Script php para extraer enlaces de una página html

coverant
12 de Junio del 2006
Hola a todos,

Necesito un script php para extraer los enlaces de una página html pasada por parámetro.

Alguien sería tan amable de echarme una mano. Agradecería que me indicasen alguna página donde encontrar información o si tienen código.

Muchas gracias a todos.

mariajose
12 de Junio del 2006
aqui te dejo el codigo que tengo, espero que te sirva:


<?php

function get_links($url){
$value = file_get_contents($url);
preg_match_all(\'/<a [^>]*href=("[^"]*"|\\'[^\\']*\\')[^>]*>/i\', $value, $match);
$urls =array_map(create_function(\'$a\',\'return substr($a, 1, -1);\'),$match[1]);
$total=count($urls);
//Comprobar que no estén repetidos
for($i=0;$i<$total;$i++){
echo $urls[$i].\'<br>\';
}
}

$url = "http://www.laurlquequieras.com";
get_links($url);

?>

mariajose
12 de Junio del 2006
aqui te dejo el codigo que tengo, espero que te sirva:


<?php

function get_links($url){
$value = file_get_contents($url);
preg_match_all('/<a [^>]*href=("[^"]*"|\'[^\']*\')[^>]*>/i', $value, $match);
$urls =array_map(create_function('$a','return substr($a, 1, -1);'),$match[1]);
$total=count($urls);
//Comprobar que no estén repetidos
for($i=0;$i<$total;$i++){
echo $urls[$i].'<br>';
}
}

$url = "http://www.laurlquequieras.com";
get_links($url);

?>

Jsaez
12 de Junio del 2006
Podrías probar a bajarte la clase snoopy, que simula un navegador y tiene una funcion llamada fetchlinks(url) que obtiene todos los links de la url especificada en un array.
Viene bien explicado en el manual, pero está en inglés.
Te dejo el link a su web: http://snoopy.sourceforge.net/