Script php para extraer enlaces de una página html
Hola a todos,
Necesito un script php para extraer los enlaces de una página html pasada por parámetro.
Alguien serÃa tan amable de echarme una mano. AgradecerÃa que me indicasen alguna página donde encontrar información o si tienen código.
Muchas gracias a todos.
Necesito un script php para extraer los enlaces de una página html pasada por parámetro.
Alguien serÃa tan amable de echarme una mano. AgradecerÃa que me indicasen alguna página donde encontrar información o si tienen código.
Muchas gracias a todos.
aqui te dejo el codigo que tengo, espero que te sirva:
<?php
function get_links($url){
$value = file_get_contents($url);
preg_match_all(\'/<a [^>]*href=("[^"]*"|\\'[^\\']*\\')[^>]*>/i\', $value, $match);
$urls =array_map(create_function(\'$a\',\'return substr($a, 1, -1);\'),$match[1]);
$total=count($urls);
//Comprobar que no estén repetidos
for($i=0;$i<$total;$i++){
echo $urls[$i].\'<br>\';
}
}
$url = "http://www.laurlquequieras.com";
get_links($url);
?>
<?php
function get_links($url){
$value = file_get_contents($url);
preg_match_all(\'/<a [^>]*href=("[^"]*"|\\'[^\\']*\\')[^>]*>/i\', $value, $match);
$urls =array_map(create_function(\'$a\',\'return substr($a, 1, -1);\'),$match[1]);
$total=count($urls);
//Comprobar que no estén repetidos
for($i=0;$i<$total;$i++){
echo $urls[$i].\'<br>\';
}
}
$url = "http://www.laurlquequieras.com";
get_links($url);
?>
aqui te dejo el codigo que tengo, espero que te sirva:
<?php
function get_links($url){
$value = file_get_contents($url);
preg_match_all('/<a [^>]*href=("[^"]*"|\'[^\']*\')[^>]*>/i', $value, $match);
$urls =array_map(create_function('$a','return substr($a, 1, -1);'),$match[1]);
$total=count($urls);
//Comprobar que no estén repetidos
for($i=0;$i<$total;$i++){
echo $urls[$i].'<br>';
}
}
$url = "http://www.laurlquequieras.com";
get_links($url);
?>
<?php
function get_links($url){
$value = file_get_contents($url);
preg_match_all('/<a [^>]*href=("[^"]*"|\'[^\']*\')[^>]*>/i', $value, $match);
$urls =array_map(create_function('$a','return substr($a, 1, -1);'),$match[1]);
$total=count($urls);
//Comprobar que no estén repetidos
for($i=0;$i<$total;$i++){
echo $urls[$i].'<br>';
}
}
$url = "http://www.laurlquequieras.com";
get_links($url);
?>
PodrÃas probar a bajarte la clase snoopy, que simula un navegador y tiene una funcion llamada fetchlinks(url) que obtiene todos los links de la url especificada en un array.
Viene bien explicado en el manual, pero está en inglés.
Te dejo el link a su web: http://snoopy.sourceforge.net/
Viene bien explicado en el manual, pero está en inglés.
Te dejo el link a su web: http://snoopy.sourceforge.net/
