Conseguir datos de un archivo
Hola muy buenas:
Estoy buscando la forma de hacer que, yo digo que url y el programa me saque los siguientes datos:
titulo, descripcion, palabras clave, lenguaje y los enlaces que hay en dixa pagina (esto es todos los href)
el ttulo descripcion, palabras clav etc... lo sacariamos de name="description" content="uasndasnd" etc...
resulta que he conseguido scar cosas pero no me funciona del todo, alguien podria darme una mano?
Con terra.com no funciona, en cambio con zonagratuita.com si por ejemplo
El codigo he echo es este.
<? // Recogemos URL
If(!isset($url)) { $url="http://www.prostylo.com"; }
// Abrimos pƔgina
$file = fopen ($url, "r");
// Si no la podemos abrir, damos msg de error
If (!$file)
{
echo "<p>PƔgina no encontrada.n";
exit;
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos titulo de la pƔgina
if (eregi ("<title>(.*)</title>", $line, $out))
{
$titulo = $out[1];
break;
}
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos la descripción de la pÔgina
if (eregi ('name="description"()content="(.*)"', $line, $out))
{
$descripcion = $out[1];
break;
}
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos las palabras clave de la pƔgina
if (eregi ('name="keywords" Content="(.*)"', $line, $out))
{
$keywords = $out[1];
break;
}
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos el lenguage
if (eregi ('name="lang" content="(.*)"', $line, $out))
{
$lang = $out[1];
break;
}
}
// Cerramos pƔgina
fclose($file); ?>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>Consigue datos de otras pƔginas</title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>
<body>
<form name="form1" method="post" action="infoweb.php">
<input name="url" type="text" id="url" value="http://">
<input type="submit" name="Submit" value="Enviar">
</form>
<p><strong>Página:</strong> <? echo $url; ?></p>
<p><strong>Titulo:</strong> <? echo $titulo; ?></p>
<p><strong>Descripción:</strong> <? echo $descripcion; ?></p>
<p><strong>Palabras clave:</strong> <? echo $keywords; ?></p>
<p><strong>Lenguaje:</strong> <? echo $lang; ?></p>
<p><strong>Páginas encontradas:</strong></p>
<p>
<? $line = fgets ($file, 1024);
while (eregi ('href="keywords"', $line, $out) or eregi ("href='keywords'", $line, $out))
{
echo $out[1];
} ?>
</p>
</body>
</html>
Estoy buscando la forma de hacer que, yo digo que url y el programa me saque los siguientes datos:
titulo, descripcion, palabras clave, lenguaje y los enlaces que hay en dixa pagina (esto es todos los href)
el ttulo descripcion, palabras clav etc... lo sacariamos de name="description" content="uasndasnd" etc...
resulta que he conseguido scar cosas pero no me funciona del todo, alguien podria darme una mano?
Con terra.com no funciona, en cambio con zonagratuita.com si por ejemplo
El codigo he echo es este.
<? // Recogemos URL
If(!isset($url)) { $url="http://www.prostylo.com"; }
// Abrimos pƔgina
$file = fopen ($url, "r");
// Si no la podemos abrir, damos msg de error
If (!$file)
{
echo "<p>PƔgina no encontrada.n";
exit;
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos titulo de la pƔgina
if (eregi ("<title>(.*)</title>", $line, $out))
{
$titulo = $out[1];
break;
}
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos la descripción de la pÔgina
if (eregi ('name="description"()content="(.*)"', $line, $out))
{
$descripcion = $out[1];
break;
}
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos las palabras clave de la pƔgina
if (eregi ('name="keywords" Content="(.*)"', $line, $out))
{
$keywords = $out[1];
break;
}
}
while (!feof ($file))
{
$line = fgets ($file, 1024);
// Buscamos el lenguage
if (eregi ('name="lang" content="(.*)"', $line, $out))
{
$lang = $out[1];
break;
}
}
// Cerramos pƔgina
fclose($file); ?>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title>Consigue datos de otras pƔginas</title>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
</head>
<body>
<form name="form1" method="post" action="infoweb.php">
<input name="url" type="text" id="url" value="http://">
<input type="submit" name="Submit" value="Enviar">
</form>
<p><strong>Página:</strong> <? echo $url; ?></p>
<p><strong>Titulo:</strong> <? echo $titulo; ?></p>
<p><strong>Descripción:</strong> <? echo $descripcion; ?></p>
<p><strong>Palabras clave:</strong> <? echo $keywords; ?></p>
<p><strong>Lenguaje:</strong> <? echo $lang; ?></p>
<p><strong>Páginas encontradas:</strong></p>
<p>
<? $line = fgets ($file, 1024);
while (eregi ('href="keywords"', $line, $out) or eregi ("href='keywords'", $line, $out))
{
echo $out[1];
} ?>
</p>
</body>
</html>
