Cómo leer PDF y archivos DOC usando PHP

Uno de mis clientes tiene una cantidad insana de PDFs y archivos DOC de Microsoft Word en su página web. Son fundamentales en las funciones que ofrece en la página, así que no son archivos basura, por así decirlo. Mi cliente quería que el motor de búsqueda de su sitio, en este caso Sphider, leyera estos archivos PDF y archivos DOC de Microsoft Windows para que sus usuarios pudiesen acceder a los documentos que necesitasen a través de la búsqueda, sin tener que pasar por páginas resumen para conseguirlos. Al final pude conseguirlo, asi que déjamos mostrarte como leer PDF y archivos DOC usando PHP.

Leyendo archivos PDF

Para leer archivos PDF, deberás tener instalado el paquete XPDF, que incluye el método "pdftotext". Una vez hayas instalado XPDF/pdftotext, ejecuta la siguiente sentencia PHP para obtener el texto del PDF:

$content = shell_exec('/usr/local/bin/pdftotext '.$filename.' -'); //barra al final para extraer el contenido

Leyendo archivos DOC de Microsoft Word

Al igual que el ejemplo de los PDF que te hemos mostrado antes, tendrás que descargar otro paquete. Para esta ocasión utilizaremos el paquete Antiword. A continuación te dejamos el código que tienes que utilizar para extraer el contenido de un archivo DOC:

$content = shell_exec('/usr/local/bin/antiword '.$filename);

El código anterior no lee archivos DOCX y no (por suerte) preserva el formato con el que está construido el fichero. Hay otras librerías que preservan el formato, pero en mi caso, solo quería extraer el texto.

Y este ha sido el artículo en el que trataba explicaros cómo leer PDF y archivos DOC usando PHP, esperamos que te haya gustado y sepas aplicarlo en tus futuros proyectos. Ya sabes que si nos quieres proponer un tema que quieres ver reflejado como un tutorial o como una práctica, solo tienes que hacer uso del área de comentarios de un poco más abajo. Por el contrario, si quieres enviarnos tus propios tutoriales, puedes hacerlo a través de la intranet de usuarios que está habilitada para ello, a través del menú Enviar Tutorial. Ya sabes, ayúdanos a crecer con tus conocimientos. ¡Un saludo y feliz código!

COMPARTE ESTE ARTÍCULO

COMPARTIR EN FACEBOOK
COMPARTIR EN TWITTER
COMPARTIR EN LINKEDIN
COMPARTIR EN WHATSAPP