Leer el contenido de un archivo(*.doc, *.pdf, ...)
Hola a todos! Me gustarÃa hacer un programa que me buscase palabras clave dentro de mis archivos de texto, pero algunos están en formato .pdf o .doc y abriéndolos con un File() no se lee el contenido.
Hay alguna forma de recuperar el contenido desde un programa Java???
Muchas Gracias.
Hay alguna forma de recuperar el contenido desde un programa Java???
Muchas Gracias.
Estoy en las mismas, para que puedas buscar dentro de un archivo *.doc necesitas la libreria HWPF. Para pdf hay una libreria iText pero no se si logre leer archivos si los puedes crear pero de lo poco que he leido no puedes obtener el texto de estos archivos por la estructura de documentos PDF.
http://jakarta.apache.org/poi/trans/es/index.html
Aqui puedes ver el API HWPF
www.lowagie.com/iText
y en esta el API iText
Si encuentras un API que pueda leer PDF me avisas porfas.
Saludos
http://jakarta.apache.org/poi/trans/es/index.html
Aqui puedes ver el API HWPF
www.lowagie.com/iText
y en esta el API iText
Si encuentras un API que pueda leer PDF me avisas porfas.
Saludos
