ExtractText de PDFBox
Hola, estoy usando la clase ExtractText de PDFBox para pasar .pdf a .html, el problema es que luego quiero hacer un IndexHTML con Lucene y los archivos nuevos .html no tienen ningún tÃtulo en las etiquetas <title>, que es de donde se saca Lucene el nombre del documento... asà que me encuentra la palabra que busco, pero no sabe cómo se llama el documento. Quiero hacerlo automáticamente... sin tener que editar el cógigo fuente una vez pasado el archivo a .html. Alguien sabe cómo se podrÃa hacer??
