ExtractText de PDFBox

rake
24 de Mayo del 2006
Hola, estoy usando la clase ExtractText de PDFBox para pasar .pdf a .html, el problema es que luego quiero hacer un IndexHTML con Lucene y los archivos nuevos .html no tienen ningún título en las etiquetas <title>, que es de donde se saca Lucene el nombre del documento... así que me encuentra la palabra que busco, pero no sabe cómo se llama el documento. Quiero hacerlo automáticamente... sin tener que editar el cógigo fuente una vez pasado el archivo a .html. Alguien sabe cómo se podría hacer??