Leer datos de pdf

demonic810
31 de Julio del 2009
Buenas. Mi problema es que tengo que crear un programa que dado un pdf (que contendrá un listado de clientes de la empresa), me genere un documento de texto plano con algún caracter especial (un ; por ejemplo) que delimite los diferentes campos en el pdf. He visto que existen algunas bibliotecas como pdfbox para convertir un pdf a texto plano, pero el asunto está en la delimitación de campos, ya que algunos me los separa con espacios, pero otros me los pone todo seguido; además la existencia de algún espacio entre datos no implica que pertenezcan a campos diferentes obligatoriamente. En pdfbox existe un método que me permite poner un delimitador de campos, como necesito en mi caso, el problema es lo que digo, que no separa bien todos los campos. Se supone que yo la longitud de los campos no la puedo saber, así que, ¿existe algún tipo de información en el pdf que pueda servirme para este propósito? ¿O quizá hay algo diferente que pueda probar?

Saludos y perdón por la parrafada.