Descomponer una estructura de texto plano

hiten
16 de Junio del 2006
Hola, el problema que tengo es el siguiente. Tengo un documento plano. Es un fichero de configuración IDL, muy parecido al de CORBA, pero no es estandar. En el se definien los siguientes elementos: typedef structs, nombre de los servicios o métodos, interfaces, tipos devueltos, parámetros etc...
El problema es que necesito parsear ese fichero, es decir descomponer esa especie de lenguaje en cada objeto que pueda identificar para exportarlo a una estructura de objetos basado en una dtd (xml). Y es que el objetivo final es construir un archivo WSDL que sería la interfaz correspondiente para un webService.
Hice algo de esto en la carrera con lenguajes formales, autómatas y demás. pero era bastante complejo y no lo recuerdo bien. Existe alguna tecnología o clase java que me pueda ayudar a descomponer en partes este texto plano?. No se utilizando expresiones regulares o algo.
Muchas gracias.