Molino de ideas y el procesamiento del lenguaje natural

molinodeideasCuánto más evoluciona internet y más mejora la tecnología, más nos damos cuenta de lo lejos que estamos de que las personas nos entendamos con las máquinas. Muchos no lo sabéis pero cuando yo empecé a escribir en Loogic en el año 2003 uno de mis principales intereses era la web semántica. Más de 9 años después la evolución no ha sido demasiado notable y la web social sin duda ha pasado por encima de la web de las máquinas. Pero mi opinión es que esto tendrá que ser algo temporal, que a largo plazo en internet las personas nos entenderemos con las máquinas y si sigue siendo Google la principal puera de entrada a la red, será mucho más fácil decirle lo que necesitamos y que nos aporte respuestas mucho más valiosas. Los agentes inteligentes tendrán mucho que hacer al respecto, pero esa es otra historia.

Hasta que todo esto suceda tenemos la suerte de que haya empresas que se estén dedicando a investigar para que las personas y las máquinas podamos entendernos usando un mismo lenguaje. Molino de Ideas es una de estas empresas, está liderada por Eduardo Basterrechea y tiene el objetivo de llegar a ser los líderes mundiales en Procesamiento de Lenguaje Natural. Para conseguirlo han empezado por desarrollar una serie de herramientas que desembocarán en la constricción de un conjunto de APIs lingüísticas para empresas que trabajen con clipping de prensa o estudios de reputación online y para lo cual ya han conseguido financiación por parte del CDTI.

Estas son las herramientas basadas en el lenguaje que actualmente tiene desarrolladas Molino de Ideas:

Onoma es el único conjugador en español que permite conjugar verbos inventados (en español estamos continuamente inventando verbos ya sea prefijando «recontracomer» o convirtiendo sustantivos en verbos, Loogicear) hemos creado un modelo para estudiar las irregularidades verbales que se puede aplicar a la enseñanza de español. El libro de descarga gratuita tiene unas 6.000 descargas mensuales. En base a ese modelo la CEE ha aprobado unos cursos para profesores de español basándonos en este método.

Molinolabs y Molinarium son herramientas para aprender diversas materias del español. Aparte del uso directo, muestra el potencial de su API y la posibilidad de integrar estos contenidos en cualquier otra web.

Sominolabs son herramientas para hacer ejercicios sobre diversas materias de español. Aparte de la integración en sus propios cursos, formarán parte de la API, y cualquier plataforma podrá incorporarlos a sus propios servicios. Los exámenes se generan de modo automático.

Refranario es un diccionario de refranes de español orientado a personas que están aprendiendo con equivalentes en otras lenguas. La idea es crear una plataforma que te permita crear tu propio diccionario. Luego el usuario los podrá integrar a su gusto. Por ejemplo podrá seleccionar varios diccionarios de naútica para crearse un diccionario naútico.

Hemero es una plataforma para probar corpus y sistemas de busqueda. Están empezando a trabajar con búsquedas lematizadas sobre 10 años de prensa española o americana.