Un traductor de forma automática para lenguas de los pueblos originarios es desarrollado por especialistas del Instituto de Investigaciones en Matemáticas Aplicadas y Sistemas (IIMAS) de la UNAM.
¿Cuáles son las lenguas traducidas?
Wixárika (Nayarit)
Ayuuk (Oaxaca)
Náhuatl (clásico y moderno)
Mexicanero (Durango)
Yorinoqui (Estado de México)
Desarrollan traductor de lenguas de los pueblos originarios
De acuerdo con el catálogo del Instituto Nacional de Lenguas Indígenas, en México hay 68 agrupaciones lingüísticas las cuales tienen 364 variantes y hasta hace poco solo la empresa Microsoft desarrolló, en colaboración con universidades de Querétaro y Yucatán, software de interpretación del otomí y maya, como parte de su programa Heritage.
Desarrollan traductor de lenguas de los pueblos originarios
¿Cómo comenzó el proyecto?
Iván Vladimir Meza Ruiz, del Departamento de Ciencias de la Computación del IIMAS y titular del proyecto es especialista en Inteligencia Artificial.
Explicó que a partir de 2014 comenzó con el trabajo gracias a un estudiante que tiene relación con la comunidad wixárika, conocidos por la mayoría como huicholes, y tenía la intención de apoyarla.
Poco a poco se sumaron voluntarios a esta labor, principalmente aquellos que tienen relación con comunidades originarias, estudian una carrera técnica y trabajan con náhuatl, mexicanero y yoem noki.
Por ejemplo, el investigador del IIMAS asesora a su estudiante de licenciatura César Cruz, en el IIMAS, para documentar el sistema inteligente para el mazahua, o como ellos se denominan J ñatio, que el alumno desarrolló en forma de una aplicación para celular que se llama MazahuApp, la cual está a disposición a través de GoogleApps.
Otro caso es el de su estudiante de maestría Delfino Zacarías Márquez Cruz, hablante de Ayuuk (mixe), quien trabaja en un método de interpretación, labor en la cual participaron varios miembros de su sitio de origen en la recolección de datos.
“La idea surgió porque desde hacía tiempo quería diseñar un traductor, pero no sabía aterrizar mi idea, así que me acerqué al doctor Iván quien me propuso hacer la red neuronal”, explicó el estudiante.
Narró que requería trabajo de campo “porque cuando empecé no había recursos para entrenar el modelo y se necesitaba algo que se llama corpus -que son los textos entre el español y la lengua que se quiere trabajar-“.
“El reto fue trabajarlos, encontrar quien traduzca y que las personas estén dispuestas a compartir”, relató Zacarías Márquez.

¿Cómo funciona el traductor de lenguas de los pueblos originarios?
Meza Ruiz explicó que para este trabajo se utilizan redes neuronales, un modelo computacional que imita un proceso, que en este caso es la traducción de una lengua a otra.
Explicó que se requieren ejemplos, como datos de frases traducidas entre ambas. Para ello se utilizan conceptos matemáticos comunes, y hasta cierto punto básicos, como las operaciones matrices y cálculo vectorial.
La complejidad surge al calibrar los modelos, es decir, encontrar valores específicos para cada una de las acciones que debe realizar el sistema, de tal manera que una frase en una lengua sea transformada a otra, sin ser confundida.
“Afortunadamente tenemos varios algoritmos que funcionan bien, pero dado que los modelos actuales llamados profundos tienen numerosos módulos y valores para procesar, se necesita un equipo de cómputo especializado”.

Alimentar la base de datos
Meza Ruiz detalló que los elaborados hasta ahora, incluidos los de Microsoft, son deficientes debido a que este tipo de tecnologías son más exitosas cuando tienen un cuerpo de datos, es decir, millones de ejemplos de frases equivalentes en ambos idiomas para que el programa aprenda a reconocerlas.
“Para lenguas originarias los corpus más grandes están cerca de los 10 mil ejemplos, en comparación con los millones de los sistemas comerciales”.
“Estamos muy lejos de tener una experiencia similar a la que tenemos al usar un traductor normal, porque tenemos muy poquitos datos”.
“Esa es parte de nuestra batalla ahorita: conseguir más datos e incrementar nuestros ejemplos”, subrayó Zacarías Márquez.
A lo anterior se agrega que las voces originarias de México son predominantemente orales, precisó, por lo que la normalización de su escritura es contemporánea y en diversos casos no está decidido aún cómo se escriben palabras, conceptos e inclusive frases completas.
Por ejemplo, dijo, el caso del wixárika se compone de numerosos vocablos con partículas morfológicas, entonces lo que para nosotros puede ser una frase para ellos es una sola palabra, una situación difícil de procesar para las redes neuronales.
Meza Ruiz añadió que también se deben considerar algunas pérdidas en la traducción, pues para el huichol una oración se estructura en base a cuánta gente escucha lo que se dice y si hay alguien de mayor jerarquía que nosotros, algo que en español no se suele hacer y esto influye para que algunos textos queden incompletos.
Por ejemplo, la frase m’k’pa:pa ya p’-ta-ti-u-ti-wawi-ri-wa entre otras cosas indica que el evento descrito es visto por el hablante, situación que no se marca en español y la traducción más cercana sería: Ella siempre nos pide tortillas.
Para consultar estos trabajos, Zacarías Márquez comentó que en el caso del wixárika se cuenta con el sitio de internet http://turing.iimas.unam.mx/wix/, y está en proceso otro para el ayuuk.
Se requiere más apoyo
El investigador enfatizó que hace falta apoyo para el desarrollo de este tipo de tecnologías a fin de rescatar las lenguas de los pueblos indígenas, pues tradicionalmente se estudian a partir de la lingüística o la antropología para documentarlas.
Además, surge la discusión de qué tanto estas comunidades necesitan de las herramientas, si es benéfico para ellas o cómo lo utilizarían, pues tienen otras prioridades.
“Lo que hemos detectado es que hay un reconocimiento de los habitantes de México de que sí debemos apoyar a preservarlas, promover su uso, y tener un traductor automático podría ayudar a esto y a facilitar esta situación”, subrayó Zacarías Márquez.
Esto te puede interesar
¿Qué sucede cuando alguien nos da una entrevista y luego cambia de opinión?
Hay que recordar que nadie, ninguna persona está obligada a dar entrevistas, a menos que sea persona servidora pública, porque tiene la obligación de rendir cuentas.
Episodio #33: Ajolotes de Michoacán, ¿extinción o conservación?
En este Episodio #33: Ajolotes de Michoacán, ¿extinción o conservación? conversamos con Miguel Piñón Flores, Maestro en Ciencias por la UMSNH y con Karina Martínez Servín y Verónica Torres Ponce, colaboradoras del proyecto Achoque, acerca de los ajolotes de Michoacán; las características de las especies, sus amenazas y conservación.
EDITORIAL: Paripé gubernamental en Michoacán
Ni siquiera los supuestos “resultados” que se enlistan, en el mensaje gubernamental, acerca de la política ambiental del estado son exactas, más bien caen en las medias verdades y datos engañosos.
0 comments on “Desarrollan traductor de lenguas de los pueblos originarios”