inoticia

Noticias De Actualidad
Google se vuelve más multilingüe, pero ¿obtendrá los matices?

LIMA, Perú (AP) — Alrededor de 10 millones de personas hablan quechua, pero tratar de traducir automáticamente correos electrónicos y mensajes de texto a la familia de lenguas indígenas más hablada en las Américas fue casi imposible durante mucho tiempo.

Eso cambió el miércoles, cuando Google agregó quechua y una variedad de otros idiomas a su servicio de traducción digital.

El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite expandir enormemente el repertorio de idiomas del mundo de Google Translate. Agregó 24 de ellos esta semana, incluidos el quechua y otras lenguas indígenas sudamericanas como el guaraní y el aymara. También está agregando una serie de idiomas africanos y del sur de Asia ampliamente hablados que faltaban en los productos tecnológicos populares.

“Observamos idiomas con poblaciones muy grandes y desatendidas”, dijo a los periodistas el científico investigador de Google, Isaac Caswell.

Las novedades de la exhibición anual de tecnología de E/S de la compañía de California pueden celebrarse en muchos rincones del mundo. Pero también generará críticas de aquellos frustrados por productos tecnológicos anteriores que no entendieron los matices de su idioma o cultura.

El quechua era la lengua franca del Imperio Inca, que se extendía desde lo que ahora es el sur de Colombia hasta el centro de Chile. Su estado comenzó a declinar. tras la conquista española del Perú hace más de 400 años.

Agregarlo a los idiomas reconocidos por Google es una gran victoria para los activistas del idioma quechua como Luis Illaccanqui, un peruano que creó el sitio web Qichwa 2.0que incluye diccionarios y recursos para el aprendizaje del idioma.

“Ayudará a poner al quechua y al español en el mismo estatus”, dijo Illaccanqui, quien no participó en el proyecto de Google.

Illaccanqui, cuyo apellido en quechua significa “tú eres el rayo”, dijo que el traductor también ayudará a mantener vivo el idioma con una nueva generación de jóvenes y adolescentes, “que hablan quechua y español al mismo tiempo y les fascina redes sociales.”

Caswell calificó la noticia como un “gran avance tecnológico” porque, hasta hace poco, no era posible agregar idiomas si los investigadores no podían encontrar una gran cantidad de texto en línea, como libros digitales, periódicos o publicaciones en redes sociales, para sus necesidades. Sistemas de IA de los que aprender.

Los gigantes tecnológicos estadounidenses no tienen un gran historial de hacer que su tecnología lingüística funcione bien fuera de los mercados más ricos, un problema que también les dificulta detectar información errónea peligrosa en sus plataformas. Hasta esta semana, Google Translate se ofrecía en idiomas europeos como el frisón, el maltés, el islandés y el corso, cada uno con menos de 1 millón de hablantes, pero no en idiomas del este de África como el oromo y el tigrinya, que tienen millones de hablantes.

Los nuevos idiomas se implementarán esta semana. Todavía no serán entendidos por el asistente de voz de Google, que por ahora los limita a traducciones de texto a texto. Google dijo que está trabajando para agregar reconocimiento de voz y otras capacidades, como poder traducir un letrero apuntándolo con una cámara.

Eso será importante para los idiomas mayoritariamente hablados como el quechua, especialmente en el campo de la salud, porque muchos médicos y enfermeras peruanos que solo hablan español trabajan en áreas rurales y “no pueden entender a los pacientes que hablan principalmente quechua”, dijo Illaccanqui.

“La próxima frontera, o desafío, es trabajar en el habla”, dijo Arturo Oncevay, investigador peruano de traducción automática de la Universidad de Edimburgo, quien cofundó una coalición de investigación para mejorar la tecnología de los idiomas indígenas en las Américas. “Las lenguas nativas de las Américas son tradicionalmente orales”.

En su anuncio, Google advirtió que la calidad de las traducciones en los idiomas recién agregados “todavía está muy por detrás” de otros idiomas que admite, como inglés, español y alemán, y señaló que los modelos “cometerán errores y exhibirán sus propios sesgos. ” Pero la compañía solo agregó idiomas si sus sistemas de IA alcanzaron un cierto umbral de competencia, dijo Caswell.

“Si hay un número significativo de casos en los que está muy mal, entonces no lo incluiríamos”, dijo. “Incluso si el 90 % de las traducciones son perfectas, pero el 10 % son tonterías, eso es demasiado para nosotros”.

Google dijo que sus productos ahora admiten 133 idiomas. Los últimos 24 son el lote individual más grande que se agregó desde que Google incorporó 16 nuevos idiomas en 2010. Lo que hizo posible la expansión es lo que Google llama un modelo de traducción automática de “disparo cero” o “recurso cero”, uno que aprende a traducir a otro idioma sin siquiera ver un ejemplo de ello.

La empresa matriz de Facebook e Instagram, Meta, introdujo un concepto similar llamado Universal Speech Translator el año pasado.

El modelo de Google funciona entrenando un “modelo de IA neuronal único y gigantesco” en aproximadamente 100 idiomas ricos en datos y luego aplicando lo aprendido a cientos de otros idiomas que no conoce, dijo Caswell. “Imagínese si usted es un gran políglota y luego comienza a leer novelas en otro idioma, puede comenzar a reconstruir lo que podría significar en función de su conocimiento del idioma en general”, dijo.

Dijo que el nuevo grupo abarca desde idiomas más pequeños como el mizo, hablado en el noreste de la India por unas 800.000 personas, hasta idiomas más hablados como el lingala, hablado por unos 45 millones de personas en África Central.

Fue hace más de 15 años, en 2006, que Microsoft recibió una atención positiva en América del Sur con una función de software que traduce menús y comandos familiares de Microsoft al quechua. Pero eso fue antes de la ola actual de avances de IA en la traducción en tiempo real.

El erudito en idiomas de la Universidad de Harvard, Américo Mendoza-Mori, que habla quechua, dijo que conseguir la atención de Google brinda cierta visibilidad necesaria al idioma en lugares como Perú, donde los hablantes de quechua todavía carecen de muchos servicios públicos. La supervivencia de muchos de estos idiomas “dependerá de su uso en contextos digitales”, dijo.

Otro erudito en idiomas, Roberto Zariquiey, dijo que es escéptico de que Google pueda ser una herramienta efectiva de revitalización del idioma para el quechua, el aymara o el guaraní sin una participación más cercana de los grupos comunitarios de la región.

“Los idiomas están profundamente ligados a la vida, a las culturas, a las etnias y organizaciones políticas”, dijo Zariquiey, lingüista de la Pontificia Universidad Católica del Perú. “Esto debe tenerse en cuenta”.

—-

Los nuevos idiomas agregados son: asamés, aymara, bambara, bhojpuri, dhivehi, dogri, ewe, guaraní, ilocano, konkani, krio, lingala, luganda, maithili, meiteilon (manipuri), mizo, oromo, quechua, sánscrito, sepedi, sorani Kurdo, Tigrinya, Tsonga y Twi.

—-

O’Brien informó desde Providence, Rhode Island.