twitter account

Meta (Facebook) lanza un nuevo modelo IA para preservar la diversidad lingüística, que reconoce más de 4.000 idiomas

25/05/2023

Meta continúa explorando nuevos usos y aplicaciones para los sistemas de inteligencia artificial (IA). Su nueva apuesta es una serie de modelos de lenguaje basados en IA que pretenden preservar la cultura lingüística del mundo entero.

Mediante una publicación en su blog oficial, Meta, la empresa responsable por la red social Facebook, presentó los modelos Massively Multilingual Speech (MMS) una tecnología capaz de ampliar la capacidad de las herramientas que convierten texto a voz y voz a texto a más 1.100 idiomas y les permiten identificar más de 4.000 idiomas hablados.

Los nuevos MMS de Meta son modelos de código abierto. De esta manera, la empresa invita a investigadores y programadores a construir sobre su base para generar nuevas aplicaciones y desarrollos capaces de considerar el gran acervo lingüístico que tiene el planeta.

“Muchos de los idiomas del mundo están en peligro de desaparecer, y las limitaciones de la tecnología actual de reconocimiento y generación de voz solo acelerarán esta tendencia. Queremos facilitar a las personas el acceso a la información y el uso de dispositivos en su idioma preferido. (...) Estamos abriendo nuestros modelos y código para que otros en la comunidad de investigación puedan desarrollar nuestro trabajo y ayudar a preservar los idiomas del mundo”, explicó el equipo de Meta.

Habitualmente, los modelos de reconocimiento voz y aquellos con capacidad de convertir contenido de texto a voz requieren capacitaciones con miles de horas de audio que se complementan con etiquetas de transcripción adjuntas para que los algoritmos de aprendizaje automático puedan clasificar e interpretar correctamente los datos.

No obstante, para los idiomas o lenguajes poco utilizados o que están en vías de desaparecer, no existen etiquetas de transcripción, situación que impide que estos códigos de habla sean incorporados en muchas aplicaciones y plataformas de uso cotidiano.

Bajo este entendido, Meta utilizó un método poco convencional para entrenar sus nuevos modelos MMS. Las grabaciones de audios de texto religiosos como la Biblia fueron la base en el proceso de capacitación.

“Recurrimos a textos religiosos, como la Biblia, que se han traducido a muchos idiomas diferentes y cuyas traducciones se han estudiado ampliamente para la investigación de traducción de idiomas basada en texto. Estas traducciones tienen grabaciones de audio disponibles públicamente de personas que leen estos textos en diferentes idiomas”, detallaron desde Meta.

Meta y un extraño método de capacitación para sus nuevos modelos IA

Gracias a que las grabaciones en audio de los textos religiosos se incorporaron sin etiquetas de transcripción, los modelos de meta ganaron la posibilidad de identificar más de 4,000 idiomas.

A pesar del enfoque poco habitual utilizado en el entrenamiento de los nuevos modelos de lenguaje, Meta asegura que estos desarrollos no tienen ningún sesgo hacia alguna postura espiritual o religiosa al momento de entregar a los usuarios respuestas determinadas. “Esto se debe a que utilizamos un enfoque de clasificación temporal conexionista (CTC), que es mucho más limitado en comparación con los modelos de lenguaje extenso (LLM) o los modelos de secuencia a secuencia para el reconocimiento de voz”, dijo el equipo de Meta.