twitter account

Google Translate incorpora 24 nuevos idiomas

12/05/2022
Isaac Caswell *

Durante años, Google Translate ha venido ayudando a romper las barreras lingüísticas y a conectar comunidades de todo el mundo. Y queremos que esto sea posible para aún más gente, especialmente para aquellos cuyos idiomas no están representados en la mayoría de las tecnologías. Por ello, hoy hemos añadido 24 idiomas a Translate, con lo que ahora se puede utilizar un total de 133 en todo el mundo.

Más de 300 millones de personas hablan estas nuevas lenguas, como el mizo, utilizado por unas 800.000 personas en el extremo noreste de la India, y el lingala, utilizado por más de 45 millones de personas en África Central. Como parte de esta actualización, las lenguas indígenas de América (quechua, guaraní y aymara) y un dialecto inglés (krio de Sierra Leona) también se han añadido a Translate por primera vez.

Aquí está la lista completa de los nuevos idiomas disponibles en Google Translate:

- El asamés, utilizado por unos 25 millones de personas en el noreste de la India

- Aymara, utilizado por unos dos millones de personas en Bolivia, Chile y Perú

- Bambara, utilizado por unos 14 millones de personas en Malí

- Bhojpuri, utilizado por unos 50 millones de personas en el norte de la India, Nepal y Fiyi

- Dhivehi, utilizado por unas 300.000 personas en las Maldivas

- Dogri, utilizado por unos tres millones de personas en el norte de la India

- Ewe, utilizado por unos siete millones de personas en Ghana y Togo

- Guaraní, utilizado por unos siete millones de personas en Paraguay, Bolivia, Argentina y Brasil

- Ilocano, utilizado por unos diez millones de personas en el norte de Filipinas

- El konkani, utilizado por unos dos millones de personas en la India central

- Krio, utilizado por unos cuatro millones de personas en Sierra Leona

- El kurdo (sorani), utilizado por unos quince millones de personas en Irak e Irán

- Lingala, utilizado por unos 45 millones de personas en la República Democrática del Congo, la República del Congo, la República Centroafricana, Angola y la República de Sudán del Sur

- Luganda, utilizado por unos 20 millones de personas en Uganda y Ruanda

- Maithili, utilizado por unos 34 millones de personas en el norte de la India

- Meiteilon (manipuri), utilizado por unos dos millones de personas en el noreste de la India

- Mizo, utilizado por unas 830.000 personas en el noreste de la India

- Oromo, utilizado por unos 37 millones de personas en Etiopía y Kenia

- El quechua, utilizado por unos 10 millones de personas en Perú, Bolivia, Ecuador y países vecinos.

- El sánscrito, utilizado por unas 20.000 personas en la India

- Sepedi, utilizado por unos 14 millones de personas en Sudáfrica

- Tigrinya, utilizado por unos ocho millones de personas en Eritrea y Etiopía

- Tsonga, utilizado por unos siete millones de personas en Eswatini, Mozambique, Sudáfrica y Zimbabue

- Twi, utilizado por unos 11 millones de personas en Ghana

Este es también un hito técnico para Google Translate. Estos son los primeros idiomas que hemos añadido utilizando la Traducción Automática Zero-Shot, en la que un modelo de aprendizaje automático sólo ve texto monolingüe, es decir, aprende a traducir a otro idioma sin ver nunca un ejemplo. Aunque esta tecnología es impresionante, no es perfecta. Y seguiremos mejorando estos modelos para ofrecer la misma experiencia a la que estás acostumbrado con una traducción al español o al alemán, por ejemplo. Si quieres profundizar en los detalles técnicos, consulta nuestra entrada en el blog de Google AI y el documento de investigación.

Agradecemos a los numerosos hablantes nativos, profesores y lingüistas que han trabajado con nosotros en esta última actualización y nos han inspirado con su pasión y entusiasmo. Si quieres ayudarnos a dar soporte a tu idioma en una futura actualización, contribuye con evaluaciones o traducciones a través de Translate Contribute.

 

 

* Isaac Caswell es Ingeniero Senior en Software, de Google Translate