Jueves, 03 de diciembre de 2020

Facebook crea un modelo de traducción para cien idiomas que no requiere pasar por el inglés

20/10/2020
Diana Arias

Facebook presentó su nueva ‘maquina modelo de traducción multidiomas’ (MMT, por sus siglas en inglés), el M2M-100, que hace la traducción de un idioma a otro sin usar de puente el inglés. Lo que de acuerdo con la compañía permite mayor precisión.

Por ejemplo, cuando un sistema de traducción necesita hacer una transcripción del chino al francés, usa el inglés como puente. Básicamente, porque hay mayor cantidad de datos que le permiten hacerlo de chino a inglés y después de inglés a francés. Este tipo de dinámicas hace que se pierda información que podría retenerse si se hiciera de manera directa, explica Facebook en su comunicado.

Es por esto por lo que el modelo de Facebook sería más confiable. El M2M-100 fue entrenado en 2.200 direcciones diferentes entre idiomas y la compañía asegura que será de código abierto para que programadores y desarrolladores puedan hacer investigaciones y usarlo. Para hacerlo, el MMT uso una serie de datos que comprendían más de 7,5 mil millones de oraciones en pares que se cruzaban en más de 100 idiomas. Después se escogieron las que tenían mejor calidad y mejor se alineaban con sus pares.

Facebook presentó su nueva ‘maquina modelo de traducción multidiomas’ (MMT, por sus siglas en inglés), el M2M-100, que hace la traducción de un idioma a otro sin usar de puente el inglés. Lo que de acuerdo con la compañía permite mayor precisión.

Por ejemplo, cuando un sistema de traducción necesita hacer una transcripción del chino al francés, usa el inglés como puente. Básicamente, porque hay mayor cantidad de datos que le permiten hacerlo de chino a inglés y después de inglés a francés. Este tipo de dinámicas hace que se pierda información que podría retenerse si se hiciera de manera directa, explica Facebook en su comunicado.

Es por esto por lo que el modelo de Facebook sería más confiable. El M2M-100 fue entrenado en 2.200 direcciones diferentes entre idiomas y la compañía asegura que será de código abierto para que programadores y desarrolladores puedan hacer investigaciones y usarlo. Para hacerlo, el MMT uso una serie de datos que comprendían más de 7,5 mil millones de oraciones en pares que se cruzaban en más de 100 idiomas. Después se escogieron las que tenían mejor calidad y mejor se alineaban con sus pares.