Domingo, 28 de noviembre de 2021

Se necesitan lingüistas y psicólogos para enseñarle español a la inteligencia artificial

09/10/2021
Luis Alemany

Traductores digitales de idiomas que construyen frases con buen oído sintáctico y con mucha precisión semántica; teclados predictivos que ya no son un estorbo sino que, muy a menudo, aciertan con la palabra buscada; cuentas de correo que intuyen una respuesta sencilla y adecuada para los mensajes recibidos ("gracias, ahora lo corrijo"); procesadores de texto que subrayan en azul las faltas de concordancia entre sujeto y verbo y en rojo las palabras que no aparecen en el diccionario de la RAE (y que, aunque dé rabia, aciertan muy a menudo), aplicaciones como Alexa o Siri que parlotean con cierta naturalidad y, sobre todo, que entienden lo que les decimos aunque seseemos o finjamos acento mexicano... Hasta las pantallitas de las lavadoras explican hoy sus averías con un par de palabras escritas en español más o menos comprensibles, en vez de con el código alfanumérico de los viejos tiempos.

Los cambios están llegando tan paulatinamente que no nos hemos dado cuenta, pero el uso del lenguaje de los dispositivos tecnológicos domésticos ha mejorado mucho en los últimos dos años. También en español, a pesar de que nuestro idioma ha tenido una posición marginal en el mundo científico y tecnológico. Para tomar nota pública de ese éxito, la Real Academia Española celebró esta mañana una jornada de debate sobre inteligencia artificial (IA) junto a representantes de Amazon Alexa, Microsoft, Google y Telefónica y presidida por la secretaria de Estado de Digitalización e Inteligencia Artificial, Carme Artigas.

¿Por qué ha sido posible esta mejora? Muy en resumen: porque las empresas tecnológicas han empezado a considerar el idioma como un todo orgánico y no como un conjunto de datos. Los lingüistas, a través del progama LEIA de la Real Academia Española (Lengua Española e Inteligencia Artificial) han empezado a trabajar cualitativamente sobre las bases de datos que las máquinas empleaban para aprender idiomas para establecer las conexiones que son imposibles de aprender como información binaria.

"Estamos en mitad de una transformación de los modelos masivos de Inteligencia Artificial", explicó David Carmona, director general de IA en Microsoft Corporation. "Vamos pasar de un modelo en el que las máquinas razonan sobre datos a otro en el que razonarán sobre el lenguaje. En el corazón de la Inteligencia Artificial va a estar el lenguaje".

El horizonte inmediato, por tanto, consiste en conseguir que los algoritmos sean creados con el idioma en su núcleo duro, y no con sistemas capaces de clasificar datos lingüísticos para después fingir que conocen el idioma. "Durante mucho tiempo, no funcionábamos muy bien por eso", explicó Ester Marinas, responsable de marca y reputación de Google España y Portugal. "El problema consistía en que había que cerciorarse de que los datos que introducíamos en los programas no tuvieran un sesgo".

Un ejemplo: si a un algoritmo se le enseña español a partir del corpus de textos históricos escritos en nuestra lengua y disponibles en las bases de datos, la máquina llegará a la conclusión de que a la mujer que se dedica a la arquitectura se le llama arquitecto y no arquitecta porque así se ha hecho hasta hace pocos años. Hace falta un trabajo humano para evitar ese error. Y ahí es donde la colaboración entre la RAE y las empresas tecnológicas tiene sentido.

El trabajo conjunto ha tenido efectos prácticos: Marie Mulot, gerente general de Amazon Alexa en España, ha explicado que Alexa ya puede dar definiciones de la RAE, propone sinónimos, antónimos y deletrea palabras. "Desde el principio queríamos que hablase un español correcto y natural, no queríamos que pareciese un robot ni hablase en infinitivo".

Chema Alonso, director de la unidad global de Consumo Digital de Telefónica y director técnico de LEIA, ha explicado que su empresa llevará el diccionario de la Academia a las televisiones de sus clientes y se ha comprometido a insistir en el trabajo de cribado sobre los datos, en el entrenamiento que permitirá que los algoritmos hablen un idioma natural. "En el mundo de la IA hemos perdido un poco el tren: la tecnología se ha creado en lengua inglesa mayoritariamente, donde el español no ha tenido esa importancia, pero el uso de esas tecnologías sigue siendo muy alto en nuestra lengua y hay que autoexigirse que el nivel de interacción sea equivalente a la importancia del español en el mundo", dijo Alonso.