Lunes, 21 de agosto de 2017

¿Cuáles son los anglicismos más frecuentes en Twitter?

27/07/2017

"Bróder", "coworker", "fangirlear", "favear" y "gossipeo" forman parte de los recurrentes préstamos lingüísticos del inglés (anglicismos) que usan en Estados Unidos los usuarios de habla hispana en Twitter, red social que representa un "buen observatorio de innovaciones lingüísticas", explicó uno de los autores de una investigación que recopiló más de 850.000 tuits.

"Lo que pretendemos en nuestro proyecto en el Instituto de Ingeniería del Conocimiento (IIC, http://www.iic.uam.es/) es crear herramientas informáticas que automaticen el marcado de términos nuevos para que luego los lingüistas los analicen", resumió a la agencia Télam Antonio Moreno Sandoval, investigador del IIC y director del Laboratorio de Lingüística Informática de la Universidad Autónoma de Madrid (UAM).

Términos como "bróder" (del "brother", que significa hermano), "fangirlear" (de "fan girl", fanática), favear (de "favourite", favorito), "gossipeo" (de "gossip", chisme), "coworker" (traducción de compañera/o de trabajo) son algunas de las voces identificadas en el marco de una recopilación de más de 850.000 tuits, con los que se creó un corpus con cerca de 175.000 palabras diferentes y luego, a través de filtros informáticos, se pasó a una lista de 3.800.

Así, los especialistas redujeron esa lista a cerca de 600 términos, seleccionados ya como candidatos.

"No toda innovación es útil, pero registrarla es un buen camino para comprender cambios sociales y culturales. Por ejemplo, hemos comprobado que se emplean mucho palabras como 'bróder' o 'fangilear' (de 'fan girl'). El hecho de que aparezcan escritas en tuits nos da una evidencia empírica de su uso", comentó Moreno Sandoval, quien junto a Francisco Moreno Fernández -director ejecutivo del Instituto Cervantes en la Universidad de Harvard y catedrático de la Universidad de Alcalá- son los investigadores de este estudio que partió de la redacción de un diccionario de anglicismos del español estadounidense (DAEE).

El proceso se desarrolló en tres fases: la primera fue la "compilación del corpus de mensajes", donde se utilizaron herramientas informáticas para filtrar los datos de los mensajes que no eran contenido léxico, para así conseguir una lista de palabras que pudieran ser analizadas por los lexicógrafos.

Luego, se procedió a una "limpieza" exhaustiva de los mensajes, al eliminar elementos que no encajaban con la búsqueda: tuits que no estaban en español o repetidos, elementos que aportan "ruido" (urls, emojis, signos de puntuación).

En la fase final, se extrajeron los candidatos a través de un proceso más afinado con filtros automáticos para eliminar elementos que no son anglicismos: palabras en español, nombres propios u onomatopeyas.

"Un aspecto importante es que en un momento dado hay palabras muy empleadas por los hablantes de una comunidad que no están aceptadas en los diccionarios. Estudios como la búsqueda de anglicismos en el español de EE.UU. a través de Twitter (http://www.iic.uam.es/inteligencia/busqueda-anglicismos-espanol-eeuu-twi...) identifican esos neologismos y los estudian para conocer su evolución", sostuvo Moreno Sandoval.

El investigador indicó que "el léxico de cualquier lengua es dinámico en todo momento, pues se adapta a las necesidades comunicativas de los hablantes", y agregó que "aparecen continuamente conceptos, relaciones, productos nuevos que tienen que ser nombrados".

"Los hablantes crean neologismos pero naturalmente solo unos cuantos se extienden y se consolidan. La sociolingüística ha estudiado muy a fondo la difusión de los neologismos entre los distintos grupos sociales. Para que un neologismo tenga éxito tiene que 'conquistar' diferentes grupos de usuarios", agregó el investigador sobre el estudio cuya metodología permitió la detección de más de 500 voces, supuestos anglicismos susceptibles de aumentar el repositorio del DAEE.

El estudio precisó que que si bien los términos son formas de algún modo interesantes y novedosas, requieren un análisis lingüístico contextualizado para comprobar si efectivamente merecen su incorporación al diccionario.

Con respecto al próximo paso del estudio, Moreno Sandoval contó que en la primera fase solo estudiaron los mensajes de Twitter, mientras que ahora van a observar otros canales en las redes sociales: "Además queremos correlacionar los neologismos con los perfiles de usuario, para obtener algún tipo de información que asocie variables lingüística con sociales", anticipó.

El IIC es una entidad privada de Investigación, Desarrollo e Innovación (I+D+i) especializada en la extracción de conocimiento a partir de grandes volúmenes de datos heterogéneos (big data) y la optimización de procesos empresariales en campos como la banca, la salud, los medios sociales, la energía.