Viernes, 17 de noviembre de 2017

RAE creará el corpus del español del siglo XXI

14/06/2007
Universia

NULL

Víctor García de la Concha, director de la Real Academia Española (RAE), y Emilio Botín, presidente del Santander, firmaron hoy un acuerdo que recoge el apoyo del Banco en la preparación del Corpus del Español del Siglo XXI, un proyecto de la RAE en colaboración con las 21 instituciones que forman la Asociación de Academias de la Lengua Española.El trabajo servirá como fuente para los proyectos académicos y proporcionará materiales básicos para la investigación lexicográfica y gramatical del español.Con la creación del Corpus del Español del Siglo XXI, la RAE ampliará el banco de datos léxicos iniciado en 1996 con la elaboración del Corpus de Referencia del Español Actual (CREA) -que cuenta actualmente con más de 150 millones de formas léxicas procedentes de textos fechados a partir de 1975- y del Corpus Diacrónico del Español (CORDE), con cerca de 300 millones de formas desde los orígenes del idioma hasta 1974. Ambos corpus, que permiten disponer de datos lingüísticos fiables, supusieron una modificación radical en el sistema de trabajo de la Real Academia Española y la Asociación de Academias de la Lengua Española.En efecto, todas las obras publicadas por las Academias desde ese momento (la vigésima segunda edición del DRAE, el Diccionario panhispánico de dudas, el Diccionario del estudiante y, sobre todo, el Diccionario esencial), así como las que se encuentran actualmente en fase de preparación (la próxima edición del DRAE, la Nueva gramática de la lengua española y el Diccionario académico de americanismos), se han beneficiado de los datos contenidos en ambos corpus. Sin embargo, el diseño del CREA, científicamente adecuado y muy ambicioso cuando se formuló, se ha quedado corto para las necesidades actuales. Conscientes de que tanto las cifras como la distribución geográfica resultan hoy por hoy insuficientes para fundamentar en ellas la enorme cantidad de decisiones normativas que la Asociación de Academias de la Lengua Española ha de tomar para todo el mundo hispánico, las Academias decidieron, en el reciente Congreso de Academias celebrado en Medellín (marzo de 2007), afrontar conjuntamente la construcción de un nuevo corpus del español, elaborado con 25 millones de formas para cada uno de los años comprendidos entre 2000 y 2011, y con una distribución de la procedencia de los textos del 30 por ciento para España y el 70 por ciento para América. La construcción del Corpus del Español del Siglo 21 se llevará a cabo con un equipo central, situado en la RAE, y un número relativamente amplio de equipos colaboradores, vinculados a diversas universidades de España y América. El equipo central se ocupará del diseño, la selección de materiales, el establecimiento del sistema de codificación, la preparación técnica del personal de los equipos colaboradores, el control del trabajo realizado por ellos, la inserción de los textos codificados en el sistema y el mantenimiento de las aplicaciones informáticas que permiten las consultas. Los equipos colaboradores se especializarán en la codificación de textos de cada zona lingüística o de determinadas características (prensa, textos orales, etc.). El proyecto se realizará con el apoyo del Santander, que participa en esta iniciativa de la mano de su División Global Santander Universidades, cuyas actividades vertebran la acción social del banco y le permiten mantener una alianza estable con el ámbito académico en España, Portugal, América y Reino Unido. A través de su División Global Santander Universidades, el Santander ha destinado 400 millones de euros entre 1996 y 2006 al patrocinio de proyectos académicos, de investigación y tecnológicos en apoyo a la educación superior en los países en que está presente, y ayuda a la difusión y la enseñanza del español mediante su colaboración en iniciativas como Universia ?la mayor red de universidades del mundo-, la Biblioteca Virtual Miguel de Cervantes ?la mayor colección en internet de las letras hispánicas-, y la Fundación Campus Comillas.