Expo
Expo
Expo
-Corpus de Referencia del Español Actual (CREA): Es un corpus de referencia desarrollado por el
Instituto de Lexicografía de la RAE. Contiene textos orales y escritos producidos en todos los países
de habla hispana desde 1975 hasta 2004. Los textos escritos proceden de revistas, periódicos y
libros y son de distintos ámbitos: literarios, periodísticos, científicos y técnicos; mientras que la
lengua hablada (solo el 10%) está representada por transcripciones de documentos obtenidos de la
radio y la televisión.
-Corpus Diacrónico del Español (CORDE): Es un corpus textual de todas las épocas y lugares en que
se habló español, desde los inicios del idioma hasta el año 1974, diseñado para extraer información
con la cual estudiar las palabras y sus significados, así como la gramática y su uso a través del
tiempo.
-Corpus del Español del Siglo XXI (CORPES XXI): Es un corpus de referencia, iniciativa de la RAE y la
Asociación de Academias de la Lengua Española (ASALE), que pretende ser una continuación de
CREA y CORDE. Contiene textos escritos y orales, procedentes de hispanohablantes, recogidos entre
2001 y 2012. Aún se encuentra en construcción.
Extracto de la página oficial de la RAE: “El 4 de febrero, la RAE y Banco Santander renovaron
el convenio de colaboración que permite el desarrollo de este proyecto. El nuevo acuerdo estará
vigente cuatro años más, hasta 2018. El objetivo final es reunir, en 2018, un conjunto textual
constituido por 400 millones de formas y palabras de la lengua común de casi 500 millones de
hispanohablantes.”
-Corpus Oral y Sonora del Español Rural (COSER): Es un corpus oral en formación. Las producciones
que se incluyen en este corpus, realizadas desde 1990, pertenecen a hablantes con una media de
70,7 años de escasa escolarización. Permite el estudio de la variación dialectal del español hablado
en el ámbito rural de la Península Ibérica.