En su versión actual (la 2.4), el corpus para el estudio del español oral ESLORA contiene 60 horas de entrevistas semidirigidas y 20 horas de conversaciones de hablantes de Galicia grabadas entre los años 2007 y 2015. Los registros sonoros se transcribieron ortográficamente con alineación texto-voz para facilitar el acceso inmediato al audio desde la transcripción. En el proceso de enriquecimiento del corpus se han desarrollado recursos para la lematización y el etiquetado morfosintáctico y pragmático de los textos que permiten realizar diversos tipos de búsquedas.
ESLORA facilita la recuperación de los datos mediante un sistema de consultas simples y combinadas que incluye variables sociales (edad, nivel de estudios y sexo) junto a categorías lingüísticas (lemas, clases de palabras, categorías morfológicas y actos de habla). La pestaña Guía contiene los documentos Descripción general, Novedades de las versiones 2.x y Anotación pragmática, en los que se describen los detalles de las múltiples posibilidades que ofrece el sistema de búsqueda, y en la sección Descargas puede obtenerse directamente el corpus en formato textual o bien solicitarse en formato etiquetado, junto con los audios y la información sociolingüística de los hablantes.
Entre las novedades de las versiones 2.x destacan el uso de operadores booleanos, la posibilidad de recuperación de las listas de lemas o elementos gramaticales distintos que reúnen unas determinadas características, la anotación de actos de habla en el subcorpus de entrevistas semidirigidas, la posibilidad de obtener información en los segmentos codificados como lengua gallega y un diccionario de frecuencias léxicas que incluye índices de dispersión.
El corpus ESLORA ha sido elaborado por miembros del Grupo de Gramática del Español de la Universidade de Santiago de Compostela a través de los proyectos ESLORA, ESLORA2, ESLORA+ y ESLORA++, financiados por el Ministerio de Economía y Competitividad (FFI2010-17417, FFI2014-52287-P, PFFI2017-86379-P y PID2020-118133GB-I00) y la Xunta de Galicia (ED481D-2022-016).
NOTA: La versión 2.3 estará disponible hasta junio de 2026 en el siguiente enlace.