Logos de la USC y del Grupo de Gramática del Español

En su versión actual (la 2.0), el corpus para el estudio del español oral ESLORA contiene 60 horas de entrevistas semidirigidas y 20 horas de conversaciones de hablantes de Galicia grabadas entre los años 2007 y 2015. Los registros sonoros se transcribieron ortográficamente con alineación texto-voz para facilitar el acceso inmediato al audio desde la transcripción. En el proceso de enriquecimiento del corpus se han desarrollado recursos para la lematización y el etiquetado morfosintáctico de los textos que permiten realizar diversos tipos de búsquedas.

A día de hoy es posible obtener datos de todos estos materiales mediante un sistema de consultas simples y combinadas que incluye variables sociales (grupo de edad, nivel de estudios y sexo) junto a categorías lingüísticas (lemas, clases de palabras y categorías morfológicas). La aplicación de consulta tiene además la ventaja de que permite recuperar los fragmentos sonoros correspondientes a las consultas realizadas. En la Guía de consulta se describen los detalles de las múltiples posibilidades que ofrece el sistema de búsqueda y en la sección Descargas puede obtenerse directamente el corpus en formato textual o bien solicitarse en formato etiquetado, junto con los audios y la información sociolingüística de los hablantes.

Además de un amplio conjunto de textos nuevos, la versión 2.0 incluye importantes mejoras en la aplicación de consulta, entre las que se encuentran el uso de operadores booleanos, la recuperación de la lista de lemas o elementos únicos que reúnen unas determinadas características y un novedoso diccionario de frecuencias dinámico.

El corpus ESLORA ha sido elaborado por los miembros del Grupo de Gramática del Español de la Universidad de Santiago de Compostela a través de los proyectos ESLORA, ESLORA2 y ESLORA+ financiados por el Ministerio de Economía y Competitividad (FFI2010-17417, FFI2014-52287-P y PFFI2017-86379-P).

NOTA: La versión 1.2.2 de noviembre de 2018 estará disponible hasta abril de 2021 en el siguiente enlace.

Esta web utiliza cookies propias y de terceros con el único propósito de analizar el uso de la propia web. Si continúa navegando consideramos que acepta su utilización.