CORPUS DEL ESPAÑOL DEL SIGLO XXI CORPES XXI Versión 0.8, beta Manual de consulta en línea
Corpus del Español del Siglo XXI . Manual de consulta en línea (v 0.8 beta).
Página 1 de 23
ÍNDICE Requisitos de uso .................................................................................................................................................... 3 Consulta del corpus ................................................................................................................................................
3
La ventana de consulta ....................................................................................................................................... 3 Concordancias ...................................................................................................................................................
5
Consulta de lemas y formas ..........................................................................................................................
5
Localización de formas verbales con enclíticos ............................... ................................ ............................... 6 Consulta de signos de puntuación ............................. ................................. ................................ .................... 6 Uso de los comodines ...................................................................................................................................
7
Criterios lingüísticos .....................................................................................................................................
7
Análisis de la proximidad entre varias piezas léxicas .....................................................................................
7
Criterios para la selección de textos (Subcorpus) ........................................................................................... 8 Criterios de ordenación ordenación ................................................................................................................................. 9 Combinación de criterios de consulta: criterios lógicos ................................................................................ 10 Combinación de criterios de consulta: consultas de índole gramatical
.............................. ............................. 12
Consulta de la transcripción de textos orales con sonido alineado ...................................................................... 14 Información estadística ....................................................................................................................................
14
Coapariciones .......................................................................................................................................................
16
Definición y uso ..............................................................................................................................................
16
Parámetros para la obtención de las coapariciones ............................................................................................
17
Clase de palabra .........................................................................................................................................
17
Tema..........................................................................................................................................................
17
Origen ........................................................................................................................................................
17
Descripción de las medidas estadísticas de asociación ....................................................................................... 17 MI (Mutual information) information) .............................................................................................................................
17
T-score .......................................................................................................................................................
17
LL simple (Log likelihood) .........................................................................................................................
17
Obtención de ejemplos a partir de las coapariciones .......................................................................................... 18 Nómina de autores y obras ....................................................................................................................................
19
Configuración ......................................................................................................................................................
19
Información de contacto
.......................................................................................................................................20
Cómo citar este corpus ..........................................................................................................................................20 Apéndice I. Referencia rápida ...............................................................................................................................
21
Apéndice II. Preguntas más frecuentes ..................................................................................................................
22
...................... ............................. 22 1) Cómo obtener los ejemplos de uso de un lema o una forma (concordancia) ................................................... .................... ............................. 22 2) Cómo ver las combinaciones más frecuentes de una palabra (coapariciones) ................................................. 3) Cómo consultar los datos estadísticos de una consulta (estadística)
............................................................... 22
4) Cómo ordenar los ejemplos (ordenar por) ............................. ................................ ................................. ....... 22
....................... ....... 22 5) Cómo ver el detalle de un ejemplo y su referencia bibliográfica (concordancia ampliada) .............................. ............................................................................. ....................... 22 6) Cómo utilizar el asistente para crear consultas complejas ...................................................... 7) Cómo imprimir o guardar en un archivo los resultados de las consultas (imprimir/exportar) ........................... 23
....... .................. 23 8) Cómo obtener ejemplos en los que figuren dos o más más palabras determinadas (proximidad) ......................... 9) Cómo localizar ejemplos de una forma gráfica determinada en el corpus (mayúsculas/tildes)
......................... 23
10) Cómo emplear los comodines en la consulta ............................................................................................... 23
Corpus del Español del Siglo XXI . Manual de consulta en línea (v 0.8 beta).
Página 2 de 23
REQUISITOS DE USO La consulta del corpus precisa de una conexión a la red Internet y de un navegador web estándar que acepte el lenguaje Javascript , por ejemplo, Microsoft Internet Explorer, Mozilla Firefox, Google Chrome, Apple Safari etc.
CONSULTA DEL CORPUS La aplicación de consulta del CORPES en línea permite obtener ejemplos de uso de los lemas y formas contenidos en él, ver los datos estadísticos más relevantes, comprobar las agrupaciones más frecuentes de una palabra (coapariciones), obtener la concordancia de palabras cuando aparecen en proximidad, así como clasificar y filtrar los resultados de la consulta mediante diversos criterios. La ventana de consulta La ventana inicial de consulta —denominada Concordancias— proporciona ejemplos de uso de las palabras contenidas en el corpus.
Fig. I. Ventana inicial del sistema de consulta: concordancia básica Corpus del Español del Siglo XXI . Manual de consulta en línea (v 0.8 beta).
Página 3 de 23
Presenta una interfaz inicial simplificada organizada en tres zonas: en la superior se especifican los criterios de consulta, en la intermedia se muestran los ejemplos y la inferior sirve para ampliar el contexto de un ejemplo determinado junto con su referencia bibliográfica completa y los datos de clasificación del texto en el CORPES: Referencia bibliográfica: «Los conserjes de San Felipe Neri». Alonso de Santos, José Luis: Los conserjes de San Felipe Neri. Madrid: Cátedra, 2012. Clasificación CORPES: Año: 2011. Criterio: Fecha de escritura. Medio: Escrito. Bloque: Ficción. Soporte: Libro. Tema: Teatro. País: España. Tipología: Ficción. Los ejemplos de uso de la palabra consultada se muestran, por defecto, en orden cronológico en el formato Kwic1, habitualmente utilizado para la presentación de este tipo de datos. En este formato cada línea
corresponde a un ejemplo, que dispone además de un número correlativo de identificación, así como de la fecha de clasificación y el país (abreviado) de la obra de la que ha sido extraído. Si el ejemplo corresponde a la transcripción de la lengua hablada de la parte oral alineada del corpus aparece también el símbolo de un altavoz para indicar la disponibilidad de sonido. En el texto, aparece resaltada la palabra buscada y, si se sitúa el puntero del ratón sobre la fecha, se muestra la referencia bibliográfica detallada de la obra. Si se señala cualquier palabra, se obtiene su análisis lingüístico; en el caso de la palabra pivote (la destacada en azul), se muestra además una pequeña ampliación del contexto. En la parte superior de la tabla de resultados, en el ángulo superior derecho, se encuentra la opción para clasificar los ejemplos y ordenarlos según el criterio que se elija; por defecto, como ya se ha indicado previamente, está marcado el cronológico. En el ángulo superior izquierdo de la tabla de resultados se proporciona el número total de casos obtenidos en la consulta, y el número de documentos seleccionados para la obtención de los ejemplos. Debajo de los ejemplos está la opción para pasar de página y continuar viendo los ejemplos, así como los botones para imprimirlos o exportarlos2. Cuando se necesita ampliar el contexto de un ejemplo, se debe pulsar con el puntero del ratón sobre la palabra pivote (resaltada en color azul); se despliega entonces, en la zona inferior de la página, un espacio donde figura el ejemplo, encabezado por la referencia bibliográfica completa del texto que lo contiene, su clasificación en el corpus, así como la opción de ampliar el contexto precedente y posterior con los botones (+). Se dispone además de un botón para Imprimir el ejemplo y de una botonera para la reproducción del sonido, que solo aparece en el caso de que el ejemplo corresponda a la transcripción de la lengua hablada de la parte oral alineada del corpus. Los cambios de color de fondo que se observan en las concordancias sirven para identificar ejemplos pertenecientes a obras distintas. 1 Keyword in context (La palabra en su contexto). 2 La exportación de ejemplos se ha limitado
–por razones operativas – a un máximo de mil casos.
Corpus del Español del Siglo XXI . Manual de consulta en línea (v 0.8 beta).
Página 4 de 23
Concordancias Consulta de lemas y formas
Los ejemplos de uso de lemas y formas se obtienen escribiendo la palabra en la casilla correspondiente y haciendo clic con el ratón en el botón Concordancia. El botón Nueva consulta restaura las condiciones originales. Lema
La consulta de Lema recupera todos los ejemplos de la palabra, de modo que, si se escribe en esta casilla la forma canónica de una palabra, se obtendrán los ejemplos de todas sus variantes (morfológicas, flexivas y gráficas). Si se busca el infinitivo andar¸ el sistema proporciona los ejemplos de miles de formas diferentes de este verbo, como: andaba, andan, anduvo, andáis, anduviese, andemos , etc. Los sustantivos se deben buscar en singular; por ejemplo, mujer, y se obtendrán las concordancias de mujer, mujeres, mujercita , etc. En cuanto a los adjetivos, se escribe el masculino singular, como vergonzoso, y se ofrecerán ejemplos de vergonzoso, vergonzosa, vergonzosos, vergonzosas , etc. Forma
La búsqueda de una determinada variante debe hacerse en la casilla Forma; seleccione la opción de Grafía original (descrita más abajo en esta sección) si desea localizar la forma exacta, tal y como figura en el texto y sin aplicar ningún tipo de regularización. Puede también emplear los comodines para localizar formas (véase el apartado Uso de los comodines ). Por ejemplo, para buscar los ejemplos de aerostato se puede usar el comodín de la interrogación lanzando la búsqueda de aer?stato, con lo que se obtendrán las dos grafías admitidas: aerostato y aeróstato (véase el apartado Uso de los comodines). Incluso puede usarse el asterisco en esta casilla, por ejemplo el prefijo pre*, para conocer todas las formas que comienzan así. Lema + forma
La combinación de ambas casillas permite obtener ejemplos de una forma concreta perteneciente a un lema determinado. Esta opción puede ser útil para buscar solo ciertas formas de un paradigma más amplio que tengan un uso diferente del resto del paradigma, como por ejemplo ver+viste, que devuelve casos de la forma como 'apéndice confirmativo'. Grafía original
Esta casilla reduce la consulta de lemas y formas a su grafía original, sin emplear ningún tipo de regularización. Es útil para hacer pertinente la diferenciación acentual (esto es, la existencia o no de tilde) y la ortográfica (mayúscula o minúscula); así, se puede buscar en forma sé para recuperar solo los ejemplos del verbo saber que estén tildados; o buscar el nombre propio Aurora, en mayúscula, y no el sustantivo común. Texto libre
Es posible realizar la consulta de expresiones que contengan hasta cinco palabras. Esta posibilidad es útil para buscar frases hechas, locuciones, etc. Por ejemplo, si se quiere consultar expresiones como amor libre, de tal palo tal astilla, de tomo y lomo, etc. basta con escribirlas en la casilla Forma. Corpus del Español del Siglo XXI . Manual de consulta en línea (v 0.8 beta).
Página 5 de 23