Lingüística de Corpus

May 25, 2017 | Autor: M. Louro Mendiguren | Categoria: Corpus Linguistics, Morphology
Share Embed


Descrição do Produto

FORMACIÓN DEL PLURAL EN ALGUNAS PALABRAS ACABADAS EN CONSONANTE. PRÉSTAMOS LÉXICOS. POLIMORFISMO

Louro Mendiguren, María Curso: 2015 - 2016 Máster Interuniversitario en Lingüística aplicada Asignatura: Lingüística de Corpus

1

1. INTRODUCCIÓN

En este breve trabajo, se pretende analizar lo que ocurre con algunos términos en cuanto a su variación morfológica de número; en particular se aborda la formación del plural de algunas palabras terminadas en consonante (máster, pin, mitin y píxel). Para ello, se parte de la normativa gramatical para luego contrastar con los datos obtenidos de los corpora de la RAE y del Instituto Cervantes; en concreto se han utilizado cuatro: CORDE 1, CREA2, CORPES3, y CAES4. Resulta de importancia destacar que para la elaboración de esta pequeña investigación de tipo morfológico con corpus, se ha tomado como referencia el artículo “¿Era Bin Laden un líder de los Talibán?...¿O de los talibanes?: Presiones externas e internas en un fenómeno reciente de variación morfológica en español” de José Luis Blas Arroyo (2002)5. En el artículo se toma como referencia un caso de gramaticalización de número, que consiste en añadir el morfema de plural a un término que ya denota plural (talibán). En el presente trabajo no se va a indagar sobre casos de regularizaciones en la gramática española como podrían ser talibán/talibanes, papparazzi/papparazzis, sino en préstamos léxicos terminados en consonante que no han regularizado el número, pero que sí presentan algunas dificultades en la formación del plural para los propios hablantes nativos. El modus operandi como ya se ha indicado, consiste en partir de la prescripción normativa de la RAE y contrastarlo con los datos obtenidos de las búsquedas en distintos corpus. Con esto se pretende indagar en las siguientes cuestiones: ¿En que medida de cumple la normativa recogida en la RAE?, ¿Influye el tipo de texto?, ¿Hay diferencias de una etapa a otra del español?¿Estamos en una primera fase que trasluce un cambio? Y si es así ¿debería ser recogido en la normativa?. La hipótesis de partida ha sido que la normativa en los textos escritos tiende a mantenerse mientras que en los textos orales o periodísticos la normativa no se tiene tan presente y es donde se supone que se encuentran más ejemplos “no normativos”.

1 2 3 4 5

Se puede acceder al corpus CORDE mediante el siguiente link: http://corpus.rae.es/cordenet.html Se puede acceder al corpus CREA en el siguiente enlace: http://corpus.rae.es/creanet.html Se puede acceder al corpus CORPES mediante el siguiente link: Se puede acceder al corpus CAES mediante el siguiente enlace: http://galvan.usc.es/caes/search En el artículo se realiza una investigación morfológica con un pequeño corpus confeccionado con textos diez periódicos españoles para ver el lo que sucede con talibán / talibanes; que se trata de una gramaticalización, pues talibán ya es plural (préstamo del árabe sg: 'talib', pl: 'talibán'). Tiene en cuenta aspectos lingüísticos y extralingüísticos al analizar el proceso de variación.

2

2. CUESTIONES METODOLÓGICAS

Los corpora utilizados en el trabajo son como se ha indicado anteriormente, cuatro. Pero es necesario destacar que el corpus que se toma como eje axial es CREA, CORDE y CORPES han sido utilizados para contrastar lo que sucede con los términos seleccionados a lo largo del tiempo, imprimiendo de este modo un matiz diacrónico a la investigación. De este modo, se pretende hacer un análisis sincrónico de los términos seleccionados en cuanto a la formación del plural de los mismos, pero también se hacen búsquedas en otros corpus para tener una perspectiva general sobre su evolución. Resulta conveniente describir brevemente los corpus utilizados además de aludir a las reglas gramaticales sobre la formación del plural que aparecen en la gramática de la RAE. En la versión electrónica del Diccionario Panhispánico de Dudas (2005)6 se recoge lo siguiente: plural. 1.Reglas de formación del plural. En español hay dos marcas para formar el plural de los sustantivos y adjetivos: -s y -es. Existe asimismo la posibilidad, aunque no es lo normal, de que permanezcan invariables. La elección de una de estas opciones debe ajustarse a las siguientes reglas: (...) g) Sustantivos y adjetivos terminados en -l, -r, -n, -d, -z, -j. Si no van precedidas de otra consonante (→ j), forman el plural con -es: dócil, pl. dóciles; color, pl. colores; pan, pl. panes; césped, pl. céspedes; cáliz, pl. cálices; reloj, pl. relojes. Los extranjerismos que terminen en estas consonantes deben seguir esta misma regla: píxel, pl. píxeles; máster, pl. másteres; pin, pl.pines; interfaz, pl. interfaces; sij, pl. sijes. Son excepción las palabras esdrújulas, que permanecen invariables en plural: polisíndeton, pl. (los) polisíndeton; trávelin, pl. (los) trávelin; cáterin, pl.(los) cáterin. Excepcionalmente, el plural de hipérbaton es hipérbatos.

Se ha decidido centrar la atención en este tipo de sustantivos, en concreto en los extranjerismos debido a la casuística que hay detrás de la formación del plural de los mismos; los préstamos léxicos, suelen presentar problemas en la flexión de número. Como ya se ha indicado anteriormente, los términos que se van a analizar son máster, píxel, pin y mitin. Antes de pasar al análisis de los datos, conviene hacer una breve descripción de las características generales de cada uno de los corpus utilizados (CORDE, CREA, CORPES). Un corpus es en líneas generales “un conjunto de textos (o fragmentos de textos) naturales, almacenados en formato electrónico, que resultan conjuntamente representativos de una variedad lingüística (...) reunidos con el fin den que puedan ser estudiados científicamente” 7. Los tres 6 La dirección web de donde se ha extraído la cita, es la siguiente: http://lema.rae.es/dpd/srv/search? id=Iwao8PGQ8D6QkHPn4i 7 La definición está tomada de los apuntes de Lingüística de corpus, asignatura impartida por Guillermo Rojo, la presentación se encuentra en la siguiente dirección web: http://gramatica.usc.es/persoas/guillermo.rojo

3

primeros corpora que se utilizan en este trabajo se sitúan en un continuum cronológico consecutivo, es decir, cada corpus cubre un período cronológico concreto, recoge textos pertenecientes a una época determinada, por tanto, las fechas que abarcan no se solapan. El Corpus Diacrónico del Español (CORDE) es un corpus que almacena textos escritos en español comprendidos desde el origen de la lengua hasta el año 1974; el corpus consta de 250 millones de formas8. El Corpus de Referencia del Español Actual (CREA) es un conjunto de textos de diversa procedencia, en su última versión (3.2, junio de 2008) reúne algo más de 160 millones de formas. El CREA está constituído por una amplia variedad de textos escritos y orales, producidos en todos los países de habla hispana desde 1975 hasta 2004: los textos escritos, se recogen de libros, periódicos y revistas; la lengua hablada está representada por grabaciones transcritas de radio y televisión. El Corpus del Español del Siglo XXI (CORPES XXI) es, al igual que CREA, un corpus de referencia y está formado tanto por textos orales como escritos. La nueva versión publicada en Noviembre de 2015 la 0.82. cuenta con más de 215 millones de formas. Estos son los tres corpora que se van a utilizar para el análisis de los términos que se han seleccionado, además cabe destacar que sería interesante la comparación con datos obtenidos del CAES para así demostrar las dificultades de las palabras analizadas en cuanto a la formación del plural. El Corpus de aprendices de español como lengua extranjera (CAES) es un corpus de aprendices, este caso en concreto es un conjunto de textos escritos producidos por estudiantes de español con diferentes grados de dominio lingüístico (niveles A1 a C1 ) y procedentes de seis L1: árabe, chino mandarín, francés, inglés, portugués y ruso. Este corpus está constituido por 575 mil elementos lingüísticos aproximadamente. El contraste con los datos del CAES no se va a realizar por cuestiones de extensión, pero podría considerarse como una propuesta para una futura investigación. Estas son las tres fuentes de datos utilizadas para el análisis de los cuatro préstamos léxicos terminados en consonante máster, píxel, pin y mitin. Una vez realizadas las aclaraciones metodológicas pertinentes, conviene abordar el análisis de los datos obtenidos para contrastarlos con la hipótesis de partida señalada al comienzo del trabajo.

8 Se tendrá en cuenta el número total de palabras de cada corpus para calcular la frecuencia normalizada al realizar el análisis comparativo en el punto 3.

4

3. Resultados y análisis sobre datos obtenidos

Los datos obtenidos se recogen en tres tipos de gráficos (cuadros, diagramas en barra y diagramas circulares), cada uno de ellos ha sido elaborado con la intención de plasmar de manera más visual distintos aspectos que se deducen de los datos. La obtención de datos se han realizado mediante consultas simples excepto en un caso 9. Los resultados generales obtenidos en los corpora, se recogen de manera cuantitativa en los siguientes cuadros10:

CUADRO 1 “Máster” CORDE

CREA

CORPES

Nº– Doc.11 Fr. norm12 Nº – Doc. Fr. norm Nº – Doc. Fr. norm MÁSTER (sg.)

15--10

0'06

360 - 225

2'25

1613 - 989

6'81

MÁSTER (pl.)

-

-

7--6

0'04

36 - 24

0'17

MÁSTERES

-

-

1--1

0'004

107 - 64

0'47

2--2

0'008

63-48

0'39

1197 - 678

5'34

MÁSTERS

En el cuadro 1 se puede observar claramente que el término máster en general se utiliza de más en singular que en plural, además también se observa cómo va aumentando gradualmente el uso del término de un período a otro, hasta convertirse en una palabra bastante utilizada en la actualidad. Con el incremento de la utilización de la palabra máster, se van incrementando también los usos que se apartan de las directrices de la Gramática. Recordemos que la RAE recomienda formar el plural de este tipo de palabras con el morfema -es, pero se encuentran casos en los que se utiliza el alomorfo -s ya en el corpus CORDE (recuérdese que abarca textos escritos hasta 1974). 9 Es conveniente hacer referencia a un aspecto que se va a tener en cuenta al en el recuento de los casos que aparecen en las consultas de los corpus:una opción posible que hay que tener en cuenta es que el sustantivo analizado puede presentar además de las dos variantes morfológicas del plural, también puede permanecer invariable. Para discernir los casos en los que el plural adopta la misma forma que el singular se han decidido utilizar los siguientes términos en conjunto con el sustantivo para afinar la recuperación de datos: los, dos, varios, unos, algunos, muchos + sustantivo en singular. Los casos que respondan a estas búsquedas, se restan del total de la búsqueda del término en singular. 10 Los datos que se plasman en los cuadros parten de las consultas realizadas on-line; éstas búsquedas realizadas se recogen en el índice del trabajo mediante capturas de pantalla. Téngase en cuenta que debido a la utilización del la forma del como plural, obliga a realizar operaciones matemáticas en los valores reflejados en la segunda fila de cada cuadro. 11 Nº.: número de apariciones o frecuencia absoluta; Doc.: Documentos en los que aparece el término. 12 Fr. norm.: Frecuencia normalizada o frecuencia por millón. Valor que se obtiene mediante la fórmula Fr. normalizada= (Fr. absoluta : Numero total de palabras del corpus) x 1.000.000

5

Por tanto, hasta 1974, solamente hay dos casos en los que se utilice el término en plural y además con el alomorfo 'inadecuado'. A partir de 1975 se encuentran ejemplos en los que para el plural se utiliza el singular, el alomorfo -es y el alomorfo -s. En los datos obtenidos en CREA resulta llamativo que abunden más casos en los que se utiliza el morfo -s en vez del recomendado; tendencia que se sigue manteniendo como muestran los valores del corpus CORPES, en el que también predominan los casos en los que se forma el plural con el morfema -s (másters). No sucede lo mismo con el término píxel como se puede observar en el cuadro 2:

CUADRO 2 “Píxel” CORDE Nº – Doc.

CREA

CORPES

Fr. norm Nº – Doc. Fr. norm Nº – Doc. Fr. norm

PÍXEL (sg.)

-

-

77 - 34

0'31

170 - 97

0'73

PÍXEL (pl.)

-

-

-

-

5--4

0'02

PÍXELES

-

-

63 - 31

0'39

434 - 254

1'85

PÍXELS

-

-

96 - 22

0'6

46 - 23

0'19

Al observar los datos recogidos en el cuadro 2 se observa claramente el momento en el que el término píxel empieza a aparecer en la lengua castellana, ya que no se encuentra ningún caso hasta después de 1974; a partir del 2004 los casos aumentan. Este aumento paulatino de los casos encontrados, nos muestra cómo la palabra va entrando en la lengua española, circunstancia sujeta a nuevas realidades que van surgiendo, en este caso referente a la esfera tecnológica. Lo más llamativo es que a diferencia del caso anterior, observamos que en CREA predomina la formación del plural con el morfo -s, tendencia que se invierte a partir de 2004, ya que si observamos los valores que nos da CORPES se ve claramente que se prefiere el morfo recomendado por la RAE (-es). También hay otra diferencia destacable respecto al caso que se ha analizado en primer lugar, con píxel se observa que la opción de que el término permanezca invariable para denotar plural es menos usual que con máster. En el siguiente caso (pin) hay que tener presente que se trata de una palabra polisémica, puede ser una onomatopeya, un sustantivo que denota una especie de broche y un sustantivo que se refiere a la

contraseña de un aparato electrónico por ejemplo. Estos tres significados van

apareciendo en la lengua de manera gradual: en CORDE solamente se encuentran casos de onomatopeyas, pero en CREA ya aparece como sustantivo. Al igual que con píxel, la opción de

6

utilizar pin como invariable aparece a partir de 2004 y es muy poco representativa como se puede observar el los casos recogidos en el cuadro 3:

CUADRO 3 “Pin” CORDE Nº – Doc.

CREA

CORPES

Fr. norm Nº – Doc. Fr. norm Nº – Doc. Fr. norm

PIN (sg.)

43 - 31

0'17

109 - 49

0'68

286 - 140

1'2

PIN (pl.)

-

-

-

-

6--5

0'03

PINES

1--1

0'004

54 - 17

0'34

40 - 30

0'16

PINS

1--1

0'004

25 - 21

0'16

31 - 23

0'13

Se ha decidido tener en cuenta otra préstamo léxico terminado en -n además de pin, pues las tendencias de una palabra monosílaba pueden diferir de una palabra de más de una sílaba. En el presente trabajo no se va a indagar sobre el factor del cuerpo fónico de la palabra, pero se ha creído conveniente tener en cuenta dos términos acabados en -n. En el cuadro 4 se recogen los datos referentes al lema mitin.

CUADRO 4 “Mitin” CORDE

CREA

CORPES

Nª – Doc.

Fr. norm

Nª – Doc. Fr. norm Nª – Doc. Fr. norm

MITIN (sg.)

176 - 64

0'7

1285 - 653

8'03

757 - 452

3'19

MITIN (pl.)

-

-

-

-

1--1

0'004

MITINES

9--6

0'04

15--14

0'09

413 - 294

1'74

MITINS

6--6

0'02

1--1

0'006

2--2

0'009

En el cuadro, además de ver el progresivo aumento en la utilización del término en general, se puede observar que la opción de que permanezca invariable para denotar pluralidad comienza a aparecer en CORPES (es cierto que solamente se trata de un caso, pero puede ser indicador de un cambio que se verificaría con el paso del tiempo). Respecto a los ejemplos que hemos visto anteriormente, en mitin, la formación del plural se adecua más a la prescripción gramatical, pues como se puede observar, en los tres períodos los casos predominantes son corresponden a la forma mitines. En este sentido, podría decirse que en la 7

formación del plural del sustantivo mitin sigue la tendencia gramatical, no hay vasculaciones entre el predominio de una forma y la otra, sino que la tendencia se mantiene estable en los tres períodos que cubren los corpora utilizados. Como se ha ido viendo, cada palabra tiene tendencias distintas, algunas se decantan gradualmente a la utilización de la forma recomendada (-es) pero hay otros casos en los que las tendencias oscilan de lo correcto a lo inadecuado para luego mantenerse en pugna con valores relativamente iguales. Para ver más claramente las tendencias de la formación del plural en cada caso, se ha decidido utilizar las frecuencias absolutas para la elaboración de diagramas en barras que contrasten estos valores y permitan plasmar de manera más visual la variación diacrónica de cada unos de los término en cuanto a la formación del plural. En los diagramas no se tienen en cuenta los valores que se refieren al término utilizado en singular con valor de singularidad, es decir, solamente se muestran los valores referentes a los plurales.

5,34

6 4,5 3 1,5 0

0,01

0,39

1,85

2 1,5

máster másteres másters

1 0,5 0

CORDE CREA CORPES

0,39 0

píxel píxeles píxels

CORDE CREA CORPES

Gráfico 1 :Plural de máster

Gráfico 2: Plural de píxel

En estos dos primeros gráficos, se observa de manera más sencilla la tendencia que sigue cada una de las opciones de plural que presentan los términos analizados. En el gráfico 1 se observa que la tendencia es constante, se predomina másters sobre másteres. Los resultados obtenidos de CORPES muestran que los hablantes no siguen la prescripción gramatical, sino que prefieren el alomorfo -s; lo que puede llevarnos a pensar que quizá la gramática debería considerar másters como forma adecuada. Es cierto que un error si se generaliza no tiene porqué convertirse en algo correcto, pero un aspecto a tener muy en cuenta es que ya la lengua evoluciona, está viva; ya los gramáticos latinos se enfrentaban a este tipo de problemática en los Appendix Probi: listas de 'errores' comunes, que finamente constituyeron uno de los eslabones principales de la evolución al castellano actual (sino seguiríamos hablando latín o, si nos queremos retrotraer más, indoeuropeo).

8

Sin embargo no sucede lo mismo con el plural de píxel, que en un primer momento parece tener más peso el plural no normativo píxels, pero que al final la tendencia se ajusta a la normativa haciendo más habitual la utilización de la forma píxeles como se observa en el gráfico 2 (pág. 8). En el gráfico 3 se observa que el término pin se produce un cambio de tendencia a partir del 2008 (año limítrofe entre CREA y CORPES), donde se aprecia la disminución de la utilización del plural normativo pines a favor de pins; aunque la frecuencia de pines sigue siendo superior (sería interesante contrastarlo con datos obtenidos en el futuro, para saber si predomina pines o pins).

0,4

1,75

0,3

1,4 pin pines pins

0,2 0,1

1,05 0,7 0,35

0 CORDE

CREA

mitin mitines mitins

0

CORPES

CORDE CREA CORPES

Gráfico 3: Plural de "pin"

Gráfico 4: Plural de "mitin"

En el gráfico 4 se observa que hay un claro predominio de la forma normativa mitines, la tendencia es lineal, no hay cambios como en ejemplos anteriores (pin y píxel). Las otras dos opciones a penas tienen presencia, en este sentido podría decirse que es de entre los cuatro términos analizados, el que menos dudas plantea en la formación del plural. Una vez comentados los datos obtenidos de los distintos corpora, conviene recordar la hipótesis que se planteaba en la introducción: se supone que en los textos escritos la norma debería mantenerse con más regularidad, mientras que en los textos de carácter oral es donde se espera que haya ejemplos no normativos. La hipótesis se cumple en algunos casos y en otros no tanto, pero en líneas generales se encuentran ejemplos con el alomorfo -s en prosa científica, textos orales, textos periodísticos, noticias, textos de divulgación, reportajes, etc.; mientras que en textos clasificados tipológicamente como ficción y académico suelen ajustarse a las formas normativas con -es. Esto no quiere decir que no se encuentren ejemplos normativos en prensa y no normativos en textos de ficción por ejemplo. Sin embargo, en líneas generales podría decirse que son los textos de carácter oral y los periodísticos los que se permiten más licencias.

9

4. ALGUNAS CONCLUSIONES

Se han ido analizando cuatro préstamos léxicos que se pertenecen al grupo de las palabras terminada en -n, -r, -l, -d, -z y -j. En la formación del plural de los términos estudiados (máster, píxel, pin, mitin) no parece haber tendencias generalizadas que estén influidas por el tipo de consonante final de la palabra, las tendencias a veces parecen responder a las presiones prescriptivas y otras veces no. A veces la tendencia consiste en ir adaptándose paulatinamente a la forma recomendada, otras veces hay cambios de un período a otro y otras veces simplemente la forma más utilizada es una de las dos. La opción de utilizar el término en singular con el valor de plural no es una opción muy recurrida con ninguno de los sustantivos escogidos. Cada término tiene su propia evolución, sus propias tendencias. En los casos en los que la opción normativa no se generaliza o por lo menos no supera la frecuencia de la opción con el alomorfo -s, como por ejemplo lo que sucede con máster; ¿qué quiere decir esto? ¿implica la necesidad de un cambio e la normativa a favor del alomorfo -s o mantenerse en una posición intermedia y aceptar ambas opciones y, con lo cual, hablar de polimorfismo?¿o simplemente necesita más tiempo para que los hablantes vayan adecuándose a las recomendaciones gramaticales? En el presente trabajo no se trata de dar una respuesta a estas preguntas, sino que lo que se pretende es hacer reflexionar al lector sobre el concepto de prescripción o normativa gramatical, en la gramática no hay leyes intrínsecas sino recomendaciones de uso y tendencias generalizadas. Todo esto podría resumirse en la siguiente frase de Crystal “el habla de hoy es la gramática del mañana”. Lo que queda claro es que se trata de un asunto que necesita ser reflexionado con más datos, por ello en el trabajo no se pretende dar una solución y mucho menos desestimar la labor de los gramáticos de la RAE. Personalmente y aunque a la luz de los datos obtenidos sea la opción menos usual, cuando utilizo alguno de este tipo de términos, ante la duda, prefiero utilizarlos como formas invariables, es decir, en singular.

10

BIBLIOGRAFÍA

Blas Arroyo, José Luis. (2002)“¿Era Bin Laden un líder de los Talibán?...¿O de los talibanes?: Presiones externas e internas en un fenómeno reciente de variación morfológica en español”

Versión

on

line

en

Dialnet

y

en

el

siguiente

enlace:

http://revistas.um.es/ril/article/view/5001 http://gramatica.usc.es/persoas/guillermo.rojo http://lema.rae.es/dpd/srv/search?id=Iwao8PGQ8D6QkHPn4i [20/12/2015] http://www.rae.es/recursos/banco-de-datos/corde#sthash.2UUMGqZ7.dpuf [20/12/2015] http://www.rae.es/recursos/banco-de-datos/crea#sthash.yFePxzuZ.dpuf [20/12/2015] http://www.rae.es/recursos/banco-de-datos/corpes-xxi#sthash.dvzLhzQx.dpuf [20/12/2015] REAL ACADEMIA ESPAÑOLA: Banco de datos (CORDE) [en línea].Corpus diacrónico del español. [20/12/2015] REAL ACADEMIA ESPAÑOLA: Banco de datos (CREA) [en línea].Corpus de referencia del español actual. [20/12/2015] Object5

REAL ACADEMIA ESPAÑOLA: Banco de datos (CORPES XXI) [en línea]. Corpus del

Español del Siglo XXI (CORPES). [20/12/2015]

11

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.