Estudos de parsing em outras línguas: espanhol e português brasileiro

June 28, 2017 | Autor: Laura Pissani | Categoria: Experimental Psycholinguistics, Syntactic Parsing
Share Embed


Descrição do Produto

Estudos de parsing em outras línguas: espanhol e português brasileiro Laura Pissani1 PUC-Rio/CNPq 1. Introdução. Os estudos de parsing pretendem explicar como funciona o parser (mecanismo de processamento de linguagem humana) no processamento de enunciados linguísticos e como ele chega à interpretação de um enunciado linguístico a partir de uma sequência de itens lexicais; também, entre os problemas abrangidos pelos estudos de parsing, está a questão de como o parser lida diante de enunciados linguísticos ambíguos e que fatores intervêm no processamento. Por um lado, a Teoria do Garden-Path (Frazier e Fodor, 1978; Frazier 1979; Frazier e Rainer, 1982) propõe um parser autônomo que faz uso de informações de natureza sintática (modular) e procede de forma sequencial em dois estágios (serial), onde o primeiro estágio é guiado por dois princípios universais Late Closure e Minimal Attachment para a pronta interpretação do enunciado linguístico. Por outro lado, existe um conjunto de teorias, conhecidas como Constraint Based Theories (CBT), que propõem um parser interativo, que faz uso de informações de toda natureza (e.g. sintática, semântica, pragmática, etc.), para chegar à interpretação do enunciado linguístico e apresenta um tipo de processamento em paralelo explicitado nos modelos do tipo Constraint-Satisfaction. Contudo, a universalidade dos princípios propostos pela TGP foi posta em controvérsia pelos achados de Cuetos e Mitchell (1988) no artigo Cross-linguistic differences in parsing: restrictions on the use of the Late Closure strategy in Spanish, que avalia a aplicação dos princípios da TGP em sentenças com marcadores relativos em inglês e em espanhol como no seguinte exemplo.

(1) a. Alguien disparó al empleado de la actriz que estaba en la terraza. b. Someone shot the servant of the actress who was on the balcony.

Segundo a TGP, na interpretação da sentença (1) deveria se aplicar o princípio Late Clousure que sugere associar o novo material (CR: que estaba em la terraza/ who was on the balcony) ao sintagma que está sendo processado no momento (SPrep.: de la actriz/of the

1

Estudante de mestrado na área de estudos da linguagem da PUC-Rio/CNPq (Rio de Janeiro, Brasil)

actress) independentemente da língua. Porém, Cuetos e Mitchell (1988) acharam preferência da associação da cláusula relativa (CR) como modificador do sintagma nominal el empleado em falantes nativos de espanhol, contrario ao princípio de LC achado em falantes do inglês que mostraram preferência pela associação da CR ao SPrep. Desse modo, a pesquisa de Cuetos e Mitchel (1988) iniciou a chamada crise do princípio de Late Closure e colocou em dúvida a universalidade do processador sintático. Posteriormente, Mitchell e Cuetos (1991) propuseram a Hipótese da Sintonia do parser (Tuning Hypothesis), que sugere que a análise de enunciados linguísticos ambíguos depende das experiências individuais do sujeito. Então, diante de qualquer estrutura sintática ambígua, o parser não faria uso indefectivelmente dos princípios; mas levaria em conta as vivencias do sujeito.

2. Estudos de parsing em espanhol. A partir dos estudos de Cuetos e Mitchel (1988) em inglês e espanhol, surgiram pesquisas em outras línguas, entre elas: português brasileiro e replicas em espanhol, etc. Assim, Gibson, Pearlmutter e Torrens (1999) realizam uma réplica dos estudos de Cuetos e Mitchel (1988) também em espanhol no artigo Recency and lexical preferences in Spanish. Gibson, Pearlmutter e Torrens (1999), contrários aos postulados de Cuetos e Mitchel (1988), planteiam a hipótese de que o princípio de que o novo material é associando ao sintagma analisado mais recentemente (no artigo, recency) se aplica também no processamento de sentenças relativas em espanhol, como postulado pelos princípios universais da TGP. O experimento foi aplicado a 25 participantes, estudantes da comunidade académica de Boston, que receberam $5 de pagamento. Um dos participantes foi excluído por baixo desempenho na compreensão de perguntas em relação ao resto de participantes (76%, em relação ao resto de participantes que mostrava um desempenho igual ou superior a 82%). Todos os participantes eram nativos do espanhol de diferentes nacionalidades; Espanha (8), México (3), Islas Canarias (2), El Salvador (2), Peru (2), Estados Unidos (2), Colômbia (1), Cuba (1), Republica Dominicana (1), Nicarágua (1) e Venezuela (1). Os estímulos consistiram em 30 enunciados, cada um deles com 5 versões do tipo que se apresenta em (2):

(2) a. El astrónomo predijo la órbita de los planetas que se observó desde el satélite. b. El astrónomo predijo las órbitas del planeta que se observó desde el satélite.

c. El astrónomo predijo el cambio de las órbitas de los planetas que se observó desde el satélite. d. El astrónomo predijo el cambio de la órbita de los planetas que se observó desde el satélite. e. El astrónomo predijo los cambios de las órbitas del planeta que se observó desde el satélite.

Além do mais, foram adicionadas 70 frases distratoras e 9 frases de treinamento. E, no final de cada frase, foi acrescentada uma pergunta de compreensão para ser respondida com sim ou não. Os estímulos foram organizados em 5 listas de 100 sentenças cada uma, de modo que em nenhuma lista foram repetidas sentenças do mesmo grupo, e cada sujeito era exposto a uma lista só. No procedimento, tanto para apresentar os estímulos quanto para coletar as respostas foram usados dois computadores Macintosh (uma Centris 610 e uma Quadra 950). Todas as instruções e materiais foram apresentados em espanhol. No início, o participante via na tela uma sequência lineal de hifens representando cada palavra da sentença (- - - - - - - - - - - - - - -), ao pressionar a barra de espaço o hífen se transformava na palavra (El - -- - - - - - - - - - - - ), ao pressionar a barra de espaço de nova, a palavra voltava à forma de hífen e a seguinte palavra aparecia (-astrónomo- - - - - - - - - - - -) e assim sucessivamente até a última palavra (- - - - - - - - - - - -satélite) e depois aparecia a pergunta de compreensão. Cada participante demorou aproximadamente 35 minutos em fazer o experimento todo, o computador gravava o tempo que tomava o participante em pressionar o botão e, finalmente, dava uma retroalimentação sobre a resposta de compreensão. Os resultados replicaram o achado em estudos anteriores, onde existe predominância da associação da cláusula relativa (CR) ao nó mais alto em sentenças com 2 sintagmas nominais (SN) e ao nó mais baixo em sentenças com 3 sintagmas nominais. Sobre os resultados, os autores afirmam que outros fatores (como preferências lexicais e plausibilidade) não seriam suficientes para explicar os achados; eles simplesmente mostram que existe uma inclinação por associação da CR ao nó mais alto em sentenças ambíguas com 2SN e ao nó mais baixo em sentenças ambíguas com 3SN em espanhol. Para explicar as diferencias achadas em espanhol com respeito ao inglês, Gibson et al. (1996) propõem a Two-Factor Theory, na qual o primeiro princípio seria

Recency,

equivalente ao LC na TGP, «applied uniformly across languages and specified an increasing cost associated with increasingly distant attachments» (Gibson et al., 1999:2) e o segundo

princípio seria Predicate proximity «specified a fixed cost associated with attachments that were not as close as possible to a predicate phrase (typically a VP)» (Gibson et al., 1999:2).

3. Estudos de parsing em português. Em relação ao português, o livro Processamento da Linguagem é o primeiro de uma serie de livros que explora a crescente área da Psicolinguística no Brasil. O livro é compilado por Marcus Maia e Ingrid Finger (2005) e reúne uma série de artigos sobre diferentes tópicos dentro da área do processamento da linguagem feitos tanto por pesquisadores consolidados quanto por alunos de pós-graduação, as pesquisas têm sido realizadas dentro do Brasil e apresentam experimentos aplicados no português brasileiro (PB). Uma das teorias que, na atualidade, guia a pesquisa na área de estudos de parsing é a Teoria do Garden-Path (TGP). A teoria caracteriza ao parser como um processador eficiente, que tenta chegar à interpretação de modo mais rápido possível e que exija o menor custo de processamento; ele é de natureza modular ou encapsulada; isto é, guiado somente pela informação de tipo sintática na interpretação de enunciados verbais; o parser é também serial; quer dizer, processa a informação de modo sequencial em dois estágios, sendo o primeiro guiado pelos princípios de Late Closure e Minimal Attachment. Do mesmo modo, a chamada crise da Late Closure, propagada pela pesquisa de Cuetos e Mitchel (1988) também motivou estudos no português brasileiro. Especificamente, estudos do princípio de LC em português brasileiro foram realizados por Ribeiro (2005, 2008, 2010). Ribeiro (2005) testa as predições de LC no processamento sentenças ambíguas, em português brasileiro, similares às estudadas por Frazier (1979).

(1) Em quanto Maria costurava a meia caiu do colo dela. (2) Em quanto Maria costurava a meia ela caiu do colo dela.

Diante de sentenças do tipo (1) e (2); o parser, seguindo o princípio LC, deveria ligar a meia ao verbo costurava e; desse modo, chegaria a uma interpretação correta na sentença (2); mas cairia no efeito do Garden-Path na sentença (1) e seria obrigado a voltar para fazer uma reanálise. Para comprovar se os falantes nativos do português seguiam ou não o princípio de LC na interpretação de sentenças ambíguas; Ribeiro testou as sentenças relativas, similares às propostas por Cuetos e Mitchel (1988).

(3) Alguém atirou contra o empregado da atriz que estava na varanda.

Para o experimento, foram reclutados dezoito participantes, falantes monolíngues do português brasileiro, que foram expostos a um questionário com dezesseis sentenças do tipo (3) e no final foram apresentadas perguntas de compreensão do tipo ‘Quem estava na varanda?’. Nos resultados, 11/16 sujeito ligaram ‘o empregado’ a ‘que estava na varanda’, seguindo o princípio de Early Closure; enquanto que, 3/16 sujeitos ligaram ‘a atriz’ a ‘que estava na varanda’, seguindo o princípio Late Closure. Os resultados evidenciaram a preferência dos falantes nativos de português pelo princípio EC. Posteriormente, em um experimento de leitura auto-monitorada com 23 sujeitos das mesmas caraterísticas, as frases foram as mesmas já descritas, porém com o acréscimo de um fragmento final que obrigava a ligação da cláusula relativa a ‘a atriz’ seguindo o LC.

(4) Alguém atirou contra o empregado da atriz que estava na varanda com seu marido. (5) Alguém atirou contra a atriz que estava na varanda com seu marido.

Ainda não achando resultados que mostrassem a preferência do parser pelo LC, Ribeiro (2005) testou os modelos de sentenças apresentadas por Frazier (1979):

(6) a. Por mais que Jorge continuasse lendo as histórias aborreciam as crianças da creche. (EC) b. Por mais que Jorge continuasse lendo as crianças detestavam as histórias de terror. (SC) c. Por mais que Jorge continuasse lendo as histórias as crianças choravam sem parar. (LC)

As sentenças foram apresentadas a 48 participantes, em (6a) e (6c) e se evidenciou a preferência de LT; enquanto que para (6b) foi evidenciado o Weak Semantic Principle (SC) que diz que o parser deve evitar ligações não compatíveis semanticamente e associar o SN ao fragmento seguinte. Em outro tipo de sentenças, também propostas em Frazier (1979) se evidencia a preferência pelo LC e SC, sustentando os princípios propostos na TGP. Desse modo, Ribeiro consegue sustentar o LC em sentenças com cláusulas relativas propostas nos experimentos de

Frazier (1979); contudo, sentenças do tipo apresentado por Cuetos e Mitchel (1984) ainda precisam ser analisadas com mais detalhe para demonstrar a preferência do LC ou EC com precisão no PB.

4. Sugestão de desenvolvimento do tema. A TGP propõe um processamento serial e sugere que ao cair no efeito do Garden-Path o falante volta e faz uma reanálise; no entanto as CBT propõem um processamento em paralelo, onde o falante processa as duas (ou mais) possibilidades e contrasta com todas as informações disponíveis para selecionar a forma correta. Os resultados obtidos de estudos em outras línguas (e.g. espanhol e português) mostram a importância de pesquisar o grau de dependência ou independência do processador da linguagem de uma língua específica. Isto é, a TGP propõe princípios universais baseados em nosso aparato cognitivo humano o qual prediz que o nosso processador deveria funcionar do mesmo modo independentemente da língua. No entanto, pesquisas feitas em outras línguas (Cuetos e Mitchel (1988); Ribeiro (2005, 2008, 2010)) sugerem diferentes preferências do processador em diferentes línguas; por suposto, existem fatores metodológicos e interferências que poderiam estar afetando os resultados; por exemplo, as estruturas sintáticas e outros fatores externos. De qualquer forma, existem evidências que questionam a universalidade do processador da linguagem. O que faz muito interessante a pesquisa em falantes bilíngues; especialmente, aqueles que, segundo as pesquisas, mostram preferencias opostas na análise sintática de sentenças ambíguas. Com base nos estudos de Cuetos e Mitchel (1988), poderia se realizar uma replica com falantes bilíngues espanhol-inglês e inglês-espanhol com nível avançado da segunda língua. Segundo os achados em sentenças ambíguas do tipo Alguém atirou contra empregado da atriz que estava na varanda, os falantes de espanhol preferiam EC; enquanto que, os falantes de inglês preferiam LC. Porém, um problema para pesquisar seria o seguinte: (1) O que tipo de interpretação preferem os falantes nativos de inglês quando testados em espanhol e; o oposto, (2) O que tipo de interpretação preferem os falantes nativos de espanhol quando testados em inglês; levando em conta que o nível da segunda língua deve ser avançado e; portanto, se assume que teriam um domínio avançado da gramática da língua e restaria saber como funciona o processamento psicolinguístico de esses falantes não nativos.

5. Referências Bibliográficas ALTMANN, G. History of Psycholinguistics. In: BROWN, K. (Ed). Encyclopedia of Language & Linguistics. 2nd Edition, v. 10. Elsevier, 2006, p. 257-265. BOCK, K.; LEVELT, W. Language Production: Grammatical encoding. In: Handbook of Psycholinguistics. Wisconsin: Academic Press, 1994. p. 945-984. CUETOS, F. & MITCHELL, Don C. Cross-linguistic differences in parsing: restrictions on the use of the Late Closure strategy in Spanish. Cognition (30), p.73-105, 1988. FERNÁNDEZ, E. M.; CAIRNS, H. S. Fundamentals of Psycholinguistics. Malden, MA, USA/Oxford, UK: Wiley-Blackwell, 2011. GIBSON, E.; PEARLMUTTER, N.; TORRENS, C. Recency and lexical preferences in Spanish. Memory & Cognition, p.603-611, 1999. HARLEY, T. A. The Psychology of Language: From Data to Theory. 3. ed. Hove: Taylor & Francis, Psychology Press, 2008. KONOPKA, A.; BROWN-SCHMIDT, A. Message encoding. In: The Oxford Handbook of Language Production. New York: Oxford University Press, 2014. p. 1-20. LEVELT, W.; ROELOFS, A.; MEYER, A. A theory of lexical access in speech production. Behavioral and brain sciences, n.22, p.1-75, 1999. LEVELT, W. Models of word production. Trends in Cognitive Sciences, v.3, n.6, p.223-231, jun. 1999. ____. The Speaker as Information Processor. In: Speaking: From Intention to Articulation. Cambridge: MIT Press, 1993. p. 1-28. MARR, D. (1982). Vision. Cambridge, Mass: MIT Press. Introdução. RIBEIRO, A. Late closure em parsing no português do Brasil. In: MAIA, M. & FINGER, I. (org.). Processamento de Linguagem. Pelotas: 2005 p. 51-69. RODRIGUES, E. dos S. Produção da linguagem. In: Marcus Antônio Rezende Maia. (Org.). Psicolinguística, Psicolinguísticas: uma introdução. 1ed. São Paulo: Contexto, 2015, v. 1, p. 85-98. TANENHAUS, M. et al. Eye Movements and Lexical Access in Spoken-Language Comprehension: Evaluating a Linking Hypothesis between fixations and Linguistic Processing. Journal of Psycholinguistics Research, v.29, n.6, p.557-577, 2000. WARREN, P. Introducing Psycholinguistics. Cambridge: Cambridge University Press, 2013.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.