EQUIVALENTES DE TRADUÇÃO ENTRE PORTUGUÊS, ESPANHOL E INGLÊS NA CONSTITUIÇÃO DE DICIONÁRIO TEMÁTICO TRILÍNGUE PARA A COPA 2014

June 4, 2017 | Autor: Maucha Andrade | Categoria: Translation Studies, Lexicography, Frame Semantics, Equivalence in Translation
Share Embed


Descrição do Produto

EQUIVALENTES DE TRADUÇÃO ENTRE PORTUGUÊS, ESPANHOL E INGLÊS NA CONSTITUIÇÃO DE DICIONÁRIO TEMÁTICO TRILÍNGUE PARA A COPA 20141 Maucha Andrade Gamonal Simone Rodrigues Peron Tiago Timponi Torrent INTRODUÇÃO Este trabalho insere-se no projeto Copa_2014 (Salomão et al 2011), subprojeto da FrameNet Brasil, que está desenvolvendo um dicionário temático trilíngue (Português, Inglês, Espanhol), em meio eletrônico, para os domínios do Futebol e do Turismo. A estruturação do dicionário segue os postulados da Semântica de Frames (Fillmore 1982, 1985) e adota a metodologia da rede semântica FrameNet (Fillmore et al. 2003a, 2003b; Ruppenhoffer et al. 2010). Por tal motivo, pode ser considerado um produto de inovação tecnológica, uma vez que tanto as entradas do dicionário quanto o sistema de consulta se distinguirão dos demais, já que serão estruturados a partir de frames. Como a Semântica de Frames se propõe a ser um programa de pesquisa de natureza empírica, todas as análises realizadas e as entradas para ilustrar o dicionário serão baseadas em textos autênticos. Desse modo, a motivação para a realização deste recorte resultou dos desafios estabelecidos para a constituição de corpora trilíngue traduzidos que tratassem do domínio do turismo de maneira autêntica, ou seja, através de sentenças cuja estruturação sintático-semântica fosse natural a um falante nativo de cada um dos três idiomas alvo. 1 O DICIONÁRIO A expectativa no desenvolvimento do projeto Copa_2014 é a oportunidade de criar um dicionário trilíngue nos moldes da rede semântica FrameNet, que seja acessível eletronicamente de qualquer parte do mundo. Tal recurso pretende atender tanto aos turistas brasileiros e estrangeiros, que assistirão aos jogos e conhecerão as diversas 1

O projeto Copa 2014 FrameNet Brasil é desenvolvido com apoio do CNPq – APQ 474270/2011-4 – e da Universidade Federal de Juiz de Fora, através do Programa de Apoio aos Grupos de Pesquisa.

atrações turísticas do país, quanto à demanda daqueles que, direta ou indiretamente, estarão envolvidos na organização da Copa do Mundo FIFA 2014. A concepção fillmoreana de frame, inserida na Linguística Cognitiva, propõe que a compreensão de qualquer conceito depende do acesso a toda estrutura à qual ele esteja vinculado; assim, se o conceito é interpretado, é sinal de que toda a estrutura foi disponibilizada. Quando Fillmore (1982) propõe esse termo, ele pretende estabelecer um programa de pesquisa que valorize a intrínseca relação estabelecida entre o conhecimento linguístico e o conhecimento enciclopédico. A escolha por essa abordagem é uma tentativa de superar os limites da linearidade imposta pelos dicionários impressos e, ao mesmo tempo, explorar as oportunidades da tecnologia computacional. Um exemplo de recurso estruturado em corpus inspirado em tais postulados teóricos é o Kicktionary (Schmidt 2007, 2009). Esse dicionário multilíngue (Inglês, Francês, Alemão) abarca o vocabulário do futebol inserindo as regras e as etapas do jogo em cenas e frames (cf. Fillmore 1977; Schmidt 2009). 2 DESAFIOS NA CONSTITUIÇÃO DE CORPUS TRILÍNGUE Diante da necessidade de buscar exemplos que guiassem a estruturação e análise dos frames do turismo, foi necessária a criação de corpus de domínio específico. Dessa maneira, o material foi constituído de textos advindos de sites de órgãos governamentais de fomento à atividade turística e de blogs de viajantes. O objetivo era que esses corpora fossem trilíngues, já que a pretensão inicial era garantir equivalentes nas três línguas para as entradas do dicionário. Uma vez que os corpora trilíngues disponíveis precisam se constituir em repertórios de instâncias autênticas dos usos linguísticos praticados por falantes não só do português do Brasil como também do espanhol e do inglês, fez-se necessário averiguar a confiabilidade das traduções disponibilizadas. De modo a verificar tal confiabilidade, realizaram-se estudos das valências sintático-semânticas de itens lexicais presentes nos corpora traduzidos previamente selecionados em contraste com as valências desses mesmos itens em corpora constituídos de textos produzidos por nativos.

Como amostra de tais estudos, este trabalho apresentará as valências sintáticosemânticas da Unidade Lexical (UL) – pareamento de um lexema a um frame – surpreender e seus equivalentes sorprender, na língua espanhola, e surprise, na língua inglesa. Tais ULs evocam o frame Atração_turística, representado na Figura 1. Os dados analisados foram extraídos do corpus referente às matérias publicadas no site governamental Braziltour (http://www.braziltour.com/). Atração_turística Definição: Um Lugar apresenta uma Atração_turística para chamar a atenção de um Turista. Elementos de Frame Nucleares: 

Lugar: local em que se encontra a atração.



Atração_turística: espaço com valor cultural, importância histórica e/ou beleza natural ou artificial, que atrai turistas.



Turista: pessoa que visita o lugar em busca da atração.

Figura1: Frame de Atração_turística

Para analisar as ULs, a metodologia adotada é semelhante à desenvolvida pela FrameNet (cf. Ruppenhofer et al. 2010). De forma sintetizada, alguns dos procedimentos de anotação são: a escolha por lexemas que tratem de um mesmo domínio semântico; a busca por esses lexemas com tais sentidos específicos nos corpora compilados, através da ferramenta WordSketch, do software SketchEngine (http://www.sketchengine.co.uk); o estudo do comportamento semântico e sintático desses predicadores nos corpora e, por último, a definição de qual frame está sendo evocado, juntamente com a designação de seus elementos. O processo de anotação é realizado com o apoio da ferramenta FrameNet Desktop, adaptada pela FrameNet Brasil à anotação trilíngue. Os seguintes exemplos foram extraídos dos corpora mencionados anteriormente:

2

(1)

Bonito é [uma cidade do interior do Mato Grosso do Sul Lugar] [queLugar] SURPREENDE [por seus rios de águas cristalinasAtração]. IND2

(2)

Bonito es [una ciudad del interior de Mato Grosso do Sul Lugar] [queLugar] SORPRENDE [por con sus ríos de aguas cristalinasAtracción]. IND

IND é a sigla utilizada na FrameNet para Instanciação Nula Definida. Uma IND ocorre quando um Elemento de Frame nuclear não se manifesta através de material linguístico explícito na sentença anotada, podendo, porém, ser inferível pelo contexto. No caso das sentenças (1), (2) e (3), sabe-se que aquilo que a cidade de Bonito atrai são turistas.

(3)

Bonito is [a city in the inlands of Mato Grosso do SulPlace] [thatPlace] SURPRISES [for its crystal-clear watersAttraction]. IND

Conforme se depreende da leitura dos exemplos de (1) a (3), a julgar pelos textos constantes do site BrazilTour, a UL surpreender e seus equivalentes de tradução para o inglês e espanhol teriam valências sintático-semânticas muito semelhantes, já que, para todas elas, o EF Lugar aparece como argumento externo do verbo, e a Atração configura-se como complemento indireto regido por por ou for. Com vias a verificar a procedência dessa possível equivalência, foi realizada uma busca por tais exemplos na FrameNet Espanhola (http://sfn.uab.es:8080/SFN) e também uma pesquisa através da ferramenta WordSketch no Spanish Web Corpus, que contêm textos coletados via web dos domínios .es, totalizando 116 milhões de tokens. Para a verificação desse uso na língua inglesa, a mesma ferramenta foi utilizada no British National Corpus, que apresenta tanto dados da modalidade oral quanto escrita, constituído por cerca de 110 milhões de tokens. Algumas anotações de surprise foram encontradas também na FrameNet de Berkeley (https://framenet.icsi.berkeley.edu). Observou-se que, em relação à língua espanhola, a UL sorprender exige como complemento a preposição com, e não a preposição por, como exibido pelo corpus BrazilTour. O exemplo da língua inglesa exibiu problema ainda mais grave, já que, além de o complemento desse verbo ser regido por by, este lexema no inglês não evoca o frame mencionado, uma vez que, com base no corpus pesquisado, os falantes nativos não usaram esse tipo de estrutura linguística para falar de atrações turísticas. CONSIDERAÇÕES FINAIS Como se pôde notar nesta breve exposição, confiar em corpora traduzidos pode colocar em risco a representatividade dos exemplos anotados em um dicionário baseado em frames e sustentado por evidência em corpora. Assim, para o desenvolvimento do Copa_2014, optou-se por se proceder a uma alteração metodológica que substitui os corpora traduzidos por corpora equivalentes, produzidos por falantes nativos dos três idiomas.

BIBLIOGRAFIA

FILLMORE, C. J. (1977). “Scenes and frames semantics”, in: ZAMPOLLI, A. Linguistic Structures Processing: Fundamental Studies in Computer Science, nº 59. Amsterdam: North Holland Publishing. _____. (1982). “Frame semantics”, in: THE LINGUISTICS SOCIETY OF KOREA. Linguistics in the morning calm. Seoul: Hashin. _____.; JOHNSON, C. R. & PETRUCK, M. R. L. (2003a). “Background to FrameNet”. International Journal of Lexicography, vol. 26, nº 3. _____.; PETRUCK, M. R. L.; RUPPENHOFER, J. & WRIGHT, A. “FrameNet in action: the case of attaching”. International Journal of Lexicography, vol. 26, nº 3. RUPPENHOFER,

J.;

ELLSWORTH,

M.;

PETRUCK,

M.;

JOHNSON,

C.;

SCHEFFCZYK. (2010). FrameNet II: Extended Theory and Practice. Disponível em http://framenet.icsi.berkeley.edu/. Acesso em 13 de outubro de 2012. SALOMÃO, M. M. M.; TORRENT, T. T.; CAMPOS, F. C. A.; BRAGA, R. M. M. & VIEIRA, M. B. (2011). Copa 2014 Framenet Brasil. Projeto apresentado ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), no âmbito do Edital Universal nº 14/2011. Juiz de Fora. SCHMIDT, T. (2006). “Interfacing Lexical and Ontological Information in a Multilingual Soccer FrameNet”. Proceedings of OntoLex – Interfacing Ontologies and Lexical Resources for Semantic Web Technologies. Gênova: OntoLex. SCHMIDT, T. (2009). “The Kicktionary: a multilingual lexical resource of football language”, in: BOAS, H. Multilingual FrameNets – Methods and Applications. Berlim/Nova York: Mouton de Gruyter.

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.