REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

June 14, 2017 | Autor: M. Scherre | Categoria: Languages and Linguistics

Descrição do Produto

DEFESA DE TESE

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em português.Tese de Doutorado em Lingüística. Rio de Janeiro, Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p. mimeo.

______________________________________________________________ ORIENTADOR: PROFESSOR DOUTOR ANTHONY JULIUS NARO - UFRJ

______________________________________________________________ PROFESSORA DOUTORA DINAH MARIA ISENSEE CALLOU - UFRJ

______________________________________________________________ PROFESSOR DOUTOR MARCO ANTÔNIO DE OLIVEIRA - UFMG

______________________________________________________________ PROFESSOR DOUTOR FERNANDO LUIZ TARALLO - UNICAMP/PUC-SP

______________________________________________________________ PROFESSOR DOUTOR EMMANOEL M.DA S. T. J. DOS SANTOS - UFRJ

DEFENDIDA A TESE CONCEITO: EM: __/__/1988

REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

POR MARIA MARTA PEREIRA SCHERRE

VOLUME I

DEPARTAMENTO DE LINGÜÍSTICA E FILOLOGIA FACULDADE DE LETRAS UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

RIO DE JANEIRO, 1º SEMESTRE DE 1988

REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

POR MARIA MARTA PEREIRA SCHERRE DEPARTAMENTO DE LINGÜÍSTICA E FILOLOGIA

Tese de Doutorado em Lingüística apresentada Cursos

de

à

Coordenação

dos

Pós-Graduação

da

Faculdade de Letras da Universidade Federal do Rio de Janeiro. Orientador: Professor Doutor Anthony Julius Naro.

RIO DE JANEIRO, 1º SEMESTRE DE 1988

A meu companheiro, Lessa; a meus filhos, Paula e Rafael; a meus pais, Tãozinho (in memoriam) e Maria.

A Anthony J. Naro, pela orientação segura, precisa e amiga; aos colegas e amigos do Projeto Censo, pelas discussões e críticas enriquecedoras; ao Projeto Censo, pelo acesso ao banco de dados; à Vera Lúcia Paredes Pereira da Silva, pelas discussões frutíferas e pelo apoio amigo; à Denise Novo de Oliveira, pela participação ativa no levantamento, revisão e codificação dos dados e pela leitura do texto; à Maria Elisabeth Dias Pereira, pela digitação deste trabalho, de forma cuidadosa, minuciosa e incansável; à Maria Sônia Dias Pereira, pelo auxílio meticuloso no manuseio de arquivos de dados; à Ivone Isidoro Pinto, pelo auxílio precioso e eficiente na digitação e revisão do texto; à Maria das Graças Dias Pereira, pelas valiosas críticas à redação deste trabalho; à Elizabeth Ferreira Barros, pela leitura cuidadosa e pela revisão da tradução das notas; à Aleria Cavalcante Lage, Gerson Luiz Sales e Luciana Araújo Rocha, pelo auxílio no levantamento, codificação e reclassificação de dados; ao Departamento de Lingüística e Filologia da UFRJ, pelo apoio recebido; ao Laboratório Nacional de Computação Científica do CNPq e a toda a sua equipe, pelos excelentes serviços computacionais; ao CNPq, pelo auxílio prestado através de bolsas de Pesquisador e de Iniciação Científica; a todos os meus familiares, pelo estímulo constante; a todos os meus amigos, por me ouvirem pacientemente; a todas as demais pessoas ou entidades que contribuíram, direta ou indiretamente, para a realização deste trabalho,

agradeço.

SINOPSE Variáveis lingüísticas subjacentes às tendências sistemáticas da variação na concordância de número entre os elementos do sintagma nominal em Português. Princípio universal de motivação externa. Relação entre variação e mudança. Variação inerente. Influência de variáveis sociais não convencionais.

SUMÁRIO

v

LISTA DE QUADROS E TABELAS LISTA DE SÍMBOLOS E ABREVIATURAS

vii xiv

1 - INTRODUÇÃO

15

2 - OS DADOS LINGÜÍSTICOS

20

2.1 2.2 2.3 2.4

-

Introdução Constituição da amostra Processo de coleta e armazenamento dos dados Caracterização dos dados

3 - PRESSUPOSTOS TEÓRICOS 4 - CONSIDERAÇÕES TEÓRICOS

ADICIONAIS

20 21 27 29 33

SOBRE

ASPECTOS

4.1 - Sobre o Funcionalismo no arcabouço teórico da Gramática Gerativa 4.2 - Sobre o Funcionalismo fora do arcabouço teórico da Gramática Gerativa 4.2.1 - O Princípio da Iconicidade 4.2.2 - O Princípio da Economia 4.2.3 - O Princípio do Fluxo de Informação Preferido e o Princípio da Topicidade 4.2.4 - O Princípio da Baixa Tensão

41 41 45 47 48 49 52

5 - SUPORTE QUANTITATIVO

55

6 - ANÁLISE DAS VARIÁVEIS LINGÜÍSTICAS

61

6.1 - Introdução 6.2 - Análise atomística 6.2.1 - Introdução 6.2.2 - Saliência fônica 6.2.3 - Três variáveis relacionadas: Posição linear, Classe gramatical e Marcas precedentes 6.2.4 - Contexto fonético/fonológico seguinte 6.2.5 - Função sintática do SN 6.2.6 - Traços mórficos, semânticos e estilísticos, do substantivo e/ou do adje tivo 6.2.7 - Conclusão 6.3 - Análise não atomística 6.3.1 6.3.2 6.3.3 6.3.4

-

Introdução A pluralidade do contexto Buscando novas explicações Conclusão

6.4 - Conclusão

61 62 62 64 142 247 257 265 277 281 281 283 302 358 376

vi

7 - O PAPEL DO LINGÜÍSTICA

PROCESSAMENTO

NA

VARIAÇÃO 378

7.1 - Introdução 7.2 - Evidências da força do processamento no uso lingüístico 7.2.1 7.2.2 7.2.3 7.2.4 7.2.5 7.2.6

-

No Espanhol No Inglês No Francês No Quechua No Crioulo Caboverdiano No Português do Brasil

381 381 383 387 389 391 392

7.3 - Conclusão

416

8 - RELAÇÃO ENTRE VARIAÇÃO E MUDANÇA

426

8.1 - Introdução 8.2 - Sobre a configuração de variáveis sociais

426 427

8.2.1 - O comportamento de variáveis sociais na variação lingüística estável 8.2.2 - O comportamento de variáveis sociais na mudança em progresso 8.2.3 - Sobre o cruzamento de variáveis sociais 8.3 - Reflexões sobre a mudança em progresso 8.4 - Posições controversas sobre a concordância de número no português popular brasileiro 8.5 - Sobre os resultados de variáveis sociais 8.6 - Sobre resultados de variáveis lingüísticas 8.6.1 - Saliência fônica 8.6.2 - Posição do elemento no SN

427 428 432 433 436 444 461 464 472 482

8.7 - Conclusão 9 - NOVAS PERSPECTIVAS DE INFLUÊNCIAS SOCIAIS 9.1 - Introdução 9.2 - Caracterização das variáveis não convencionais 9.3 - Metodologia de mensuração das variáveis convencionais 9.4 - Resultados das variáveis convencionais e convencionais 9.5 - Conclusão

378

485 485 486 não 488 não 490 506

10 - CONCLUSÃO

509

11 - NOTAS

525

12 - REFERÊNCIAS BIBLIOGRÁFICAS

546

vii

LISTA DE QUADROS E TABELAS

Quadro 2.2.1

- Características sociais dos falantes adultos femininos

25

- Características sociais dos falantes adultos masculinos

26

Quadro 2.2.3

- Características sociais das crianças

27

Tabela 6.2.2.1

- Processos morfofonológicos de formação do plural de todos os dados dos adultos

79

- Tonicidade da sílaba dos itens lexicais singulares de todos os dados dos adultos

80

- Número de sílabas dos itens lexicais singulares de todos os dados dos adultos

81

- Processos morfofonológicos de formação do plural dos substantivos, adjetivos e categorias substantivadas dos dados dos adultos

83

- Processos morfofonológicos de formação do plural dos substantivos, adjetivos e categorias substantivadas dos adultos por escolarização

86

- Tonicidade da sílaba do item lexical singular dos substantivos, adjetivos e categorias substantivadas dos adultos por escolarização

89

- Cruzamento de processos e tonicidade nos substantivos, adjetivos e categorias substantivadas dos adultos: percentagens

92

- Cruzamento de processos e tonicidade nos substantivos, adjetivos e categorias substantivadas dos adultos: probabilidades

93

Tabela 6.2.2.10 - Sobreposição entre processos e tonicidade nos substantivos, adjetivos e categorias substantivadas nos dados dos adultos

94

Quadro 2.2.2

Tabela 6.2.2.2

Tabela 6.2.2.3

Tabela 6.2.2.4

Tabela 6.2.2.6

Tabela 6.2.2.7

Tabela 6.2.2.8

Tabela 6.2.2.9

viii

Tabela 6.2.2.11 - Diferenças probabilísticas entre os processos não regulares e o processo regular em função da presença ou ausência da variável Tonicidade

96

Tabela 6.2.2.12 - Processos e escolarização: comparação entre os resultados de Scherre (1978) e Guy (1981a)

100

Tabela 6.2.2.13 - Processos e escolarização: comparação entre os nossos resultados e os de Guy (1981a)

103

Tabela 6.2.2.14 - Processos e escolarização: comparação entre os nossos resultados do primário e ginasial e os de Braga (1977)

107

Tabela 6.2.2.15 - Processos e escolarização: comparação entre os nossos resultados do colegial e os de Braga (1977) e Scherre (1978)

108

Quadro 6.2.2.16 - Distribuição das marcas de plural nos itens não regulares

110

Tabela 6.2.2.17 - Sobre a análise da concordância

112

Tabela 6.2.2.18 - Processos: sobre a fronteira de morfema

119

Tabela 6.2.2.19 - Tonicidade: sobre a fronteira de morfema

121

Tabela 6.2.2.20 - Sobre os regulares em -ão

125

Tabela 6.2.2.21 - Relação entre itens regulares e itens duplos

128

Tabela 6.2.2.22 - Relação entre itens regulares e itens em -l

129

Tabela 6.2.2.23 - Relação entre itens regulares e itens em -R

130

Tabela 6.2.2.24 - Relação entre itens regulares e itens em -ão

132

Tabela 6.2.2.25 - Relação entre itens regulares e itens em -S

133

Tabela 6.2.2.26 - Análise final de processos e tonicidade dos substantivos, adjetivos e categorias substantivadas dos adultos por escolarização

139

ix

Quadro 6.2.3.1

- Exemplos de posição linear do elemento no SN

144

Quadro 6.2.3.2

- Exemplos de classe gramatical dos elementos no SN

150

- Distribuição dos dados dos falantes adultos em função da classe gramatical e da posição dos elementos no SN

154

- Sobre o efeito paralelo da posição em todos os Sns de três ou mais elementos dos falantes adultos

156

- Cruzamento de posição e classe gramatical em Sns de três ou mais elementos dos dados dos falantes adultos

157

- Cruzamento de posição e classe gramatical em todos os dados dos falantes adultos

158

- Cruzamento de posição e classe gramatical em todos os dados das crianças

158

- Paralelo entre posição e classe gramatical em todos os dados

159

- Relação entre possessivo, quantificador e posição

160

Tabela 6.2.3.3

Tabela 6.2.3.4

Tabela 6.2.3.5

Tabela 6.2.3.6

Tabela 6.2.3.7

Tabela 6.2.3.8

Tabela 6.2.3.9

Tabela 6.2.3.10 - Primeira posição do SN e classe gramatical

164

Tabela 6.2.3.11 - Segunda posição do SN e classe gramatical

166

Quadro 6.2.3.12 - Exemplos de marcas precedentes em unção da posição

177

Tabela 6.2.3.13 - Marcas precedentes em função da posição

180

Tabela 6.2.3.14 - Marcas precedentes, posição e possessivo

181

Tabela 6.2.3.15 - Marcas precedentes, terceira posição e classe gramatical

185

Quadro 6.2.3.16 - Sobre estruturas preferenciais

189

Quadro 6.2.3.17 - Estruturas preferenciais e classe gramatical

190

Tabela 6.2.3.18 - Sobre os SNs inseridos em Sns mais altos

192

x

Tabela 6.2.3.19 - Marcas precedentes, segunda posição e classe gramatical

194

Tabela 6.2.3.20 - Marcas precedentes: análise A

204

Tabela 6.2.3.21 - Marcas precedentes em função da posição: análise B

205

Tabela 6.2.3.22 - Classe gramatical: análises A e B

209

Tabela 6.2.3.23 - Posição linear dos elementos no SN: análises AeB

211

Tabela 6.2.3.24 - Classe gramatical e posição no SN: análise C

214

Tabela 6.2.3.25 - Relação entre os elementos do SN: análise D

219

Tabela 6.2.3.26 - Cruzamento de substantivos e adjetivos e posição em todos os dados dos adultos

225

Tabela 6.2.3.27 - Cruzamento de classe gramatical e posição em SNs de três ou mais constituintes nos dados dos falantes adultos

226

Tabela 6.2.3.28 - Marcas precedentes e posição: análise B e D

229

Tabela 6.2.3.29 - Interferência entre marcas precedentes e relação dos elementos no SN nos resultados das crianças

232

Tabela 6.2.3.30 - Sobre a influência da terminação dos numerais nos Sns de dois constituintes

236

Tabela 6.2.4.1

Tabela 6.2.4.2

Tabela 6.2.4.3

Tabela 6.2.4.4

- Contexto fonético/fonológico seguinte em todos os dados

248

- Contexto fonético/fonológico seguinte em todos os dados e nos itens regulares

249

- Sobre a influência da consoante, da vogal e da pausa em estudos diversos

250

- Comparação da influência do contexto fonético/fonológico seguinte nos itens regulares e nos itens terminados em -S

251

xi

Tabela 6.2.4.5

- Comparação da influência do contexto fonético/fonológico seguinte nos itens regulares, nos terminados em -S e em -R dos dados dos falantes adultos

253

Tabela 6.2.4.6

- Traços das consoantes com os itens regulares

254

Quadro 6.2.5.1

- Exemplos de função sintática do SN

260

Tabela 6.2.5.2

- Função sintática do SN

261

Tabela 6.2.5.3

- Função resumitiva do SN

262

Tabela 6.2.6.1

- Formalidade dos substantivos

269

Tabela 6.2.6.2

- Animacidade dos substantivos nos dados dos falantes adultos

272

- Animacidade dos substantivos nos dados de todos os falantes

272

Tabela 6.2.6.4

- Grau dos substantivos

274

Tabela 6.2.6.5

- Distribuição dos adjetivos: grau e formalidade

275

Tabela 6.2.6.6

- Grau e formalidade dos adjetivos

276

Tabela 6.3.2.1

- A Pluralidade do contexto

289

Tabela 6.3.2.2

- Sobre o efeito do local da informação adicional de plural

295

Tabela 6.3.2.3

- A Pluralidade do contexto

296

Tabela 6.3.2.4

- Sobre a influência do tipo indefinido na quantidade de marcas plurais no substantivo em SNs de dois elementos

300

Tabela 6.3.3.1

- Sobre a Configuração sintagmática do SN

303

Tabela 6.3.3.2

- Sobre a Configuração sintagmática do SN

305

Tabela 6.3.3.3

- Sobre a Configuração sintagmática do SN

309

Tabela 6.3.3.4

- Sobre a Função textual do SN

320

Tabela 6.3.3.5

- Sobre a Localização do SN

323

Tabela 6.3.3.6

- Configuração sintagmática do SN

338

Tabela 6.2.6.3

xii

Tabela 6.3.3.7

- Configuração sintagmática do SN

340

Tabela 6.3.3.8

- Função textual do SN

342

Tabela 6.3.3.9

- Grau e formalidade do SN

343

Tabela 6.3.3.10 - Localização do SN

345

Tabela 6.3.3.11 - Relação entre Configuração sintagmática e Localização do SN

346

Tabela 6.3.3.12 - Relação entre Configuração sintagmática e Localição do SN

348

Tabela 6.3.3.13 - A Pluralidade do SN

350

Tabela 6.3.3.14 - Status informacional do SN

353

Tabela 6.3.3.15 - Animacidade do SN

355

Tabela 6.3.3.16 - Saliência fônica: dimensão processos

357

Tabela 6.3.3.17 - Pluralidade do contexto por escolarização

359

Tabela 6.3.3.18 - Tipos sintagmáticos de baixa freqüência em SNs com a categoria substantivo na terceira posição

369

Tabela 6.3.3.19 - Tipos sintagmáticos de alta freqüência em SNs com a categoria substantivo na terceira posição

370

Tabela 6.3.3.20 - Tipos sintagmáticos de baixa freqüência em SNs com a categoria não-substantivo na terceira posição

371

Tabela 6.3.3.21 - Tipos sintagmáticos de alta freqüência em SNs com a categoria não-substantivo na terceira posição

372

Tabela 8.5.1

- Variáveis sociais dos adultos

445

Tabela 8.5.2

- Variáveis sociais das crianças

447

Tabela 8.5.3

- Variáveis sociais: tipo de ambiente e grau de concordância

454

xiii

Tabela 8.6.1

- Saliência fônica dos substantivos, adjetivos e categorias substantivadas por subagrupamentos de falantes

465

- Relação entre os elementos do SN por subagrupamentos de falantes

474

- Relação entre os elementos do SN por subagrupamentos de falantes

475

- Marcas precedentes em função da posição por subagrupamentos de falantes

478

- Marcas precedentes em função da posição por agrupamentos de falantes

479

Tabela 9.4.1

- Variáveis sociais convecionais

491

Tabela 9.4.2

- Variáveis sociais não convencionais

492

Tabela 9.4.3

- Anos de escolarização e Sexo

494

Tabela 9.4.4

- Sobre interferências na variável anos de escolarização: dados dos homens

495

- Sobre interferências na variável anos de escolarização: dados das mulheres

496

- Relação entre variáveis não convencionais e Sexo

498

Tabela 9.4.7

- Faixa etária e Sexo

501

Tabela 9.4.8

- Sobre a Faixa etária nos dados dos falantes do sexo masculino

502

- Distribuição dos falantes por ambiente, grau de concordância e sexo

504

- Sobre o comportamento das mulheres

505

Tabela 8.6.2

Tabela 8.6.3

Tabela 8.6.4

Tabela 8.6.5

Tabela 9.4.5

Tabela 9.4.6

Quadro 9.4.9

Tabela 9.4.10

xiv

LISTA DE SÍMBOLOS E ABREVIATURAS

*

f

Sexo feminino

m

Sexo masculino

p

Primário

g

Ginasial

c

Colegial

a

Anos

Apl.

Aplicação da regra, ou seja, número total de ocorrências com a marca analisada

Total

Número total de ocorrências nas quais se esperaria a marca analisada

Prob. ou P.

Probabilidade de aplicação da regra

Freq. ou F.

Freqüência de aplicação da regra

+

Aplicação categórica positiva, ou seja, presença constante da marca analisada na presença de um dado fator

-

Aplicação categórica negativa, ou seja, ausência constante da marca analisada na presença de um dado fator

xxx

Não ocorrência de um certo tipo de dado

E

Entrevistador

F

Falante

(N,NN)

Nas tabelas, os parênteses ao redor dos números indicam que as probabilidades são estatisticamente não relevantes

* Esta versão desta tese foi adaptada para ser impressa a laser em fevereiro de 1966. Portanto, ocorreram alterações no formato das letras e das linhas das páginas. Sempre que foi possível, fizemos corresponder o início e o fim das páginas desta versão com o início e o fim das páginas da versão original. As diferenças dificilmente ultrapassam duas linhas, ora na parte superior, ora na parte inferior das páginas. Aproveitamos também a oportunidade para efetuar a correção dos erros detectados até a presente data. Alguns constam da errata anexada à versão original; outros foram encontrados posteriormente. Objetivando maior precisão de redação, alteramos a denominação de Princípio do Processamento Paralelo para Princípio do Processamento com Paralelismo.

1 - INTRODUÇÃO

No

presente

trabalho,

fazemos

uma

análise

minuciosa

da

concordância gramatical de número plural entre os elementos flexionáveis do sintagma nominal em português sob uma perspectiva teórica que une aspectos da Teoria da Variação Lingüística Laboviana ou Sociolingüística Quantitativa e aspectos da Teoria Funcionalista fora do arcabouço teórico da Gramática Gerativa. Temos quatro objetivos com esta análise. O primeiro deles é o de apresentar a descrição e explicação de um conjunto de variáveis lingüísticas e não lingüísticas que regem a sistematicidade da variação da concordância de número entre os elementos do SN. Vamos evidenciar que existe um sistema gerenciando esta variação, sendo, portanto, possível estabelecer-se com relativa precisão em que circunstâncias

lingüísticas

haverá

a

ocorrência

de

uma

estrutura

sintagmática com todas as marcas de plural ou com apenas algumas delas. Conseqüentemente, é possível prever em que estruturas lingüísticas os falantes são propensos a colocar ou não todas as marcas formais de plural. O segundo objetivo é discutir a hipótese funcionalista de Kiparsky (1972), inserida no arcabouço teórico da Gramática Gerativa, trazendo evidências de que uma teoria lingüística adequada que pretende ter caráter explanatório deve incorporar também motivações ou princípios gerais externos, ou seja, princípios não estritamente gramaticais determinando o uso e, conseqüentemente, a forma da língua.

16

O terceiro objetivo envolve uma questão bastante polêmica: a análise da relação entre a variação e mudança, no sentido de se verificar se o fenômeno focalizado reflete um estágio de variação sociolingüística estável ou um processo de mudança lingüística em progresso. O quarto objetivo envolve outro ponto também polêmico, o que se relaciona à questão da variação inerente: se a variação grupal reflete a variação individual, ou seja, se ela é inerente ou se é apenas fruto do agrupamento de indivíduos com comportamentos lingüísticos diferenciados entre si, mas internamente homogêneos. Através desta análise, objetivamos, portanto, discutir aspectos relacionados ao funcionamento de gramáticas particulares, no caso a do Português, bem como aspectos que dizem respeito a características comuns às línguas naturais. Desta

forma,

pretendemos

trazer

contribuições

a

nível

descritivo/explicativo do funcionamento de uma língua particular com a descrição e explicação das variáveis lingüísticas que regem a concordância nominal variável e, também, a nível da teoria lingüística geral, através de questões que dizem respeito (1) a princípios universais envolvendo diferentes línguas; (2) à relação entre variação e mudança e (3) à existência ou não de variação inerente. A nossa exposição seguirá a seguinte ordem: no segundo capítulo, apresentamos todos os aspectos relativos aos dados lingüísticos analisados, quais sejam: a sua fonte, o perfil social dos falantes que os produziram, a sua forma de obtenção e a sua caracterização precisa; no terceiro, descrevemos sucintamente

os

pressupostos

teóricos

deste

trabalho;

no

quarto,

17

explicitamos aspectos teóricos adicionais que envolvem algumas das questões a serem discutidas através dos resultados desta pesquisa e, no quinto, descrevemos o suporte quantitativo utilizado na análise dos dados. No sexto capítulo, o mais longo de todos eles, apresentamos exaustivamente a análise das variáveis lingüísticas, procurando ver as implicações para algumas das questões teóricas que serão discutidas. No sétimo capítulo, sugerimos a postulação de um princípio de motivação externa de caráter universal, baseado no processamento das unidades lingüísticas, para dar conta (1) de resultados obtidos através da nossa análise, (2) de resultados obtidos através de outras análises de outros fenômenos do Português e (3) de resultados obtidos através de análises feitas para diversos fenômenos envolvendo também outras línguas como o Espanhol, o Francês, o Inglês, o Quechua e o Crioulo Caboverdiano. No oitavo capítulo, discutimos a relação entre variação e mudança, com base nos resultados de variáveis sociais convencionais como Anos de escolarização, Sexo e Faixa etária e abordamos a questão da variação inerente

com

base

nos

resultados

de

variáveis

lingüísticas

por

subagrupamentos de falantes. No nono, trazemos resultados de novas variáveis sociais não convencionais do tipo Mercado ocupacional, Mídia e Sensibilidade lingüística. No décimo, apresentamos a conclusão e, nos dois últimos, as notas e as referências bibliográficas. Não desenvolvemos um capítulo específico para a revisão bibliográfica. Optamos por fazer referência aos diversos trabalhos sobre o assunto nos momentos oportunos. Também não reservamos um capítulo especial para a interpretação

lingüística

dos

resultados

estatísticos.

Preferimos

apre-

18

sentar as conclusões ao final de cada item ou subitem, bem como ao final de cada capítulo. Esta forma de apresentação objetiva fazer com que cada parte possa ser percebida como um texto fechado e, conseqüentemente, ser claramente entendida, sem recorrência necessária a outras partes do presente trabalho. Não temos a pretensão de apresentar uma análise acabada, o que nem é possível. Antes de mais nada, interessa-nos o processo analítico, que nos conduz necessariamente a um conhecimento mais profundo dos fatos. Por isto, a nossa exposição sempre se reveste de um cunho polêmico e apresenta um mínimo do caminho que seguimos para buscar as perguntas e apresentar as respostas que se encontram neste trabalho. Sempre que possível, sugerimos mais de uma alternativa de análise, buscando a mais adequada com base em argumentação lingüística e estatística. Queremos crer que, desta forma, tivemos oportunidade de contribuir para conhecer um pouco mais do nosso precioso sistema de comunicação: a língua. Estamos assumindo que a análise que vamos apresentar no corpo deste trabalho se reveste de caráter explicativo. Sabemos estar sendo por de mais ambiciosos, mas esta foi a tarefa a que nos impusemos, ao continuarmos o estudo de um fenômeno lingüístico do Português do Brasil iniciado em 1976, por Braga & Scherre, e amplamente rediscutido e reestudado em outras amostras de fala por Braga em 1977, Scherre em 1978, Ponte em 1979, Carvalho Nina em 1980 e Guy em 1981. Se não tivermos alcançado o nosso objetivo (e julgamos que sim), temos certeza de termos conseguido uma descrição acurada dos dados que tínhamos em mãos: da análise

19

que fizemos, somos capazes de prever, com baixa margem de erro, em que contextos lingüísticos e sociais haverá maior ou menor probabilidade de ocorrer a concordância de número entre os elementos do sintagma nominal em Português.

2 - OS DADOS LINGÜÍSTICOS

2.1 - Introdução

Extraímos o material lingüístico aqui analisado de uma amostra constituída de 64 horas de fala gravada de 64 falantes radicados no município do Rio de Janeiro. Estas 64 horas estão na forma de entrevistas, transcritas e armazenadas eletronicamente, constituindo-se um "banco de dados", o qual foi organizado por uma equipe de pesquisadores sediada na Faculdade de Letras da UFRJ, congregando também professores de outras universidades como UFRRJ, UFF e UFJF - a equipe do Projeto Censo.1 As entrevistas feitas com os 64 falantes ocorreram em dois momentos distintos: em 1982-1984, gravaram-se 48 entrevistas com 48 falantes de 15 a 71 anos, através de um projeto de pesquisa financiado pela FINEP e, em 1983-1985, gravaram-se 16 entrevistas com 16 falantes de sete a 14 anos, através de outro projeto de pesquisa financiado pelo INEP. Estas 64 entrevistas foram todas transcritas segundo um sistema de transcrição específico e, após, foram digitadas e armazenadas eletronicamente. Estão hoje em fase final de correção para uso futuro através de acesso automático. A descrição detalhada a respeito da formação do "banco de dados" e a caracterização minuciosa da amostra encontram-se em sucessivos relatórios apresentados por esta equipe aos órgãos financiadores e encontram-se especialmente sistematizadas no primeiro volume de um relatório final apresentado à FINEP em 1986, por ocasião do segundo biênio de financiamento de pesquisa através deste órgão de fomento (cf. NARO et

21

alii, 1986, v.I, p.3-59; Adendos computacionais e Anexos). Vamos apresentar aqui uma síntese da constituição da amostra nos aspectos relevantes para este trabalho.

2.2 - Constituição da amostra A equipe do Projeto Censo na sua primeira fase de coleta dos dados decidiu estratificar a amostra dos 48 falantes adultos segundo três características sociais tradicionalmente conhecidas: Anos de escolarização, Sexo e Faixa etária. Em termos dos Anos de escolarização, a equipe decidiu estabelecer três recortes: um a quatro anos (antigo primário), cinco a nove anos (antigo ginasial) e nove a onze anos (antigo colegial). Atualmente os dois primeiros recortes são denominados de primeiro grau e o terceiro recorte

é

denominado de segundo grau. A equipe decidiu fazer este tipo de recorte por considerar que esta "antiga divisão (...) corresponde a diferenças bem conhecidas

nos currículos e metodologias de ensino utilizados nesses

níveis". (p.31) A equipe justifica a exclusão de universitários por já existir um "projeto específico (NURC) para o estudo da linguagem deste grupo" (p.31) e justifica também a dos analfabetos por já terem sido "estudados no Projeto Competências Básicas do Português junto ao MOBRAL (1977)". (p.31) O recorte relativo ao Sexo é por si evidente: sexo feminino e sexo masculino. No que concerne à Faixa etária, a equipe estabeleceu três recortes: 15 a 25 anos; 26 a 49 anos e 50 anos em diante. A primeira faixa cobre um

22

intervalo de 10 anos, a segunda de 24 anos e a terceira não tem teoricamente intervalo definido, mas na prática ele não vai além dos 25 anos. Segundo a equipe, o critério para o estabelecimento dos recortes foi semi-intuitivo e se justifica em termos da inserção dos falantes no mercado de trabalho, na ausência de algum fato marcante como guerra ou processo migratório, que são fatos históricos muito fortes na divisão dos grupos em função de faixas etárias. A equipe apresenta então a caracterização das três faixas etárias conforme transcrevemos abaixo. 15 a 25 anos - Adolescentes e adultos jovens que se iniciam no mercado de trabalho. Enquanto nas classes mais favorecidas essa faixa ainda se encontra na escola, sendo mantida pelos pais, a expectativa era de que, na classe menos favorecida, esses jovens já estariam inseridos, ou pelo menos com a atenção voltada para o trabalho. 26 a 49 anos - Adultos maduros. É a faixa, ao que tudo indica, que exerce plenamente seu potencial de trabalho. 50 anos - Nesta faixa estão inseridos os falantes, que, se ainda não estão aposentados, já estão aquém do seu ponto máximo de realização quanto às suas perspectivas de trabalho. (NARO et alii, 1986, p.30-1)

Quanto à origem dos falantes, a equipe estabeleceu que eles deveriam ser cariocas ou morar no Rio de Janeiro desde os cinco anos de idade, sem terem saído da cidade por mais do que dois anos consecutivos. Após traçado o perfil da amostra, a equipe dividiu a cidade do Rio de Janeiro em 48 grandes porções com base em informações da prefeitura sobre a divisão de bairros em termos geográficos e em termos de sentimento de bairro e, a seguir, sorteou aleatoriamente um bairro e um tipo de informante. A equipe afirma que não usou "métodos de escolha totalmente

23

aleatórios por não existir nenhuma maneira de listar todos os habitantes do bairro. (...) Parte da população não possui endereço do tipo padrão e muito menos telefone". (p.32) A segunda fase de coleta de dados envolveu a complementação do corpus em termos de uma quarta faixa etária: a dos falantes entre sete a 14 anos, denominados simplesmente crianças. A amostra das crianças foi também estratificada em função de Anos de escolarização - um a quatro anos (primário) e cinco a oito anos (ginasial) - e Sexo: feminino e masculino. Segundo a equipe, foi impossível evitar, neste caso, um certo enviesamento entre Faixa etária e Anos de escolarização. Todos os falantes de sete a 10 anos estão nos quatro primeiros anos do primeiro grau e todos os falantes de 11 a 14 anos estão nos quatro últimos. As crianças pesquisadas nasceram e foram criadas no Rio de Janeiro e todas elas estudam em escolas públicas. Estas escolas foram sorteadas aleatoriamente de uma relação fornecida pela Secretaria de Educação do Município do Rio de Janeiro. Uma das razões para a escolha das escolas públicas foi manter um certo paralelismo com a amostra dos adultos, considerando que falantes de nível universitário tendem a colocar seus filhos em escolas particulares. Após o sorteio da escola, procurava-se um aluno que atendesse às características já estabelecidas. O procedimento para a coleta dos dados dos adultos e das crianças foi de forma geral o mesmo, com as especificidades naturais relativas Às diferenças existentes entre as faixas etárias.

24

Após o término do levantamento dos dados, os informantes ficaram distribuídos da seguinte forma:

1) adultos: a) Anos de escolarização: 19 de um a quatro (primário); 16 de cinco a oito (ginasial) e 13 de nove a 11 anos (colegial); b) Sexo: 24 homens e 24 mulheres; c) Faixa etária: 16 de 15/25 anos; 15 de 26/49 anos e 17 de 50/71 anos; 2) crianças: a) Anos de escolarização: oito de um a quatro (primário) e oito de cinco a oito (ginasial); b) Sexo: oito meninos e oito meninas; c) Faixa etária : 16 de 7/14 anos.

No quadro 2.2.1, apresentamos os dados sociais relativos a cada falante adulto feminino. No quadro 2.2.2, os relativos a cada adulto masculino e, no quadro 2.2.3, os relativos a cada criança.

25

QUADRO 2.2.1 CARACTERÍSTICAS SOCIAIS DOS FALANTES ADULTOS FEMININOS IDENTIFICAÇÃO SEXO Lei04 Sue05 Jup06 Joa10 Nil12 Ire17 Mal16 Dal18 Jos35

F F F F F F F F F

Glo11 Nad36 Val24 Fat23 Ari30 Dor29 Hel34

F F F F F F F

San39 Ana40 Eve43 Mar22 Lau28 Hel44 Mgl48 Mag47

F F F F F F F F

ANOS DE ESCOLARIZAÇÃO 3 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 5*.(primário)2 6 (ginasial) 7 (ginasial) 8 (ginasial) 8 (ginasial) 8 (ginasial) 8 (ginasial) 8 (ginasial) 9 9 9 10 11 11 11 11

(colegial) (colegial) (colegial) (colegial) (colegial) (colegial) (colegial) (colegial)

IDADE 25 24 18 27 45 52 56 71 59 48 57 15 15 43 44 62 16 18 42 17 43 44 52 53

26

QUADRO 2.2.2 CARACTERÍSTICAS SOCIAIS DOS FALANTES ADULTOS MASCULINOS IDENTIFICAÇÃO

SEXO

ANOS DE ESCOLARIZAÇÃO 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 4 (primário) 5* (primário) 5* (primário)

IDADE

Cab02 Sam01 Rob15 Seb09 Edb07 Jan03 Lui08 Edp13 Man14 Ago33

M M M M M M M M M M

16 18 22 39 41 56 57 62 59 60

Car19 Pac20 Cas46 Ubi21 Jae25 Jov26 Cla27 Cid32 Geo31

M M M M M M M M M

6 7 7 8 8 8 8 8 8

(ginasial) (ginasial) (ginasial) (ginasial) (ginasial) (ginasial) (ginasial) (ginasial) (ginasial)

20 25 62 20 30 32 32 57 58

Leo38 Pit37 Par41 Dav42 Mor45

M M M M M

10 10 11 11 11

(colegial) (colegial) (colegial) (colegial) (colegial)

18 25 26 31 51

27

QUADRO 2.2.3 CARACTERÍSTICAS SOCIAIS DAS CRIANÇAS IDENTIFICAÇÃO

SEXO

ANOS DE ESCOLARIZAÇÃO 1 (primário) 2 (primário) 3 (primário) 4 (primário)

IDADE

Adl57 Mar50 Eri59 Ros52

F F F F

10 8 9 10

Adm61 Mon54 Adr63 Jaq56

F F F F

5 6 7 8

(ginasial) (ginasial) (ginasial) (ginasial)

14 12 12 14

Nel49 Jos58 Mar51 Vin60

M M M M

1 2 3 4

(primário) (primário) (primário) (primário)

7 10 9 9

Fra53 Gus62 Ale55 Jor64

M M M M

5 6 7 8

(ginasial) (ginasial) (ginasial) (ginasial)

11 11 13 14

Apresentamos a seguir a descrição do processo de coleta e armazenamento dos dados.

2.3 - Processo de coleta e armazenamento dos dados

Decidiu-se que a gravação da entrevista propriamente dita duraria uma hora. Decidiu-se também que ela não seria feita no primeiro contato com o informante para minimizar o conhecido Paradoxo do observador (cf. LABOV, 1972a, p.207-9). Nesta oportunidade, o entrevistador preenchia uma ficha social para cada falante. Além de estabelecer contato e identificar o informante correto, esta ficha, projetada pela equipe, objetivava obter informações diversas dos falantes, a serem oportunamente utilizadas. Uma

28

destas informações dizia respeito, por exemplo, ao tipo e freqüência de contato do falante com os meios de comunicação de massa. Após o contato

com os informantes e o preenchimento da ficha

social, o entrevistador planejava a entrevista com um dos pesquisadores, objetivando-se elicitar a maior gama

possível de formas lingüísticas da

maneira mais espontânea possível. Gravadas as entrevistas, elas eram submetidas a um controle de qualidade técnica e lingüística. Se necessário, eram refeitas. Caso contrário, eram transcritas segundo um sistema de transcrição específico e submetidas posteriormente a uma revisão para o controle de qualidade da transcrição.

Como

último

passo,

eram

digitadas,

armazenadas

eletronicamente, para, ao final, se submeterem a um processo de correção da digitação e se tornarem prontas para serem utilizadas em pesquisas futuras através de mecanismos eletrônicos de levantamento de dados. Este procedimento não impedia que as entrevistas já pudessem ser utilizadas para pesquisas antes de armazenadas na forma final. Em verdade, todas as pesquisas realizadas até agora com base neste "banco de dados", inclusive a nossa, tiveram seus dados retirados manualmente através das entrevistas manuscritas ou através das entrevistas digitadas sem a correção final. O processo de armazenamento eletrônico dos dados ainda encontra-se em desenvolvimento.

29

2.4 - Caracterização dos dados

De posse das entrevistas, caracterizadas como textos semi-livres em situação da fala semi-espontânea, localizamos todos os sintagmas nominais relevantes; efetuamos um outro controle de qualidade, ouvindo novamente todos os sintagmas nominais localizados e fizemos o seu levantamento sob critérios

de classificação

apropriados. Antes de falarmos do total

obtido, gostaríamos de explicitar novamente que o fenômeno lingüístico que estamos

analisando é o da concordância gramatical

entre os

elementos

flexionáveis do sintagma

de

nominal.

número plural Além

disso,

consideramos necessário caracterizar com precisão o tipo de dado que constitui o nosso objeto de estudo, para que as nossas conclusões fiquem claras e inequívocas. Inicialmente podemos afirmar que encontram-se no escopo de nossa análise todo e qualquer SN que tenha pelo menos uma marca formal ou semântica de plural. Todavia, esta caracterização não é suficientemente precisa, pois ela engloba estruturas do tipo muita mulher casada que, no momento, não constitui o nosso centro de interesse. Para casos deste tipo, não existe nenhuma prescrição: eles tanto podem ser produzidos na forma singular - muita mulher casada - ou na forma plural - muitas mulheres casadas. Estas duas formas são igualmente aceitas pela tradição gramatical brasileira, pelo menos implicitamente, diferentemente de

outras formas

como duas mulher casada. Neste caso, a nossa tradição gramatical só legitima a forma duas mulheres casadas. Pretendemos analisar aqui os dados envolvidos no processo gramatical de concordância nominal de número

plural que esta mesma

30

tradição prevê como existente, explícita ou implicitamente, e que, diante de sua ausência, rotula-os como desvios da norma gramatical ou simplesmente como erros. Sendo assim, excluímos casos do tipo muita mulher casada, mas incluímos casos como: muitas mulheres casadas; muitas mulheres casada ou muitas mulher casada. Incluímos igualmente casos do tipo uma porção de coisas; uma porção de coisas interessantes, mas não excluímos uma porção de coisa interessante ou uma porção de coisa. Estes dois últimos casos são considerados pela tradição gramatical também como desvios da norma, embora não se encontrem claramente referenciados em quaisquer partes das gramáticas, relativas à concordância nominal. Entretanto, basta que se leiam as partes relativas à concordância verbal envolvendo as construções acima para que se possa inferir que a ausência de marca formal do plural no substantivo do SN encaixado não está conforme os padrões gramaticais vigentes (cf. ALI, 1971, p.295; MELO, 1978, p.229-80; BECHARA, 1982, p.298; ROCHA LIMA, 1983, p.358; CUNHA & CINTRA, 1985, p.488). É importante observar ainda que, embora tenhamos analisado dados de SNs complexos como um punhado de; um montão de; uma série de; um grupo de etc., não estendemos a nossa análise a estruturas do tipo uma lista de presentes x uma lista de presente, pois consideramos que estes casos encontram-se em áreas fronteiriças. Temos dúvidas sobre a obrigatoriedade da marca formal de plural no substantivo do SN encaixado. Estes dados são interessantes de serem analisados, mas em outra oportunidade. Excluíram-

31

se também casos de núcleos coordenados, uma vez que a própria tradição gramatical brasileira admite a variação nestas circunstâncias. Por outras razões, excluíram-se desta análise outros dois tipos de dados. São eles: (1) os que fogem da posição canônica como em "tios, eu tenho dois"; (2) os que ocorrem em situação de neutralização do tipo "as meninas são", "as botas cheias de", "os jogadores do". A exclusão do primeiro tipo ocorreu pela escassez de dados, inviabilizando uma análise quantitativa do tipo laboviana, e a exclusão do segundo, pela impossibilidade de se perceber com precisão nestas situações a presença ou ausência do morfema de plural. Sabe-se que em Português o /S/ em final de palavra, morfêmico ou não, pode-se realizar em termos de segmentos como [s] (fricativa, alveolar, surda); como [] (fricativa, palatal, surda); como [z] (fricativa, alveolar, sonora) e como [] (fricativa, palatal, sonora) (cf. CÂMARA JR., 1975, p.834). Admite-se também a sua realização como uma aspirada [h] (cf. GRYNER & MACEDO, 1981, p.135-6), o que, todavia, é bastante raro em nossos dados. Tal realização é mais comum em travamento silábico no interior da palavra. A não freqüência desta realização em final de palavra fez com que não eliminássemos os dados seguidos de /R/. Foram finalmente excluídos casos indubitavelmente cristalizados do tipo Os Trapalhões, "moro em Duas Barras", bem como todos os casos de núcleo nominal invariável como costas, férias etc., os quais merecem ser estudados separadamente. Excluindo-se os casos acima citados, podemos então afirmar que todo e qualquer sintagma que apresentasse pelo menos uma marca formal

32

ou semântica de plural que implicasse necessariamente outra ou outras marcas formais de plural nos elementos flexionáveis do SN foi nosso objeto de estudo. Analisamos, portanto, SNs com todas as marcas formais de plural (todos os dias; os nossos filhos), com algumas marcas (essas estradas nova; essas coisas toda); com apenas uma (aqueles médico todinho; as perna bem feita) ou até sem nenhuma marca formal explícita, quando ocorria um SN contendo um numeral como primeiro elemento seguido de outros elementos não marcados (vinte ano; dois risco verde) ou quando o SN encontrava-se encaixado num SN mais alto semanticamente plural sem marca formal explícita (um montão de coisa; um punhado de peixinho colorido).3 Após o levantamento de todos os dados relevantes e, excluídos os casos acima citados, obtivemos um total de 7193 sintagmas nominais nas 64 horas de fala analisada. Destes 7193, 6027 foram produzidos pelos falantes adultos e 1166 pelas crianças. Outros detalhes sobre caracterização e levantamento de dados que se fizeram importantes, bem como a sua forma de codificação, serão apresentados nos momentos oportunos.

3 - PRESSUPOSTOS TEÓRICOS

Conforme afirmamos, o trabalho que vamos desenvolver aqui inserese de forma geral dentro da perspectiva teórica denominada Teoria da Variação Lingüística Laboviana ou Sociolingüística Quantitativa. O texto clássico de Labov, "The study of language in its social context", discute entre outros aspectos as colocações saussurianas e chomskianas a respeito de língua como uma estrutura invariante e incorpora ao conceito de língua enquanto sistema a noção de estrutura heterogênea (cf. 1972, p.825-7; 1975a, p.183;187;203-4). Resumindo algumas idéias deste texto, Scherre observa que Labov dissocia, portanto, estrutura de homogeneidade e introduz a noção de variação inerente a um sistema lingüístico, uma vez que ela existe não só na comunidade de fala mas até na gramática de um único indivíduo. Sendo assim, deve ser focalizada por uma lingüística da língua ou por uma teoria da competência e não relegada ao domínio da lingüística da fala ou teoria do desempenho. (SCHERRE, 1978, p.8)

Ao incorporar a noção de variabilidade à estrutura lingüística e atribuíla à lingüística considerada propriamente dita - a lingüística da língua -, Labov propõe alargar o conceito de regra da gramática para abarcar o conceito de regra variável, como uma forma alternativa da regra opcional, a qual não é capaz de incorporar a variação sistemática. Propõe então a generalização da regra variável em moldes gerativos, para dar conta da probabilidade de aplicação de uma dada regra em função da presença de determinados contextos lingüísticos e sociais relevantes (cf. LABOV, 1975a, p.216-8 e 1975b, p.93-101)

34

Neste trabalho, partimos da idéia laboviana de variação sistemática envolvendo os fenômenos lingüísticos. Todavia, consideramos pertinentes as críticas feitas a Labov por querer considerar que a sua proposta teórica constitua uma extensão da proposta da Gramática Gerativa (cf. KAY & MC DANIEL, 1977, p.1-7). Nos moldes labovianos, interessa a freqüência de aplicação de uma regra, fato que é absolutamente irrelevante para a Gramática Gerativa. Para esta corrente teórica, o que interessa é a possibilidade da ocorrência de uma dada estrutura e não o número de vezes que esta estrutura ocorre. E ainda mais: nem mesmo importa a ocorrência de uma dada construção. A Gramática Gerativa, embora considere que toda construção aceitável seja necessariamente gramatical, no sentido não normativo do termo, assume que há orações que mesmo inaceitáveis podem, ainda assim, ser gramaticais, se a sua inaceitabilidade decorrer de fatores externos ao conjunto de regras internalizadas, como questões ligadas à forma da mente processar as informações. Sendo assim, uma estrutura com múltiplos encaixes, embora gramaticalmente possível, pode não ocorrer nos dados reais, uma vez que a sua produção pode ser impossível por questões de processamento (cf. CHOMSKY, 1965, p.83-97). Em verdade, neste caso, interessa a intuição sobre a possibilidade de ocorrência: a possível ocorrência real é irrelevante. A partir do momento que uma postura teórica considera irrelevantes aspectos que para uma outra postura teórica são fundamentais e vice-versa, cabe perguntar se uma pode ser vista como extensão da outra ou se elas

35

apresentam cortes epistemológicos realmente distintos. Em verdade, consideramos que a Gramática Gerativa e a Teoria da Variação poderiam ser vistas como duas formas complementares de ver o fenômeno lingüístico (cf. OLIVEIRA, 1987, p.19-21). A primeira o olha do ponto de vista de processos mentais, como caracterizadores da própria inteligência, e a segunda o olha da perspectiva da sua relação com o meio social, como possíveis indicadores da estrutura social existente nas comunidades de fala. A primeira atribui à língua uma função cognitiva e a segunda, uma função social e comunicativa (cf., também, LOBATO, 1986, p.43-4). Em verdade, a língua tem estas duas funções e não há razão alguma para que uma se sobreponha à outra. Elas são simplesmente duas funções diferentes que refletem, no mínimo, duas facetas da estrutura lingüística. Com o propósito de tentar resumir as grandes tendências lingüísticas do Ocidente, na atualidade, Nichols & Woodbury (1985) chegam a afirmar que a linha mestra da lingüística ocidental atual apresenta duas grandes divisões: uma abordagem formal e outra funcional. A abordagem formal é caracterizada em termos de ser orientada para o modelo: seu objetivo não é descrever fenômenos lingüísticos explícitos, mas sim desenvolver um modelo explanatório integrado a respeito do conhecimento lingüístico que o falante possui, ou seja, a respeito da língua. Esta perspectiva focaliza propriamente constructos teóricos internos e o dado é relevante apenas para a construção e teste do modelo (cf. p.1). Segundo eles, o que é menos freqüentemente reconhecido é que existe um outro modo, fundamentalmente diferente (embora logicamente complementar) da lingüística teórica. (...)

36

Seu objetivo científico é descrever, não constructos teóricos e analíticos, mas os próprios fenômenos lingüísticos. (...) Busca-se fazer generalizações sobre fenômenos concretos na língua. (NICHOLS & WOODBURY, 1985, p.2)4 Nesta perspectiva, a Teoria da Variação ou Sociolingüística Quantitativa pode-se denominar funcionalista, pois interessa-lhe também e, primordialmente, descrever e explicar os dados lingüísticos reais (cf. LABOV, 1975a, p.187-205). A própria Nichols, em um texto de 1984, afirma que o funcionalismo lingüístico combina certos avanços teóricos da gramática formal com as preocupações e os avanços teóricos da sociolingüística e etnografia da comunicação. Ele objetiva solucionar o hiato entre o estudo da língua e o estudo da comunicação. (NICHOLS, 1984, p.98)5

Ainda no texto de 1984, Nichols tenta estabelecer uma tipologia para as abordagens funcionalistas, uma vez que considera que ainda "(...) não há teoria funcionalista embora haja esboços e relatos do que uma teoria deste tipo seria e do que ela trataria (...)". (p.102)6 Segundo ela, afirmações funcionalistas podem ser divididas em três tipos: conservadoras, moderadas e extremistas. Os tipos meramente conservadores reconhecem a inadequação do formalismo ou estruturalismo estrito, sem propor uma nova análise da estrutura. (...) O tipo moderado não simplesmente aponta a inadequação da análise formalista ou estruturalista, mas vai além para propor análises funcionalistas da estrutura e então substituir ou mudar abordagens inerentemente formais ou estruturais da estrutura. (...) Funcionalista extremista nega, de uma forma ou de outra, a realidade da estrutura pela estrutura. Pode-se afirmar que regras são baseadas inteiramente na função e conseqüentemente não há restrições puramente sintáticas; que a estrutura é somente a função codificada, ou coisa parecida. (NICHOLS, 1984, p.102-3)7

37

Du Bois (1984), em "Competing motivation", apresenta por sua vez a forma de conceber a relação entre fenômenos internos e externos ao sistema que se podem associar às duas grandes correntes dentro da história da Lingüística moderna: a primeira ele denomina de Estruturalismo autônomo e a segunda de Funcionalismo transparente. Segundo Du Bois, o Estruturalismo autônomo considera que (...) as únicas forças que organizam a língua são forças internas ao sistema. (...) Nada vem de fora: nem motivação icônica e nem qualquer outra motivação externa. (DU BOIS, 1984, p.345)8 O Funcionalismo Transparente, por sua vez, assume que (...) todos os fatos sintáticos aparentemente autônomos são realmente os resultados transparentes dos objetivos funcionais do falante etc, de modo que nenhum aparato sintático arbitrário precisa ser postulado para a língua (...) Aqui as únicas forças que governam a sintaxe (que existe no sentido simplesmente de ordenação das palavras nos enunciados) são as forças positivas da lingüística externa: talvez mecanismos de processamento biologicamente baseados, intenção do falante etc. (DU BOIS, 1984, p.345-6)9

Du Bois propõe em seu texto uma visão teórica conciliadora que reconhece a existência das forças internas e das forças externas que atuam sobre a língua, constantemente em competição. Não propõe eliminar a distinção

entre

língua/fala,

competência/desempenho,

lingüística

da

língua/lingüística da fala ou lingüística externa/lingüística interna. Propõe que a lingüística propriamente dita reconheça que a gramática é um sistema adaptativo que tem no seu funcionamento a existência de forças externas em

38

competição entre si, forças internas também em competição entre si e forças externas e internas também em competição, que mais cedo ou mais tarde chegam a uma resolução. Segundo ele, nenhuma teoria do discurso ou da gramática seria adequada (...) sem uma teoria explícita da competição e reconciliação sistemática de motivações externas e internas. (DU BOIS, 1984, p.347)10 Em síntese, Du Bois coloca o seguinte: Se a língua é considerada ser adaptativa, no sentido que responde às pressões do 'ambiente externo', nós devemos rejeitar a estrutura teórica do estruturalismo autônomo, que se limita, na sua tentativa de explicar a estruturação da língua, a reconhecer apenas forças de motivações internas ao sistema. Por outro lado, se a língua é considerada como um sistema, e como tal tem no mínimo um grau de continuidade de existência, nós devemos rejeitar a estrutura teórica do funcionalismo transparente, que falha em dar conta do fato de que as categorias gramaticizadas (...) são retidas para serem novamente usadas (...) em uma forma mais ou menos congelada (...). Mais importante, talvez, é que ela falha em construir propriamente o aspecto interno mais fundamental da gramática, o processo de gramaticização em si mesmo. Como uma alternativa a versões rigidamente puristas do estruturalismo autônomo ou funcionalismo transparente, eu sugiro que será mais frutífero buscar uma estrutura sintetizadora para a lingüística, uma capaz de tratar com a interação de forças externas e internas, e as suas resoluções sistemáticas. (...) Finalmente, nós devemos procurar entender a natureza da interação complexa entre língua e fala, entre discurso e gramática. (DU BOIS, 1984, p.362)11 É neste contexto teórico ainda nebuloso que o nosso trabalho se coloca. Ele se insere na perspectiva teórica da Teoria da Variação ou da Sociolingüística Quantitativa porque incorpora a noção de variação

39

sistemática, determinada a partir de padrões recorrentes extraídos de dados do desempenho lingüístico na sua forma semi-espontânea. Como tal procura estabelecer

as

variáveis

lingüísticas

e

sociais

que

determinam

a

previsibilidade da variação, ou seja, procura descrever e explicar os próprios fenômenos lingüísticos. Todavia, ele se afasta desta perspectiva teórica no sentido de que não considera a regra variável como uma extensão da regra opcional de cunho gerativo, pelo fato de hoje concordarmos com a colocação de Kay & Mc Daniel (cf. 1977, p.3) no que diz respeito à importância dada à freqüência de ocorrência de uma estrutura na perspectiva variacionista e a sua total irrelevância numa perspectiva formal e gerativista. Se usamos a palavra regra dentro do nosso texto, queremos dar a ela o sentido de padrões que emergem a partir dos dados do desempenho (cf. DU BOIS, 1984, p.384-51). Considerando que padrões se manifestam, é razoável supor que exista uma contraparte internalizada destes padrões lingüísticos. Se estes padrões pertencem ao que se denomina de língua ou de fala, não é nosso objeto de discussão. É importante, todavia, considerar que, se forem atribuídos à fala, temos de modificar o seu conceito conforme estabelecido por Saussure e passar a considerá-la também essencial, sistemática e coletiva (cf. SAUSSURE, 1973, p.22-3). O nosso trabalho assume então da Teoria da Variação a idéia de que há variação inerente, diferente do que Bickerton (1977) coloca em "Inherent variability and variable rules". A variação aqui não é, portanto, considerada como advinda da junção de indivíduos com comportamentos lingüísticos

40

internamente homogêneos, mas diferenciados entre si. Assume-se assim que a variação existe no comportamento lingüístico individual e que ela reflete, a nível grupal, o comportamento lingüístico de indivíduos que variam da mesma forma. Além disso, as diferenças entre os agrupamentos de indivíduos são interpretadas

como diferenças dialetais ou como

indicadores de mudança lingüística (cf. BICKERTON, 1977, p.474-5; 488-9; LABOV, 1975a, p.223-59; LABOV, 1975b, p.65-129 e GUY, 1980, p.1-35). O nosso trabalho se insere também dentro do mundo teórico e conturbado do que se convencionou rotular Funcionalismo, no sentido moderado do termo conforme colocado por Nichols (1984), ou no sentido conciliador de Du Bois (1984), porque admite e propõe princípios ou motivações externas, em competição entre si, para explicar os padrões sistemáticos, previsíveis e inerentes, que emergem do nosso

estudo

minucioso de um fenômeno lingüístico em Português: a concordância gramatical de número plural entre os elementos flexionáveis do sintagma nominal.

4 - CONSIDERAÇÕES TEÓRICOS

ADICIONAIS

SOBRE

ASPECTOS

4.1 - Sobre o Funcionalismo no arcabouço teórico da Gramática Gerativa

Kiparsky (1972), em seu artigo "Explanations in phonology", apresenta uma série de limitações da Gramática Gerativa, que não reproduziremos em detalhes aqui por não ser este o nosso objetivo. Interessa-nos especificamente resumir algumas de suas propostas dentro do que estamos chamando de Funcionalismo no arcabouço teórico da Gramática Gerativa. Segundo ele, há uma série de regularidades na fonologia e na morfologia que são baseadas em condições de natureza funcional e que para explicá-las é necessário "(...) adicionar à teoria condições substantivas que pertencem não à forma da gramática (isto é, ao sistema de regras que gera a língua) mas à sua saída (output)." (p.195) 12 Um destes aspectos regulares diz respeito a regras opcionais com freqüências variáveis (cf. p.197). Kiparsky afirma então o seguinte: Uma simples ilustração deste tipo de fenômeno com o qual eu me ocuparei aqui é encontrado naquelas variedades do Inglês americano que têm a regra que cancela o -t em final de palavra, usualmente de forma opcional. Onde este -t é a terminação de tempo passado, alguns falantes cancelam-no somente quando as formas do passado e do presente do verbo mostram uma vogal diferente na raiz (Twaddell, 1935, p.79). (...) A vogal da raiz não pode na presente teoria da fonologia gerativa servir para determinar se o -t pode ou não ser cancelado. (...) Não há nenhum ponto na derivação em que a informação crucial, se uma mudança vocálica ocorreu, é disponível. (KIPARSKY, 1972, P.197)13

42

Segundo

Kiparsky,

há

tentativas

formais

para

explicar

o

comportamento variável do -t, mas todas elas insuficientes. Além disso, considera que estas tentativas não constituem explicações e nem mesmo base para explicações verdadeiras(cf. p.198). Segundo ele, a regra é bloqueada (ou, em alguns dialetos, aplicada menos freqüentemente) quando sua aplicação torna as formas do presente e do passado indistiguíveis (pass:passed) mas se aplica livremente onde esta distinção é retida por causa da diferença vocálica (keep:kep). (KIPARSKY, 1972, P.198) 14 O exemplo acima constitui apenas um dentre uma série de outros apresentados por Kiparsky (cf. 1972, p.196-206). Para explicá-los, ele postula a existência de condições de natureza funcional, denominadas por ele de Condições de Distintividade, formulada nos seguintes termos: Nós temos (...) Condições de Distintividade, que, como uma aproximação inicial, estabelecem que há uma tendência para informação semanticamente relevante ser retida na estrutura superficial. (KIPARSKY, 1972, p.195)15 Ao lado das Condições de Distintividade, Kiparsky estabelece também Condições de Nivelamento, que não nos interessam no momento. Com relação aos dois tipos de condições, aos quais ele atribui caráter funcional, e especificamente no que se refere

às Condições de

Distintividade, afirma então que "retenção de informação funcional na estrutura superficial pareceria ser motivada por necessidade de percepção da fala." (p.195)16 Afirma ainda que apenas a existência destes fenômenos não é condição suficiente para provar que "(...) fatores funcionais estão atuando"

43

(p.198),17 mas considera necessário provar que "(...) aspectos substantivos de condicionamento morfológico são constantes de uma língua para outra" (p.198)18, ou seja, considera necessário evidenciar o seu caráter universal. As Condições de Distintividade conforme estabelecidas por Kiparsky dão origem então à hipótese funcionalista dentro do arcabouço da Gramática Gerativa, que neste trabalho passaremos

a

nomear de Funcionalismo

kiparskiano, por causa de outras hipóteses funcionalistas existentes que não se encaixam numa perspectiva gerativa. As colocações de Kiparsky (1972) passaram a ser incorporadas em trabalhos de natureza quantitativa. Em "The notion of the plural in Puerto Rican Spanish: competing constraints on (-S) deletion", Poplack discute explicitamente a hipótese funcional baseada nas Condições de Distintividade de Kiparsky (cf. 1980a, p.57), retoma-a em "Deletion and disambiguation in Puerto Rican Spanish" (cf. 1980b, p.372-3) e volta a discutir o assunto em "Mortal phonemes as plural morphemes" (cf. 1981, p.59; 61-2), apresentando resultados

parcialmente opostos à hipótese em questão. Nestes artigos,

Poplack apresenta a influência de restrições estruturais e funcionais em competição, evidenciando a supremacia das restrições estruturais. Lefebvre, em "Variation in plural marking: the case of Cuzco Quechua", apresenta também evidências de restrições funcionais e não funcionais em competição, mostrando algumas situações que são previstas pela hipótese funcionalista kiparskiana e outras que não o são (cf.1981, p.812). Em

"Linguistic

variation

in

Brasilian

Portuguese:

aspects

of

phonology, syntax and language history", Guy também discute a hipótese

44

funcionalista kiparskiana (cf. 1981a, p.156-61; 165; 189-93; 241; 246; 250-2; 334; 342-9 e 351-2). Semelhantemente à Poplack, Guy encontra resultados contrários à hipótese de Kiparsky. Para mantê-la, chega a propoo uma mudança na proposta original de Kiparsky no sentido de que "(...) restrições 'funcionais' são operantes somente quando forma e função caminham lado a lado, quando estrutura e significado são perfeitamente paralelos." (p.345)19 Em "Functional compensation for (-S) deletion in Puerto Rican Spanish", Hochberg retoma novamente a hipótese funcionalista de Kiparsky, apresentando resultados que a corroboram (cf. 1986, p.609-11; 616-9). Cumpre-nos observar desde já que, embora Poplack, Guy, Hochberg e Lefebvre tenham tratado de

fenômenos de cancelamentos, eles

analisaram segmentos de natureza distinta: Poplack estudou o -S e a nasal finais, morfêmicos e não-morfêmicos no Espanhol de Porto Rico; Guy estudou os mesmos fenômenos no Português popular do Brasil, enquanto Hochberg estudou apenas o cancelamento do -S morfêmico que marca as formas verbais de primeira pessoa. Lefebvre, por sua vez, estudou a variação de plural na língua Quechua - uma língua Indígena Americana meridional falada na área andina por, aproximadamente, seis milhões de pessoas - que, embora não apresente concordância nominal, apresenta a verbal (cf. p.73). O fenômeno estudado por Lefebvre é, pois, de natureza inteiramente morfológica, mas não apresenta os mesmos resultados que Hochberg. Suas conclusões são semelhantes às de Poplack com as quais, inclusive, estabelece comparações (cf. p.82-3). A síntese das idéias de Kiparsky (1972) sobre a hipótese funcionalista no arcabouço da Gramática Gerativa e os estudos feitos perseguindo esta hipótese com resultados controversos, de 1980 a 1986, mostram a

45

atualidade da discussão e a necessidade de a inserirmos no corpo deste trabalho, que retoma novamente o estudo do -S final de natureza morfêmica no Português do Brasil.

4.2 - Sobre o Funcionalismo fora do arcabouço teórico da Gramática Gerativa

Como já vimos, o Funcionalismo fora do arcabouço da Gramática Gerativa é um rótulo usado para cobrir uma gama bastante ampla de correntes lingüísticas que, embora diferentes entre si, apresentam algumas características fundamentais em comum. Pela literatura lingüística existente (cf., especialmente, DU BOIS, 1984, p.343-7; NICHOLS, 1984, p.97-117 e NICHOLS & WOODBURY, 1985, p.1-13), ressaltam-se três principais pontos em comum: 1) O primeiro deles diz respeito à função primeira que

se pode

atribuir à língua, pois, nestas correntes funcionalistas, a língua é considerada antes de mais nada como um instrumento de comunicação inserido no seio de uma comunidade. Como tal, não pode ser estudada no abstrato sem que se leve em conta o contexto lingüístico e, inclusive, todo o processo comunicativo (cf. NICHOLS, 1984, p.97-8). 2) O segundo ponto se relaciona ao objeto do estudo lingüístico. Como também já vimos, interessa a estas correntes funcionalistas descrever os fenômenos lingüísticos substantivos e não constructos teóricos e analíticos, buscando, conseqüentemente, universais de natureza substantiva (cf. NICHOLS & WOODBURY, 1985, p.2). Os dados provenientes de intuição não têm, portanto, lugar nesta perspectiva funcionalista.

46

3) O terceiro ponto diz respeito ao que se admite constituir uma explicação em lingüística: não se considera que a língua tenha a sua estrutura e funcionamento explicados apenas por forças ou motivações internas em competição, mas considera-se também a ação de forças ou motivações externas igualmente em competição, entre si ou entre estas e as forças internas. Conseqüentemente, a própria característica da arbitrariedade da língua é discutida, que, no sentido absoluto do termo, fica reservada apenas para as relações internas entre os significantes e os significados dos signos lingüísticos (cf. DU BOIS, 1984, p.342-4, 346; HAIMAN, 1980, p.51540; 1983, p.781-819). Destes três pontos, interessa-nos detalhar o terceiro, o qual abordaremos no interior deste trabalho. Os princípios ou motivações externas ligados especificamente às teorias funcionalistas, e encontrados por nós na literatura lingüística, são os seguintes:

1) o Princípio da Iconicidade ou Motivação Icônica (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984); 2) o Princípio da Economia ou Motivação Econômica (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984); 3) o Princípio do Fluxo de Informação Preferido (cf. DU BOIS, 1984); 4) o Princípio da Topicidade (cf. DU BOIS, 1984); 5) o Princípio da Natureza Comunicativa Periférica da Oração VS ou o Princípio da Tensão Baixa (cf. NARO & VOTRE, 1986).

47

4.2.1 - O Princípio da Iconicidade

O Princípio da Iconicidade ou a Motivação Icônica nos termos de Haiman (1983) relaciona-se diretamente ao Princípio do Isomorfismo ou da Invariância entre forma e expressão (cf. p.814). Seu objetivo é, portanto, apresentar evidências lingüísticas de que "(...) uma dimensão lingüística (ou formal) corresponde diretamente a uma dimensão não lingüística (ou conceptual) (...)." (p.781)20 Dentre as evidências apresentadas, são

de

nosso interesse particular as que ele utiliza para demonstrar um dos aspectos da Motivação Icônica sintetizado na seguinte colocação: "(...) a distância lingüística entre as expressões corresponde à distância conceptual entre as idéias que elas representam." (p.782)21 Segundo Haiman, a diferença conceptual existente entre matar e causar a morte, por exemplo, é iconicamente motivada no sentido da colocação acima. Matar é uma expressão formal mais sintética do que causar a morte e indica, por sua vez, maior proximidade entre o agente e o paciente da ação. Em "x matou y", há a pressuposição de que a ação tenha sido direta, no mesmo espaço e no mesmo tempo, o que não ocorre em "x causou a morte de y". A distância material entre x e y é menor em matar do que em causar a morte, o que corresponde também a uma distância (e não complexidade) conceptual maior (cf. HAIMAN, 1983, p.782-4)

48

4.2.2 - O Princípio da Economia Ao lado da Motivação Icônica, Haiman aponta também a existência da Motivação Econômica a qual estabelece (...) uma correspondência entre a dimensão lingüística (transparência/opacidade, formas plenas/formas reduzidas) e a dimensão conceptual (familiar/não familiar e previsível/não previsível) (...). (HAIMAN, 1983, p.802)22

Neste sentido, Haiman afirma que "(...) poderia se argumentar que a correspondência acima é em si mesma icônica em certo nível." (HAIMAN, 1983, p.802)23 Todavia, ele refuta esta associação, afirmando o seguinte: Mas a forma não é um ícone do conceito, ou mesmo da familiaridade do conceito. Redução da forma é um índice ECONOMICAMENTE motivado da familiaridade, não um índice motivado iconicamente. (HAIMAN, 1983, p.802)24

Segundo Haiman, a hierarquia dos mecanismos formais para a especificação dos sujeitos de uma narrativa, estabelecida por Givón

em

1983, e sua covariação em volume e complexidade com a previsibilidade da identidade de seu sujeito, "(...) dá suporte a nossa tese de que quanto mais imprevisível for um pedaço de informação, mais codificação ele requer." (HAIMAN, 1983, p.802)25 Em outras palavras, Haiman coloca que o Princípio da Economia ou a Motivação Econômica se apóia "(...) na verdade do axioma geralmente aceito de que o que é previsível recebe menos codificação do que o que não é." (cf. 1983, p.807)26 Em verdade, este princípio se aproxima muito das Condições de Distintividade de Kiparsky. A diferença entre Haiman e Kiparsky reside no

49

fato de que o primeiro assume claramente a natureza deste princípio como externa, ou seja, uma natureza não formal e não estritamente gramatical.

4.2.3 - O Princípio do Fluxo de Informação Preferido e o Princípio da Topicidade

O Princípio da Iconicidade e o Princípio da Economia já são muito abordados dentro da literatura lingüística (cf. HAIMAN, 1983, p.814). À medida em que os trabalhos funcionalistas

vão tomando corpo, novos

princípios são propostos. E é com o objetivo de explicar a diferença entre as línguas ergativas e as línguas absolutivas que Du Bois (1984) propõe a existência, também em competição, de dois princípios menos conhecidos: o Princípio do Fluxo de informção Preferido e o Princípio da Topicidade.27 Neste texto, Du Bois afirma que em Sacapultec, uma língua da Guatemala, pode-se verificar, através de dados do discurso conectado, uma estrutura de argumento preferencial. Com base neste tipo de dado, verificase que o pressuposto da diversidade na ordenação dos argumentos (cf. p.347-9) não existe, pois, nesta situação, a aparente variação 'livre' desaparece. De outra forma, as orações convergem para um padrão básico: um verbo seguido por um argumento direto, (ou, menos freqüentemente, nenhum) na forma de um sintagma nominal pleno. (...) Mas orações com dois argumentos diretos na forma de SNs plenos são extremamente raras. (DU BOIS, 1983, p.348)28 Para Du Bois, a tendência acima se dá igualmente com verbos transitivos e intransitivos, (...) embora eles difiram num aspecto crucial. O único argumento direto com verbos intransitivos é mais comumente o sujeito, mas com transitivos é o objeto.

50

Estes argumentos juntos constituem, naturalmente, a classe dos absolutivos nas línguas ergativas como Sacapultec. Conseqüentemente, nós observamos uma unidade natural no discurso para a categoria de absolutivo: é a categoria na qual os sintagmas nominais plenos aparecem. (DU BOIS, 1984, p.348)29 As duas tendências discursivas

apontadas acima por Du Bois

denominam-se, respectivamente, de restrição de um só SN e restrição de S/O (sujeito/objeto). São estas duas preferências discursivas que formam o que Du Bois denomina de

estrutura de argumento preferencial. O mais

interessante da argumentação de Du Bois decorre do fato de que, segundo ele, tal configuração não surge arbitrariamente, pois ela ocorre em função do fluxo de

informação

preferido no discurso

narrativo de Sacapultec (cf.

p.348-9). Du Bois afirma então que se nós examinarmos todas as ocorrências de itens de referências nominais nas narrativas de Sacapultec que têm status discursivo pragmático 'novo' (como definido por Chafe 1976), nós vamos ver que eles aparecem freqüentemente em certas categorias gramaticais e muito raramente em outras, em particular, novas menções ocorrem bem livremente nos papéis de S /sujeito de verbo intransitivo/ ou de O /objeto de verbo transitivo/ (...) mas quase nunca em papel de A /sujeito de verbo transitivo/ (...) Esta preferência de menções novas para papéis S e O (...) é a base para a preferência, descrita antes, de sintagmas nominais plenos para os papéis de S e O. Naturalmente, uma menção nova de um referente tipicamente requer a informação codificada de forma explícita que um sintagma nominal pleno pode fornecer, de modo que a maioria das menções novas serão realizadas como sintagmas nominais plenos (embora a implicação reversa não seja verdadeira). Inversamente, o fato de que informação nova nunca seja virtualmente introduzida no papel de A explica em grande parte a relativa escassez de sintagmas nominais plenos nesta posição. (DU BOIS, 1984, p.349-50)30

51

Com estas e outras argumentações dentro de seu texto, Du Bois considera que podemos levantar a hipótese de que a gramatização da ergatividade morfológica em Sacapultec é em última instância a cristalização de certos padrões discursivos. (DU BOIS, 1984, p.353)31 A seguir Du Bois desenvolve "(...) os preliminares para uma teoria de motivações em competição" (p.353-9)32, discutindo, por exemplo, por que razão nem todas as línguas são ergativas se existe motivação para a sua existência. Afirma então que uma outra pressão discursiva que privilegia marcar a relação tópico/agente, em competição com a pressão discursiva para marcar a informação nova, motiva a morfologia das línguas não ergativas

ou motiva

morfologia acusativa dentro das próprias línguas

ergativas (cf. p.354). Além da demonstração de motivações externas atuando em competição, Du Bois

mostra também a atuação de forças internas em

competição com as forças externas ou forças internas em competição entre si (cf. p.356), concluindo sobre a necessidade da lingüística incorporar estas questões amplamente discutidas, numa tentativa de "procurar entender a natureza da interação complexa entre língua e fala, entre discurso e gramática." (p.362)33

52

4.2.4 - O Princípio da Baixa Tensão

Naro & Votre (1986), ao estudarem a ordem VS (ordem verbo/sujeito) no Português do Brasil, numa amostra de 24 horas de fala gravada dentre as 64 que constituem o "banco de dados" do Projeto Censo, assumem explicitamente que, para a explicação deste fenômeno, não sentem "nenhuma necessidade de postular a existência

independente de

uma

gramática abstrata" (p.455), ou seja, assumem uma postura funcionalista radical. Apresentam ampla argumentação de que o importante na ordem VS é a baixa centralidade comunicativa do sujeito, por ele não se constituir o centro, pólo ou ponto de referência do que está sendo transmitido pelo falante. Evidenciam que este aspecto é mais importante do que o traço novo (cf. p.459-61), ou seja, a ordem VS em Português não é principalmente motivada pelo fluxo de informação preferido como colocado por Du Bois (1984),

para as línguas ergativas. Tal constatação

se

reveste

de

fundamental importância uma vez que, segundo Du Bois, é o Princípio da Topicidade que determina a existência de línguas

morfologicamente não

ergativas, tipo o Português. É então coerente e significativo que, para um fenômeno específico do Português, Naro & Votre tenham constatado a importância do centro, pólo ou ponto de referência, o que, segundo eles, tende a corresponder, no nível sintático, à "posição do sujeito" (p.457), que constitui o tópico natural dentro de uma oração. Segundo Naro & Votre, em narrativas, a dimensão centro-periferia corresponde à distinção entre figura (aquilo que é narrado) e fundo (circunstâncias externas à seqüência narrativa propriamente dita, mas que a complementam de algum modo). (NARO & VOTRE, 1986, p.463)

53

A partir da análise de "400 ocorrências de VS, e número aproximadamente igual de SV" (p.455), Naro & Votre postulam a existência do princípio da Natureza Comunicativa periférica da oração VS ou Princípio de Tensão Baixa (PTB), transcrito abaixo. O uso de ordenação VS indica um nível baixo de tensão comunicativa. O sujeito não é apresentado como central, isto é, um pólo receptor de informação e a oração não está situada na linha central da comunicação. Em termos mais positivos o PTB poderia ser parafraseado afirmando a natureza comunicativamente periférica da oração VS. (NARO & VOTRE, 1986, p.4645)

Com a explicitação deste princípio, acabamos de sintetizar os princípios

de

motivação

externa

existentes

na

literatura

lingüística

funcionalista, uma vez que vamos apresentar extensa argumentação de que o Princípio da Economia, nos termos de Haiman, ou as

Condições de

Distintividade, nos termos de Kiparsky, não são suficientes para explicar certos padrões de concordância que emergem da análise dos dados do desempenho. Conseqüentemente, vamos propor a existência de um outro princípio, em competição com o Princípio da Economia, para explicar tais padrões. Estamos consoantes com as idéias de Du Bois, no sentido de que nenhuma teoria do discurso ou da gramática seria adequada (...) sem uma teoria explícita da competição e reconciliação sistemática de motivações externas e internas. (DU BOIS, 1984, p.347)34

54

Não objetivamos desenvolver aqui a teoria vislumbrada por Du Bois, mas, sim, acrescentar mais argumentação sobre a necessidade de sua existência. Há ainda um outro princípio a ser referenciado no corpo deste trabalho: o Princípio da Saliência. Mas, como ele não foi desenvolvido dentro de uma perspectiva teórica funcionalista no sentido atual do termo, vamos apresentá-lo no momento apropriado, ou seja, no item 6.2.2.

5 - SUPORTE QUANTITATIVO

Um dos modelos matemáticos utilizados em pesquisas variacionistas foi introduzido na Lingüística por Sankoff em 1975. Ele recebe a denominação de modelo misto ou logístico e tem como função calcular as probabilidades associadas aos fatores de cada variável35 estudada, com base em freqüências observadas. Discussões sobre modelos probabilísticos anteriores a este, seus problemas e inadequações, são apresentadas em 1974 por Cedergren & Sankoff. O modelo logístico tem sido utilizado com muito sucesso por pesquisadores brasileiros desde 1976 e encontra-se detalhadamente descrito na literatura lingüística (cf., por exemplo, LABOV, 1975b, p.65-129; CEDERGREN & SANKOFF, 1974; GUY, 1975, p.59-69; LEMLE & NARO, 1977, p.25-8; BRAGA, 1977, p.3-8; ROUSSEAU & SANKOFF, 1978, p.57-68; FASOLD, 1978; SCHERRE, 1978, p.12-8; NARO, 1981a, p.67-73; GUY, 1981a, p.29-38; NARO, 1981b, p.69-73 e NARO et alii, 1986, p.39-42). Pela

forma

de

funcionamento

deste

modelo,

afirma-se

que

probabilidades maiores do que 0,50 favorecem a aplicação da regra, probabilidades menores do que 0,50 desfavorecem-na e todas as probabilidades em torno de 0,50 têm sobre ela uma influência neutra. Este modelo, que trabalha na base de probabilidades, é mais adequado do que os que trabalham com percentagens cruas, porque ele quantifica

a

influência

relativa

de

cada

probabilísticos devidos aos diversos fatores

variável, das

atribuindo

pesos

diversas variáveis

estudadas (cf., por exemplo, NARO, 197636 e SCHERRE, 1978, p.41-2). Além disso, ele tem no seu bojo a hipótese da uniformidade do efeito dos

56

fatores,

sendo,

portanto,

suficiente

que

se

calculem

apenas

as

probabilidades dos fatores, os quais formam um conjunto relativamente pequeno, se comparado ao número hipoteticamente possível de ambientes ou contextos (cf. LABOV 1975b, p.108-9; CEDERGREN & SANKOFF, 1974, p.338-40). Entretanto, a realidade lingüística se mostra muitas vezes diferente da hipótese da não interferência entre os diversos fatores das diversas variáveis, sugerindo-se a necessidade de reanálise de duas ou mais variáveis lingüísticas em apenas uma (cf. SCHERRE, 1978, p.71; 105-9; NARO, 1981a, p.68) ou sugerindo-se a própria rediscussão da adequação do modelo para fenômenos lingüísticos que não refletem variação inerente ou que refletem processos de mudança lingüística (cf. KAY, 1978, p.71-82). Para a implementação deste modelo matemático, foi desenvolvido um programa computacional denominado VARBRUL, de autoria de David Sankoff, que já se encontra na sua terceira versão, denominada VARBRUL 2S, escrito em linguagem FORTRAN, cujo funcionamento descrevemos a seguir.37 O VARBRUL 2S, além de calcular as probabilidades dos fatores de cada variável, apresenta uma seleção estatística das diversas variáveis analisadas. Esta seleção ocorre inicialmente em função de um valor estatístico denominado nível de significância, que deve ser igual ou menor do que 0,05, por questões de confiabilidade estatística dos resultados. O nível de significância é gerado por um parâmetro estatístico denominado log likelihood (ou o cálculo da verossimilhança máxima) que mede o grau de confiabilidade de as freqüências observadas terem sido geradas pelo modelo estatístico, ou seja, ele mede a diferença entre as freqüências esperadas e as observadas e, portanto, a que nível de significância os valores estatísticos

57

projetados se adequam aos observados, à semelhança do teste de quiquadrado (cf. ROUSSEAU & SANKOFF, 1978, p.60-1).38 Se o nível de significância atribuído ao cálculo probabilístico efetuado para os fatores de uma variável for igual, o programa escolhe o conjunto que apresentar o valor do log likelihood mais próximo de zero, considerando-se que, se não houver diferença entre as freqüências

esperadas e

as

freqüências

observadas, o log likelihood será exatamente zero. Se houver identidade entre o nível de significância e os log likelihood de dois conjuntos de valores probabilísticos

calculados, o programa então seleciona a variável ou o

conjunto de variáveis com menor número de fatores. Um nível

de

significância 0,0 é considerado o ideal, pois ele indica uma certeza estatística de os valores gerados pelo modelo estarem adequados aos valores observados. Um outro aspecto novo do VARBRUL 2S consiste no fato de que ele trabalha com níveis diversos de análises, efetuando-se comparações entre os valores probabilísticos atribuídos aos fatores das variáveis. No nível zero, o programa calcula a média global de aplicação da regra corrigida que pretende ser "a probabilidade de aplicação da regra quando o efeito de todos os fatores de todas as variáveis é neutro." (LEMLE & NARO, 1977, p.26-7) Esta probabilidade recebe o nome de input da regra. No nível 1, o programa (a) calcula as probabilidades dos fatores de cada uma das variáveis isoladamente, apenas em comparação ao input, (b) atribui a cada uma delas um log likelihood e um nível de significância e (c) efetua a seleção de uma das variáveis, nos moldes descritos acima.

58

Selecionada a primeira variável, o programa executa o segundo nível de análise, quando observa o comportamento da variável selecionada em conjugação com cada uma das outras variáveis, duas a duas, atribuindo log likelihood e níveis de significância a cada par de variáveis com os valores probabilísticos de seus fatores e, então , seleciona a segunda variável mais relevante do ponto de vista estatístico. A seguir, o programa compara as duas variáveis selecionadas com as demais, três a três, a fim de selecionar a terceira variável e assim consecutivamente até o término da seleção de todas as variáveis estatisticamente relevantes. Teoricamente, o número de níveis de uma dada análise é, pois, função do número de variáveis. Na prática, ele se limita ao número de variáveis selecionadas. O processo acima descrito, do nível 0 até o nível N, recebe o nome de stepup e é feito também inversamente: do nível N ao nível 1, com o nome de stepdown, a fim de se verificar se as variáveis não selecionadas são também eliminadas. Os diversos níveis de análise são interessantes, porque eles nos permitem verificar precisamente a interferência entre variáveis, ocasionada por

codificação

superposta.

Quando

não

há

sobreposições

ou

enviesamentos entre variáveis, não se constatam interferências e as probabilidades do primeiro nível permanecem as mesmas, ou bastante semelhantes, até o último nível de análise. Esta seria a situação lingüística e matematicamente ideal, mas não constitui a realidade dos fatos. Se lingüisticamente os fatos sempre ocorressem dessa forma, não haveria necessidade de sofisticação matemática na análise dos dados: o cálculo de percentagens seria suficiente.

59

No caso de haver sobreposição entre variáveis, o programa atribui pesos probabilísticos relativos em função da importância estatística de cada uma delas, com base, por exemplo, numa distribuição equilibrada dos dados entre os diversos fatores de uma variável. Esta nova versão do programa, além de apresentar um instrumental estatístico mais elaborado, permite-nos assim ver com clareza toda a questão de codificações superpostas, conduzindo-nos a um entendimento mais apurado da distribuição dos dados lingüísticos e permitindo-nos análises lingüísticas cada vez melhores. No decorrer deste trabalho, teremos oportunidade de demonstrar a utilidade dos diversos níveis de análise agora efetuados por VARBRUL 2S. Para a preparação dos dados de entrada para o VARBRUL 2S, em quaisquer de suas versões, Naro desenvolveu um programa denominado SWAMINC, escrito em linguagem SNOBOL para o compilador SPITBOL. A sua primeira versão foi escrita em 1974. Atualmente são usadas as quinta e sexta versões. Uma das funções do SWAMINC consiste em verificar erros ocorridos na codificação dos dados emitindo mensagens a eles associadas. Este programa também insere, cancela e amalgama símbolos em função das alterações desejadas pelo pesquisador no decorrer da análise. Além disso emite algumas estatísticas elementares do tipo: número total dos registros de entrada e saída; número total de aplicação da regra; número total de ocorrências; cálculo percentual de apli-

60

cação da regra para cada fator de cada variável bem como para a sua aplicação global. A documentação detalhada do funcionamento do SWAMINC encontra-se no manual do usuário SWAVA - escrito por Naro & Votre em 1980 A partir deste ponto, vamos passar ao capítulo 6, que constitui o cerne de nosso trabalho. Nele apresentamos a análise lingüística efetuada, a qual será usada como base para as discussões teóricas apontadas na Introdução.

6 - ANÁLISE DAS VARIÁVEIS LINGÜÍSTICAS

6.1 - Introdução

Vamos desenvolver, neste capítulo, a análise das variáveis lingüísticas que julgamos atuar sobre a concordância de número entre os elementos do sintagma nominal, sob duas perspectivas: (1) a que considera cada elemento do SN como um dado de análise e (2) a que considera o SN inteiro como unidade de análise. Na primeira perspectiva, analisamos todos os constituintes flexionáveis de todos os SNs plurais pertinentes que fazem parte de nossa amostra e, na segunda, analisamos os SNs de três ou mais constituintes extraídos dos dados dos falantes adultos. As duas perspectivas de análise a serem apresentadas têm como objetivo mostrar que (1) algumas variáveis atuam especificamente sobre cada elemento do SN; (2) outras atuam principalmente sobre o SN como um todo e (3) um terceiro tipo atua tanto sobre os elementos do SN quanto sobre o SN inteiro. No item 6.2, desenvolvemos, portanto, a análise denominada atomística; no item 6.3, a análise não atomística e, no item 6.4, apresentamos a conclusão da análise das variáveis lingüísticas.

62

6.2 - Análise atomística

6.2.1 - Introdução

Nesta parte do trabalho, consideramos como dado de análise cada um dos constituintes flexionáveis dos SNs plurais conforme caracterizados nos

item

2.3.

Se

o

constituinte

estivesse

formalmente

marcado,

consideramos presença de concordância; caso contrário, consideramos ausência. O termo concordância neste caso não é bem apropriado para todas as situações, considerando que muitas vezes apenas um elemento do SN é formalmente marcado (as perna toda marcada), podendo inclusive haver SNs sem nenhuma marca formal de plural

(dois risco verde; um

montão de nego velho). Nestes casos, o mais exato seria falar em indicação de pluralidade e não em concordância. Concordância gramatical implica harmonia formal em pelo menos dois elementos de uma dada construção, o que não ocorre nas construções acima. Mesmo assim, temos nos referido a estes casos como presença de concordância. Nesta parte, analisamos, portanto, diversas propriedades lingüísticas relativas a cada um dos elementos nominais da amostra, justificando assim o seu subtítulo: análise atomística, em contraposição à análise não atomística, a ser desenvolvida no item 6.3. Vamos discutir aqui um conjunto expressivo de variáveis: algumas já vistas em estudos anteriores e outras inteiramente novas. Para variáveis já estudadas, propomos alternativas diversas de análise, procurando escolher a mais

adequada

e,

se

possível,

a

mais

simples.

Com

relação

63

ainda aos estudos anteriores, apresentamos uma síntese dos resultados já obtidos e, quando pertinentes, comparamo-los com os nossos. As variáveis discutidas nesta parte são as seguintes: 1) Processos morfofonológicos de formação do plural; 2) Tonicidade dos itens lexicais singulares; 3) Número de sílabas dos itens lexicais singulares; 4) Posição linear do elemento no SN; 5) Classe gramatical do elemento nominal; 6) Marcas precedentes ao elemento nominal analisado; 7) Contexto fonético/fonológico seguinte ao elemento nominal sob análise; 8) Função sintática do SN (codificada em cada um de seus constituintes); 9) Animacidade dos substantivos39; 10) Grau dos substantivos e dos adjetivos e 11) Formalidade dos substantivos e dos adjetivos. Após a codificação de todos os elementos pertinentes, em função das variáveis relacionadas acima, obtivemos um total de 13229 dados extraídos de, aproximadamente, 7193 SNs. Destes 13229 dados, 11086 são de 6027 SNs produzidos pelos falantes adultos e 2143 são de 1166 SNs produzidos pelas crianças. Os adultos e as crianças apresentaram, respectivamente, os seguintes percentuais globais de concordância: 72% (7978/11086) e 66% (1407/2143). Estes percentuais incluem todos os segmentos nominais analisados em todos os ambientes possíveis, inclusive os ambientes de presença positiva ou negativa da concordância. Todavia, cumpre observar que, em etapas intermediárias ou em análises alternativas, o número de

64

dados pode variar, devido à existência dos contextos que implicam presença categórica, positiva ou negativa, da marca de plural. A análise final, envolvendo todos os dados, contém, para as crianças e os adultos, respectivamente, os seguintes totais: 7861/10969 (72%) e 1385/2121 (65%). Nas páginas seguintes, em cada item, seguem-se: síntese de estudos anteriores; descrição e exemplificação das variáveis consideradas; análises alternativas e resultados estatísticos obtidos, com as suas respectivas interpretações lingüísticas.

6.2.2 - Saliência fônica

6.2.2.1 - Introdução

A introdução do Princípio da

Saliência para explicar aspectos do

funcionamento sincrônico de uma língua foi feita por Lemle & Naro em estudos realizados sobre o Português do Brasil entre 1974 e 1976. Suas idéias sobre a atuação do Princípio da Saliência encontram-se publicadas em 1976 e em 1977 (cf. NARO & LEMLE, 1976, 259-68; LEMLE & NARO, 1977, p.47; NARO & LEMLE, 1977, p.259-68). Este princípio consiste em estabelecer que as formas mais salientes, e por isto mais perceptíveis, são mais prováveis de serem marcadas do que as

menos salientes. Nestes

trabalhos, os autores focalizam particularmente a saliência

fônica na

concordância verbal, especialmente a dimensão que envolve a quantidade de

diferenciação

material

fônica

na

relação

singular/plural,

65

denominada processos neste nosso trabalho. Em 1976, Braga & Scherre verificam este tipo de influência sobre a concordância de número entre os elementos do sintagma nominal. Novos estudos nesta mesma linha são feitos por Braga (1977), Scherre (1978), Ponte (1979) e Carvalho Nina (1980). Em 1981a, Naro retoma o estudo da concordância verbal, propondo que se estabeleçam duas dimensões no eixo da saliência fônica: diferenciação material fônica ou processos e tonicidade. Ainda em 1981a, Guy analisa o eixo da saliência fônica levando em consideração estas duas dimensões propostas por Naro em 1981a. Em nosso trabalho, vamos reanalisar a influência do eixo da saliência, observando a possibilidade da existência de uma terceira dimensão: o número de sílabas. O primeiro objetivo nesta reanálise é verificar se a atuação do Princípio da Saliência está correlacionada a características sociais dos falantes de nossa amostra, bem como a características sociais dos falantes de outras amostras estudadas. O segundo objetivo, o principal deles, consiste em discutir detalhadamente a sobreposição entre as três dimensões do eixo da saliência fônica, especialmente a existente entre diferenciação material fônica na relação singular/plural e tonicidade dos itens lexicais, apresentando, na conclusão desta parte do trabalho, uma alternativa de análise

que

consideramos mais adequada. O terceiro objetivo desta parte é a rediscussão da hipótese funcionalista de Kiparsky (1972) que postula, através das Condições de Distintividade, que "há uma tendência para a informação semanticamente relevante ser retida na estrutura superficial." (p.195)

66

Os resultados obtidos serão também utilizados no capítulo 8 para retomar a polêmica da relação entre variação e mudança envolvendo a concordância de número no SN, uma vez que há visões diferentes e até conflitantes sobre esta questão. As quatro questões que envolvem a saliência fônica mostram claramente o interesse que o estudo de sua influência desperta. Acreditamos que as reflexões a serem feitas neste capítulo servirão para um entendimento mais claro dos diversos aspectos envolvidos.

6.2.2.2 - Estudos anteriores

A influência da variável Saliência fônica sobre a concordância de número entre os elementos do SN, no que diz respeito ao grau de diferenciação de material fônico na relação singular/plural, encontra-se ainda em discussão, pois os diversos trabalhos realizados sobre o Português nem sempre apresentam as mesmas conclusões. Braga & Scherre (1976), num trabalho pioneiro sobre o assunto, estudaram o Português do Brasil com falantes residentes no Rio de Janeiro, mas de classes sociais e procedência geográfica distintas. Ao introduzirem o estudo da Saliência fônica na concordância entre os elementos do sintagma nominal, estabeleceram uma escala de diferenciação

material fônica em

cinco níveis (cf. p.465-77):

1) inserção de -S e abertura vocálica ou plural metafônico (ovo/óvus);

67

2) inserção

de

-S

e

mudança

silábica

(milhão/milhões;

imóvel/imóveis); 3) inserção de -ES em palavras em -R (flor/flores); 4) inserção de -S em palavras de plural regular (livro/livros); 5) inserção de -ES em palavras que terminam em -S (rapaz/rapazes). Braga & Scherre (1976) concluem que as formas mais salientes favorecem mais marcas de plural do que as formas menos salientes. Verificam que a escala da saliência é mais evidente nos falantes de classe média e média alta do que nos de classe baixa, embora ocorra nos três grupos. Encontram os valores probabilísticos mais baixos no fator inserção de -ES em palavras em -S e atribuem isto ao fato de as palavras deste fator já terminarem em uma consoante semelhante à do plural (cf. p.474). Braga (1977), trabalhando com o Português do Triângulo mineiro da classe média e baixa, retoma esta variável com as mesmas categorias e conclui também que a classe média mineira apresenta resultados probabilísticos favorecedores da presença da concordância em função do grau de saliência fônica, da mesma forma estabelecida em Braga & Scherre (1976). A classe baixa mineira, por sua vez, apresenta apenas uma oposição binária: inserção de -S em itens terminados em -S, desfavorecendo a presença da concordância, versus os demais, favorecedores. Braga deixa fora da hierarquia, para ambas as classes, os itens de plural duplo, devido à escassez de dados (cf. p.62-3).

68

Com relação a esta variável, Braga afirma, portanto, que, para a classe média, a concordância de número entre os elementos do SN é condicionada pelo grau de saliência fônica existente na oposição singular/plural (...). Mas se a situação da classe média parece conformar-se a este padrão e explicar-se satisfatoriamente, o comportamento lingüístico da classe baixa não se explica da mesma maneira. O comportamento lingüístico das classes média e baixa é diferente, e, novamente, a classe baixa está mais avançada em termos de evolução lingüística. Condicionamentos morfológicos parecem, pois, não afetar a aplicação da regra de concordância de número no SN, na classe baixa. Se, diacronicamente, houve um momento em que condicionamentos, tais como os aqui rotulados de grau de saliência fônica, exerceram pressão sobre a aplicação da regra de concordância de número, na classe baixa, hoje não se verifica o mesmo. (BRAGA, 1977, p.72-5)

Scherre (1978), analisando o Português do Rio de Janeiro, com base em falantes escolarizados e semi-escolarizados, continua a considerar esta variável basicamente da mesma forma e conclui também que os falantes escolarizados evidenciam um comportamento lingüístico regido pelo Princípio da Saliência. Considera, por sua vez, que os semi-escolarizados apresentam ainda uma hierarquia em função da saliência, apenas menos marcada. Em vez de cinco níveis, apresentam três, mas na mesma ordem da hierarquia dos falantes escolarizados (cf. P.79-82). Comparando os seus resultados com os de Braga, Scherre considera que, se esse condicionamento ainda afeta o grupo carioca semiescolarizado, embora de forma enfraquecida, é possível imaginar "que ele deve também ter existido em grupos apresentam." (p.127)

de falantes que hoje não mais o

69

Continuando, afirma que, de tal comparação, pode-se concluir que os informantes mineiros de classe baixa evidenciam um estágio de mudança lingüística mais avançado do que os nossos semi-escolarizados; o condicionamento morfológico, já enfraquecido nos últimos, não apresenta mais uma hierarquia diretamente proporcional ao grau de saliência fônica na oposição singular plural; o que nos permite concluir novamente que a mudança se inicia nos ambientes de menor saliência fônica e se alastra progressivamente até atingir os de maior saliência fônica. (SCHERRE, 1978, p.127) É importante observar que Scherre

apresenta uma diferença na

codificação de seus dados. Considera plurais formas do tipo mulhere, mese, óvo, aviõe etc., o que não ocorre no trabalho de Braga, no qual estas formas foram consideradas singulares (cf. 1977, p.83, nota 20). Mesmo assim os casos de inserção de -ES em itens terminados em -S se apresentam na base da hierarquia, ou seja, com menor probabilidade de concordância do que os próprios regulares, nos falantes escolarizados, e com probabilidade igual à dos regulares nos semi-escolarizados (cf. SCHERRE, 1978, p.79-82). Ponte (1979) estuda os falantes semi-analfabetos de Porto Alegre, Rio Grande do Sul. Trabalhando da mesma forma que Scherre (1978), conclui que a hierarquia da saliência encontrada para os falantes gaúchos semi-analfabetos é bastante semelhante à dos falantes semi-escolarizados cariocas; há apenas uma diferença: o fator que menos favorece a aplicação da regra

é constituído por nomes regulares (livro/livros) e não pelos

terminados em - S (mês/meses) (cf. p.164-6). Segundo Ponte, os falantes semi-analfabetos gaúchos estão também em estágio de mudança lingüística

70

avançado, o que se evidencia através da diminuição dos níveis da escala de saliência (cf. p.180). Carvalho Nina (1980) trabalha com falantes analfabetos da microregião Bragantina, Estado do Pará. Considerando a escala da saliência fônica em quatro níveis (agrupa todos os casos de inserção de -ES por terem comportamento semelhante), conclui que os Processos de formação de plural não apresentaram condicionantes fortes, na concordância de número, na fala dos informantes analfabetos. A comparação exata destes resultados com os das pesquisas anteriores não é possível, pois Carvalho Nina apresenta apenas percentagens. Todavia, é interessante constatar que nenhum caso do fator inserção de -S com mudança silábica (milhão/milhões; casal/casais) apresenta-se marcado (cf. p.103). Este fator é um dos mais altos na hierarquia até agora proposta, mesmo para os falantes semiescolarizados cariocas e gaúchos. Carvalho Nina afirma que o segundo fator de concordância mais alto é constituído pelos itens regulares; o primeiro é formado pelos plurais duplos e o terceiro pelos itens terminados em -R ou em -S. A interpretação da influência dos regulares não é correta, pois neste caso encontram-se todos os elementos não nucleares antepostos ao núcleo, enquanto nos demais processos só estão os substantivos e adjetivos. Considerando que ela trabalha só com percentagens, o peso real dos regulares não é medido. Se retirados os casos não nucleares antepostos, certamente a percentagem dos regulares se aproximará de zero.

71

A fraca influência da saliência fônica no comportamento lingüístico destes falantes e a ausência total de marcas em um dos fatores de forte saliência são interpretadas por Carvalho Nina da seguinte forma: Talvez este fato se explique por ter-se um maior número de informantes analfabetos reais, isto é, que não tiveram quase nenhuma freqüência à escola e, talvez, por residirem em zona rural, não contactaram, muitas vezes, com a classe média. (...) Talvez se possa dizer que os analfabetos se encontram num estágio mais avançado de mudança lingüística do que os informantes cariocas, mineiros e gaúchos. (CARVALHO NINA, 1980, p.144-5).

Guy (1981a) estuda falantes semi-escolarizados do Rio de Janeiro. Diferentemente de todos os estudiosos até aqui relacionados, analisa duas dimensões do eixo da saliência fônica:

1) grau de diferenciação material fônica na relação singular/plural e 2) tonicidade da sílaba.

Com relação ao item 1, Guy (cf. p.181-99) estabelece uma escala de saliência de sete níveis, não mais de cinco. As duas diferenças apresentadas por Guy ocorrem porque 1) ele separa em duas categorias os itens que apresentam alteração silábica na sua forma plural, ou seja, estabelece um fator para os que terminam em -ão (avião/aviões) e outro para os que terminam em -l (lençol/lençóis) e 2) destina um fator apenas para o item vez, por causa da expressão às vezes, mantendo outro para os demais itens deste tipo.

72

Guy conclui então o seguinte: 1) Não existe diferença entre a probabilidade atribuída aos regulares (0,28), aos itens em -ão (0,30) e aos em -l (0,33). 2) Os itens terminados em -R (0,62) têm comportamento bem semelhante ao dos itens terminados em -S (0,51) e ao do item vez (0,54). 3) Os plurais metafônicos se apresentam muito marcados (0,86), mas o número de dados é pequeno.

Com base nos resultados acima e após retirar os metafônicos, devido à escassez de dados, chega ele a uma análise final binária de itens terminados em vogal, do ponto de vista fonético (-ão, -l e regulares), desfavorecendo a presença da concordância (0,36), e itens terminados em consoantes (-R e -S), favorecendo-a (0,64). Guy (1981a) observa que os resultados de sua análise são bem diferentes dos apresentados por Braga (1977) e Scherre (1978) (que também são diferentes entre si). Evidencia ele que os seus dados e os de Braga mostram que não há diferença entre os itens regulares e os em -ão ou em -l, enquanto os de Scherre contradizem isto, pois apresentam tais casos como sendo o segundo fator que mais favorece o índice de concordância. Por outro lado, os resultados de Scherre mostram também que não há diferença entre os itens terminados em -R e os terminados em -S como os dele, mas diferentemente mostram também que os regulares se comportam como estes itens e não como os itens em -ão ou em -l. Considera ele ainda que a diferença mais forte entre os resultados é encontrada no baixo valor

73

probabilístico atribuído aos itens em -S em Braga, o que não se encontra em nenhum dos outros estudos (cf. p.187) 40 Guy conclui mesmo assim que os resultados por ele encontrados "(...) são certamente consistentes com a hipótese da saliência, mas não constituem prova conclusiva de seu efeito." (p.189)41 A influência do segundo eixo da saliência fônica - a tonicidade da sílaba - é considerada por Guy um efeito aparente. Segundo ele, este efeito é um reflexo da influência poderosa que a tonicidade exerce sobre o cancelamento do -S final não morfêmico. Afirma então que (...) o cancelamento do -S é raro nas sílabas tônicas mas ocorre na maioria das sílabas não tônicas. Este mesmo efeito, embora reduzido em magnitude, é observado nos dados de marcas de plural (...). (GUY, 1981a, p.163)42 Uma vez resumidos os diversos estudos em questão, a nossa apresentação segue a seguinte ordem: no item 6.2.2.3, relatamos os primeiros resultados obtidos no nosso trabalho; no item 6.2.2.4, observamos a relação entre saliência e características sociais dos falantes de nossa pesquisa; no item 6.2.2.5, refletimos sobre a relação entre as variáveis Processos e Tonicidade; no item 6.2.2.6, efetuamos comparações entre os nossos resultados e os de alguns estudos acima resumidos; no item 6.2.2.7, discutimos a influência da fronteira de morfema; no item 6.2.2.8, continuamos a refletir sobre a relação entre Processos e Tonicidade e, no item 6.2.2.9, concluímos, apresentando a nossa alternativa final de análise.

74

6.2.2.3 - Três dimensões do eixo da Saliência fônica

Vamos considerar, neste trabalho, o eixo da Saliência fônica sob três dimensões: 1) processos morfofonológicos de formação do plural; 2) tonicidade da sílaba dos itens lexicais singulares; 3) número de sílabas dos itens lexicais singulares. Como já colocamos inicialmente, um dos pontos em discussão, nesta parte do trabalho, é se o Princípio da Saliência atua de forma diferente em função de características sociais dos falantes, especialmente no que diz respeito aos seus anos de escolarização. Se o efeito do Princípio em foco for sempre positivo, podemos então estabelecer o seguinte:

1) Com relação a Processos, espera-se que as formas que apresentam maior diferenciação de material fônico na relação singular/plural (ovo/óvos; leitão/leitões; casal/casais) tendam a ser mais marcadas do que as que apresentam menor diferenciação (coisa/coisas; carioca/cariocas). 2) Com relação à Tonicidade, espera-se que os oxítonos singulares e os monossílabos tônicos (pé; pais, país, leitão, principal), por terem acento na sílaba que vai receber o morfema de plural, favoreçam mais a aplicação da regra do que os paroxítonos (coisa, salário, dólar, descartável) e proparoxítonos (fábrica, finíssimo), cuja sílaba final não é acentuada. Consideramos oportuno observar que Naro (1981a) analisa a Tonicidade,

75

mas da forma plural (cf. p.95), e Guy (1981a) não é explícito a este respeito, mas deduzimos que ele trata da tonicidade dos itens lexicais singulares (cf. p.138), embora trabalhe com uma oposição binária: sílabas acentuadas e sílabas não acentuadas. 3) Com relação ao número de sílabas, espera-se que os itens de maior número de sílabas (salário, português, descartável), por conterem mais material fônico e serem, portanto, mais perceptíveis, sejam os mais marcados. Para a variável Processos, estabelecemos em nosso trabalho uma categorização comparável à de Guy (1981a), com uma diferença: desconsideramos de nossa análise a expressão às vezes e codificamos todas as ocorrências de itens terminados em -S em um só fator. Além disso, codificamos casos do tipo "papeizinhos" junto aos plurais metafônicos, por apresentarem também duas possibilidades de marcas (cf. SCHERRE, 1978, p.61). Estes casos passaram a ser referenciados como plural duplo. Observamos, finalmente, que os itens do tipo irmão/irmãos foram classificados como regulares, uma vez que não apresentam alteração silábica junto à inserção do morfema de plural, à semelhança da codificação de Scherre (cf. 1978, p.65) e de Guy (cf. 1981a, p.181-2). A variável Processos ficou então subdividida da seguinte forma:

1) plural duplo: - nóvos papeizinhos - esses pósto, né?

(Joa10,fp,27a); (Mal16,fp,56a);

76

2) itens terminados em -l, cujo plural se faz com inserção de -S e alterações silábicas (ou apenas com alterações silábicas): - os casais (Dav42,mc,31a); - os quartéis (Cla27,mg,32a); - termos comerciai, era (Mor45,mc,51a);

3) itens terminados em -ão, cujo plural se faz com inserção de -S e alterações silábicas (ou apenas com alterações silábicas): - seleções carioca (Man14,mp,59a); - as próprias contradições (Par41,mc,25a); - todas as religiõe, intão (San39,fc,16a);

4) itens terminados em -R, cujo plural se faz através da inserção de ES ou de -E: - cores assim lindas - esse pescadore - esses professor

(Pit37,mc,25a); (Ire17,fp,52a); (Ana40,fc,18a);

5) itens terminados em -S, cujo plural se faz através da inserção de ES ou de -E: - os fregueses - sete mese - certos país

(Ana40,fc,18a); (Mor45,mc,51a); (Joa10,fp,27a);

6) itens terminados em vogal ou vogal + nasal, cujo plural se faz através da inserção de -S sem nenhuma alteração morfofonêmica, o chamado plural regular:

77

- uns metaizinhos - as lei trabalhista - tribos indígena - os meus três irmãos

(Hel34,fg,62a); (Cid32,mg,57a); (Geo31,mg,58a); (Jaq56,fg,14a).

Conforme explicitado acima, consideramos plurais os elementos nominais analisados que tinham uma marca formal, padrão ou não padrão, à semelhança de Scherre (cf. 1978, p.60-1). É então importante salientar que 72% (568/789) das formas marcadas nos itens não regulares (incluindo os de plural duplo) são do tipo padrão. O percentual acima refere-se a formas totalmente padrão, pois foram excluídas desses 568 casos todas as ocorrências em situações de neutralização ("as mulheres sejam" ou "essas posições são sempre revistas"), embora tais dados tenham sido também analisados: eles são 11% (85/789) do total das formas marcadas. Os 17% (136/789)

restantes ficam por conta das formas não padrão(mese,

comerciai, religiõe, óvo etc.).

Para a variável Tonicidade do item lexical singular, estabelecemos três subdivisões:

1) oxítonos e monossílabos tônicos (seleção, casal, quartel, cor, pescador, professor, freguês, mês, país, lei, meu, irmão); 2) paroxítonos e monossílabos átonos (carioca, própria,43 linda, esses, certos, trabalhista, tribo, o, um); 3) proparoxítonos (indígena).

78

Finalmente, para a variável Número de sílabas do item lexical singular, consideramos também uma subdivisão tríplice: 1) monossílabos (o, um, cor, lei, mês, meu); 2) dissílabos (casal, própria, quartel, tribo, irmão) e 3) mais de duas sílabas (seleção, carioca, contradição, pescador, professor, metalzinho, trabalhista, indígena).

Os resultados que vamos apresentar a seguir, ainda neste item e nos itens 6.2.2.4 e 6.2.2.5, nos levam às seguintes conclusões: 1) Os Processos de formação do plural e a Tonicidade dos itens lexicais singulares influenciam a concordância de número entre os elementos do SN. 2) O Número de sílabas dos itens lexicais singulares não exerce influência sobre a concordância de número entre os elementos do SN. 3) A categorização dos dados considerando os três eixos da saliência apresenta sobreposição e, conseqüentemente, ocorre interferência entre eles. 4) Os subagrupamentos de falantes em função de qualquer característica não lingüística apresentam mais marcas no plural duplo e menos marcas no plural regular, ficando as diferenças nas categorias intermediárias.

A tabela 6.2.2.1, a seguir, apresenta os resultados da variável Processos para os adultos. Antes, gostaríamos de observar que, nesta parte do trabalho, só apresentamos resultados de falantes adultos porque nos

79

outros trabalhos, com os quais faremos comparações, não foram estudados dados de crianças.

TABELA 6.2.2.1 PROCESSOS MORFOFONOLÓGICOS DE FORMAÇÃO DO PLURAL DE TODOS OS DADOS DOS ADULTOS PROCESSOS

Apl./Total

%

Prob.

Duplo maravilhoso ) maravilhósos)

63/68

=

93

0,86

-l (internacional ) (internacionais)

83/97

=

86

0,56

-ão (contradição ) (contradições)

173/200

=

86

0,42

-R (pescador ) (pescadores)

237/268

=

88

0,48

-S (português ) (portugueses)

219/265

=

83

0,38

7086/10071

=

70

0,24

Regular (pequenininha ) (pequenininhas)

Através destes resultados, podemos verificar que os falantes adultos, com referência a Processos, evidenciam mais marcas de concordância nos itens lexicais que apresentam mais diferença material fônica entre as suas respectivas formas singulares e plurais. Os plurais duplos favorecem-nas com 0,86 e os regulares inibem-nas com 0,24. São exatamente estes casos que

possuem,

respectivamente,

maior

e

menor

dife-

80

rença material fônica na relação singular/plural. Entre os itens terminados em -l (0,56), em -R (0,48) e em -S (0,38), constata-se uma hierarquia em termos de grau de saliência. Todavia, os itens terminados em -ão fogem da hierarquia prevista. Esperava-se que o seu comportamento fosse igual ou bastante semelhante ao dos itens terminados em -l, uma vez que fazem o plural de forma bastante parecida: além da inserção de -S, verificam-se alterações silábicas. Vamos voltar a esta questão nos itens subseqüentes. Antes disto, queremos apresentar na tabela 6.2.2.2 os resultados obtidos para a variável Tonicidade.

TABELA 6.2.2.2 TONICIDADE DA SÍLABA DOS ITENS LEXICAIS SINGULARES DE TODOS OS DADOS DOS ADULTOS TONICIDADE Oxítono e monossílabo tônico (país/leitão) (meu/pé) Paroxítono e monossílabo átono (coisa/dólar/os/as) Proparoxítono (fábrica ) (indígena) (médico )

Apl./Total

%

Prob.

1028/1198

=

86

0,66

6752/9615

=

70

0,39

81/156

=

52

0,44

Podemos verificar que a Tonicidade da sílaba do item singular influencia a concordância: ela

ocorre mais, se a sílaba do item lexical

singular for marcada, ou seja, se o item lexical for oxítono. Mas se o item

81

lexical singular for paroxítono ou proparoxítono, apresentando, portanto, a sílaba final não marcada, a concordância ocorre menos. A terceira dimensão da saliência fônica - o Número de sílabas dos itens

lexicais

singulares

-

não

foi

considerada

relevante

para

a

ausência/presença de concordância entre os elementos do SN, embora em termos de percentagens haja uma oposição entre monossílabos (95%), por um lado, e dissílabos (64%) e mais de duas sílabas (58%), por outro. A tabela 6.2.2.3 apresenta resultados para esta variável.44

TABELA 6.2.2.3 NÚMERO DE SÍLABAS DOS ITENS LEXICAIS SINGULARES DE TODOS OS DADOS DOS ADULTOS NÚMERO DE SÍLABAS

Apl./Total

%

Prob.

Monossílabo

2901/3056

=

95

(0,48)

Dissílabo

2943/4621

=

64

(0,51)

Mais de duas

1794/3070

=

58

(0,51)

As diferenças entre as probabilidades associadas ao número de sílabas são irrelevantes, ou seja, os valores para os três fatores são praticamente iguais a 0,50, o que mostra a neutralidade desta variável sobre a concordância nominal. Além disso, ela não foi considerada como estatisticamente relevante. As diferenças entre as percentagens e as probabilidades ocorrem por haver forte interferência entre as variáveis Tonicidade, Número de sílabas e Relação dos elementos no SN.45

82

A análise estatística reflete fielmente o que ocorre com a distribuição real dos dados lingüísticos, pois 1) 90% dos casos de monossílabos ocorrem antepostos ao núcleo, sendo 81% artigos e 09% possessivos, os quais são marcados por esta razão e não por serem monossílabos; 2) os 10% restantes são todos tônicos, e são marcados por causa da Tonicidade e não, também, pelo número de sílabas. Os resultados até aqui apresentados

foram obtidos através da

análise de todos os dados dos falantes adultos. Considerando que a diferenciação

material fônica só ocorre

basicamente nos substantivos, adjetivos e categorias substantivadas, uma vez que os demais itens lexicais são regulares (a exceção de três ocorrências de tal e uma de qualquer) e considerando também que todos os artigos foram classificados no mesmo fator de paroxítonos, decidimos repetir a análise acima considerando apenas as classes gramaticais pertinentes. Esta decisão ocorreu por simples cautela, pois tínhamos uma outra variável Relação entre os elementos do sintagma nominal, a ser discutida no item 6.2.3.7, que dá conta de um possível enviesamento nos resultados. Mas, considerando que as categorias não relevantes perfazem aproximadamente 40% dos casos, decidimos testar o instrumental estatístico usado. Os resultados obtidos nesta etapa são apresentados nas tabelas 6.2.2.4 e 6.2.2.5, para as variáveis Processos e Tonicidade, respectivamente.

83

TABELA 6.2.2.4 PROCESSOS MORFOFONOLÓGICOS DE FORMAÇÃO DO PLURAL DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS DADOS DOS ADULTOS PROCESSOS

Apl./Total

%

Prob.

Duplo (maravilhoso ) (maravilhósos)

63/68

=

93

0,85

-l (internacional ) (internacionais)

80/93

=

86

0,56

-ão (contradição ) (contradições)

173/200

=

86

0,42

-R (pescador ) (pescadores)

237/268

=

88

0,49

-S (português ) (portugueses)

219/265

=

83

0,39

2819/5583

=

50

0,24

Regular (pequenininha ) (pequenininhas)

84

TABELA 6.2.2.5 TONICIDADE DA SÍLABA DOS ITENS LEXICAIS SINGULARES DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS DADOS DOS ADULTOS TONICIDADE Oxítono e monossílabo tônico (país/leitão) (meu/pé) Paroxítono e monossílabo átono (coisa/dólar) (maravilhoso) Proparoxítono (fábrica (indígena) (médico)

Apl./Total

%

Prob.

829/992

=

84

0,66

2681/5329

=

50

0,39

81/156

=

52

0,44

Pelos resultados acima, e pela sua comparação com os resultados das tabelas 6.2.2.1 e 6.2.2.2, podemos ver que

não existe nenhuma

diferença entre os resultados probabilísticos associados aos diversos fatores das variáveis Processos e Tonicidade, quer se considerem todos os dados, quer se considerem apenas os substantivos, adjetivos e categorias substantivadas. A única diferença nas duas análises que merece menção é a que diz respeito à ordem de seleção entre as duas variáveis focalizadas. Considerando-se todos os dados, a variável Tonicidade é selecionada em terceiro lugar, com significância 0,0, e a variável Processos, em sexto, com significância 0,000. Considerando-se apenas as classes gramaticais pertinentes, praticamente inverte-se a situação: a variável Processos é selecionada em segundo lugar, com significância 0,0, e a variá-

85

vel

Tonicidade em sétimo, com significância 0,000. A nossa intuição de

lingüista nos diz que a segunda análise condiz melhor com a realidade dos fatos, porque a variável Processos é a que se aplica especificamente ao fenômeno da concordância. Daqui para a frente, sempre que possível, apresentaremos análises envolvendo apenas os substantivos, os adjetivos e as categorias substantivadas, quando estivermos tratando das variáveis Processos e Tonicidade. Queremos ainda dizer que o instrumental estatístico utilizado mostra-se satisfatório, atribuindo os devidos pesos probabilísticos aos fatores das diversas variáveis.

6.2.2.4 - Relação entre Saliência fônica características sociais dos falantes

e

Considerando (1) que os itens terminados em -ão fogem da hierarquia prevista e (2) que queremos testar a hipótese de o grau de influência da variável Processos estar vinculado a características sociais dos falantes, fizemos uma separação da nossa amostra em função dos anos de escolarização: um a quatro anos (antigo primário), cinco a oito anos (antigo ginasial) e nove a 11 anos (antigo colegial). Para facilitar a redação, estamos utilizando a terminologia primário, ginasial e colegial, alternando com a indicação

destes

falantes

em

termos

dos

anos

de

escolarização

correspondentes. Elegemos inicialmente esta característica social por ser ela a mais evidente em termos de se poder observar as possíveis diferenças entre os resultados dos diversos trabalhos já realizados. Pelo resumo dos trabalhos

anteriores,

pudemos

ver

o

ponto

marcante

de

dife-

86

rença ou semelhança entre as amostras é exatamente o nível de escolarização dos falantes. A tabela 6.2.2.6 contém os resultados para a variável Processos, subdividida em termos do grau de escolarização.

TABELA 6.2.2.6 PROCESSOS MORFOFONOLÓGICOS DE FORMAÇÃO DO PLURAL DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS ADULTOS POR ESCOLARIZAÇÃO PROCESSOS

FALANTES

Duplo (novo ) (nóvos)

F.

-l (casal ) (casais)

F.

-ão (leitão ) (leitões)

F

-R (cor ) (cores)

F.

-S (país ) (países) Regular (caro) (caros)

P.

P.

P.

P. F. P. F. P.

Todos

Primário

Ginasial

Colegial

63 = 93% 68 0,85

22 = 88% 25 0,84

24 = 92% 26 0,88

17 = 100% 17 +

80 = 86% 93 0,56

21 = 70% 30 0,50

18 = 95% 19 0,73

41 = 93% 44 0,63

173 = 86% 200 0,42

31 = 72% 43 0,39

61 = 84% 73 0,32

81 = 96% 84 0,66

237 = 88% 268 0,49

77 = 82% 94 0,51

74 = 89% 83 0,47

85 = 94% 90 0,61

219 = 83% 265 0,39

87 = 78% 112 0,48

68 = 83% 82 0,27

64 = 90% 71 0,37

2819 = 50% 5583 0,24

653 = 33% 1990 0,24

992 = 53% 1876 0,24

1158 = 68% 1701 0,24

87

Os resultados acima mostram semelhanças e diferenças no comportamento dos falantes de nossa amostra, em função dos anos de escolarização. Com relação às semelhanças, podemos ver que todo e qualquer falante

apresenta

probabilidades

altas

associadas

ao

plural

duplo,

probabilidades baixas associadas ao plural regular e probabilidades intermediárias associadas aos demais fatores. De uma forma geral, podemos falar em três grandes oposições envolvendo a variável em questão para qualquer agrupamento de falantes, o que é claramente refletido nas probabilidades grupais. Com relação às diferenças, temos o seguinte: 1) Os falantes de primário não apresentam diferenças relevantes entre os quatro fatores intermediários: 0,50 para os itens terminados em -l; 0,51 para os itens em -R; 0,48 para os itens terminados em -S e 0,39 para os itens em -ão, a menor probabilidade dentre as destes quatro fatores. 2) Os falantes do ginasial já apresentam maior diferenciação entre as quatro categorias intermediárias: 0,73 para os nomes terminados em -l; 0,32 para os itens em -ão; 0,47 para os itens em -R e 0,27 para os itens em -S. Neste caso, a probabilidade atribuída aos nomes em -ão situa-se abaixo da probabilidade dos itens em -R, mas acima das probabilidades dos itens em S; mas é radicalmente diversa da que foi atribuída aos itens em -l. 3) Os falantes do colegial apresentam também pouca diferença entre os fatores intermediários: há uma aproximação muito forte entre os terminados em -l (0,63), em -ão (0,66) e em -R (0,61). Somente os itens em S apresentam-se menos marcados (0,37). Neste caso, diferentemente dos

88

outros dois, há uma aproximação bastante forte entre os itens terminados em -l e os terminados em -ão. 4) Com relação ao distanciamento ou aproximação dos fatores das categorias intermediárias em relação aos itens regulares, pode-se verificar que as probabilidades variam dependendo do grupo de falantes analisado: nos falantes do primário, a probabilidade

que mais se distancia dos

regulares é a que está associada aos itens em -R (diferença de 0,27) e a que mais se aproxima é a dos itens em -ão (diferença de 0,15); nos falantes do ginasial, a que mais se distancia é a que é atribuída aos itens em -l (diferença de 0,48) e a que mais se aproxima é a dos itens em -S (diferença de 0,03); nos falantes de colegial, a probabilidade mais distante dos regulares está associada aos itens em -ão (diferença de 0,42) e a mais próxima é a dos itens em -S (diferença de 0,13).

A novidade nos resultados obtidos nesta etapa diz respeito ao distanciamento entre as probabilidades associadas aos itens em -ão e em -l nos falantes do primário e do ginasial, pois a nossa expectativa era de que estes itens apresentassem comportamento semelhante, considerando que a forma de se pluralizarem é também semelhante. Antes de quaisquer tentativas de interpretação de diferenças mais sutis entre os diversos agrupamentos de falantes, gostaríamos de apresentar os resultados da variável Tonicidade, a seguir, na tabela, 6.2.2.7.

89

TABELA 6.2.2.7 TONICIDADE DA SÍLABA DO ITEM LEXICAL SINGULAR DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS DADOS DOS ADULTOS POR ESCOLARIZAÇÃO TONICIDADE

Oxítono e monossílabo tônico (país ) (leitão) (meu, pé) Paroxítono e monossílabo átono (raro) (coisa/dólar) (os/as) Proparoxítono (fábrica ) (indígena) (médico )

FALANTES Todos

Primário

Ginasial

Colegial

F.

829 = 84% 992

254 = 74% 345

272 = 85% 321

299 = 93% 322

P.

0,66

0,67

0,69

0,59

F.

2681 = 50% 5329

622 = 33% 1901

937 = 53% 1778

1092 = 67% 1620

P.

0,39

0,44

0,38

0,35

F.

81 = 52% 156

15 = 31% 48

28 = 47% 60

38 = 79% 48

P.

0,44

0,39

0,43

0,56

Podemos novamente verificar que os itens oxítonos são sempre os mais marcados e que os paroxítonos são sempre os menos marcados. Esta oposição é uniforme: encontra-se em qualquer agrupamento de falantes. A diferença de comportamento entre os falantes nesta variável fica por conta da influência dos proparoxítonos que, pela nossa hipótese, deveriam apresentar probabilidade igual ou inferior à dos paroxítonos, pois a sílaba que vai receber a marca de plural é ainda menos marcada, ou seja, mais distante da tônica. Isto se constata para os falantes do primário e do

90

ginasial, mas não para os falantes do colegial, que apresentam um índice probabilístico nos proparoxítonos (0,56) próximo ao dos oxítonos (0,59). A interpretação que fazemos desta diferença de comportamento é que, para os falantes do colegial, importa em verdade o fato de o item lexical ser mais saliente: os proparoxítonos e os oxítonos, enquanto um todo, têm a característica comum de serem mais salientes do que os paroxítonos, pois eles são itens marcados na língua portuguesa, que é constituída predominantemente de palavras paroxítonas. Testamos se a diferença entre os oxítonos e proparoxítonos era estatisticamente relevante e constatamos que sim, a nível de 0,005. Outra hipótese plausível seria a de que os proparoxítonos são categorias instáveis na língua portuguesa. Constata-se inclusive a passagem de proparoxítonos a paroxítonos mesmo na fala de pessoas escolarizadas, mas com freqüência menor do que na

fala das não escolarizadas.

Cosquinha por cocegazinha ou abobrinha por aboborazinha são formas naturais para qualquer falante do Português, mas abobra por abóbora, corgo por córrego, musga por música, Petropis por Petrópolis e arve por árvore ocorrem predominantemente em grupos de falantes menos escolarizados. Este comportamento instável de alguns proparoxítonos não tem suporte empírico em nossos dados. Todos os proparoxítonos da nossa amostra são proparoxítonos reais. Há apenas um caso de arve na fala das crianças. Em resumo, constatamos que Processos e Tonicidade influenciam presença/ausência da concordância nominal embora apresentem algumas diferenças na forma de atuar em função do grau de escolarização

91

dos falantes. Na tentativa de entendermos melhor as diferenças existentes, vamos apresentar a seguir uma análise detalhada da relação entre estas duas variáveis.

6.2.2.5 - Refletindo sobre a relação entre Processos e Tonicidade

Os resultados que apresentamos no item 6.2.2.4 não são diretamente comparáveis aos de todos os estudos feitos anteriormente, pois a maioria deles, exceto Guy (1981a), não levou em consideração a variável Tonicidade. Em verdade, o próprio estudo de Guy (1981a) não seria diretamente comparável ao de Scherre (1978), pois ela, embora tenha trabalhado com um subconjunto dos dados de Guy (1981a),46 só codificou a variável Processos. A sobreposição entre estas duas variáveis é evidente porque, como se vê na tabela 6.2.2.8, a grande maioria dos itens regulares e dos itens de plural duplo são paroxítonos; os itens em -l e em -R são predominantemente oxítonos; todos os itens em -ão e em -S são oxítonos e todos os proparoxítonos são regulares. Sendo assim, os itens que não têm oposição oxítonos versus paroxítonos (os em -ão e os

em -S) apresentam

uma superposição muito forte na codificação de Processos e Tonicidade.

92

TABELA 6.2.2.8 CRUZAMENTO DE PROCESSOS E TONICIDADE NOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS ADULTOS: PERCENTAGENS PROCESSOS

TONICIDADE Oxítono e monoss. tônico

Duplo

5/5

-l

Paroxítono

Proparoxítono

= 100%

58/63

= 92%

xxx

67/77 = 87%

13/16

= 81%

xxx

-ão

173/200 = 86%

xxx

-R

231/260 = 88%

-S

219/265 = 83%

xxx

Regular

134/185 = 72%

2604/5242= 50%

6/8

= 75%

xxx xxx xxx 81/156 = 52%

Inevitavelmente haverá diferenças probabilísticas entre duas análises que codifiquem apenas Processos ou apenas Tonicidade, ou ambas, porque o instrumental estatístico que usamos pretende dar a cada uma das variáveis o peso probabilístico devido. Na tabela 6.2.2.9 (ver a página seguinte), temos os resultados probabilísticos associados ao cruzamento das variáveis Processos e Tonicidade. Os resultados probabilísticos da tabela 6.2.2.9 mostram que atuam tanto a variável Processos quanto a variável Tonicidade. Nas colunas, temos novamente uma escala em função do grau de diferenciação material fônica na relação singular/plural, quer para os oxítonos, quer para

os

proparoxítonos. Nas linhas, temos a oposição entre os oxítonos e os não oxítonos, restando, todavia, testar se as diferenças quatro entre as categorias intermediárias são estatisticamente relevantes. Retomaremos esta questão no item 6.2.2.8.

93

TABELA 6.2.2.9 CRUZAMENTO DE PROCESSOS E TONICIDADE NOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS UBSTANTIVADAS DOS DADOS DOS ADULTOS: PROBABILIDADES PROCESSOS

TONICIDADE Oxítono e monoss. tônico

Paroxítono

Proparoxítono

+

0,80

xxx

-l

0,74

0,44

xxx

-ão

0,61

xxx

xxx

-R

0,68

0,38

xxx

-S

0,58

xxx

xxx

Regular

0,40

0,18

0,22

Duplo

A fim de testarmos o nível de influência da variável Tonicidade sobre a variável Processos, efetuamos uma análise dos dados ignorando o efeito da Tonicidade, o que tornará a comparação entre os resultados dos diversos estudos mais segura. Os resultados desta etapa são apresentados na tabela 6.2.2.10, a qual contém apenas probabilidades, pois nem as percentagens e nem o número de dados sofreram qualquer alteração. Repetimos as probabilidades com o efeito da Tonicidade na primeira coluna de cada grupo ou subgrupo de falantes para que a comparação possa ficar mais clara.

94

TABELA 6.2.2.10 SOBREPOSIÇÃO ENTRE PROCESSOS E TONICIDADE NOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS DADOS DOS ADULTOS PROCESSOS

FALANTES Primário c/ton. s/ton.

Ginasial c/ton. s/ton.

Colegial c/ton. s/ton.

Duplo (novo ) (nóvos)

0,84 0,75

0,88 0,76

-l (móvel ) (móveis)

0,50 0,56

0,73 0,80

0,63 0,61

-ão (eleição ) (eleições)

0,39 0,47

0,32 0,42

0,66 0,72

-R (flor ) (flores)

0,51 0,59

0,47 0,56

0,61 0,65

-S (luz ) (luzes)

0,48 0,55

0,27 0,36

0,37 0,45

Regular (tribo ) (tribos)

0,24 0,15

0,24 0,12

0,24 0,14

+

+

Pelos resultados, podemos ver que a hierarquia entre os diversos fatores alterou em apenas dois aspectos: nos falantes de ginasial, o comportamento dos itens de plural duplo (0,76) praticamente se identificou ao dos itens terminados em -l (0,80) e, nos falantes do colegial, a probabilidade associada aos itens em -ão (0,72), além da mudança de posição, passou a se distanciar um pouco da associada aos itens em -l (0,61). De forma geral, os itens terminados em -ão continuam a fugir da hierarquia prevista, exceto nos falantes do colegial em que eles apresentam mais chances de serem marcados (0,72) do que os próprios itens em -l (0,61). Todavia ocorre uma diferença sistemática entre praticamente todos os

95

fatores de todos os falantes. O peso probabilístico do plural duplo e dos regulares diminui, uma vez que não há o fator paroxítono a quem é atribuído um peso probabilístico baixo; inversamente, sobe o peso de todos os demais fatores que são constituídos na sua maioria de itens lexicais oxítonos, pois não há mais também o fator oxítono a que se atribui um peso alto. A conseqüência

mais

marcante

desta

nova

distribuição

de

pesos

probabilísticos é o maior distanciamento entre as probabilidades associadas aos regulares e aos demais itens, exceto para os de plural duplo de todos os falantes, conforme se observa na tabela 6.2.2.11. Estamos apresentando, na tabela 6.2.2.11, as diferenças entre as probabilidades associadas

aos itens regulares

e as probabilidades

associadas aos demais itens em termos da presença ou ausência da variável Tonicidade, na análise. Estas diferenças estão na tabela 6.2.2.11 sob os rótulos respectivos c/ton (com tonicidade) e s/ton (sem tonicidade), para os falantes dos três níveis de escolarização. Efetuamos então as diferenças entre as probabilidades dos itens não regulares e as dos itens regulares, obtendo, portanto, a diferença probabilística entre eles. Ilustrando o processo, podemos ver, na tabela 6.2.2.10, que os falantes do primário têm, respectivamente, as probabilidades 0,39 e 0,47 associadas aos itens em -ão nas análises com ou sem tonicidade, e 0,24 e 0,15 para os itens regulares nestas mesmas análises. As diferenças entre as probabilidades dos itens em -ão e as dos itens regulares nas respectivas análises são, portanto, de 0,15 e de 0,32.

96

TABELA 6.2.2.11 DIFERENÇAS PROBABILÍSTICAS ENTRE OS PROCESSOS NÃO REGULARES E O PROCESSO REGULAR EM FUNÇÃO DA PRESENÇA OU AUSÊNCIA DA VARIÁVEL TONICIDADE PROCESSOS

FALANTES Primário c/ton. s/ton.

Ginasial c/ton. s/ton.

Colegial c/ton. s/ton.

Duplo (porto) (pórtos)

+0,60 +0,56

+0,64 +0,64

-l (móvel ) (móveis)

+0,26 +0,41

+0,49 +0,68

+0,39..+0,47

-ão (dentão ) (dentões)

+0,15 +0,32

+0,08 +0,30

+0,42 +0,59

-R (melhor ) (melhores)

+0,27 +0,44

+0,22 +0,44

+0,37 +0,51

-S (raiz ) (raízes)

+0,24 +0,40

+0,03 +0,24

+

+

+0,13 +0,31

Observando-se então as diferenças probabilísticas entre os itens regulares e não regulares, conclui-se que a variável Tonicidade tem uma influência bastante forte no grau de distanciamento que se estabelece entre estes fatores da variável Processos. É oportuno observar que, na análise em que se considera a variável Processos com Tonicidade, os itens terminados em -S, nos falantes de ginasial, quase não apresentam diferenças com relação aos regulares: neste caso, ela é de apenas 0,03. Se retirado o efeito da Tonicidade, a diferença se eleva para 0,24. Diante

de

tais

diferenças

probabilísticas,

fica

definitivamente

demonstrado que análises que codificam apenas a variável Processos não

97

podem ser diretamente comparáveis às que codificam também a variável Tonicidade. Levaremos isto em conta no item 6.2.2.6, no qual vamos comparar os nossos resultados aos de outros estudos realizados sobre o assunto em pauta. Gostaríamos de retomar neste ponto a questão que envolve os itens terminados em -l e em -ão no que diz respeito a serem considerados como constituintes de um ou de dois fatores. Como já vimos, todos os estudiosos deste assunto que antecederam Guy (1981a) os agruparam em um só fator, levando-se em conta que eles fazem a oposição singular plural de forma semelhante - com inserção de -S e alterações silábicas - e que deveriam, portanto, ter o mesmo efeito sobre a aplicação da concordância entre os elementos do SN. Guy (1981a), todavia, efetuou a separação destes dois tipos de itens em dois fatores separados. Os nossos resultados mostram que esta separação se mostra pertinente, pelo menos para os falantes do primário e do ginasial: os itens em -ão, com ou sem a influência da Tonicidade, favorecem menos a aplicação da regra do que os itens em -l. Para os falantes do colegial, todavia, os itens em -ão chegam a favorecer mais a aplicação da regra do que os em -l, se retirado o peso da Tonicidade. O que não nos parece adequada é a afirmação generalizante de Guy de que os regulares têm o comportamento igual aos dos itens em -ão e em -l por terminarem em vogal (cf. GUY, 1981a, p.183-4). Mesmo considerando também a influência da variável Tonicidade, os itens terminados em -ão, da nossa amostra, não apresentam compor-

98

tamento igual ao dos regulares; muito menos os itens terminados em -l. Isto nos leva obrigatoriamente a observar com cuidado a sobreposição entre variáveis lingüísticas, antes de qualquer generalização. Guy (1981a), numa tentativa de interpretar as discrepâncias entre os resultados do seu estudo, os de Braga (1977) e os de Scherre (1978) (ver item 6.2.2.2. p.72-73), levanta duas hipóteses, sem, contudo, demonstrá-las. Na primeira, ele considera que a variável Processos pode não ser muito poderosa e neste caso (...) os valores dos fatores poderiam facilmente oscilar por flutuação aleatória nos dados e por sistemas de codificação diferentes usados na análise de outras variáveis. (GUY, 1981a, p.187)47

Na segunda, ele observa que a diferença de número de dados em cada uma das categorias da variável Processos é muito grande. Mais de 90% dos dados são de plural regular, o que (...) significa que há uma forte correlação entre o valor do fator para plurais regulares e a probabilidade de input (...). Em tal situação, mudanças pequenas nos dados, mesmo em outros grupos de fatores, podem produzir mudanças muito fortes na posição relativa destes dois valores, e portanto nos outros valores neste grupo de fatores. (GUY, 1981a, p.188)48

Com base nessas duas hipóteses, afirma ele que em qualquer caso, os nossos resultados são preferíveis, uma vez que nós temos mais dados (quase 30% mais do que os de Scherre) - o remédio soberano para estatísticas instáveis. (GUY, 1981a, p.188)49

99

Consideramos que a primeira hipótese aventada por Guy (1981a), no que toca à oscilação dos resultados por sistemas de codificação diferentes usados na análise de

outras variáveis, é a mais plausível. Como já

observamos, diferentemente de todos

os demais pesquisadores, Guy

codifica as variáveis Processos e Tonicidade, intimamente associadas. A Tonicidade, codificada ao lado de Processos, retira dos fatores

não

regulares constituídos de oxítonos grande parte do seu peso, assim como atribui aos regulares maior peso, pois os paroxítonos favorecem pouco a presença de concordância (ver tabelas 6.2.2.10 e 6.2.2.11). A proximidade entre regulares, itens em -ão e em -l, na análise de Guy, deve ocorrer, portanto, pelo que foi apontado acima. Guy

todavia

não mostra isto

explicitamente. Se fosse possível termos os resultados de Scherre (1978) incluindo a variável Tonicidade ou os de Guy (1981a) sem Tonicidade, poderíamos ver melhor as reais diferenças entre estas duas análises. Os resultados destes dois estudos na sua forma original podem ser vistos na tabela 6.2.2.12.

100

TABELA 6.2.2.12 PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS RESULTADOS DE SCHERRE (1978) E GUY (1981a) PROCESSOS

FALANTES SEMI-ESCOLARIZADOS CARIOCAS SCHERRE(1978) Apl./Total

%

GUY (1981a)

Prob.

Apl./Total

%

Prob.

Duplo (novo ) (nóvos)

30/34

=

82 0,96

6/8

=

75 0,84

-l e -ão (incrível ) (incríveis) (noção ) (noções)

39/101

=

39 0,49

68/141

=

48 0,28

-R (anterior ) (anteriores)

37/80

=

46 0,25

96/142

=

68 0,59

-S (freguês ) (fregueses)

72/140

=

51 0,29

222/445

=

50 0,50

Regular (armazém ) (armazéns)

4291/7240

=

59 0,26

5887/9058

=

65 0,25

Observando-se os resultados da tabela 6.2.2.12, podemos ver que 1) as percentagens atribuídas aos itens em -l e em -ão no trabalho de Guy (48%) são, inclusive, maiores do que as de Scherre (39%); 2) as percentagens atribuídas ao fator -S são iguais: 51% e 50%. As

grandes

diferenças

entre

as

duas

análises

probabilidades, quando se atribui o peso relativo a cada fator.

estão

nas

101

A diferença percentual marcante entre estes dois conjuntos de dados (22%) encontra-se apenas nos itens em -R (46% e 68%). Neste caso, a diferença probabilística pode não ser devida apenas a diferenças nos sistemas de codificação. Acabamos de ver que a introdução da variável Tonicidade ao lado da variável Processos apresenta repercussões bastante evidentes na relação que se pode fazer entre os itens regulares e os demais itens. Uma análise que considera este aspecto tem de estar atenta para as suas interferências e não se furtar de apresentá-las objetivamente. Além disso, verificamos que o poder da variável Processos sobre os substantivos, adjetivos e categorias substantivadas é muito forte. Para os falantes do primário e do ginasial, a sua seleção ocorre antes da seleção da variável Tonicidade com significância 0,0. Apenas para os falantes

do

colegial, a situação se inverte. Diferentemente de Guy (1981a), não consideramos que o efeito da Tonicidade seja aparente, especialmente nos casos não regulares. Nestes casos, a simples ausência de -S não significa ausência de marcas de plural. A Tonicidade é, portanto, um traço integrante do eixo da saliência fônica, com repercussões importantes sobre o índice de presença de marca formal de plural nos itens analisados.

102

6.2.2.6 - Comparando os resultados de estudos diversos

Feitas as reflexões acima, podemos agora comparar os resultados do presente estudo com os dos demais trabalhos. Na tabela 6.2.2.13, encontramos os nossos resultados para os falantes do primário e os de Guy (1981a) para falantes semi-escolarizados, que estavam se alfabetizando no MOBRAL. Nesta parte do estudo, consideramos a análise que envolve todos os dados, uma vez que a dos demais estudiosos também baseia-se em todos os dados da amostra. Com base nos resultados desta tabela, a seguir, verificam-se as seguintes similaridades: o plural duplo é o que mais favorece a aplicação da regra, e o plural regular, o que menos a favorece. Observa-se também que os itens em -ão, fora os regulares, apresentam as mais

baixas

probabilidades de aplicação da regra. Conseqüentemente, os itens em -R e em -S favorecem mais a aplicação da regra do que os próprios itens em -ão. Esta é uma das grandes descobertas com o desmembramento feito entre os itens que fazem a oposição singular/plural com inserção de -S e alterações silábicas.

103

TABELA 6.2.2.13 PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS NOSSOS RESULTADOS E OS DE GUY (1981a)50 PROCESSOS

FALANTES Primário

Semi-escolarizados Guy (1981a)

Apl./Total

%

Prob.

Apl./Total

%

Prob.

Duplo (famoso ) famósos)

22/25

=

88

0,85

6/8

=

75

0,86

-l (horrível ) (horríveis)

21/31

=

68

0,49

25/57

=

44

0,33

-ão (profissão ) (profissões)

31/43

=

72

0,39

44/84

=

52

0,30

-R (revólver ) (revólveres)

77/94

=

82

0,50

96/142

=

68

0,62

-S (rapaz ) (rapazes)

87/112

=

78

0,47

76/147

=

52

0,51

2175/3598

=

60

0,24

5887/9058

=

65

0,28

Regular (amendoim ) (amendoins)

Outra grande diferença observada, em relação a análises anteriores, é a alta taxa probabilística associada aos itens em -S, pois, se retirado o efeito da variável Tonicidade, esta probabilidade, inclusive, aumenta (de 0,47 passa a 0,55, como vimos na tabela 6.2.2.10). Esta categoria apresenta, a nosso ver, comportamento bastante flutuante nos agrupamentos de falantes.

104

Nos nossos falantes do ginasial e do colegial, inclusive, ela já apresenta um comportamento diferente: mais semelhante ao dos regulares na análise que considera a variável Tonicidade (ver tabela 6.2.2.6). Ao compararmos análises que não consideraram a variável Tonicidade, para os nossos falantes do colegial, para os escolarizados cariocas e para a classe média mineira, veremos também que o seu comportamento não é uniforme. Todavia, a probabilidade associada aos itens em -l (0,49) nos nossos falantes do primário é mais alta do que a dos falantes semi-analfabetos de Guy (0,33). No nosso caso, ela fica próxima à dos itens terminados em -R (0,50) e em -S (0,47), enquanto, nos falantes da amostra de Guy, ela se mantém semelhante(0,33) à dos itens em -ão (0,30) e dos regulares (0,28). Então os nossos falantes do primário apresentam uma oposição tríplice em termos de: plural duplo, plural não regular, e escolarizados estudados por Guy

plural regular; os semi-

apresentam também uma oposição

tríplice, mas fora da escala da saliência prevista: plural duplo, plural dos itens em -R e em -S, e demais casos (itens em -l, em -ão e regulares). A conclusão a que se chega com base na comparação entre estes resultados é a de que a escala da saliência para os falantes do primário se comporta dentro da linha por nós esperada de forma mais nítida do que para os falantes que freqüentavam o MOBRAL, ou seja, o seu maior refinamento parece estar ligado a um maior índice de escolarização.

Vamos agora comparar os nossos resultados com os de Braga (1977) e com os de Scherre (1978). Utilizaremos neste ponto os resultados da

105

nossa etapa de análise sem o efeito da Tonicidade e com o agrupamento dos itens terminados em -l e em -ão em um só fator, por questão apenas de comparabilidade. Já adiantamos, todavia, que mesmo assim a comparação não é perfeita, porque Braga (1977) codificou formas não padrão do tipo veze, mese como singulares. Após a apresentação dos resultados comparativos, vamos discutir esta segunda questão. Os nossos resultados não serão comparados aos de Ponte (1979), porque o instrumental estatístico por ela utilizado é diferente do nosso, o que pode falsear a comparação. Nem faremos comparação com os resultados de Carvalho Nina (1980), porque ela, além de apresentar apenas resultados percentuais, apresenta também um número improvável de dados para os fatores não regulares da

variável Processos, se comparados aos que já

obtivemos até hoje para estes fatores. Exemplificando: enquanto obtivemos apenas 25 dados no fator plural duplo para os nossos falantes do primário, Carvalho Nina obteve 338 casos. Podemos com isso levantar a hipótese de que não estamos trabalhando exatamente com o mesmo

tipo de dado.

Como estamos trabalhando com a concordância nominal, não levamos em conta dados do tipo "comprar ovos" que podem, por exemplo, ter sido considerados por Carvalho Nina (cf. p.110). A diferença numérica acima poderia ser atribuída ao número de falantes pesquisados, o que não é verdade, pois esta diferença não é tão grande: Carvalho Nina trabalhou com 20 falantes analfabetos e nós trabalhamos com 16 falantes do primário. Esta dúvida se desfaz totalmente, se considerarmos o total de falantes adultos por nós analisados - 48 - que mesmo assim apresenta um total de apenas 68 dados, contra os 338 ca-

106

sos de Carvalho Nina para o mesmo fator, com um conjunto de apenas 20 informantes. Todavia, é possível observar que os analfabetos paraenses apresentam um comportamento surpreendente: os itens terminados em -ão e em -l jamais são marcados. apresentados e das

Pelo que pudemos ver dos exemplos

observações de Carvalho Nina (1980), o núcleo só

tende a ser marcado quando for constituído por um item de plural duplo, por um item em -S ou em -R, mas sem o -S final, ou seja, apresenta-se nas formas ólhu (cf. p.66 e 144), caçadore (cf. p.67) e veze (cf. p.68). Ao falar da possibilidade de marcas no segundo elemento do SN, afirma ela que "a ausência de flexão se verificava no núcleo do sintagma nominal, salvo ocorrências irrelevantes." (p.70)

Os resultados comparativos dos nossos falantes do primário e do ginasial, e os do primeiro grau de Braga (1977), encontram-se na tabela 6.2.2.14. É bom relembrar que os itens em -l e em -ão foram aqui agrupados e, com isto, desaparece uma grande diferença entre o comportamento dos falantes do primário e os do ginasial da nossa amostra. Os itens em -l são muito marcados nos dados deste segundo grupo de falantes (ver tabela 6.2.2.6). Além disso, os resultados abaixo foram obtidos sem a interferência da variável Tonicidade. A escala de saliência é nitidamente tríplice para os três grupos de falantes. A diferença reside apenas na categoria que ocupa a base da hierarquia.

107

TABELA 6.2.2.14 PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS NOSSOS RESULTADOS DO PRIMÁRIO E GINASIAL E OS DE BRAGA (1977) PROCESSOS

Duplo (pãozinho ) (pãezinhos) -l e -ão (possível ) (possíveis) (garotão ) (garotões) -R (morador ) (moradores) -S (melhor ) (melhores) Regular (problema ) (problemas)

FALANTES Primário

Ginasial

1º grau (BRAGA, 1977)

22 = 88% 25 0,76

24 = 92% 26 0,82

3 = 75% 4 0,95

F.

52 = 70% 74

79 = 86% 92

11 = 22% 51

P.

0,51

0,54

0,42

F.

77 = 82% 94 0,59

74 = 89% 83 0,60

20 = 25% 79 0,54

87 = 78% 112 0,56

68 = 83% 82 0,42

2175 = 60% 3598 0,15

2360 = 71% 3330 0,15

F. P.

P. F. P. F. P.

5 = 3% 145 0,08 1871 = 56% 3326 0,44

A diferença de comportamento mais forte entre os nossos resultados e os de Braga, ainda não discutida, é, portanto, a que se refere à inversão das probabilidades associadas aos itens terminados em -S e os de plural regular. Esta mesma inversão pode ser observada nos falantes do segundo grau de Braga (1977) e nos "universitários"51 de Scherre (1978), conforme se pode observar pelos resultados da tabela 6.2.2.15.

108

TABELA 6.2.2.15 PROCESSOS E ESCOLARIZAÇÃO: COMPARAÇÃO ENTRE OS NOSSOS RESULTADOS DO COLEGIAL E OS DE BRAGA (1977) E SCHERRE (1978) PROCESSOS

FALANTES Colegial

Duplo (tijolo ) (tijólos)

F.

-l e -ão (móvel ) (móveis) (machão ) (machões) -R (bar ) (bares)

21 =100% 21 +

4 = 57% 7 0,50

F.

125 = 95% 131

116 = 95% 122

66 = 79% 83

P.

0,73

0,85

0,76

F.

85 = 94% 90 0,69

76 = 88% 86 0,57

51 = 61% 83 0,62

64 = 90% 71 0,45

80 = 52% 154 0,18

27 = 17% 158 0,18

2531 = 81% 3123 0,17

2705 = 80% 3365 0,39

2192 = 70% 3138 0,46

P.

Regular (irmão ) (irmãos)

2º grau (BRAGA, 1977)

17 =100% 17 +

P.

-S (mês ) (meses)

Universitários (SCHERRE, 1978)

F. P. F. P.

Se não fosse a inversão apontada acima, a escala da saliência nos falantes de maior nível de escolarização seria praticamente perfeita. A escala da saliência é também um pouco perturbada no fator plural duplo dos mineiros do segundo grau. Acreditamos que a discrepância com relação ao plural duplo e a inversão das probabilidades associadas aos itens em -S e aos regulares nos falantes mineiros têm a sua explicação no fato de Braga ter considerado formas do tipo mese como singulares, o que não explica, todavia, a inversão no caso dos "universitários" cariocas, em que tal fato não

109

ocorreu. Scherre é bastante clara a este respeito. Ela codificou todas estas formas como plurais (cf. 1978, p.68). Numa tentativa de entender melhor a posição dos itens terminados em -S na escala da saliência, decidimos verificar a distribuição das formas plurais não padrão nos diversos fatores da variável Processos, para então reanalisarmos nossos dados na direção da análise

de Braga, embora

saibamos que isto não esclareça a inversão dos resultados de Scherre. Temos, no quadro 6.2.2.16, a distribuição completa dos itens não regulares em função do tipo de marca encontrada. As marcas apresentadas neste quadro são de três tipos: padrão (meses); não padrão (mese) e com neutralização (meses são). Através da distribuição dos dados no quadro 6.2.2.16,

a seguir,

podemos ver que o número de formas não padrão do tipo mese é significativamente alto: 40% contra 45% de formas padrão (meses). Este número também é bastante alto nos plurais duplo: há 24% de formas não padrão (óvo) e 71% de formas padrão (óvos). Estes percentuais justificam a reanálise. A diferença entre os totais de aplicação de todos os não regulares, 789 no quadro 6.2.2.16 e 775 nas tabelas,

ocorre porque, no quadro

6.2.2.16, incluem-se também os dados categóricos do tipo determinada discussões.

110

QUADRO 6.2.2.16 DISTRIBUIÇÃO DAS MARCAS DE PLURAL NOS ITENS NÃO REGULARES PROCESSOS

MARCA PADRÃO

MARCA NÃO PADRÃO

MARCA COM NEUTR.

TOTAL

Duplo (novo/nóvos)

47(71%)

16(24%)

3( 5%)

66

-l (casal/casais)

71(85%)

7( 8%)

5( 6%)

83

-ão (leitão/leitões)

154(87%)

10( 6%)

13( 7%)

177

-R (cor/cores)

194(81%)

14( 6%)

30(13%)

238

-S (país/países)

102(45%)

89(40%)

29(13%)

220

TOTAL

568(72%)

136(17%)

80(10%)

784

A reanálise feita, considerando formas plurais não padrão como ausência de concordância, não significa mudança de posição frente aos dados. Continuamos a acatar tais formas como plurais, mas não temos como reanalisar os dados de Braga (1977), para tornar seus resultados comparáveis aos nossos; porém, temos condições de fazer os nossos comparáveis aos seus e depois podemos inverter o raciocínio. O nosso objetivo aqui é apenas o de saber qual seria a "verdadeira" posição da categoria

constituída pelos itens

em -S, assim como já

verificamos, através das idéias de Guy (1981a), a necessidade da colocação dos itens em -l e em -ão em dois fatores separados, pelo menos para os falantes do primário e do ginasial.

111

Na tabela 6.2.2.17, temos os resultados da reanálise feita focalizando apenas os três fatores diretamente envolvidos: plural duplo, itens terminados em -S e plural regular. Em primeiro plano, repetimos os resultados da análise que vimos apresentando, em que a forma padrão e a não padrão são consideradas presença de concordância, e, em segundo plano, colocamos os resultados da reanálise dos dados conforme Braga (1977), na qual se considera presença da concordância apenas a forma padrão e, como ausência, a forma não padrão e a forma não marcada. É importante observar ainda que as formas com neutralização (meses são) foram desconsideradas nesta reanálise. Além disso, considerou-se a separação entre os itens terminados em -l e em -ão e incluiu-se a variável Tonicidade, ou seja, esta reanálise contém o mesmo número de variáveis e o mesmo número de fatores da análise que foi apresentada nas páginas 68-69. É importante observar novamente que os resultados desta etapa envolvem todos os dados dos falantes adultos. Os números apresentados abaixo para a primeira alternativa de análise diferem, portanto, ligeiramente dos que se encontram na tabela 6.2.2.6, a qual envolve apenas os substantivos, adjetivos e categorias substantivadas.

112

TABELA 6.2.2.17 SOBRE A ANÁLISE DA CONCORDÂNCIA TIPOS DE APLICAÇÃO

FALANTES

PROCESSOS Duplo

Padrão+não padrão versus não aplicação

Padrão versus não padrão + não aplicação

-S

Regular

Primário

22=88% 25 0,85

87=78% 112 0,49

2175=60% 3598 0,24

Ginasial

24=92% 26 0,90

68=83% 82 0,26

2360=75% 3330 0,23

Colegial

17=100% 17 +.

64=90% 71 0,33

2531=81% 3123 0,25

Primário

13=52% 25 0,66

31=32% 97 0,22

2175=60% 3598 0,48

Ginasial

16=64% 25 0,64

36=49% 74 0,15

2360=71% 3330 0,49

Colegial

15=100% 15 +.

35=56% 63 0,16

2531=81% 3123 0,48

Os resultados da tabela 6.2.2.17 mostram-se perfeitamente dentro do esperado: diminui-se a influência do plural duplo e inverte-se a posição dos outros dois fatores na escala da saliência. Os itens terminados em -S passam a ocupar, portanto, a base da hierarquia. Invertendo-se agora as conclusões acima, poderíamos esperar (1) que o fator plural duplo em Braga (1977)

apresentasse

probabilidade

alta

de

aplicação

da

113

regra e (2) que a base da hierarquia fosse ocupada pelos itens de plural regular, se a sua codificação fosse igual à nossa. Dois aspectos envolvendo os itens em -S ainda assim não se explicam: (1) o fato de serem bem menos marcados nos dados dos falantes do primeiro grau apresentados por Braga (1977), mesmo mantendo-se a hierarquia (cf. Tabela 6.2.2.14, p.107); (2) o fato de apresentarem-se na base da hierarquia nos dados dos falantes escolarizados apresentados por Scherre (1978), invertendo realmente a sua posição com relação aos itens regulares ( ver tabela 6.2.2.15, p.108). A única hipótese que temos em mãos para conjecturar sobre estas questões diz respeito a certas particularidades da formação de plural envolvendo os itens terminados em -S. É comum se afirmar que "os nomes paroxítonos (...) terminados em s (ou em x)" (ROCHA LIMA, 1973, p.74) do tipo alferes, ourives e pires não possuem plural morfológico (cf., também, BECHARA, 1972, p.79). Todavia, segundo Pereira (1949), tais itens já tiveram as formas plurais alfereses, ouriveses e pireses, respectivamente (cf. p.94). Com relação aos itens lexicais oxítonos em -S, a afirmação geral é que eles se pluralizam normalmente: gás/gases; português/portugueses; luz/luzes; giz/gizes (cf. ROCHA LIMA, p.75 e BECHARA, p.77). Bechara (1972) afirma ainda que "os nomes das letras vão normalmente ao plural", exemplificando com os efes, os erres e os is (p.80), mas afirma, por outro lado, que xis é invariável, ocorrendo, portanto, os xis, bem como cais e cós (cf. BECHARA, 1972, p.72 e, também, ROCHA LIMA, 1973, p.79). Segundo nossa intuição, itens lexicais como giz, nariz, gravidez, avidez, morbidez, insensatez e lilás

dificilmente seriam susceptíveis de

114

pluralização. Nos nossos dados, ocorre apenas gravidez, dentre a lista feita acima, sem plural morfológico (as minhas gravidez). Levantam-se então as seguintes questões: 1) Por que não se pluraliza xis se é normal pluralizar efe, por exemplo? 2) Por que não se pluralizam formas como cais, cós se são palavras que se referem a elementos concretos e contáveis, normalmente pluralizáveis? 3) Por que achamos que não se pluralizam giz e nariz se ambos são também elementos concretos e contáveis? Para o segundo caso, poder-seia dizer que se tem apenas um nariz e por isto ficaria estranho pluralizar o item nariz. Mas como atribuir esta interpretação à palavra giz? 4) Por que consideramos estranha a idéia de se pluralizarem palavras como gravidez, avidez, insensatez etc? Poder-se-ia ser tentado a afirmar que estas palavras são abstratas e, portanto, menos susceptíveis de pluralização. Esta colocação carece de fundamento,

pois pluralizam-se

facilmente palavras tão abstratas quanto as acima relacionadas: obrigações, privações,

problemas,

asneiras,

vantagens,

mentiras,

possibilidades,

descobertas, conceitos etc., embora não descartemos a hipótese de que este traço associado aos itens derivados terminados em -S iniba mais ainda a sua pluralização morfológica (ver item 6.2.6). 5) Por que parece estranha a pluralização do item lilás, que não partilha de nenhuma das possíveis particularidades dos outros itens acima? Nos nossos dados, os itens oxítonos em -S que ocorrem são basicamente os seguintes: vez, mês, país, raiz, rapaz, freguês, português,

115

holandês, feliz e gravidez. Embora não tenhamos feito estatísticas, certamente as ocorrências concentram-se em mês e vez, mesmo excluindo, neste segundo caso, as construções às vezes. Observa-se, portanto, que o item lexical terminado em -S é bastante peculiar e merece, para o futuro, um estudo bastante apurado para se verificar se muitos dos oxítonos realmente não se pluralizam ou se este fato se limita a uma classe morfológica específica de itens lexicais ou se há um traço semântico comum a todos os substantivos menos susceptíveis de pluralização. Antes de concluirmos este tópico,

vamos discutir a questão

relacionada à queda do -S em fronteira de morfema com base nos dados que estamos analisando e vamos fazer algumas reflexões adicionais sobre análises alternativas envolvendo Processos e Tonicidade.

6.2.2.7 - Sobre a fronteira de morfema Em 1980a, Poplack já apresentava resultados percentuais que evidenciavam que o cancelamento do -S no Espanhol de Porto Rico era mais freqüente em formas bimorfêmicas do que em formas monomorfêmicas, fornecendo evidência contrária à hipótese funcionalista de Kiparsky (1972), a qual estabelece que a informação semântica relevante tende a ser retida na estrutura de superfície (cf. POPLACK, 1980a, p.57-8).

116

Em 1980b, Poplack reitera a colocação acima, através de um número maior de dados referentes ao cancelamento do -S e através da análise da queda da nasal final (cf. POPLACK, 1980b, p.373). Em 1981, Poplack afirma que o cancelamento da nasal no Espanhol ocorre mais em verbos regulares, recolocando que esta conclusão vai contra a hipótese funcionalista de Kiparsky, uma vez que "(...) mais informação corre o risco de ser perdida neste contexto."(p.65).52 Observa também que um efeito idêntico foi encontrado em diversos estudos do Português brasileiro (Lemle e Naro 1977, Guy e Braga 1976, Votre 1978) e que Naro descreve em termos de saliência fônica. (POPLACK, 1981, p.65)53

Guy (1981a) sugere que a regra de cancelamento do -S no Português popular do Brasil é inibida pela presença de fronteira de morfema, num processo semelhante ao encontrado por outras regras de cancelamento de segmentos do tipo -t, -d finais em Inglês. Sugere ainda que "(...) este efeito inibidor ocorre somente onde a estrutura e a função de morfema coincidem", (p.165)54 o que explica o fato de a queda da nasal em Português não ser regida por restrições funcionais: neste caso, a função de morfema não é exercida por um segmento, mas por um traço suprassegmental - a nasalização da vogal (cf. p.164-5). Todavia, Guy não codificou a queda de -S considerando as formas monomorfêmicas em oposição às bimorfêmicas. Ele chega à conclusão acima, sobre o -S, através de um raciocínio inferencial, alegando problemas no levantamento dos dados (cf. p.164). Neste estudo, não analisamos a queda do -S final sem função morfêmica. O nosso centro de interesse é a concordância de número entre

117

os elementos do SN. como já vimos, consideramos as formas pósto, religiõe, comerciai, pescadore e mese como plurais, embora não haja a presença do -S final. Considerando os dados desta forma, não podemos afirmar que um índice menor de marcas em itens do tipo livro seja contrafuncional, pois a forma singular religião tem o mesmo risco de perder a informação de plural ao ocorrer dentro de um SN plural. Para testarmos a hipótese funcionalista do tipo acima aludido com base nos dados de que dispomos, retiramos do seu conjunto todas as ocorrências de itens não regulares na sua forma singular (posto, religião, comercial, pescador e mês) e consideramos não aplicação da concordância a ausência do -S também nas formas plurais não padrão (pósto, religiõe, comerciai, pescadore e mese). É importante observar também que todos os elementos nominais analisados estão inseridos dentro de um SN com pelo menos uma marca de plural, encontrando-se, portanto, em igualdade de condições. Pela hipótese funcionalista kiparskiana, espera-se que o -S final ocorra mais em palavras do tipo livro do que nas demais. No primeiro caso, ele é o morfema de plural, em fronteira de morfema; e, nos demais casos, ele é apenas parte do morfema de plural, sem, portanto, estar em fronteira de morfema. Segundo Kiparsky (1972), como já bem o sabemos, as Condições de Distintividade estabelecem que há uma tendência para a informação semanticamente relevante ser retida na estrutura superficial (cf., novamente, p.195). Os resultados desta etapa de análise estão na tabela 6.2.2.18, a seguir. Nesta fase do trabalho, não fizemos análises só com os substan-

118

tivos, adjetivos e categorias substantivadas, pois, como já sabemos, as probabilidades quase não seriam alteradas. Além disso, esta etapa envolve todas as demais variáveis assinaladas: Relação entre classes nucleares e não nucleares, Marcas em função da posição, Contexto fonológico seguinte, Função resumitiva e todas as variáveis sociais. Á

exceção

dos

itens

de

plural

duplo,

que

apresentam-se

categoricamente marcados nos dados dos falantes do colegial, os valores probabilísticos associados a todos os fatores de todos os falantes relacionados na tabela 6.2.2.18 são extremamente uniformes, indicando o seguinte: 1) Os itens terminados em -l, em -ão e em -R favorecem a presença do -S final. 2) Os itens regulares e os terminados em -S desfavorecem a presença do -S final, sendo que estes últimos apresentam as mais baixas probabilidades dentre todos. 3) Os itens de plural duplo favorecem mais a inserção de marcas de plural do que os itens regulares e menos um pouco do que os itens terminados em -l, em -ão e em -R. Os resultados falam por si. A inserção do -S final não tem fortes ligações com a fronteira de morfema. Os itens regulares, ao contrário do que se esperava, são o segundo fator na escala de desfavorecimento. Por outro lado, os itens de plural duplo, que apresentam nitidamente a possibilidade de duas marcas distintas de plural em pontos também distintos, favorecem mais a inserção de -S sistematicamente.

119

TABELA 6.2.2.18 PROCESSOS: SOBRE A FRONTEIRA DE MORFEMA PROCESSOS

Duplo (novo ) (nóvos)

F.

-l (casal ) (casais)

F.

-ão (leitão ) (leitões)

F.

-R (cor ) (cores)

F.

-S (país ) (países) Regular (o ) (os)

P.

P.

P.

P. F. P. F. P.

FALANTES Todos

Primário

Ginasial

Colegial

47 = 75% 63 0,54

13 = 59% 22 0,52

16 = 70% 23 0,45

15 = 100% 15 +

71 = 91% 78 0,70

16 = 84% 19 0,67

16 = 89% 18 0,55

39 = 95% 41 0,83

154 = 94% 164 0,69

28 = 90% 31 0,72

56 = 98% 57 0,86

68 = 92% 74 0,58

194 = 93% 208 0,70

62 = 91% 68 0,72

65 = 97% 67 0,79

66 = 92% 72 0,64

102 = 53% 191 0,13

31 = 42% 73 0,15

36 = 59% 61 0,10

35 = 72% 57 0,13

7182 = 71% 10167 0,31

2175 = 60% 3598 0,28

2397 = 71% 3367 0,28

2531 = 81% 3123 0,35

A hipótese funcionalista do tipo kiparskiana apenas se insinua com relação à colocação do plural duplo na hierarquia da saliência, nos falantes do primário e ginasial, com relação aos itens terminados em -l e em -R principalmente, mas cai por terra se comparada com os regulares.

120

Por detrás das oposições maiores, o que está em jogo é o Princípio da Saliência fônica, por enquanto visto na sua primeira dimensão: os itens que apresentam maior diferenciação de material fônico na relação singular/plural são os que mais favorecem a inserção de -S, por serem os mais perceptíveis. Os itens terminados em -S (mês/meses) encontram-se na base da hierarquia, por estarem envolvidos num processo haplológico que consiste em eliminar sílabas ou palavras iguais ou parecidas (cf. 1976, p.162; CÂMARA JR., 1977, p.134; BRAGA & SCHERRE, 1976, p.474 e SCHERRE, 1978,

p.

101-2;

ver,

também,

item

6.2.4.2)

e

por

apresentarem

comportamento bastante especial como discutimos nas páginas anteriores. A influência da Tonicidade vem corroborar a atuação do Princípio da Saliência, pois os itens oxítonos favorecem mais a inserção de -S do que os paroxítonos para quaisquer falantes, conforme se pode ver pelos resultados da tabela 6.2.2.19.

121

TABELA 6.2.2.19 TONICIDADE: SOBRE A FRONTEIRA DE MORFEMA TONICIDADE

FALANTES Todos

Oxítono e monossílabo tônico (país ) (leitão) (meu, pé) Paroxítono e monossílabo átono (caro ) (dólar) (os/as) Proparoxítono (fábrica ) (indígena) (médico )

F.

P.

F.

895 = 83% 1072

0,66

6771 = 70% 9641

Primário

Ginasial

Colegial

261 = 76% 346

304 = 86% 360

292 = 77% 336

0,68

0,69

0,56

2049 = 60% 3417

2252 = 71% 3179

2409 = 81% 2983

P.

0,39

0,43

0,38

0,37

F.

84 = 53% 159

15 = 31% 48

30 = 48% 62

38 = 79% 48

P.

0,44

0,38

0,42

0,57

Os proparoxítonos se comportam como itens não marcados para os falantes do primário e do ginasial e como marcados para os do colegial, conforme também já vimos no item 6.2.2.4. Retomando as colocações de Kiparsky (1972), podemos ver que ele classifica o número como uma categoria forte, ao lado do gênero e do tempo. Ao fazer isto, ele se baseia em línguas que não têm concordância, como o Inglês. Todavia, dentro de sua proposta, o número em Português deve ser considerado uma categoria fraca. Como ele próprio coloca, "(...) categorias fracas são aquelas que registram informação que é relativamente redundante." (p.206)55 Generalizando, dentro de seu esquema, qualquer

122

categoria que envolva concordância deve se classificar como uma categoria fraca, e não apenas a marca de pessoa (cf. p.206). Consideramos, ainda mais, que esta classificação, que se supõe universal, deve ser repensada pois, como vamos mostrar no item 6.2.3, a existência de uma marca no primeiro elemento do SN não é condição suficiente para que as demais caiam. Em SNs de mais de dois elementos, se houver uma marca também no segundo elemento, haverá mais chances de ocorrer uma outra marca a seguir e, se à primeira marca se seguir um zero, as chances de aparecer um zero seguinte são quase categóricas. Os nossos resultados apontam para o fato de que o cancelamento ou a inserção de categorias lingüísticas não é necessariamente regido por princípios funcionalistas do tipo estabelecido por Kiparsky. É importante salientar que o comportamento do -S em Português não constitui um caso particular. O cancelamento do -R também não é influenciado pela fronteira de morfema (cf. VOTRE, 1978, p.44-7;, 64-7 e 105-7 e CALLOU, 1979, p.148). Assim, a hipótese de Guy

sobre o cancelamento do -S e sobre o

cancelamento da nasal em Português não se sustenta. Em verdade, a interpretação para a ausência do efeito da fronteira de morfema sobre a nasal em Português não se deve ao fato de falta de correspondência entre estrutura e função. O seu cancelamento ocorre, em princípio, porque em português, uma língua que tem concordância, permite-se o cancelamento de consoantes finais, mesmo que elas estejam exercendo algum papel morfológico (cf., novamente, GUY, 1981a, p.164, cf., também, VOTRE, 1978, p.105-7; p. 128 e 195-7 e NARO, 1980, p.166).

123

6.2.2.8 - Reflexões adicionais sobre a relação entre Processos e Tonicidade Acabamos de ver que Processos e Tonicidade são as duas dimensões do eixo da saliência fônica que exercem influência sobre a concordância de número entre os elementos do sintagma nominal. Com relação a Processos especificamente, vimos que todos os nossos falantes apresentam uma oposição entre os itens de plural duplo e os terminados em -l, favorecedores da concordância; e os itens regulares, desfavorecedores. Os itens em -ão já não apresentam posição tão firme na escala da saliência. Nos dados dos falantes do colegial, o seu comportamento é igual ao dos terminados em -l, com os quais apresentam similaridade em termos de formação do plural. No caso dos grupos de falantes do primário e do ginasial, além de apresentarem menor probabilidade de concordância do que itens em -l, estão abaixo da probabilidade associada aos itens em -R. Entretanto, seu comportamento nos nossos dados jamais se iguala ao dos regulares que são, sistematicamente, os menos marcados. É sabido por todos que os itens terminados em -ão, diferentemente dos itens terminados em -l, são categorias também consideradas flutuantes em relação à formação de plural. A nossa tradição gramatical afirma que a formação de plural dos itens terminados em -ão pode se dar de três formas: em -ãos (irmão/irmãos - formação regular); em -ães (capitão/capitães) e -ões (balão/balões - o caso mais comum). Registra-se, inclusive, mais de uma possibilidade para uma só palavra (anciãos,

124

anciões, anciães) (cf. ROCHA LIMA, 1983, p.76). Mesmo admitindo que isto possa estar influenciando o comportamento diferenciado desta categoria, gostaríamos de ressaltar que, nos nossos 200 dados deste tipo para os falantes adultos, só encontramos um dado de plural em -ães (alemães) e nenhum caso de plural em -ão no sentido de regularização (verão/verãos, por exemplo). Em todos os dados que já analisamos, incluindo os de 1978, detectamos apenas um caso de regularização (cordãos): ou encontramos sempre a forma totalmente plural ou totalmente singular. É interessante observar ainda que os poucos aumentativos em -ão que ocorreram, precisamente 11 casos, tenderam a se apresentar na forma singular, (amigão, cachorrão, brabão, dentão etc.) e não na sua forma plural irregular (amigões, cachorrões, brabões, dentões) e muito menos na forma regular(amigãos, cachorrãos, brabãos, dentãos). Acreditamos que, em tais situações, os falantes devem evitar o plural por causa da incerteza.56 As duas formas plurais cedem a vez à forma singular, apesar da saliência. Esta é uma hipótese bastante sedutora e que poderia se aplicar a todos os casos de ausência de marca nos nomes irregulares em -ão. Podemos imaginar que esteja ocorrendo um processo de regularização, e, uma vez que os itens são regularizados, eles são pouco marcados, como todo e qualquer regular. O interessante desta hipótese reside no fato de podermos verificar o comportamento de casos do tipo irmão, mão, órgão e órfão que já fazem o plural de forma regular. Se a hipótese agora levantada estiver correta, é de se esperar que estes casos apresentem menos concordância do que os próprios regulares que não terminam em -ão.

125

Esquadrinhando nossos dados, verificamos, todavia, que há apenas 38 casos deste tipo, dentre os quais 36 são oxítonos e dois paroxítonos. Mesmo diante do número exíguo de dados, efetuamos uma etapa de análise em função dos anos de escolarização dos falantes e obtivemos os resultados relacionados na tabela 6.2.2.20, para os falantes do primário e do ginasial. TABELA 6.2.2.20 SOBRE OS REGULARES EM -ÃO PROCESSOS

FALANTES Primário Apl./Total

%

Ginasial Prob.

Apl./Total

%

Prob.

Duplo (famoso ) (famósos)

22/25

= 88

0,90

24/26

= 92

0,91

-l (casal ) (casais)

21/30

= 70

0,56

18/19

= 95

0,76

-R (pescador ) (pescadores)

77/94

= 82

0,57

74/83

= 89

0,51

-S (rapaz ) (rapazes)

87/112

= 77

0,53

68/82

= 83

0,31

-ão (nação) (nações)

31/43

= 72

0,45

61/73

= 84

0,37

Regular (salário) (salários)

648/1973

= 33

0,35

979/1859

= 53

0,30

5/17

= 17

0,11

13/17

= 76

0,20

Regular em -ão (irmão ) (irmãos)

126

Pelos resultados da tabela acima, é possível vermos que os regulares em -ão situam-se abaixo dos demais regulares na escala de concordância, o que realmente aponta para a existência de um processo de regularização dos nomes em -ão dos falantes com menos escolarização. Os dados dos falantes do colegial são poucos - apenas quatro - mas mesmo assim apresentam-se com todas as marcas: o que é no mínimo consistente com o fato de os falantes do colegial apresentarem uma diferença bem

mais

marcante entre os itens em -ão e os itens regulares, como já tivemos oportunidade de ver. Por causa do número de dados, pesquisas futuras podem trazer mais evidências para a hipótese que acabamos de estabelecer. Os itens terminados em -S, de forma geral, tendem a se colocar na hierarquia entre os itens em -R e os regulares, embora este fato deixe de ocorrer nos universitários cariocas. Já discutimos exaustivamente o comportamento desta categoria. Em

suma,

dentre

as

seis

categorias

estabelecidas,

quatro

apresentam comportamento regular e duas apresentam comportamento flutuante. Resta, entretanto, saber se as diferenças entre as categorias intermediárias são estatisticamente relevantes. Para testarmos a significância estatística das diferenças entre os fatores intermediários da variável Processos, efetuamos uma etapa de análise com apenas os quatro fatores em questão, os quais são: itens em -l; em -ão; em -R e em -S. Este teste foi feito inicialmente com todos os dados de todos os falantes e, a seguir, com os dados dos falantes subdivididos em termos dos anos de escolarização. Os resultados são sistemáticos: não há significância estatística entre os quatro fatores em questão, pois a variável

127

Processos, com somente estas quatro categorias, não é selecionada em nenhuma das etapas de análise. As diferenças existentes entre estes quatro fatores podem nos apresentar indícios lingüísticos interessantes, mas sem validade estatística a nível de 0,05. Por outro lado, a análise dos itens regulares isoladamente apresentou seleção da variável Tonicidade para todos os falantes e para os subagrupamentos de falantes em função do grau de escolarização, embora não tenha sido colocada entre as três primeiras variáveis selecionadas. Diante disto, decidimos testar se as diferenças entre os itens regulares e os demais itens desta variável, incluindo-se os de plural duplo, seriam estatisticamente significativas. Vamos apresentar os resultados destes testes em tabelas separadas, cada uma delas mostrando os resultados para as variáveis Processos e Tonicidade. Focalizaremos primeiro os resultados relativos aos três fatores não regulares que não são flutuantes e, após, os resultados dos flutuantes. As três tabelas a seguir, 6.2.2.21, 6.2.2.22 e 6.2.2.23, contêm, portanto, os resultados relativos aos regulares versus itens de plural duplo, regulares versus itens terminados em -l e regulares versus itens terminados em -R, nesta ordem. Em cada uma destas tabelas, apresentamos também os resultados relativos à variável Tonicidade.

128

TABELA 6.2.2.21 RELAÇÃO ENTRE ITENS REGULARES E ITENS DUPLOS PROCESSOS

FALANTES Todos

Primário

Ginasial

Colegial

653= 33% 1986 0,20

992= 53% 1876 0,17

1158= 68% 1701

Regular (filho ) (filhos)

F. P.

2819= 50% 5583 0,19

Duplo

F.

63= 93%

22= 88%

24= 92%

P.

68 0,81

25 0,80

26 0,83

17 +

139= 73% 190 0,66

39= 57% 68 0,67

53= 78% 68 0,67

44= 86% 51 0,60

2662= 50% 5305 0,39

621= 33% 1893 0,43

935= 53% 1774 0,39

1076= 67% 1602 0,35

81= 52% 156 0,44

15= 31% 48 0,39

28= 47% 60 0,44

38= 79% 48 0,55

17=100 %

(bondoso ) (bondósos) TONICIDADE Oxítono e monossílabo tônico

F. P.

Paroxítono

F. P.

Proparoxítono

F. P.

129

TABELA 6.2.2.22 RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -L PROCESSOS

FALANTES

Regular (filho ) (filhos)

F.

-l (principal ) (principais)

F.

P.

P.

Todos

Primário

Ginasial

Colegial

2819= 50% 5583 0,33

653= 33% 1980 0,35

992= 53% 1876 0,25

1158= 68% 1701 0,31

80= 86% 93 0,67

21= 70% 30 0,65

18= 95% 19 0,75

41= 93% 44 0,68

201= 77% 262 0,66

58= 61% 95 0,67

67= 81% 83 0,67

75= 90% 83 0,62

2617= 50% 5258 0,39

601= 32% 1867 0,44

915= 52% 1752 0,38

1086= 67% 1614 0,34

81= 52% 156 0,44

15= 31% 48 0,39

28= 47% 60 0,44

38= 79% 48 0,54

TONICIDADE Oxítono e monossílabo tônico

F. P.

Paroxítono

F. P.

Proparoxítono

F. P.

130

TABELA 6.2.2.23 RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -R PROCESSOS

FALANTES Todos

Regular (filho ) (filhos)

F.

-R (bar ) (bares)

F.

P.

P.

Primário

Ginasial

Colegial

2819= 50% 5583 0,36

653= 33% 1984 0,35

992= 53% 1876 0,38

1158= 68% 1701 0,30

237= 88% 268 0,73

77= 82% 94 0,65

74= 89% 83 0,62

85= 94% 90 0,70

365= 82% 445 0,66

111= 71% 161 0,67

125= 85% 147 0,69

123= 91% 135 0,57

2610= 50% 5250 0,39

600= 32% 1859 0,44

913= 52% 1752 0,37

1082= 67% 1608 0,36

81= 52% 156 0,45

15= 31% 48 0,39

28= 47% 60 0,43

38= 79% 48 0,57

TONICIDADE Oxítono e monossílabo tônico

F. P.

Paroxítono

F. P.

Proparoxítono

F. P.

A oposição entre os regulares e os outros três tipos de processos em questão é indubitável, pois ocorre para todos os falantes conforme nos mostram os resultados. Igualmente, a influência da Tonicidade se faz presente em cada um dos tipos de relação apresentada. É importante salientar que ocorre a seleção tanto de Processos quanto de Tonicidade, na relação regular versus não regular, para estes três casos, ou seja,

isto

ocorre quando se tem nos não regulares a oposição oxítono/paroxítono, mesmo com poucos dados nas categorias dos paroxítonos. Apenas os falantes do colegial deixam de apresentar variação nos duplos, o que é perfeitamente consistente dentro da linha que verifica que há uma leve correlação entre Processos e anos de escolarização dos falantes.

131

É interessante ainda observar que (1) na relação regular/duplo, a variável Processos é selecionada antes da variável Tonicidade; (2) na relação regular/-l, quem é selecionada em primeiro plano é a variável Tonicidade e (3), na relação regular/-R, a variável Tonicidade é selecionada em primeiro plano para os falantes do primário e do ginasial, enquanto para os falantes do colegial quem é selecionada antes é a variável Processos. Verifica-se assim uma alternância constante entre o peso relativo mais forte da variável Processos ou da variável Tonicidade. Neste ponto, creditamos este fato a uma simples distribuição dos dados, que ora está mais favorável para Processos, ora mais favorável para Tonicidade.

Os resultados da relação entre regular/-ão e regular/-S são apresentados nas duas tabelas 6.2.2.24 e 6.2.2.25, que se seguem.

132

TABELA 6.2.2.24 RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -ÃO PROCESSOS

FALANTES Todos

Regular (filho ) (filhos)

-ão (patrão ) (patrões)

F. P.

F. P.

Primário

Ginasial

Colegial

2819= 50% 5583 0,39

653= 33% 1980 (0,43)

992= 53% 1876 (0,43)

1158= 68% 1701 0,29

173= 86% 200 0,61

31= 72% 43 (0,57)

61= 84% 73 (0,57)

81= 96% 84 0,71

307= 80% 385 0,66

69= 63% 110 0,77

112= 81% 139 0,71

125= 92% 135 0,62

2604= 50% 5242 0,39

600= 32% 1865 0,41

913= 52% 1750 0,36

1076= 67% 1602 0,35

81= 52% 156 0,45

15= 31% 48 0,37

28= 47% 60 0,41

38= 79% 48 0,53

TONICIDADE Oxítono e monossílabo tônico

F. P.

Paroxítono

F. P.

Proparoxítono

F. P.

133

TABELA 6.2.2.25 RELAÇÃO ENTRE ITENS REGULARES E ITENS EM -S PROCESSOS

FALANTES Todos

Regular (filho ) (filhos)

F.

-S (rapaz ) (rapazes)

F.

P.

P.

Primário

Ginasial

Colegial

2819= 50% 5583 0,41

653= 33% 1980 0,37

992= 53% 1876 (0,47)

1158= 68% 1701 (0,42)

219= 79% 264 0,66

87= 77% 112 0,63

61= 84% 73 (0,53)

64= 91% 70 (0,58)

353= 79% 449 0,66

125= 70% 179 0,67

119= 80% 148 0,69

108= 89% 121 0,65

2604= 50% 5242 0,39

600= 32% 1865 0,44

913= 52% 1750 0,38

1076= 67% 1602 0,33

81= 52% 156 0,45

15= 31% 48 0,40

28= 47% 60 0,42

38= 79% 48 0,52

TONICIDADE Oxítono e monossílabo tônico

F. P.

Paroxítono

F. P.

Proparoxítono

F. P.

Os dois fatores não regulares agora em evidência são aqueles que não apresentam uma oposição interna entre oxítonos e paroxítonos, pois todos eles são oxítonos. Tal enviesamento na distribuição dos dados vai se refletir na seleção das variáveis em jogo, refletindo assim o que é mais relevante nos dados de cada conjunto de falantes: se o Grau de diferenciação material fônica na relação singular/plural ou se a Tonicidade dos itens regulares.

No que diz respeito

à relação regular/-ão, para os

falantes do primário e do ginasial, apenas a Tonicidade é selecionada, embora Processos chegue à última etapa da análise mostrando diferenças na direção esperada. Somente para os falantes do colegial, as duas variáveis são

selecionadas

como

relevantes

do

ponto

de

vista

estatístico.

134

Se retirarmos o peso da variável Tonicidade, certamente Processos é selecionada com oposições marcantes: 0,31 x 0,69 para os falantes do primário e 0,30 x 0,70 para os do ginasial. Então parece que, para os falantes que apresentam indícios mais fortes do processo de regularização das formas em -ão, prevalece como mais relevante, no eixo da saliência fônica, a dimensão da Tonicidade, em detrimento de Processos. Ressalte-se, entretanto, que mesmo tendo sido selecionadas as duas variáveis em jogo para os falantes do colegial, a variável Tonicidade é selecionada antes da variável Processos. Com relação ao fator constituído pelos itens em -S, ocorre uma situação

parecida,

mas

quase

inversa

no

que

diz

respeito

aos

subagrupamentos de falantes. Ambas as variáveis são selecionadas para os falantes do primário, sendo a Tonicidade também selecionada em primeiro plano, o que derruba a hipótese levantada no parágrafo acima. Para os demais falantes, a variável Processos não é selecionada, embora também se mantenha um distanciamento probabilístico entre regular/-S na linha prevista. Se retirarmos novamente o efeito da variável Tonicidade, vamos ter também um oposição forte entre regular/-S para os falantes do ginasial(0,37 x 0,67) e para os do colegial (0,31 x 0,69). Já tivemos oportunidade de observar que a categoria dos itens em -S é a mais flutuante de todas por uma série de razões: (1) está envolvida num processo de haplologia sintática; (2) há itens terminados em -S que não são susceptíveis de se pluralizarem e (3) é a classe de itens que apresenta um maior número de formas não padrão. Constata-se mais uma vez um jogo constante entre Processos e Tonicidade.

135

6.2.2.9 - Conclusão

Após todas estas reflexões, temos certeza de que passamos a entender um pouco mais do funcionamento da saliência fônica na concordância de número entre os elementos do sintagma nominal. Na tentativa de refletir este entendimento, através de uma análise alternativa para a que considera Processos e Tonicidade como variáveis separadas, vamos alinhar uma série de motivos que nos levaram a esta análise. Considerando

1) que as diferenças existentes entre os itens não regulares intermediários, quer no que diz respeito à variável Processos quer com relação à variável Tonicidade, não são consideradas estatisticamente significativas, quando estes itens são analisados isoladamente; 2) que a variável Tonicidade é sistematicamente selecionada, junto ou não à variável Processos, sempre que os itens regulares estão em jogo em qualquer contraposição com os outros fatores, isolados ou agrupados; 3) que a variável Tonicidade é selecionada quando os itens regulares são analisados separadamente; 4) que decorre dos itens 2 e 3 que a oposição entre os fatores da variável Tonicidade é estatisticamente relevante apenas para os itens regulares, como reflexo da sua influência sobre a queda do -S final; 5) que também decorre dos considerandos acima que a tonicidade dos itens não regulares e a sua diferenciação material fônica na relação singular/plural definem a sua saliência;

136

6) que uma análise que codifica duas variáveis tão superpostas, quanto Processos e Tonicidade o são, não é desejável do ponto de vista lingüístico e nem do ponto de vista estatístico; 7) que o número de dados dos paroxítonos dos itens em -R e em -l e dos oxítonos dos itens de plural duplo é excessivamente pequeno, propomos o seguinte: A) Fazer uma análise alternativa que considere uma só variável, advinda da junção de Processos e Tonicidade, ignorando a relação oxítono e paroxítono para os itens não regulares e mantendo-a, acrescida do fator proparoxítono, para os itens regulares. Desta forma, a nova variável agora denominada de Saliência fônica conteria os fatores: 1) duplo (oxítono ou paroxítono); 2) -l (oxítono ou paroxítono); 3) -R (oxítono ou paroxítono); 4) -ão (oxítono); 5) -S (oxítono); 6) regular oxítono; 7) regular paroxítono e 8) regular proparoxítono. B) Comparar as duas análises alternativas, a fim de que se verifique qual delas é estatisticamente melhor, uma vez que a segunda reflete melhor a realidade dos fatos sob a perspectiva lingüística.

137

Fizemos a nova análise proposta. E como já fizéramos uma outra análise simplesmente eliminando a variável Tonicidade, a fim de verificarmos a influência da Tonicidade sobre Processos (ver tabelas 6.2.2.10 e 6.2.2.11), decidimos então comparar a relevância estatística das três possibilidades de análise para o eixo da saliência. São elas: Análise 1 - Processos e Tonicidade como duas variáveis separadas, com seis fatores na variável Processos e três na variável Tonicidade; Análise 2 - Processos com seis fatores sem a variável Tonicidade; Análise 3 - Processos e Tonicidade como uma só variável, contendo oito fatores. Para fazer o teste de significância estatística, utilizamos os testes de log likelihood na forma transcrita abaixo. Para testar a significância estatística ao longo destas linhas, nós necessitamos somente encontrar a diferença dos "logs" dos "likelihoods" para as duas análises, uma vez que duas vezes esta diferença se aproximaria da distribuição de um qui-quadrado se nenhum efeito resulta dos fatores adicionais do modelo mais complexo. O número de graus de liberdade envolvidos na distribuição é o número de fatores eliminados dos grupos - ou, se um grupo inteiro é eliminado, o número de fatores do grupo menos 1. (NARO, 1981a, p.73)57

Procedendo desta forma, verificamos que existe uma diferença estatística significativa entre a análise 1 e a análise 2, a nível de 0,001, a favor da análise 1. O log likelihood da análise 1 com dois grupos de fatores é mais próximo de zero do que o da análise 2 que tem apenas o grupo de seis fatores, uma vez que foi eliminado o de três. Este fato significa

138

que a Tonicidade não pode ser simplesmente abandonada. Todavia, as diferenças entre a análise 1 e a análise 3 não são estatisticamente significativas para todos os falantes, para os falantes do primário, do ginasial e do colegial. Tal situação nos diz, portanto, que, entre a análise 1 e a análise 3, devemos escolher a mais simples. A mais simples é exatamente a análise 3 que, além de transformar duas variáveis em uma só, contém um fator a menos do que a análise 1. Mostrando de outra forma, podemos ver que a análise 3 é mais simples do que a análise 1 pelo número de contextos que se podem formar nos dois casos: oito na análise 3 e 18 na análise 1 (para este último caso, seis x três fatores em duas variáveis distintas perfazem 18 contextos possíveis). Uma quarta análise alternativa seria a que apresentamos nas páginas 91-93, com o cruzamento de Processos e Tonicidade também para os itens não regulares (ver Tabelas 6.2.2.8 e 6.2.2.9). A nosso ver, esta seria a análise lingüística mais intuitiva. Todavia, a diferença entre ela e a análise 3 só é significativa a nível de 0,20. A não relevância estatística da análise 4 reflete que, no conjunto dos dados, a diferença estatística entre a oposição oxítono versus paroxítonos, para os não regulares, não é significativa. O número de dados para se estabelecer esta oposição é deveras pequeno, o que também inviabiliza análises feitas em termos de subagrupamentos de falantes. A análise 3 deve ser novamente preferida, por ser a mais simples do que a análise 4: esta contém dez fatores e aquela contém oito. Uma vez decidida

a questão, vamos apresentar os resultados

conforme a análise 3, na tabela 6.2.2.26.

139

TABELA 6.2.2.26 ANÁLISE FINAL DE PROCESSOS E TONICIDADE DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS DOS ADULTOS POR ESCOLARIZAÇÃO SALIÊNCIA FÔNICA

FALANTES Todos

Primário

Ginasial

Colegial

22= 88% 25 0,81

24= 92% 26 0,82

17=100% 17 +

Duplo (novo ) (nóvos)

F. P.

63= 93% 68 0,80

-l

F.

80= 86%

21= 70%

18= 95%

41= 93%

(casal ) (casais)

P.

93 0,69

30 0,64

19 0,85

44 0,68

237= 88% 268 0,65

77= 82% 94 0,67

74= 89% 83 0,64

85= 94% 90 0,71

173= 86% 200 0,59

31= 72% 43 0,56

61= 84% 73 0,51

81= 96% 84 0,77

219= 83% 265 0,56

87= 78% 113 0,64

68= 83% 82 0,44

64= 91% 70 0,51

134= 72% 185 0,38

38= 57% 67 0,38

51= 25% 66 0,38

44= 86% 51 0,36

F.

81= 52% 156

15= 31% 48

28= 47% 60

38= 79% 48

P.

0,21

0,16

0,19

0,32

F.

2604= 50% 5242 0,17

600= 32% 1875 0,19

913= 52% 1750 0,16

1076= 67% 1602 0,17

-R (cor ) (cores)

F. P.

-ão (dentão ) (dentões)

F.

-S (país ) (países)

F.

Regular oxítono e monossílabo tônico Regular proparoxítono

Regular paroxítono

P.

P. F. P.

P.

Os resultados acima nos permitem ver com mais clareza a oposição entre os diversos graus de saliência. Há uma oposição nítida entre as

140

probabilidades associadas dos três primeiros fatores do topo e aos três últimos da base da escala, para todos os falantes de qualquer nível de escolarização. Os três primeiros fatores favorecem nitidamente a concordância nominal e os três últimos desfavorecem-na. Verifica-se aí a forte influência da diferenciação material fônica na relação singular/plural. O que importa para a oposição entre as três primeiras e as três últimas categorias é a diferenciação material fônica na oposição singular/plural. Nos falantes do primário e colegial, constata-se inclusive uma suboposição entre o plural duplo e os itens em -l e em -R. As três últimas categorias, todas de plural regular, mostram novamente a oposição entre os oxítonos e os paroxítonos para todos os agrupamentos de falantes. Os proparoxítonos, exceto para os falantes do colegial, continuam a se comportar como os oxítonos. Praticamente tudo que dissemos acima já foi dito nas páginas anteriores. O formato de apresentação é, contudo, mais explícito. É na parte que diz respeito aos fatores flutuantes - os constituídos pelos itens terminados em ão e em -S - que isto se dá com precisão, chegando a trazer novidades nesta nova forma de se analisarem os dados. Existindo alguma aproximação entre o comportamento dos itens em -ão e dos regulares, ela não vai se dar

com qualquer regular, mas com os regulares oxítonos.

Mesmo assim, há uma distância considerável entre estes e aqueles. Entre os nomes em -ão e os regulares paroxítonos, há um distanciamento muito acentuado. Mesmo que esteja se processando a regularização dos itens em -ão,

ela

ainda

está

longe

de

se

completar.

Com

relação

141

aos itens em -S, verifica-se, também, que seu ponto de maior contato é com a subclasse dos regulares constituída pelos regulares oxítonos, e não com qualquer item regular. Mostramos então que não podemos reduzir a escala da saliência para a concordância nominal a uma oposição binária em termos de itens que terminam em consoante e itens que terminam em vogal, como o faz Guy (1981a), para qualquer falante do Português. Apontamos evidências de que a escala da saliência, não tão regular como supúnhamos, atua no funcionamento sincrônico de uma gramática. Algumas diferenças são constatadas em função dos anos de escolarização dos falantes. As mais evidentes são: (1) a ordem dos itens em -ão e em -S na escala da saliência e (2) a oposição entre os proparoxítonos e os demais regulares. Nos outros cinco

fatores,

a

influência

é

bastante

semelhante

para

os

três

subagrupamentos de falantes. Nos dados aqui estudados, não se constata, portanto, a Saliência fônica funcionando de forma muito diferente em função dos anos de escolarização do falante, conforme constatara Braga (1977) e mesmo Scherre (1978). Esta variável é realmente polêmica, permanecendo ainda em aberto o número de suas subcategorias e a sistematicidade da influência de algumas delas. O que não permanece em aberto é a existência de sua forte influência numa oposição não binária. A discussão a respeito de a concordância de número entre os elementos do SN estar em processo de mudança lingüística e de o Princípio da saliência ter alguma função neste processo

será levada a termo no

capítulo 8, onde apresentamos outros resultados em função de novos

142

subagrupamentos de falantes. No próximo item, vamos discutir a relação também polêmica entre três variáveis amplamente estudadas: Posição linear, Classe gramatical e Marcas precedentes.

6.2.3 - Três variáveis relacionadas: Posição linear, Classe gramatical e Marcas precedentes 6.2.3.1 - Introdução

A Posição linear que o elemento ocupa no SN, a sua Classe gramatical e a natureza das Marcas a ele precedentes têm sido consideradas como variáveis muito importantes para dar conta do fenômeno do cancelamento ou da inserção do -S final, especialmente quando este segmento é uma marca de plural. Todavia, estas três variáveis nunca foram consideradas separadas, numa mesma análise. Apenas Poplack (1980a) observa o efeito destas três variáveis através da (1) Classe gramatical e do (2) cruzamento entre Marcas precedentes e Posição. A grande maioria dos demais estudiosos privilegiaram a análise que considera apenas o efeito da Posição e Marcas precedentes como duas variáveis distintas, sem observar o efeito da Classe gramatical. Um dos estudiosos, Guy (1981b), chega a estabelecer um paralelo entre o efeito da Classe gramatical no Espanhol de Porto Rico e o efeito da Posição no Português do Brasil, sem, contudo, fazer menção ao cruzamento das restrições Marcas precedentes e Posição efetuado por Poplack (1980a), na análise do Espanhol de Porto Rico.

143

Vamos apresentar, neste trabalho, uma abordagem analítica que considera, inicialmente, estas três variáveis separadamente, verificando todas as inter-relações entre elas através da observação minuciosa dos dados que temos em mãos, objetivando, assim, fornecer uma descrição mais adequada e uma explicação mais satisfatória do fenômeno lingüístico sob estudo.

6.2.3.2 - Sobre a Posição linear

A variável Posição tem sido normalmente caracterizada em função do local que o elemento analisado ocupa no SN no sentido estritamente linear, conforme se observa no quadro 6.2.3.1.58 Este quadro apresenta as subdivisões que têm sido consideradas pelos pesquisadores do assunto, bem como exemplos extraídos de nossos corpus, com a indicação, entre parêntesis, das terminologias alternativas utilizadas. Todos os trabalhos realizados até o presente momento apresentam, com relação a esta variável, uma conclusão uniforme: a primeira posição do SN é a mais marcada, num índice probabilístico nunca inferior a 0,70; e as demais posições evidenciam um índice baixo de marcas, estabelecendo-se assim uma oposição forte com relação ao que ocorre com o primeiro elemento do SN. No que diz respeito ao comportamento dos elementos da segunda posição em diante, alguns estudiosos encontram uma perfeita linha decrescente, enquanto outros não. Estes chegam, às vezes, a verificar um aumento de inserção de marcas nas últimas posições.

144

QUADRO 6.2.3.1 EXEMPLOS DE POSIÇÃO LINEAR DO ELEMENTO NO SN POSIÇÕES Primeira posição (posição zero ou distância zero)

Segunda posição (posição 1 ou distância 1)

Terceira posição (posição 2 ou distância 2)

Quarta posição (posição 3 ou distância 3)

Quinta e sexta posição (posição 4 e 5 ou distância 4 e 5)

EXEMPLOS as perna toda marcada suas tias coisas lindas do meus pais representante diretos grande viagis todas as casas do meus pais os mesmos direitos as boas ações coisas lindas doze latinha as porta aberta as duas palavras os mesmos direitos todas as casas essas estradas nova coisas até ligadas uns amigos meus três colega meu essas bestera toda os meus quatro filhos do meus dez anos do meus próprios filho as minhas duas filha os piores nomes feios esses políticos aí chaguistas as conta quase toda os documento dela todinho os meus ainda velhos amigos as três coisa mais importante aquelas pessoas assim bem esquisitinha as mulheres ainda muito mais antiga

(Man14,mp,59a) (Glo11,fg,48a) (Dor29,fg,44a) (Joa10,fp,27a) (Jov26,mg,32a) (Glo48,fc,52a) (Hel44,fc,44a) (Joa10,fp,27a) (Val24,fg,15a) (Ire17,fp,52a) (Dor29,fg,44a) (Jup06,fp,18a) (Sam01,mp,18a) (Hel34,fg,62a) (Val24,fg,15a) (Hel44,fc,44a) (Mar47,fc,53a) (Pit37,mc,25a) (Hel34,fg,62a) (Joa25,mg,39a) (Fat23,fg,15a) (Dal18,fp,71a) (Nil12,fp,45a) (Glo48,fc,52a) (Ire17,fp,52a) (Ire17,fp,52a) (Pac20,mg,25a) (Mag47,fc,53a) (Jro64,mg,14a) (Gus62,mg,11a) (Hel44,fc,44a) (Jos35,fp,59a) (Hel44,fc,44a)

Para maior clareza na discussão desta variável, vamos apresentar um breve resumo dos trabalhos sobre o assunto, por ordem cronológica.

145

Braga & Scherre (1976), num trabalho pioneiro sobre o assunto, analisam a influência da Posição (denominada Distância) e concluem que a oposição geral detectada é entre a primeira e as demais posições no SN, favorecendo e desfavorecendo, respectivamente, a aplicação da regra (cf. p.472). Scherre (1978), falando sobre estes mesmos resultados, observa o seguinte: As duas classes - média e baixa - apresentam ainda uma ligeira elevação quando se passa da distância 2 para a 3. A diferença entre as probabilidades para estas distâncias é de respectivamente 0,10 e 0,05. A diferença da classe baixa é totalmente irrelevante. A da classe alta poderia refletir alguma tendência elevação da probabilidade a partir da distância três mas o número de dados é muito baixo para apresentarmos essa conclusão. (SCHERRE, 1978, p.44) Braga retomou o estudo da variável Posição, ainda denominada Distância, e concluiu que, para os falantes da classe baixa e média, a probabilidade de aplicação da regra é mais elevada na primeira posição, abaixando-se progressivamente nas segunda/terceira posições, e nas quarta/quinta posições (cf. BRAGA, 1977, p.58-59). Scherre também reanalisou esta variável, concluindo que, para os falantes escolarizados e semi-escolarizados, a primeira posição do SN é a que mais favorece a inserção de marca de plural (...) Em ambos os grupos estudados, há também uma queda considerável entre os números probabilísticos da posição zero(primeiro elemento) e posição um(segundo elemento) (SCHERRE, 1978, p.84) Scherre (1978) observa todavia que, enquanto o grupo escolarizado apresenta "a oposição básica entre a posição zero - favorecendo a

146

aplicação da regra - e a posição não zero - desfavorecendo-a" (p.85), o grupo semi-escolarizado evidencia "uma linha decrescente em termos de favorecimento, partindo da posição 0(zero) até a posição 4(quatro)". (p.85) Scherre observa ainda que, com relação à posição 4(quinto elemento), a probabilidade de aplicação da regra sobe no grupo escolarizado e desce no grupo semi-escolarizado, evidenciando-se duas direções opostas. Considera, entretanto, que o número escasso de dados impossibilita também qualquer conclusão definitiva a respeito do comportamento desta última posição (cf. p.84). Ponte (1979), da mesma forma que Scherre (1978), conclui que a primeira posição é o fator que mais favorece a aplicação da regra. Constata, também, uma queda forte na segunda posição e, a partir desta, uma linha decrescente em termos de favorecimento de aplicação da regra. Na quinta posição, há apenas um dado, impossibilitando qualquer conclusão segura a seu respeito (cf. PONTE, 1979, p.160-1). Carvalho Nina (1980), por sua vez, conclui que a aplicação da regra ao primeiro elemento do SN é quase categórica no sentido positivo, ocorrendo novamente uma queda brusca em relação às demais posições, as quais apresentam uma escala decrescente (cf. p.104-5).59 Guy (1981a), semelhantemente aos pesquisadores anteriores, conclui que a primeira posição do SN é a que mais favorece a marca de plural, havendo uma passagem brusca para a segunda posição e uma escala decrescente a partir do segundo elemento do SN (cf. p.179). Todos os pesquisadores envolvidos concluem que a variável Posição é a mais importante de todas, no sentido de exercer uma influência

147

polarizada e uniforme sobre a regra de concordância de número entre os elementos do SN

em Português. Além disso, todos eles explicam este

condicionamento em função do fenômeno da redundância: "repetição explícita de sinais que não trazem nova informação à já existente." (BIDERMAN, 1968, p.11) Considera-se, então, de forma geral, que o mecanismo da concordância não constitui uma necessidade lógica das línguas, pois uma marca formal ou semântica de plural em algum ponto no SN é suficiente para se transmitir a informação desejada (cf. ALI, 1971, p.279). Como se afirma que em Português marca-se preferencialmente a primeira posição, as demais marcas tornam-se desnecessárias (cf., por exemplo, SCHERRE, 1978, p.104-5).60 A visão que subjaz à explicação do comportamento desta variável é, portanto, funcionalista, no sentido de Kiparsky (1972) (cf. p.195; cf., também, MARTINET, 1973, p.181-5 e HAIMAN, 1983, p.801-8). Já é do nosso conhecimento que as Condições de Distintividade de Kiparsky estabelecem que há uma tendência para a informação semanticamente relevante ser retida na estrutura superficial (cf. 1972, p.195), podendo, conseqüentemente, cancelarem-se informações redundantes. Pretendemos então reanalisar a variável Posição linear do elemento no SN com o objetivo de reavaliar conclusões tão fortemente estabelecidas, verificando se a hipótese funcionalista do tipo kiparskiana dá realmente conta do fenômeno em estudo.

148

6.2.3.3 - Sobre a Classe gramatical

A influência da Classe gramatical sobre a variação de marcas de plural no SN foi estudada por Cedergren (1973), Poplack (1980a) e Lefebvre (1981). Cedergren (1973), analisando o Espanhol do Panamá, conclui que, nos casos do -S morfema de plural, os determinantes inibem a forma 0(zero) e os substantivos e adjetivos favorecem-na (cf. p.46). Poplack, analisando o Espanhol de Porto Rico, conclui também que os determinantes desfavorecem o cancelamento do -S plural, enquanto os adjetivos e substantivos favorecem-no. Poplack afirma ainda que, além de Cedergren (1973), Ma & Herasimchuck (1968) e Terrell (1976) encontraram resultados análogos em outros estudos de outros dialetos hispânicos (cf. p.60). Há, todavia, pequenas diferenças entre as conclusões de Cedergren e Poplack. A primeira autora observa que os adjetivos têm mais chances de reterem a marca do que os substantivos (cf. CEDERGREN, 1973, p.46). E a segunda verifica, contrariamente, que os adjetivos têm menos chances de serem marcados do que os substantivos, embora a diferença entre estas duas classes seja bem pequena (cf. POPLACK, 1980a, p.61). Lefebvre (1981), em "Variation in plural marking: the case of Cuzco Quechua", analisa também a influência da Classe gramatical sobre a presença de marcas plurais nos nomes em termos de: nomes, pronomes e interrogativos+nomes,

concluindo

que

esta

variável

não

tem

signi-

149

ficância sobre a aplicação desta regra (cf. p.80). Este caso é, todavia, diferente de todos os demais arrolados acima, pois não envolve o fenômeno de concordância nominal, inexistente nesta língua, mas sim a presença ou ausência de marcas plurais nos nomes e pronomes. Em nossa pesquisa, não consideramos apenas a subdivisão tríplice, até então apresentada. Fizemos uma categorização mais detalhada, resumida e exemplificada no quadro 6.2.3.2, na página seguinte.

150

QUADRO 6.2.3.2 EXEMPLOS DE CLASSE GRAMATICAL DOS ELEMENTOS NO SN CLASSES

EXEMPLOS

Substantivo

problemas assim maiores essas carne congelada das otas famílias

(Lau28,fc,43a) (Jan03,mp,56a) (Pac20,mc,25a)

Categoria substantivada

trabalha uma, as outras fica os próprio do lugar a gente procura ouvir as coisas boas e as ruins a gente

(Jos35,fp,59a) (Edp13,mp,62a) (Ire17,fp,52a)

Pronome pessoal de 3a. pessoa

delas todas todos eles todos ele

(Dor29,fg,44a) (Jan03,mp,56a) (Jan03,mp,56a)

Adjetivo

novas escolas coisas assim fabulosas umas casinha bunitinha

(Gus62,mg,11a) (Mor45,mc,51a) (Jup06,fp,18a)

Quantificador

todos os anos eles todos aquelas cruzinha toda

(Sam01,mp,18a) (Dal18,fp,71a) (Geo31,mg,58a)

Possessivo

suas tias no meus filhos uns colega meu

(Glo11,fg,48a) (Edb07,mp,41a) (Geo3l,mg,58a)

Adjetivo 2

determinadas discussões os próprios vagabundo eles mesmo

(Pac20,mg,25a) (Dav42,mc,31a) (Rob15,mp,22a)

Indefinido

alguns meses os outros colégios diversas perguntas

(Sam01,mp,18a) (Sue05,fp,24a) (Rob15,mp,22a)

Artigo e demonstrativo

essas carne congelada todos os anos umas pessoas ricas

(Jan03,mp,56a) (Sam01,mp,18a) (Joa10,fp,27a)

Os rótulos categoriais do quadro 6.2.3.2 seguem basicamente a terminologia tradicional. Diferem apenas com relação a dois tipos de adjetivos e com relação à categoria substantivada.

151

Os itens do tipo determinado, mesmo e próprio são de classificação controvertida. Ora são considerados como adjetivos (cf. LEMLE, 1984, p.150), ora como demonstrativos (cf. BECHARA, 1982, p.266), ora como identificadores (cf. LOBATO, 1986, p.120). Estes casos foram colocados numa só categoria rotulada de adjetivo 2. Os demais adjetivos (avaliativos ou não, deverbais, indicativos de cor, nacionalidade etc.) ficaram sob o rótulo de adjetivo. A categoria substantivada envolve todas as classes gramaticais (adjetivos, possessivos e indefinidos) que ocorrem em SNs que não têm um substantivo ou um pronome pessoal como núcleo (ver exemplos no quadro 6.2.3.2). Esta classificação mais detalhada tem como objetivo final verificar a relação entre Classe gramatical e Posição a ser discutida no item 6.2.5.4, buscando, assim, explicação para a influência da variável Classe gramatical. Como vamos ver no item seguinte, normalmente tenta-se "explicar" a sua influência em função da variável Posição.

6.2.3.4 - Relação entre Classe gramatical e Posição

Guy (1981b), em "Parallel Variability in American Dialects of Spanish and Portuguese", estabelece uma relação direta entre a variável Classe gramatical, conforme estudada para o Espanhol de Porto Rico por Poplack, e a variável Posição do elemento no SN, conforme estudada por ele para o Português popular do Brasil.

152

A tabela apresentada por Guy (cf. 1981b, p.90) encontra-se reproduzida a seguir.61 EFEITO PARALELO DA POSIÇÃO NO SN SOBRE A MARCA DE PLURAL CLASSE GRAMATICAL DO ELEMENTO DO SINTAGMA NOMINAL

Espanhol de Porto Rico (POPLACK, 1980b)

Determinante

Nome

Adjetivo

0,74

0,43

0,31

POSIÇÃO DO ELEMENTO NO SINTAGMA NOMINAL Português do Brasil (GUY, 1981a)

Primeira

Segunda

Terceira

0,93

0,43

0,34

Com base nos resultados probabilísticos acima, Guy afirma que é claro que os efeitos são virtualmente idênticos, exceto para a primeira posição. A pequena discrepância é sem dúvida devida à ocorrência do determinante lo (de los) nos dados de Poplack. (GUY, 1981b, p.90)62

Guy considera ainda que, se os casos de lo fossem retirados dos dados de Poplack, a discrepância entre determinante e primeira posição seria reduzida ou até eliminada (cf. 1981b, p.90). Discordamos da correlação estabelecida acima por uma série de razões. A primeira delas diz respeito à distribuição do substantivo e do adjetivo na segunda e na terceira posição, que pode ser vista no quadro 6.2.3.3, na página 154.63 Com base nos dados dos falantes adultos, podemos ver que o percentual de ocorrências de substantivos na terceira posição - 8,7% (514 em 5871 casos) - não é tão baixo para ser despre-

153

zado, embora a maioria dos substantivos ocorram na segunda posição: 88,5% (5196 em 5871 ocorrências). Em verdade, o número de substantivos na terceira posição - 514 - é maior do que o número de adjetivos nesta mesma posição: 307, ou seja, 53% dos casos de terceira posição são substantivos (514/968) e 31%, adjetivos (307/968). Além do mais, há um grande número de adjetivos na segunda posição: 163 em 518 casos, perfazendo 31,5% dos casos de adjetivos, percentual também significativamente alto para ser ignorado. Não há dúvidas de que o número de adjetivos da segunda posição (163) é quase irrelevante em relação ao número de substantivos nesta mesma posição (5196), mas não o é em relação ao número de adjetivos de todas as posições (518). Portanto, se igualarmos segunda posição e substantivo, deixaremos de captar qualquer regularidade que envolva outras classes gramaticais que ocorram nesta posição, pois a maioria dos casos que ocorre aí é exatamente de substantivos (5196/5781=88,5%). Se igualarmos também terceira posição e adjetivo, deixaremos de ver como se comporta o substantivo nesta posição, além de podermos estar estabelecendo conclusões falsas a respeito do comportamento do adjetivo.

154

TABELA 6.2.3.3 DISTRIBUIÇÃO DOS DADOS DOS FALANTES ADULTOS EM FUNÇÃO DA CLASSE GRAMATICAL E DA POSIÇÃO DOS ELEMENTOS NO SN CLASSE

POSIÇÃO Primeira

Segunda

Terceira

Total

153= 95% 161

2777= 53% 5196

317= 62% 514

3247= 56% 5871

xxx

60= 65% 93

16= 70% 23

76= 66% 116

Pronome pessoal de 3a. pessoa

12=100% 12

27= 82% 33

xxx

39= 87% 45

Adjetivo

47= 98% 48

125= 77% 163

125= 41% 307

297= 57% 518

Substantivo Categoria substantivada

Quantificador

133=100% 133

3= 43% 7

22= 20% 108

158= 64% 248

Possessivo

184=100% 184

130= 96% 135

2= 17% 12

316= 95% 331

Adjetivo 2

9= 90% 10

21= 78% 28

3=100% 3

33= 80% 41

Indefinido

424= 99% 429

45= 94% 48

0= 0% 1

469= 98% 478

Artigo e demonstrativo

3268= 97% 3363

75=100% 75

xxx

3343= 97% 3438

Total

4230= 97% 4340

3263= 56% 5778

485= 50% 968

7978= 72% 11086

É possível, inclusive, levantar a hipótese de que a discrepância entre a probabilidade da primeira posição, para o Português do Brasil, e a dos determinantes, para o Espanhol de Porto Rico, ocorra pela interfe-

155

rência natural entre as duas variáveis consideradas por Poplack: Classe e Marcas precedentes em função da posição (cf. 1977, p.13-6 e 1980a, p.612). Os resultados utilizados por Guy são, todavia, obtidos de uma análise que trabalha apenas com a variável Posição, sem observar, portanto, a influência da Classe gramatical (cf. 1981b, p.86).64 Outro aspecto importante que nos leva a questionar a correlação estabelecida por Guy (1981b) é que ela se aplicaria mais apropriadamente a SNs de três ou mais elementos e, especialmente, a SNs de estrutura [determinante + substantivo + adjetivo]. O seu texto não é suficientemente explícito para sabermos com quais SNs ele trabalhou. Vamos observar, portanto, o comportamento do determinante, do substantivo e do adjetivo, sob dois aspectos: (1) em SNs de três ou mais elementos; (2) em todos os SNs da amostra. Neste segundo caso, consideramos também os dados das crianças, a fim de mostrarmos a generalidade do fenômeno.65 Os valores percentuais obtidos para os SNs de três ou mais constituintes encontram-se na tabela 6.2.3.4. Observando as percentagens desta tabela, constatamos que o efeito das variáveis Classe gramatical e Posição é bastante paralelo. Entretanto, se compararmos o número de ocorrências dos adjetivos com o número de ocorrências dos elementos da terceira posição, é possível verificarmos novamente que, embora haja similaridade percentual, não há realmente identidade entre o número de adjetivos (347) e o número de elementos da terceira posição (822).

156

TABELA 6.2.3.4 SOBRE O EFEITO PARALELO DA POSIÇÃO EM TODOS OS SNS DE TRÊS OU MAIS ELEMENTOS DOS FALANTES ADULTOS CLASSE

POSIÇÃO

Determinante

Substantivo

Adjetivo

796/881 = 90%

534/917 = 58%

162/347 = 50%

Primeira

Segunda

Terceira

711/792 = 90%

339/531 = 64%

442/822 = 54%

Fazendo-se o cruzamento entre Classe gramatical e Posição, podemos obter os resultados percentuais relacionados na tabela 6.2.3.5, na página seguinte. Os resultados desta tabela, a seguir, mostram, claramente, que não se pode estabelecer um paralelo entre determinante e primeira posição; substantivo e segunda posição; adjetivo e terceira posição. Mesmo nos SNs de três ou mais constituintes, o paralelo assim feito encobre fatos importantes: 1) determinantes na segunda posição são até mais marcados do que na primeira; 2) os substantivos têm mais chances de serem marcados na terceira posição do que na segunda; 3) os adjetivos, inversamente aos substantivos, se apresentam mais marcados na segunda do que na terceira posição.

157

TABELA 6.2.3.5 CRUZAMENTO DE POSIÇÃO E CLASSE GRAMATICAL EM DE TODOS OS SNS DE TRÊS OU MAIS ELEMENTOS DOS FALANTES ADULTOS Primeira posição Determinante Substantivo Adjetivo

Segunda posição

Terceira posição

668/759 = 89%

118/121 = 96%

0/1

= 0%

33/33 = 100%

184/370 = 50%

317/514 = 62%

xxx

37/40 = 92%

125/307 = 41%

Com relação ao fato de os determinantes apresentarem menos marcas na primeira posição, é importante observar que neste caso os determinantes não marcados se encontram inseridos numa estrutura sintagmática bastante peculiar, ou seja, ocorrem nas seqüências do tipo [artigo ou demonstrativo + possessivo + substantivo] (casa do meus pais), das quais falaremos posteriormente. Considerando, agora, todos os dados que envolvem alguns "determinantes" (artigos, demonstrativos, indefinidos) e os substantivos e os adjetivos acompanhados por estes determinantes, é possível, não apenas reafirmarmos o comportamento diferenciado das classes em relação à posição como, também, evidenciarmos que o paralelo entre Classe e Posição não se pode mais estabelecer, nem em termos percentuais, conforme visto através dos resultados da tabela 6.2.3.4. As tabelas 6.2.3.6 e 6.2.3.7, dos adultos e das crianças, respectivamente, confirmam o que dissemos nas páginas anteriores: os substantivos são menos marcados do que os adjetivos na segunda posição e mais marcados do que estes na terceira.

158

TABELA 6.2.3.6 CRUZAMENTO DE POSIÇÃO E CLASSE GRAMATICAL EM TODOS OS DADOS DOS FALANTES ADULTOS

Determinante Substantivo Adjetivo

Primeira posição

Segunda posição

3692/3792= 97%

120/123 = 96%

153/161 = 95%

2277/5196= 53%

17/514 = 62%

125/163 = 77%

15/307 = 41%

47/48

= 98%

Terceira posição 0/1

= 0%

TABELA 6.2.3.7 CRUZAMENTO DE POSIÇÃO E CLASSE GRAMATICAL EM TODOS OS DADOS DAS CRIANÇAS Primeira posição

Segunda posição

Determinante

752/768 = 98%

Substantivo

16/18

= 89%

4/4

=100%

Adjetivo

20/23

= 87%

424/1057 = 40% 18/18

=100%

Terceira posição xxx 46/86 = 53% 16/40 = 42%

Através destas tabelas, percebe-se também que qualquer classe gramatical que esteja na primeira posição tende a ser mais marcada. Totalizando-se os dados de Classe gramatical e Posição, verifica-se, ainda, que o paralelo entre Classe e Posição conforme estabelecido por Guy (1981b) não mais se estabelece. Colocando-se os totais em uma outra tabela, a 6.2.3.8, para maior clareza, observa-se, em termos percentuais, que os adjetivos são mais marcados do que os substantivos e que a segunda posição e a terceira posição são igualmente marcadas.

Para a Posição, tais resultados não

chegam a ser surpreendentes. Como vimos nos resumos feitos, o que parece ocorrer,

em

linhas

gerais,

é uma

oposição entre primeira e demais

159

posições. Mas, com relação à Classe, estes resultados se assemelham mais aos encontrados por Cedergren (1973) do que aos de Poplack (1980 e 1981). TABELA 6.2.3.8 PARALELO ENTRE POSIÇÃO E CLASSE GRAMATICAL EM TODOS OS DADOS CLASSE GRAMATICAL Determinante Adultos Crianças

3812/3916 = 97% 772/791

= 98%

Substantivo

Adjetivo

3247/5871 = 55%

297/518 = 64%

486/1161 = 42%

38/62

= 61%

POSIÇÃO DO ELEMENTO NO SN

Adultos Crianças

Primeira posição

Segunda posição

Terceira posição

3892/4001 = 97%

3022/5482 = 55%

442/822 = 54%

772/790 = 98%

462/1098 = 42%

62/126 = 49%

Já sabemos que Cedergren, em 1973, afirma que os adjetivos têm mais chances de reterem a marca (63%) do que os substantivos (44%) (cf. p.46) e que, em 1980, Poplack apresenta resultados indicando que os substantivos é que têm probabilidade mais alta (0,43) de reterem a marca do que os adjetivos (0,31) (cf. 1980a, p.63). Mas, em 1981, Poplack apresenta resultados ligeiramente diferentes, evidenciando-se que o comportamento do substantivo (0,40) praticamente se iguala ao do adjetivo (0,38) em termos probabilísticos (cf. p.61). Observamos finalmente que o único caso de determinante na terceira posição posposto ocorre com o indefinido qualquer em "esses ne-

160

gócio qualquer", o que sugere que ele deveria ser reclassificado como adjetivo 2, que pode também ocorrer esporadicamente posposto ao núcleo do SN. Os fatos até aqui apresentados já são suficientes para nos levarem a duvidar do efeito paralelo entre Classe introduzir a variável

e Posição e nos conduzirem a

Classe gramatical ao lado da variável Posição, se

quisermos ter uma compreensão mais clara do fenômeno em estudo. Todavia, outra questão sobre a distribuição das classes pelas posições ainda merece ser levantada: a que diz respeito à classe determinante. Não sabemos quais elementos Cedergren (1973) e Poplack (1980 e 1981) colocam sob este rótulo. Até aqui, consideramos apenas o artigo, o demonstrativo e o indefinido, embora, em Português, o possessivo e o quantificador todo sejam também classificados desta forma. Mas tanto o possessivo quanto o quantificador podem ocorrer nas três posições do SN, diferentemente dos outros determinantes e, além disso, a freqüência de suas marcas é função de suas posições de ocorrência, conforme se constata na tabela 6.2.3.9, a seguir. TABELA 6.2.3.9 RELAÇÃO ENTRE POSSESSIVO, QUANTIFICADOR E POSIÇÃO Primeira posição Possessivo Adultos Crianças

184/184 = 100% 42/43 = 100%

Quantificador Adultos Crianças

133/133 = 100% 23/23 = 100%

Segunda posição 130/135 = 96% 24/25 = 96% 3/7

= 43% xxx

Terceira posição 2/12 = 17% 2/4 = 50% 22/108 = 20% 1/5 = 20%

161

O possessivo se comporta como qualquer determinante quando ocorre na primeira e segunda posição. Na terceira, com pouca freqüência, apresenta um baixo índice de marcas. No caso dos adultos, 41% das ocorrências são de segunda posição e, nas crianças, 35%. Estes percentuais são bastante elevados para serem ignorados, em termos de uma análise que iguala a segunda posição à classe substantivo. O quantificador, por sua vez, ocorre com freqüência alta na terceira posição:

43%(108/248),

contra

54%(133/248)

na

primeira

posição,

considerando-se apenas os dados dos adultos, de maior freqüência. Na primeira posição, ele é categoricamente marcado e, na terceira, apresenta um índice de marcas de apenas 20%. Podemos ver, portanto, que o percentual de ocorrência do quantificador na terceira posição é também alto e não pode ser deixado de lado. A freqüência do quantificador é baixa na segunda posição e, neste caso, ele se apresenta com 43% das marcas. Estes

casos

são

de

uma

estrutura

bastante

típica:

[pronome

pessoal+quantificador] (eles todos). Verificamos assim que (1) só a variável Posição não dá conta de captar o alto índice de marcas do possessivo, e de outros determinantes, tanto na primeira quanto na segunda posição e que (2) só a variável Classe não dá conta do baixo índice de marcas do possessivo e do quantificador na terceira posição. É necessário, no mínimo, que se trabalhe com as duas variáveis, separadas ou cruzadas, ou com alguma outra que dê conta da relação entre as duas. O comportamento do possessivo e do quantificador na terceira posição assemelha-se mais ao dos adjetivos do que ao dos determinantes. A característica distribucional que têm em comum é exatamente a de es-

162

tarem na terceira posição ou, em outras palavras, estarem pospostos ao núcleo do SN. A grande diferença entre o possessivo e o quantificador da segunda posição, por sua vez, se dá em função também da sua relação com o núcleo do SN. Dos 135 casos de possessivo desta posição, 130 são antepostos. Dos sete casos de quantificador desta mesma posição, todos são pospostos. Oportunamente voltaremos a falar da relação que o elemento nominal não nuclear estabelece com o seu núcleo dentro do SN. Com relação ao quantificador, é importante, ainda, abrirmos um parêntesis e observarmos que, dentre os 133 casos dos dados dos falantes adultos que ocupam a primeira posição, 69 estão em SNs de dois elementos. Dentre estes, 16 casos são do tipo que poderiam ser interpretados como SNs de três constituintes sem a marca no quantificador da primeira posição. Então, casos como "em todos lado tem assalto", codificados como um SN de dois

constituintes, poderiam ser analisados como

"em tod' os lado tem

assalto". Optamos por analisar tais SNs como de dois constituintes e com marca no quantificador, porque todos os demais casos têm marca no quantificador da primeira posição. Outra solução que hoje nos ocorre seria tê-los

considerado

como

neutralizados

e,

conseqüentemente,

tê-los

eliminado da nossa análise. Isto entretanto não foi feito no momento adequado. Focalizando agora a relação entre classe e primeira posição, com base nos dados dos adultos (ver tabela 6.2.3.3, p.156), observa-se que, dentre os 4340 dados da primeira posição, 87% dos casos(3792/4340) são artigos, demonstrativos e indefinidos. Embora a maioria dos casos que aí ocorram sejam de determinante por excelência, qualquer classe que ocupe esta

posição

tende

a

ter

marcas

num

nível

percentual

próximo

163

a 90%, conforme se constata novamente na tabela 6.2.3.10, a seguir, para os adultos e para as crianças. O paralelo entre Classe e Posição deixa, portanto, mais um fato não explicitado. A afirmação mais correta, então, é que a primeira posição do SN é percentualmente a mais marcada, independente da classe gramatical, embora o substantivo seja um pouco menos marcado do que as demais classes. Já observamos também que a maioria dos casos não marcados nesta posição encontram-se numa estrutura sintagmática bastante regular. São eles os artigos e demonstrativos (deste segundo tipo há apenas dois dados) seguidos de um possessivo e um substantivo, como se vê nos exemplos abaixo: - interferir no meus problemas

(Val24,fg,15a);

- não bate no teus filho

(Mgl47,fc,53a);

- vou com a minhas colegas

(Val24,fg,15a) e

- eu e o meus colega, entendeu

(Man14,mp,59a).

164

TABELA 6.2.3.10 PRIMEIRA POSIÇÃO DO SN E CLASSE GRAMATICAL CLASSE

FALANTES Adultos

Substantivo

153/161

=

Crianças 95%

Pronome pessoal

12/12

= 100%

Adjetivo

47/48

=

98%

16/18

=

89%

xxx 4/4

= 100%

Quantificador

133/133

= 100%

23/23

= 100%

Possessivo

184/184

= 100%

42/43

=

Adjetivo 2

9/10

=

90%

Indefinido

424/429

=

97%

80/80

3268/3363 =

97%

672/688

Art. e dem.

98%

xxx = 100% =

98%

Dentre os dados das crianças (19) e dos adultos (110), temos 129 ocorrências não marcadas na primeira posição. Das 129, 112 são de artigos e demonstrativos. Dos 112 casos, 94 estão inseridos na estrutura sintagmática em questão. Eles perfazem 73% do total de casos e 84% do total de artigos e demonstrativos não marcados na primeira posição. Em "O estudo da regularidade dos possessivos no Português do Rio de Janeiro", Silva afirma que o falante tende a não analisar a contração do tipo no e po como dois morfemas: preposição e artigo (cf. 1982, p.389). Os nossos dados sugerem que o falante pode estar analisando esta contração como uma preposição, ou seja, como uma categoria que não se flexiona e, portanto, não apresenta marcas de plural. Esta possibilidade de reanálise parece tão forte que chega a se estender aos artigos diante de possessivos precedidos de preposição que não apresentam contração e mesmo àqueles não precedidos de preposição.

165

Segundo Guy, tais fatos ocorrem devido à influência da nasal que forma um contexto que favorece o cancelamento do -S fonético (cf. 1981a, p.176). Mas, de acordo com esta hipótese, como se explicaria a ausência de marcas diante do possessivo teu. Além disso, nos outros 36 casos restantes, sem marca na primeira posição, apenas três são seguidos de nasal. É realmente notável o número de casos não marcados versus o número de casos marcados em estruturas com o artigo seguido de possessivo: é da ordem de 57% (87/153), enquanto o de todos os demais casos é da ordem de, no máximo, 5%. Vamos voltar ainda a esta discussão. No que concerne à relação entre classe e segunda posição, verificase que, dos seus 5778 casos, 90%(5196/5778) dos dados dos adultos (ver tabela 6.2.3.3, p.156) são de substantivos; o que faz com que o seu peso possa encobrir o de qualquer outra categoria nesta posição, se igualarmos segunda posição a substantivo, sem estabelecermos, portanto, codificação para posição e classe de forma distinta. Observando, todavia, os dados da segunda posição, distribuídos pelas classes na tabela 6.2.3.11, na página seguinte, para os dois grupos de falantes, podemos constatar que o percentual de marcas de todas as outras categorias que não o substantivo, à exceção do quantificador, é bastante elevado, inclusive o dos adjetivos. Poder-se-ia levantar a hipótese de que pelo menos o alto índice de marcas dos possessivos da segunda posição ocorresse devido à ausência de marcas na primeira posição (nO meus problemas). Isto não é verdade. Retirados os 87 casos sem marca na primeira posição, do total

166

de 160 dos adultos (135) e das crianças (25), fica-se com 73, dos quais 67 são também marcados, perfazendo-se um total de 92% de marcas.

TABELA 6.2.3.11 SEGUNDA POSIÇÃO DO SN E CLASSE GRAMATICAL CLASSE

FALANTES Adultos

Substantivo

2777/5196 =

Crianças 53%

424/1057 =

40%

Cat. substantivada

60/93

=

86%

13/20

=

65%

Pronome pessoal

27/33

=

82%

3/5

=

60%

125/163

=

77%

18/18

3/7

=

43%

130/135

=

96%

24/25

Adjetivo 2

21/28

=

78%

1/1

= 100%

Indefinido

45/48

=

94%

6/9

=

Art. e dem.

75/75

= 100%

Adjetivo Quantificador Possessivo

= 100% xxx

14/14

=

96% 67%

= 100%

Resumindo, o estabelecimento do efeito paralelo entre Classe e Posição proposto por Guy (1981b) impede que se veja o seguinte: 1) A terceira posição não é ocupada apenas por adjetivos; os substantivos também ocorrem nesta posição e, inclusive, com freqüência maior do que a dos adjetivos. 2) Os substantivos e adjetivos se comportam de forma oposta na segunda e terceira posição. 3) Os

possessivos

e

o

quantificador

se

comportam

determinantes na primeira posição e como adjetivos na terceira.

como

167

4) Qualquer classe gramatical que esteja na primeira posição tende a ser muito marcada, independente de ser determinante. 5) Os artigos e os demonstrativos não marcados que ocupam a primeira posição encontram-se inseridos numa estrutura sintagmática regular (artigo definido + possessivo + substantivo). 6) Todas as classes que ocorrem na segunda posição, exceto o quantificador, já comentado, têm comportamento bastante diferente do substantivo nesta mesma posição. Portanto, uma análise desta natureza não é adequada, uma vez que deixa de dar conta de uma série de aspectos regulares que envolvem o fenômeno sob estudo. Conseqüentemente, é necessário inserir as variáveis Classe e Posição na análise dos dados, bem como pensar de que forma elas se interagem em termos da relação entre os elementos nucleares e não nucleares dos SNs. É importante se ter em mente que todas as observações feitas até o presente momento se basearam em percentagens e não em probabilidades. Elas foram utilizadas para mostrarmos a necessidade da introdução das duas variáveis sob foco, mas a análise final será baseada nas probabilidades, que poderão confirmar ou não as distribuições já observadas. Antes de passarmos à apresentação dos resultados probabilísticos, vamos falar sobre a variável mais polêmica das três em discussão: Marcas precedentes.

168

6.2.3.5 - Sobre marcas precedentes

A variável Marcas precedentes foi considerada por todos os estudiosos que analisaram a regra de concordância nominal, mas de formas as mais diversas. Poplack, por exemplo, mede o efeito das Marcas precedentes em função da Posição que o elemento ocupa no SN. Segundo ela, esta variável apresenta um efeito muito forte sobre o cancelamento do -S plural, atuando da seguinte forma: (...) Uma marca imediatamente precedente leva a mais marcas (quando S, 0S ou SS precede o dado em questão, o cancelamento é desfavorecido) (...) e zeros levam a zeros, um efeito que é claramente estrutural (...), e contra funcional, no sentido de que, em vez dele favorecer um padrão de marcas com uma marca flexional de pluralidade, ele favorece todas as marcas(funcionalmente redundante) ou nenhuma (perda de função). (POPLACK, 1981, p.61. Cf., também, 1980a, p.62-7; 1980b; p.61-2)66 Poplack coloca ainda que um efeito oposto (...) foi encontrado por Guy e Braga para o Português brasileiro, uma língua que marca a pluralidade no SN e no SV da mesma forma que o Espanhol. (POPLACK, 1980a, p.64)67

O nosso objetivo, nesta parte do

trabalho, é retomar a variável

Marcas precedentes de forma análoga à de Poplack e mostrar que o Português e o Espanhol apresentam mais semelhanças do que diferenças. Para isto, vamos evidenciar que os estudos sobre o Português que consideraram esta variável não a trabalharam adequadamente ou deixaram de explorar regularidades importantes. Faz-se necessário, portanto, que apresentemos um resumo de como os diversos pesquisadores obser-

169

varam a influência desta variável em Português, antes de descrevermos o nosso tratamento. A forma de codificar esta variável não tem sido uniforme nos diversos trabalhos sobre o Português e, por isto, comparações exatas não são possíveis. Carvalho Nina (1980), por exemplo, além de fazer uma codificação bastante diferente das demais, apresenta apenas resultados percentuais, o que torna duplamente inviável qualquer espécie de comparação (cf. p.72-5). Braga (1977) codifica esta restrição em termos binários: presença ou ausência de marca formal de flexão antes do segmento analisado, imediatamente ou não. Desta forma, todos os numerais são colocados no fator ausência formal de marcas (cf. p.30-1). Ela conclui que este condicionamento não é muito poderoso, mas evidencia uma leve tendência para haver mais marcas quando há ausência de flexão antes e vice-versa (cf. p.39). Segundo Braga, tal comportamento evidencia uma tendência à eliminação da redundância exigida pelas regras de concordância nominal. (BRAGA, 1977, p.70)

Scherre (1978) codifica seus dados fazendo um cruzamento parcial entre Marcas precedentes e Posição, sem, contudo, abandonar a variável Posição, e conclui que a oposição maior que se pode detectar é a seguinte: Ausência de flexão ou a sua neutralização na posição 0(zero) favorece a aplicação da regra, /enquanto/ presença de marca formal ou semântica de plural em pelo menos um dos segmentos precedentes desfavorece a aplicação da regra. (SCHERRE, 1978, p.110)

170

A oposição geral encontrada por Scherre é análoga à de Braga, mas, diferentemente desta, agrupa os casos de numeral junto à presença de marcas e não à ausência. Os resultados de Scherre mostram-se bastante polarizados - 0,68 versus 0,32 para os falantes escolarizados e 0,82 versus 0,18 para os semi-escolarizados -, enquanto os de Braga, não - 0,56 versus 0,44 para a classe média e 0,54 versus 0,46 para a classe baixa (cf. SCHERRE, 1978, p.109 e BRAGA, 1977, p.38). Antes de estabelecer a conclusão geral, Scherre apresenta uma codificação mais detalhada do que a de Braga (cf. SCHERRE, 1978, p.74;105-9). Todavia, Scherre não explora adequadamente uma diferença sistemática encontrada entre o efeito da presença ou ausência de marcas antes do terceiro, quarto e quinto elementos, em SNs com marca no seu primeiro ou segundo elemento. A presença de marcas neste caso favorece mais marcas, enquanto a ausência favorece mais zeros, resultados estes que apontam para a conclusão apresentada por Poplack. Scherre (1978) chega a observar que a ausência de marcas precedendo o terceiro, quarto e quinto elementos é o fator que mais inibe a aplicação da regra, ou seja, favorece a forma zero no segmento seguinte. Ela chega também a observar que é importante analisar esta variável "em termos de oposições gerais e oposições mais específicas." (p.91). Scherre considera ainda que as "conclusões globais explicam-se (...) em função do fenômeno da redundância" (p.111), mas afirma que as diferenças internas entre os diversos fatores que já apresentam uma marca precedente receberam interpretações ad hoc, uma vez que, segundo ela, não

se

conseguiu

um

princípio

geral

que

desse

conta

do

fe-

171

nômeno. Scherre observa então o seguinte: (...) Isto indica que o grupo em si está mal definido, pois parece não haver influência de redundância local sobre a aplicação da regra. Seria interessante partir para a reestruturação desse grupo em função de número de marcas plurais precedentes. (SCHERRE, 1978, p.112-3) Estes aspectos apontados por Scherre (1978) serão explorados neste trabalho, utilizando-se as idéias de Poplack com o objetivo já explicitado de mostrar que, diferentemente das conclusões gerais de Braga & Scherre (1976), Braga (1977) e, também, Ponte (1979), Carvalho Nina (1980) e Guy (1981a), o Espanhol e o Português têm mais semelhanças do que diferenças. Ponte (1979) estudou a variável em discussão de forma bastante semelhante à de Scherre (1978), introduzindo apenas uma mudança, sugerida por Scherre, qual seja, a de separar os numerais dos segmentos precedentes não flexionáveis, colocando-os, portanto, separados de casos do tipo "coisas ASSIM fabulosas" e "as ) mais ) novas" (cf. SCHERRE, 1978, p.112 e PONTE, 1979, p.80). A conclusão geral a que chega Ponte é a mesma de Scherre, como se pode ver pela passagem abaixo: Segmento precedente flexionável sem marca formal ou semântica de plural na posição 0(zero) (A) favorece a regra, e segmento precedente com marca plural e/ou semântica de plural (S,Z e Q) inibem-na. Há dois fatores que estão fora desta classificação: H, que inibe a regra, pois o segmento precedente apesar de não flexionado está em posição não zero; R, que é constituído por segmento precedente não flexionável e cuja baixa probabilidade (0,08) mostra que também inibe a regra. (PONTE, 1979, p.162) As conclusões acima, com referência ao fator H(duas SOBRINHA nossa), apontam também para a conclusão de Poplack: zeros levam a zeros. Guy (1981a) retoma a variável Marcas precedentes, tentando estabelecer um paralelo com o tratamento dado por Poplack. Não consegue,

172

todavia, chegar a conclusões novas. Ele afirma que a análise que cruza Marcas precedentes e Posição não é elegante e é grosseira (cf. p.176) e que aquela que considera Marcas precedentes e Posição como duas variáveis separadas é estatisticamente melhor (cf. p.178). Nesta nova forma de analisar, Guy também não explora a diferença entre segmentos precedentes marcados, favorecendo mais marcas, e segmentos precedentes não marcados na posição não zero, favorecendo, relativamente, menos marcas. Em verdade, Guy nem chega a falar nesta diferença e não levanta, à semelhança de Scherre (1978), a hipótese da não influência da redundância local, no sentido de eliminação de marcas, a partir das primeiras posições (cf. GUY, 1981a, p.179 e SCHERRE, 1978, p.112-3). A nosso ver, Guy apresenta dois problemas na codificação de seus dados que o impediram de ver regularidades mais fortes em direção à análise proposta por Poplack. Primeiro, ele codifica seqüências do tipo 00- e n0- juntas (cf. p.16970); temos tudo para crer que, se seqüências 00- ocorrerem (nos nossos dados não ocorrem), elas propiciarão mais marcas no terceiro elemento, senão corre-se o risco de se perder a informação de plural. No entanto, seqüências do tipo n0- (TRÊS RISCO verde) provocam zeros seguintes sem nenhuma possibilidade de perda de informação, já contida no primeiro elemento do SN, através do numeral. Vamos retomar, oportunamente, as supostas seqüências 000. Segundo, ele codifica todas as seqüências de quatro elementos

173

juntas, quer as que tenham "esses" precedentes (sss- (AS PARTIDAS TODAS iguais) ou 0ss- (dO MEUS DEZ anos)), quer as que terminem em zero ou zeros precedentes (ss0- (OS PIORES NOME feio) ou s00- (AS PERNA TODA marcada) ou s0m- (AS CASA MAIS antiga)) (cf. Guy, 1981a, p.169-70). Esta junção não faz sentido dentro da proposta de Poplack de que marcas levam a marcas e zeros levam a zeros. Resta ainda ressaltar que todos os pesquisadores que codificaram o numeral na variável Marcas precedentes separadamente concluíram que ele tende a favorecer mais a presença de -S do que uma marca formal precedente (cf. SCHERRE, 1978, p.111-2; PONTE, 1979, p.163; GUY, 1981, P.179-80).68 As explicações para a influência positiva do numeral são, todavia, opostas. Scherre (1978), numa linha nitidamente funcionalista kiparskiana, considera que o numeral favorece mais marcas nos dados dos falantes semiescolarizados, porque ele tem apenas marca semântica de pluralidade e pode estar sendo menos percebido como plural do que aquele segmento precedente que tem a marca formal e, indubitavelmente, a idéia de plural nesta marca. Ela alega que a marca semântica de plural nos numerais pode não estar sendo percebida pelos falantes semi-escolarizados, pois eles, às vezes, colocam um -S, talvez pluralizador, nestes elementos, fenômeno pouco constatado na fala dos falantes escolarizados, na qual numeral tem a mesma influência que um segmento precedente com marca formal de plural (cf. p.11-2).69 Guy (1981a), por sua vez, numa linha claramente não funcionalis-

174

ta kiparskiana, sugere que a influência mais forte do numeral seja resultado de auto-monitoração e auto-correção (cf. 1981a, p.180). Afirma ele que o contexto plural mais óbvio na fala de uma pessoa seria seguramente em um SN contendo um número que especificasse alguma quantidade plural. Então na situação de entrevista, esperar-se-ia que o falante do dialeto popular que está tentando acomodar a sua fala ao dialeto padrão do entrevistador "se corrigisse" mais neste ambiente plural mais óbvio. (GUY, 1981a, p.180)70

Além disso, todos os pesquisadores aludidos concluíram que o elemento inserido em um sintagma preposicional dentro de um SN mais alto com marca semântica de plural (simbolizado SPrep-), do tipo UMA PORÇÃO DE coisa, tende a ser pouco marcado. Scherre (cf. 1978, p.108), Ponte (cf. 1979, p.163) e Guy (cf. 1981a, p.179) apresentam resultados probabilísticos que indicam que este fator é o segundo mais forte no sentido de inibir a presença de marcas no segmento analisado. Ele perde apenas para o fator ausência de marcas a partir da segunda posição. Todavia, usando as palavras de Guy ao falar de numerais, podemos constatar que a carga semântica de pluralidade, nestes casos, é tão óbvia quanto a dos numerais. A única diferença reside no fato de não indicarem um número preciso. Mas, relativamente à influência dos numerais, tais construções favorecem mais a forma zero. Scherre, seguida por Ponte (cf. 1979, p.111) e por Guy (cf. 1981a, p.180), apresenta a seguinte interpretação para este fato: a baixa influência do fator Q (uma porção de coisa) na aplicação da regra deve ser atribuída ao fato de o fa-

175

lante considerar as formas desse tipo como um todo, sendo a marca formal desnecessária. Poderíamos inclusive levantar a hipótese de serem elas análogas às formas de duplicidade na concordância: -uma porção de coisas estava boa; -uma porção de coisas estavam boas. (SCHERRE, 1978, p.112)

A interpretação de Scherre, para este fator, não é claramente funcionalista no sentido kiparskiano do termo. Guy, encontrando este mesmo efeito, coloca de forma explícita que isto certamente está conforme a tendência de se eliminar redundância (cf. 1981a, p.180). Sua interpretação, para este fator, é então claramente de base funcionalista kiparskiana. Verificamos,

portanto,

que

as

análises

da

variável

Marcas

precedentes apresentam resultados não interpretados, explicações ad hoc e, inclusive, explicações diferentes para resultados idênticos. A sua abordagem, à luz das idéias de Poplack (1980a, 1980b e 1981), cujos indícios se encontram também no trabalho de Scherre (1978), Ponte (1979) e Guy (1981a), trará, indiscutivelmente, uma compreensão mais clara dos fatos e, conseqüentemente, uma explicação uniforme para o seu comportamento. Através de uma codificação feita com base em Poplack, vamos mostrar, de início sob bases percentuais, que o condicionamento da variável Marcas precedentes é absolutamente regular. Apresentamos, a seguir, o quadro 6.2.3.12, que contém exemplos detalhados desta variável, bem como a simbologia que será usada no decorrer de sua apresentação. O quadro 6.2.3.12 apresenta então a variável Marcas precedentes subdividida em nove grandes categorias, com diversas subcategorias. Relembramos que, especialmente nesta variável, estamos apresentando

176

nos exemplos, de forma sistemática, o dado sob análise sublinhado e o contexto precedente, que constitui o fator condicionante, em MAIÚSCULAS. São também especificadas no quadro 6.2.3.12 a posição em que se encontram as marcas condicionantes e a posição em que se encontra o elemento analisado. O primeiro fator, denominado ausência, refere-se, como o próprio nome diz, à ausência de qualquer constituinte do SN precedendo o dado da primeira posição (os fregueses; do meus tio). O fator 0(zero), o segundo na ordem de apresentação, constitui-se dos casos de primeira posição não marcados(dO meus tios; FILHOTINHO novos; TANTA gargalhadas). Os fatores 3 e 4 dizem respeito às estruturas inseridas num sintagma preposicional dentro de um SN semanticamente plural. O fator 3, simbolizado SPrep(x)s-, engloba os casos (a) de núcleo nominal mais alto com marca formal de plural (MILHÕES de coisa) ou (b) de núcleo nominal com ou sem marca formal de plural acompanhado de marca no primeiro elemento do SN sob análise (UM GRUPO DE CRIANÇAS abandonadas; UMA SÉRIE DE OUTRAS coisas). O fator 4, simbolizado SPrep0(0)-, abarca as ocorrências (a) de núcleo nominal mais alto sem marca formal de plural (UMA PORÇÃO DE carro; UM GRUPO DE crianças abandonadas); (b) de núcleo nominal sem marca formal de plural seguido de ausência de marca no primeiro elemento do SN sob análise (UMA PURÇÃO DE COISA interessante).

177

QUADRO 6.2.3.12 EXEMPLOS DE MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO TIPO DE MARCAS 1)Ausência 2)Zero

POSIÇÃO DAS MARCAS

POSIÇÃO DE ANÁLISE

EXEMPLOS

1

1 2

os fregueses dO meus pais

3)Sprep(x)s-

1 1,2

2 3

MILHÕES DE coisas UM GRUPO DE CRIANÇAS abandonadas

4)Sprep 0(0)-

1 1,2

2 3

UMA PORÇÃO DE carro UMA PORÇÃO DE COISA interessante

5)Numeral 6)s-

1 1

2 2

TRÊS capítulos UNS troço AS maiores privações

7)s(s)ssssss-

1,2 1,2,3

3 4

AS MAIORES privações AS PARTIDAS TODAS iguais

2 2 1 1,2 2 1,2 2 1,2

3 3 3 3 4 4 4 4 5

1,2,3

6

dO MEUS tios PESSOAS MUITO humildes NOVE NÚCLEOS formados AS DEZ horas OS MEUS QUATRO filhos dO MEUS DEZ anos AQUELAS LOJAS BEM baratinhas DEZ SINHORAS LÁ sentada AQUELAS PESSOAS ASSIM BEM esquisitinha AS CRIANÇAS TODAS DA RUA abandonadas

1 1 1 1,2 1 1 1 1

3 3 4 4 4 4 4 5

8)y(x)x0ssmnssnssn0snssmnsmssmmsssmm9)x(y)0s0n0s00ss0sn0s0ms0ms0mm-

1

UMAS BORRACHA grande DOIS RISCO verde AS PERNA TODA marcada OS PIORES NOME feio AS MINHA DUAS filha AS CASA MAIS antiga AS COISA MUITO uniformes dOS BAIRRO AINDA MAIS calmo

178

O fator 5 é constituído de numerais, e apenas numerais, da primeira posição (TRÊS capítulos; NOVE núcleos formados; DEZ sinhoras lá sentada; DOIS risco verde). O fator 6 agrupa todos os casos de marcas formais de plural em elementos da primeira posição (OS fregueses; UNS troço; OS meus quatro filhos; AS perna toda marcada; NOTAS melhores). O fator 7, representado por ss(s)-, envolve a presença de duas ou mais marcas formais de plural precedendo o segmento analisado (AS MAIORES privações; AS PARTIDAS TODAS iguais). O fator 8, simbolizado y(x)x-, engloba todos os casos de presença de pelo menos uma marca formal de plural precedendo o elemento nominal analisado, não mediada por zero em elemento que admite marca. Nestes casos, portanto, os elementos nominais analisados são precedidos de:

A) 0s- .zero e marca formal (dO MEUS tios); B) ns- .numeral e marca formal (NOVE NÚCLEOS formados) C) sn- .marca formal e numeral (AS DEZ horas); D) sm- .marca formal e modificador (PESSOAS MUITO humildes).

Os demais casos deste fator seguem o mesmo princípio: entre a última marca formal e o segmento analisado não pode existir um zero, embora admita-se aí a existência de numerais ou modificadores. Sendo assim, entende-se que o "y" da simbologia y(x)x- pode ser lido como zero, numeral ou marca formal, mas o "x" jamais pode ser lido como zero. O

raciocínio acima se aplica também ao fator 9, simbolizado

179

x(y)0-: o "x" jamais pode ser zero. Seus valores são apenas dois: marca formal de plural ou numeral. O "y", por sua vez, pode assumir valores diversos, inclusive marca formal ou zero. É importante observar que a característica necessária deste fator é que, entre a última marca e o elemento analisado, tem de haver necessariamente um zero, mesmo mediado por um numeral ou por um modificador. Neste fator, podemos, então, ter elementos nominais precedidos de:

A) s0- .marca formal e zero (UMAS BORRACHA grande); B) n0- .numeral e zero

(DOIS RISCO verde);

C) s00- .marca formal, zero e zero (AS PERNA TODA marcada; D) sn0- .marca formal, numeral e zero (UNS QUATRO SALÁRIO mínimo); E) s0n- .marca formal, zero e numeral (AS MINHA DUAS filha); F) s0m- .marca formal, zero e modificador (AS CASA MAIS antiga); G) s0mm- .marca formal, zero, modificador e modificador (dOS BAIRRO AINDA MAIS calmo).

Os casos de dois zeros precedentes foram todos agrupados aos de apenas um zero por serem de menor número de ocorrências. Há, por exemplo, apenas dois casos do tipo s00-(AS PERNA TODA marcada e AS OTA CRIANÇA pequena). A tabela 6.2.3.13 apresenta percentuais de presença de concordância para esta variável considerando os nove agrupamentos de Marcas

180

precedentes em função da posição. Mantivemos a numeração de 1 a 9 do quadro 6.2.3.12 para que o leitor possa se orientar melhor em termos dos exemplos, uma vez que não vamos repeti-los nas tabelas.

TABELA 6.2.3.13 MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO MARCAS

POSIÇÃO DE ANÁLISE

FALANTES Adultos

1)Ausência

1

4225/4335 =

2)0(zero)

2

3)SPrep(x)s-

1e2

11/16

=

4)SPrep0(0)-

1e2

68/177

5)Numeral

105/105

Crianças 97%

= 100%

836/855

=

98%

19/19

= 100%

69%

1/1

= 100%

=

38%

14/80

=

17%

2

886/1529 =

58%

146/258

=

37%

6)s-

2

2205/3974 =

55%

326/796

=

41%

7)ss(s)-

3e4

258/368

=

70%

36/50

=

71%

8)y(x)x-

3,4,5

207/382

=

54%

28/59

=

47%

9)x(y)0-

3,4,5

13/200

=

6%

1/25

=

4%

Observando, portanto, a tabela 6.2.3.13, podemos verificar que a ausência de qualquer marca fora do SN provoca um alto percentual de marcas no elemento nominal da primeira posição, assim como o zero na primeira posição provoca a sua presença categórica, no sentido positivo, no elemento da segunda posição. Tais resultados sugerem que a hipótese funcionalista de Kiparsky (1972) está se confirmando, pois evidencia-se uma tendência de inserir o -S, quando ele é fundamental para indicar

181

a idéia de pluralidade. Todavia, já sabemos, através da discussão da relação entre Classe e Posição, que a ausência sistemática de marcas na primeira posição ocorre, predominantemente, em estruturas do tipo do meus pais, e sabemos ainda mais que a quantidade de marcas no possessivo da segunda posição praticamente independe da presença ou ausência de marcas no artigo ou demonstrativo precedente. Isto vai contra a hipótese funcionalista kiparskiana, pois, levando-a em consideração, esperar-se-ia que a presença de uma marca no primeiro elemento provocasse sempre um índice significativamente maior de queda na segunda posição. Todavia, a segunda posição precedida de s- é marcada em 92% das vezes. Podemos comprovar o que dissemos acima através dos números contidos na tabela 6.2.3.14.

TABELA 6.2.3.14 MARCAS PRECEDENTES, POSIÇÃO E POSSESSIVO MARCAS

POSIÇÃO

FALANTES Adultos

Crianças

Ausência

1

184/184 = 100%

42/43 = 98%

0 (zero)

2

75/75 = 100%

12/12 = 100%

s-

2

55/60 = 92%

12/13 = 92%

O percentual de ausência de marcas na segunda posição precedida de s- na primeira posição é muito pequeno para se apontar uma tendência funcionalista forte. Além disso, o funcionamento de todos os demais fatores indica, tanto nos dados dos adultos quanto nos das crianças,

um comportamen-

182

to extremamente regular não funcionalista, em direção às conclusões de Poplack: presença de marcas leva a marcas e presença de zeros leva a zeros. Mesmo nos casos das construções em sintagmas preposicionais dentro de um SN mais alto, o índice de marcas é função da existência de "esses" ou de zeros. Assim SPrep(x)s- (MILHÕES DE coisas e UM GRUPO DE CRIANÇAS abandonadas) favorece mais a inserção de marcas no segmento sob análise do que o SPrep0(0)- (UMA PORÇÃO DE carro e UMA PORÇÃO DE COISA interessante). Além disso, observa-se que a presença de duas ou três marcas formais precedentes (AS MAIORES privações e AS PARTIDAS TODAS iguais) constitui o fator que, percentualmente, mais favorece a presença de concordância no segmento seguinte. Dentro da mesma linha, verifica-se que a presença de pelo menos uma marca precedente não mediada por zero continua a favorecer marcas no segmento seguinte, embora com um percentual menor. Inversamente, a presença de um zero precedente, desde que já se tenha uma marca no primeiro ou no segundo elemento, provoca quase que categoricamente o aparecimento de um outro zero no segundo segmento. O comportamento dos três últimos fatores é altamente regular até mesmo em um pequeno número de dados, pois, antes de agruparmos os seus diversos casos, observamos separadamente cada um deles. Em termos percentuais pelo menos, podemos afirmar que o Português tem um comportamento bastante semelhante ao do Espanhol, o que traz mais evidências sobre uma variável de comportamento forte que não é estritamente regida pela hipótese funcionalista nos moldes de Kiparsky (1972).

183

6.2.3.6 - Relação entre Marcas Posição e Classe gramatical

precedentes,

Apresentamos, no item 6.2.3.3, resultados percentuais que mostram que o substantivo, por um lado, e o adjetivo, o possessivo e o quantificador, por outro, evidenciam comportamento diferenciado em função da segunda e terceira posição no SN: o substantivo é menos marcado na segunda do que na terceira posição (ou quase igualmente marcado nestas duas posições), enquanto o adjetivo e o possessivo são mais marcados na segunda do que na terceira e o quantificador é pouco marcado tanto na segunda quanto na terceira posição. Apresentamos, no item 6.2.3.4, evidências de que o tipo e o número de marcas precedentes influencia a presença ou ausência de marcas seguintes e chegamos a mostrar que o possessivo da segunda posição praticamente não sofre influência de s- ou de zero na primeira posição (ver tabela 6.2.3.14, p.181). Evidenciamos, também, que os fatores ausência fora do SN ou zero na primeira posição têm efeito regular, praticamente categórico sobre qualquer classe (ver tabelas 6.2.3.13 e 6.2.3.14). Resta ainda saber

1) se todas as classes que ocupam a terceira, quarta e quinta posição do SN são igualmente afetadas por marcas formais ou zeros precedentes; 2) se todas as classes em SPreps, inseridos num SN mais alto, são igualmente afetadas; 3) se todas as classes que ocupam a segunda posição do SN se

184

comportam da mesma forma que o possessivo, ou seja, se são indiferentemente afetadas pela presença ou ausência de marca formal de plural no elemento da primeira posição e 4) se todas as classes que ocupam a segunda posição do SN são igualmente afetadas pelo numeral da primeira posição.

Para a discussão do primeiro ponto, vejamos a tabela 6.2.3.15, na página seguinte. Esta tabela

contém os resultados percentuais que

envolvem o substantivo, o adjetivo, o possessivo e o quantificador, que são as classes da terceira, quarta e quinta posição que nos interessam particularmente, neste ponto. Através dos resultados da tabela 6.2.3.15, percebe-se que o efeito das marcas precedentes é absolutamente regular para qualquer classe gramatical que ocupa as referidas posições, ou seja,

- marca formal precedente favorece o aparecimento de marca formal no segmento seguinte; - forma zero precedente favorece o aparecimento de zero no segmento seguinte.

Observa-se ainda que, coerentemente com os dados globais, a presença de ss(s)- é mais forte do que a de y(x)x- no sentido de favorecimento de marcas seguintes.

185

TABELA 6.2.3.15 MARCAS PRECEDENTES, TERCEIRA POSIÇÃO E CLASSE GRAMATICAL MARCAS

POSIÇÃO

CLASSE

FALANTES Adultos

ss(s)3e4 (OS OUTROS colégios)

Subst.

ss(s)3e4 (UMAS PESSOAS ricas)

Adj.

ss3 (UNS AMIGOS meus)

Poss.

%

Crianças %

Total

%

158/211=75

23/31= 74

181/242=75

73/109=67

10/15= 67

83/124=67

2/4 =50

2/2 =100

4/6 =67

22/41 =54

1/2 = 50

23/43 =53

152/285=53

22/50= 44

174/335=52

39/72 =54

5/8 = 62

44/80 =55

0/1 = 0

xxx

0/1 = 0

ssm4 Quant. (AS CONTAS QUASE toda)

0/1 = 0

xxx

0/1 = 0

x0(0)3e4 (AS OTA menina)

Subst.

3/14 =21

0/4 = 0

3/18 =17

x0(0)3,4,5 (AS LEI trabalhista)

Adj.

10/113= 9

1/15= 7

11/128= 9

x03e4 (UNS COLEGA meu)

Poss.

0/6 = 0

0/2 = 0

0/8 = 0

0/66 = 0

0/3 = 0

0/69 = 0

ss3 Quant. (AQUELAS BRIGAS todas) 0s(x)3e4 (DO MEUS pais)

Subst.

sx(x)3e4 (COISAS ATÉ ligadas)

Adj.

xs3 (DOIS IRMÃOS meus)

Poss.

s03 Quant. (NAQUELES NEGÓCIO todo)

As outras classes que ocorrem nesta posição são (a) categorias substantivadas (24 casos) e (b) indefinidos e adjetivo 2 (cinco casos). E-

186

las apresentam comportamento semelhante ao dos elementos especificados na tabela 6.2.3.15, conforme se pode ver abaixo: A) ss(s)- ................................. 3/3 = 100%; B) y(x)x- .................................17/24 = 71%; C) x(y)0-................................. 0/2 =

0%.

Uma série de observações interessantes a respeito dos tipos de seqüências possíveis merecem ser feitas. Guy (1981a) levanta a hipótese de que a concordância de número entre os elementos do SN opera da seguinte forma: ela se limita a copiar a informação plural da esquerda para a direita através do nódulo SN. Conseqüentemente, "(...) ela não seria capaz de saltar sobre as palavras, produzindo seqüências marcada-não marcada-marcada" /grifos nossos/ (p.169),71 ou seja, segundo ele, seqüências do tipo s0s são improváveis e, se ocorrerem, isto deve ser creditado à influência de fatores que atuam sobre a queda do -S final não morfêmico e não a fatores que atuam sobre o -S morfêmico. Em termos percentuais, os nossos dados comprovam esta hipótese, pois apenas três casos de substantivos (essas nossa dificuldades) e 11 de adjetivos (as coisa naturais) apresentam tais seqüências, ou seja, 1% do total de seqüências de três ou mais constituintes(14/1053). Verificando os 14 casos de s0s, podemos constatar que oito deles ocorrem diante de consoantes sonoras (das quais cinco são nasais), um diante de vogal e cinco diante de consoantes surdas. Dentre estes últimos cinco casos, quatro ocorrem diante de consoantes labiais e um dian-

187

te de velar. Em verdade, 12 dos 14 casos (86%) ocorrem em ambientes que favorecem levemente a queda do -S final não morfêmico (cf. SCHERRE, 1979, p.7 e GUY 1981a, p.144). Conforme já vimos, Scherre (1979), analisando a influência do contexto fonético/fonológico seguinte sobre a inserção de marca formal de plural em elementos do SN, com base nos mesmos dados de Scherre (1978), conclui que "os traços [+surdo] e [+consonantal] favorecem a aplicação da regra e os traços [-surdo] e [+consonantal] desfavorecem-na". (p.7) Verificamos também que Guy (1981a), ao falar sobre a queda do -S não morfêmico, conclui que (1) consoantes sonoras favorecem cancelamento mais do que surdas e consoantes labiais, em relação às velares, favorecem também o cancelamento (cf. p.143-4). Ele considera ainda que este efeito, embora com magnitude reduzida, permanece na análise do -S morfêmico (cf. p.166). Cumpre relembrar que os resultados obtidos para a análise desta variável nos dados em questão são perfeitamente paralelos aos de Guy (1981a), conforme se pode ver no item 6.2.3 deste trabalho. Concluindo, as seqüências s0s são realmente fruto da influência do contexto fonético/fonológico seguinte sobre a queda do -S final não morfêmico e não um efeito específico sobre a concordância de número entre os elementos do SN. Resta ainda a questão das seqüências do tipo 0s (grande viagis) e 0sx (do meus pais; no meus problemas) que também não deveriam ocorrer, considerando a forma da regra operar, prevista por Guy (1981a). Seqüências 0s, as de SNs de dois elementos, são muito poucas. Há ape-

188

nas 33 casos num total de 4290 estruturas: 0,8%. As seqüências 0sx já são em maior número. Dentre os 1053 casos de SNs de três ou mais elementos, 97 são deste tipo: 9%. É o percentual mais alto de todas as ocorrências não previstas pela forma da regra operar. Já falamos sobre estes casos no item anterior, p.151-167. Mostramos que 94 destes 97 casos são de uma estrutura bastante particular: [artigo + possessivo ou demonstrativo + substantivo] (do meus pais). Refutamos a hipótese da influência da nasalidade, por ocorrerem estruturas do tipo no teus filhos72 e por haver apenas outros três casos, dentre 36, diante de nasais. Malgrado a sistematicidade desta estrutura, fizemos um levantamento dos segmentos seguintes nos 130 casos em questão, à luz de que os traços [sonoro], [labial] e [dental] desfavorecem levemente a inserção do morfema de plural, como um reflexo no favorecimento da queda do -S não morfêmico, e concluímos que os casos de 0s, 0ss ou 0s0 também podem ser explicados pela influência do contexto seguinte. A distribuição dos 130 casos em função desta variável é a seguinte: 1) 107 casos ocorrem diante de sonoras (82%); 2) 8 casos ocorrem diante de surdas labiais e dentais (6%) e 3) 15 casos ocorrem diante de surdas velares e diante de vogais (12%). Dos 130 casos, 115 (88%) não marcados estão diante de ambiente propício ao cancelamento do -S não morfêmico. Acreditamos, portanto, que a concordância de número entre os elementos do SN em português opera realmente da forma proposta por Guy (1891a): aplica-se ao nódulo

189

do SN da esquerda para a direita sem saltar nenhuma palavra, a não ser as que não podem ser marcadas. Gostaríamos, todavia, de acrescentar que, além da não freqüência de seqüências do tipo s0s ou 0s(x), há também uma preferência pelas seqüências sss ou x00, ficando as seqüências do tipo yxx sem preferência nítida, como se pode ver pelo quadro 6.2.3.16, com base nos dados dos adultos e das crianças conjuntamente.

QUADRO 6.2.3.16 SOBRE ESTRUTURAS PREFERENCIAIS ESTRUTURAS

Subst.

Adj.

Poss.

Quant.

Total

sss(s)xs0(0)Total-

181 (75%) 61 (25%) 242

83 (67%) 41 (33%) 124

4 (67%) 2 (43%) 6

23 (53%) 20 (47%) 43

291 (70%) 124 (30%) 415

x0x(s)x00(0)Total

3 (21%) 15 (79%) 18

11 ( 9%) 117 (81%) 128

0 ( 0%) 8 (100%) 8

0 ( 0%) 69 (100%) 69

14 ( 6%) 210 (94%) 223

yxx(s)yx0(0)Total

174 (52%) 161 (48%) 335

44 (55%) 36 (45%) 80

0 ( 0%) 1 (100%) 1

0 ( 0%) 1 (100%) 1

218 (52%) 199 (48%) 417

A distribuição acima evidencia com clareza que o falante prefere a estrutura com todas as marcas formais de plural -sss- (os outros colégios; as partidas todas iguais; uns amigos meus; aquelas brigas todas) ou com zeros, uma vez marcada a primeira posição, -x00- (as lei trabalhista; uns colega meu; aqueles negócio todinho; umas borracha grande; dois risco verde; quatro quarto reservado; aqueles cabelim branquim; duas cebola descascada; aquelas casa bem antiga; as conta quase toda).

190

A estrutura que apresenta a mistura de marcas precedentes, quer quanto à quantidade, quer quanto ao tipo (do meus pais, dois irmãos meus; os três dias) ou a que tem a marca mediada por um modificador (coisas até ligadas; umas pessoa muito ricas) não apresenta preferência nítida de presença ou ausência de marca na última posição: ocorre tanto -S quanto 0 no terceiro elemento. Além disso, é importante observar a distribuição das estruturas ss-, x0- e yx- em termos das classes gramaticais que aí podem ocorrer. O quadro 6.2.3.17 reapresenta esta distribuição.

QUADRO 6.2.3.17 ESTRUTURAS PREFERENCIAIS E CLASSE GRAMATICAL ESTRUTURAS

Subst.

Adj.

Poss.

Quant.

Total

sss(s)xs0(0)Total

181 61 242(41%)

83 41 124(37%)

4 2 6(31%)

23 20 43(36%)

291 124 415(39%)

x0x(s)x00(0)Total

3 15 18 (3%)

11 117 128(37%)

0 8 8(56%)

0 69 69(61%)

14 210 223(21%)

yxx(s)yx0(0)Total

174 161 335(56%)

44 36 80(25%)

0 1 1(12%)

0 1 1 (3%)

218 199 417(40%)

Com base nas distribuições do quadro 6.2.3.17, podemos então verificar o seguinte:

1) Os substantivos privilegiam as estruturas ss- (os outros colégios) ou yx- (do meus pais; os três dias). Em 595 estruturas, 242 (41%) são

191

do primeiro tipo e 334 (56%) do segundo, perfazendo um total de 577 casos, ou seja, 97%. Apenas 18 casos ocorrem em x0- (as ota menina), com o percentual de 3%. 2) Os adjetivos se distribuem uniformemente. Dos 330 casos, 124 (37%) ocorrem em ss- (umas pessoas ricas); 82 (25%) em yx- (coisas até ligadas; dois cavalos lindo); 124 (38%) em x0- (as lei trabalhista; dois risco verde). 3) Os quantificadores privilegiam as estruturas x0- (essas coisa toda). Dentre 113 casos, 69 (61%) são deste tipo e praticamente não ocorrem em yx- (as contas quase toda); apenas 4 casos (3%) são do tipo yx-. O restante - 41 (36%) - fica igualmente na estrutura ss- (aquelas brigas todas). 4) Os possessivos também privilegiam a estrutura x0- (uns colega meu; três colega meu): 53% dos casos (8/15). Também ocorrem pouco em estruturas yx- (dois irmãos meus) - 7% (1/15). O restante fica por conta da estrutura ss- (uns amigos meus) - 40% (6/15).

As observações feitas até aqui tiveram como objetivo mostrar a relação entre marcas precedentes e classes gramaticais que ocorrem na terceira, quarta e quinta posição. Vamos verificar agora o segundo ponto em questão: se todas as classes inseridas em SNs mais altos são igualmente afetadas pelas marcas precedentes. Para isto, vamos casos na tabela 6.2.3.18, a seguir.

observar a distribuição detalhada destes

192

TABELA 6.2.3.18 SOBRE OS SNS INSERIDOS EM SNS MAIS ALTOS MARCAS

POSIÇÃO DE ANÁLISE

CLASSE

FALANTES Adultos 4/7

= 57%

Crianças

SPrepS-

2

Subst.

SPrep0-

2

Subst.

SPrep0-

2

Ind.

4/4

= 100%

xxx

SPrep+S-

3

Subst.

4/4

= 100%

xxx

SPrep+S-

3

Adj.

3/5

= 60%

xxx

SPrep+0-

3

Adj.

0/8

= 0%

SPrep+0-

3

Poss.

64/164 = 39%

xxx

1/1

= 100%

14/78

= 18%

0/2

= 0% xxx

Os percentuais acima indicam que (1) o SprepS- (MILHARES DE coisas; MILHÕES DE pessoas) favorece a presença de -S no substantivo seguinte enquanto o Sprep0- (UMA PURÇÃO DE carro; UM MONTÃO DE ingresso) a desfavorece; (2) o Sprep+S- (UMA SÉRIE DE OTRAS coisas; PURÇÃO DE OTROS cantores; UM GRUPO DE CRIANÇAS abandonadas; UM MONTE DE IDÉIAS diferentes), também favorece a presença de -S em substantivos e adjetivos e o Sprep+0- (UM MONTÃO DE NEGO velho; UMA PURÇÃO DE PEIXINHO colorido; UM MONTE DE USINA nuclear) também desfavorece a presença de marcas em adjetivos. Observe-se que a influência de SPrep+0- é a mais forte de todas, porque os elementos que estão nesta situação são precedidos de 00-, ou seja, zero do núcleo nominal mais alto e do mais baixo. Esta é a única situação dos dados por nós analisados em que ocorre a forma 000: ausência de qualquer marca formal de plural, mas com carga semântica de

193

pluralidade, carga esta que é transmitida através do núcleo nominal mais alto das estruturas em questão. Ocorre apenas um caso de possessivo: encontrase na terceira posição (PUÇÃO DE BLOQUINHO nosso) e se comporta como adjetivo: não marcado. Os únicos casos que fogem, portanto, do esperado são os indefinidos de segunda posição precedidos de SPrep0- (UMA PURÇÃO DE otos cantores): eles apresentam 100% de marcas. Isto está exatamente dentro da terceira questão que queremos discutir: se todas as classes que ocupam a segunda posição do SN se comportam da mesma forma que o possessivo, ou seja, se são indiferentemente afetadas pela presença ou ausência de marca no elemento precedente. Vejamos a tabela 6.2.3.19 que apresenta resultados de marcas precedentes, segunda posição e classe gramatical.

194

TABELA 6.2.3.19 MARCAS PRECEDENTES, SEGUNDA POSIÇÃO E CLASSE GRAMATICAL CLASSE

FALANTES

GRAMATICAL

MARCAS Zero

s-

Numeral

1806/3482 = 52% 261/719 = 36%

884/1524 = 58% 146/257 = 57%

Substantivo

Ad. Cr.

21/21 = 100% 4/4 = 100%

Categoria subst.

Ad. Cr.

1/1 = 100% 0/1 = 0%

57/87 13/19

= 66% = 68%

Pronome pessoal

Ad. Cr.

xxx xxx

27/33 3/5

= 82% = 60%

xxx xxx

Adjetivo

Ad. Cr.

7/7 = 100% 2/2 = 100%

119/157 = 76% 16/16 =100%

xxx xxx

Quantificador

Ad. Cr.

xxx xxx

3/7

Possessivo

Ad. Cr.

75/75 = 100% 12/12 = 100%

Adjetivo 2

Ad. Cr.

Indefinido

Artigo e demonstrativo.

2/5

= 40% xxx

= 43%

xxx xxx

55/60 12/13

= 92% = 92%

xxx xxx

xxx xxx

21/27 1/1

= 78% =100%

xxx xxx

Ad. Cr.

xxx 1/1 = 100%

41/44 5/8

= 94% = 62%

xxx xxx

Ad. Cr.

xxx xxx

75/75 15/15

=100% =100%

xxx xxx

xxx

Observando os percentuais desta tabela, podemos perceber que as classes da segunda posição não são igualmente afetadas em função das marcas precedentes. Os substantivos, se precedidos de zero, apresentam marcas categóricas positivas mas, se precedidos de s- ou de numeral, reduzem consideravelmente o número de marcas. Os adjetivos, no caso dos adultos, apresentam menor número de marcas quando precedidos de s- do que de zero. No caso das crianças, apresentam-se categoricamente marcados, em termos positivos. Os adjetivos 2, para os adultos, comportam-se como adjetivos e, para as

195

crianças, não há número de dados suficientes para se fazer qualquer comentário. A categoria substantivada apresenta comportamento percentual intermediário entre os substantivos e os adjetivos e os pronomes pessoais têm um comportamento diferenciado dos substantivos. Os indefinidos (exceto no caso das crianças), os artigos e demonstrativos apresentam comportamento idêntico ao dos possessivos: são também muito marcados na segunda posição, mesmo quando precedidos de marca na primeira. Estávamos vendo até aqui que a variável Marcas precedentes exercia um efeito extremamente uniforme sobre todas as classes gramaticais, à exceção do possessivo na segunda posição e dos indefinidos em SPrep0-. Através dos resultados percentuais descritos acima, podemos agora verificar que a presença de marca na primeira posição exerce efeito diferenciado em função da classe gramatical. Isto mostra, mais uma vez, a necessidade da variável Classe na análise dos dados. É exatamente com relação ao comportamento dos elementos da segunda posição que o Português e o Espanhol diferem. Segundo Poplack, um zero na primeira posição também conduz a outro zero na segunda posição (cf. 1977, p.16 e 1981, p.61). Isto não ocorre em Português, pelo menos no tipo de dado que levantamos. O zero na primeira posição conduz a mais marcas do que a própria presença de marcas e, às vezes, a classe é indiferente à existência ou não de marcas na primeira posição. Poplack observa, também, que "o contexto mais favorável ao can-

196

celamento da marca é precisamente quando as duas marcas precedentes já foram canceladas" (1980a, p.64),73 o que conduz a formas do tipo 000. Neste aspecto, o nosso trabalho também difere do de Poplack. Segundo ela, em Espanhol há formas do tipo:

- la [0] cosa [0] bonita [0]

com informação semântica de plural deduzida do contexto, embora o falante do Espanhol não as reconheça como plural de forma isolada (cf. 1980a, p.14).74 Este tipo de SN não existe em Português. Há sim casos do tipo menina bonita não chora com sentido genérico. Mas, para nós, não se trata aí de cancelamento ou ausência de inserção de marca formal de plural. Pode-se ter em Português a idéia de plural sem nenhuma marca formal de plural, quer seja através de um substantivo coletivo do tipo pessoal, povo, turma, gente, quer através do uso genérico de menina bonita não chora, quer através de outras palavras que denotam pluralidade muito livro caro, havia roupa espalhada na vitrine, bastante coisa, como bem o coloca Pereira (cf. 1984, p.11; p.36-8 e p.56-65, cf., também, NARO, 1981, p.64). Os únicos casos de 000 observados por nós e analisados em termos da ausência de marca formal de plural nos elementos flexionáveis são do tipo já referenciado: uma purção de peixinho colorido. Embora haja três zeros, do ponto de vista da forma, uma purção de é semanticamente plural e induz à idéia de pluralidade no substantivo do SN mais baixo. Todavia, não há dúvidas de que os dois zeros formais precedentes a colorido conduzem-no a ser sempre não marcado.

197

A outra possibilidade de estruturas não formalmente marcadas mas semanticamente plurais, e também não analisadas por nós, diz respeito ao uso de construções cristalizadas que envolvem partes do corpo do tipo Paula e Rafael, vem lavá a mão, o pé e escová o dente. Estas estruturas são comuns em Português mesmo com referência "às duas mãos", "aos dois pés" e, certamente, "aos dentes". Trata-se necessariamente de "mais de um", numa relação de posse inalienável, em estruturas cristalizadas. Toda a argumentação apresentada até o presente momento nos leva à conclusão de que a variável Marcas, desvinculada das variáveis Posição e Classe, não dá uma visão adequada dos fatos lingüísticos em Português. É, portanto, necessária a consideração dessas três variáveis, mesmo que a análise fique menos elegante. Com relação à quarta questão, se todas as classes gramaticais que ocupam a segunda posição do SN são igualmente afetadas pelo numeral da primeira posição, ela simplesmente não faz sentido. A grande maioria destes casos é de substantivo: 1524 dos 1528 nos dados dos adultos e os 257 dados das crianças. Os cinco casos restantes são

de categoria

substantivada (ver tabela 6.2.3.19). Vamos passar a apresentar a seguir os resultados probabilísticos que envolvem uma análise que codifica (1) Posição, (2) Marcas precedentes em função da posição e (3) Classe gramatical, com o objetivo de buscarmos a melhor forma de descrever os fatos lingüísticos que temos em mãos e verificarmos que explicações podem ser dadas para o efeito das variáveis sob consideração, bem como para a relação entre a configuração sintagmática do SN e o número de marcas de plural.

198

6.2.3.7 - Análises alternativas

Vamos apresentar resultados probabilísticos de análises alternativas, considerando as três variáveis discutidas: Posição, Classe gramatical e Marcas precedentes. Na análise A, apresentamos os dados codificados à semelhança de Guy para as variáveis Posição e Marcas, na sua forma final (cf. 1980a, p.168-80).75 Para a variável Posição, consideramos, portanto, quatro fatores: 1) primeira posição; 2) segunda posição; 3) terceira posição e 4) quarta e quinta posição. A variável Marcas precedentes foi subdividida, conforme Guy (1981a), em cinco fatores: 1) ausência fora do SN e zero na primeira posição; 2) marcas formais imediatamente precedentes(s-; ss-; 0s-; sss-) ; 3) segmento precedente não flexionável, incluindo todos os numerais, em qualquer posição (n-; sm-; ns-; sn-; n0-; ssm-; nsm-; s0m-; n0m-; ssmm- e s0mm-) ; 4) s- precedente mas não imediatamente (s0-; s00-; ss0-) ; 5) sintagma preposicional inserido dentro de um SN mais alto com marca semântica de plural (SPrep). A variável Marcas apresentada aqui contém uma diferença com

199

relação à de Guy. Ele colocou em um só fator (1) a ausência fora do SN, (2) o zero na primeira posição e (3) 00 ou n0 precedentes. Mas, considerando que as probabilidades respectivas são 0,98, 0,96 e 0,32 (cf. 1981a, p.170-7), colocamos, na análise A, n0- junto aos numerais ou outros segmentos não flexionáveis, embora isto ainda não seja o mais adequado

como vamos

mostrar na análise B. Conforme já afirmamos, ocorrências de 000 não foram constatadas em nossos dados. Outra diferença ainda pode ser apontada. Todos os casos de quarta e quinta posição foram colocados por Guy juntos ao fator com maior número de casos: s- ou ss- imediatamente precedente. Segundo Guy, esta colocação arbitrária se deu porque as marcas das primeiras posições destes casos não eram diretamente recuperáveis pelo sistema de codificação original. Considera ele que, "uma vez que há tão poucos dados envolvidos aqui, isto não introduziria qualquer distorção significativa." (1981a, p.177)76 Na análise ora apresentada, fizemos a codificação correta. Os casos terminados em sou em 0-, sem numeral, ficaram em seus devidos lugares e todos os casos de elementos não flexionáveis foram codificados juntos. Esta forma de analisar estabelece pouca superposição entre Marcas precedentes e Posição e foi considerada por Guy, como já dissemos, melhor que aquela que observa o detalhamento de Marcas precedentes em função da Posição (cf. 1981a, p.178). Introduzimos, por razões já expostas, uma variável nova nesta análise: a Classe gramatical, conforme descrita no item 6.2.3.3 e resumida no quadro 6.2.3.2, p.150. Voltamos a observar que o fator n0- (DOIS risco verde), que Guy

200

colocou junto a ausência fora do SN na primeira posição (cf. 1981a, p.177) e que nós colocamos nesta análise junto a "numeral", deverá ser colocado junto a s0-, principalmente se quisermos seguir as idéias de Poplack de que, exceto a ausência fora do SN, marcas levam a marcas e zeros levam a zeros. Acrescentamos ainda que, se desejarmos fazer uma comparação adequada com Poplack, temos de reorganizar uma série de outros dados colocados junto a "numeral" em termos de terem um s- ou um zero precedendo o elemento analisado. Então seqüências do tipo 0s-; sm-; ssm- e ssmm- devem todas ficar juntas, formando um fator, pois apresentam marcas imediatamente precedentes ou apenas mediadas por um numeral ou modificador, enquanto seqüências

do tipo n0-; s0n-; s0m-; n0m-; s0mm- devem todas também

ficar juntas, formando outro fator, pois apresentam um zero precedente, também mediado por elementos não marcados formalmente. Estas seqüências, que sugerimos que sejam separadas em dois fatores diferentes, estão todas agrupadas junto ao numeral precedendo o elemento da segunda posição (três CAPÍTULOS), pois todas elas têm ou um numeral ou um modificador: segmentos precedentes não flexionados, que foram agrupados por Guy (cf. 1981a, p.169) e por outros estudiosos já citados. Sob a perspectiva de Poplack, dados de natureza completamente distinta estão num só fator na análise A, pois o que importa neste caso é a presença ou ausência de marcas formais. Esta reorganização é feita na

análise B,

descrita a seguir. Na análise B, mantivemos as variáveis Posição e Classe da mes-

201

ma forma que na análise A e recodificamos a variável Marcas precedentes em função da posição nos moldes de Poplack. Ela ficou constituída de nove fatores, a seguir relacionados: 1) ausência fora do SN; 2) zero na primeira posição; 3) SPrep(x)s- na primeira e/ou segunda posição; 4) SPrep0(0)- na primeira e/ou segunda posição; 5) numeral na primeira posição; 6) s- na primeira posição; 7) ss(s)- dois ou três "esses" imediatamente precedentes; 8) y(x)x- pelo menos um s- precedente, não mediado por zero(0s-; sm-; ns-; sn-; ssn-; 0sn-; ssm-; nsm-; ssmm-) ; 9) x(y)0- pelo menos um zero imediatamente precedente não mediado por s-, com uma marca formal ou um numeral na primeira posição (s0-; n0-; s00-; ss0-; sn0-; s0n-; s0m-; s0mm-).

O quadro 6.2.3.12, apresentado na p.177, contém exemplos diversos de cada um destes nove fatores. É claro que a análise B codifica dois fatores de forma bastante superposta, pois Marcas precedentes é praticamente uma subdivisão de Posição. O nosso objetivo central neste momento é verificar o que ocorre, do ponto de vista estatístico, com as três variáveis juntas tanto na análise A quanto na análise B, ou seja, queremos saber quais variáveis são selecionadas pela metodologia que usamos e em que ordem esta seleção ocorre e com que significância.

202

Em ambas as análises, para os adultos, constatamos que, de um total de 10 variáveis, (1) Marcas precedentes é a primeira variável selecionada, com significância 0.0; (2) Classe gramatical é a quinta variável selecionada com significância também 0,0; (3) Posição é a décima variável selecionada, ou seja, a última, com significância 0,003 na análise A e 0,008 na análise B, sem convergência no último passo da análise, até a iteração número 100, em ambas as análises.

Com relação aos resultados das crianças, verificamos que, em ambas as análises contendo nove variáveis, Marcas precedentes é também selecionada em primeiro lugar com significância 0,0, mas a ordem de seleção de Classe não é relevante em relação às demais variáveis: a significância é 0,000. A variável Posição, por sua vez, é selecionada apenas na análise A, mesmo sem convergência. Embora esta variável não seja selecionada na análise B, seus valores probabilísticos ainda permanecem diferenciados e com convergência. Encontram-se na tabela 6.2.3.20, na p.204, os resultados de Marcas precedentes da análise A para os dados dos adultos e das crianças separadamente. Transcrevemos os resultados de Guy (cf. 1981a, p.179) com uma só diferença: Guy coloca em sua tabela - a de número 6-17 - apenas os valores do total, o percentual e as probabilidades. Calculamos a aplicação da regra a partir dos valores dados. Os resultados dos três grupos de falantes são bastante semelhantes, principalmente no que diz respeito à hierarquia entre os fatores. De uma forma geral, eles confirmam as conclusões anteriores: ausência de

203

marca fora do SN e zero na primeira posição favorecem a concordância (0,94; 0,90; 0,86) e presença de pelo menos uma marca antes do elemento analisado a desfavorece relativamente (0,59/0,49/0,57; 0,57/0,39/0,47; 0,04/0%/0,21; 0,45/0,16/0,35), conforme se pode ver pelas respectivas probabilidades atribuídas aos outros quatro fatores. Em termos das diferenças entre estes quatro fatores que apresentam pelo menos uma marca antes do elemento analisado, quer semântica quer formal, emergem as mesmas questões já levantadas por nós e abaixo relacionadas. 1) Como dar uma explicação uniforme para a influência diferente do "numeral" e do SPrep? Ambos têm marcas semânticas de plural, mas, enquanto os numerais favorecem relativamente a presença de concordância (0,59; 0,49; 0,57), o SPrep a desfavorece (0,45; 0,16; 0,35).

204

TABELA 6.2.3.20 MARCAS PRECEDENTES: ANÁLISE A MARCAS

%

Prob.

Adultos

4330/4440 = 98

0,94

Crianças Guy(1981a)

855/874 = 98 4842/5097 = 95

0,90 0,86

Numeral ou outro segmento não flexionável

Adultos

1055/1891 = 56

0,59

Crianças

169/314

= 54

em qualquer posição

Guy(1981a)

488/1437

= 34

0,49 0,57

Marcas formais imediatamente

Adultos

2507/4420 = 57

0,57

Crianças

368/862

= 43

0,39

precedentes(s,ss,

Guy(1981a)

699/2914

= 24

0,47

Ausência fora do SN e zero na 1a. posição

FALANTES

Apl./Total

sss, 0s etc.) Marcas formais não imediatamente

Adultos

7/142

=

5

0,04

Crianças

0/12

=

0

-

precedentes (n0,

Guy(1981a)

8/131

=

6

0,21

79/193

= 41

0,45

15/81

= 19

0,16

140/209

= 67

0,35

s0, ss0,s00 etc.) SPrep

Adultos Crianças Guy(1981a)

2) Como explicar o fato de que "esses" imediatamente precedentes favoreçam mais a concordância (0,57; 0,39 e 0,47) do que um s- não imediatamente precedente (0,04; 0%; 0,21)? Em outras palavras, como explicar que marcas estão levando a marcas e zeros a zeros, se o fator "snão imediatamente precedente" em verdade é sempre seguido de um ou

205

mais zeros? A rigor, este fator seria mais adequadamente descrito como "zero imediatamente precedente com uma marca na primeira posição". Através da análise B, descrita nas paginas 202 e 203, pretendemos mostrar que todas as questões levantadas são adequadamente respondidas. Apresentamos na tabela 6.2.3.21 resultados probabilísticos para os nove fatores que constituem agora a variável Marcas precedentes.

TABELA 6.2.3.21 MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO: ANÁLISE B MARCAS

POSIÇÃO DE ANÁLISE

FALANTES Adultos Apl./Total

Ausência Zero na 1a. posição

1

% Prob.

4225/4335 =

2

105/105

Crianças

97 0,92

= 100

+

Apl./Total

% Prob.

836/855

= 98

0,93

19/19

= 100

+

Numeral na 1a. pos. s- na 1a. posição

2

886/1529 =

58 0,56

146/258

= 57

0,72

2

2205/3974 =

55 0,49

326/796

= 41

0,57

Sprep(x)sSprep0(0)-

2e3 2e3

11/16 68/177

69 0,71 38 0,34

1/1 14/80

= 100 + = 17 0,28

ss(s)y(x)xx(y)0-

3e4 3,4,5 3,4,5

258/368 207/382 13/200

= 70 0,61 = 54 0,47 = 6 0,04

36/50 28/59 1/25

= 72 = 47 = 4

= =

0,76 0,58 0,01

Os resultados desta tabela apresentam, em termos probabilísticos,

206

regularidades que já mostráramos em termos percentuais e que são parcialmente encobertas pela análise do tipo A, suscitando explicações ad hoc. À exceção dos fatores ausência fora do SN e zero na primeira posição que favorecem, respectivamente, marcas na primeira e segunda posição,

todos os demais nos levam a uma conclusão absolutamente

consistente: marcas levam a marcas e zeros levam a zeros. O SPrep que contém um s- (MILHARES DE coisas) ou seguido de um s- (UMA SÉRIE DE OUTRAS coisas; UMA PORÇÃO DE CRIANÇAS abandonadas) favorece a inserção de s- no segmento analisado, enquanto o SPrep que contém um zero (UMA PORÇÃO DE coisa) ou que é seguido de zero (UMA PORÇÃO DE PEIXINHO colorido) favorece a forma zero seguinte. Antes de efetuarmos este agrupamento, fizemos análises prévias dos dados dos adultos separando o SprepS- do Sprep+S- e Sprep0- do Sprep+0-, obtendo os seguintes resultados: A) SprepS- ............................................. 0,70; B) Sprep+S- ........................................... 0,77; C) Sprep0- ............................................. 0,40; D) Sprep+0- ...........................................

0%.

Como o número de dados de SprepS- (4/7) e Sprep+S- (7/9) era muito pequeno e o comportamento era idêntico, consideramos oportuno e adequado agrupá-los. O número de dados de Sprep+0 (0/9), e também o seu comportamento, levou-nos, conseqüentemente, a agrupá-los com Sprep0(68/168). Os dados das crianças impossibilitaram uma análise probabilística prévia, pois há apenas um caso de SprepS- (1/1) e dois de Sprep+0 (0/2) (ver tabela 6.2.3.18, p.192).

207

Então, não é simplesmente o SPrep que desfavorece a aplicação da regra, como tem sido dito por todos os pesquisadores que consideraram este fator, mas sim o SPrep0(0)-. As baixas probabilidades atribuídas ao SPrep decorrem do fato de a maioria dos casos serem de SPrep0(0)- (92) e não de SPrep(x)s- (8), o que não nos impediu, a nível grupal, de detectar a mesma regularidade encontrada nos demais fatores. Não precisamos agora de explicações ad hoc para dar conta do comportamento do numeral e do SPrep, ambos com carga semântica de pluralidade. A carga semântica junto ao SPrep(x)s- favorece mais a aplicação da regra do que os numerais: duas marcas levam a mais marcas. O numeral, por sua vez, favorece mais a inserção de marcas no segmento analisado do que o SPrep0(0)-: o numeral tem a marca semântica de plural que também conduz a marcas e o SPrep0(0), embora tenha a marca semântica de pluralidade, tem também o zero formal que conduz a zero. O SPrep0(0)-, por sua vez, se comparado com x(y)0- que não

contém marca semântica intrínseca de pluralidade,

conduz a menor índice de zeros, sendo x(y)0- o fator que conduz a maior índices de zeros. As probabilidades destes fatores são, na ordem de favorecimento de aplicação da regra, para os adultos e crianças respectivamente, as seguintes:

A) SPrep(x)s- ......................................... 0,71 e 100%; B) numeral na 1a. Posição..................... 0.56 e 0,72; C) SPrep0(0)- ........................................ 0,34 e 0,28; D) x(y)0-................................................. 0,04 e 0,01.

208

Considerando agora apenas os "esses" precedentes versus zero(s) precedente(s), podemos verificar que a presença de ss(s)- (dois ou mais "esses" precedentes) favorece mais a inserção de -S no segmento analisado do que a presença de s- (marca na primeira posição imediatamente precedente) ou do que a presença de y(x)x- (pelo menos um s- precedente não mediado por zero), embora todos estes três fatores favoreçam a concordância. A presença de x(y)0- (pelo menos um zero precedente não mediado por s-, com marca na primeira posição), por sua vez, desfavorece drasticamente a concordância, como já vimos. Os resultados probabilísticos são destacados, a seguir, para os adultos e crianças, respectivamente: A) ss(s)- ................................................. 0,61 e 0,76; B) s- ....................................................... 0,49 e 0,57; C) y(x)x- ................................................. 0,47 e 0,58; D) x(y)0-................................................. 0,04 e 0,01. Novamente, não são necessárias explicações ad hoc. Os resultados evidenciam que marcas levam a marcas e zeros levam a zeros. Evidenciam também que mais marcas de uma só natureza - ss(s) - conduzem a mais marcas do que uma só marca ou marcas de natureza distinta, evidenciandose a força da proximidade no processamento das unidades lingüísticas.

A segunda variável em foco, a Classe gramatical, apresenta as probabilidades de concordância na tabela 6.2.3.22, para a análise A(Prob.A) e B(Prob.B).

209

TABELA 6.2.3.22 CLASSE GRAMATICAL: ANÁLISES A e B CLASSE GRAMATICAL

FALANTES

Apl./Total

%

Prob.A

Prob.B

Substantivo

Adultos Crianças

3347/5871 486/1158

= =

55 42

0,25 0,22

0,25 0,18

Categoria subst.

Adultos Crianças

75/115 15/22

= =

65 68

0,33 0,41

0,33 0,36

Pronome pessoal

Adultos Crianças

39/45 3/5

= =

87 60

0,73 0,48

0,73 0,45

Adjetivo

Adultos Crianças

290/511 38/56

= =

57 69

0,23 0,36

0,23 0,43

Quantificador

Adultos Crianças

158/248 24/26

= =

64 92

0,38 0,52

0,38 0,61

Possessivo

Adultos Crianças

241/256 68/71

= =

94 96

0,60 0,69

0,60 0,70

Adjetivo 2

Adultos Crianças

33/41 1/2

= =

82 50

0,55 0,36

0,55 0,35

Indefinido

Adultos Crianças

486/477 86/89

= =

98 96

0,81 0,72

0,81 0,71

Artigo e demonstrativo

Adultos Crianças

3343/3438 686/702

= =

97 98

0,62 0,73

0,62 0,74

Esta variável apresenta probabilidades

semelhantes nas duas

análises. Considerando a dispersão natural dos números, com base nas probabilidades da análise B, revelam-se, para os falantes adultos, três agrupamentos de classes: 1) indefinidos (0,81) e pronomes pessoais (0,73); 2) artigos/demonstrativos (0,62), possessivos (0,60) e adjetivos 2 (0,55);

210

3) quantificador (0,38), adjetivos (0,23), substantivos (0,25) e categorias substantivadas (0,33). Utilizando-se o mesmo critério para as crianças, constata-se que, diferentemente dos adultos, formam-se quatro agrupamentos:

1) artigos/demonstrativos (0,74), indefinidos (0,71) e possessivos (0,70); 2) quantificador (0,61); 3) pronomes

pessoais

(0,45),

adjetivos

(0,43),

categorias

substantivadas (0,36) e adjetivos 2 (0,35) e 4) substantivos (0,18). Pelos agrupamentos feitos acima, percebe-se claramente que não há uma linha natural, em termos de classe gramatical, determinando-os. Diversas questões merecem então ser levantadas:

1) Por que os quantificadores e os pronomes pessoais, por exemplo, têm comportamento diferenciado para ambos os grupos de falantes? 2) Por que os adjetivos se comportam como substantivos nos dados dos falantes adultos, mas não nos das crianças? 3) Por que os substantivos formam uma categoria isolada nos dados das crianças?

Antes de tentarmos explicar os agrupamentos categoriais feitos,

211

gostaríamos de apresentar os resultados probabilísticos da variável Posi-ção, mesmo sem convergência e/ou não selecionados. É oportuno observar que os valores probabilísticos das variáveis Marcas e Classe gramatical, apresentados até aqui, trazem em si mesmos o peso probabilístico que deveria ser atribuído à variável Posição, pois eles foram retirados da etapa de análise em que se desconsiderou a influência desta variável, por não haver convergência nos resultados dos adultos e por não ter sido ela selecionada nos dados das crianças. Observando as probabilidades da tabela 6.2.3.23, é possível constatar que a Posição, mesmo ao lado de Marcas precedentes (em função ou não da posição), ainda tem algum efeito.

TABELA 6.2.3.23 POSIÇÃO LINEAR DOS ELEMENTOS NO SN: ANÁLISES A e B POSIÇÃO

FALANTES

Apl./Total.A

%

Prob.A

Prob.B

Primeira

Adultos Crianças

4230/4340 837/856

= 97 = 98

(0,58) (0,44)

(0,89) (0,74)

Segunda

Adultos Crianças

3263/5778 503/1149

= 56 = 44

(0,56) (0,64)

(0,53) (0,44)

Terceira

Adultos Crianças

454/884 60/107

= 51 = 56

(0,57) (0,66)

(0,24) (0,35)

Quarta e quinta

Adultos Crianças

31/84 7/19

= 37 = 37

(0,30) (0,27)

(0,26) (0,45)

A primeira posição favorece mais a aplicação da regra do que as demais posições, principalmente se observarmos a análise B, que apresenta resultados lingüísticos melhores

dentro das nossas expectativas. A

212

falta de convergência entre os resultados com as três variáveis juntas, e mesmo a não seleção da variável Posição na análise B, para as crianças, ocorre pela superposição existente na codificação dos dados. Na análise B, isto é mais flagrante, pois o fator ausência, da variável Marcas; os artigos e demonstrativos, da

variável Classe;

e a primeira posição, da variável

Posição quase se identificam. De qualquer forma, os resultados até então apresentados já mostram, em quaisquer das análises, que a variável Posição não é, isolada, a mais forte das três em discussão. Considerando 1) que as superposições conduzem a resultados probabilísticos indesejáveis; 2) que os resultados probabilísticos associados à Classe gramatical não são totalmente satisfatórios do ponto de vista lingüístico, por não se estabelecerem agrupamentos (a) homogêneos para os dois grupos de falantes e (b) lingüisticamente naturais do ponto de vista da classe gramatical; 3) que em termos percentuais já sabemos que o substantivo, o adjetivo, o possessivo e o quantificador não se comportam da mesma forma em todas as posições do SN (ver item 6.2.3.4), decidimos transformar Classe e Posição em uma só variável, ao lado de Marcas precedentes em função da posição.

Esta

etapa

foi

por

nós

denominada

de

análise C.

Daqui para frente, vamos abandonar a análise A - a que considera a variável Marcas desvinculada da posição -, uma vez que ela encobre

213

regularidades

lingüísticas

importantes,

demonstradas

através

das

percentagens e das probabilidades associadas aos diversos fatores da variável Marcas na análise B.

Os resultados obtidos com o cruzamento de Classe e Posição são apresentados na tabela 6.2.2.24. Todavia, eles servem apenas de justificativa adicional para a análise D, a análise final, pois continuam sem convergência para os adultos e, além disso, não selecionados para as crianças. Observando-se os resultados sob o ângulo da posição, podemos verificar, agora em termos probabilísticos, que, para todas as classes gramaticais, é a primeira posição que mais favorece o índice de marcas formais de concordância. Mesmo assim, constatam-se diferenças entre as classes, com intervalos não muito acentuados, à exceção do substantivo: esta classe é sistematicamente a menos marcada nessa posição. Tal fato também se evidencia nas percentagens. Todavia, já sabemos que os casos de ausência de marca nesta posição ocorrem predominantemente em contexto fonético/fonológico favorável ao cancelamento do -S final. Creditamos, portanto, a este efeito, parte das baixas probabilidades que aí se verificam. Na ocasião desta etapa da nossa análise, o contexto fonético/fonológico seguinte encontrava-se em termos de consoante, vogal e pausa e não em termos de traços das consoantes, onde se destaca este tipo de influência. A nosso ver, apenas os artigos e demonstrativos sugerem alguma sistematicidade não fonético/fonológica de ausência de marcas nesta posição, pois, como já é do nosso conhecimento também, ocorrem predominantemente em estruturas do tipo [artigo ou demonstrativo + possessivo + substantivo] (no meus filhos).

214

TABELA 6.2.3.24 CLASSE GRAMATICAL E POSIÇÃO NO SN: ANÁLISE C CLASSE E POSIÇÃO

FALANTES Adultos Apl./Total

% Prob

153/161 = 95 (0,62) 2756/5175 = 53 (0,33) 317/514 = 62 (0,20)

Crianças Apl./Total

% Prob.

Substantivo Substantivo Substantivo

1a pos. 2a pos. 3a pos.

Cat.subst. Cat.subst.

2a pos. 3a pos.

59/92 16/23

= 65 (0,43) = 70 (0,28)

13/20 2/2

= 65 (0,45) = 100 +

Pr.pessoal Pr.pessoal

1a pos. 2a pos.

12/12 27/33

= 100 + = 82 (0,80)

3/5

xxx = 60 (0,59)

Adjetivo Adjetivo Adjetivo

1a pos. 2a pos. 3a pos.

47/48 118/156 125/307

= 98 (0,84) = 78 (0,48) = 31 (0,12)

4/4 18/18 16/40

= 100 + = 100 + = 40 (0,31)

Quant. Quant. Quant.

1a pos. 2a pos. 3a pos.

133/133 3/7 22/108

= 100 + = 43 (0,34) = 20 (0,10)

23/23 1/5

= 100 + xxx = 20 (0,14)

Possessivo Possessivo Possessivo

1a pos. 2a pos. 3a pos.

184/184 55/60 2/12

= 100 + = 92 (0,75) = 17 (0,03)

42/43 12/13 2/4

= 98 (0,74) = 92 (0,87) = 50 (0,53)

Adjetivo 2 Adjetivo 2 Adjetivo 2

1a pos. 2a pos. 3a pos.

9/10 21/28 3/3

= 90 (0,46) = 78 (0,69) = 100 +

1/1 0/1

Indefinido Indefinido Indefinido

1a pos. 2a pos. 3a pos.

424/429 44/47 0/1

= 99 (0,92) = 94 (0,92) = 0 -

Art.e dem. Art.e dem.

1a pos. 2a pos.

3268/3363 = 97 (0,83) 75/75 = 100 +

16/18 = 89 (0,29) 419/1052 = 40 (0,28) 46/86 = 53 (0,28)

xxx = 100 + = 0 -

80/80 5/8

= 100 + = 63 (0,64) xxx

672/688 14/14

= 98 (0,83) = 100 +

Na segunda posição, a concordância mostra diferenças mais acentuadas em função da classe gramatical. Artigos e demonstrativos, indefinidos, adjetivos 2 e possessivos favorecem muito a inserção de

215

marcas e de forma uniforme. Os adjetivos já mostram queda de marcas nos dados dos adultos, embora a percentagem ainda seja bem alta, e continuam totalmente marcados nos dados das crianças. A categoria substantivada apresenta índice baixo de concordância e a categoria menos marcada é o substantivo. Os pronomes pessoais continuam a evidenciar comportamento probabilístico semelhante ao dos "determinantes". Na terceira posição, todas as categorias se apresentam com baixo índice de marcas, sendo que os substantivos e as categorias substantivadas são as mais marcadas. Observando os resultados probabilísticos sob o ângulo da Classe gramatical, contrapondo a segunda com a terceira posição, podemos constatar que há sempre uma queda sistemática nas probabilidades dos possessivos,

quantificadores,

adjetivos,

substantivos

e

categorias

substantivadas, só que esta queda é mais acentuada nos possessivos, quantificadores e adjetivos e muito baixa nos substantivos e categorias substantivadas, o que aponta, no mínimo, para o fato de não se poder estabelecer identidade ou paralelo entre classe gramatical e posição, conforme Guy (1981b) o faz. Com base em toda a argumentação apresentada até o presente momento, pode-se assim constatar que existe um jogo complexo entre Marcas precedentes, Classe gramatical e Posição que, a nosso ver, evidencia-se de forma mais simples se a relação entre Classe gramatical e Posição for focalizada sob outro ângulo. Observando a distribuição dos nossos dados, vamos verificar que os elementos não nucleares que ocorrem na primeira posição são certa-

216

mente todos antepostos ao núcleo do SN. Os da segunda posição também são predominantemente antepostos. Todos estes casos se apresentam com índices altos de marcas. Os elementos não nucleares da segunda posição que têm ocorrências pospostas são os seguintes: possessivos, quantificador, adjetivo 2 e adjetivo. Dos 135 casos de possessivos da segunda posição dos falantes adultos, 130 são antepostos. Dos 130 antepostos, 127 são marcados (98%) e, dos cinco pospostos, três são marcados (60%). Dos 25 casos dados das crianças, há apenas dois pospostos e um deles sem marca: (50%). Dos 23 antepostos, todos são marcados (100%).77 Os casos de adjetivo 2 desta posição são também antepostos e pospostos. Dentre as 28 ocorrências dos adultos, 25 são antepostas e, destas, 21 são marcados (84%). Os três casos pospostos são todos não marcados. Este tipo de dado, no caso das crianças, ocorre apenas duas vezes. Os dois casos que ocorrem (em verdade dois casos de numeral ordinal) são antepostos ao núcleo: um deles é marcado e o outro não. Dentre os adjetivos, há 163 casos dos adultos. Destes, 39 são antepostos e 124, pospostos; fato

que indica o porquê da queda da

concordância do adjetivo nesta posição, no caso dos adultos. Dos 39 antepostos, 36 são marcados (92%) e, dos 124 pospostos, 89 o são (72%). Todos os adjetivos desta posição nos dados das crianças são marcados. A maioria deles é, todavia, posposta: 13 em 18 (72%). Apenas cinco são antepostos: 28%. Somente os adjetivos da segunda posição, nos dados das crianças, fogem ao raciocínio geral que estamos estabelecendo: o

217

elo que une as classes gramaticais não nucleares, até aqui codificadas como primeira e segunda posição, é basicamente a sua colocação anteposta ao núcleo, enquanto o elo que une as classes gramaticais não nucleares da terceira, quarta e quinta posição é a sua posposição ao referido núcleo. Como o número de dados dos adjetivos da segunda posição nos dados das crianças é bem menor - há 18 casos para elas e 163 para os adultos - , vamos assumir que a nossa linha de raciocínio é correta para todos os falantes. Retomando a distribuição dos elementos não nucleares, verificamos que todos os casos de quantificador da segunda posição são pospostos e com baixa concordância e, além disso, que todos os casos não nucleares de terceira, quarta e quinta posições são todos pospostos ao núcleo, exceto dois casos de adjetivo 2 (o meus PRÓPRIOS filhos; as duas PRIMERA viage), e são eles que apresentam os mais baixos níveis de marcas. Somos levados a concluir, portanto, que a relação entre a Classe gramatical e Posição, no que toca aos elementos não nucleares, deve ser vista à luz de como eles se distribuem ao redor do núcleo: não importa exatamente nem a classe nem a posição nuclear, mas sim a posição do elemento não nuclear em relação ao centro do SN. Feito este raciocínio, apresentamos então a análise D que mantém a variável Marcas precedentes conforme codificada na análise B e transforma Classe e Posição em uma só variável, denominada Relação entre os elementos no SN. Os elementos nucleares continuaram a ser codificados em função da posição por já termos indícios de sua atuação um pouco diferenciada em tais circunstâncias.

218

A variável Relação ficou, portanto, constituída de nove fatores, a seguir especificados: 1) substantivo na 1a. Posição; 2) substantivo na 2a. Posição; 3) substantivo na 3a. Posição; 4) categoria substantivada na 2a. Posição; 5) categoria substantivada na 3a. Posição; 6) pronome pessoal na 1a. Posição; 7) pronome pessoal na 2a. Posição; 8) classe não nuclear anteposta e 9) classe não nuclear posposta.

Passamos a apresentar os resultados da análise D. Em primeiro lugar, nas tabelas 6.2.3.25 a 6.2.3.27, encontram-se os resultados da variável Relação entre os Elementos do SN e, em segundo, nas tabelas 6.2.3.28 a 6.2.3.32, encontra-se a variável Marcas precedentes com seus resultados finais. Nesta análise, a análise alternativa D, a variável Marcas continua sendo selecionada em primeiro plano com significância 0,0 para os dois grupos de falantes, dentre nove e oito variáveis respectivamente.78 A variável Relação é selecionada em quarto lugar nos adultos com significância ainda 0,0 e em terceiro para as crianças com significância 0,000. A análise dos adultos apresentou convergência até a iteração 31 com significância final de 0,000 e a análise das crianças apresentou convergência até a iteração 57, com significância

final de 0,001. Os resultados da variável Relação

encontram-se na tabela 6.2.3.25, a seguir.

219

TABELA 6.2.3.25 RELAÇÃO ENTRE OS ELEMENTOS DO SN: ANÁLISE D FATORES

FALANTES Adultos Apl./Total

Subst.na 1a. pos. Subst.na 2a.pos. Subst.na 3a.pos.

153/161

%

Crianças Prob.

= 95

0,66

2756/5176 = 53

0,23

Apl./Total 16/18

%

Prob.

= 89

0,34

419/1052 = 40

0,21

317/514

= 62

0,38

48/86

= 53

0,56

Categoria subst. na 2a.pos.

59/92

= 64

0,33

13/20

= 65

0,36

Categoria subst. na 3a.pos.

16/23

= 70

0,49

2/2

= 100

+

Pronome pessoal na 1a. pos.

12/12

= 100

+

Pronome pessoal na 2a.pos.

27/33

= 82

0,72

3/5

= 60

0,49

4291/4406 = 97

0,87

857/877

= 98

0,87

0,25

31/63

= 49

0,61

Classe não nuclear anteposta Classe não nuclear posposta

242/565

= 43

xxx

Os resultados da tabela 6.2.3.25 confirmam as nossas expectativas:

220

1) As classes não nucleares antepostas são mais marcadas do que as pospostas; então, não é o adjetivo que é pouco marcado, mas o adjetivo posposto. Também não é o quantificador que é muito marcado nos dados das crianças e pouco marcado nos dos adultos, mas o quantificador anteposto ou o quantificador posposto, respectivamente (ver o número de dados na tabela 6.2.3.24). Generalizando, qualquer classe gramatical anteposta ou qualquer classe gramatical posposta ao núcleo do SN apresenta, respectivamente, mais ou menos chances de conter marcas formais de plural. A simples afirmação de que a primeira posição do SN é a mais marcada também não é, portanto, adequada. O elemento nominal não nuclear pode estar até na terceira posição, mas, se estiver anteposto ao núcleo, apresenta também mais chances de ser marcado do que o posposto. Além disso, o substantivo da primeira posição é menos marcado do que as classes antepostas que ocupam primeira e segunda posição dentro do SN, mesmo nos dados dos adultos. 2) Os substantivos não são igualmente marcados em todas as posições: na primeira e na terceira são sempre mais marcados do que na segunda, o que refuta conclusões de que o substantivo é uma das classes gramaticais menos marcadas (cf. CEDERGREN, 1973, p.46; POPLACK, 1980a, p.1-62; POPLACK, 1980b, p.373 e POPLACK, 1981, p.61), embora Poplack já afirmasse também que o substantivo tendia a ser mais marcado na primeira posição (cf. 1980a, p.65). Com relação ao comportamento do substantivo na terceira posição, os nossos resultados não têm precedentes na literatura lingüística. 3) As categorias substantivadas se comportam, em termos de hierarquia, da mesma forma que os próprios substantivos; são mais marcadas na terceira do que na segunda posição.

221

4) Os pronomes pessoais, embora apresentem probabilidades significativamente mais altas do que os substantivos, evidenciam, como eles, maior número de marcas na primeira do que na segunda posição.

Temos agora agrupamentos de classes naturais do ponto de vista lingüístico. Os elementos não nucleares se agrupam em função da sua relação com o núcleo do SN e os núcleos se agrupam em termos da posição que ocupam dentro do SN. A hipótese que levantamos neste momento para explicar a influência desta variável é a da coesão sintagmática. Verificamos em nossos dados que os únicos constituintes que aceitam elementos entre eles, modificadores ou não, são os substantivos e seus elementos pospostos, pois deparamo-nos com SNs do tipo: - as brincadera mais usadas

(Glo11,fp,48a);

- os irmãos mais novos

(Ari30,fg,43a);

- aquelas lojinhas bem baratinhas

(Joa10,fp,27a);

- as coisa muito certa

(Ari30,fg,43a);

- as conta quase toda

(Mag47,fc,53a);

- as costura mais séria

(Seb09,mp,53a);

- essas ropinha bem fácil

(Seb09,mp,53a);

- as camisa lá de Curitiba muito bonitas

(Nil12,fp,45a);

- aqueles morro lá pra cima iscundido

(Lui08,mp,57a);

- os documento dela todinho

(Jro64,mg,14a).

Todavia, entre os próprios elementos antepostos e entre estes e os seus núcleos raramente se encontra qualquer segmento. Dentre, apro-

222

ximadamente, 7193 SNs por nós analisados, encontramos apenas um caso do tipo: - os meus mais velhos amigos

(Fat56,fg,14a).

A quase totalidade dos SNs do tipo - os meus filhos

(Dal18,fp,71a);

- todas as pessoas

(Ubi21,mg,20a);

- as pequenas passagens

(Eve43,fc,42a);

- os maiores problemas

(Cab02,mp,16a);

- algumas outras coisas

(Par41,mc,26a);

- as mesmas coisas

(Par41,mc,26a)

não apresenta, portanto, segmentos intervenientes entre quaisquer de seus constituintes. Os constituintes dos SNs que aceitam ser separados por quaisquer elementos têm uma relação sintagmática menos coesa; e o menor número de marcas nesta situação deve ser visto como índice da não ligação formal estreita entre estes constituintes. Inversamente, os constituintes que não aceitam ser separados marcam formalmente esta inseparabilidade através de mais inserção do morfema de plural. Esta hipótese dá conta inclusive do fato de os sintagmas que têm o substantivo como seu último constituinte não privilegiarem estruturas do tipo s00 (AS OTA menina; NOS PRIMERO capítulo). Há apenas 15 casos deste tipo num total de 595 (2%) (ver quadro 6.2.3.17, p.190, tipo x00). Estas construções são do tipo mais coeso. Lançando mão da noção da Motivação Icônica de Haiman de que "a distância entre expressões corresponde à distância conceptual entre as idéias que elas representam" (1983, p.782),79 diríamos que temos aí o

223

funcionamento do Princípio da Iconicidade. Há uma relação direta entre o grau de coesão sintagmática entre os elementos do SN e o número de marcas existentes: quanto mais coesão, mais marcas; quanto menos coesão, menos marcas. Isto explica também por que o substantivo ou a categoria substantivada tendem a ter mais marcas na terceira posição do que na segunda: os da terceira posição estão inseridos dentro de uma estrutura mais coesa. O substantivo e a categoria substantivada que ocorrem na segunda posição pertencem, por sua vez, a dois tipos de estrutura sintagmática: (1) uma constituída de dois elementos em que a questão da coesão, a nosso ver, não se coloca e (2) outra constituída de [numeral + substantivo + adjetivo], ou seja, do tipo considerado como menos coesivo: - dois susto bem grande

(Lei04,fp,25a);

- dois istatuto totalmente diferente

(Cla27,mg,32a);

- dez senhoras lá sentada

(Geo31,mg,58a);

- dez dias mais maravilhóso

(Dor29,fg,44a).

A forte atuação do pronome pessoal na segunda posição não é explicada pelo princípio da coesão sintagmática: eles ocorrem basicamente em estruturas de dois elementos (ELES todos; todos ELES). Uma hipótese que se levanta é que ele seja uma categoria mais marcada por pertencer a um paradigma bem definido. O fato de se marcarem mais os substantivos e os pronomes pessoais da primeira posição também não se explica por este mesmo princípio: atua aí a tendência

de línguas como o Português e o

Espanhol marcarem qualquer elemento nuclear na primeira posição.

224

Queremos retomar novamente a questão do paralelo feito por Guy (1981b) entre determinante e primeira posição, entre substantivo e segunda posição e entre adjetivo e terceira posição. Os resultados apresentados até aqui mostram que não se pode estabelecer identidade entre determinante e primeira posição, pois os determinantes ocorrem tanto na primeira quanto na segunda posição e com probabilidades altas de concordância, por serem antepostos. Além disso, o substantivo se apresenta nas três posições, com probabilidade de ter mais marcas na primeira e terceira posições. O adjetivo, como uma categoria posposta na terceira posição, é menos marcado do que o próprio núcleo nesta mesma posição. Para dissipar quaisquer dúvidas, fizemos uma análise probabilística só dos substantivos e adjetivos. Os resultados serão vistos a seguir. Nas tabelas 6.2.3.26 e 6.2.3.27, temos os resultados considerando, respectivamente, (1) todos os dados e (2) apenas os SNs de três ou mais elementos, cuja estrutura propicia o aparecimento de [determinante + substantivo + adjetivo] e [determinante + adjetivo + substantivo].80

225

TABELA 6.2.3.26 CRUZAMENTO DE SUBSTANTIVOS E ADJETIVOS E POSIÇÃO EM TODOS OS DADOS DOS ADULTOS CLASSE GRAMATICAL

Apl./Total

%

Prob.

Substantivo na primeira posição

153/161

= 95

0,68

Substantivo na segunda posição

2756/5157

= 53

0,27

Substantivo na terceira posição

317/514

= 62

0,43

Adjetivo anteposto

80/84

= 95

0,80

Adjetivo posposto

210/427

= 49

0,29

226

TABELA 6.2.3.27 CRUZAMENTO DE CLASSE GRAMATICAL E POSIÇÃO EM SNS DE TRÊS OU MAIS CONSTITUINTES NOS DADOS DOS FALANTES ADULTOS CLASSE GRAMATICAL E POSIÇÃO

Apl./Total

%

Prob.

Substantivo na primeira posição

1/1

Substantivo na segunda posição

179/356

=

50

0,22

Substantivo na terceira posição

313/510

=

62

0,28

Adjetivo na 1a. posição (anteposto)

= 100

+

xxx

Adjetivo na 2a. posição (anteposto)

35/38

=

92

0,64

Adjetivo na 3a. posição (posposto)

100/260

=

38

0,16

666/747

=

89

0,70

113/116

=

97

0,92

0/1

=

0

-

Determinante (art., dem. e ind.) na primeira posição (anteposto) Determinante (art., dem. e ind.) na 2a. e na 3a.posição (anteposto) Determinante (indefinido) na 3a. posição posposto)

Os resultados continuam os mesmos: os substantivos da segunda posição são menos marcados do que os adjetivos nesta mesma posição; inversamente os adjetivos da terceira posição é que são menos marcados do que os substantivos aí presentes. A diferença entre os substantivos

227

da segunda e terceira posições na análise que considera todos os dados é maior porque, naquele caso, os substantivos da terceira posição apresentam contraste com os substantivos da segunda posição em SNs de dois constituintes, os quais são menos marcados. Há um único caso de substantivo na primeira posição (PONTOS existenciais muito atual) e um indefinido na terceira (uns negócio QUALQUER). Merece destaque a diferença de probabilidade entre determinantes da primeira(0,70) e da segunda(0,92) posição: é bem maior nestes casos. Este resultado decorre simplesmente do fato de a maioria das ausências de marcas em determinantes da primeira posição ocorrerem em SNs de três ou mais constituintes, na já tão discutida estrutura [artigo ou demonstrativo + possessivo + substantivo] (no meus filhos). Concluindo, fica definitivamente evidenciado que não se pode estabelecer um paralelo entre Classe e Posição sem se perderem fatos lingüísticos importantes. No que diz respeito ainda à relação entre Classe gramatical e Posição, gostaríamos de fazer uma observação final sobre a distribuição do possessivo, do quantificador e do adjetivo. O possessivo, quando anteposto, ocorre predominantemente em estruturas com artigo definido (os meus filhos) e, quando posposto, em estruturas que não possuem artigo definido (algumas colega minha; três colega meu). O quantificador, quando posposto, é realizado, às vezes, como tudo (uns cabelo tudo arrepiado), elemento não flexionável e, portanto, não considerado neste trabalho. O adjetivo anteposto, por sua vez, é basicamente do tipo

228

"avaliativo" (grande, novo, maior, pior, melhor, bom, mau, belo). O adjetivo posposto é de tipo diverso. Além do "avaliativo", há o "qualificativo" (humilde, estranho, público, festivo, pelado), o "deverbal" (caído, aberto, largado, marcado), o "substantivo adjetivado" (médico, menina, amigo), o indicativo de nacionalidade ou de naturalidade (argentino, português, holandês, mineiro) e o designativo de cores (preto, verde, azul) Levanta-se

apenas

uma

pergunta:

será

que

tais

categorias

antepostas ou pospostas são "a mesma categoria"? Chegamos a pensar que o adjetivo "avaliativo" pudesse apresentar maior índice de concordância mesmo quando posposto, o que levaria à conclusão de que o índice de marcas de plural no adjetivo fosse função de traços semânticos e não de sua distribuição ao redor do núcleo. Concluímos, em termos percentuais, que o adjetivo "avaliativo" posposto apresenta o mesmo grau de concordância de que os demais adjetivos pospostos, o que não nos incentivou a codificar em detalhes as suas subclasses semânticas. Todavia, questões desta natureza ficam como propostas para pesquisas futuras. Uma vez explicados

os principais fatos relacionados à variável

Relação, vamos apresentar as discussões finais sobre a variável Marcas precedentes. A reapresentação de seus resultados se justifica pelo fato de estarmos analisando variáveis muito relacionadas. É fundamental então verificarmos se os mesmos pesos probabilísticos foram atribuídos à variável Marcas, nesta nova forma de se analisarem os fatos. Conforme podemos ver a partir dos resultados da tabela 6.2.3.28, as grandes oposições não se modificaram.

229

TABELA 6.2.3.28 MARCAS PRECEDENTES E POSIÇÃO: ANÁLISES B E D MARCAS E POSIÇÃO

POSIÇÃO DE ANÁLISE

FALANTES Adultos

Crianças

%

Prob.B

Prob.D

%

Prob.B

Prob.D

Ausência

1

97

0,92

0,79

98

0,93

0,92

Zero na 1a. posição

2

100

+

+

100

+

+

Numeral na 1a. posição s- na 1a. posição

2

58

0,56

0,63

57

0,72

0,82

2

55

0,49

0,55

41

0,57

0,69

SPrep(x)sSPrep0(0)-

2,3 2,3

69 38

0,71 0,34

0,74 0,41

100 17

+ 0,28

+ 0,39

3,4 3,4,5 3,4,5

70 54 6

0,61 0,47 0,04

0,60 0,41 0,06

72 47 4

0,76 0,58 0,01

0,62 0,34 0,02

ss(s)y(x)xx(y)0-

A ordem entre SPrep(x)s-, numeral na primeira posição, SPrep0(0)- e x(y)0- não se alterou. Temos para os adultos e crianças, nas análises 2 e 3, respectivamente, as seguintes probabilidades:

A) SPrep(x)s- ......................................... 0,71/0,74 e 100%/100%; B) numeral na 1a.posição ...................... 0,56/0,63 e 0,72/0,82; C) SPrep0(0)- ........................................ 0,34/0,41 e 0,28/0,39; D) x(y)0-................................................. 0,04/0,06 e 0,01/0,02. Além disso, a presença de ss(s)- continua a favorecer mais a aplicação da regra (0,61/0,60 e 0,76/0,62) no elemento seguinte do que a

230

presença de pelo menos um s- não mediado por zero (0,47/0,41 e 0,58/0,34). A diferença, inclusive, se acentua. A diferença entre a influência do numeral

e a do s- na primeira

posição sobre o elemento que ocorre na segunda permanece quase inalterada, embora os valores absolutos tenham mudado. Na análise B, esta diferença é de 0,07 para os adultos e de 0,15 para as crianças; na análise D, ela é de 0,08 para aqueles e de 0,13 para estes. Confirma-se também o fato de a ausência fora do SN e de o zero na primeira posição do SN serem os fatores que mais favorecem a inserção de marcas no elemento nominal da primeira e da segunda posição, respectivamente. Da análise B para a D, ocorreu o seguinte: 1) Modificou-se a magnitude da influência da ausência fora do SN nos adultos (0,92 na análise B e 0,79 na análise D). Nos resultados das crianças isto não ocorre. Em compensação, neste caso, os substantivos da primeira posição receberam menor peso probabilístico (0,35) do que nos adultos (0,66) (ver tabela 6.2.3.25, p.219). A ordenação, todavia, não mudou em nenhuma das situações. 2) Surgiram diferenças entre a influência do s- da primeira posição sobre a segunda e do y(x)x- sobre as demais, em favor do primeiro fator. Temos então para os adultos e crianças, nas análises B e D, o seguinte:

A) s- na primeira posição ....................... 0,49/0,55 e 0,57/0,69; B) y(x)x- ................................................. 0,47/0,41 e 0,58/0,34.

231

Enquanto na análise B a diferença entre estes dois fatores é de 0,02 para os adultos e de 0,01 para as crianças, na análise D, ela é de, respectivamente, 0,14 e 0,35. Mesmo assim, novamente a ordenação não foi alterada. 3) Modificou-se a ordenação entre os fatores s- e ss(s)- nas crianças. Na análise B, havia uma diferença de 0,19 em favor de ss(s)-. Esta situação se inverte com alteração na diferença: 0,07 em favor de s-. De uma forma geral, podem-se interpretar as mudanças ocorridas pelo fato de se ter medido o restante da influência da variável Posição, agora presente na variável Relação (ver tabela 6.2.3.23, p.211). As modificações nos resultados das crianças foram mais drásticas, especialmente as que envolvem a inversão de ordenação na influência dos fatores s- e ss(s)-. O que ocorre é o seguinte: a metodologia que estamos usando, ao comparar as diversas variáveis, procura atribuir os valores devidos a cada uma delas, do ponto de vista estritamente estatístico. Ao se comparar o efeito das variáveis em foco, Marcas precedentes e Relação, o programa usado atribuiu valor relativamente alto às classes não nucleares pospostas (0,60) e ao substantivo na terceira posição (0,55). Isto provocou um abaixamento nas probabilidades de ss(s)- e de y(x)x- com conseqüente aumento para s- e numeral na primeira posição. Comparando-se os passos feitos pelo programa, podemos ver as probabilidades dos fatores em jogo nestas variáveis, da forma em que se segue, na tabela 6.2.3.29.

232

TABELA 6.2.3.29 INTERFERÊNCIA ENTRE MARCAS PRECEDENTES E RELAÇÃO DOS ELEMENTOS DO SN NOS RESULTADOS DAS CRIANÇAS MARCAS E POSIÇÃO

PROBABILIDADES Isoladas

Só com a variável Relação

Com todas as variáveis

Numeral na 1a. posiçâo.

0,58

0,84

0,82

s- na 1a. posição

0,42

0,70

0,69

ss(s)-

0,73

0,58

0,62

y(x)s-

0,47

0,32

0,34

0,27

0,65

0,61

0,31

0,60

0,56

RELAÇÃO DOS ELEM. NO SN Classe não nuclear posposta Subst. na 3a. posição

Podemos

observar

claramente,

na

tabela

6.2.3.29,

que

as

probabilidades isoladas dos fatores em questão se modificam bastante, até o último passo da análise, sendo que esta mudança acentuada não ocorre nos dados dos falantes adultos. Considerando que os resultados das crianças é que estão um pouco discrepantes de todos os que encontramos até agora e considerando também que elas apresentam menos dados do que os adultos, pesquisas futuras terão oportunidade de verificar se as pequenas diferenças aqui apontadas ocorrem apenas devido ao número de dados ou se o comportamento das crianças apresenta real diferença com relação à im-

233

portância probabilística absoluta atribuída, principalmente, ao substantivo de terceira posição e à classe não nuclear posposta. Cumpre inclusive observar que os valores probabilísticos iniciais atribuídos a todos os fatores das variáveis Marcas e Relação são extremamente semelhantes nos dados das crianças e dos adultos. Na comparação entre os fatores, surgem algumas alterações mais fortes exatamente nos resultados das crianças, o que não é inesperado quando se trabalha com variáveis relacionadas e com um número relativamente pequeno de dados. Nestes casos, o maior número de dados é certamente fundamental para que as probabilidades possam ser adequadamente associadas aos diversos fatores em jogo. Mesmo se constatando algumas diferenças, as probabilidades finais associadas aos fatores das variáveis Marcas e Relação, para os adultos e para as crianças, em termos de hierarquia, são muito paralelas. Resta agora interpretar o comportamento da variável Marcas precedentes. A explicação da influência desta variável não tem nenhum suporte funcionalista, no sentido de Kiparsky (1972). Uma vez marcada a primeira posição do SN ou, em alguns casos, a segunda, o número de marcas seguintes é função da forma de processar a informação. Usando as palavras de Schiffrin, (...) parece haver uma tendência geral para formas gramaticais particulares ocorrerem juntas. (...) podendo tal fenômeno resultar de uma restrição mais mecânica na continuação de uma forma a não ser que haja razão para a mudança (...). (SCHIFFRIN, 1981, p.55-6).81 A tendência geral explicitada acima rege não só este fenômeno, mas uma série de outros em Português, bem como não rege apenas o

234

funcionamento do Português e do Espanhol, mas também o do Francês, o do Inglês, o do Quechua e o do Crioulo Caboverdiano. Isto sugere que qualquer abordagem adequada da linguagem, seja sob o rótulo de lingüística da língua ou de lingüística da fala, de teoria da competência ou de teoria do desempenho, tem de conter princípios que dêem conta da tendência geral de formas gramaticais particulares ocorrerem juntas (cf. SCHIFFRIN, 1981, p.16). O comportamento desta variável, em especial, mostra que a explicação dos fatos lingüísticos está fora da gramática: a influência recíproca, resultante da proximidade entre fenômenos, faz parte da forma da mente humana operar em circunstâncias as mais diversas. No capítulo 7 deste trabalho, vamos retomar esta discussão e vamos propor a existência do Princípio do Processamento Paralelo para explicar o funcionamento deste tipo de variável que exerce uma forte influência sobre fenômenos diversos de diversas línguas. Focalizando apenas os numerais da primeira posição, é possível entender agora, com clareza, que a sua influência sobre marcas na segunda posição nada tem realmente de funcionalista no sentido kiparskiano. Com base numa hipótese desta natureza, seria de se esperar que os elementos seguintes aos numerais fossem menos marcados, uma vez que se afirma serem os contextos, em que há um numeral, mais óbvios do ponto de vista da pluralidade (cf. GUY, 1981, p.180). Além disso, Poplack coloca que embora os fatores funcionais tenham um efeito relativamente menor do que outros a ordenação dos fatores dentro dos grupos funcionais é clara. A informação adicional de plural favorece o cancelamento da marca, ao passo que quando a única possibilidade de marcar o plural é flexional, dentro do próprio SN, uma marca tende a ser retida. Esta é uma tendência, mas ela é um tanto fraca. (POPLACK, 1980a, p.62-3)82

235

Os nossos resultados relativos à influência dos numerais da primeira posição são diferentes dos resultados do Espanhol no sentido acima relatado. Os numerais da primeira posição favorecem mais a inserção de marcas na segunda posição do que o s- nesta mesma posição. Esta tendência também foi verificada por Scherre (cf. 1978, p.111-2), Ponte (cf. 1979, p.163) e Guy (cf. 1981a, p.179-80). É bom relembrar aqui que Scherre e Guy dão explicações diferentes e ad hoc para o funcionamento do numeral, pois partem de um pressuposto

geral inadequado para o fenômeno

lingüístico em questão: um pressuposto funcionalista no sentido kiparskiano do termo. Repetindo, o que está em jogo aqui é a tendência geral de formas semelhantes se agruparem (cf. SCHIFFRIN, 1981, p.51-7). Consideramos, portanto, que a atuação do numeral se explica também dentro desta mesma linha: marcas conduzem a marcas, inclusive quando esta marca é semântica. Resta ainda uma outra indagação sobre o comportamento dos numerais: haveria alguma diferença entre a atuação daqueles que terminam em -S (três ANOS) e os numerais que não terminam em -S (quinze ANOS)? Estariam os falantes interpretando o -S final dos numerais como plural e inserindo mais marcas em elementos nominais precedidos por numerais terminados em -S? Fizemos um levantamento de todos os numerais em SNs de dois elementos dos dados dos adultos e das crianças, e, eliminados os casos de neutralização (seis sócios, por exemplo), obtivemos os resultados percentuais apresentados na tabela 6.2.3.30.

236

TABELA 6.2.3.30 SOBRE A INFLUÊNCIA DA TERMINAÇÃO DOS NUMERAIS NOS SNS DE DOIS CONSTITUINTES FATORES

FALANTES Adultos Crianças Apl./Total % Apl./Total %

Numeral precedente terminado em -S (três anos) (dois em dois meses) (trinta e seis horas)

382/661

= 58

78/142

= 55

Numeral precedente não terminado em -S (quinze anos) (nove anos) (dez mil cruzeros)

460/783

= 59

61/109

= 56

Podemos observar que não existe diferença de marcas no segmento da segunda posição se o numeral precedente termina ou não em -S. Como a diferença percentual é quase nula, dificilmente haveria qualquer diferença probabilística para estes dois fatores, o que não justifica a sua codificação. Concluímos, portanto, que os "esses" que conduzem a "esses" são apenas os que têm a informação semântica de pluralidade. Embora Schiffrin fale em restrição mecânica, ela não é tão mecânica assim, pois, se o fosse, atingiria também os "esses" precedentes sem informação de plural. O comportamento do SPrep explica-se também sob as mesmas bases, uma vez que o SPrep(x)s- conduz a mais marcas do que o SPrep0(0)e este por sua vez conduz a mais marcas do que a existência de um zero num segmento que não tem marca semântica alguma de pluralidade.

237

Os únicos fatores desta variável que apontam para o funcionamento da hipótese funcionalista kiparskiana são os que dizem respeito à ausência fora do SN e ao zero na primeira posição, os quais determinam altos índices de marcas nos elementos analisados. Este tipo de hipótese funcionalista não explica, todavia, porque as marcas tendem a ocorrer nos elementos nucleares antepostos e não nos pospostos. Também não explica porque os substantivos da terceira posição são mais marcados do que os da segunda. Além disso, já observamos detidamente que a maioria dos casos da segunda posição precedida de zero envolve uma estrutura bem característica [artigo ou demonstrativo + possessivo + substantivo]. A questão nada tem de funcional em termos de Kiparsky (1972), pois os possessivos da segunda posição são muito marcados quer sejam precedidos do zero (100%) quer sejam precedidos de s- (92%): o fato é que todos os elementos não nucleares antepostos tendem a ser muito marcados. A nosso ver, a hipótese funcionalista, no sentido de Kiparsky (1972), só explica em verdade a possibilidade da concordância de número entre os elementos do SN Português ser variável, ou seja, por ser um mecanismo considerado redundante, é possível haver ausência de marcas sem prejuízo da informação. Segundo Poplack, Terrell mostrou, para o Espanhol de Cuba, "(...) que os falantes (...) constantemente evitavam suprimir todos os traços morfológicos do plural (...)." (POPLACK, 1981a, p.63)83 Ela considera, todavia, que isto não se aplica ao Espanhol de Porto Rico, pois há (...) quase 1000 exemplos de seqüências de SN contendo dois ou três elementos, sem nenhuma marca morfológica. Além disso, a taxa de cancelamento (...)

238

é até mais alta quando o elemento analisado é precedido por dois zeros (94%) do que quando é precedido por um (82%). (POPLACK, 1980a, p.63) 84 O que ocorre com o Português do Brasil é análogo, neste aspecto, ao Espanhol de Cuba, pois não há nenhum caso de SN sem marca formal ou semântica de plural, a não ser os casos do tipo genérico, conforme já discutimos no item 6.2.3.6, p.183-197. Vimos, portanto, que a variável Marcas precedentes da forma agora estudada pode ser explicada consistentemente pela "tendência geral de formas semelhantes aparecerem juntas". Finalmente, cumpre-nos observar que, ao analisarmos apenas os SNs de três ou mais elementos, a propósito da variável Relação, a influência do grupo Marcas precedentes permanece praticamente uniforme. O único aspecto que merece destaque é a ausência de diferença entre um sprecedente (0,58) e um numeral precedente (0,56) na primeira posição. Isto ocorre porque as estruturas aí envolvidas são do tipo três cavalos lindo, dois colega meu, em que há uma preferência nítida pelas seqüências n00. Em 40 seqüências n--, há:

A) uma do tipo n0s(2,5%); B) seis do tipo nss(15%); C) dez do tipo ns0(25%)e D) 23 do tipo n00(57,5%).

Percebe-se desta forma que a estrutura sintagmática como um todo está claramente envolvida. Conforme já colocamos na introdução deste capítulo,

estamos

analisando

todos

os

SNs

sob

uma

perspectiva

239

atomística, considerando cada constituinte flexionável como um dado de análise. Vamos ainda analisar todos os SNs de três ou mais constituintes dos falantes adultos sob uma perspectiva não atomística, considerando o SN inteiro

como

a

unidade

de

análise.

Nesta

segunda

perspectiva,

consideramos, entre outras, a variável Estrutura sintagmática do SN, cujos resultados e conclusões vamos apresentar no item 6.3 . Uma última palavra sobre a variável Posição precisa ser dita. Colocamos, no início desta discussão, que esta variável apresentava, de uma forma geral, resultados bastante semelhantes. Vimos também que algumas pesquisas detectaram uma linha decrescente em termos de desfavorecimento da concordância, a partir da primeira posição, enquanto outras detectaram a elevação da concordância na quarta posição. É possível levantar a hipótese de que, nas análises que detectaram a tendência à elevação da probabilidade na quarta posição, os SNs em jogo terminassem em substantivo ou tivessem o seu último elemento precedido de elementos anteriores marcados.

240

6.2.3.8 - Conclusão Acabamos de comprovar que a variável Posição isolada das Marcas precedentes e da Classe gramatical não dá conta do fenômeno lingüístico em estudo na sua totalidade. A melhor análise para este fenômeno, quer do ponto de vista lingüístico, quer do ponto de vista estatístico, é, portanto, a que considera estas três variáveis transformadas em duas: 1) Marcas precedentes em função da posição e 2) Relação entre elementos nucleares e não nucleares e posição dos elementos nucleares dentro do SN. Esta análise é mais adequada do ponto de vista estatístico porque apresenta convergência com todas as variáveis juntas e apresenta também log likelihood mais próximo de zero do que as outras análises. Ela é mais adequada do ponto de vista lingüístico, porque dá conta de descrever adequadamente a influência das variáveis Classe gramatical, Posição e Marcas precedentes transformadas em duas, através do cruzamento entre elas. Desta forma, evidenciam-se aspectos fortemente regulares que envolvem, inclusive, casos de poucas ocorrências, como a questão dos adjetivos antepostos em SNs de três constituintes, ou a presença

de

marcas ou de zeros no quarto e no quinto elemento do SN. Finalmente, além de uma descrição adequada, a nossa análise fornece explicações contundentes para o funcionamento da variável Marcas e da variável Relação, trazendo evidências de que o Português e o Espanhol, duas

línguas

que

marcam

a

pluralidade

da

mesma

forma,

241

apresentam mais similaridades do que diferenças, no que diz respeito a um condicionamento forte não funcionalista no sentido de Kiparsky (1972). Nos subitens seguintes, ainda na perspectiva atomística, vamos apresentar os resultados das variáveis restantes, que são: - o Contexto fonético/fonológico seguinte; - a Função sintática do SN; - os Traços mórficos, semânticos e estilísticos do substantivo e/ou do adjetivo.

6.2.4 - Contexto fonético/fonológico seguinte 6.2.4.1 - Introdução Na análise do contexto fonético/fonológico seguinte, a primeira expectativa que surge é a de que a busca do padrão silábico CV influencie a ausência de concordância nominal que, em 95% dos casos, consiste apenas na inserção de -S: um elemento de natureza consonântica. Sendo assim, espera-se que uma vogal seguinte favoreça a inserção de marcas formais de plural no SN,

porque o fenômeno da elisão propiciará a ligação entre a

consoante final do item anterior com a vogal inicial da primeira sílaba do item seguinte, dando uma sílaba do padrão CV, de tendência universal. De uma forma oposta, espera-se que uma consoante

seguinte a iniba, deixando de

provocar um travamentro silábico do tipo CVC, uma vez que não há possibilidade de ocorrer o fenômeno da ligação (cf. CÂMARA JR., 1975, p.50-1 e GUY, 1980, p.7-8;27-9).

242

Todavia, diversos trabalhos sobre o cancelamento ou inserção do -S morfêmico, e até

do não morfêmico, têm mostrado que a diferença

probabilística entre o efeito da consoante e o da vogal seguintes não é muito forte e, às vezes, inexistente (cf. CEDERGREN, 1973, p.43; POPLACK, 1980a, p.61; 1980b, p.376 e 1981, p.61; BRAGA & SCHERRE, 1976, p.471; BRAGA, 1977, p.31; SCHERRE, 1979, p.7-8; GUY, 1981a, p.166). A maior diferença probabilística entre estes dois fatores - 0,13 - foi encontrada por Poplack, em 1980, na direção esperada, ou seja, as vogais sendo menos favorecedoras do cancelamento do -S morfêmico (cf. 1980b, p.376). Entretanto, em 1981, Poplack reanalisa seus dados e apresenta outros resultados, deixando perceber que a diferença entre o efeito da consoante (0,47) e da vogal seguinte (0,40) diminui para 0,07 (cf. 1981, p.61). Scherre (1979) considerou oportuno observar este efeito em tipos nominais morfologicamente distintos, pelas seguintes razões: 1) Apenas os itens regulares fazem o plural através de inserção de S, onde se poderia verificar melhor a diferença em questão. 2) Os itens terminados em -S (mês) ou -R (mulher) foram considerados por ela como indicando o plural através de inserção de -es (meses/mulheres) ou de -e (mese/mulhere), o que faz com que apenas a ausência do -S não seja analisada como falta de concordância. Este mesmo raciocínio, afirma ela, se aplica também aos itens de plural duplo, aos terminados em -l e em -ão. 3) A partir da observação dos dados, verificou-se que, contrariamente à linha esperada, uma consoante seguinte parecia favorecer mais

243

a inserção de marca de plural nos nomes terminados em

-S ou -R,

especialmente nos em -S (cf. p.1-2; 8-11). Uma vez que a diferença existente entre consoante/vogal não exerce influência significativa, Braga (1977), seguida

por Scherre (1979) e Guy

(1981a), decidiu analisar os elementos seguintes em termos de traços, principalmente as consoantes, na tentativa de capturar alguma regularidade neste tipo de influência. Braga faz um trabalho bastante detalhado em termos de traços do segmento seguinte. Os resultados mais interessantes obtidos em termos crescentes de favorecimento da inserção do morfema de plural são os seguintes:

palatais(0,11);

labiais(0,36);

nasais(0,41);

dentais(0,42)

e

velares(0,65) (cf. 1977, p.71-2).85 Ela explica seus resultados em termos de assimilação. Os elementos consonânticos mais semelhantes aos segmentos marcadores de plural, os palatais, são os que mais favorecem a presença de concordância. Scherre também efetua uma análise bastante detalhada. Todavia, ela sempre agrupa as velares e as labiais, o que impossibilita uma comparação direta com os resultados de Braga em termos de ponto de articulação. Além disso, Scherre não verificou a influência das palatais, devido ao já conhecido fenômeno da neutralização em Português (cf. CÂMARA JR., 1975, p.83-4 e SCHERRE, 1987, p.73). Scherre não verificou também o efeito das nasais, observado por Braga junto ao Ponto de articulação. Com relação á influência da sonoridade dos segmentos consonantais, não observada por Braga, Scherre chega a uma conclusão bas-

244

tante interessante: o segmento surdo(0,54/0,58) favorece a inserção de marca formal de plural e o sonoro(0,42/0,42) a desfavorece (cf. 1979, p.7).86 Segundo Scherre, a influência positiva do traço +surdo não é estranha, pois é interessante nos lembrarmos de que a existência de elementos surdos é mais geral nas línguas humanas do que a de elementos sonoros. A atuação deste traço nos mostra exatamente que os elementos surdos estão sendo mais preservados do que os sonoros, pois em Português a fricativa não labial é sempre surda diante de elementos surdos. (SCHERRE, 1979, p.10) A conclusão mais surpreendente de Scherre

é a seguinte: "a

presença de uma consoante seguinte(0,74/0,69) favorece sensivelmente a inserção de marca formal de plural, enquanto a de uma vogal(0,26/0,30) a desfavorece" (1979, p.9)

nos itens terminados em -S (mês/meses) e -R

(mar/mares) e tem efeito absolutamente neutro sobre os itens regulares (consoantes: 0,48/0,51 e vogais 0,52/0,49). Com relação à influência da consoante e da vogal nos itens em -S e R, inversamente ao esperado em função da busca do padrão silábico CV, Scherre afirma que há uma explicação bastante simples: Ocorre nestes casos, o fenômeno da haplologia processo morfofonêmico que consiste na supressão de uma de duas sílabas iguais contíguas. Este fenômeno se aplica essencialmente nos casos mês/meses. Inserindose a marca de plural em casos seguidos de vogal vamos ter duas sílabas muito semelhantes, fato que não ocorre quando eles forem seguidos de uma consoante. Nada mais natural, portanto, que a vogal desfavoreça a aplicação da regra e que a consoante a favoreça. (SCHERRE, 1979, p.10-1)

245

Guy (1981a) também observou o efeito da sonoridade e do ponto de articulação das consoantes em termos de (1) +sonoro e -sonoro e (2) labial, alveolar e velar. As suas conclusões com relação ao ponto de articulação são análogas às de Braga (1977): as labiais(0,49) e as alveolares (e/ou dentais)(0,48) favorecem menos a inserção do morfema de plural do que as velares(0,54). Semelhante a Scherre (1979), ele conclui também que o traço sonoro(0,44) desfavorece a inserção de marcas plurais

e o surdo a

favorece(0,56). Com relação à influência do ponto de articulação, Guy afirma que estes resultados sugerem um padrão de dissimilação (cf. 1981a, p.145). A articulação não velar do segmento que marca o plural e a articulação também não velar dos segmentos seguintes formam uma seqüência de sons mais semelhantes, o que parece estar sendo evitado. Com relação à influência da sonoridade, Guy afirma que acha-se bastante estabelecido no estudo da percepção da fala que as fricativas não labiais surdas (denominadas por ele de sibilantes) são mais distintas e mais perceptíveis que as sonoras correspondentes, o que favorece a permanência das surdas e não das sonoras (cf. 1981a, p.146). Guy também não estudou o efeito das fricativas não labiais (palatais e alveolares), bem como o efeito das nasais separadamente. A influência da pausa tem sido também observada nos estudos em questão. Considera-se, todavia, que ela não apresenta, intrinsecamente, a linha esperada em termos de favorecimento ou desfavorecimento da presença de marcas de plural, no sentido da oposição consoante/vogal, ou seja, no sentido da busca do padrão silábico universal CV. Segundo Guy,

246

(...) não se pode prever a priori um efeito geral da pausa sobre regras de cancelamento. De outra forma, seu efeito parece ser arbitrariamente definido para diferentes dialetos: às vezes ela é tratada como não silábica, às vezes como não consonantal, e às vezes como simplesmente não marcada. (GUY, 1981a, p.145, cf., também, Guy, 1980, p.27-8.)87 Cedergreen observa que a pausa não tem nenhum efeito sobre o cancelamento do -S final não morfêmico (cf. 1973, p.43) no Espanhol do Panamá. Diferentemente Poplack considera que a pausa, em oposição à consoante e à vogal, favorece o cancelamento do -S morfêmico no Espanhol de Porto Rico (cf. 1980a, p.61; 1980b, p.376 e 1981, p.61). Com relação ao Português do Brasil, Braga (cf. 1977, p.40) e Guy (cf. 1981a, p.166) constatam que a pausa, em oposição à consoante e à vogal, favorece ligeiramente a inserção do morfema de plural. Os três estudos acima mostram três resultados diferentes para a influência da pausa, o que de certa forma aponta para a arbitrariedade de seu comportamento, conforme colocado por Guy. Segundo Poplack, os seus resultados relativos ao comportamento da pausa são similares aos encontrados por Terrell (1975) no estudo de Espanhol formal de Porto Rico. Considera, todavia, que, neste mesmo estudo, "(...) o cancelamento ocorre mais na posição pré-vocálica do que na posição pré-consonantal." (POPLACK, 1980a, p.62) 88 Uma vez que temos resultados divergentes em alguns aspectos, decidimos reanalisar os nossos dados, considerando também a influência desta variável.

247

6.2.4.2 - Análise do Contexto fonético/fonológico seguinte Analisamos o Contexto fonético/fonológico seguinte nos nossos dados, procurando confirmar ou não as conclusões mais interessantes dos estudos feitos anteriormente. Para tanto, fizemos inicialmente uma análise de todos os dados considerando as oposições maiores em termos de (1)consoante; (2)vogal; (3)pausa interna e (4)pausa final. A separação de pausa m interna e final teve

como

objetivo

verificar

possíveis

diferenças

neste

tipo

de

condicionamento de comportamento considerado arbitrário. Posteriormente, com base nas colocações de Scherre (1979), separamos os itens lexicais em três grupos regulares, terminados em -S (mês/meses) e em -R

(mar/mares) - e verificamos novamente o efeito da

consoante, vogal e pausa seguintes. Analisamos finalmente o conjunto dos itens regulares em termos de traços das consoantes agrupados em três variáveis: Ponto de articulação, Sonoridade e Caixas de ressonância. Já sabemos que este último efeito foi estudado por Braga (1977), mas junto ao Ponto de articulação. Isto impossibilita uma comparação direta entre os resultados dos dois estudos. Os nossos resultados relativos a todos os dados em termos de consoantes, vogais e pausa são apresentados na tabela 6.2.4.1, a seguir.

248

TABELA 6.2.4.1 CONTEXTO FONÉTICO/FONOLÓGICO SEGUINTE EM TODOS OS DADOS FATORES

FALANTES Adultos Apl./Total

Crianças

% Prob.

Apl./Total

% Prob.

Consoante

5140/6863 = 75

0,43

911/1277

= 71

0,43

Vogal

1590/2248 = 71

0,48

251/429

= 58

0,39

Pausa interna

1025/1678 = 61

0,56

166/307

= 54

0,56

Pausa final

106/180

0,53

57/108

= 53

0,62

Os

resultados

acima

= 59

corroboram

a

conclusão

comumente

apresentada: a diferença de atuação da consoante e da vogal é praticamente inexistente - 0,05 nos adultos a favor da vogal e 0,04 nas crianças a favor da consoante. Encontra-se uma

leve oposição entre pausa e não pausa,

favorecendo e desfavorecendo, respectivamente, a inserção de morfema de plural nos SNs, nos dados dos falantes adultos. Nos dados das crianças, a oposição é mais forte. Mesmo trabalhando só com os itens regulares, que constituem 95($) dos dados, esta mesma situação permanece, conforme se verifica nos resultados da tabela 6.2.4.2, que apresenta as pausas interna e final já amalgamadas.

249

TABELA 6.2.4.2 CONTEXTO FONÉTICO/FONOLÓGICO SEGUINTE EM TODOS OS DADOS E NOS ITENS REGULARES FATORES

FALANTES Adultos Todos os dados

Consoante

F. P.

Vogal

F. P.

Pausa

F. P.

Só regulares

Crianças Todos os dados

Só regulares

5140 = 75% 6883 0,44

4743 = 74% 6406 0,44

911 = 71% 1277 0,46

859 = 71% 1208 0,45

1590 = 71% 2248 0,49

1428 = 70% 2041 0,50

251 = 58% 429 0,41

238 = 60% 394 0,44

1131 = 61% 1858 0,57

915 = 56% 1624 0,56

233 = 54% 415 0,62

169 = 50% 338 0,61

Os resultados encontrados acima, para a influência da pausa, são consistentes com aqueles evidenciados por Braga (cf. 1977, p.40) e Guy (cf. 1981a, p.166) e opostos aos apresentados por Poplack (cf. 1981, p.61), conforme se observa pelos resultados da tabela 6.2.4.3, a seguir.89

250

TABELA 6.2.4.3 SOBRE A INFLUÊNCIA DA CONSOANTE, DA VOGAL E DA PAUSA EM ESTUDOS DIVERSOS FATORES

FALANTES Adultos

Crianças

Guy (1981a)

Poplack (1981)

Consoante

0,44

0,46

0,46

0,53

Vogal

0,49

0,41

0,49

0,60

Pausa

0,57

0,62

0,55

0,37

Os resultados da análises do Português mostram que existe uma leve oposição entre pausa e não pausa. Mostram, ainda, que a pausa favorece mais a presença do morfema de plural do que uma vogal ou uma consoante. Poplack encontra também uma oposição entre pausa e não pausa, mas na direção oposta: a pausa está favorecendo o cancelamento (ou desfavorecendo a inserção), enquanto a

consoante e a vogal estão

favorecendo-o. Neste aspecto, Português e Espanhol de Porto Rico diferem. A influência

da pausa sobre a inserção das marcas de plural é

consistente em Português e apresenta uma polarização especialmente positiva nos itens terminados em -S: favorece nitidamente a inserção do morfema de plural, conforme se pode observar nos resultados da tabela 6.2.4.4. Os resultados relativos à oposição consoante/vogal são inteiramente diversos nestes casos e perfeitamente paralelos aos encontrados por Scherre (1979). Diferentemente das expectativas de busca do padrão silábico, os nomes em -S recebem mais inserção do morfema de plural quando seguidos de consoante do que de vogal.

251

TABELA 6.2.4.4 COMPARAÇÃO DA INFLUÊNCIA DO CONTEXTO FONÉTICO/FONOLÓGICO SEGUINTE NOS ITENS REGULARES E NOS ITENS TERMINADOS EM -S FATORES

ITENS REGULARES Adultos

Consoante

F. P.

Vogal

F. P.

Pausa

F. P.

ITENS TERMINADOS EM -S

Crianças

Adultos

Crianças

4743 = 74% 6406 0,44

859 = 71% 1208 0,45

96 = 91% 106 0,58

13 = 81% 16 0,88

1428 = 70% 2041 0,50

238 = 60% 394 0,44

35 = 55% 64 0,14

1 = 08% 12 0,003

915 = 56% 1624 0,56

169 = 50% 338 0,61

78 = 96% 81 0,81

19 = 95% 20 0,98

Conforme já colocáramos em (1979), tais resultados são explicados pelo fenômeno da fonética sintática: a haplologia sintática, que consiste em eliminar grupos de segmentos semelhantes dentro da palavra ou em fronteiras de palavras (cf. CÂMARA JR., 1977, p.134). Do ponto de vista diacrônico, temos: - bondadoso passando a bondoso; - saudadoso passando a saudoso.

Do ponto de vista sincrônico, temos, por exemplo, - "rua Con de Bonfim" por "rua Conde de Bonfim"; - "pos de gasolina" por "posto de gasolina"; - "po dexá que eu faço" por "pode deixar que eu faço";

252

- "tu de novo" por "tudo de novo".

Nos nossos casos em estudo, a presença de uma vogal seguinte e a inserção de -ES ou de -E criam exatamente as mesmas circunstâncias sobre as quais o fenômeno da haplologia opera, como podemos ver pelos exemplos a seguir:

(Pac20,mg,25a); - quantaz vez eu (quantas vezes eu) - pocos mês aí (pocos mezes aí) (Cab02,mp,16a); - três mês ele (três mese ele) (Dav42,mc,31a).

Por sua vez, a presença de uma consoante seguinte ou a presença da pausa e a inserção de -ES ou de -E não criam tais situações, favorecendo a inserção de marcas formais de plural no SN. Pode-se verificar, portanto, que não há o princípio da busca do padrão silábico CV regendo a inserção do morfema de plural mas sim um princípio estrito de fonética sintática. Esta variável não foi selecionada para os itens terminados em -R, que não apresentam o fenômeno da haplologia sintática, diferentemente do que supunha Scherre (1979). Os resultados não selecionados apontam em direção à oposição pausa x não pausa, apenas mais polarizados do que no caso dos regulares, conforme se pode ver nos resultados da tabela 6.2.4.5, a seguir.

253

TABELA 6.2.4.5 COMPARAÇÃO DA INFLUÊNCIA DO CONTEXTO FONÉTICO/FONOLÓGICO SEGUINTE NOS ITENS REGULARES, NOS TERMINADOS EM -S E EM -R DADOS DOS FALANTES ADULTOS FATORES

ITENS LEXICAIS Regulares

Consoante

F. P.

Vogal

F. P.

Pausa

F. P.

Terminados em -S

Terminados em -R

4743 = 74% 6406 0,44

96 = 91% 106 0,58

121 = 84% 144 (0,36)

1428 = 70% 2041 0,50

35 = 55% 64 0,14

49 = 89% 55 (0,42)

915 = 56% 1624 0,56

78 = 96% 81 0,81

45 = 96% 47 (0,71)

Na análise dos traços das consoantes seguintes aos itens regulares, consideramos três variáveis: Papel das cordas vocais, Ponto de articulação e Caixas de ressonância. Os resultados, já sintetizados, são apresentados na tabela 6.2.4.6. Para chegarmos a este ponto, passamos por duas etapas: análise detalhada em termos de segmentos e análise detalhada em termos de traços. Julgamos que a apresentação destes passos é desnecessária, uma vez que se trata de variáveis de influência com pouca relevância sobre o fenômeno em estudo. Na terceira coluna da tabela 6.2.4.6, colocamos os resultados probabilísticos de Guy. Para estas variáveis, ele não apresenta as freqüências (cf. 1981a, p.166). Além disso, os resultados de Guy referem-se a todos os dados, o que, todavia, não impossibilita a comparação uma vez que os regulares constituem a maioria absoluta dos dados. Vejamos os resultados.

254

TABELA 6.2.4.6 TRAÇOS DAS CONSOANTES COM OS ITENS REGULARES PAPEL DAS CORDAS VOCAIS

FALANTES Adultos

Sonoro

F. P.

Surdo

F. P.

Crianças

Guy (1981a)

1903 = 65% 2913 0,46

414 = 66% 632 (0,49)

0,44

2843 = 81% 3494 0,54

441 = 77% 572 (0,51)

0,56

2142 = 81% 2646 0,44

322 = 77% 420 (0,44)

0,49

1264 = 58% 2175 0,49

263 = 58% 450 (0,54)

0,48

1340 = 84% 1586 0,56

270 = 81% 334 (0,51)

0,54

811 = 61% 1326 0,46

187 = 64% 291 0,43

3935 = 77% 5081 0,54

668 = 73% 913 0,57

PONTO DE ARTICULAÇÃO Labial

F. P.

Dental/ alveolar

F. P.

Velar

F. P.

CAIXAS DE RESSONÂNCIA Nasal

F. P.

Oral

F. P.

Os resultados obtidos para os falantes adultos são semelhantes aos já relatados por Braga (1977) e Guy (1981a) em termos de Ponto de articulação: as velares favorecem ligeiramente a presença do morfema de

255

plural. Eles são também semelhantes aos encontrados por Scherre (1979) e Guy (1981a) em termos de Papel das cordas vocais: as surdas também propiciam a inserção da marcas de plural um pouco mais do que as sonoras. Com relação a estas duas variáveis, as crianças apresentam resultados não selecionados. A única novidade que aqui se apresenta diz respeito à variável Caixas de ressonância, indicando-se que, para ambos os agrupamentos de falantes, as nasais desfavorecem a existência de marcas formais de plural no SN, o que já era esperado pela incidência bastante perceptível da aspiração e queda do -S

diante da nasal bilabial principalmente. Passemos à

conclusão.

6.2.4.3 - Conclusão

Resumindo, em termos de contexto fonético/fonológico seguinte, constata-se 1) a ausência do efeito da oposição consoante/vogal, não se evidenciando a busca do padrão silábico universal CV; 2) a presença de efeito positivo da consoante e negativo da vogal nos itens terminados em -S (mês/meses) devido ao fenômeno da haplologia sintática; 3) a influência ligeiramente positiva da pausa nos itens regulares e especialmente forte nos itens terminados em -S; 4) a influência bastante fraca dos traços dos segmentos em termos de Papel das cordas vocais, Ponto de articulação e Caixas de ressonância.

256

Além

disso,

é

interessante

observar

que

estudos

sobre

o

cancelamento do -S não morfêmico em Português mostram que o efeito da sonoridade é bastante polarizado. Gryner e Macedo (1981), num trabalho sobre o Português falado em Cordeiro, interior do Estado do Rio de Janeiro, mostram que os elementos surdos são os menos favorecedores do cancelamento do -S (0,22). Os mais favorecedores são os sonorantes (0,71) e os de efeito intermediário, os sonoros (0,59) (cf. P.136-7). Os resultados de Guy (1981a) sobre o cancelamento do -S não morfêmico com respeito à sonoridade são

ligeiramente

superiores

aos encontrados

para o -S

morfêmico (para o não morfêmico, 0,58 x 0,42, para surdos e sonoros, respectivamente; e, para o morfêmico, 0,56 x 0,44). Em termos da oposição consoante, pausa e vogal, ambos os estudos evidenciam que a consoante favorece o cancelamento do -S não morfêmico, enquanto a vogal o desfavorece, evidenciando-se assim um movimento em direção à busca do padrão silábico CV, na questão do cancelamento do -S não morfêmico. Em ambos os estudos, constata-se a influência neutra da pausa sobre o cancelamento em questão. Temos, portanto, indícios fortes para afirmar que o cancelamento do S não morfêmico e a inserção do -S morfêmico não se encontram, hoje, completamente ligados a um processo único. Refutamos assim a hipótese que levantamos em 1978 (cf. P.141). No presente estágio do Português, trata-se de regras com condicionamentos distintos, conforme também o coloca Guy (cf. 1981a, P.197). A

influência

do

Contexto

fonético/fonológico

sobre

a

presença/ausência de marcas formais de plural no SN em Português não se mostra muito forte, principalmente, se relacionada à influência (1) das

257

Marcas precedentes e posição e (2) da Relação entre elementos nucleares e não nucleares e posição dos elementos nucleares no SN. Diferentemente do que Poplack propõe para o Espanhol de Porto Rico, o -S morfêmico em Português não é principalmente uma entidade fonológica (cf. 1980b, P.383), mas sim um índice de, por exemplo, grau de coesão entre os elementos no SN. Podemos então levantar aqui a seguinte hipótese: se a variação no número de marcas formais de plural no SN estiver refletindo um processo de mudança lingüística, certamente não será um tipo de mudança preconizada pelos neogramáticos, a qual se supõe altamente regular e não condicionada por fatores outros que não os fonéticos (cf. LABOV, 1981, P.272-4).

6.2.5 - Função sintática do SN A motivação para o estudo da influência da Função sintática sobre o número de marcas plurais no SN decorreu do fato de termos detectado um tipo especial de SN que se apresenta consistentemente menos marcado do que os demais. Na maioria das vezes, este tipo de SN funciona como resumo de idéias anteriores, mas pode também se apresentar como uma unidade parentética. Como se pode observar pelos exemplos abaixo, este tipo de SN não faz parte de uma estrutura sintática na qual se possa identificar a sua função em termos tradicionais: - Já saímos de melindrosa, de Pedrita, de (...) Que mais? Essas bestera toda. (Fat23,fg,15a);

258

- (Sua tia nasceu onde?...) Bom Jardim, Friburgo, (Sue05,fp,24a);

esses canto aí.;

- Talvez por (...) Em termos de cidade grande hoje, as coisas sejam mais agressivas, a pessoa (...) tem uma atitude mais agressiva ou de medo, né? De assalto, de violência, essas coisas todas. (Hel44,fc,44a); - Passavam filmes (...) sobre a vida de Jesus Cristo... esses negócio assim! História a gente estuda... No princípio, era como os homens viviam, sabe? Essas coisas assim! (...) a Pré-história, o período neolítico, (...) essas coisas assim. (Sue05,fp,24a). Decidimos então codificar uma variável denominada Função sintática do SN, com o objetivo de analisar o comportamento do SN apresentado acima e de verificar se as funções sintáticas tradicionais exercem alguma influência sobre o número de marcas formais de plural no SN. Se a hierarquia estabelecida para as diversas funções sintáticas tiver algum efeito sobre o fenômeno em estudo, espera-se que os SNs que exerçam funções essenciais e integrantes tenham mais marcas de plural do que os demais, ficando em último lugar aqueles SNs que não exercem nenhuma função sintática e que parecem ter menos relevância na comunicação, considerando que a informação já foi transmitida em outros elementos do discurso ou que ela é de natureza mais fática do que propriamente referencial, no sentido de Jakobson 1969 (cf. P.118-162). Com estas idéias em mente, fizemos uma categorização inicial desta variável da seguinte forma: 1) SNs de função sujeito; 2) SNs de função complemento nominal ou verbal, incluindo-se os chamados complementos circunstanciais e os relativos (cf. ROCHA LIMA, 1983, P.307-11 e FERNANDES, 1979);

259

3) SNs de função adjunto adnominal ou verbal; 4) SNs de função predicativa ou de função dúbia (estes últimos casos podem ser interpretados como sujeito, como predicativo ou como objeto direto);90 5) SNs de função dupla (casos de oração relativa que exercem uma função na principal e outra na encaixada, através do que relativo principalmente); 6) SNs de função abortada (casos em que ocorrem interrupções no discurso, não sendo possível a identificação precisa da função sintática); 7) SNs de função resumitiva ou de função fática, conforme já descritos.

Posteriormente subdividimos os casos de função sujeito em SNs de função sujeito com verbos de ação e com verbos de não ação, com o objetivo de verificar se a carga de agentividade também exerceria alguma influência sobre o número de marcas de plural. No quadro 6.2.5.1, apresentamos alguns exemplos desta variável.

260

QUADRO 6.2.5.1 EXEMPLOS DE FUNÇÃO SINTÁTICA DO SN FUNÇÃO

EXEMPLOS

Sujeito de verbo de ação

os cara começa a correr as garotas brincam

(Jup06,fp,18a) (Glo11,fg,48a)

Sujeito de ver bo de não ação

os homens viviam... os pais dela eram

(Sue05,fp,24a) (Glo11,fg,48a)

Complemento

tem contato com as pessoas participar das reuniões

(Hel44,fc,44a) (Sue05,fp,24a)

Adjunto

quarto dos fundos acorda quatro horas

(Mar47,fc,44a) (Ana40,fc,18a)

Predicativa ou dúbia

eu não acho que sejam pessoas alienadas não... são 48 horas assim

(Hel44,fc,44a) (Glo11,fg,48a)

Dupla

as pessoas ficaram sem as máscaras que elas têm

(Hel44,fc,44a)

não tô interessada se tem esquerda...as idéias...por isto eu acho que

(Hel44,fc,44a)

já saímos de melindrosa De Pedrita, de...que mais? Essas bestera toda

(Fat23,fg,15a)

Abortada

Resumitiva

Os resultados obtidos, com base em um subconjunto da amostra para as crianças, e com base em praticamente todos os dados para os falantes adultos, evidenciaram que as funções sintáticas tradicionais não apresentam oposição evidente entre si, como se constata na tabela 6.2.5.2, a seguir.91

261

TABELA 6.2.5.2 FUNÇÃO SINTÁTICA DO SN FATORES

FALANTES Adultos Apl./Total %

Sujeito de verbo de ação Sujeito de verbo de não ação

465/602

Prob.

Crianças Apl./Total % Prob.

= 77

0,56

61/98

= 62

0,51

922/1187 = 78

0,57

62/96

= 65

0,50

Complemento nominal e verbal

2926/4153 = 70

0,48

254/395

= 64

0,53

Adjunto nominal e verbal

1688/2319 = 73

0,53

129/184

= 70

0,60

Função dupla

662/844

= 78

0,63

= 65

0,41

Função predicativa ou dúbia

700/1011 = 69

0,52

72/114

= 63

0,57

Função abortada

394/572

= 67

0,50

49/71

= 69

0,50

Função resumitiva

215/392

= 55

0,25

30/59

= 51

0,38

36/56

Tanto os SNs de funções consideradas essenciais quanto integrantes e acessórias apresentaram índices de concordância bastante semelhantes. Os

SNs

de

função

sujeito

e

função

adjunto

apresentam

índices

probabilísticos extremamente próximos nos falantes adultos. Nas crianças, a quase identidade de comportamento pode ser vista nos SNs de função sujeito e função complemento. Além disso, os dois tipos de sujeito não apresentam qualquer diferença de comportamento entre si, quer nos dados dos adultos quer nos dados das crianças. Até mesmo os SNs de função predicativa, dúbia e abortada apresentaram índices de concordância extremamente semelhantes aos índices dos SNs de função sujeito. Diante de tais resultados, nem ousamos interpretar os índices probabilísticos relativamente altos atribuídos aos SNs de função adjunto nas

262

crianças (0,60) e aos SNs de função dupla nos adultos (0,63), bem como os índices probabilísticos relativamente baixos atribuídos ao SNs de função dupla nas crianças (0,41). Diríamos que tais resultados são possíveis reflexos de outros aspectos não estudados por nós aqui, do tipo: a posição tópica ou não tópica do SN. A única oposição consistente encontrada ocorre apenas na relação entre os SNs de função resumitiva ou fática e os demais, cujos

resultados

encontram-se

amalgamados

na

tabela

6.2.5.3.

A

denominação de Função sintática do SN para esta variável deixou de ter qualquer significado. Passou-se então a denominá-la Função resumitiva do SN. Os resultados da tabela abaixo, tanto para os adultos quanto para as crianças, envolvem todos os dados da nossa análise, obtidos através da última análise alternativa, sendo, portanto, diferentes em termos da aplicação e do total de ocorrências em relação ao que se encontra na tabela 6.2.5.2. TABELA 6.2.5.3 FUNÇÃO RESUMITIVA DO SN FUNÇÕES

FALANTES Adultos Apl./Total

%

Crianças Prob.

Apl./Total

%

Prob.

+resumitiva

214/389

= 55

0,38

58/119

= 49 0,41

-resumitiva

7647/10580 = 72

0,62

1327/2002

= 66 0,59

Os resultados da tabela 6.2.5.3 mostram evidentemente que os SNs de função resumitiva favorecem o número de marcas de plural e que

263

os demais favorecem-no. A explicação para estes resultados poderia ser de base funcionalista, no sentido de Kiparsky: as marcas plurais dos SNs denominados resumitivos parecem ter menos carga funcional por portarem informação redundante ou por não terem função propriamente referencial. Sendo assim, eles acrescentam pouco, ou quase nada de novo, à mensagem transmitida, podendo, portanto, vir menos marcados sem risco de se perder informação. Contrapondo este tipo de influência àquela vista na variável Marcas precedentes (itens 6.2.3.5 a 6.2.3.8, p.168 a 241), poderíamos dizer, nos termos de Poplack para o Espanhol de Porto Rico, que há restrições em conflito regendo a presença ou ausência das marcas de pluralidade no SN. Em 1980, Poplack afirma, para o Espanhol, que (...) fatores funcionais têm um efeito pequeno mas regular no cancelamento, em direção à confirmação da hipótese funcionalista. (...) Entretanto, os fatores funcionais como um todo afetam menos o cancelamento do que qualquer outro grupo de fatores estudado, exceto o acento seguinte. (POPLACK, 1980a, p.62)92 Em 1981, Poplack reanalisa estes mesmos dados de forma ligeiramente diferente e conclui novamente que (...) o fator funcional (...) tem um efeito regular sobre o cancelamento da marca. (...) Entretanto esta não é uma tendência forte. (...) Eles não afetam a retenção da marca mais do que os fatores fonológicos e gramaticais. (POPLACK, 1981, p.61)93 Os nossos resultados mostram, mais uma vez, semelhanças no comportamento desta regra para o Espanhol de Porto Rico e para o Português do Brasil. A variável Função resumitiva do SN, embora apresente

264

resultados bastante polarizados para os dois grupos de falantes, é selecionada em penúltimo lugar. Poplack, em 1981, afirma que o fraco efeito funcional encontrado por ela no cancelamento do (S) não é exatamente do tipo postulado por Kiparsky, pois, segundo ela, isto foi estabelecido para situações em que o segmento (...) realmente carrega toda a informação de plural que deve ser conservada. Então considerações funcionais não têm resultado no condicionamento estritamente gramatical (...) determinando a retenção do (S). Aqui nós temos um caso onde efeitos estruturais e efeitos informacionais desempenham papéis em competição, e onde restrições de natureza puramente fonológica são igualmente importantes. (POPLACK, 1981, p.61-2)94 A nosso ver, a melhor forma de explicar estes resultados seria através de hipóteses funcionalistas não formais do tipo não kiparskiano, ou seja, através de noções do tipo tópico X não tópico (cf. CHAFE, 1976, p.50) ou de centralidade X perifericidade (cf. NARO & VOTRE, 1986, p.454-66). Os SNs resumitivos ocorrem normalmente à direita da oração, não sendo, portanto, tópicos do discurso. Usando as palavras de Naro & Votre, poderíamos dizer que estes SNs são de baixa polaridade, pois jamais são ponto de referência no discurso. Por esta razão, tendem a vir menos marcados. É importante observar que nesta parte da nossa análise não codificamos todos os SNs em termos de ser tópico ou não tópico do discurso ou em termos de centralidade X perifericidade. Não sabemos se estas noções se aplicam a quaisquer SNs não polares. Estamos sim observando que os SNs rotulados como resumitivos são todos não polares. Não podemos, todavia, afirmar que todos os não resumitivos são polares,

265

o que seria facilmente falsificável. A reanálise desta variável será feita no item 6.3, ao considerarmos o SN inteiro como uma unidade de análise, quando rediscutiremos a influência de uma série de variáveis numa perspectiva não atomística. Concluindo, vimos que a hierarquia estabelecida para as funções sintáticas tradicionais não exerce influência relevante e coerente sobre o número de marcas plurais no SN e vimos também que a oposição relevante existente é de natureza funcional, no sentido não kiparskiano do termo. Vimos ainda que a influência desta variável é uma das menos relevantes, no sentido de ser uma das últimas selecionadas, e que isto é coerente com os resultados relatados por Poplack (1980 e 1981) para o Espanhol de Porto Rico.

6.2.6 - Traços mórficos, semânticos substantivo e/ou do adjetivo

e

estilísticos

do

6.2.6.1 - Introdução Com base no fato de que "conservam-se geralmente no singular os nomes de massas, que, em razão de não se poderem contar por unidades, não comportam a noção de plural" (cf. ROCHA LIMA, 1983, p.74), levantamos a hipótese de que os nomes

[+concretos], [+específicos] e

[+contáveis] apresentassem maiores índices de concordância do que [+abstratos], [+genéricos] e [-contáveis]. Codificamos os nossos dados seguindo estas idéias, mas, seja por imprecisão de critérios ou por inexistência real deste tipo de condicionamento no número de marcas formais nos SNs plurais, não alcançamos os resultados desejados.

266

O que certamente mais nos chamou a atenção durante a análise dos dados foi o fato de as palavras pessoa e coisa, ambas de emprego essencialmente genérico e também de maior ocorrência, serem as mais e menos marcadas, respectivamente. Em números aproximados, verificamos que 1) havia 580 ocorrências do substantivo coisa com 209 marcadas: 36%; 2) havia 356 ocorrências do substantivo pessoa com 292 marcadas: 82%. Então, a hipótese que de imediato se levanta é que a questão não está ligada ao caráter genérico, mas sim ao caráter humano do item, não apenas pela obviedade dos dados, mas também por já se saber, através da literatura lingüística, que o traço [+humano] é discursivamente mais saliente, e que tem se revelado um fator importante em fenômenos lingüísticos estudados em Português (cf., por exemplo, MOLLICA, 1977, p.37; 54; 68 e OMENA, 1978, p.33; 44; 91; 97-8). Todavia, substantivos

a observação dos dados nos mostrou também que os

cara

e

outro,95

portadores

de

traço

[+humano],

se

apresentavam tão pouco marcados quanto o substantivo coisa: 3) havia 280 ocorrências de substantivos cara e outro com 90 marcadas: 32%. Com base nestas novas observações, surge também a hipótese da influência da Formalidade léxica sobre o uso de uma ou outra variante

267

lingüística, o que já é também constatado na literatura lingüística por Fischer (1974), ao estudar a variação in/ing para o inglês (cf. p.92). A

hipótese

da

influência

da

Formalidade

léxica

se

torna

particularmente interessante de ser perseguida, ao verificarmos também que 4) havia 164 ocorrências de itens informais com traço [-humano] do tipo bestera, troço, goró com apenas 21 marcadas: 13%. Observamos, finalmente, que os itens lexicais diminutivos e aumentativos, estes últimos de baixa freqüência, tendiam também a inibir, consideravelmente, o número de marcas plurais no SN, ou seja, 5) havia 212 ocorrências de diminutivos/aumentativos, com apenas 71 marcadas: 34%. É do conhecimento de todos que o diminutivo tem, ao lado da carga semântica "tamanho pequeno", também a carga de "afetividade" e de "pejorativo", por exemplo, traços que se coadunam perfeitamente com o traço da "informalidade". Com base nas observações relatadas acima, decidimos codificar os substantivos (incluindo também os pronomes pessoais) e os adjetivos especificamente,

em

termos

das

seguintes

variáveis:

Animacidade,

Formalidade léxica e Grau dos itens léxicos. A apresentação de exemplos e dos resultados será feita a seguir,

268

seguindo a pertinência estatística atribuída a cada uma das variáveis analisadas.96

6.2.6.2 - Formalidade dos substantivos Foram classificados como informais os substantivos do tipo cara, outro (de emprego substantivado), besteira, bobagem, grilo, lance, papo, merda, goró, tipicamente usados como gírias. Incluíram-se também nesta categoria todos os usos da palavra coisa sem função sintática, mas apenas como função fática ou resumitiva - casos não detectados, quer em redações de alunos, quer em escrita de jornais e revista (cf. OLIVEIRA, PEREIRA & BASTOS, 1986), além de estruturas como um montão de, uma pá de, um bando de, um monte de. Os demais casos foram considerados como não marcados em relação à informalidade. Alguns exemplos de [+informais] são apresentados a seguir: (Jae25,mg,30a); - os paraíba brabo lá... - tomou uns goró, queimou uns fumo e surrou... (Jov26,mg,32a); (Jov26,mg,32a); - tá fritando uns troço... - uns cara machão... (Pac20,mg,32a); - acontece cum os otro... (Cla27,mg,30a); (Ire17,fp,52a). - fazendo essas miséria todinha... A divisão binária ocorreu pela inexistência de critérios precisos e não tendenciosos para se estabelecer uma escala mais detalhada da informalidade léxica. Estamos assumindo que a informalidade léxica determina a ausência de marcas de plural no SN. Todavia, não é impossível de se imaginar que a ausência de marcas possa ser um indicativo de não formalidade discursiva.

269

Considerando, portanto, que poderíamos ser influenciados pela ausência de marcas formais de plural na classificação da informalidade léxica, preferimos ficar com uma classificação mais simplificada e mais precisa, que não oferece margem a dúvidas. A nossa classificação aqui diz respeito a itens léxicos e não a partes das entrevistas. Não utilizamos os critérios de Labov para isolar a fala casual nas situações de entrevista, porque consideramos que as nossas entrevistas versam sobre assuntos corriqueiros e usuais, não nos fornecendo grandes possibilidades de delimitar com precisão mudanças de estilo (cf. LABOV, 1972a, p.79-94 e cf., também, HOCHBERG, 1986, p.612). Além disso, a informalidade léxica mostrava-se indiscutivelmente relevante. Os resultados dos substantivos são apresentados na tabela 6.2.6.1.

TABELA 6.2.6.1 FORMALIDADE DOS SUBSTANTIVOS FORMALIDADE

FALANTES Adultos

+informal -informal

Apl./Total

%

130/459

= 28

3152/5451 = 58

Crianças Prob.

Apl./Total

%

Prob.

0,39

34/192

= 18

0,33

0,61

447/951

= 47

0,67

Encontramos, na tabela 6.2.6.1, resultados probabilísticos dentro da linha esperada: os substantivos mais informais inibem o número de marcas plurais no SN, tanto

no caso dos adultos quanto no das crianças,

270

enquanto

os

substantivos

menos

informais

favorecem-no.

Isto

é

perfeitamente natural, pois já se sabe que, em situação de fala menos tensa, por exemplo, o número de marcas formais de plural no SN tende a diminuir (cf. BRAGA & SCHERRE, 1976, p.473; BRAGA, 1977, p.65-6; SCHERRE, 1978, p.91-3 e GUY, 1981, p.193). Os itens de menor formalidade léxica são exatamente índices de menor formalidade da situação de fala. A análise feita permite prever que, se um falante que normalmente aplica muito a regra deixar de aplicá-la, certamente ele o fará numa estrutura que

contenha

um

item

léxico

marcado

pela

informalidade

(cara).

Inversamente, um falante que aplica pouco a regra, ao aplicá-la, o fará em estruturas que contenham um item léxico não marcado quanto à informalidade (pessoa).97

6.2.6.3 - Animacidade dos substantivos A classificação dos substantivos como [+humano] ou [+animado], em princípio, não apresenta problemas, mas, mesmo assim, há casos limítrofes e discutíveis. Os substantivos lojas, colégio, fábrica, por exemplo, podem adquirir o traço [+humano] quando empregados no sentido de agrupamento de pessoas (no sentido metonímico). Eles foram, por isso, neste emprego, classificados como [+humano] e

[+coletivo]. Estabelecemos inicialmente

quatro categorias obtidas através da combinação dos traços [+humano], [+animado] e [+coletivo]. Este último caso foi usado apenas para os itens com o traço [+humano]. Obtivemos, portanto, o seguinte:

271

1) [-humano] e [-animado] - tirou as árvores fora... - ia dar três capítulos...

(Lui08,mp,57a); (Fat23,fg,15a);

2) [-humano] e [+animado] - até a comida dos cachorros eu... (Mgl48,fc,52a); - em cima das codorna... (Ago33,mp,60a);

3) [+humano] e [-coletivo] - com meus pais eu já viajei... (Val24,fg,15a); - as professoras novinhas gostavam... (Mgl48,fc,52a);

4) [+humano] e [+coletivo] - as quadrilhas disputavam para... (San01,mp,18a); - as lojas ficaram desesperada... (Lau28,fc,43a); - contra as melhores equipe lá... (Man14,mp,59a).

A tabela 6.2.6.2 apresenta os resultados dos falantes adultos, com a variável em questão subdividida em quatro categorias, e a tabela 6.2.6.3 mostra os resultados destas quatro categorias transformadas em duas, em função das semelhanças de comportamento, para os adultos e para as crianças.

272

TABELA 6.2.6.2 ANIMACIDADE DOS SUBSTANTIVOS NOS DADOS DOS FALANTES ADULTOS ANIMACIDADE

Apl./Total

%

Prob.

-humano -animado

1966/3748 =

52

0,44

=

36

0,33

1192/1947 =

61

0,59

66

0,65

-humano +animado

22/61

+humano -coletivo +humano +coletivo

102/154

=

TABELA 6.2.6.3 ANIMACIDADE DOS SUBSTANTIVOS NOS DADOS DE TODOS OS FALANTES ANIMACIDADE

FALANTES Adultos Apl./Total

% Prob.

Crianças Apl./Total

% Prob.

-humano

1988/3809 = 52 0,45

316/746

= 42 0,46

+humano

1294/2101 = 62 0,55

165/397

= 42 0,54

A oposição maior que temos com relação à Animacidade é [+humano] x [-humano]. Novamente os resultados correspondem à nossa expectativa lingüística: se o traço humano é considerado mais saliente, é de se esperar, dentro da linha geral do nosso trabalho, que os substantivos marcados positivamente com relação a este traço tenham mais marcas de plural (0,55/0,54) do que os com traço [-humano] (0,44/0,46), como mostram as probabilidades obtidas. Os resultados desta variável são consistentes para

273

os adultos e para as crianças, mas, sem sombra de dúvidas, eles não apresentam diferenças probabilísticas fortes. Inclusive, no caso das crianças, no nível de análise em que ele foi selecionado, o último, não houve convergência até a iteração 21.

6.2.6.4 - Grau dos substantivos Os substantivos foram categorizados também em função de grau: normal x diminutivo/aumentativo. Exemplos de diminutivo/ aumentativo podem ser vistos em:

- tem umas garotinha lá... (Val24,fg,15a); - são meus amigão... (Seb09,mg,39a); - tem umas briguinha... (Ari30,fc,43a); (Ana40,fc,18a); - sai uns quatrocentos bolinhos de... - e outras escolinha pequena, eles... (Eve43,fc,42a); - dois dentão enorme que... (Mal16,fp,56a).

Os aumentativos não foram categorizados separadamente por duas razões: 1) o número de casos é pequeno, apenas nove; 2) eles

apresentam,

em

termos

percentuais,

comportamento

semelhante ao do diminutivo: em nove casos há apenas dois marcados. Os resultados da nossa análise em função da variável Grau para os substantivos encontram-se na tabela 6.2.6.4.

274

TABELA 6.2.6.4 GRAU DOS SUBSTANTIVOS GRAU

FALANTES Adultos Apl./Total

Diminutivo/ Aumentativo Normal

% Prob.

63/157 = 40 0,40 3219/5753 = 56 0,60

Crianças Apl./Total 8/55

% Prob. = 15 0,37

473/1088 = 43 0,63

Os resultados acima - diminutivos/aumentativos desfavorecendo o número de marcas plurais nos SNs (0,40/0,37) - explicam-se também em função das situações de mais informalidade; afetividade etc.

E,

conseqüentemente, de menos pressão social que envolve o uso dos diminutivos/aumentativos.

Nestas circunstâncias, a ausência de marcas

plurais nos SNs é comumente constada.

275

6.2.6.5 - Grau e formalidade dos adjetivos Os adjetivos foram também categorizados em função da variável Grau e Formalidade, mas a sua análise não foi feita da mesma forma que a dos substantivos, porque os adjetivos apresentam uma distribuição um pouco diferente, conforme se vê na tabela 6.2.6.5.

TABELA 6.2.6.5 DISTRIBUIÇÃO DOS ADJETIVOS: GRAU E FORMALIDADE GRAU E FORMALIDADE

FALANTES Adultos Apl./Total

Crianças %

Apl./Total 0/4

Dim./aum. informal

4/20

=

20

Normal informal

3/15

=

20

=

60

Normal não informal.

290/481

% =

0

xxx 38/58

=

65

Conforme se observa na tabela acima, os adjetivos informais limitamse a 15 casos, apresentam comportamento percentual igual ao dos adjetivos de grau diminutivo/aumentativo e não ocorrem nos dados das crianças. Consideramos

então

oportuno

agrupar

os

adjetivos

de

grau

diminutivo/aumentativo e traço [+informal]. A tabela 6.2.5.6 apresenta os resultados para a análise assim feita.

276

TABELA 6.2.6.6 GRAU E FORMALIDADE DOS ADJETIVOS GRAU E FORMALIDADE

FALANTES Adultos Apl./Total

Dim./aum. informal Normal não informal.

7/35 290/481

% Prob.

Crianças Apl./Total

= 20 0,37

0/4

= 60 0,63

38/58

% Prob. =

0 xxx

= 65 xxx

Os resultados dos adjetivos para Grau/Formalidade nos adultos, ressalvadas as diferenças de análise, são comparáveis aos dos substantivos, pois seguem a mesma direção já observada. A comparação, no que se refere às crianças, não é diretamente possível, pois não há probabilidades. As percentagens seguem, todavia, a mesma direção. Os traços [+informal] e diminutivo/aumentativo desfavorecem a incidência de marcas formais de plural no SN.

6.2.6.6 - Conclusão Pelos resultados obtidos, concluímos que o número de marcas formais de plural no SN é também condicionado por traços estilísticos (formalidade), semânticos (animacidade) e mórficos (grau normal/diminutivo ou aumentativo) dos substantivos e adjetivos. É possível então prever que qualquer item lexical [+informal], [+diminutivo] e [-humano] terá muita chance de não ser marcado com relação à pluralidade. São, pois, comuns e muito naturais seqüências do tipo:

277

- travissero, fronha, essas coisinha pra buneca. (Sam39,fc,16a); (Cid32,mg,57a); - eles ali tem as barraquinha. - limpa aqueles negocinho que tem (...) aquela pele melosa (Ana40,fc,18a); - fizeram umas casinha bonitinha e tudo. (Jup06,fp,18a); - com aqueles cabelim branquim.(Sue05,fp,18a). A motivação inicial que nos levou à análise de traços dos substantivos não se confirmou, mas consideramos que o traço [+abstrato], por exemplo, deve ser retomado, com critérios bem precisos. Ressaltamos, todavia, que, ao se trabalhar com esta dimensão, será necessário que se analisem SNs sem nenhuma marca formal de plural, a fim de que se possa verificar também se há substantivos que, mesmo não se referindo a massas, são menos susceptíveis de ocorrerem em estruturas plurais. No item 6.3.4, teremos inclusive oportunidade de observar que algumas estruturas plurais, diferentes de pluralia tanta, não têm correspondentes singulares, insinuandose que o chamado morfema de plural nem sempre indica apenas mais de um e, às vezes, nem este significado lhe pode ser atribuído.

6.2.7 - Conclusão A análise atomística aqui feita evidencia que um conjunto significativo de variáveis contribuem para a não aleatoriedade da presença/ausência das marcas formais de concordância gramatical (ou simplesmente de marcas formais de plural) nos elementos flexionáveis do SN.

278

Constatamos que exercem influência sobre a concordância as seguintes variáveis: 1) Saliência fônica, com as suas dimensões Processos e Tonicidade; 2) Relação entre os elementos não nucleares em função do núcleo e posição dos elementos nucleares no SN; 3) Marcas precedentes em função da posição; 4) Contexto fonético/fonológico seguinte; 5) Função resumitiva do SN; 6) Formalidade dos substantivos e adjetivos; 7) Grau dos substantivos e adjetivos e 8) Animacidade dos substantivos. A variável Saliência fônica explica-se pelo Princípio da Saliência; as Marcas precedentes, em função da tendência de formas particulares ocorrerem juntas, ou seja, em função do Princípio do Processamento Paralelo e a variável Relação explica-se, principalmente, pelo Princípio da Iconicidade. A atuação do Contexto fonético/fonológico seguinte explica-se por processos de dissimilação, por

aspectos perceptuais evidentes e pelo

fenômeno da haplologia sintática. A influência da Função resumitiva tem a sua interpretação em princípios funcionalistas não kiparskianos, denominados Princípio da Topicidade ou Princípio da Baixa Tensão. O desempenho das variáveis Formalidade e Grau dos itens léxicos é explicado pelo fato de que, em situações informais, a ausência de concordância ocorre com naturalidade e, às vezes, com muita intensidade.

279

A variável Animacidade, de influência modesta, explica-se por ser o traço +humano discursivamente mais saliente. De uma forma geral, podemos concluir que a concordância ou as marcas de plural ocorrem mais: 1) quando há mais saliência fônica na oposição singular/plural; 2) quando os itens nucleares ocupam as primeiras e as terceiras posições do SN; 3) quando os itens não nucleares estão antepostos ao núcleo do SN; 4) quando os itens não são precedidos por qualquer elemento ou quando são precedidos por elementos marcados; 5) quando o contexto seguinte é consonantal, com os traços [+surdo], [+velar] ou [-nasal] ou quando é uma pausa. 6) quando o SN não é de função resumitiva e 7) quando os itens lexicais são não informais e são de grau normal e humanos. Inversamente, a concordância ou as marcas de plural ocorrem menos: 1) quando há menos saliência fônica na oposição singular/plural; 2) quando os itens nucleares ocupam a segunda posição do SN; 3) quando os itens não nucleares encontram-se pospostos ao núcleo do SN; 4) quando os itens da terceira posição são precedidos por elementos não marcados, formalmente;

280

5) quando o contexto fonológico seguinte é uma vogal ou uma consoante com os traços [+sonoro], [+labial], [+dental] ou [+nasal]; 6) quando o SN é de função resumitiva; 7) quando os itens lexicais são informais, diminutivos/aumentativos e não humanos.

Com base no exposto acima, é possível, portanto, prever em que circunstâncias lingüísticas as marcas de plural tendem ou não a ocorrer nos diversos constituintes dos sintagmas nominais no Português falado no Brasil. Vamos proceder agora à apresentação da análise não atomística que nos conduzirá à confirmação de uma série de aspectos localizados, vistos agora de uma perspectiva global.

REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

POR MARIA MARTA PEREIRA SCHERRE

VOLUME II

DEPARTAMENTO DE LINGÜÍSTICA E FILOLOGIA FACULDADE DE LETRAS UNIVERSIDADE FEDERAL DO RIO DE JANEIRO

RIO DE JANEIRO, 1º SEMESTRE DE 1988

6.3 - Análise não atomística

6.3.1 - Introdução

Com o objetivo de entender melhor a relação entre Classe gramatical e Posição, seja para corroborar a nossa explicação dada com base no Princípio da Iconicidade, seja para trazer à luz novas explicações de natureza não estritamente formal, decidimos analisar minuciosamente a Configuração sintagmática de 948 SNs constituídos de mais de dois elementos, que, por si, passou a ser considerada uma variável. Como já foi dito, utilizamos nesta parte de nosso trabalho apenas os dados dos falantes adultos. Além disso, assumimos o SN inteiro como unidade de análise e consideramos, como aplicação da regra, a presença de plural formal em todos os elementos flexionáveis que constituem o SN e, como não aplicação, a falta de pelo menos uma marca formal de plural, exceto nos casos do tipo do meus pais, os quais foram considerados como aplicação da regra, uma vez que a explicação para a ausência de marca no artigo não se dá pelas mesmas razões por que se dá a ausência no substantivo, por exemplo. Além disso, decidimos abandonar todos os casos que apresentam a seqüência: "marcada, não marcada, marcada" do tipo as coisa naturais, pois a explicação para a ausência da marca em tais casos se dá a níveis estritamente fonológicos (ver item 6.2.4). Além do que, estas últimas seqüências não são comuns. Trata-se de apenas sete casos, num total de 955 (0,007%). Deixamos de lado também SNs do tipo candidatos assim certo; coisas muito limitadas; um montão de bestera escrita, pela simples razão de estarmos interessados

282

na relação de ordem entre os elementos de um SN de três ou mais constituintes que se encontram num mesmo nível hierárquico em termos de estrutura frasal, o que não ocorre nos casos supracitados. Por outro lado, consideramos como dados de análise, nesta parte, seqüências do tipo os serviços todos ou todos os serviços. Embora haja neutralização entre o artigo e o substantivo subseqüente, sabemos que os artigos têm 97% de chances de serem marcados, o que nos autoriza a admitir aí a existência de marcas e a não eliminar de nossa análise dados deste tipo. Além

da

Configuração

sintagmática,

analisamos

também

a

Pluralidade do contexto, a Função textual do SN, a Localização do SN em relação ao verbo ou à oração, o Status informacional do SN, o Grau/Formalidade do SN, a Pluralidade do SN, a Animacidade do SN e a Saliência fônica na dimensão processos. Antes de passarmos à discussão da variável Configuração sintagmática, bem como à verificação de suas interrelações com outras variáveis, vamos apresentar os resultados relativos à Pluralidade do contexto que foi selecionada como a variável mais importante do ponto de vista estatístico, o que reflete a nossa posição de analista do fenômeno lingüístico em foco. A sua seleção se deu em primeiro plano com significância 0,0, em uma análise que teve nove variáveis selecionadas, dentre as quais duas de natureza não lingüística: Grau de escolarização e Sexo.

283

6.3.2 - A pluralidade do contexto

Apresentamos no item 6.2.3.7 os resultados relativos à influência da variável Marcas precedentes ao elemento nominal analisado, dentro do SN. Em linhas gerais, concluímos que, a partir da existência de uma marca, marcas levam a marcas e zeros levam a zeros(ver tabela 6.2.3.28), evidenciando-se, nos termos de Schiffrin (cf. 1981, p.55-6), uma tendência geral para formas gramaticais particulares ocorrerem juntas, o que, a nosso ver, deve-se explicar em termos de uma das formas da mente humana operar. Partindo-se então do princípio de que o desempenho lingüístico tende a apresentar uma harmonia formal entre os seus elementos constituintes, não apenas a nível da relação interna entre os elementos da estrutura sintagmática, mas também a nível da relação entre os diversos sintagmas, decidimos investigar se um contexto de maior pluralidade nominal provocava a existência de SNs totalmente marcados e, inversamente, se um contexto de menor pluralidade provocava a existência de SNs parcialmente marcados. Movidos por estas idéias, fizemos uma categorização de nossos dados bastante detalhada, a fim de controlarmos duas questões: 1) a da primeira ou não primeira ocorrência dos SNs de referência idêntica ou do mesmo campo léxico-semântico que apareciam em série (cf. BRAGA, 1986, p.428); 2) a da localização da informação plural, se precedente ou não ao SN analisado.

Controlamos o primeiro aspecto para verificarmos o grau de influência da primeira sobre a segunda ocorrência e vice-versa. Controlamos

284

o segundo aspecto, para uso futuro em comparações a serem feitas com resultados de outros pesquisadores, sobre a influência da informação precedente e/ou seguinte ao SN analisado. Como o pronome, na maioria da vezes, encontra-se após o SN analisado, os casos de ocorrência pronominal precedente, num total de sete, são apresentados juntos ao de ocorrência seguinte ao SN. Todavia, eles foram também controlados para uso posterior. Denominada Pluralidade do contexto, esta variável ficou subdividida em oito fatores. Conforme fizéramos no item 6.2.3.5 (ver quadro 6.2.3.12, p.177), o SN analisado encontra-se sublinhado e os elementos que caracterizam o contexto encontram-se em MAIÚSCULAS. 1) Primeira ocorrência do SN, cercada de pronome pessoal plural antes e/ou depois: - A Luanda levou um tiro (...) é a única coisa que eu me lembro (...) num dá pra num ficá...prestando atenção muito na novela, por causa do meus filho, que o...a hora que ELES tão acabando de jantá... Aí fico gritando com ELES... (Lei04,fp,25a); - A maior parte dos meus amigos falam gíria, sabe? Falam mais para gíria. ELES falam (...) Alguma coisa do tipo palavrão também. (Sam01,mp,18a); - E: E o relacionamento da senhora com os vizinhos? - F: Ah, é, ótimo também. Não tenho nada que dizé. Me dô com TODOS. ELES lá, eu cá, né? (...)Eu gosto muito do meus vizinho. (Jos35,fp,59a). 2) Primeira ocorrência do SN, seguida de SN contendo todas as marcas de plural e seguida de presença não obrigatória de pronome plural:

285

- E: Mas ela é filha desse marido. - F: Do meu primeiro marido (...) Aí me disquitei. Aí fiquei com ela na casa... Voltei pra casa do meus pais. Fiquei com ela, na casa dO MEUS PAIS trabalhando. (Joa10,fp,27a); - Quando nóis...somos jovens, nóis num damos tanto valor à... Ais nossas raízes. Mais conforme nós vamos envelhecendo... Num me considero velha, embora cum cinquenta e dois anos. Eu sô uma coroa, eu acho que a gente dá muito...Eu...eu pelo menos dô muito valor AIS MINHAS RAÍZES. Intão não vale a pena brigá, cum pai, cum irmão, cum tio... (Mgl48,fc,52a); - (...) Essa casa pra reformá, ela precisa de...de...um... De grana. Vamos botá aí, aí... uns treis mil cruzeiros... TREIS MILHÕES, né? Pra ela ficá legal. Aí, sim, eu lá atrás teria o que eu gosto, que é uma mesinha de sinuca; (...) uma piscina legal (...) Pra comprá eu precisaria de, no mínimo, UNS DOZE MIL CRUZEROS que...que é quanto essa casa miseravelmente tá valendo atualmente. (Jov26,mg,37a); - Meu pai tinha uma...uma preocupação social... Quando a gente foi pra lá, ais casas todas da fazenda eram de sapê, TODAS AS CASAS foram arrebentadas, ESSAS de sapê foram construídas novas. (Hel44,fc,44a). 3) Primeira ocorrência do SN, seguida de SN não totalmente marcado e sem a presença de pronome pessoal seguinte: - Eu acredito que, realmente, o PT seja um partido de expressão nacional, porque ele não traiz nada de novo (...) de tão diferente, né? Que não seja as próprias contradições da pessoa, né? (...) Ele vai colocar em baila...a vida que a gente leva, né, (...) (...) Que os otros partido trazem...uma proposta pronta (...) de como vai ser a participação de cada indivíduo, né? De como vai se dá...o movimento político, né? Da...da...das classes soci...das classes sociais ô...ô das transformações do...do sistema, já tá muito estabelecido NOS OTRO PARTIDO. E o PT num coloca isso. (Par41,mc,26a); - Bom, eu num sei cumé que é o problema nos otos condomínio, mais eu digo..., eu não diria NO OTOS CONDOMÍNIO - que nóis somo mais uma sociedade fechada, não diria fechada, mais uma sociedade mais unida, né? Pela questão de sê...vivê...naquele... Ah! Nós tamos vivendo no condomínio... (Mor45,mc,51a); - E: E quais são, assim, os a maiores problemas aqui do bairro de Santa Tereza? (...) - F: (...) Minha filha já foi com revólver apontada ais nove horas da noite num sábado. Menos de NOVE HORA, tava no meio da novela. (Mgl48,fc,52a).

286

4) Segunda ocorrência do SN, precedida e/ou seguida de SN totalmente marcado e de, opcionalmente, pronome plural: - Quando nóis...somos jovens, nóis num damos tanto valor à... AIS NOSSAS RAÍZES. Mais conforme nós vamos envelhecendo... Num me considero velha, embora cum cinquenta e dois anos. Eu sô uma coroa, eu acho que a gente dá muito...Eu...eu pelo menos dô muito valor ais minhas raízes. Intão não vale a pena brigá, cum pai, cum irmão, cum tio... (Mgl48,fc,52a); - Meu pai tinha uma...uma preocupação social... Quando a gente foi pra lá, AIS CASAS TODAS da fazenda eram de sapê, todas as casas foram arrebentadas, ESSAS de sapê foram construídas novas. (Hel44,fc,44a); - (...) Essa casa pra reformá, ela precisa de...de...um... De grana. Vamos botá aí, aí... UNS TREIS MIL CRUZEIROS... TREIS MILHÕES, né? Pra ela ficá legal. Aí, sim, eu lá atrás teria o que eu gosto, que é uma mesinha de sinuca; (...) uma piscina legal (...) Pra comprá eu precisaria de, no mínimo, uns doze mil cruzeros que...que é quanto essa casa miseravelmente tá valendo atualmente. (Jov26,mg,37a); - Eu nunca apanhei do meu pai (...) E eu nem me habituei a isso, MEUS FILHOS também, nunca bati no meus filhos. Eu acho horrível! Batê numa criança eu acho uma covardia. (Mag47,fc,53a); - Faço tricô desde DOUZE ANOS (...) Mas eu faço tricô desde os douze anos! (Mgl48,fc,52a).

5) Segunda ocorrência do SN seguida e/ou precedida de SN não totalmente marcado: - Ela vende, aí, um tal de (...) um livreto da Hermes, que ela nem impata dinheiro dela (...) Ela pega, vende pra vizinhança (...), vai na Hermes e compra tudo...cum dinheiro das pessoas e leva 25% de comissão (...) Que dizê, DEIZ MIL CRUZEIRO que ela vendeu (...), que gaste (...) cem pra í, cem pra voltá (...) gaste QUINHENTOS CRUZEIRO, sobra pra ela dois mil cruzeiro limpinho dela, pra ela, sem ela fazê força. Que ela vende DEIZ MIL CRUZEIRO. Ela quando vai lá, ela já tá com trinta, QUARENTA MIL CRUZEIRO de venda. (Jov26,mg,32a); - Eu acredito que, realmente, o PT seja um partido de expressão nacional, porque ele não traiz nada de novo (...) de tão diferente, né? Que não seja as próprias contradições da pessoa, né? (...) Ele vai colocar em baila...a vida que a gente leva, né? (...) (...) Que OS OTROS PARTIDO trazem...uma proposta pronta (...) de como vai ser a participação de cada

287

indivíduo, né? De como vai se dá...o movimento político, né? Da...da...das classes soci...das classes sociais ô...ô das transformações do...do sistema, já tá muito estabelecido nos otro partido. E o PT num coloca isso. (Par41,mc,26a); - Bom, eu num sei cumé que é o problema nOS OTOS CONDOMÍNIO, mais eu digo..., eu não diria no otos condomínio - que nóis somo mais uma sociedade fechada, não diria fechada, mais uma sociedade mais unida, né? Pela questão de sê...vivê...naquele... Ah! Nós tamos vivendo no condomínio... (Mor45,mc,51a). 6) Ocorrência de SN isolado, seguida e/ou precedida

de SNs

singulares generalizantes e/ou pronomes pessoais no singular: - E: Vem cá! E se você ganhasse na Loteria, hein? O que você faria, assim cum tanto...tanto dinheiro? - F: (...) Ia pegá um bom dinheiro, e dá, assim, prum grupo de criança (...) (...) Paguei a passagi e inda fiquei cum... O que? Cinquenta cruzeros. (...) Tão, peguei, entrô aqueles minininho, né? Mais do que pobrezinho, piquinininho (...) "Moça compra uma bala aí. Deis cruzero". ELE tava com uns cinco tabletim na...na... (...) Comprei a bala dO GAROTO. "vai embora". Aí O GAROTO pegô, desceu... (San39,fc,16a): - (...) Os órgãos governamentais dizem que tá dentro do mínimo, né? E o que é que cê vai dizê?... Até O PRÓPRIO PASSAGERO tem interesse em posá, sabe disso? (...) ELE tá no centro da cidade (...) Se todos os passagero tivesse conhecimento disso (...) (...) Então você pergunta: (...) Se fizesse essa pergunta PO PASSAGERO, mas ELE preferiria posá, no Santos Dumont, por facilidade que ELE tem, tá praticamente em casa (Mor45,mc,51a); - F: Nunca dei um tapa! Eu só olho... - E: Nunca bateu? - F: Nunca bati no meus filhos. Ela bate, não sei o quê? Eu nunca dei um tapa. Só dei um tranco uma vez (...) Dei-LHE um, sabe? Um...tranco assim, ELE... Aí, eu só olho pra ELE, já é motivo pra ELE ir pro canto chorá. - E: E a menina? - F: A menina? A menina é uma coisa maravilhosa. Atrevidinha, folgadinha... com aquele tamaninho que você vê aí... (Jov26,mg,32a).

288

7) Ocorrência de SN totalmente isolado: - E: E como foi a reação aqui na casa da senhora, com relação à exclusão do Brasil, né? Da copa? (...) Pra oitenta e seis, o Brasil ganhará? - F: A Itália, eu acho que é um time melhor do que o nosso. (...) Mas eu num intendo. Escuto, vejo o que eles falam e vô tirando os pedacinho das minhas conclusões. (Ari30,fg,43a); - A senhora quiria... Um quilo de camarão (...). Mais essa senhora chorô tanto esse camarão: umas deiz vezes! E eu tava...saturado! (Jan03,mp,57a); - Não sei se as condições financera que ele tinha na época mas eu juro, pelo tapa que eu tomei, eu queria botá ele pra fora da polícia. (Ubi21,mg,20a). 8) Primeira ou segunda ocorrência de SN, seguida e/ou precedida de SNs ou de pronomes marcados e não marcados, e de SNs generalizantes, ou seja, contexto misto: - E: Você não acha que isso é uma conseqüência de um não preparo político? - F: (...) Que a maioria que se interessa por política, veja bem, é que menos...teria interesse em...fazê mudá certas coisas siria a classe média. (...) Que OS ISTUDANTES... Os istudantes universitários têm uma participação política ativa. Qué dizê, pelo menos, vamos supô, 80% DOS ISTUDANTES... Se... ELES... Eles se engajam, né? E... Por uma... Bom, que O ESTUDANTE, primeiro, porque qué renová, né? Primeiro, porque ELE tem uma otra idéia, primeiro que... ELE vem com coisas nova, né? Que nóis os...os...os velhos já...já temo que dá lugar realmente. Mais, segundo, também, porque ELES estudaram, então ELES, sabe? ELES é... (Mor45,mc,51a); - A gente saía de manhã, chegava às quatro hora da tarde...ÀS...ÀS DUAS HORAS, mudava de ropa, (...) QUATRO HORA ia no Infantil Clube (...). Carnaval é assim aqui. (Fat23,fg,15a); - Olha, o dia que eu vô à junta médica - são 60 MÉDICO (...) ELES passam um aparelho (...) ELES vão mostrando tudo - Olha eu fico ali bem dizê umas três hora com aqueles médico todinho. Aí vem um aperta aqui, outro aperta ali, pra vê, né? (Nil12,fp,45a). Os oito fatores da variável Pluralidade do contexto descritos e exemplificados acima, em função da primeira ou não primeira ocorrência

289

ou ocorrência isolada e em função do tipo de contexto ao seu redor, se total ou parcialmente plural ou se misto, têm os seus resultados apresentados na tabela 6.3.2.1, a seguir.

TABELA 6.3.2.1 A PLURALIDADE DO CONTEXTO FATORES 1a.ocorrência do SN com pronome pessoal PLURAL antes e/ou depois

Apl./Total

% Prob.

26/39

= 67 0,70

1a.ocorrência do SN com repetição do SN TOTALMENTE marcado (e pronome plural) depois

68/82

= 83 0,76

2a.ocorrência do SN precedida e/ ou seguida de SN TOTALMENTE marcado (e de pronome PLURAL)

76/99

= 77 0,71

14/50

= 28 0,33

9/62

= 15 0,20

14/37

= 38 0,40

249/518

= 48 0,47

28/61

= 46 0,44

1a.ocorrência do SN seguida de SN NÃO totalmente marcado 2a.ocorrência do SN seguida e/ou precedida de SN NÃO totalmente marcado SN isolado seguido e/ou precedido de SNs singulares generalizante/ou pronomes pessoais no singular (contexto generalizante) SN totalmente isolado 1a. ou 2a.ocorrência de SN seguida e ou precedida de SN ou de pronomes marcados ou não marca dos (contexto misto)

Através dos resultados da tabela 6.3.2.1, podemos verificar a existência de três grandes linhas de atuação da variável Pluralidade do

290

contexto sobre a existência de SNs parcial ou totalmente marcados, independentemente de ser ou não a primeira ocorrência do SN: 1) A presença da SNs totalmente marcados e/ou a presença de pronomes pessoais plurais nas vizinhanças do SN analisado favorece(m) a incidência de todas as marcas nos SNs plurais(0,70/0,76/0,71). 2) A presença de SNs não totalmente marcados nas vizinhanças do SN analisado desfavorece a incidência de todos as marcas nos SNs plurais(0,33/0,20). 3) A presença de contexto generalizante, a ausência de pronomes plurais ou de qualquer sintagma totalmente marcado ou não totalmente marcado (SN isolado) e a presença do contexto misto apresentam influência intermediária sobre a incidência de marcas nos SNs plurais(0,40/0,47/0,44). A influência da Pluralidade do contexto, da forma por nós analisada, constitui um fato completamente novo. Ela reflete, a nível do discurso, "a tendência geral de formas particulares ocorrerem juntas", o que se configura como uma tendência bastante geral que se pode estabelecer sobre fenômenos lingüísticos de diversas línguas e sobre fenômenos lingüísticos diversos de uma mesma língua, a se apresentar em detalhes no capítulo 7. Diante destes resultados, é interessante agora compará-los a outros resultados encontrados por Guy (1981a), também para a concordância de número no SN. Ao lado do estudo do efeito das variáveis Tonicidade, Contexto

291

fonológico seguinte, Posição, Marcas precedentes (Informação plural precedente no SN), Processos morfofonológicos de formação do plural (Categoria morfológica), Guy

verifica também a influência do que ele

denomina de restrições funcionais, a respeito das quais apresenta duas etapas: (1) Correlação entre marca de plural no SN sujeito e marca de plural no verbo e (2) Efeito do lugar da informação adicional de plural (cf. 1981, p.191). Para justificar a inclusão do estudo deste tipo de restrição, Guy afirma o seguinte: A razão para incluir tal grupo de fatores é para investigar a questão do funcionalismo: será que o falante é restringido de alguma forma para evitar cancelamento ou omissão de elementos que trazem uma alta carga funcional? Poplack 1979 investiga esta questão em detalhes, e conclui que fatores funcionais restringem de forma significante o cancelamento do -S plural: quando há uma informação adicional de plural presente no discurso, uma dada marca de plural é mais provável de ser omitida do que quando não há tal informação adicional. Poplack investigou dois tipos de informação no plural: morfológica e não morfológica. Nenhuma diferença significante entre as duas foi relatada, e a posição da informação adicional não era também aparentemente importante. (GUY, 1981a, p.190)98 Guy explicita em seu texto que a presença de um numeral e a presença de um SN mais alto indicando a pluralidade no SN foram consideradas na variável Marcas precedentes e então a sua discussão seria confinada à informação de plural desambiguante fora do SN. Coloca ainda que tentou distinguir todos os tipos de informação, observando, (...) por exemplo, a presença e a posição do verbo com marca de plural do qual o SN sob consideração era o sujeito, a ocorrência de SN como o complemento de uma sentença copular com o sujeito e/ou verbo plurais,

292

e a ocorrência de informação semântica ou lexical que poderia indicar a pluralidade da palavra sob consideração. (GUY, 1981, p.190-1).99 Observa

finalmente

que

muitas

categorias

eram

raras

e

insignificantes e que ele iria apresentar somente resultados das categorias com maior quantidade de dados. Apresenta, portanto, os resultados parciais, em uma tabela sob o rótulo de "Correlação entre marcas de plural no SN sujeito e marcas de plural no verbo", com dois fatores: verbo seguinte com marca de plural, com probabilidade 0,62, e verbo seguinte sem marca de plural, com probabilidade de 0,55 (cf. p.191). Com base nestes resultados afirma que esta tendência vai contra a hipótese funcionalista, porque ela favorece marcas de plural precisamente naqueles contextos onde há outra informação de plural disponível. (...) Isto é análogo à tendência em direção à concordância a nível do SN que Poplack relata para o EPR /Espanhol de Porto Rico/. Isto poderia resultar de um tipo de efeito estilístico: quando um falante procura marcar mais o plural, ele o fará no SN e no SV simultaneamente. (GUY, 1981a, p.191-2)100

Continuando, Guy afirma que a sua análise final sobre a informação adicional de plural teve como objetivo buscar um efeito local, conforme relatado por Poplack para a concordância verbo-sujeito no Espanhol de Porto Rico (cf. GUY, 1981a, p.192). A seguir apresenta seus resultados em outra tabela sob o rótulo de "Efeito do lugar da informação adicional de plural na CSN" (concordância no sintagma nominal), através de três fatores, com as respectivas probabilidades: (1) informação adicional de plural precedendo o SN: 0,24; (2) nenhuma informação adicional de plural: 0,63

e

(3)

informação adicional de plural seguindo o SN: 0,65 (cf. p.192). Considerando estes novos resultados, afirma então o seguinte:

293

A diferença entre os dois últimos fatores (nenhuma informação de plural e informação de plural seguinte) não é significante. A diferença entre os dois últimos fatores e o primeiro fator é estatisticamente significativa, mas ela tem o grande defeito de conter somente 1 1/2% dos dados, opondo isto a todo o resto. Entretanto, os resultados estão em concordância com a tendência notada previamente neste dialeto de marcar a pluralidade na primeira oportunidade, e então omiti-la em situações subseqüentes 'redundantes'. Isto segue no mínimo uma linha funcionalista: há uma taxa baixa de marcas de plural num contexto onde a marca teria uma carga funcional mais baixa. /Grifos nossos/ (GUY, 981a, p.192-3)101 Já tivemos oportunidade de mostrar no item 6.2.3 deste nosso trabalho (ver p.142-241), quando discutimos a relação entre as variáveis Posição linear, Classe gramatical e Marcas precedentes, que a situação não é bem como a colocada por Guy (1981a) e por todos os pesquisadores que o antecederam, especialmente por Braga (1977) e Scherre (1978). Vimos neste item que, nos SNs de três ou mais elementos, uma segunda marca conduz a mais marcas no segmento seguinte do que um zero após a primeira marca. A existência de uma marca na primeira oportunidade não é, pois, condição suficiente para que as demais marcas redundantes desapareçam, embora, na maioria dos casos, seja condição necessária. Diante então dos resultados que obtivemos (1) para a variável Marcas precedentes, a nível de SN, (2) para a variável Pluralidade do contexto, a nível da relação entre os SNs no discurso, e diante dos resultados relatados por Guy (1981a), apresentados acima, decidimos fazer uma etapa de análise, com uma parte dos nossos 948 SNs de três ou mais elementos, cujos resultados podem ser comparáveis, mesmo que indiretamente, aos resultados apresentados por Guy (1981a).102 Tal tarefa não se colocava

294

impossível, uma vez que, na codificação da variável Pluralidade do contexto, estabelecêramos um total de 21 fatores que, transformados em 16, se resumiram finalmente a oito, conforme apresentamos nas páginas anteriores. A codificação assim detalhada nos permitia controlar o "Local da informação adicional de plural", se antes e/ou depois, através de referências pronominais ou de repetição de SNs. Eliminados os casos impossíveis de serem comparados aos de Guy (1981a), obtivemos uma etapa de análise com 850 SNs, na qual se inclui a variável "Local da informação adicional de plural", constituída pelos seguintes fatores: 1) informação adicional de plural antes do SN analisado; 2) informação adicional de plural somente depois do SN analisado; 3) nenhuma informação adicional de plural ao SN analisado ou SN isolado. Fizemos esta etapa de análise em duas subetapas, ou seja, na primeira, analisamos a variável Local da informação adicional de plural junto à variável Pluralidade do contexto e, na segunda, eliminamos a variável Pluralidade do contexto, analisando assim somente o efeito da variável Local da informação adicional de plural. Os resultados probabilísticos, para ambas as subetapas, são apresentados na tabela 6.3.2.2, a seguir. Nesta mesma tabela, transcrevemos também os resultados de Guy (1981a).

295

TABELA 6.3.2.2 SOBRE O EFEITO DO LOCAL DA INFORMAÇÃO ADICIONAL DE PLURAL FATORES

Com pluralidade

Sem pluralidade

Guy (1981a)

Informação precedente

(0,48)

0,44

0,24

Informação seguinte

(0,59)

0,56

0,65

Nenhuma informação

(0,43)

0,50

0,63

Na subetapa de análise com o efeito da Pluralidade do contexto, a variável

Informação

adicional

de

plural

não

é

selecionada

como

estatisticamente relevante, embora as probabilidades apresentem uma leve oposição entre a Informação precedente favorecendo a ausência de marcas (0,48) e a Informação seguinte favorecendo a presença de marcas (0,59), na direção prevista por Guy (1981a). A subetapa sem o efeito da Pluralidade apresenta resultados semelhantes aos anteriores. Neste caso, a variável Informação adicional é, todavia, selecionada em último lugar num total de oito selecionadas, enquanto na primeira etapa, em que se considerou também o efeito da Pluralidade do contexto, a Pluralidade continua a ser a primeira variável selecionada, apresentando praticamente os mesmos resultados probabilísticos, que podem ser vistos na tabela 6.3.2.3 a seguir, na qual se repetem os resultados da análise original, para efeitos comparativos.

296

TABELA 6.3.2.3 A PLURALIDADE DO CONTEXTO FATORES

Apl./Total 1a.ocorrência do SN com pronome pessoal PLURAL antes e/ou depois

Todos os dados

Comparação com Guy (1981a)

%

Prob.

Prob.

26/39

=

67

0,70

0,67

68/82

=

83

0,76

0,73

76/99

=

77

0,71

0,67

1a.ocorrência do SN seguida de SN NÃO totalmente marcado

14/50

=

28

0,33

0,33

2a.ocorrência do SN seguida e/ou precedida de SN NÃO totalmente marcado

9/62

=

15

0,20

0,20

14/37

=

38

0,40

xxx

249/518

=

48

0,47

0,44

28/61

=

46

0,44

xxx

1a.ocorrência do SN com repetição do SN TOTALMENTE marcado (e do pronome PLURAL) depois 2a.ocorrência do SN precedida e/ou seguida de SN TOTALMENTE marcado de pronome PLURAL)

SN isolado seguido e/ou precedido de SNs singulares generalizantes e/ou pronomes pessoais no singular (c.generalizante) SN totalmente isolado 1a. ou 2a.ocorrência de SN seguida e ou precedida de SN ou de pronomes marcados ou não marcados (contexto misto)

As probabilidades acima mostram a coerência e sistematicidade

297

do efeito da variável Pluralidade do contexto mesmo diante da inserção de outra variável candidata a estar com ela em competição. Antes

de

concluirmos,

duas

observações

merecem

ser

feitas. A primeira delas é a seguinte: se Poplack (1979), em "Function and process in a variable phonology", conclui que fatores funcionais restringem de forma significativa o cancelamento do -S plural, conforme afirma Guy (cf. 1981a, p.190), ela já não faz o mesmo, em "The notion of plural in Puerto Rican Spanish: competing constraints on /S/ deletion"; em "Deletion and Disambiguation in Puerto Rican Spanish" e em "Mortal phonemes as plural morphemes", conforme já tivemos oportunidade de verificar. Objetivando precisar suas idéias, vejamos passagens (algumas já parcialmente vistas) destes três textos. No primeiro deles, Poplack afirma que (...)fatores funcionais têm um efeito pequeno mas regular sobre o cancelamento, na direção que confirma uma hipótese funcionalista. Presença de informação adicional de plural, seja morfológica ou não morfológica, favorece o cancelamento de alguma forma, ao passo que a ausência de informação adicional favorece a retenção. Entretanto fatores funcionais como um todo afetam o cancelamento menos que qualquer outro grupo de fatores estudado, exceto acento seguinte. (...) o propósito do grupo funcional é averiguar o efeito de fatores funcionais na eliminação da redundância. Embora os fatores funcionais tenham um efeito relativamente menor que os outros, a ordenação dos fatores nos grupos funcionais é clara. (...) Esta é uma tendência, mas um tanto fraca. /Grifos nossos/ (POPLACK, 1980a, p.62).103

No segundo texto, Poplack também afirma que

298

considerações funcionais desempenham um papel regular, embora não muito forte, na retenção de uma marca de plural. (...) Fatores funcionais não mostram efeito maior no cancelamento do (S) do SN do que outras categorias de fatores estudadas. (POPLACK, 1980b, p. 379 e 383)104 E, no terceiro texto, Poplack continua afirmando que embora fatores funcionais sejam significativos para o cancelamento do (S) plural em contraste com aspiração, eles não afetam a retenção da marca mais do que fatores fonológicos e gramaticais. (...) Deveria ser relembrado que a hipótese funcionalista conforme colocada (...) é realmente que padrões de marcas superficiais que podem conter informação tenderão a ser conservados na gramática. O efeito funcional mais fraco encontrado aqui contra cancelamento do (S) não é deste tipo. Ele ocorre somente nas sentenças onde o (S) realmente carrega toda a informação plural que deve ser conservada. Assim considerações funcionais não têm resultado no condicionamento estritamente gramatical (i.e. morfossintático ou lexical) determinando a retenção do (S). Aqui nós temos um caso em que efeitos estruturais e efeitos informacionais desempenham papéis competitivos, e onde restrições de natureza puramente fonológica são igualmente importantes. /Grifos nossos/ (POPLACK, 1981, p.61-2)105 Os nossos resultados, quer a nível do SN internamente, quer a nível da relação entre os SNs, apontam para a seguinte conclusão: na competição entre os dois tipos de variáveis mencionadas por Poplack, emerge uma possível vencedora: a de natureza não informacional, usando os termos de Poplack. Os efeitos das Marcas precedentes e os efeitos da Pluralidade do contexto sobre o fenômeno em questão têm se mostrado consistentemente mais fortes do que os efeitos das demais variáveis. Convém lembrar ainda que,

como

já

vimos,

a

fronteira

de

morfema

não

299

exerce influência sobre a presença ou ausência de marcas plurais no SN em Português. Mesmo Guy e Poplack, que buscavam explicitamente comprovar as idéias funcionalistas no sentido kiparskiano do termo, encontraram também resultados não funcionalistas, o que mostra que efeitos "não informacionais" sobre o fenômeno em estudo são tão fortes que eles são encontrados mesmo quando não explicitamente perseguidos. Guy (1981a), ao estudar também a Concordância Verbal, encontra igualmente efeitos não informacionais (cf. p.249-54). Mesmo assim, não totalmente convencido, chega a sugerir que "(...) a regra de cancelamento do -S é realmente inibida pela presença de uma fronteira de morfema antes do S final." (p.164-5)106 Neste caso, ele afirma que esta restrição, colocada em termos estruturais, "(...) poderia também ser considerada como uma restrição funcional favorecendo a retenção da informação gramatical." (p.165)107 Guy coloca, todavia, que este efeito não ocorre no caso de desnasalização, porque tal restrição só funciona quando a estrutura de morfema e a função coincidem. A marca de plural nos verbos é um traço suprassegmental (nasalização de uma vogal),

conseqüentemente não pode ser definida

estruturalmente por colocações do tipo "presença de uma fronteira de morfema precedente". Ele considera então que restrições "funcionais" talvez apareçam somente nas circunstâncias em que elas podem ser expressas em termos estruturais (cf. p.165). Estas considerações de Guy, a nosso ver, são fruto da hipótese que perseguia, a qual, conforme pudemos ver através dos diversos resultados que apresentamos até o presente momento, não é a mais forte para dar conta das marcas de plural no SN.

300

A segunda observação que queremos fazer constitui mais uma prova indireta do não funcionamento de uma hipótese do tipo funcionalista nos moldes aludidos acima. Numa pequena amostra de SNs de dois elementos, observamos o tipo de "indefinido" precedente ao substantivo, conforme se pode ver na tabela 6.3.2.4.

TABELA 6.3.2.4 SOBRE A INFLUÊNCIA DO TIPO DE INDEFINIDO NA QUANTIDADE DE MARCAS PLURAIS NO SUBSTANTIVO EM SNS DE DOIS ELEMENTOS TIPO DE INDEFINIDO

Apl./Total

%

outro/outra

22/29

= 76

muito/muita

46/87

= 76

vário/vária

13/20

= 65

algum/alguma

11/18

= 61

tanto/tanta

8/13

= 61

quanto/quanta

6/11

= 55

A pequena amostra apresentada acima indica que a informação semântica do item léxico não tem influência sobre o número de marcas no substantivo seguinte: os dois primeiros casos ilustram isso muito bem. Se a configuração sintagmática dos SNs de dois elementos tem algum efeito sobre o número de marcas plurais aí encontradas, certamente não o será devido à hipótese funcionalista do tipo kiparskiana.108 Concluindo, vimos que a variável Pluralidade do contexto exerce,

301

a nível da relação entre os diversos SNs, o mesmo tipo de influência que a variável Marcas precedentes

exerce a nível de SN internamente.

Semelhantemente, a influência destas duas variáveis tem a mesma importância estatística. Conseqüentemente, explicam-se pela mesma razão: tendência geral de formas gramaticais particulares ocorrerem juntas. Consideramos que uma questão maior de processamento envolve a influência das variáveis em questão. A sua forma de atuar cria uma harmonia discursiva formal, tornando o discurso mais coeso. Isto é análogo ao que Naro & Votre (1986) colocam a propósito do estudo da ordem SV/VS em "Emergência da sintaxe como um efeito discursivo", a nível de conteúdo. Segundo eles, a manutenção de um mesmo ponto de referência em um texto mais ou menos longo é, de fato, essencial para o funcionamento do discurso natural, uma vez que mudança rápida de ponto de referência tenderia a produzir um discurso com baixo grau de textualidade. (NARO & VOTRE, 1986, p.457)

Diríamos que o mesmo ocorre na repetição de SNs totalmente marcados ou de SNs parcialmente marcados, ou na preferência por seqüências sss ou s00. A alternância excessivamente rápida chegaria a produzir, a nosso ver, estranheza na comunicação. Certamente, esta é uma das múltiplas variáveis que influenciam a quantidade de marcas plurais nos SNs. Há uma série de outras que também estão em jogo e que atuam no sentido de provocar alternâncias mais ou menos rápidas das formas. Estamos simplesmente afirmando que a tendência aqui apresentada é uma das mais fortes. A segunda mais forte é a Relação entre os elementos nucleares e não nucleares do SN que será retomada a seguir com a Configuração sintagmática do SN.

302

6.3.3 - Buscando novas explicações

6.3.3.1 - Sobre a configuração sintagmática do SN No item 6.2.3.7, concluímos que a quantidade de marcas plurais nos elementos nominais não nucleares é função da sua relação com o núcleo do SN: se antepostos, o número de marcas aumenta e, se pospostos, o número diminui. Concluímos também que os núcleos nominais têm os seus índices de marcas em função da posição que ocupam dentro do SN: são mais marcados na primeira do que nas demais posições e, se substantivos ou substantivados, chegam a elevar ligeiramente o seu número de marcas na terceira posição (ver p.198-241). A hipótese que levantamos para explicar as conclusões acima foi a da Coesão sintagmática, que tem no seu bojo o Princípio da Iconicidade nos moldes de Haiman (1983). Conforme colocamos na introdução deste item, decidimos analisar minuciosamente a Configuração sintagmática dos 948 SNs de mais de dois constituintes dos dados dos falantes adultos, com o objetivo de verificar se outras explicações de natureza também não estritamente formal poderiam existir, para as conclusões já obtidas. Já no item 6.2.3.7, entrevíramos que a Configuração sintagmática como um todo poderia estar influenciando o índice de marcas plurais no SN. A análise inicial dos dados nos revelou de imediato contrastes interessantes que podem ser observados em algumas construções nas tabelas 6.3.3.1 e 6.3.3.2, a seguir.

303

TABELA 6.3.3.1 SOBRE A CONFIGURAÇÃO SINTAGMÁTICA DO SN CONFIGURAÇÃO

82

7/18 =

39

95/136 =

70

1b) art.def. (as

+

subst. coisa

+

QUANT. toda)

2a) art.def. (os

+

poss. meus

+

SUBST. filhos)

2b) poss.

+

+

{QUANT.} {ADJ.} todinha)

3/11 =

27

POSS. meu)

2/8

=

25

46/92 =

50

5/23 =

22

prova

SUBST. coisas)

62/78 =

+

subst.

+

%

1a) quant. (todas

(minhas

art.def. as

Apl./Total

2c) -art.def. (três

+

subst. colega

+

3a) art.def. (as

+

card. duas

+

3b) card. (quatro

+

subst. quarto

4a) det. (umas

+

adj. boas

+ SUBST. palmadas)

19/33 =

56

4b) det. (as

+

subst. perna

+

86/216 =

40

5a) dem. (esses

+

adj. trinta

+

7/14 =

50

5b) dem. (essas

+

subst. estradas

+

16/44 =

36

SUBST. pista)

+ ADJ. reservado)

ADJ. bonita) SUBST. dia) ADJ. nova)

304

A tabela 6.3.3.1, na página anterior, contém quatro agrupamentos de configurações sintagmáticas contrastantes entre si. A classe gramatical diferenciadora de cada conjunto, posta em evidência, é que ocupa a última posição do SN: ela é ou um substantivo ou um não substantivo e, neste caso, pode ser um adjetivo, um quantificador ou um possessivo. Consistentemente com a conclusão já conhecida, sempre que o SN tiver um substantivo como o seu último constituinte, ele tende a se apresentar mais marcado do que o seu correspondente, que tem como último constituinte um não substantivo. Então, a título de exemplo, podemos observar os casos 1 e 3. Nos casos do tipo 1a, a estrutura [quant. + art.def. + SUBST.] (todas as coisas) tem 82% dos SNs com todas as marcas, enquanto, nos casos do tipo 1b, a estrutura [art.def. + subst. + QUANT.] (as coisa toda) tem apenas 39% dos SNs com todas as marcas. Podemos observar o mesmo contraste em 3a e 3b. Os casos de 3a, cujo último elemento um é SUBST. (as duas pista), têm 50% com todas as marcas, enquanto os seus correlatos em 3b, cujo último elemento é um ADJ. (quatro quarto reservado), têm apenas 13% totalmente marcados. A diferença percentual mínima entre os elementos dos conjuntos apresentados é de 13% e encontra-se no agrupamento 5a/5b. Os agrupamentos apresentados na tabela 6.3.3.2, a seguir, neste caso aos pares, mostram ainda que a maior incidência de SNs com todas as marcas é também função do tipo categorial do primeiro elemento do SN.

305

TABELA 6.3.3.2 SOBRE A CONFIGURAÇÃO SINTAGMÁTICA DO SN CONFIGURAÇÃO

Apl./Total

%

1a) ART.DEF. (os

+

poss. meus

+

subst. netos)

95/136

=

70

1b) POSS. (meus

+

card. dez

+

subst. dias)

6/13

=

46

45/92

=

49

41/124

=

33

7/18

=

39

15/86

=

17

2a) ART.DEF. + subst. + adj. (as pessoas ricas) 2b) -ART.DEF. + subst. + adj. (umas pessoas ricas) (aqueles rolos inorme) (tantas coisas boa) (meus filhos casado) (duas cenoura descascada) 3a) ART.DEF. + subst. (os pano 3b) POSS. + subst. DEM. (meus filho (esses bairro

+ +

quant. todo) quant. todo) todo)

4a) ART.DEF. (os

+

card. três

+ subst. meses)

46/92

=

50

4b) UNS (uns

+

card. quatro

+

65/122

=

53

subst. anos)

Os três primeiros agrupamentos feitos evidenciam sistematicamente que, se o SN tem um artigo definido como seu primeiro constituinte, o percentual de marcas se eleva e, se tem uma categoria diferente do artigo definido, este percentual se abaixa. Apenas o último par, com subs-

306

tantivo na última posição, apresenta-se quase que indistintamente marcado, chegando a elevar ligeiramente o índice de SNs marcados com a categoria uns na primeira posição do SN. A nosso ver, isto mostra que o efeito da classe gramatical da última posição do SN é mais forte do que o da classe gramatical da primeira posição do SN. Se compararmos as diferenças entre os agrupamentos da tabela 6.3.3.1 com os da 6.3.3.2, podemos ver que as diferenças relativas aos primeiros são mais fortes do que as relativas aos segundos. É interessante observar ainda que o tipo de SN mais marcado é o que apresenta a configuração [quant. + art.def. + subst.] (todas as coisas) que contém dois elementos de referência globalizante juntos, altamente definidores. Como já vimos na tabela 6.3.3.1, 82% dos SNs deste tipo têm todas as marcas. É oportuno observar também que todos os falantes de qualquer nível de escolarização apresentam estas estruturas com um índice alto de marcas: os do colegial com 83%, os do ginasial com 81% e os do primário com 76%. Em verdade, as diferenças no comportamento lingüístico dos falantes com respeito ao fenômeno estudado são mais quantitativas do que

qualitativas,

principalmente

com

respeito

à

influência

do

tipo

sintagmático do SN. A configuração [dem. + subst. + quant.] (essas coisa toda, aquelas vantagens todas), que é uma dentre as configurações menos marcadas, apresenta-se com os seguintes percentuais de marcas em todos os elementos: colegial, 35%, ginasial, 13% e primário, 4%, ou seja, apresenta-se com todos os percentuais baixos, comparativamente aos percentuais da configuração [quant. + art.def. + subst.].

307

As diferenças internas são função do grau de escolarização do falante e não do tipo sintagmático em jogo. As distribuições apresentadas nas tabelas 6.3.3.1 e 6.3.3.2 nos levaram a considerar que, no mínimo, o índice de SNs com todas as marcas é função também da classe gramatical do primeiro constituinte do SN, além de ser função da classe gramatical Estabelecemos,

portanto,

uma

de seu último constituinte.

variável

denominada

Configuração

sintagmática do SN, categorizada em seis grandes fatores. Cinco deles levam em conta o tipo categorial do primeiro e do último constituinte do SN. Apenas o último fator, de natureza diferente, tenta captar a relação composta que

se

pode

estabelecer

entre

substantivo+adjetivo

ou

entre

substantivo+substantivo, independentemente do tipo categorial do primeiro elemento do SN. A decisão de colocar estes SNs em fator separado ocorreu em função de a própria tradição gramatical brasileira registrar a inexistência de marcas no substantivo dos compostos substantivo+substantivo nas situações em que o "segundo (...) limita a significação geral do primeiro" (ROCHA LIMA, 1983, p.78), em casos como bananas-maçã; canetas-tinteiro. Observamos finalmente que os SNs que têm como último elemento uma categoria substantivada ficaram separados dos que terminam em substantivo, objetivando-se assim verificar novamente as semelhanças de comportamento entre a categoria substantivada e os substantivos. Eles perfazem um total de apenas 14 dados e são todos eles iniciados por um artigo definido. Após tais considerações, apresentamos a seguir a descrição su-

308

cinta dos seis fatores que constituem a variável Configuração sintagmática do SN: 1) SN cuja estrutura tem no seu início um quantificador ou um artigo definido e, no seu final, um substantivo (todos os dias/os meus filhos); 2) SN cuja estrutura tem no seu início qualquer classe gramatical que não seja um quantificador ou um artigo definido e, no seu final, um adjetivo, um quantificador ou um possessivo (umas patada firme); 3) SN cuja estrutura tem no seu início um não artigo definido e, no seu final, um substantivo (uns bons filhos); 4) SN cuja estrutura tem no seu início um artigo definido e, no seu final, um adjetivo, um quantificador ou um possessivo (as coisa toda); 5) SN que tem na primeira posição um artigo definido seguido de categorias substantivadas (os melhores possíveis); 6) SN de estrutura composta (três salário mínimo). Na tabela 6.3.3.3, na próxima página, apresentamos as percentagens relativas à aplicação da regra em função da variável Configuração. Os resultados percentuais da tabela 6.3.3.3 nos mostram o seguinte: 1) A presença de artigo definido, com ou sem quantificador, nas primeiras posições do SN e a presença do substantivo ou categoria substantivada, na sua última posição, são duas forças poderosas no sentido de provocarem a presença de todas as marcas de plural em todos os elementos flexionáveis do SN, ou seja, favorecem nitidamente a existên-

309

cia de SNs totalmente marcados: o fator [+artigo definido ... +substantivo] apresenta 66% dos SNs com todas as marcas de plural e [+artigo definido ... categoria substantivada], 86%. TABELA 6.3.3.3 SOBRE CONFIGURAÇÃO SINTAGMÁTICA DO SN CONFIGURAÇÃO

Apl./Total

%

+ART.DEF. ... +SUBST. +QUANT. (todos os dias) (os meus filhos) (as boas ações)

261/398

= 66

-ART.DEF. ... -SUBST. (vários jogadores bons) (essas carne congelada) (aquelas rendas todas) (esses homi todo) (algumas colega minha) (três colega meu)

57/211

= 27

-ART.DEF. ... +SUBST. (umas segundas lojas) (tantas outras famílias) (esses trinta dia) (essas grande fábrica)

90/166

= 54

+ART.DEF. ... -SUBST. +QUANT. (as pessoas ricas) (os lábios vermelho) (as danças todas) (as coisa toda) (os camarada meu) (todas amiga minha)

61/128

= 48

+ART.DEF. ... CAT.SUBST. (os melhores possíveis) (os maiores prejudicado)

12/14

= 86

ESTRUTURA COMPOSTA (duas fragata-brasileira) (esses médicos-psiquiatra) (sete salário-mínimo) (três banana-prata)

3/31

= 10

2) A presença de qualquer outra classe gramatical que não seja artigo definido na primeira posição do SN e a presença do adjetivo, do possessivo

310

ou do quantificador, na sua última posição, são igualmente duas forças poderosas no sentido de desfavorecerem a presença de SNs com todas as marcas: [-artigo definido ... -substantivo] tem percentual associado de 27%. 3) O cruzamento das classes mencionadas em 1 e 2 mostra o equilíbrio das duas forças: [+artigo definido ... -substantivo] e [-artigo definido ... +substantivo] apresentam, respectivamente, 48% e 54% de possibilidade de influenciar SNs com todas as marcas. 4) A estrutura sintagmática composta desfavorece a existência de SNs totalmente marcados: apenas 10% dos casos apresentam todas as marcas. Gostaríamos de retomar agora a questão dos SNs de estrutura composta. Bechara coloca explicitamente que somente o primeiro elemento varia (...) nos compostos de dois substantivos, onde o segundo exprime a idéia de fim, semelhança Navio-escola - navios-escola (=para escola) Salário-família - salários-família Manga-rosa - mangas-rosa (=semelhante a rosa) Peixe-boi - peixes-boi (BECHARA, 1982, p.82).

Segundo o autor acima citado, os demais casos de compostos do tipo carta-bilhete, segunda-feira, cirurgião-dentista apresentam-se totalmente marcados como em: cartas-bilhetes, segundas-feiras e cirurgiões-dentistas (cf. BECHARA, 1982, p.82 e, também, ROCHA LIMA, 1983, p.78). Diante disso, consideramos interessante separar todos os SNs contendo formas compostas. Não os separamos em função de serem ou

311

não iniciados por um artigo definido pelo fato de termos poucos dados: somente 31 casos, com apenas três com todas as marcas no SN. Mesmo assim, dos três casos totalmente marcados, dois são de artigo definido, em 10 ocorrências (20%) e um de não artigo definido em 21 ocorrências (5%). Os casos por nós levantados são do seguinte tipo: - uns navios-patrulhas - os ares-condicionados - os piores nomes-feios - dois filhos-homi - mil metros-quadrado - dois caças-americano - os médico-pediatra - três banana-prata - quatro salário-mínimo

(Cas46,mg,62a); (Mar22,fc,17a); (Ire17,fp,52a); (Dal18,fp,71a); (Mag47,fc,53a); (Cas46,mg,62a); (Dav42,mc,31a); (Nil12,fp,45a); (Cid32,fg,57a).

Com base nos resultados obtidos, podemos afirmar que o número de marcas, em qualquer caso de composto, é pequeno. A tendência nítida é, portanto, para a inexistência de marca nos dois elementos dos compostos, sejam quais forem as suas constituições ou os seus tipos. Dentre todos os 31 casos levantados, 10%(3/31) têm marcas nos dois elementos; 20%(6/31) têm marcas em um dos

elementos

dos

compostos (no substantivo,

do

composto substantivo+substantivo ou adjetivo) e 70%(22/31) não têm marca em nenhum dos elementos dos compostos. Nestes casos, há marca de plural apenas no primeiro elemento do SN. Com relação à classificação feita pela nossa tradição gramatical, percebe-se que, dos três casos com todas as marcas, um é do tipo em

312

que se prevê a ausência de marcas no segundo substantivo: do tipo de navios-escola, ocorre navios-patrulhas e não navios-patrulha, com as duas marcas, portanto. Por outro lado, prevê-se que a forma cirurgião-dentista apresente-se com marcas nos dois elementos do item composto. Mas o nosso caso deste tipo, médico-pediatra, apresenta-se sem marca nos dois elementos do composto. Além disso, casos do tipo de banana-maçã, nos quais se prevê a existência da marca no primeiro substantivo, apresentam-se também sempre sem marcas nos dois elementos. Acrescentam-se a estes todos os casos constituídos por salário-mínimo, que não têm marca em nenhum dos dois constituintes. Concluindo, reafirmamos que a possibilidade de haver marcas nos dois elementos dos substantivos compostos independe de sua constituição ou de seu tipo. A tendência geral é de não se ter marca em quaisquer dos dois elementos, sendo que a marca formal de plural fica apenas nos elementos não nucleares antepostos ou então tem-se a marca semântica de plural no numeral. A nossa conclusão torna-se mais evidente ainda ao depararmos com casos não registrados pela nossa tradição gramatical, de constituição substantivo + substantivo, sem marca no segundo substantivo, do tipo formas-padrão. Tais casos são comuns em textos escritos e são, inclusive, usados por nós dentro deste próprio texto. Fora as constatações acima, cumpre ainda perguntar se o segundo substantivo do composto cirurgião-dentista, por exemplo, também não "limita a significação geral do primeiro", conforme coloca Rocha Lima (cf., 1983, p.78), da mesma forma que maçã em banana-maçã ou caneta em canetatinteiro.

Em

outras

palavras,

cumpre

saber

se

a

subclasse

de

313

compostos estabelecida por nossa tradição gramatical tem alguma razão de ser. Os nossos resultados acima indicam que não. Pelos resultados neste item, conclui-se, indubitavelmente, que a Configuração sintagmática como um todo exerce influência sobre o número de marcas de plural dentro do SN. Resta saber se a única explicação para tal influência é a da Coesão sintagmática.

6.3.3.2 - Sobre novas explicações para o efeito da Configuração sintagmática Considerando agora o fato de que o tipo categorial do primeiro elemento do SN também influencia a concordância nominal, levantamos novas hipóteses, que pudessem também explicar a influência da variável Configuração. A primeira delas coloca o seguinte: a quantidade de marcas formais de plural presentes no SN é também função do tipo de relação que se estabelece entre os elementos dentro do texto. Os SNs menos marcados são aqueles que estabelecem uma referência dentro do texto, ou referência anafórica, remetendo-se explicitamente a elementos já presentes no contexto anterior e, conseqüentemente, trazendo menor carga semântica, por ser ela redundante,

e os SNs mais marcados são os que não estabelecem

referência textual explícita, o que faz com que sua carga semântica seja maior, por ser ela não redundante. A grande maioria dos primeiros tipos de SNs iniciam-se por demonstrativos.

314

Esta hipótese surgiu por termos observado inicialmente em nossos dados que, dentre 80 SNs de estrutura [dem. + subst. + quant.] (essas coisa toda/esses homi todo), 50 são resumitivos (62%) e, dentre estes 50, apenas cinco (10%) são totalmente marcados. Por outro lado, dentre 76 SNs do tipo [quant. + art.def. + subst.] (todas as coisas), apenas quatro (5%) são resumitivos e, destes quatro, dois (50%) são totalmente marcados. Decidimos então quantificar o que passamos a denominar de Função textual do SN, ao lado da Configuração sintagmática e da Pluralidade do contexto já referenciadas, a fim de verificarmos a validade da hipótese levantada. Esta variável reanalisa a Função sintática, transformada em Função resumitiva, quando da análise das partes do SN. É uma análise bem mais detalhada como veremos no momento oportuno. A segunda hipótese levantada diz respeito ao papel da topicidade ou da centralidade que pode ser atribuído aos SNs dentro de um texto (cf. CHAFE, 1976, p.50-5; GIVÓN, 1983, p.5-10; PONTES, 1986, p.16-9;177236; PONTES, 1987, p.11-40; BRAGA, 1986, p.393-453; HOPPER, 1979, p.213-6; HOPPER & THOMPSON, 1980, p.281-99 e NARO & VOTRE, 1986, p.454-66). Não vamos codificar os nossos SNs propriamente em termos das oposições tópico x não tópico; figura x fundo ou central/ polar x periférico, por uma série de razões a serem apresentadas no item 6.3.3.2.2. Vamos nos limitar a analisar os SNs em questão em função da sua localização em relação à oração ou ao verbo, que de certa forma reflete a questão do grau de topicidade ou de centralidade do SN. A nossa expectativa é que os SNs que

se

colocam

à

esquerda

da

oração

315

ou do verbo apresentam-se mais marcados por estarem numa posição de centro ou pólo da informação. Vamos verificar também a relação entre localização do SN e o seu tipo sintagmático, uma vez que o nosso objetivo central é exatamente o de buscar outras explicações para a forte influência da Configuração sintagmática do SN. A terceira hipótese levantada diz respeito ao Status informacional do SN (cf. CHAFE, 1976; PRINCE, 1981; GORSKY, 1981; BRAGA & SILVA, 1984; NARO & VOTRE, 1986). Uma vez que os SNs com artigo definido apresentam-se mais marcados do que os SNs com não artigo definido e uma vez que se considera que a informação velha tende a ser veiculada pelos SNs definidos e a informação nova pelos indefinidos, decidimos analisar também a influência do Status informacional do SN, correlacionando-o à sua Configuração sintagmática. Se o fenômeno aqui sob análise tiver alguma influência do status informacional do SN, é de se esperar que a informação nova seja mais codificada do que a informação velha. Estas duas últimas hipóteses são de certa forma conflitantes, pois encontra-se na literatura lingüística que as informações novas tendem a vir à direita do verbo (cf., especificamente, NARO & VOTRE, 1986, p.469). Estamos codificando as duas situações exatamente para ver se é o Princípio da Topicidade (ou o Princípio da Tensão Baixa) ou o Princípio da Economia que tem mais força sobre a concordância na sua perspectiva não atomística. Surge ainda uma quarta hipótese: a relacionada com a Formalidade do sintagma, refletida através de constituintes léxicos informais, do tipo de gírias,

e

de

constituintes

léxicos

de

grau

diminutivo/aumentativo.

316

Esta variável foi codificada por nós ao estudarmos apenas os substantivos e adjetivos na análise atomística. Já vimos que algumas estruturas são tipicamente informais e que havia, inclusive, uma interferência entre Formalidade e Função resumitiva (cf. nota 97). É então importante reintroduzir também a variável Formalidade e verificar a sua inter-relação com as variáveis Configuração e, inclusive, com a Função textual. Um quinto aspecto a ser estudado é o que vamos denominar de Pluralidade do SN, considerando que há SNs que não são do tipo pluralia tantum, mas que tendem a ocorrer predominantemente no plural e que, se ocorrerem no singular, têm um sentido diferente do plural correspondente, do tipo os valores humanos; as nossas raízes. Se estes SNs têm alguma relação com a Configuração sintagmática, é também o que objetivamos verificar. Finalmente, como sexto ponto, decidimos reanalisar a variável Animacidade, tendo em vista que um número considerável de SNs ocorrem em estruturas do tipo [art.def. + poss. +subst.] (os meus filhos), as quais são muito marcadas. Podemos desta forma verificar a inter-relação entre este aspecto e a Configuração sintagmática do SN. Se estas seis variáveis agora focalizadas - Função textual do SN, Localização do SN, Status informacional do SN, Formalidade do SN, Pluralidade do SN e Animacidade do SN - tiverem relação estreita com a variável Configuração sintagmática e se elas derem conta do porquê da influência nítida e marcante da variável Configuração, é de se esperar que, ao analisarmos as sete conjuntamente, a variável Configuração seja eli-

317

minada e que seu peso probabilístico seja atribuído às outras seis variáveis sob consideração. Para que nos façamos mais claros, vamos apresentar as nossas idéias na seguinte ordem: - descrição e exemplificação da variável Função textual do SN; - descrição e exemplificação da variável Localização; - descrição e exemplificação da variável Status informacional do SN; - descrição e exemplificação da variável Formalidade do SN; - descrição e exemplificação da variável Pluralidade do SN; - descrição e exemplificação da variável Animacidade do SN e - resultados probabilísticos obtidos para as sete variáveis analisadas.

6.3.3.2.1 - A Função textual do SN

Com base no grau de ligação das idéias dentro de um texto, refletida através da estrutura sintagmática, e com base na relação entre determinadas estruturas e idéias fora do texto, decidimos estabelecer seis tipos do que estamos denominando de funções textuais: resumitiva, dêitica, retomada, atributiva, textual e circunstancial. A função resumitiva é constituída, como já se sabe, por SNs que

318

funcionam como resumo de idéias já presentes no texto, ou que exercem apenas uma função fática, sem qualquer ligação sintática com qualquer oração. Alguns casos de resumitivos podem ser vistos a seguir: - Já saímos de melindrosa, de Pedrita, de... Que mais? Empregadinha. Essas bestera toda.(Fat23,fg,15a); - Talvez por... Em termos de cidade grande hoje, as coisas sejam mais agressivas, a pessoa...tem uma atitude mais agressiva ou de medo, né? De assalto, disso, de violência, essas coisas todas. (Hel44,fc,44a).

A função denominada dêitica é aquela exercida pelos SNs que estabelecem algum tipo de relação espacial, indicando tipos e fazendo exemplificações. Ela encontra-se exemplificada em: - E: E a mãe era rígida também? - F: Não, a minha mãe não. Mais a minha mãe era muito assim, é daquelas mães antigas que tudo que o pai diz, diz amém, que o marido diz, concorda. Só faz estritamente o que o marido concorda. (Lau28,fc,43a); - E depois, lá em Teresópolis, tem uma coisa... Já foi o tempo que Teresópolis era muito bom, sabe? ... Não existia ladrão ... Você podia dormir de porta aberta ... Agora, com essas istradas nova, vai muita gente de...de Caxias, daqui do Rio mesmo, e aí roubam, sabe? Assaltam as casa. (Mag,fc,53a).

O fator retomada é constituído por SNs que, semelhantemente aos resumitivos,

remetem-se

a

idéias

anteriores,

mas,

diferentemente,

encontram-se inseridos dentro de uma oração e não exercem função fática. Exemplificando: - Esse meu filho é desquitado, tem dois filhos homens. Um com 21 anos. Está na faculdade lá em Viçosa. Fazendo Agronomia. E o otro feiz 19 e quer fazer Veterinária. Também quer fazer lá em Viçosa, porque lá é mais indicado, né? Então veja bem. Mas esses meus netos não me procuram, porque não falam com o pai. (Dal18,fp,71a);

319

- Conheço uma pução de praia, sabe? Rio das Ostras, Iguaba, essas praia toda eu já fui em ixcursão, né? (Nad36,fg,57a). Em verdade os fatores função resumitiva e função retomada são casos especiais de dêixis, ou seja, são anafóricos, pois se remetem a elementos dentro do próprio texto (cf. CÂMARA JR., 1977, p.49, BECHARA, 1981, p.263-5).

A função atributiva, ilustrada abaixo, é exercida pelos predicativos. - Nós éramos, parece que...não sei, uns dezesseis casais. (Dor29,fg,44a); - Uma das coisas boas da vida é os seus filho e melhor ainda são os netos. (Ago33,mp,60a); - Eu sou um dos poucos patriotas.

(Leo38,mc,18a);

- Grajaú e Urca são os dois bairro em que não pudia ter ladrão. (Geo31,mg,58a).

Os SNs que foram denominados textuais são aqueles que aparecem no texto sem resumir, sem estabelecer relação espacial, sem retomar idéias, conforme podemos ver pelos exemplos a seguir: - E: E você acha que tem que ter coisas que só homens gostam e tem coisas que só as mulheres gostam? - F: Não...mulhé tem que fazê... Tem que tê os mesmos direitos que o homem. (Val24,fg,15a); - A Luanda levô um tiro... É a coisa que eu me lembro... Num dá pra mim ficá (...) prestando atenção muito na novela, por causa do meus filho, que o...a hora que eles tão acabando de jantar... Aí fico gritando com eles. (Lei04,fp,25a); - Meu pai tinha uma...uma preocupação social... Quando a gente foi pra lá, ais casas todas foram arrebentadas, essas de sapê foram construídas novas. (Hel44,fc,44a).

320

O fator rotulado circunstancial envolve todos os casos de referência a tempo, espaço, medida e valor. São exemplos deste fator os casos listados a seguir. - Há uns três anos atrás, nosso barraco...

(Joa10,fp,27a);

- Uma cervejinha lá deve tá uns duzentos e cinqüenta cruzeiro. (Jal25,mg,30a); - Ele tinha uns dez a doze quilo na época.

(Ago33,mp,60a);

- Mas essa senhora chorou tanto esse camarão: umas dez vezes e eu ... (Jan03,mp,56a); - Eu não sei fazê nada disso nesses...nesses lugar todo, né? (Seb09,mp,39a).

A tabela 6.3.3.4 contém os resultados percentuais relativos a esta variável.

TABELA 6.3.3.4 SOBRE A FUNÇÃO TEXTUAL DO SN FUNÇÃO Resumitiva

Apl./Total

%

9/57

=

16

Dêitica

17/54

=

31

Retomada

13/32

=

41

Atributiva

19/47

=

40

Textual

320/589

=

54

Circunstancial

106/169

=

63

Através dos resultados percentuais acima, pode-se perceber que todos os SNs que contêm informação redundante se apresentam com

321

menos marcas, ou seja, os de função resumitiva, dêitica, retomada e atributiva são os que menos favorecem a presença de todas as marcas de plural e os textuais e os circunstanciais, os que mais favorecem a presença de marcas. Resta saber se os resultados probabilísticos serão semelhantes aos percentuais.

6.3.3.2.2 - A Localização do SN

Conforme já colocamos acima, não codificamos os SNs de nosso estudo propriamente como tópico x não tópico, figura x fundo ou central/polar x periférico, por razões diversas, dentre as quais cumpre destacar as seguintes. Trabalhamos com toda a espécie de SN plural e com todo e qualquer estilo discursivo, o que em parte dificulta classificações nas bases acima especificadas. Além disso, com relação especificamente às noções de figura x fundo ou central/polar x periférico, já observáramos, na tabela 6.3.3.4, contrariamente a expectativas existentes, que SNs tipicamente fundo ou periféricos - os circunstanciais - tendem até a ter mais marcas que os demais. Vimos também no item 6.2.5, quando analisamos a variável Função sintática, que as probabilidades associadas aos adjuntos eram semelhantes às associadas aos sujeitos, agentes ou não, os quais são candidatos a serem o centro ou o pólo discursivo. Com relação à oposição tópico x não tópico, não verificáramos nenhuma tendência evidente que justificasse uma classificação refinada,

322

quer em função de tópico sintático quer em função de tópico discursivo. Sendo assim, limitamo-nos a analisar os SNs em questão em termos de sua localização linear em relação à oração ou simplesmente em relação ao verbo que, como já dissemos, reflete a questão da topicidade ou da centralidade do SN. Os SNs tópicos ou centrais ocorrem à esquerda da oração ou à esquerda do verbo, conforme afirmam Pontes (cf. 1986, p.16-9; 177-236; 1987, p.11-40 e Naro & Votre (cf. 1986, p.454-66), embora nem todo

SN

que ocorra à esquerda do verbo ou

da

oração possa ser

classificado consistentemente como tópico ou como central. Os SNs abaixo sublinhados certamente seriam classificados como construções tópicas por Pontes, mas não como figura ou centrais/polares por Naro & Votre. - E: E aqui o Carnaval é muito grande? - F: Ah! O Carnaval é... Carnaval eu gosto. Todos os anos eu vô assisti iscola di samba. (Dor29,fg,44a); - E: Como é a rotina do seu dia? - F: (...) Terças e quintas eu vô pro curso... (...) assim, de tarde, assim, de seiz às sete, eu faço ginástica; terças e quintas, também. Nos oto dias eu saio, pego um cinema, ou estudo, depende assim... (Mar22,fc,17a).

O que importa para nós no momento não é a coincidência de classificação entre os diversos autores até então citados, mas, sim, o fato de os SNs todos os anos e nos otos dias ocorrerem à esquerda da oração. Estamos assumindo que a posição à esquerda da oração ou do verbo coloca o SN em evidência, numa posição mais saliente, mesmo os circunstanciais, e que

por

esta

razão

eles

tendem

a

vir

mais

marcados

do

323

que os que se situam à sua direita. Como alguns casos não evidenciam posição nítida, decidimos codificá-los como indistintos, em vez de "interpretar" a sua posição. A variável localização do SN ficou então constituída de três fatores, abaixo exemplificados.

1) Localização à esquerda: - Todas as ruas, né? Pintaram... (Jos35,fp,59a); - As outras pessoa taca garrafa...

(Sam01,mp,18a).

2) Localização à direita: - A gente não consegue levar todas as informações, né? - Pelé teve seus momento bão. (Car19,mg,20a).

(Par41,mc,26a);

3) Localização indistinta: - Eu devia ter o que? Uns dezoito anos...

(Ana40,fc,18a);

- Que nem os nosso pai... (San39,fc,16a).

Os percentuais de marcas de plural com relação a esta variável encontram-se na tabela 6.3.3.5, a seguir. TABELA 6.3.3.5 SOBRE A LOCALIZAÇÃO DO SN LOCALIZAÇÃO

Apl./Total

Á esquerda da oração

112/178

=

63

Á direita da oração

349/712

=

49

23/58

=

40

Indistinta

%

324

Os resultados da tabela 6.3.3.5 apontam também para a direção esperada: os SNs que se localizam à esquerda da oração são mais marcados (63%) do que os que ocupam a posição à direita (49%) ou que se encontram em posição indistinta (40%).

6.3.3.2.3 - Status informacional do SN Conforme já colocamos, decidimos codificar esta variável com base no fato de se fazer normalmente uma certa relação entre a forma de apresentar a informação e a Configuração sintagmática dos SNs. Já se sabe bem que, se o falante embalar uma mensagem nova com um SN definido sem colocar nenhuma âncora ou sem que este SN seja de alguma forma "disponível" na memória do ouvinte, corre-se o risco de provocar ruído na comunicação. Esta situação é bem típica, pois favorece, por parte do ouvinte, perguntas surpresas do tipo: O que? Quem? Onde?, quando se introduz uma informação nova-em-folha através de uma construção definida. Não vamos discutir aqui todos os detalhes que envolvem a forma de embalar a informação. Para maiores detalhes, remetemos o leitor aos textos de Chafe (cf. 1976, p.30-3); Prince (cf. 1981, p.223-55); Gorsky (cf. 1981, p.44-7) e Braga & Silva (cf. 1984, p.27-39). Vamos apresentar aqui a nossa forma de codificar os dados que, embora se baseie nos textos acima, não apresenta identidade absoluta com nenhum deles. Todavia, é importante observar que a nossa classificação encontra relação bastante estreita com a de

Prince

e

a

de

Gorsky.

Vamos

também

fazer

menção

ao

325

texto de Naro & Votre (cf. 1986, p.466-71), pois a nossa classificação coincide também, em algumas partes, com a efetuada por eles, embora não tenha sido baseada nela. Após uma classificação bastante detalhada, decidimos estabelecer as seguintes categorias para esta variável: 1) informação nova-em-folha; 2) informação nova ancorada; 3) informação nova disponível; 4) informação inferível; 5) informação velha e redundante; 6) não entidade. A

informação

denominada

nova-em-folha,

como

a

própria

terminologia já o coloca, é uma informação introduzida pela primeira vez no discurso sem nenhuma âncora, não sendo também previsível no texto, nem disponível

e

nem

inferível,

"culturalmente

ou

situacionalmente".

Apresentamos abaixo dois exemplos deste tipo de SN. No primeiro caso um falante está relatando a procura de emprego e, no segundo, outro falante emite a sua opinião sobre política. - Eu tava desempregado. (...) Precisava arrumá...uma ocupação... Aí comecei a procurá no jornal... Aí arrumei um... Fui na Uruguaiana. Aí cheguei lá e tinha umas oito ou deyz pessoas na frente. Aí eu esperei a minha vez. (Cla27,mg,32a); - E: E a política por aqui? - F: (...) Eu tenho assim uma simpatia por ela. Pela Sandra. Mays eu acho que eu não vô votar nela não. (...) Votá em branco. Acho que é melhor. - E: Vai dexá em branco também? - F: Acho que vô dexá. Se num me derem umas ixplicações muito correta, pra mim ver se intendo um pouquinho, eu dexo (...) em branco. (Ari30,fg,43a).

326

Dentre os 948 SNs analisados, só encontramos 29 casos de novosem-folha. O pequeno número de dados deste tipo é compatível com as colocações de Gorsky (cf. 1981, p.83) e Naro & Votre (cf. 1986, p.469) de que o SN novo-em-folha é raro, pois o falante, para manter a coesão do discurso, ou seu alto grau de textualidade, introduz poucas informações totalmente novas. As informações tendem a ser velhas e, se novas, tendem a ser fortemente ancoradas, como veremos a seguir. Diferentemente, Braga (1986), em seu trabalho sobre construções tópicas, encontra muitos SNs novos ao analisar o "Status informacional do referente do SN mais à esquerda", porque inclui na categoria novos todos os casos denominados de novos-em-folha, novos ancorados e novos disponíveis (não usados) (cf. p.402), consoante com as suas idéias expostas em 1984 de que uma lista de referentes novos não usados parece-nos uma solução ingênua (...) Sugerimos que a categoria novo não-usado seja abandonada e que se utilize apenas a categoria totalmente novo ou, simplesmente, novo com as suas ramificações: ancorado e não ancorado. (BRAGA & SILVA, 1984, p.33)

Os novos ancorados perfazem um total de 127 dados e são caracterizados em termos de se apoiarem na pessoa do falante através de pronomes possessivos, ou de virem introduzidos através de outros tipos de âncora como orações relativas e adjuntos adnominais. Estes casos foram assim classificados quando inseridos pela primeira vez no discurso. Caso contrário, classificaram-se ou como inferíveis ou como velhos. São exemplos de novos ancorados os SNs sublinhados no texto a seguir.

327

- E: E você já, assim, já viveu alguma situação difícil, de tensão? - F: Ah! Um dia a gen... Eu tinha ido cuns amigos meu lanchá no Bob's, lá de Copacabana. Aí a gente resolveu voltá, né? Dando a volta por tudo: Ipanema, Leblon, aquelas coi... Aí... (Mar22,fc,17a); - Tem pessoas que você se dá melhor do que com otras, né? (...) Agora se é uma cabeça boa, se tem uma visão mais aprofundada dos valores humanos, elas (as filhas) se relacionam perfeitamente, nunca tiveram problemas de relacionamento. Elas chegam a...mesmo a fazer todas as baguncinhas que todo mundo faz normalmente. (Eve43,fc,42a).

A informação nova disponível (cf. GORSKY, 1981, p.64-6) se caracteriza pelo fato de ser facilmente acessada pelo ouvinte, embora não se trate de informação já mencionada ou detectável no contexto. Diríamos que estes SNs são depreensíveis do contexto cultural que rodeia o falante e podem inclusive vir com artigos definidos sem que haja qualquer estranhamento por parte do ouvinte. Eles são do tipo considerado por Prince de referência única, só que, no nosso caso, como estamos trabalhando com SNs plurais, jamais haverá a referência única. Nos termos de

Gorsky,

"entidades deste tipo estão disponíveis no universo espacial e cultural dos participantes do discurso." (p.66) Um exemplo bastante típico deste fator pode ser encontrado no segundo texto transcrito para a exemplificação do novo ancorado. Trata-se do sintagma os valores humanos que surge no texto neste momento sem nenhuma menção prévia, sem nenhuma âncora, e com artigo definido, não provocando, todavia, nenhuma quebra de coesão ou de textualidade no discurso. Mais dois exemplos deste fator são apresentados a seguir:

328

- E: E com relação ao trabalho na igreja, né? O que a senhora faz? (...) - F: Há douze anos que nós organizamos o Natal dos velhinhos pobres. Esse Natal é maravilhoso. (Mgl48,fc,52a); - E: Vem cá! Você foi vê os cegos, né? Cumé que eles são? O que é que eles pensam? (...) - F: (...) O dia que eu fui, então, tinha muitos parentes lá. (...) Eu acho que tem uns que são órfãos, né? Ainda... Além de ser (ininteligível) e cegos, são órfãos. Intão, as... As otras pessoas, intão, dão mais atenção ainda, entendeu? (San39,fc,16a).

A informação inferível, ancorada ou não, se caracteriza por ser dedutível do contexto via raciocínio lógico ou através de elementos morfologicamente explícitos, sem que se faça a repetição ou substituição dos itens léxicos. Os casos relacionados abaixo são bons exemplos desta forma de embalar a mensagem: - Ela (a casa) tem um terraço, tem um terreno aqui por trás, tem goiabera que me dá umas goiabas bunitas. Num deu esse ano, porque eu fui podá e não sei podá, e estraguei a goiabera, sabe? (Jov26,mg,32a); - O dia em que eu for campião regional daqui...todos os time dessa redondeza jogam. (Man12,mp,56a); - De todos os assuntos da vida, o que eu menos liguei sempre foi...a política. Então ais pessoas...só dizem isso: política é uma sujeira. (...) Que roubam, que fazem, que enchem o bolso, que põem seus parentes lá dentro... Eu acredito que alguma coisa boa vá saí... Mas cumo dizem que todos...todos os político tem aquele lado mau que é como a corrupção tremenda, sô eu que vô dizê que num vai sê o que vai sê? (Mgl48,fc,52a).

A informação velha, no sentido apenas de velho textual,

como o

próprio nome já indica, já foi mencionada no contexto precedente. São exemplos, os casos abaixo: - Essa semana mesmo o Paulo...ganhô e deu pra ele uns pés de coqueiro. (...) Já tinha dado uns três pés pra ele, agora demo mais três. E carambola... (Mag47,fc,53a); - E: Cumé que faiz pra armá uma barraca? - F: Olha, a gente leva a barraca. Minha barraca pesa quarenta quilos...

329

- E: Cêis acampam em camping ou... - F: Não, não. Eu acampo adoidado. Onde eu achá melhó e não fô proibido a área, eu tô chegando. Negócio eu num gosto muito não, porque tem formalidade (...). Pra onde eu vô, não. A gente... Tem o pessoal dais otras barraca, a gente leva... Canta, samba a noite toda... (Dav42,mc,31a). Este fator, além de envolver todos os casos clássicos de informação velha, envolve também todos o SNs classificados como fáticos, resumitivos e dêiticos. Estes últimos foram colocados neste fator, porque, a nosso ver, eles veiculam informação velha, principalmente os resumitivos, que retomam através de uma nova lexicalização o conteúdo de idéias anteriores. Os fáticos talvez pudessem ser classificados mais como disponíveis de referência irrelevante (cf. NARO & VOTRE, 1986, p.23), se é que têm alguma referência. Quanto aos SNs rotulados de dêiticos, e aqui colocados no mesmo fator de informação velha, são classificados por Naro & Votre como parcialmente novos, numa subcategoria denominada de novos atenuados, como sendo aqueles "indicados por um demonstrativo anafórico, uma breve explicação ou descrição, a

partícula aí

etc." (1986, p.16) A

categoria dos parcialmente novos de Naro & Votre, além de incluir estes casos, inclui também os novos ancorados. Poderíamos até modificar a nossa forma de analisar os nossos dados para fazê-la mais comparável à de Naro & Votre, mas cremos que esta não seria a decisão mais acertada. Os novos ancorados de nossa amostra apresentam 63% de marcas, os velhos 53% e os dêiticos 31%. Podemos ver que, em termos de comportamento, faz menos sentido colocar os dêiticos junto

aos

novos

ancorados

do

que

junto

aos

velhos.

De

330

qualquer forma, mesmo efetuando-se a mudança, não acreditamos que se fizessem grandes diferenças nos resultados que já obtivemos. Gostaríamos de já adiantar que esta variável não foi considerada estatisticamente significativa, o que não justifica uma reanálise de 948 SNs, com 54 SNs dêiticos e 17 SNs fáticos. Se os SNs dêiticos fossem agrupados ao fator novo ancorado, o percentual do novo ancorado passaria de 63% para 54%. Todavia, não acreditamos que isto mudaria a configuração geral dos resultados que já temos em mãos. Além do mais, Naro & Votre fizeram uma classificação própria, específica para o fenômeno que estavam analisando (cf. 1986, p.467), a qual pode, portanto, não ser necessariamente apropriada para o estudo que estamos empreendendo. Em verdade, a categorização segundo o Status informacional do SN é muito polêmica dentro da literatura lingüística sobre o assunto. O último fator desta variável É constituído por todos os SNs que são não entidades. Ele agrupa todos os casos de função circunstancial e função atributiva, já devidamente exemplificados nas páginas 319-320. Não apresentamos aqui as percentagens relativas a esta variável, pois todos os comentários relativos a ela serão feitos por ocasião da apresentação dos resultados probabilísticos e da sua comparação com a variável Configuração.

6.3.3.2.4 - Formalidade do SN A Formalidade é uma variável já estudada no item 6.2.5, quando analisamos os substantivos e adjetivos separadamente. Utilizamos basi-

331

camente os mesmos critérios lá especificados para caracterizar um SN como informal ou não informal, ou seja, qualquer SN que tivesse um item do tipo cara, outro, besteira, bobagem, grilo, lance, papo, merda, goró, brabão etc, tipicamente usado como gíria, foi considerado informal. Além disso, classificaram-se também como informais os SNs com núcleo coisa de função fática ou resumitiva e as construções do tipo um montão de; uma pá de; um bando de; um monte de. Considerando ainda que o número de seqüências de três ou mais elementos com diminutivo/aumentativo (32) e com itens informais (66) era relativamente pequeno, se comparado ao número de seqüências com grau normal e não marcadas quanto à informalidade (850); e considerando também que os itens diminutivos/aumentativos e os itens informais apresentam o mesmo comportamento (cf. item 6.2.6, páginas 265-277), decidimos agrupá-los nesta etapa de nossa análise. Esta variável ficou então sendo formada por dois fatores: o primeiro deles constituído por SNs que contenham pelo menos um item lexical informal ou diminutivo/aumentativo e o segundo, pelos demais SNs. Os percentuais de concordância apontam também para a direção esperada: os SNs denominados informais se apresentam com apenas 15% de marcas e os não informais com 55%.

6.3.3.2.5 - A Pluralidade do SN Procuramos captar com a variável denominada Pluralidade do SN o fato de determinados SNs tenderem a aparecer predominantemente no

332

plural. A codificação desta variável é passível de discussão, considerando que não há

marcas textuais ou critérios rigidamente definidos para se

estabelecê-la. A base de codificação, à exceção de um dentre os três fatores, é essencialmente intuitiva. Consideramos, então, que há SNs que se referem a conceitos, situações, eventos ou entidades que são necessariamente ou comumente mais de um. Os casos abaixo são exemplos destes SNs:

- minha mãe nunca interferiu no meus problemas. - ficam brincando com os nossos direitos.

(Ari39,fg,43a);

(Hel44,fc,44a);

- nós não damos tanto valor às nossas raízes.

(Mgl48,fc,52a);

- me identifico muito com isso, com as nossas coisas, né? (Pac20,mc,26a); - vejo Arqueologia nas horas vagas.

(Mar22,fc,17a);

- eu comecei a pensar...nos meus atos. - voltar às minhas origens.

(Par41,mc,26a);

(Eve43,fc,42a);

- uma pessoa, né, que tinha os mesmos valores, né? - você sabe por suas próprias mão.

(Par41,mc,26a);

(Jos35,fp,59a).

Em outro fator, consideramos os SNs que fazem referência a partes do corpo, com quase todas as ocorrências listadas abaixo: - desde que os seus olhos gostaram.

(Dav24,mc,31a);

333

- ficam com as cabeças é, como se diz? pertubadas,né?

(Hel34,fg,62a);

- começaram a ingessá as duas perna. (Leo38,mc,18a); - tá com os lábio vermelho, Patrícia.

(Joa10,fp,27a);

- tinha isso aqui bem largo, as perna bem feita, né? (Nil12,fp,45a); - uns cabelo tudo arrepiado. - alisá

a

cabecinha

do

(Jov26,mg,32a); velho,

com

aqueles

cabelim

branquim.

(Sue05,fp,24a); - tinha aqueles cacho escorridinho.

(Nil21,fp,45a);

- diz que tá cos peito todo doendo.

(Lei04,fp,25a).

Embora mesmo neste fator haja SNs de classificação discutível, estes seriam os casos menos dúbios. É interessante observar que há algumas partes do corpo que são inerentemente duas (olhos, lábios, pernas), já há outras que, em verdade, são apenas um (peito, cabeça) e há os casos em que as duas situações acima não se colocam: cacho/cabelo. No caso do SN que se refere à cabeça, sem dúvida não se trata da cabeça de uma só pessoa, mas, no caso de peito, a referência é a um só indivíduo. O último fator engloba todos os casos em que se considera que a referência não é necessariamente

mais

de

um,

ou

seja,

as

construções

não

são

necessariamente plurais como as do primeiro caso. Os percentuais relativos aos três fatores desta variável apontam também em direção ao esperado: os SNs "necessariamente mais que um não inerente" se apresentam com 75% totalmente marcados, os referentes a partes do corpo com apenas 21% e os demais com 49%.

334

6.3.3.2.6 - Animacidade do SN

A variável Animacidade do SN foi também codificada nos moldes da codificação feita para os substantivos no item 6.2.6.3, ficando na sua forma final com dois fatores: [+humano] x [-humano]. A diferença percentual é, como já vimos, bastante pequena, mas na direção esperada: dentre os SNs com o núcleo [+humano], 59% são totalmente marcados e, dentre os com núcleo [-humano], 55% o são. Vamos passar agora à apresentação dos resultados probabilísticos para as sete variáveis sob consideração.

6.3.3.2.7 - Resultados probabilísticos

Gostaríamos de relembrar que os resultados probabilísticos que vamos apresentar agora estão inseridos em uma análise que considerou, além das sete variáveis agora focalizadas, também a variável Pluralidade do contexto, já apresentada, e a variável Processos de formação do plural, ainda por se apresentar, juntamente com três variáveis sociais estratificadas: Escolarização, Sexo e Idade. Estas últimas serão discutidas nos capítulos 8 e 9. Como já mencionamos, a variável Pluralidade do contexto foi selecionada em primeiro lugar com significância 0,0, em conformidade com a análise dos elementos do SN. Ainda coerentemente com a análise dos elementos do SN, que selecionou a variável Relação entre os elementos do SN em quarto lugar com significância também 0,0, a variável Configuração sintagmática

foi

selecionada

em

segundo

lugar

335

com igual significância, dentre nove variáveis selecionadas. A partir do terceiro nível, selecionam-se as seguintes variáveis, com as respectivas significâncias: 1) Escolarização: 0,000; 2) Sexo: 0,000; 3) Saliência dimensão processos: 0,000; 4) Formalidade: 0,001; 5) Pluralidade do SN: 0,010; 6) Função textual: 0,018; 7) Localização do SN: 0,018. Os níveis de significância acima evidenciam pequenas diferenças estatísticas entre os sete grupos restantes selecionados. Nesta etapa de análise, não são selecionadas as seguintes variáveis: 1) Status informacional; 2) Animacidade e 3) Faixa etária. É importante observar ainda que, no primeiro nível de análise, havia cinco variáveis com significância 0,0:

1) Pluralidade do contexto, com oito fatores; 2) Configuração sintagmática, com seis fatores; 3) Escolarização, com três fatores; 4) Sexo, com dois fatores e 5) Formalidade, com dois fatores.

336

Neste primeiro nível, a variável Pluralidade do contexto foi selecionada em primeiro lugar porque apresentava log likelihood mais próximo de zero. No segundo nível, apenas a variável Configuração sintagmática apresentou significância 0,0. As variáveis Pluralidade do contexto e Configuração sintagmática são, pois, do ponto de vista estatístico, indubitavelmente as melhores: o que confirma a análise feita para as partes do sintagma. Então, as seis variáveis codificadas não constituem explicação para a variável Configuração, mas junto com ela influenciam a ausência ou presença de SNs total ou parcialmente marcados. As variáveis codificadas só constituiriam explicação para a variável Configuração se todos os seus valores se aproximassem de 0,50. Todavia, como veremos na tabela 6.3.3.6, isto não ocorre. Vamos apresentar os resultados probabilísticos e, paralelamente, vamos mostrar que estes resultados refletem fielmente a distribuição lingüística dos dados analisados. A tabela 6.3.3.6, a seguir, contém os resultados probabilísticos da variável Configuração sintagmática. Nesta tabela, apresentamos, além das percentagens, as probabilidades iniciais (Prob.1) sem interferência de qualquer outra variável e as probabilidades finais (Prob.9) com o peso probabilístico relativo atribuído Às nove variáveis selecionadas. Fizemos a apresentação desta forma pelo fato de estarmos querendo verificar as possíveis inter-relações entre, principalmente, a variável Configuração e as demais variáveis lingüísticas aqui focalizadas. Este procedimento foi

337

adotado em quase todas as tabelas subseqüentes. Algumas delas apresentam inclusive outros níveis probabilísticos. O número de níveis probabilísticos usados em cada tabela foi função das necessidades de se mostrarem as sobreposições entre as diversas variáveis estudadas. Feitas estas considerações, vejamos os resultados da tabela 6.3.3.6 na página seguinte. Os resultados da tabela 6.3.3.6 mostram que praticamente não existe diferença entre percentagens, probabilidades iniciais e probabilidades finais, o que confirma as conclusões descritas no item 6.3.3.1, feitas apenas em bases percentuais, novamente colocadas aqui:

1) A presença de artigo definido ou do quantificador, na primeira posição do SN, e a presença de substantivo ou categoria substantivada, na última posição do SN, são duas forças poderosas no sentido de provocarem a presença de todas as marcas de plural em todos os elementos flexionáveis do plural do SN, com probabilidades de 0,68 e 0,80.

338

TABELA 6.3.3.6 CONFIGURAÇÃO SINTAGMÁTICA DO SN CONFIGURAÇÃO

Apl./Total

+ART.DEF. ... +SUBST. +QUANT. (todos os dias) (os meus filhos) (as boas ações)

261/398

-ART.DEF. ... -SUBST. (vários jogadores bons) (essas carne congelada) (aquelas rendas todas) (esses homi todo) (algumas colega minha) (três colega meu)

%

Prob.1

Prob.9

= 66

0,68

0,68

57/211

= 27

0,29

0,37

-ART.DEF. ... +SUBST. (umas segundas lojas) (tantas outras famílias) (esses trinta dia) (essas grande fábrica)

90/166

= 54

0,57

0,57

+ART.DEF. ... -SUBST. +QUANT. (as pessoas ricas) (os lábios vermelho) (as danças todas) (as coisa toda) (os camarada meu) (todas amiga minha)

61/128

= 48

0,51

0,50

+ART.DEF. ... CAT.SUBST. (os melhores possíveis) (os maiores prejudicado)

12/14

= 86

0,87

0,80

ESTRUTURA COMPOSTA (duas fragata-brasileira) (esses médicos-psiquiatra) (sete salário-mínimo) (três banana-prata)

3/31

= 10

0,11

0,13

2) A presença de qualquer outra classe gramatical que não seja artigo definido ou quantificador, na primeira posição do SN, e a presença do

339

adjetivo, do possessivo ou do quantificador, na última posição do SN, são igualmente duas forças poderosas no sentido de desfavorecer a presença de SNs com todas as marcas, com probabilidade de 0,37. 3) O cruzamento das classes mencionadas em 1 e 2 mostra o equilíbrio das duas forças, com probabilidades de 0,57 e 0,50 de influenciar a presença de SNs com todas as marcas. 4) A estrutura sintagmática composta desfavorece a existência de SNs totalmente marcados, com probabilidade de 0,13. Poder-se-iam levantar objeções ao significado lingüístico da variável Configuração, afirmando-se que a sua seleção em segundo lugar ocorreu por causa dos valores extremos (0,80 e 0,13) atribuídos aos dois últimos fatores que contêm poucos dados. Sendo assim, poderíamos supor que, se todas as variáveis tivessem sido selecionadas, todos os valores da variável Configuração se aproximariam de 0,50. Tivemos o cuidado de fazer este teste, pois o instrumental estatístico que estamos usando nos permite ver isto através do step-down, onde se medem os pesos de todas as variáveis conjuntamente, para se verificar se as variáveis não selecionadas são também eliminadas. Neste teste, desconsideramos os fatores extremos a fim de se eliminar a possibilidade de "ajuda" na seleção. Os resultados obtidos neste teste podem ser vistos na tabela 6.3.3.7, na página seguinte. Em Prob.1, temos as probabilidades isoladas e, em Prob.12, temos as probabilidades com todas as variáveis, inclusive as não selecionadas. Podemos verificar, pelos resultados desta tabela, que os valores probabilísticos permanecem praticamente inalterados e não se aproximam de 0,50 mesmo com todas as variáveis juntas.

340

O fato de haver pouca diferença entre as percentagens, as probabilidades iniciais e as finais da variável Configuração indica que ela é realmente uma variável forte e que, mesmo apresentando sobreposições com outras variáveis, recebe praticamente toda a distribuição relativa dos pesos probabilísticos. TABELA 6.3.3.7 CONFIGURAÇÃO SINTAGMÁTICA DO SN CONFIGURAÇÃO

Apl./Total

+ART.DEF. ... +SUBST. +QUANT. (todos os dias) (os meus filhos) (as boas ações)

261/398

-ART.DEF. ... -SUBST. (vários jogadores bons) (essas carne congelada) (aquelas rendas todas) (esses homi todo) (algumas colega minha) (três colega meu) - ART.DEF. ... +SUBST. (umas segundas lojas) (tantas outras famílias) (esses trinta dia) (essas grande fábrica) +ART.DEF. ... -SUBST. +QUANT. (as pessoas ricas) (os lábios vermelho) (as danças todas) (as coisa toda) (os camarada meu) (todas amiga minha)

%

Prob.1

Prob.12

= 66

0,67

0,65

57/211

= 27

0,28

0,35

90/166

= 54

0,56

0,54

61/128

= 48

0,49

0,47

341

O fator da variável Configuração sintagmática que apresenta uma diferença digna de nota entre a probabilidade inicial e a probabilidade final é o constituído por [-art.def. ... -subst.], que se apresenta com uma probabilidade associada de 0,28 no primeiro nível de análise, e de 0,35 no último, conforme se pode ver na tabela 6.3.3.7. Não existe, todavia, inversão na ordem das percentagens, probabilidades iniciais e finais. Em verdade, a variável Configuração é que altera a ordem das percentagens atribuídas à variável Função textual, variável esta que foi a primeira a ser codificada com o objetivo de buscarmos novas explicações não formais para a forte influência da variável Configuração. Os resultados probabilísticos atribuídos à variável Função textual na tabela 6.3.3.8, a seguir, mostram que o seu peso probabilístico não segue a mesma hierarquia que o seu peso percentual. Antes de qualquer outro comentário,

consideramos

oportuno

observar

que,

nesta

tabela,

apresentamos as probabilidades relativas a quatro níveis de análise: primeiro nível (N.1), terceiro nível (N.3), sétimo nível (N.7) e nono nível (N.9).

342

TABELA 6.3.3.8 FUNÇÃO TEXTUAL DO SN FUNÇÃO

PROBABILIDADES Freq. %

N.1

N.3

N.7

N.9

Resumitiva

9= 16 57

0,22

0,31

0,52

0,54

Dêitica

17= 31 54

0,41

0,55

0,57

0,57

Retomada

13= 41 32

0,51

0,46

0,39

0,36

Atributiva

19= 40 47

0,51

0,44

0,32

0,38

Textual

320= 54 589

0,64

0,56

0,54

0,52

Circunstancial

106= 63 169

0,72

0,67

0,66

0,67

No primeiro nível de análise, as probabilidades relativas à variável Função textual mantêm a mesma hierarquia das percentagens. No nível 3, ao se comparar a influência relativa das variáveis Configuração e Função textual, observa-se que os pesos probabilísticos dos fatores da variável Função já se alteram, estabelecendo-se uma identidade entre as probabilidades dos SNs dêiticos e dos SNs textuais, até então bastante diferenciados. As modificações são mais fortes ao se atribuir, no nível 7, o peso relativo das variáveis considerando também a variável Formalidade. O fator resumitivo sofre mudança radical no seu peso probabilístico. Neste nível,

igualam-se

o

comportamento

dos

fatores

resumitivo

e

343

dêitico com

o do

fator textual, três fatores bastante diferenciados no

primeiro nível probabilístico. Configuração e Função se sobrepõem, porque quase todos os SNs resumitivos e dêiticos têm a configuração [demonstrativo + substantivo + quantificador] (essas coisa toda). E, como a variável Configuração é considerada estatisticamente mais poderosa, o peso probabilístico é atribuído À Configuração e retirado do grupo Função. A sobreposição com a variável Formalidade também se dá porque a quase totalidade dos resumitivos é constituída de

SNs informais. Além disso, a variável

Formalidade é considerada também mais forte estatisticamente, o que retira bastante do peso probabilístico que seria atribuído à variável Função. Diferentemente do que ocorre com a variável Função, os resultados finais da variável Formalidade mantêm a mesma hierarquia das probabilidades do primeiro nível, conforme podemos ver pelos resultados da tabela 6.3.3.9. TABELA 6.3.3.9 GRAU E FORMALIDADE DO SN GRAU/FORMALIDADE Informal e/ou Diminutivo/aumentativo Não informal Não diminutivo Não aumentativo

Apl./Total

%

Prob.1

Prob.9

15/98

=

15

0,28

0,37

469/850

=

55

0,72

0,63

Em verdade, quase todos os valores probabilísticos dos fatores da variável Função se alteram, quando juntos às variáveis Configuração e

344

Formalidade. O efeito da variável Função que se observa nos valores percentuais e nos valores probabilísticos do primeiro nível em direção a uma possível "eliminação de redundância" é apenas aparente. Ele é apenas um reflexo da Configuração sintagmática e da Formalidade do SN. Chegamos a fazer um cruzamento entre Configuração e Função, esta recodificada em dois fatores: redundante e não redundante. Pelo resultado deste cruzamento, verificamos, por exemplo, que 66% (125/190) dos SNs com informação redundante são de estrutura [-art.def. ... -subst.] e, destes, apenas 24% (30/125) são marcados. Constatamos, por outro lado, que os outros SNs desta mesma constituição, os não redundantes, têm também apenas 31% (27/86) totalmente marcados, enquanto os demais redundantes chegam a ter 45% dos SNs com todas as marcas (28/62). Conseqüentemente, somos levados a refutar a primeira hipótese por nós levantada: a Função textual não explica o forte condicionamento exercido pela Configuração sintagmática. Além disso, a sua influência não chegou a ser sistemática, pois as probabilidades finais relacionadas na tabela 6.3.3.8 não apresentam uma hierarquia razoável. Por um lado, apresentam-se os fatores retomada e atributivo, ambos com informação redundante, com probabilidades baixas; respectivamente 0,36 e 0,33; mas, por outro, apresenta-se o fator resumitivo, indubitavelmente redundante, com probabilidade 0,54, a qual é praticamente igual à probabilidade do fator textual: 0,52. Por último, o fator circunstancial é quem exerce a influência mais forte: apresenta uma probabilidade 0,67 em favor de SNs totalmente marcados.

Não

há

dúvidas

de

que

o

que

tentamos

captar

345

com a variável Função textual exerce alguma influência sobre a quantidade de marcas plurais no SN, mas não da forma por nós analisada. Análises futuras deverão ser feitas para que se verifique a realidade dos fatos. Cumpre, ainda, observar que esta variável, na linha de raciocínio adotada neste trabalho, sempre se apresenta como uma das últimas selecionadas mesmo na análise atomística dos dados, na sua forma final binária. A Localização do SN em relação à oração foi outra hipótese levantada para também explicar a forte atuação da Configuração sintagmática do SN. Os valores probabilísticos finais a ela atribuídos são praticamente idênticos às percentagens e às probabilidades iniciais, conforme se pode observar na tabela 6.3.3.10.

TABELA 6.3.3.10 LOCALIZAÇÃO DO SN LOCALIZAÇÃO

Apl./Total

%

Prob.9

À esquerda da oração

112/178

=

63

0,61

À direita da oração

349/712

=

49

0,47

Indistinta

23/58

=

40

0,42

Os resultados acima observados são consistentes em termos discursivos: os SNs à esquerda, na posição de tópico ou de centro da informação, são os que mais se apresentam com todas as marcas. Os da direita e os de posição não definida são os que menos se apresentam com todas as marcas. Os resultados são interessantes, mas em nada afetam também a variável Configuração sintagmática. Estes resultados novamente refletem a distribuição lingüística real dos dados. Efetuamos também

346

um cruzamento entre Configuração sintagmática e Localização do SN em relação à oração e concluímos que não existe qualquer correlação entre Configuração sintagmática e a Localização do SN, conforme se pode ver pela tabela 6.3.3.11. TABELA 6.3.3.11 RELAÇÃO ENTRE CONFIGURAÇÃO SINTAGMÁTICA E LOCALIZAÇÃO DO SN CONFIGURAÇÃO

LOCALIZAÇÃO Esquerda

Direita

Indistinta

Total

+art.def. ... +subst.

95 (24%)

286 (72%)

17 ( 4%)

398

-art.def. ... -subst.

25 (12%)

168 (80%)

18 ( 9%)

211

-art.def. ... +subst.

21 (13%)

138 (83%)

7 ( 4%)

166

+art.def. ... -subst.

26 (20%)

94 (73%)

8 ( 6%)

128

+art.def. ... categoria subst..

6 (43%)

5 (36%)

3 (21%)

14

Estrutura Composta

5 (16%)

21 (68%)

5 (16%)

31

178 (19%)

712 (75%)

58 ( 6%)

948

Total

Observando a última linha da tabela 6.3.3.11, podemos verificar que 19% do SNs ocorrem à esquerda da oração, 75% à direita e 6% em posição não definida. Observando-se as ocorrências em função do tipo sintagmático do SN, verifica-se que, com exceção da Configuração [+art.def ... categoria substantivada], com apenas 14 SNs, todos os demais tipos sintagmáticos ocorrem na mesma proporção à esquerda, à direita ou na posição indistinta. O que seria mais interessante saber, num outro momento, é o porquê da predominância de SNs plurais de mais de dois elementos à direita da oração. Seria mais interessante ainda saber se todos os SNs plurais, mesmo aqueles

347

de um só elemento, também ocupam preferencialmente a posição à direita da oração e ver que função discursiva há por detrás desta distribuição. Segundo Naro, em comunicação pessoal, os SNs singulares também ocorrem predominantemente à direita da oração. Afirma ele que isto deve acontecer porque a informação nova vem à direita e não adianta muito ficar falando de coisas velhas. Consideramos oportuno observar que, realmente, todos os SNs classificados por nós como totalmente novos ocorrem à direita. Todavia, eles constituem apenas 27 casos e, além disso, são os menos marcados: 22% (6/27). Os demais (velhos/inferíveis; disponíveis; novos ancorados e não entidades) distribuem-se de maneira regular em função da posição em relação à oração. Todos eles ocorrem mais à direita do que à esquerda da oração. Voltando à correlação entre Configuração sintagmática e Localização do SN, é importante observar também que os percentuais de concordância em função do cruzamento destas duas variáveis mostra novamente a maior relevância do tipo sintagmático do que da Localização do SN, sobre a concordância nominal. A tabela 6.3.3.12, a seguir, percentuais.

evidencia estes

348

TABELA 6.3.3.12 RELAÇÃO ENTRE CONFIGURAÇÃO SINTAGMÁTICA E LOCALIZAÇÃO DO SN CONFIGURAÇÃO

LOCALIZAÇÃO Esquerda %

+art.def. ... +subst. -art.def. ... -subst. -art.def. ... +subst. +art.def. ... -subst. +art.def. ... cat. subst. Estrutura Composta Total

Direita %

Indistinta %

Total %

68 = 72 95 11 = 44 25 15 = 71 21 11 = 42 26 6 =100 6 1 = 20 5

183 = 64 286 44 = 26 168 70 = 51 138 47 = 50 94 3 = 60 5 2= 9 21

10 = 59 17 2 = 11 18 5 = 71 7 3 = 37 8 3 =100 3 0= 0 5

261 = 66 398 57 = 27 211 90 = 54 166 61 = 48 128 12 = 85 14 3 = 10 31

112 = 63 178

349 = 49 712

23 = 40 58

484 = 51 948

Observando-se os percentuais acima e focalizando-se especialmente os quatro primeiros agrupamentos de tipos sintagmáticos, podemos ver que as diferenças entre os diversos fatores destas duas variáveis são bastante regulares. Todavia, enquanto a maior diferença entre os diversos tipos sintagmáticos é da ordem de 48% (59% - 11%) e a menor de ordem de 1% (72%

-

71%),

a

maior

diferença

entre

localização

à

349

esquerda e à direita é da ordem de 20% (71% menos 51%), e a menor, da ordem de -8% (42% menos 50%). Isto mostra que os pesos probabilísticos atribuídos aos diversos fatores da variável Configuração e da variável Localização, bem como a ordem de seleção entre estas duas variáveis, refletem a realidade distribucional dos dados lingüísticos. Portanto, verifica-se realmente que a variável Localização, embora relevante, também não constitui explicação para o forte condicionamento da Configuração sintagmática: ela, além de não excluir a variável Configuração, é a última a ser selecionada dentre as nove variáveis selecionadas. A variável Formalidade é a quinta variável selecionada e, como pudemos ver através dos resultados da tabela 6.3.3.9, apresenta as probabilidades de primeiro nível de análise hierarquicamente iguais às do último, apenas reduzidas em magnitude. Neste caso, os resultados probabilísticos novamente correspondem Às oposições detectadas em termos percentuais: os SNs com o traço da informalidade são menos marcados (0,37) do que os demais (0,63). A diferença em magnitude em termos das percentagens, probabilidades iniciais e probabilidades finais, já vista, ocorre devido à sobreposição também já observada entre Formalidade e Configuração. Como já sabemos, a metodologia estatística por nós usada atribui pesos probabilísticos relativos aos fatores das duas variáveis. A variável Pluralidade do SN foi também selecionada como estatisticamente relevante, em sétimo lugar, e, como as demais, evidencia a sua influência

sobre a quantidade de SNs totalmente marcados sem

350

também provocar qualquer alteração na variável Configuração. Seus resultados encontram-se relacionados na tabela 6.3.3.13, a seguir. TABELA 6.3.3.13 A PLURALIDADE DO SN FATORES Mais de um não inerente Pode ser apenas um Partes do corpo

Apl./Total

%

Prob.1

Prob.9

57/76

=

75

0,76

0,78

424/858

=

49

0,51

0,63

3/14

=

21

0,23

0,14

Observa-se, pelos resultados da tabela acima, que há a mesma hierarquia entre as percentagens, as probabilidades iniciais e finais, modificando-se também a magnitude da diferença probabilística entre os fatores "partes do corpo" e "pode ser apenas um". Os resultados acima, ressalvadas todas as discussões quando da descrição desta variável, mostram que, se o SN se refere a fatos, eventos, entidades que comumente se apresentam no plural - tanto que a forma singular tem significado diverso da forma plural (as minhas raízes não é simplesmente plural de a minha raiz) - ele tende a ter todas as marcas de plural. Os resultados mostram também que, se o SN se refere a partes do corpo, ele tende a não ter todas as marcas de plural. Em verdade, como já tivemos oportunidade de observar, os SNs que se referem a partes do corpo são muitas vezes usados também no singular com o mesmo sentido de plural. É possível em português expressões do tipo: "Rafael, cê tá

351

com a mão suja. Vai lavá a mão pra cumê.", em situações em que as duas mãos estão sujas e que as duas mãos são lavadas: trata-se, neste caso, de posse inerente e, às vezes, de cristalização da estrutura. Os demais SNs, classificados como se referindo a "o que pode ser apenas um", apresentam-se também muito marcados, embora menos do que aqueles cuja referência é "mais de um não inerente". Acreditamos que um estudo das formas singulares relacionadas às formas plurais, com as suas possíveis alterações de significado, e a obtenção de critérios seguros com relação à lexicalização ou cristalização de estruturas seriam de grande valia para o esclarecimento de aspectos que envolvem esta variável. O seu estudo, mesmo intuitivo, nos trouxe uma certeza: o morfema de plural em português não indica simplesmente "mais de um". Às vezes, nem isso ele indica. Tal aspecto merece, pois, um estudo bem mais profundo do que o que apresentamos neste trabalho. Merece destacar aqui o cuidadoso trabalho de Pereira (1984), "Gênero e Número em Português", numa abordagem gerativa. Entre uma série de idéias interessantes, afirma ela que "nem sempre o SN singular tem interpretação singular e pode ter interpretação plural" (p.135), com o que concordamos inteiramente, embora não tenhamos feito este tipo de estudo nos dados do nosso corpus. Pereira chega a sugerir que a questão da escolha entre, por exemplo, muito livro e muitos livros talvez pudesse ser abordada no "arcabouço da teoria da variação". (p.171) É importante relembrar aqui que a seleção dos dados por nós estudados teve uma base sociolingüística, ou seja, interessava-nos estudar

352

os SNs semanticamente plurais que a Gramática tradicional e a Gramática gerativa colocam como subjacentes a um processo formal obrigatório de concordância plural, com base no dialeto padrão. Uma vez que estruturas semanticamente plurais do tipo muito livro são descritas pelas duas abordagens acima como não sujeitas obrigatoriamente ao processo formal de concordância plural, não nos interessava estudá-las no momento. Consideramos, todavia, que seria bastante esclarecedor um estudo sobre (1) os fatores que determinam a escolha de muito livro x muitos livros; lavar o pé x lavar os pés; essa coisa toda x essas coisas todas, por exemplo; (2) o processo de concordância nas construções pluralia tantum; e (3) a influência do traço semântico PLURAL dos coletivos no processo de concordância nominal. Estudando-se estes aspectos, podemos, sem dúvida, entender um pouco mais do fenômeno da concordância e do processo de escolha do plural formal em situações em que se poderia ter o singular formal. Como já adiantamos, a variável Status informacional do SN não foi selecionada como estatisticamente relevante. Mesmo assim, consideramos oportuno fazer algumas observações sobre os seus valores percentuais e probabilísticos. Os resultados percentuais e probabilísticos são apresentados na tabela 6.3.3.14. Na primeira coluna, estão as aplicações e o total de ocorrências; na segunda, as percentagens; na terceira, as probabilidades do nível 1, sem qualquer outra interferência; na quarta, as probabilidades do nível 3 com a interferência da Configuração e, na quinta, e última, as probabilidades do nível 10, com a interferência de todas as variáveis, ponto em que poderia ter ocorrido a sua seleção. Vejamos os resultados da tabela 6.3.3.14.

353

TABELA 6.3.3.14 STATUS INFORMACIONAL DO SN STATUS

PROBABILIDADES Freq. %

N.1

N.3

N.10

Novo em folha

6 = 21 29

0,20

0,31

(0,33)

Novo ancorado

80 = 63 127

0,63

0,56

(0,56)

Novo disponível

39 = 70 56

0,69

0,68

(0,60)

Inferível

34 = 44 69

0,49

0,47

(0,49)

Velho

200 = 44 451

0,44

0,43

(0,50)

Não entidade

125 = 58 216

0,57

0,54

(0,52)

Observando os resultados acima, em especial os percentuais e os probabilísticos do primeiro nível, podemos constatar que os SNs novos-emfolha são os menos marcados (21% ou 0,20), o que contraria afirmações de que a informação nova é a mais codificada (cf. DU BOIS, 1984, p.350 e HAIMAN, 1983, p.802 e 807). Isto não parece aplicar-se de forma coerente para o fenômeno em estudo, pois, se considerarmos os percentuais ou as probabilidades isoladas associadas aos outros SNs classificados como novos - os novos ancorados e os novos disponíveis - , veremos que elas são maiores do que aquelas associadas aos SNs inferíveis e velhos. Outro aspecto

também

intrigante

diz

respeito

ao

compor-

354

tamento dos SNs classificados como não entidades que apresentam índices bastante altos de concordância. No decorrer da análise, as outras variáveis selecionadas, inclusive a variável Configuração, vão fazendo com que os valores probabilísticos da variável Status informacional fiquem bem menos marcados. Os resultados finais que restam continuam ainda a evidenciar uma oposição entre os novos-em-folha e os novos disponíveis, para a qual não temos interpretação lingüística razoável dentro das nossas expectativas, pois desfavorecem a presença de SNs totalmente marcados, exatamente os SNs classificados como novos-em-folha. A metodologia estatística que estamos usando não seleciona os resultados apresentados na tabela 6.3.3.14, porque considera que eles podem ser devidos ao acaso. Acreditamos, todavia, que os resultados aqui relatados não são de todo surpreendentes, uma vez que, nos termos de Poplack 1981, o "S" em questão não carrega sozinho toda a informação de plural (cf. p.61-2). A Animacidade foi outra variável não selecionada. Pelas etapas de análise, verificamos que ela também em nada

interfere na variável

Configuração. Os seus resultados são apresentados na tabela 6.3.3.15.

355

TABELA 6.3.3.15 ANIMACIDADE DO SN ANIMACIDADE

Apl./Total

-humano

315/641

+humano

168/307

%

Prob.9

=

59

(0,47)

=

55

(0,53)

Pelos resultados acima, observa-se que as diferenças percentuais e probabilísticas, mesmo as isoladas, não são muito fortes. Observa-se ainda, mesmo na etapa não selecionada no nível 10, as mesmas diferenças probabilísticas encontradas no primeiro nível: 0,53 para os SNs que têm núcleo humano e 0,47 para os de núcleo não humano. Novamente, considera-se que estes resultados também podem ser devidos ao acaso. Já víramos na análise atomística que as diferenças probabilísticas associadas a esta variável não eram fortes, embora se manifestassem na direção por nós esperada. Nesta nova forma de analisar os dados, ela se mostra estatisticamente não relevante. Antes de concluirmos, vamos apresentar brevemente a descrição e os resultados da variável Processos nesta nova forma de se analisarem os dados. Decidimos testar, nesta fase da análise, se a influência da variável Processos era apenas localizada (ver item 6.2.1) ou se ela se expandia para o SN inteiro. Codificamos então a variável Processos da seguinte forma:

1) SN que apresenta pelo menos um elemento de plural duplo:

356

- os dois últimos jogos

(Fat23,fg,15a).

2) SN que, não apresentando nenhum plural duplo, apresenta pelo menos

um

elemento

do

tipo

terminado

em

-l,

com

alternâncias

morfofonêmicas na forma plural: - as posições muito radicais

(Pac20,mg,25a).

3) SN que, não apresentando nenhum plural duplo ou nenhum plural em -l, apresenta pelo menos um elemento do tipo terminado em -ão, com alternâncias morfofonêmicas na forma plural: - os piores palavrões

(Lau28,fc,43a);

- as associações desorganizadas

(Pac20,mg,25a).

4) SN que, não apresentando nenhum plural duplo ou nenhum plural em -ão ou em -l, apresenta pelo menos um elemento do tipo terminado em R: - os melhores desejos

(Ari30,fg,43a);

- vários jogadores bons

(Sue05,fp,24a).

5) SN que, não apresentando nenhum caso do tipo 1,2 ou 3, apresenta pelo menos um elemento do tipo terminado em -S: - uns quatro meses(Jae25,mg,30a). 6) SN que apresenta todos os elementos com plural regular: - quatro homens armados (Dor29,fg,44a); - meus filho casado

(Edb07,mp,41a).

Os resultados relativos a esta variável são apresentados na tabela 6.3.3.16.

357

TABELA 6.3.3.16 SALIÊNCIA FÔNICA: DIMENSÃO PROCESSOS PROCESSOS

Apl./Total

%

Prob.9

Duplo (olho/ólhos)

9/11

=

82

0,85

-l anel/anéis)

23/33

=

70

0,57

-ão (patrão/patrões)

32/43

=

74

0,37

-R (flor/flores)

32/47

=

68

0,52

-S (mês/meses)

27/34

=

79

0,52

361/780 =

46

0,16

Regular (livro/livros)

Pelos resultados da tabela 6.3.3.16, verificamos que os processos morfofonológicos estendem a sua influência para todos os elementos do SN, ou seja, basta que o SN tenha pelo menos um item com plural não regular para que todos os outros elementos do SN, regulares ou não, tendam a vir totalmente marcados; inversamente, uma seqüência de regulares tende a desfavorecer a marca de plural em todos os elementos do SN, com exceção do primeiro elemento, se for flexionável. Observa-se novamente que

a

influência dos itens em -ão é menor que a influência dos itens em -l.109 Passemos à conclusão da análise do SN sob a atomística.

perspectiva não

358

6.3.4 - Conclusão

A motivação principal do estudo do SN sob uma perspectiva não atomística era a de verificar a existência de outras explicações não estruturais do tipo "coesão sintagmática" entre os elementos do SN. Ao lado do estudo das diversas variáveis levantadas como hipóteses de explicação da variável Configuração sintagmática do SN, estudamos também a Pluralidade do contexto e os Processos morfofonológicos de formação do plural. Já vimos que estas duas variáveis exercem influência sobre a concordância também numa perspectiva não atomística e vimos, além disso, que a variável Pluralidade é a mais forte das três em questão. Sobre a questão da Pluralidade do contexto, poder-se-ia levantar uma dúvida quanto à veracidade de sua influência, uma vez que estamos trabalhando com grupos de falantes de três níveis de escolarização. Explicando: se as pessoas de maior nível de escolarização têm maiores índices de concordância e se as pessoas de menor nível de escolarização tendem a ter menores índices de concordância, a Pluralidade do contexto poderia

ser um mero artefato de junção de grupos homogêneos

internamente, mas de comportamento distinto (cf. BICKERTON, 1977, p.4775; 488-9; LABOV, 1975a, p. 223-59; LABOV, 1975b, p.65-129; GUY, 1980, p.1-35). Ainda explicando: o fator [+pluralidade] do contexto poderia ser constituído de dados de falantes mais escolarizados e o fator [pluralidade], de dados de falantes menos escolarizados. Tais dúvidas não têm, todavia, o seu lugar neste estudo. Antes de agruparmos os falantes, vimos que, à semelhança do funcionamento da variável Configu-

359

ração, as diferenças entre os diversos falantes, com relação à variável Pluralidade do contexto, eram também mais quantitativas do que propriamente qualitativas, ou seja, as diferenças ocorriam apenas na probabilidade global de aplicação da regra e não com relação aos pesos probabilísticos dos fatores e à hierarquia entre eles. Para elucidar esta questão, apresentamos a tabela 6.3.3.17, abaixo, com resultados para esta variável em função dos três níveis de escolarização de nossos falantes: primário, ginasial e colegial. Devido ao fracionamento natural dos dados, os oito fatores da variável Pluralidade do contexto encontram-se amalgamados em função das três grandes oposições detectadas, as quais se relacionam aos contextos de [+pluralidade], [-pluralidade] e misto/isolado.

TABELA 6.3.3.17 PLURALIDADE DO CONTEXTO POR ESCOLARIZAÇÃO FATORES

Plural

FALANTES

F. P.

Não Plural

F. P.

Isolado ou Misto

F. P.

Todos

F. P.

Primário

Ginasial

Colegial

Todos

33= 59% 56 0,70

54= 80% 67 0,79

64= 85% 75 0,76

170= 77% 220 0,73

9= 17% 52 0,31

9= 22% 40 0,27

5= 26% 19 0,21

23= 21% 112 0,28

67= 33% 203 0,48

88= 44% 200 0,41

113= 62% 181 0,53

291= 46% 616 0,48

112= 35% 323 0,30

155= 50% 311 0,55

217= 66% 314 0,65

484= 51% 948 0,51

360

Pelos resultados apresentados na página anterior, podemos ver que todos os agrupamentos de falantes, independentemente do seu grau de escolarização,

apresentam

SNs

mais

marcados

nos

ambientes

de

[+pluralidade] do que nos de [-pluralidade]. Respectivamente, para os falantes do primário, temos as probabilidades 0,70 e 0,31; para os do ginasial, 0,79 e 0,27; para os do colegial, 0,76 e 0,21. Os SNs em contexto misto ou os SNs isolados se apresentam, também para os três agrupamentos de falantes, com percentuais de concordância intermediária: primário, 0,48; ginasial, 0,41 e colegial, 0,53. Os resultados probabilísticos atribuídos aos três fatores dos três grupos de falantes são extremamente semelhantes entre si e, conseqüentemente, extremamente semelhantes aos resultados de todos os falantes que se encontram nas últimas colunas da tabela. O número total de ocorrências e o número total de dados não constitui a soma exata dos subgrupos, porque estes, quando analisados separadamente, apresentam alguns fatores com comportamento categórico, devido ao fracionamento natural dos dados. Conclui-se, então, que esta variável não constitui um artefato de junção

de

falantes

de

comportamento

distinto.

Sua

influência

é

absolutamente sistemática. As diferenças entre os agrupamentos de falantes são, pois, indubitavelmente, quantitativas e não qualitativas, no mínimo com respeito à variável Pluralidade do contexto e à Configuração sintagmática, as duas variáveis lingüísticas mais fortes. Pelos resultados nas últimas linhas da tabela, percebem-se as diferenças quantitativas, diretamente proporcionais aos níveis de escolarização.

361

Voltando à motivação inicial do estudo do SN sob uma perspectiva global, que era a de entender melhor a relação entre Classe gramatical e Posição dos elementos do SN, buscando novas explicações não formais, pudemos verificar que nenhuma das hipóteses levantadas - o que resultou na codificação de seis outras variáveis - mostrou-se significativa para explicar a forte influência da Relação entre os elementos do SN, numa perspectiva atomística, e da Configuração sintagmática do SN, numa perspectiva global. As variáveis Formalidade do SN, Pluralidade do SN e Localização do SN , com resultados consistentes, têm as suas próprias explicações. Conforme já colocamos no item 6.2.5.2, a atuação da Formalidade se explica pelo fato de a Formalidade léxica ser índice do grau de formalidade da situação da conversa: quanto mais informais os itens léxicos mais informalidade discursiva e quanto mais informalidade discursiva menor o número de marcas formais de plural no SN, pois as pressões sociais não estão exercendo a sua forte influência no sentido de inibir formas estigmatizadas. A atuação da Pluralidade do SN tem a sua explicação em termos da relação semântica entre as formas singulares e plurais, no sentido de as formas plurais serem ou não diferentes das singulares em algo mais do que a simples relação mais de um. É possível, também, que haja formas plurais do tipo pelas minhas próprias mãos, nos seus devidos lugares, os valores humanos, as minhas raízes, os meus atos etc., que estejam caminhando para

uma

cristalização

e

que,

portanto,

são

dadas

362

"prontas", já na forma "plural", sem que aí interfira a liberdade do falante, que pode ser vista como uma das causas da variação. A atuação da Localização do SN, com os SNs à esquerda favorecendo o índice de SNs com todas as marcas e os demais desfavorecendo-os, conforme já colocamos, tem a sua explicação em termos discursivos. A posição à esquerda é a posição tópica ou de centralidade, a de maior evidência e, por isto, sempre mais marcada. Esta atuação não é das mais fortes no sentido estatístico do termo, mas se mostra relevante. Neste ponto do trabalho, é interessante observar novamente que o Status informacional do SN nem foi considerado como estatisticamente relevante. Isto é, no mínimo, coerente com as colocações de Du Bois, no sentido de que há línguas mais orientadas para a "topicidade", línguas não ergativas, e há línguas mais orientadas para "o fluxo da informação", as línguas ergativas (cf. 1984, p.353-63). O Português tem sido considerado uma língua muito tópica (cf., novamente, PONTES, 1986 e PONTES, 1987) e esta sua característica tem se mostrado mais relevante nas explicações de fenômenos diversos do que o próprio Status informacional do SN (cf. MOLLICA, 1986, p.365-8; BRAGA, 1986, p.442; NARO & VOTRE, 1986, p.459; 461 e 469). Aliado a este aspecto, já observamos que o grau de novidade do morfema de plural, exceto daquele que ocupa a primeira posição, é bastante relativo, pois todos os SNs analisados têm, no mínimo, uma marca formal ou semântica de plural. Algumas reflexões adicionais sobre a Configuração sintagmática do SN ainda merecem ser feitas. Em primeiro lugar, merece menção a força do artigo definido, junto ou não ao quantificador todo anteposto ao núcleo do SN, favorecendo o

363

índice de marcas de plural. Já é também conhecido na literatura lingüística que o traço [+definido], aqui especificamente o do artigo definido, é discursivamente marcado e, como tal, coerentemente com a linha geral de nosso trabalho, favorece a presença de marcas plurais. Em segundo lugar, é bom relembrar que a influência favorecedora do substantivo e a desfavorecedora do não substantivo no final do SN já foi explicada pela existência da "coesão sintagmática" associada ao Princípio da Iconicidade, nos moldes colocados no item 6.2.2. Todavia, necessitamos rediscutir este ponto com base num fato novo, que diz respeito à influência altamente desfavorecedora da estrutura composta do SN. O que define uma estrutura composta é exatamente um grau maior de coesão entre os seus elementos constitutivos, que podem, com o tempo, até deixar de apresentar a idéia de composto, aglutinando-se e passando a serem

vistos

como

uma

única

forma.

Então,

este

caso

quebra,

aparentemente, a relação diretamente proporcional estabelecida por nós: quanto mais coesão, mais marcas; e quanto menos coesão, menos marcas. Embora o comportamento dos compostos pareça contraditório, ou no mínimo paradoxal, é possível verificar que isto não se aplica especificamente ao Português. Segundo Cornish (1986), esta situação também ocorre nos compostos de Francês, onde o alto grau de coesão é marcado pela falta de concordância formal (cf. p.187), como em grand-mére, que não apresenta concordância de gênero na forma grande-mére (cf. p.187).

364

É interessante apresentar aqui a exposição completa de Cornish (1986) a respeito da noção de distância estrutural que, segundo ele, (...) é definível em termos da noção de coesão, que em si mesma é um conceito mais relativo do que absoluto. Distância estrutural se refere ao grau em que dois elementos estão integrados em termos de alguma relação gramático-semântica dentro de uma estrutura de nível mais alto. (CORNISH, 1986, p.187)110 Então, segundo Cornish, podem-se estabelecer três níveis de distância estrutural. Para o primeiro, que se aplica aos compostos, ele coloca o seguinte: o grau mais baixo de distância estrutural que existe entre dois elementos é representado pela dependência mútua de morfemas dentro da palavra, entre aos quais não é possível inserir qualquer elemento. (...) Este status é marcado pela falta de concordância formal (...). (CORNISH, 1986, p.187)111 O segundo grau mais baixo de distância entre dois elementos envolve casos de artigos e outros determinantes antepostos que "(...) podem somente preceder o seu núcleo sendo a sua ordem mútua altamente restringida (...)." (p.187).112 Este grau de coesão pressupõe a indicação (...) de relações de concordância entre dois elementos. A concordância obtida entre os dois elementos que manifestam este grau de distância estrutural é sempre (como esperado) formal (i.e., puramente gramatical) e não de natureza semântico-referencial. (CORNISH, 1986, p.187)113 Continuando, afirma também que o terceiro grau de distância estrutural é aquele representado pelas relações obtidas por sintagmas dentro das orações. As relações obtidas entre sujeitos e predicados (...) são refletidas em sua grande propensão

365

para a concordância em termos de traços semânticoreferenciais relevantes de seus controladores. (CORNISH, 1986, p.187)114

Resumindo, o primeiro nível de distância

estrutural, com o grau

máximo de coesão, se refere a palavras compostas, em que a impossibilidade de inserir qualquer elemento entre os dois constituintes dos compostos se reflete na falta de concordância. O segundo nível de distância estrutural, coesão mediana, envolve a relação interna ao SN, no que diz respeito aos artigos e outros determinantes antepostos ao núcleo, com ordem bem rígida. Neste caso, a concordância marca este grau de distância estrutural, mas é puramente gramatical. O terceiro nível de distância estrutural existe na relação entre os sintagmas dentro de uma mesma cláusula, que é marcado não pela concordância gramatical, mas pela concordância semântico-referencial. Se tomarmos a concordância como um mecanismo que estabelece harmonia formal, como um mecanismo gramatical, como temos feito até o presente momento, poderíamos dizer que o terceiro nível de distância estrutural descrito por Cornish - o de menor coesão - apresenta também menor concordância formal, ou no mínimo, conflito de concordância formal. Em verdade, os extremos no eixo da coesão não estabelecem concordância formal ou estabelecem-na menos, seja o grau de coesão 1, o caso dos compostos, seja o grau de coesão 3, ainda não visto neste estudo. O grau de coesão 1 explica, portanto, o baixo índice de marcas de concordância formal nos SNs de estrutura composta e o grau de coesão 3 prevê um baixo índice de concordância formal entre, por exemplo, o sujeito e o predicativo. Ao estudarmos, no futuro, a relação de concordância entre o sujeito e o predicativo, poderemos verificar o que ocorrerá no terceiro nível de

366

distância estrutural estabelecido por Cornish (1986). Exemplificando com a concordância do gênero (cf. p.208), Cornish coloca que estas relações "são refletidas por sua grande propensão para a concordância em termos de traços semânticos-referenciais de seus controladores" (p.188),115 em vez de propensão à concordância gramatical. Acreditamos que, para a concordância de número, a previsão que podemos fazer é a de que a relação entre sujeito e predicativo será fortemente marcada pela ausência de marcas formais no predicativo, em direção à nossa colocação de que o menor grau de coesão sintagmática é marcado pelo menor número de marcas formais. O estudo que fizemos até o presente momento se situa no segundo nível de distância estrutural conforme caracterizado por Cornish, onde, segundo ele, ocorre a concordância puramente gramatical. Vimos, todavia, que, dentro do âmbito do SN, os elementos antepostos ao núcleo apresentam entre si e o núcleo uma relação mais coesa do que a que é estabelecida entre os elementos pospostos e o núcleo correspondente. É, portanto, possível postular a existência de dois graus de coesão dentro do segundo nível de distância estrutural estabelecido por Cornish, com base exatamente na possibilidade de se inserir ou não elementos entre os constituintes do SN. Vimos que somente os constituintes pospostos ao núcleo admitem a possibilidade de inserção de elementos entre eles e os seus núcleos correspondentes e, coerentemente, são estes constituintes

367

os menos marcados. Aqueles constituintes que não admitem ser separados de seus núcleos - os antepostos - são os mais marcados. Desta forma, estabelece-se uma relação direta entre grau de coesão e número de marcas no segundo nível de distância estrutural dentro da escala estabelecida por Cornish. O próprio Cornish fala da diferença de coesão existente entre o adjetivo anteposto ou posposto ao seu núcleo, no Francês, evidenciando-se maior coesão entre o adjetivo anteposto ao núcleo do SN do que entre o adjetivo posposto a este mesmo núcleo; sem, contudo, retomar estas idéias, ao estabelecer os graus de distância estrutural, correlacionados ao grau de coesão e à presença/ausência de concordância formal ou semânticoreferencial como índices de tais aspectos coesivos (cf. 1986, p.183-4).

Resumindo, consideramos que o traço [+definido], discursivamente marcado, e o Princípio da Coesão Sintagmática, vinculado ao Princípio da Iconicidade nos termos de Haiman (1983), explicam a forte influência da Configuração sintagmática sobre a incidência de SNs com todas as marcas de plural. Restam, em último lugar, algumas observações sobre a freqüência das configurações sintagmáticas analisadas. Nem todas as configurações sintagmáticas têm a mesma freqüência de ocorrência. As tabelas 6.3.3.18 e 6.3.3.19 apresentam a distribuição da configuração sintagmática dos SNs que têm como último elemento um substantivo, com altas e baixas freqüências respectivamente, e as tabelas 6.3.3.20 e 6.3.3.21 apresentam as mesmas

distribuições

para

os

SNs

que

têm

um

não

subs-

368

tantivo na sua última posição. Como o maior percentual de ocorrência de um tipo sintagmático específico é da ordem de 14% (136/948), na estrutura [art.def. + poss. +subst.] (os meus filhos), consideramos freqüência alta até 1% de ocorrência e freqüência baixa, um percentual menor do que 1%. Vejamos as tabelas nas páginas seguintes.

369

TABELA 6.3.3.18 TIPOS SINTAGMÁTICOS DE BAIXA FREQÜÊNCIA EM SNS COM A CATEGORIA SUBSTANTIVO NA TERCEIRA POSIÇÃO CONFIGURAÇÃO 1) quant. (todas

+

2) art.def. (nos 3) uns (uns

1/2

=

50

+ ord. primeiros

+

subst. dia)

1/3

=

33

+

+

subst. filhos)

3/3

= 100

4/6

=

subst. lojas)

1/1

= 100

+ subst. trabalhos)

1/3

=

33

subst.

1/3

=

33

12/23

=

52

adj. bons {ind.} {adj.2} outros certas outras

5) uns (umas

+

6) dem. (esses

+ adj. pequenos

7) dem.

TOTAL

ord. segundas

+

adj.2 próprios

67

subst. colégios) palavras) coisa) +

{poss.} {ind.} meus outras

(esses (essas 8) poss. (meus

%

+ subst. decisões)

4) uns ind (uns (umas (algumas

dem. essas

Apl./Total

netos) vez) +

subst. irmão)

370

TABELA 6.3.3.19 TIPOS SINTAGMÁTICOS DE ALTA FREQÜÊNCIA EM SNS COM A CATEGORIA SUBSTANTIVO NA TERCEIRA POSIÇÃO CONFIGURAÇÃO 1) quant. (todos

+

2) art.def. (os

+

3) art.def.

art.def. os poss. meus {ind.} {adj.2} outros mesmos

(os (os

Apl./Total

%

+ subst. temperos)

62/78

= 82

+

95/136

= 70

36/51

= 71

14/26

= 54

subst. filhos) subst.

colégios) direitos)

4) art.def. (as

+

adj. más

+ subst. empregadas)

5) art.def. (as

+

card. duas

+

subst. coisas)

46/92

= 50

6) uns (uns

+

card. três

+

subst. meses)

65/122

= 53

7) dem. (esses

+

card. trinta

+

subst. dia)

6/11

= 55

8) poss. (meus

+

card. doze

+

subst. filhos)

6/13

= 46

9) art.def. (os

+

... dois

+ ... + subst. melhores time)

9/12

= 75

TOTAL

339/541

Pela comparação dos tipos sintagmáticos das tabelas 6.3.3.19, é fácil verificar, por exemplo,

= 63

6.3.3.18 e

que os SNs que terminam em

substantivo, se combinados com [quant + art.def.]; [art.def. + poss. ou + {ind./adj.2/adj. e card.}] (casos 1, 2, 3, 4 e 5 da tabela 6.3.3.19), são de alta freqüência, mas existe restrição de ocorrência entre [quant. + dem.] e

371

[não art.def. + {adj./adj.2/ind./poss.}] (casos 1, 3, 4, 5, 6, 7 e 8 da tabela 6.3.3.18). Não artigo definido só ocorre com substantivo, em níveis altos de freqüência, se for mediado por um cardinal. Trata-se dos casos 6 a 8 da tabela 6.3.3.19, especialmente do caso de número 6. As tabelas 6.3.3.20 e 6.3.3.21, a seguir, mostram também distribuições interessantes.

TABELA 6.3.3.20 TIPOS SINTAGMÁTICOS DE BAIXA FREQÜÊNCIA EM SNS COM A CATEGORIA NÃO-SUBSTANTIVO NA TERCEIRA POSIÇÃO CONFIGURAÇÃO

Apl./Total

%

1) poss. (seus

+ subst. lançamento

+ adj. preciso)

1/5

= 20

2) poss. (meus

+

+

quant. todo)

2/6

= 33

3) art.def. (os

+ subst. camarada

+

poss. meu)

0/1

=

0

4) ind. (alguns

+ subst. + poss. companhero meu)

0/2

=

0

5) quant. (todas

+

subst. amiga

+ poss. minha)

0/1

=

0

6) uns (uns

+

subst. colega

+

poss. meu)

1/3

= 33

7) card. (duas

+

subst. amigas

+

poss. minha)

1/3

=

33

8) -art.def. (umas

+

...+subst. vinte telas

0/3

=

0

7/24

= 29

TOTAL

subst. filhos

-subst. pintada)

372

TABELA 6.3.3.21 TIPOS SINTAGMÁTICOS DE ALTA FREQÜÊNCIA EM SNS COM A CATEGORIA NÃO-SUBSTANTIVO NA TERCEIRA POSIÇÃO CONFIGURAÇÃO

Apl./Total

%

1) art.def. (os

+

subst. + adj. irmãos mais novos)

45/92

= 49

2) uns (umas (umas

+

subst. + adj. épocas mais fraca) borracha grande)

10/30

= 33

16/44

= 36

8/17

= 47

5/23

= 22

7/18

= 39

13/80

= 16

7/11

= 63

111/315

= 35

3) dem. + subst. + adj. (aqueles vocabulário meio pesado) (aquelas igreja famosa) 4) ind. (muitos (muitas

+

subst. colégio coisas

+ adj. público) boas)

5) card. (duas (três

+

subst. + adj. lâmpada acesa) crianças maravilhosas)

6) art.def. (os (os

+ subst. problemas direito

+

quant. todo) todo)

7) dem. + subst. (aqueles tomates (esses degrau (essas coisa

+ todo todos) todo) toda)

8) art.def. (as (os

-subst. marcada) todos)

TOTAL

+ ... subst. perna toda meus filhos

Com base nas tabelas 6.3.3.20 e 6.3.3.21, podemos ver que os tipos consistentemente menos freqüentes são os de possessivo na última posição: casos 3, 4, 5, 6 e 7, da tabela 6.3.3.20, especialmente quando o possessivo

373

se conjuga com o artigo definido ou com o quantificador na primeira posição: casos 3 e 5 desta mesma tabela. Os tipos mais freqüentes podem ser vistos nos números 1 e 7 da tabela 6.3.3.21, quando se conjugam, [art.def ... adj.1] e [dem. ... quant.]. Além disso, consideramos interessante observar que os tipos sintagmáticos de alta freqüência que têm em sua última posição um não substantivo combinam-se mais com não artigos definidos na primeira posição (20%: 194/948) do que com artigos definidos também na primeira posição (13%: 121/948). No caso dos substantivos, esta situação é exatamente inversa e ainda mais polarizada. Com artigos definidos, temos 40% (383/948) dos casos e com não artigos definidos, 16% (148/948). Além do mais, enquanto SNs do tipo [art.def. + subst. + poss.] (os camarada meu) são praticamente inexistentes, o seu correlato [art.def. + poss. + subst.] (os meus filhos) é o tipo sintagmático de freqüência mais alta: caso 2 da tabela 6.3.3.19, com 136 ocorrências, num total de 948 dados, ou seja, 14 do total. Com base nestas observações, podemos nos perguntar por que há restrição de ocorrência entre, por exemplo: 1) demonstrativo + adjetivo + substantivo (esses

pequenos

trabalhos)? 2) quantificador + demonstrativo + substantivo (todas essas decisões)? 3) indefinido + indefinido + substantivo (algumas outras coisa)? 4) artigo definido + substantivo + possessivo (os camarada meu)?

374

Será que estas restrições de ocorrência são explicadas a nível estritamente semântico em termos de incompatibilidade de traços ou será que, embora estas estruturas existam, elas não exercem função discursiva alguma e por tais razões não ocorrem no discurso? Este é um estudo que precisa ser empreendido, principalmente num momento em que há duas posições teóricas em jogo defendendo duas posições bem distintas: uma que afirma que as estruturas existem e que, então, são usadas para uma determinada função e outra, no pólo oposto, que afirma que o que existe é a função, a qual é a determinadora das estruturas. Conforme já vimos, estas duas posições teóricas, por enquanto antagônicas, são rotuladas por Du Bois de, respectivamente, Estruturalismo autônomo e Funcionalismo transparente (cf. DU BOIS, 1984, p.342-47). Não podemos responder agora a estas indagações, porque o caminho que tomamos no estudo dos dados que temos em mãos - o da Sociolingüística Quantitativa - nos levou sempre a olhar mais detidamente para os dados de alta freqüência do que para os de baixa. Dentro desta perspectiva, são aqueles dados e não estes que são mais interessantes no sentido de se evidenciarem as grandes tendências variáveis de uma língua, passíveis de sistematização. Mas, ao analisarmos os nossos dados, não pudemos deixar de ver a peculiaridade das distribuições envolvendo a Configuração sintagmática dos SNs com mais de dois elementos. No tipo de dado que analisamos, pudemos ver ainda que a Configuração [substantivo + adjetivo + adjetivo] (problemas existenciais muito atual) ocorre apenas uma única vez, o que nos mostra que esta configuração é praticamente inexistente, embora seja prevista em termos gerativos.

375

Mesmo outras construções previstas por uma gramática do tipo gerativo jamais foram encontradas em nossos dados, como a possibilidade de uma construção que combine adjetivo anteposto com adjetivo posposto do tipo problemáticas comunidades agrícolas ou do tipo que combine dois adjetivos antepostos a elegante velha senhora (cf. LEMLE, 1979, p.7 e 9). Além do mais, como já vimos, a classe de adjetivos que ocorre antes do substantivo, nos dados com os quais trabalhamos, é altamente restrita. Ela é constituída apenas dos "avaliativos", ou

simplesmente "intensificadores",

que fazem parte de um inventário fechado, enquanto os adjetivos que podem ocorrer pospostos aos substantivos são de subclasses diferentes e encontram-se num inventário aberto, embora finito. O mais interessante é que tal comportamento não é específico do Português, pois o Francês, segundo Cornish, pelo menos no que toca ao adjetivo anteposto, apresenta também semelhante configuração (cf. CORNISH, 1986, p.184). As últimas observações que acabamos de fazer nos levam a ver que o estudo da Configuração sintagmática do SN não tem importância apenas com referência à concordância de número entre os elementos nominais, mas pode trazer mais esclarecimentos sobre a própria forma da língua se estruturar através de funções discursivas diversas ou sobre como ela usa as diversas possibilidades estruturais para funções discursivas diferentes.

376

6.4 - Conclusão

A análise da concordância gramatical de número entre os elementos do sintagma nominal em Português sob a perspectiva atomística e não atomística mostrou-se pertinente. As variáveis Saliência fônica, Relação entre os elementos do SN/Configuração

sintagmática

do

SN,

Marcas

precedentes

e

posição/Pluralidade do contexto e Formalidade léxica/Formalidade do SN atuam sobre os elementos do SN e sobre o SN como um todo, evidenciandose definitivamente as tendências sistemáticas da variação. Há outras variáveis que só atuam de forma atomística ou só de forma global. Do ponto de vista atomístico, temos, por exemplo, a influência do contexto fonético/fonológico seguinte; e, do ponto de vista global, temos a localização do SN em relação à oração e a Pluralidade do SN, com influências positivas. O Status informacional do SN - também uma propriedade global - não se mostrou relevante. Dúvidas sobre a definição de seus fatores e sobre a conseqüente codificação podem ser levantadas. Acreditamos, todavia, que a sua influência realmente inexiste. Pesquisas futuras poderão confirmar ou não os resultados por nós obtidos. A Função resumitiva ou a Função textual a nível atomístico e global, respectivamente, não apresentou comportamento consistente. Do ponto de vista atomístico, binariamente codificada, apresentou sempre comportamento uniforme. Mas, do ponto de vista não atomístico, com uma codificação mais detalhada, não apresentou resultados finais interessantes. Isto pode evidenciar

que:

(1)

os

critérios

de

classificação

não

377

foram precisos e, por isto, não captamos as regularidades lingüísticas existentes; (2) ou este tipo de variável não tem a relevância lingüística que julgávamos ter. De atuação também não consistente revelou-se a variável Animacidade: a nível atomístico, a oposição, embora regular, já se mostrava fraca; e, a nível global, não se mostrou estatisticamente pertinente. Novos estudos terão oportunidade de corroborar ou não as nossas conclusões. Dentro da nossa própria amostra, o estudo dos SNs de dois constituintes, por exemplo, é um campo fértil para testar a generalidade das conclusões não atomísticas. Estamos assumindo que a análise que fizemos se aplica com precisão a todo e qualquer SN plural do Português falado no Brasil. Vamos passar agora ao capítulo 7, no qual fazemos a apresentação de fenômenos de línguas diversas, bem como a apresentação de diversos fenômenos do próprio Português,

que evidenciam

um condicionamento

comum, o qual mostra, nos termos de Schiffrin, a tendência de formas gramaticais particulares ocorrerem juntas (cf. 1981, p.51-5).

378

7 - O PAPEL DO LINGÜÍSTICA

PROCESSAMENTO

NA

VARIAÇÃO

7.1 - Introdução

Para explicarmos a influência das variáveis Marcas precedentes, a nível do sintagma nominal, e Pluralidade do contexto, a nível das relações entre os diversos sintagmas nominais, lançamos mão da influência que o processamento exerce sobre o uso das formas lingüísticas. A moda de uma forma geral, quer no vestuário, quer na configuração arquitetônica dos prédios, reflete bem como o ser humano é influenciado "pelas semelhanças". A própria necessidade da formação de grupos reflete o aspecto do "ser parecido". Estamos, então, invocando uma força de motivação externa (cf. DU BOIS, 1984, p.353) para explicar, não a estrutura da língua, mas o funcionamento das estruturas no seu uso efetivo. A utilização de princípios gerais que envolvem a forma da mente humana operar na colocação de hipóteses sobre a estruturação das unidades lingüísticas não constitui nenhuma novidade. As hipóteses da análise fonológica de linha estruturalista servem como uma boa ilustração (cf. TROUBETZKOY, 1976, p.33-55;

PIKE, 1976, p.67-173 e CÂMARA JR.,

1977, p.29-45). Coloca-se,

por

exemplo,

que,

se

dois

sons

foneticamente

semelhantes estiverem em distribuição complementar, eles devem ser considerados como variantes combinatórias ou condicionadas de um só fonema. Diante disto, normalmente se pergunta: Por que? E normalmente se responde: é porque onde um ocorre o outro não ocorre, ou porque eles se

379

excluem nos mesmos ambientes, e a distribuição dos dois configura a distribuição completa em função dos seus ambientes de ocorrência (cf. TROUBETZKOY, 1976, p.50-2 e PIKE, 1976, p.84-104). Em verdade, tais respostas não constituem respostas, mas simplesmente paráfrases da primeira colocação. Estas paráfrases ocorrem porque a resposta não está na língua, mas está na forma da mente humana operar, ou seja, duas entidades parecidas que nunca são vistas juntas no mesmo ambiente são sempre captadas pela mente humana como uma só. Esta forma da mente operar se manifesta na grande confusão que se faz entre irmãos parecidos nunca vistos juntos e se verifica também no uso amplo que os filmes ou telenovelas fazem da "dupla personalidade" ou de "duas entidades" que parecem uma, até que se desfaça o suspense, através da "distribuição equivalente com oposição" ou através da "distribuição análoga", ou da efetiva demonstração da "distribuição complementar". Então, dois sons foneticamente semelhantes que estão em distribuição complementar são variantes ou alofones condicionados de um só fonema (ou de uma só entidade fonológica), porque é assim que a nossa mente os capta: como uma só entidade, com realizações diferentes. Em outras palavras, a explicação

é externa à língua e não "tem caráter

estritamente gramatical" (cf. LOBATO, 1986, p.97). Mas como bem coloca Du Bois, uma força funcional externa ao sistema, uma vez evocada, não pode ser simplesmente abandonada. Volumes do então chamado funcionalismo estão repletas de apelos ingênuos à percepção, cognição ou outros domínios funcionais externos ao sistema, que são usados para "explicar" porque a língua em questão simplesmente tem de ter uma particularidade gramati-

380

cal - quando num momento de reflexão posterior mostrarse-ia que uma outra língua bem conhecida, ou mesmo até o dialeto mais próximo, tem uma estrutura gramatical diametralmente oposta no parâmetro relevante. (p. 353)116

Pretendemos agora evidenciar que lançar mão da força externa do processamento na produção de formas lingüísticas específicas não constitui um apelo ad hoc e nem um apelo "ingênuo" que será rapidamente abandonado.

Temos

evidências

deste

tipo

de

influência

sobre

o

funcionamento do Espanhol, do Inglês, do Francês, do Quechua, do Crioulo Caboverdiano e do Português, o que nos autoriza a considerá-la como uma influência geral. Na conclusão deste capítulo, pretendemos discutir ainda dois outros aspectos: um diz respeito à interdependência entre duas ocorrências de uma mesma variável dependente, nos termos colocados por Sankoff & Laberge (1978), e o outro se refere à questão das "motivações em competição", conforme discutido por Du Bois (1984). Antes da apresentação das evidências em questão, é importante fazermos as seguintes considerações: 1) Todos os trabalhos a serem citados utilizaram dados do desempenho e não dados da intuição lingüística e todos, exceto dois, fazem estudos dentro da linha da Sociolingüística Quantitativa ou

Teoria da

Variação. 2) A variável a ser focalizada recebe diversos rótulos, mas, quando estivermos falando sobre ela de forma geral, usaremos o rótulo Paralelismo formal, por ser este o aspecto comum a todos os trabalhos, incluindo os não variacionistas.

381

3) A caracterização precisa da amostra de cada estudo não será aqui explicitada, por este aspecto não ser relevante para as três questões em jogo. 4) Os estudos apresentados agrupam-se em primeiro plano por tipos de língua: Espanhol, Francês, Inglês, Quechua, Crioulo Caboverdiano e Português e, em último, pela época de realização: de 1977 a 1987.

7.2 - Evidências da força do processamento no uso lingüístico

7.2.1 - No Espanhol

o primeiro trabalho que temos em mãos no qual se aborda a influência da variável agora denominada de Paralelismo formal é o de Poplack,117 intitulado "The notion of the plural in Puerto Rican Spanish: competing constraints on /s/ deletion", publicado em Locating Language in Time, Space and Society, em 1980 (1980a), livro organizado por William Labov, já citado inúmeras vezes no corpo deste trabalho. Em outras publicações suas, Poplack retoma esta variável, sempre sob a denominação de Posição do elemento na seqüência e Marcas precedentes para comparações e conclusões diversas. Podemos, portanto, localizá-la em pelo menos mais dois artigos, já referenciados no capítulo 6, os quais são: (1) "Deletion and disambiguation in Puerto Rican Spanish", publicado também em 1980 (1980b), na revista Language, volume 56, número 2 e (2) "Mortal phonemes as plural morphemes", publicado em 1981, em Variation omnibus.

382

Como já sabemos, nos três artigos em questão, Poplack discute a hipótese funcionalista de Kiparsky, afirmando com base em seus resultados que, embora fatores funcionais - rotulados de fatores informacionais em 1981 - desempenhem papel regular sobre o cancelamento do /s/ no Espanhol de Porto Rico, seu efeito é fraco e é menor do que o efeito de fatores não informacionais. Entre estes, destaca-se a atuação da Posição e Marcas precedentes, no sentido de que a conclusão mais interessante é de que marcas conduzem a marcas e zeros conduzem a zeros (cf. 1980a, p.63-4; 1980b, p.376-83 e 1981, p.61-2). Segundo Poplack, o efeito da Posição e Marcas precedentes da forma em que se dá parece se vincular à aplicação da teoria do menor esforço de Martinet (cf. 1980a, p.65), colocada em 1962, nos seguintes termos: Concordância é redundância, e ao contrário do que seria esperado, redundância resulta, como uma regra, do menor esforço: as pessoas não se importam em repetir se o esforço mental é por isto reduzido. (cf. MARTINET, 1962, p.55)118

No primeiro texto de 1980, Poplack já atribui, portanto, o fenômeno em foco a uma questão de processamento.

No segundo texto de 1980,

através de nota de rodapé, ela novamente se refere a esta colocação de Martinet, sem, todavia, considerá-la o centro da questão. A nosso ver, isto se coloca desta forma porque, em verdade, Poplack queria apresentar evidências para a hipótese funcionalista de Kiparsky e não para a de Martinet. Neste segundo texto, ela coloca, explicitamente, que a variável Posição e Marcas precedentes funciona de uma forma diferente do que seria esperado (cf. POPLACK, 1980b, p.377).

383

Em todos os seus textos, Poplack considera que estamos diante de um caso claro em que os efeitos estruturais e informacionais desempenham papéis competitivos, tendo cuidado em apresentar fartas evidências de que, embora a influência de fatores "funcionais ou informacionais" não seja tão forte, o falante sempre tem uma forma de desambiguar a informação, a qual nunca é perdida (cf., por exemplo, POPLACK, 1981, p.62).

7.2.2 - No Inglês Em 1977, Weiner & Labov realizaram um estudo quantitativo das variáveis que determinam a seleção da passiva sem agente, em vez da ativa, em amostras de fala espontânea de falantes do Inglês, com características sociais diferenciadas.119 Dentre outras variáveis estudadas, como a influência da oposição Velho x Novo, Weiner & Labov verificam o efeito da estrutura superficial (p.32), observando se o objeto lógico, ou seja, o sujeito da passiva, era ou não co-referencial ao SN na posição de sujeito da oração anterior. Os dois autores concluem que tal paralelismo da estrutura superficial parece ser um fator poderoso na determinação da escolha da ativa ou passiva, e passivas são favorecidas quando o objeto lógico se move para uma posição paralela aos seus co-referentes. A distribuição global desta restrição prova ser de alguma forma mais ampla do que o efeito velho versus novo. Quando os SNs co-referenciais estavam localizados na posição de sujeito nas orações precedentes, o objeto lógico da oração passiva sem agente aparecia na posição de sujeito paralela 58% das vezes, ou seja, a alternativa com a passiva foi escolhida. Quando isto

384

não era o caso, a escolha da passiva foi realizada somente 29% das vezes. (WEINER & LABOV, 1977, p.32)120

A seguir, Weiner & Labov mostram que a análise probabilística também atribui diferenças estatísticas mais significativas aos

fatores da

variável Paralelismo de estrutura superficial do que aos da variável Status informacional. Afirmam ainda que esta conclusão tem como efeito reforçar (...) nossa primeira decisão de tratar a escolha da ativa e da passiva como duas formas alternativas de dizer "a mesma coisa", uma vez que ela é condicionada por fatores sintáticos, formais, mais do que por influência do velho x novo. Poder-se-ia argumentar que seqüências paralelas são também características de escolhas semanticamente significativas: há uma tendência cognitivamente determinada para manter-se falando sobre a mesma coisa. (WEINER & LABOV, 1977, p.389)121

Objetivando mostrar que não há uma tendência cognitivamente determinada influenciando a escolha da passiva, Weiner & Labov observam que a variável Paralelismo estrutural é uma categoria mista, pois envolve coreferencialidade e ordem superficial. Para mostrar então que há uma influência puramente sintática (p.39), Weiner & Labov introduzem uma nova variável: presença ou ausência de estrutura passiva precedendo a passiva sob análise, independentemente da co-referência (cf. p.39). Weiner & Labov concluem que a análise acrescida desta variável não altera de forma significativa os resultados dos valores atribuídos

aos

fatores

das

outras

variáveis,

além

probabilísticos de

mostrar-se

estatisticamente melhor. Evidenciam ainda que a passiva precedente se

385

mostra como um fator condicionante independente e poderoso, o que reforça a sua conclusão de que a escolha da passiva sem agente é condicionada por considerações sintáticas. Com estes resultados em mãos, Weiner & Labov citam o primeiro trabalho de Poplack, afirmando que uma análise informacional preveria que um /s/ precedente deveria favorecer a ausência de um zero seguinte, o que, entretanto, não se constata. Observam então que ambos os resultados são de natureza semelhante (cf. p.40). Weiner & Labov consideram finalmente que a distribuição da informação no discurso não deixa de ter influência, mas ela é um fator relativamente menor comparado à tendência mecânica para preservar a estrutura paralela: primeiro na sucessão das construções passivas, segundo na retenção da mesma posição estrutural para o mesmo referente em sentenças sucessivas. Há indubitavelmente um fator estilístico operando (...) /grifos nossos/. (WEINER & LABOV, 1977, p.43)122

Pelo que Weiner & Labov apresentam, podemos verificar que eles trabalham restrições informacionais e formais, evidenciando que, se elas estiverem em competição, as forças formais tendem a prevalecer. Além disso, pudemos ver que Weiner & Labov descartam a explicação

do

funcionamento desta variável na base de uma tendência cognitivamente determinada para manter-se falando sobre a mesma coisa e atribuem-na à uma tendência mecânica para preservar a estrutura paralela, havendo um fator estilístico operando. Queremos, todavia, levantar uma hipótese de

que a tendência

mecânica ou a semelhança de estilo são reflexos de uma tendência geral que rege uma das formas

da mente humana operar, qual seja, a de

aproximar formas pelas suas semelhanças. Certamente, a demonstração

386

desta hipótese foge do escopo desse trabalho. Tal tipo de empreendimento nem seria propriamente lingüístico. Já tivemos inclusive oportunidades de mostrar que, no fenômeno que estamos estudando, a influência da variável Paralelismo formal não é simplesmente mecânica, pois o /S/ que não tem informação de plural não acarreta outro /S/ (cf. tabela 6.2.3.30). Em 1981, Schiffrin faz uma análise quantitativa da alternância do presente histórico e do passado em narrativas orais do Inglês. Observa ela que (...) há uma tendência para verbos no mesmo tempo ocorrerem juntos. Tanto os verbos no presente histórico e no passado são mais freqüentes quando o verbo anterior está no mesmo tempo. Em orações de complicação da ação não iniciais, 62 dos 368 verbos do presente histórico ocorrem depois de um presente histórico na oração anterior, e 82 dos 847 verbos no passado seguem um verbo no passado na oração anterior. Então seqüências com alternância rápida entre o presente histórico e o passado não são típicas. (SCHIFFRIN, 1981, p. 51)123

Segundo

Schiffrin,

Wolfson

(1979),

apresentando

resultados

similares, conclui que a tendência para verbos em um só tempo ocorrerem juntos tem explicação funcional, no nível discursivo: a manutenção de um tempo agrupa eventos em uma cena ou episódio, enquanto a mudança separa eventos uns dos outros. (SCHIFFRIN, 1981, p. 52)124

Continuando, Schiffrin afirma que seus resultados (...) dão suporte à hipótese de Wolfson de que a mudança de tempo separa eventos. Entretanto, isto não significa que a manutenção de um tempo tenha efeito oposto - de unir atos em um evento.

387

De preferência, parece ser uma tendência geral para formas gramaticais particulares ocorrerem juntas. Assim Weiner & Labov 1977 verificaram que a probabilidade de se usar passiva aumenta se a passiva já ocorreu no discurso precedente. E Sankoff & Laberge 1978 relatam para o Francês que, quando on e tu/vous ocorrem numa seqüência de sentenças coordenadas ou justapostas, sua média de mudança é mais baixa do que a sua proporção geral. Tais restrições seqüenciais sugerem que o que influencia a primeira ocorrência de uma forma não precisa ser o mesmo que influencia as ocorrências subseqüentes. É perfeitamente possível que a mudança de tempo funcione no discurso para separar eventos, mas que a manutenção em um tempo não tenha uma função discursiva comparável. Diferentemente, o último pode resultar de uma restrição mais mecânica na continuação de uma forma a não ser que haja razão para mudar. /Os últimos grifos são nossos/ (SCHIFFRIN, 1981, p.55-6).125

Semelhantemente à Weiner & Labov, Schiffrin afirma que há uma restrição mecânica envolvendo a tendência geral de formas particulares ocorrerem juntas, sem vincular tal situação a qualquer tipo de força externa que pode atuar sobre o funcionamento das formas lingüísticas.

7.2.3 - No Francês

Em 1978, Sankoff & Laberge, sem querer jogar por terra "a hipótese da independência" de ocorrência das diversas formas lingüísticas, discutem o efeito da proximidade sintagmática em dados de ocorrência sucessiva. Abordam três fenômenos sobre a evolução do sistema pronominal do Francês de Montreal, com base no trabalho de Laberge (1977) sobre on/tuvous e no de Sankoff & Laberge sobre on/ils e nous/on (cf. p.119).

388

Os autores em questão definiram três tipos de proximidade sintagmática entre dois dados, além dos casos de hesitação, focalizando a relação da segunda em função da primeira ocorrência. Consideraram que a hipótese de trabalho subjacente aos três tipos de proximidade sintagmática (...)coloca que quanto menor a relação sintagmática entre os dois dados, maior a chance de mudar a variante quando o segundo dado é enunciado. (SANKOFF & LABERGE, 1978, p.121)126

Os três tipos de proximidade sintagmática estudados foram os seguintes: 1) Restrições de encaixe: "(...) quando um único referente é o sujeito de duas (ou mais) sentenças, uma das quais está encaixada na outra." (p.120)127 2) Restrições seqüenciais: "(...) quando um único referente é um subconjunto de uma seqüência de duas ou mais sentenças independentes que são coordenadas ou simplesmente justapostas". (p.120)128 3) Ausência de restrições 1 e 2: quando duas ocorrências de uma mesma variável estão distantes, não sendo possível caracterizar as restrições dadas em 1 e 2 (cf. p.121). Segundo os autores, as comparações mais interessantes envolvem as restrições seqüenciais, onde se observa que as segundas ocorrências em questão apresentam tendência para não mudar, mostrando uma taxa maior de

ocorrência, o que rejeita a hipótese da independência da segunda

ocorrência em relação à primeira. Afirmam também que, embora os dados sejam esparsos, os encaixes restringem as mudanças mais fortemente do que as seqüências (cf. p.122). Os autores então se perguntam:

389

A restrição seqüencial é uma forma de coerência textual, embora quantitativa, operando sobre variáveis coreferenciais em unidades sintagmáticas adjacentes, ou isto simplesmente reflete homogeneidade estilística dentro de passagens relativamente curtas na conversação? /Grifos nossos/ (SANKOFF & LABERGE, 1978, p.122)129 Segundo eles, a primeira opção é no mínimo parcialmente válida (...), /uma vez que/ as taxas de mudança para os pares não restringidos não são claramente diferentes das proporções gerais das variantes, indicando pouco ou nenhum efeito da homogeneidade estilística." /grifos nossos/ (SANKOFF & LABERGE, 1978, p.122 e 126)130 Os autores acima mostram a influência da primeira sobre a segunda ocorrência, sem, todavia, atribuir este fato a uma simples tendência mecânica de repetição das formas ou à homogeneidade estilística, mas sim ao que eles denominam de coerência textual, não tecendo

considerações

mais detalhadas a respeito desta questão. Resta saber se entre os pares não restringidos existe diferença entre os de maior e os de menor proximidade.

7.2.4 - No Quechua Em 1981, em "Variation in plural marking: the case of Cuzco Quechua", Lefebvre estuda a flexão nominal e verbal no Quechua e compara seus resultados aos obtidos por Poplack (1979). Embora esteja estudando uma

língua bastante diferente das até agora apresentadas, ela conclui

também que há restrições em competição agindo nesta língua indígena da América do Sul falada na região andina. Com relação aos fatores que afetam a flexão plural do nome e do pronome, afirma o seguinte:

390

o fato de que há uma alta probabilidade de flexão plural nos nomes que não são precedidos por um quantificador está de acordo com a hipótese funcionalista. 131 (LEFEBVRE, 1981, p.80) No caso acima, não fenômeno de flexão

se verifica restrição

em conflito, pois o

nominal em curso não envolve processos de

concordância. Já com relação à flexão verbal, que envolve mecanismos de concordância, Lefebvre apresenta dois tipos de conclusão: uma em direção à hipótese funcionalista e outra em direção ao Princípio do Processamento com Paralelismo, conforme podemos ver a seguir. Se olharmos a contribuição do tipo de informação plural contida no SN sujeito nós encontramos os seguintes resultados. Nos casos em que os pronomes sujeitos não aparecem na estrutura superficial, a probabilidade de flexão plural dos verbos é muito alta. Este fato se amolda à hipótese funcionalista (...); inversamente no caso de um nome quantificado ou sujeito coordenado a probabilidade de flexão plural dos verbos é muito baixa (...) Os outros fatores, entretanto, não confirmam a hipótese funcionalista como tal. Isto envolve dois tipos de casos para os quais não há informação de plural no SN sujeito (...) e para os quais há informação de plural no SN sujeito (...) A hipótese funcionalista preveria que a primeira categoria favoreceria a flexão plural nos verbos a fim de preservar informação plural a nível de sentença, enquanto a segunda categoria permitiria menos flexão no verbo uma vez que a pluralidade já está marcada no sujeito. Os resultados mostram a tendência contrária. Eu sugiro a seguinte explicação para estes fatos: parece haver um fenômeno de concordância superficial que dá conta da flexão de plural nos verbos quando o SN sujeito está flexionado com o plural e ausência de flexão quando o SN sujeito não está flexionado. /Grifos nossos/ (LEFEBVRE, 1981, p.81-2)132

391

Lefebvre conclui então que a sua análise com base nos dados de Quechua, à semelhança da análise feita para o Espanhol, parece mostrar que há dois processos em competição, evidenciando-se assim que línguas diferentes como o Quechua e Espanhol são governadas pelas mesmas restrições (cf. p.83). Os resultados de Lefebvre

são extremamente interessantes, não

apenas pelas conclusões explícitas sobre o funcionamento das restrições em competição e, especialmente, sobre o funcionamento do Paralelismo Formal, mas, também, pelo fato de apresentarem exatamente a mesma influência vista para o Português do Brasil por Naro (1981b), num estudo sem qualquer conexão com o seu ou com o de Poplack.

7.2.5 - No Crioulo Caboverdiano

Em 1982, Braga defende sua tese de doutorado, intitulada "Leftdislocation and topicalization in Capeverdean Creole". O seu objetivo, ao fazer esse estudo, era determinar as propriedades e as funções discursivas das topicalizações e deslocamentos para a

esquerda no Crioulo

Caboverdiano, que é normalmente considerada como língua de ordem fixa (cf. p.1-5; 154). Embora não estivesse analisando especificamente a influência da variável Paralelismo Formal, conclui que a menção do referente no discurso imediatamente

precedente favorece tanto os deslocamentos para a

esquerda (cf. p.97) quanto as topicalizações (cf. p.131). O Crioulo Caboverdiano é, pois, um exemplo de um outro tipo de

392

língua,

sincronicamente

diacronicamente

tão

natural

quanto

qualquer

outra,

mas

diferente, que evidencia a consistência da força do

Paralelismo Formal sobre o uso lingüístico.

7.2.6 - No Português do Brasil

O efeito do Paralelismo formal tem se mostrado relevante em diversos fenômenos do Português

do Brasil, principalmente na área da

sintaxe e da morfossintaxe. Há pelo menos dez trabalhos, excluindo o nosso ora apresentado, que evidenciam a influência desta variável em situação de discurso livre na modalidade oral ou em situação de elicitação de dados orais ou escritos. Vamos apresentar, por ordem de tipo de fenômeno e, então, por ordem cronológica, primeiro os trabalhos que analisam apenas o discurso livre na modalidade oral semi-espontânea e, em segundo, aqueles que analisam também dados lingüísticos obtidos através de questionários, quer orais, quer escritos. Estes últimos trabalhos mostram a influência do efeito denominado "gatilho" por Emmerich 1977 (cf. p. 397), em situação de pergunta-resposta, quer através de diálogos, quer através de questionários. O primeiro estudioso a falar sobre a influência do Paralelismo formal na modalidade oral semi-espontânea em discurso livre, no Português do Brasil, é Omena que, em 1978, realizou a sua Dissertação de Mestrado sob o

título

"O

pronome

pessoal

de

terceira

pessoa:

suas

for-

393

mas variantes em função acusativa." na modalidade de fala analisada, Omena coloca que praticamente não ocorreu a forma pronominal oblíqua o, fato que limitou a sua "observação ao uso do pronome de caso reto em função de objeto direto e ao cancelamento do pronome" (p.30), portanto, nas sua formas respectivas ele e zero (0). Num estudo piloto, Omena testa a influência de sete variáveis, dentre as quais destacamos a que ela denomina neste ponto do trabalho de Classe de palavras a que pertencia o antecedente. As suas expectativas diante desta variável são colocadas inicialmente da seguinte forma: pela natureza do fenômeno lingüístico em observação, o pronome seria um item lexical que substituiria um nome já anteriormente expresso, para evitar repetição. Assim esperávamos uma alternância no uso do pronome. Pensávamos que para maior clareza na comunicação seria mais provável ocorrer um apagamento quando o sintagma antecedente fosse um nome, do que quando fosse um pronome, achando que, uma vez ocorrido um pronome, a tendência seria o falante utilizar numa referência subseqüente o nome do ser a que se referia, ou, repetir o pronome. (OMENA, 1978, p.32)

Realizado o estudo piloto, Omena conclui que a diferença entre o efeito do tipo categorial do antecedente, se pronome ou se nome, é neutro, pois a diferença probabilística entre eles é de apenas 0,04 (cf. p.43). No estudo definitivo, com uma amostra constituída apenas de falantes semi-escolarizados, Omena decidiu reanalisar a variável Classe gramatical do antecedente. Segundo ela, observou-se que muitas vezes, além do pronome antecedente, havia, posteriormente, um ou mais apagamentos da forma, para só depois ocorrer o pronome (ou o seu cancela-

394

mento) em função de objeto direto. Outro fator observado foi que havia frases em que o antecedente aparecia cancelado, dedutível apenas pelo contexto, para depois surgir o cancelamento ou o emprego do pronome objeto. Também foi visto que o antecedente (nome ou pronome) podia aparecer repetidamente, antes da ocorrência ou cancelamento do pronome objeto. /Grifos nossos/ (OMENA, 1978, p.54)

Com base nas observações acima, Omena reorganizou esta variável em três fatores: 1) antecedente formalmente ausente, mas dedutível do contexto; 2) antecedente nome ou pronome, seguido ou não de algum cancelamento (não reforçado) e 3) antecedente reforçado, isto é, "ou aparecia um nome e um pronome (ou vice-versa), ou agrupavam-se ora nomes, ora pronomes". (p.54-5 e p.64) O estudo desta variável sob a nova perspectiva levou Omena a concluir o seguinte: Outro fator a inibir a aplicação da regra foi a referência reiterada ao elemento que constituía o assunto do discurso. A idéia de que o falante tenderia a apagar o pronome objeto mais facilmente em seguida ao apagamento de um substantivo, do que ao aparecimento de um pronome pessoal que já seria uma cópia, mostrouse, na prática, irrelevante. Pensávamos em uma regularidade na seqüência dos itens lexicais, tendo em vista seu conteúdo semântico (...) A lógica lingüística revelou-se outra. Nossos falantes tendem mais a usar o pronome objeto, quando antes já aparece uma seqüência de nomes e/ou pronomes. Parece influenciar aí o mecanismo enfático da repetição. /Grifos nossos/ (OMENA, 1978, p.100)

Pelas conclusões de Omena, podemos ver novamente a influência da repetição sobre o uso das formas lingüísticas. E, por suas palavras, podemos ver também que tal tipo de influência não fazia parte de suas hipóteses iniciais: o esquadrinhamento dos dados foi que revelou a importância da variável

Paralelismo

formal.

Todavia,

é

importante

observar

395

que Omena mediu também a influência de outras variáveis do tipo Acumulação de função sintática, quando o pronome exerce uma função na oração principal e na oração encaixada (deixei ela sair), concluindo que o SN pronominal que acumula em um dado contexto duas funções sintáticas tende a se realizar formalmente no discurso. A ausência deste fator favoreceria o cancelamento da forma. (OMENA, 1978, p.98) Continuando a sua exposição, ela coloca que uma forma, que representa na estrutura superficial o objeto de uma oração dominante e o sujeito de uma oração encaixada, tenderia a se manter, dada a necessidade de clareza na comunicação. (OMENA, 1978, p.99) Com a influência destas duas variáveis, podemos ver dois princípios ou motivações diferentes em competição: o Princípio da Economia ou Motivação Econômica (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984) e o Princípio do Processamento por semelhança formal, ou Princípio do Processamento com Paralelismo, agora em proposição. O primeiro conduz à manutenção da forma em função da "clareza na comunicação", enquanto o segundo conduz ao Paralelismo formal independentemente deste aspecto. Em 1981, também com base em dados do Português do Brasil, produzidos por falantes semi-escolarizados, Naro analisa a possibilidade de ocorrência de sujeitos vazios com verbos de terceira pessoa do plural em função de duas variáveis: o tipo de desinência da forma verbal - se forte ou fraca - e o tipo de desinência plural do verbo - se presente ou se ausente, neste segundo caso neutralizada.

396

Seu objetivo final é discutir, com base no uso real da linguagem, a visão difundida de que, em línguas como o Português, a existência de pronomes vazios é possível pelo fato de a desinência da concordância verbal ser suficiente para indicar a mesma informação que um sujeito explícito (cf. 1981b, p.351). Naro deseja discutir a colocação acima porque, segundo ele, ela apresenta pelo menos duas pressuposições fundamentais: uma de que a concordância não é uma questão de grau e outra de que a concordância é uma regra obrigatória que sempre produz distinções explícitas na língua que permite sujeitos vazios (cf. 1981b, p.351). Pelo estudo da relação entre os sujeitos vazios com verbos que apresentam concordância e o tipo de desinência verbal explícita - forte ou fraca -, Naro conclui que há mais sujeitos vazios com verbos com desinência forte do que com verbos de desinência fraca. Segundo ele, estes resultados tendem (...) a dar suporte à idéia de que 'onde você tem concordância explícita você pode cancelar o sujeito' (...) Além disso, podemos acrescentar que, quanto mais explícita for a concordância, mais sujeitos podem ser cancelados. (NARO, 1981b, p.356)133

Segundo Naro, pelo fato de a concordância ser uma questão de grau, a generalização correta "(...) não é 'tente preservar a marca', mas 'tente eliminar a redundância'". (p. 354),134 o que, todavia, não se aplica aos casos de verbos sem concordância. Pelo estudo da relação entre os sujeitos vazios com

verbos

que

não

apresentam

concordância

e

o

tipo

de

397

desinência verbal não explícita - forte ou fraca, Naro conclui que há também mais sujeitos vazios com verbos fortes sem concordância do que com verbos fracos sem concordância, verificando-se o mesmo padrão dos verbos com concordância. Sendo assim o princípio tente eliminar redundância não se aplica

a

estes

casos,

pois

não

há

desinências

explícitas

e,

conseqüentemente, não há redundância a ser eliminada (cf. p.354). Afirma ele também que se a única consideração relevante fosse a preservação da marca explícita de categorias tais como o plural, o sujeito deveria aparecer mais freqüentemente /com verbos sem concordância/ do que com verbos com concordância, porque tais categorias não são marcadas na desinência da forma sem concordância. Além disso, esperaríamos mais sujeitos explícitos com verbos fortes sem concordância do que com as suas contrapartes fracas. Entretanto, nenhuma destas expectativas são confirmadas(...). (NARO, 1981b, p.354)135

As expectativas acima não são confirmadas porque, além de sujeitos vazios aparecerem mais também com verbos fortes sem concordância, os sujeitos vazios são também mais freqüentes com os verbos sem concordância do que com os verbos com concordância, pelos resultados apresentados por Naro (cf. 1981b, p.354-6). A preferência de sujeitos vazios com verbos fortes sem concordância significa, segundo Naro, que falantes evidenciam para

uma grande inclinação

evitar conflito superficial entre o sujeito e o verbo com verbos de

desinência forte. Assim, o princípio aqui é 'elimine conflito' (cf. 1981b, p.355). Concluindo, Naro coloca que

398

é importante se ter em mente, entretanto, que no mundo real há muitos verbos sem concordância. O fato de que estes também permitem sujeitos vazios, e na mesma ou maior proporção do que verbos com concordância, mostra que a hipótese da concordância explícita, mesmo na sua forma relativizada, não é correta. O princípio subjacente geral por trás do comportamento de ambos os tipos de construção é a redução na quantidade de marcas superficiais. Para verbos com concordância, isto reduz a redundância sujeito/verbo e para verbos de não concordância isto reduz conflito sujeito/verbo. Observe-se que neste segundo caso, o processo de marcar é reduzido mesmo com o custo de se perderem todas as marcas superficiais de categorias semânticas. (NARO, 1981b, p.356)136

No resumo parcial do artigo de Naro que acabamos de fazer, interessa-nos destacar a correlação entre sujeitos vazios e verbos com ou sem concordância. Neste ponto específico, podemos perceber novamente que formas semelhantes tendem a se agrupar: por um lado, sujeito explícito com desinência explícita e, por outro, sujeito vazio com desinência plural não explícita, ou seja, forma sujeito zero com desinência zero. Aplicam-se com precisão aqui as palavras de Poplack: marcas levam a marcas e zeros levam a zeros. Conforme já observáramos, estas conclusões são extremamente semelhantes às de Lefebvre para o Quechua, evidenciando-se a importância da variável Paralelismo formal. Os resultados relativos a verbos com desinência forte ou fraca interessam-nos também na medida em que eles mostram, a nosso ver, um outro princípio envolvido, que é o Princípio da Economia Lingüística. Em 1982, Lira realiza a sua tese de Doutoramento, intitulada "Nominal, Pronominal and Zero Subject in Brazilian Portuguese", objetivando estudar a alternância entre sujeito pronominal e sujeito zero (cf. p.1). No estudo da influência de uma variável denominada Referentes novos e velhos, Lira efetua uma subdivisão dos referentes velhos em função

399

do número de orações anteriores em que ele foi mencionado, considerando (1) a oração imediatamente precedente, (2) duas orações precedentes e (3) três ou mais orações precedentes (cf. p.148). As suas expectativas, com base na análise desta variável, eram que "um referente sujeito novo e um referente que já fosse mencionado três ou mais cláusulas antes favorecesse os sujeitos pronominais." (p.148)137 Embora Lira tenha codificado esta variável com as expectativas estabelecidas acima, os resultados que obtém encontram-se praticamente na razão inversa de suas expectativas, pois, não apenas os sujeitos novos desfavorecem o aparecimento da forma pronominal, mas, conforme afirma ela, "(...) o reverso acontece. Se o sujeito está presente em uma oração antes, o pronome tem a probabilidade mais alta de ser realizado." (p.149)138 Buscando uma explicação para tal situação, Lira coloca o seguinte: O fato de que o sujeito pronominal ocorre mais freqüentemente quando o referente foi mencionado uma oração antes poderia ser explicado por algum tipo de paralelismo ou concordância na superfície. /Grifos nossos/ (LIRA, 1982, p.150)139

A seguir, Lira cita o estudo de Poplack, em sua tese de Doutoramento, o de Weiner & Labov (1977) e o de Schiffrin (1981). Com relação à inesperada influência dos sujeitos novos, favore-

400

cendo o cancelamento, Lira afirma que tais casos são pronomes generalizantes, o que explica os resultados, pois, segundo ela, o sujeito de uma sentença

generalizante não é importante para a inteligibilidade da

mensagem (cf. p.151-2). Podemos então observar que os resultados de Lira mostrando a influência da proximidade entre as formas também foram obtidos ao acaso. A hipótese explicitamente colocada era exatamente o inverso dos resultados obtidos. Podemos novamente ver que a influência deste tipo de variável é tão forte que, mesmo quando não analisada conscientemente, ela emerge no estudo de outras variáveis sob hipóteses opostas. Omena, em 1978, concluíra que o mecanismo da repetição exercia influência no uso explícito do pronome pessoal ele na sua função acusativa. Esta conclusão emergiu do estudo de uma

variável que não tinha por

objetivo testar o mecanismo da repetição, conforme ela o coloca. Em 1986, Omena efetua um outro estudo, agora sobre as formas de referência à primeira pessoa no discurso na sua forma plural com as seguintes realizações: nós, a gente e zero (0). Ao estudar as formas nós x a gente na função sujeito, ela analisa uma série de variáveis condicionantes, dentre as quais a mais forte é a Mudança de referente. Fora esta variável, a outra mais evidente é a que reflete a tendência à repetição de formas semelhantes, denominada seqüências das formas no discurso. Segundo Omena,

é interessante observar que, no caso da primeira escolha, não há influência da seqüência no discurso sobre a variável: a probabilidade fica em torno de .5. (...) No

401

entanto, uma vez escolhida a forma, essa escolha atua sobre o uso das formas subseqüentes. (OMENA, 1986, p.295) Continuando, ela coloca ainda que a influência da forma do sujeito explícito antecedente sobre o uso das formas é uma tendência à repetição. /Grifos nossos/. Veja-se que nos dados das Crianças essa influência em relação ao uso de nós é tão forte que não importa a mudança de referente. É uma tendência assinalada em outros fenômenos sintáticos. (OMENA, 1986, p.295) No estudo do sujeito zero, relacionado às formas nós e a gente, Omena estuda também a influência de uma série de variáveis condicionantes e, dentre tudo o que ela coloca, destacamos a parte referente à variável seqüência das formas no discurso. Com relação a este aspecto, Omena afirma que a ausência de sujeito em oração anterior favorece nova ausência, a presença de a gente /fala/ propicia 0 V + des. de 3a. P. /fala/ e a de nós /falamos/ propicia 0 V + des. De 4a. P. /falamos/. (OMENA, 1986, p.307) Ela afirma ainda que a primeira referência, semelhantemente ao que ocorre no sujeito explícito, não é influenciada pela seqüência no discurso (cf. p. 306). A influência da variável Seqüência das formas no discurso se torna ainda mais evidente na parte em que Omena estuda "a ocorrência de nós e a gente em outras funções", especificamente nos casos de complemento adverbial e adjunto adverbial. Segundo ela, nestes casos verifica-se que é a seqüência do discurso o fator mais atuante na escolha de uma das formas. Propicia as ocorrências de a gente o fato de haver no contexto antecedente a gente. (...) Para que ocorra nós (e seus derivados) deve existir antes uma manifestação dessa forma (...) Quando se faz uma referência isolada à

402

primeira pessoa do plural, ou quando se trata de referência inicial, há uma tendência ao uso de a gente (...). (OMENA, 1986, p.314) É oportuno observar que, neste estudo, Omena coloca explicitamente que o Paralelismo formal envolve não apenas a repetição da forma com presença de substância, mas envolve também a repetição da forma zero, ou seja, a repetição da ausência de substância. Omena mostra novamente que há duas forças em competição: uma que provoca a mudança de forma, subjugada, portanto, ao Princípio da Iconicidade ou Isomorfismo forma/significado, e outra que conduz à manutenção da forma, compelida pelo Princípio do Processamento com Paralelismo. Segundo ela, a primeira é mais forte do que a segunda de forma geral, mas há alguns momentos em que a segunda motivação é que assume a liderança. Também em 1986, Braga, ao estudar as construções de tópico (CTs) no discurso oral de falantes cariocas, na sua relação com o objeto direto e indireto, mostra, em última instância, que a menção prévia de um constituinte é fundamental para desencadear uma construção tópica (cf. p.422). Inicialmente, tanto em relação às construções de tópico com objeto direto e construções de tópico com objeto indireto, ela analisa uma série de variáveis, mostrando que elas "não constituem condicionadores no sentido estrito da palavra, funcionando antes como caracterizadores do formato de uma CT." (p.417 e p.418)

403

Braga afirma que todas as construções de tópico e objeto direto analisadas, quer as classificadas como reiteradoras; quer as condicionadas por fatores estritamente mecânicos; quer as que estabelecem contraste, destacam elementos dentro de uma série ou apresentam justificativas; quer as que exercem outras funções não definidas, todas elas revelam uma característica comum: a retomada de um item já evocado anteriormente ou a menção a constituintes de conceitos também já referidos. Esta volta ao texto anterior parece ser a macro-função das CTs da qual os grupos listados anteriormente constituem tão somente uma especialização. Esta característica das CTs aponta para e, enquanto tal, caracteriza-se como um dos mecanismos coesivos de que dispõe o falante. (BRAGA, 1986, p.412)

Embora evidencie a característica comum às CTs sob análise, Braga estabelece uma distinção forte entre, por exemplo, as CTs reiteradoras e as condicionadas por fatores estritamente mecânicos. Segundo ela, a CT reiteradora mostra uma

relevância, sob a perspectiva do falante, na

repetição do enunciado prévio e a CT condicionada por fatores mecânicos surge em função de uma pergunta do interlocutor, "o efeito gatilho referido por Emmerich (1984)". (BRAGA, 1986, p.405) Ao analisar especificamente as CTs e objeto indireto, Braga retoma todos os agrupamentos feitos e, através de um último exemplo, que tem como única função a de simplesmente retomar uma menção anterior, Braga coloca explicitamente que as menções prévias favorecem a ocorrência do SN em posição inicial não restando ao locutor outra possibilidade de predicar sobre o mesmo, produzindo uma CT. (BRAGA, 1986, p.422) A seguir, apresenta um exemplo hipotético, mostrando que

404

a oração com ordem neutra constituirá uma perturbação do ritmo frásico utilizado pelo falante e, enquanto tal, será evitada. Já a CT, permitindo-lhe combinar a estrutura frásica e predicação sobre o elemento em questão, será preferida.(BRAGA, 1986, p.422) Com base em todos os tipos de construções de tópico observados, especialmente com relação ao tipo de função sem classificação, Braga conclui então que tal situação sugere que os fatores mecânicos, referidos na seção anterior, quando da análise de ODs, devem ser ampliados de forma a englobar CTs que ocorrem como respostas a perguntas, CTs que reiteram uma anterior e CTs cujo SN à esquerda retoma um referente recémmencionado no discurso anterior. Esta possibilidade de uma construção motivar a ocorrência de uma outra com o mesmo formato superficial /grifos nossos/ já havia sido aventada por Weiner & Labov (1977), em seu estudo sobre passivas sem agente em inglês. Em nosso trabalho sobre DEs e TOPs em Crioulo Caboverdiano, também mostramos que paralelismo de estrutura superficial era um condicionamento atuante.(BRAGA, 1986, p.423)

Com o trabalho de Braga, temos mais um estudo sobre o Português do Brasil, diferente de todos os demais até então arrolados, evidenciando a influência da variável Paralelismo formal. Também através de suas palavras, já tivemos oportunidade de ver

evidências

da influência do Paralelismo

formal sobre uma outra língua diacronicamente diferente das línguas até então citadas: o Crioulo Caboverdiano. Já é do nosso conhecimento que, em 1981, Guy estudou, entre outros aspectos, a concordância de número no sintagma nominal (CSN) e a concordância verbo/sujeito (CVS) em amostras da fala do Português do Brasil, produzidas por pessoas semi-escolarizadas. É interessante relatar aqui algumas conclusões suas a respeito da concordância verbal, que trazem também informações importantes sobre a

405

influência do Paralelismo formal através dos resultados da variável Tipos de sujeito. Analisando as ocorrências com sujeitos explícitos, Guy verifica a influência de diversos tipos de sujeitos. Interessa-nos especificamente os resultados obtidos para três tipos de sujeitos: singulares coordenados, plurais com ausência de alguma marca e plurais com todas as marcas. Os resultados obtidos mostram que SNs com todas as marcas de plural favorecem mais as marcas de plural no verbo do que os SNs que se apresentam com ausência de alguma marca e os SNs singulares coordenados são os que mais favorecem a ausência de desinência de plural nos verbos. Segundo Guy, esta indicação de que as duas regras tendem a covariar aparece no nosso exame da CSN no capítulo 5. Isto seria um reflexo do grau de auto-monitoração, um efeito "estilístico" mais sutil do que nós estamos sendo capazes de discriminar com a nossa medida de estilo de fala relativamente crua, medida com base no assunto do estilo da fala. (GUY, 1981a, p.252)140

Após uma série de considerações sobre um quarto fator da variável Tipos de sujeito, denominado Pluralidade no discurso, Guy rejeita a hipótese funcionalista perseguida por Poplack (cf. GUY, 1981a, p.249-54), e, após uma breve observação sobre o fator sujeito singular coordenado, conclui definitivamente que portanto o que nós temos, então, é uma covariância relativamente forte entre CNS e CVS, que pode ser resumida dizendo que, quando a primeira deixa de se aplicar, a última é também mais provável de se deixar

406

de se aplicar. Estes dados dizem respeito naturalmente às sentenças com sujeito superficial(...) (GUY, 1981a, p.254)141

Acabamos de ver, portanto, que Guy encontra também influência de marcas levando a marcas e zeros levando a zeros. Ele interpreta esta influência como sendo uma questão de efeito estilístico, à semelhança do que colocam Weiner & Labov para o uso das passivas sem agente no Inglês. Embora Guy tenha trabalhado apenas com sujeitos explícitos e afirme que suas conclusões só se aplicam a estes casos, é oportuno lembrar que Naro (1981b) mostra que os verbos semanticamente plurais, mas sem desinência formal explícita, tendem a aparecer com sujeitos vazios e não com sujeitos explícitos, o que nos levaria a estabelecer generalizações cada vez mais amplas sobre o efeito do Paralelismo formal. Em 1987, Lage estudou

a concordância verbal em expressões

quantitativas do tipo um grupo de crianças passou x um grupo de crianças passaram, também no discurso oral (cf. p.13-6).142 Infelizmente, o número de dados deste tipo encontrado em 48 horas gravadas foi muito pequeno, num total de apenas 46.

Mesmo assim, a

variável denominada Plenitude do SN, que observa a presença/ausência de marcas formais de plural no sujeito "a maior parte dos meus amigos falam", "uma porção de motoqueiro parou", mostrou-se estatisticamente relevante em direção ao Paralelismo formal encontrado em todos os fenômenos até agora relatados (cf. p.20-1;28).

407

Lage observou que, quando o SN sujeito apresentava-se com todas as marcas formais de plural explicitadas, o verbo tendia a apresentar mais marcas formais explícitas de plural; a ausência de marcas formais no SN sujeito também provocava ausência de marcas formais na forma

verbal

correspondente (cf. p.28). Esta conclusão é absolutamente consistente com a encontrada por Guy (1981a) ao analisar a concordância verbal em amostras de fala de pessoas semi-escolarizadas. Temos então, nas palavras de Lage, as seguintes colocações: A variável mais condicionante, sendo assim mais importante, é a que trata da plenitude do SN contido no Sprep (expressão quantitativa), isto é, quando o SN não está em total concordância de número (...), a freqüência da aplicação da regra em estudo é baixíssima, quase ínfima em relação à situação contrária (...). A plenitude do SN foi, desde as etapas preliminares, o único grupo selecionado como estatisticamente relevante (...). Isto vem ratificar a idéia de que uma forma plural atrai um flexão neste número do elemento próximo. (LAGE, 1987, P.28)

Os resultados obtido por Lage são extremamente interessantes, por duas razões: primeiro, eles não foram obtidos ao acaso. Lage coloca explicitamente como uma de suas hipóteses a busca do Paralelismo formal, através do estudo da variável denominada Plenitude do SN; segundo, eles evidenciam que a influência do Paralelismo formal é tão forte que emerge mesmo de uma pequena quantidade de dados. Do total de dados trabalhados por Lage, restaram ao final,

após a retirada de dados

neutralizados e os de influência categórica, apenas 34, nos quais se evidenciou a forte influência da variável em foco (cf. p.28).

408

O efeito extremo da variável Paralelismo formal, na sua

atuação

estritamente mecânica, é encontrado por Emmerich num estudo

do

Português como uma língua de contato no Alto Xingu. Em 1977, numa comunicação intitulada "Um traço propulsor numa língua de contato", Emmerich inicia o estudo de uma variável, bastante produtiva, que funciona como estímulo ou, como a denominamos tentativamente, como traço propulsor ou mesmo gatilho, na língua de contato. Ela consiste na produção de formas verbais decalcadas da pergunta, quando esta é imediatamente precedente, inibindo a realização da forma verbal de pessoa correspondente ao contexto da resposta. (EMMERICH, 1977, p. 396-7)

Com base na forma de coletar os dados: “gravações de conversa livre, diálogos dirigidos e aplicações de questionários," (cf. 1977, p.397), Emmerich codifica a variável Traço propulsor e conclui que o gatilho do traço propulsor ocorre (..) com bastante freqüência sendo o índice de variação (...) mais do que o dobro, se o compararmos com os percentuais de variação na conversa livre.(EMMERICH, 1977, p.398)

Como Emmerich observou a influência do Paralelismo formal apenas na relação entrevistado/entrevistador, ela desenvolve uma discussão no sentido da sua inclinação de considerar "o traço propulsor como uma variável de natureza sociolingüística" (cf. 1977, p.390), sem ignorar que estudos realizados no âmbito da psicolingüística, particularmente da aquisição da linguagem, registram variação análoga ao do falante da língua de contato na fala infantil. (EMMERICH, 1977, p.399)

Continuando a sua discussão, ela conclui que

409

em face dessa semelhança entre o processo de aquisição da linguagem na criança e no adulto bilingüe, nos parece pertinente formular a hipótese de que também variáveis psicolingüísticas tenham função relevante na formação e funcionamento de uma língua de contato. (EMMERICH, 1977, p.399)

Em 1984, estudando o fenômeno da concordância da primeira pessoa verbal nesta mesma língua de contato, Emmerich continua afirmando que a observação de diversas situações da interação verbal nos levou a admitir a existência de maior autonomia no emprego da regra de concordância de pessoa verbal quando o locutor não estava na dependência direta do interlocutor. Denominou-se esta variável de Traço Propulsor. Ela consiste basicamente em decalcar na reposta a forma não flexionada da pergunta. Este mecanismo de cópia se reflete na tendência a inibir o uso de regra em situações dialógicas. EMMERICH, 1984, p.132)

Emmerich caracteriza a variável Traço propulsor binariamente: discurso livre e gatilho. Neste trabalho afirma ela que como gatilho foi entendido o contexto em que o enunciado, com forma verbal de primeira pessoa singular, era inevitavelmente precedido por pergunta com forma semelhante, enquanto o contexto do discurso livre é o da fala espontânea, não dirigida. (EMMERICH, 1984, p.132) Emmerich conclui novamente que o fator denominado gatilho inibe sensivelmente a concordância da pessoa, enquanto o discurso livre a favorece. Buscando explicações para os resultados obtidos, Emmerich afirma agora que a variável em questão leva a admitir o funcionamento de condicionamentos psicolingüísticos, pois realizações análogas ocorrem na aquisição do Português pela criança. (...) O traço propulsor representa, assim, em sua

410

essência, a permeabilidade do indivíduo exposto a situações de contato em códigos diferenciados, devendo ser entendido, pela sua generalidade, como um princípio atuante em estágios aquisitivos da linguagem, seja da primeira ou segunda língua. (EMMERICH, 1984, p.222-3) Em verdade, o efeito que Emmerich denomina de gatilho não funciona apenas em processos de aquisição da linguagem ou na relação entre entrevistador/entrevistado. Neste caso, ele é apenas mais evidente. Ele funciona também na interação natural entre as pessoas e mesmo na fala de um só indivíduo, se admitirmos a possibilidade de generalizar todos os fenômenos estudados até agora como sujeitos ao efeito gatilho. No estudo dos fenômenos lingüísticos, há evidências explícitas de que os pesquisadores eliminam de seu conjunto de dados aqueles em que se constata a influência da pergunta. Assim, Omena relata que houve supressão de dados que apareciam nas situações que o falante respondia a uma pergunta do entrevistador ou repetia o que ele acabava de afirmar. O conjunto de tais dados demonstrou que o falante ora cancelava ou usava o pronome objeto numa mera imitação da fala do entrevistador, ora emitia a referência anafórica ao item já expresso na pergunta que lhe era dirigida, imitando em parte a fala do interlocutor. (OMENA, 1978, p.48-9) Em 1977, Gryner, em sua Dissertação de Mestrado sobre "A variação da concordância verbal com os verbos impessoais na cidade de Petrópolis", chega a eliminar de sua análise final todo um subconjunto de dados, devido à interferência na forma de obtenção dos dados a serem analisados. Gryner coletou seus dados através de aplicação de testes em situação artificial, num laboratório de línguas, porque o fenômeno que ela

411

pretendia estudar ocorria pouco nos textos livres (cf. p.2-3; 32). E, então, afirma ela que para neutralizar a interferência da flexão dos verbos constituintes das frases apresentadas (...), eles serão apresentados ora no singular (...), ora no plural (...) (além de dois exemplos de "tem" (sg) e "têm" (pl)). (GRYNER, 1977, p.39) Mesmo com a cautela revelada na citação acima, Gryner codifica inicialmente seus dados em função também de uma variável que ela denomina de Forma com que o verbo foi apresentado, categorizada em: (1) verbo apresentado no singular; (2) verbo apresentado no plural e (3) verbo apresentado ambíguo (cf. p.48). Ela observa então que não há diferença probabilística entre o verbo plural e o verbo ambíguo, mas que "é evidente a interferência da forma plural" (p.49) apresentada no questionário. Conclui, portanto, que a forma singular da pergunta favorece a forma singular da resposta e a forma plural ou ambígua da pergunta favorece a forma plural da resposta. Podemos assim verificar que, mesmo querendo evitar o Paralelismo formal entre resposta e pergunta, Gryner não o consegue. E, como seu objetivo não era estudá-lo, ela o controla, e passa a trabalhar apenas com as respostas obtidas através de perguntas feitas com o verbo no singular. É interessante observar que o primeiro trabalho sobre o Português que fala deste tipo de efeito, embora de forma marginal, é exatamente o de Gryner. Sua dissertação foi apresentada no primeiro semestre de 1977. No segundo semestre deste mesmo ano, Emmerich apresenta a sua comunicação, falando sistematicamente deste tipo de efeito, na sua forma de atuar estritamente mecânica.

412

Em 1981, Macedo apresenta também um estudo sobre um outro fenômeno do Português do Brasil. Este estudo constitui a sua Tese de Doutorado, sob o título de "O uso do futuro do subjuntivo em Português: regularização de uma forma verbal". Macedo

trabalhou com dados obtidos através de três formas

diferentes: discurso livre, testes escritos e testes orais. Justifica a aplicação dos testes também pela pouca freqüência deste tipo de dado em discurso livre (cf. p.56-9). Igualmente preocupada com a possível influência da forma de coletar os dados, o que tenta evitar, inclui uma variável denominada Efeito da forma verbal no teste para controlar a situação (cf. p.54; p.127-8). Após a análise dos dados afirma que dadas as formas de pretérito do indicativo, constatamos que há maior probabilidade de se flexionar o futuro do subjuntivo no irregular. O contrário acontece quando as frases são apresentadas no presente, e a regularidade é ainda maior se o "gatilho" no teste for o próprio infinitivo. (MACEDO, 1981, p.128, cf., também, p.157)

Macedo mostra ainda, através de outra variável denominada Paralelismo morfossintático, que se, num período com coordenação, o primeiro elemento verbal for regular, o morfossintático é responsável por um tipo de rima morfológica que faz subir o índice de regularização da regra em estudo. (MACEDO, 1981, p.129)

Fora as conclusões acima, consideramos oportuno colocar que Macedo encontra o efeito da variável denominada por ela de Paralelismo

413

morfossintático não apenas em testes escritos e orais, mas também nos dados de entrevistas gravadas. O mais importante disto é que, além de se mostrar que esta variável também influencia o discurso livre, mostra-se também que a sua influência é neste caso bem mais polarizada (cf. p.130 e 147). Temos então, nas palavras de Macedo, o seguinte: o efeito "gatilho" das construções coordenadas em que o item precedente é um verbo regular apresenta-se como interferente com acentuada diferença entre os dois fatores (...) - o que comprova a importância deste grupo de fatores na variação em estudo. (MACEDO, 1981, p.147)

Após resultados consistentes para o efeito do Paralelismo formal através de duas variáveis, nos textos escritos e orais e no discurso livre, em amostras de fala de crianças, adolescentes e adultos, Macedo

cita

Emmerich (1977); Sankoff & Laberge (1978) e apresenta uma reflexão sobre este tipo de influência que consideramos a mais arrojada dentre todas as que vimos até o presente momento. Na íntegra, ela diz o seguinte: O chamado efeito "gatilho" da forma precedente tem sido pouco estudado pela teoria lingüística. Teríamos nestes casos a atuação dos elementos do discurso, que interferem uns sobre os outros. Estes fenômenos operam em níveis bastante superficiais da sintaxe: a forma precedente atua como propulsora da forma subseqüente, tanto para manter a irregularidade, caso a forma precedente seja irregular, como para aumentar a probabilidade de emprego da forma regularizada, caso o antecedente seja um verbo regular(ver o efeito da forma verbal no modelo e o efeito da presença de construção coordenada). Os fatores acima discutidos podem ser generalizados como fatores que, de um modo ou de outro, atuam sobre a memória em níveis bastante superficiais da sintaxe. Conseqüentemente, suscitam a rediscussão de conceitos de "competência" e desempenho, pois os níveis superficiais a que nos referimos seriam mais próximos do

414

que a Teoria transformacionalista definiria como fatores de desempenho, que, todavia, atuam de maneira sistemática sobre as regras de gramática. (MACEDO, 1981, p.165-6) Por tudo que apresentamos até aqui, temos apenas um ponto na conclusão de Macedo para refutar: que o efeito "gatilho" tem sido pouco estudado dentro da teoria lingüística. Conforme acabamos de ver, ele foi bastante explorado, mesmo antes ou concomitantemente à realização de seu trabalho. Ele apenas não foi

explicitamente incorporado pela teoria

lingüística, como um reflexo de motivação externa, ao lado de outras variáveis que refletem, por

exemplo, a Motivação Icônica, a Motivação

Econômica, a Motivação pelo Fluxo da Informação, ou a Motivação pela Centralidade ou Topicidade da Informação (cf. HAIMAN, 1981; DU BOIS, 1984 e NARO & VOTRE, 1986). Cumpre finalmente mencionar o trabalho de Saraiva & Bittencourt (1987), "A concordância verbal em estruturas com SN complexo no Português: um caso de interferência de fatores metonímicos e metafóricos", embora ele tenha sido desenvolvido numa abordagem bastante diferente dos anteriores: além de não seguir um linha quantitativa, apresenta uma outra forma de coletar e analisar os dados. Mesmo sendo um trabalho diferente dos anteriormente apresentados, Saraiva & Bittencourt mostram que a força da proximidade linear é fundamental na determinação da concordância plural entre o sintagma verbal e o SN mais próximo, inclusive nos casos em que o SN não é o controlador da

concordância

pela

tradição

gramatical

brasileira,

como,

415

por exemplo, "o casamento deles não

deram certo" e "quando ocorre a

anteposição do advérbio, o significado das orações se alteram". Para a concordância plural especificamente, afirmam então as autoras que o SN que determina as flexões número-pessoais do verbo (...) é o SN anteposto que se acha mais próximo dele na cadeia linear, ou seja, a linearidade tem papel atuante. (SARAIVA & BITTENCOURT, 1987, p.21)

A seguir colocam que somos levadas a postular o seguinte: no discurso oral e escrito o SN anteposto, linearmente mais próximo ao verbo independentemente do seu nível hierárquico, é o candidato mais provável de comandar o processo de concordância verbal. (SARAIVA & BITTENCOURT, 1987, p.21)

Em suma, Saraiva & Bittencourt mostram que plural conduz a plural, mesmo quando o núcleo do SN complexo que não está linearmente próximo ao verbo é singular. Para explicar o fenômeno estudado, as autoras se utilizam dos conceitos de metonímia e metáfora, que não pretendemos discutir aqui, por não ser o momento oportuno. Consideramos, todavia, que é a

variável

Paralelismo formal que está comandando também estes casos de concordância verbal, à semelhança do que pudemos ver nos trabalhos de Guy (1981a) e Lage (1987).

416

7.3 - Conclusão Três aspectos serão retomados nesta conclusão: (1) a questão da interdependência entre as diversas ocorrências de uma variável dependente; (2) a questão de que princípios ou motivações externas ou internas estão atuando sobre o uso lingüístico e (3) a questão das motivações em competição atuando sobre um domínio do uso lingüístico. Sobre a primeira questão, os trabalhos de Weiner & Labov (1977), Sankoff & Laberge (1978), Omena (1978), Poplack (1980a e 1980b), Schiffrin (1981), Lira (1982) e Omena (1986) mostram explicitamente que a segunda ocorrência é formalmente dependente da primeira, na busca do Paralelismo formal. Os nossos resultados relativos à variável Pluralidade do contexto evidenciam, além disso, que a primeira ocorrência de uma série, ou a primeira ocorrência de um conjunto de duas ocorrências, é também afetada pela segunda ocorrência. A primeira ocorrência de um SN seguida de outro SN com todas as marcas de plural tem 0,76 de probabilidade de ter também todas as marcas, enquanto a primeira ocorrência do SN seguida de SN parcialmente marcado tem apenas 0,33 de probabilidade de ter todas as marcas de plural e o SN que ocorre isolado apresenta um comportamento neutro: ele tem 0,47 de probabilidade de receber todas as marcas de plural (cf. tabela 6.3.2.1). Os nossos resultados mostram então que temos que estar atentos a esta questão e não assumir simplesmente que a primeira ocorrência independe da segunda, sem efetuar uma codificação que separe a ocorrência isolada dentre as primeiras ocorrências que aparecem seguidas de outra(s).

417

As nossas conclusões e as dos autores acima mencionados trazem então à tona a discussão de um aspecto apontado por Sankoff & Laberge. Segundo eles, tem sido ainda aceita a prática de tratar sucessivas ocorrências de uma variável, mesmo no mesmo enunciado, como um experimento binomial independente. Aqueles que usam este modelo reconhecem, naturalmente, que vários tipos de relações de coocorrência podem se estabelecer entre dados vizinhos de uma variável (...). Entretanto nós geralmente procedemos sob esta hipótese (independência), não somente porque ela simplifica a análise, mas também porque, em termos de sua não freqüência nos dados, relações de coocorrência não afetariam seriamente os resultados dos procedimentos estatísticos para estimar os efeitos de outras restrições lingüísticas e sociolingüísticas. /Grifos nossos/ (SANKOFF & LABERGE, 1978, p.119)143 Consideramos que, diante de tantas evidências de que as ocorrências

vizinhas de uma mesma variável não são independentes, é

necessário que "compliquemos" a análise se quisermos dar conta dos fatos de forma adequada, ou seja, qualquer estudioso de qualquer fenômeno tem de verificar, antes de qualquer outro aspecto, a questão da interferência recíproca entre as sucessivas ocorrências de uma mesma variável. Esta questão se coloca ainda como mais imperiosa se pudermos comprovar que tais tipos de dados não são assim tão infreqüentes. Observando os nossos 948 SNs codificados em função da Pluralidade do contexto, pudemos ver (cf. tabela 6.3.2.1) que há 293 ocorrências vizinhas, primeiras ou segundas, ou seja 31% dos dados, e há 518 isoladas, ou seja, 53% dos dados. O percentual de ocorrências vizinhas não é nada desprezível, ou melhor, é suficientemente alto até para "afetar seriamente os resultados dos procedimentos estatísticos para estimar os

418

efeitos de outras restrições lingüísticas e sociolingüísticas." Dizemos até, porque ainda não realizamos este teste. A forma de fazê-lo seria a seguinte: efetuar uma análise dos 293 SNs, por um lado, e dos

518, por outro,

mantendo-se as demais variáveis, e verificar se os resultados probabilísticos para as demais variáveis permanecem os mesmos. O número de dados de que dispomos não nos permite análises separadas confiáveis. Este ponto fica como sugestão para o futuro. O que é irrefutável é que, se codificarmos os dados relativos a qualquer fenômeno sem olharmos para as interferências mútuas entre as ocorrências vizinhas, estamos

deixando de captar generalizações

importantes que envolvem fenômenos lingüísticos de qualquer língua. O segundo ponto em questão é o que envolve a existência de motivações externas ou internas sobre o uso lingüístico. A influência da variável Paralelismo formal se mostrou como uma força muito poderosa sobre os diversos fenômenos arrolados. Mostrou-se também

de caráter geral, pois,

além de envolver diversos fenômenos

lingüísticos de uma mesma língua, o Português do Brasil, envolve fenômenos de línguas diversas como o Espanhol, o Inglês, o Francês, o Quechua e o Crioulo Caboverdiano. A força do Paralelismo formal não encontra explicação motivações internas do tipo "nivelamento paradigmático"

em

(cf. DU BOIS,

1984) e nem nos diversos tipos de motivação externa até agora conhecidos por nós dentro da literatura lingüística. Os autores por nós pesquisados falam dos seguintes princípios ou motivações externas:

419

1) o Princípio da Iconicidade ou Motivação Icônica (ou Isomorfismo entre forma/significado) (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984); 2) o Princípio da Economia ou Motivação Econômica (ou a tendência a eliminar ou a codificar menos o que é previsível) (cf. HAIMAN, 1980 e 1983; DU BOIS, 1984); 3) o Princípio do Fluxo de Informação Preferido ( ou a pressão discursiva para se codificar a informação nova) (cf. DU BOIS, 1984); 4) o Princípio da Topicidade (pressão discursiva para se codificar tópico/agente) (cf. DU BOIS, 1984); 5) o Princípio da Natureza Comunicativa Periférica da Oração VS (ou o Princípio da Baixa Tensão) (cf. NARO & VOTRE, 1986). Pelo menos os dois primeiros princípios têm sido também discutidos por estudiosos que pertencem a linhas teóricas que observam mais influências internas do que externas. Então, com acepções um pouco diferentes, pois não consideram que os fenômenos lingüísticos possam ser influenciados por pressões discursivas ou por forças que regem o comportamento humano ou a própria estrutura do mundo, vamos encontrar estas discussões, como já vimos, em Kiparsky, através das Condições de Distintividade (cf. 1972, p.195) ou em Martinet, através da Economia da língua (cf. 1973, p.181-5). Os princípios 3 e 4 são discutidos por Du Bois (1984) e apresentados como forças motivadoras externas que atuam para determinar a configuração de línguas ergativas ou línguas não ergativas.

420

O princípio 5 é apresentado por Naro & Votre para dar conta de construções VS ou SV em Português e relaciona-se ao Princípio 4 de Du Bois. Nenhum destes princípios trata da questão do Paralelismo formal, pois ele não tem nenhum vínculo (1) com a necessidade de codificar mais ou menos uma determinada informação ou (2) com a possibilidade de eliminação ou redução de formas lingüísticas e (3) sequer está ligado à forma de se estruturar a informação nova/velha ou à questão de se colocar em relevo, numa situação central ou periférica, as informações transmitidas. Poplack coloca que a influência do Paralelismo formal estaria ligada à lei do menor esforço, conforme estabelecida por Martinet

em 1962.

Retranscrevendo a citação de Martinet, temos o seguinte: Concordância é redundância, e contrário ao que seria esperado, redundância resulta, como uma regra, do menor esforço: pessoas não se importam de repetir se o esforço mental é então reduzido. (MARTINET, 1962, p.55)144 Embora admitamos que a variável Paralelismo formal esteja ligada a algum princípio mental de repetição, que pode até implicar redução de esforço, consideramos que a colocação de Martinet insinua que o falante têm uma influência consciente neste processo de repetição, o que diríamos não ser o que ocorre, inclusive no discurso oral livre. Em verdade, a forma de atuar da variável Paralelismo formal mostra que os falantes são compelidos a usar formas semelhantes por algum princípio mental associativo, que pode estar ligado a uma das formas da mente humana operar, refletido no comportamento humano em geral.

421

Além disso, a idéia que Martinet transmite em 1973 sobre a lei do menor esforço é diferente da encontrada em seu texto de 1962, ou seja, afirma ele em 1973 que o comportamento humano obedece à lei do menor esforço, de acordo com a qual o homem só desprende energia na medida em que esta permita atingir os objetivos que pretende(...) Em cada estágio da evolução, realiza-se um equilíbrio entre as necessidades da comunicação, que requerem unidades mais numerosas, mais específicas, cada uma das quais apareça com menor freqüência nos enunciados, e a inércia do homem, que o leva a empregar um número restrito de unidades de valor mais geral e de uso mais freqüente. /Grifos nossos/ (MARTINET, 1973, p.181)

Também através de Haiman, percebe-se que normalmente se considera a Lei do menor esforço atuando junto à Motivação Econômica. Em suas palavras temos o seguinte: A oposição formal transparente x opaco corresponderá assim à oposição pragmática não usual x familiar. A motivação para a redução, e conseqüentemente para a opacidade, é presumivelmente econômica: 'o princípio do menor esforço'. (HAIMAN, 1983, p.802; cf., também, p.814)145

Sendo assim, é no mínimo paradoxal a dupla forma de interpretar a relação da Lei do menor esforço com as motivações associadas aos fenômenos lingüísticos aqui focalizados. Por outro lado, tivemos a oportunidade de ver que Naro estabelece um princípio geral para explicar também a existência de sujeitos vazios com verbos sem concordância nos seguintes termos:

422

O princípio subjacente geral por trás do comportamento de ambos os tipos de construções é a redução na quantidade de marcas superficiais. Para verbos com concordância, isto reduz a redundância sujeito/verbo e para verbos sem concordância isto reduz o conflito sujeito/verbo. (NARO, 1981b, p.356)146 Todavia, consideramos que o princípio estabelecido por Naro não dá conta de forma adequada da relação entre verbos sem concordância

e

sujeitos vazios, por um lado, e verbos com concordância e sujeitos explícitos, por outro, pois não se trata da redução de

quantidade de marcas

superficiais, mas sim do processamento com paralelismo.

É exatamente

neste ponto que se coloca a variável Paralelismo formal: sujeito zero com verbo de desinência zero e sujeito explícito com verbo de desinência explícita. A generalização correta neste caso é então Processe com paralelismo formal. Este princípio pode estar ligado a um princípio mais geral ainda: Processe com paralelismo (cf. MOLLICA, 1978, p.68-75). Neste sentido, o princípio específico estabelecido por Naro, para estes casos, é mais adequado, qual seja: elimine conflito (cf. 1981b, p.355). Usando as palavras de Macedo (1981), este tipo de processamento se coloca a níveis bem superficiais da memória, mas exerce uma influência sistemática no uso que o ser humano faz de sua língua, o que, inevitavelmente, provocará, ao longo do tempo, alterações na forma de sua gramática. Se este tipo de variável exerce uma influência sistemática e geral, uma teoria lingüística que queira dar

conta da sistematicidade e da

generalidade que envolvem o uso lingüístico, com conseqüências na forma ao longo do tempo, tem de incorporar o Princípio do Processamento com Paralelismo, ao lado dos demais princípios já arrolados.

423

A atuação deste princípio no uso lingüístico é regular. Ele opera até que haja alguma outra razão discursiva para que se passe a usar uma outra forma. Alguns tipos de razões discursivas são apontadas explicitamente nos trabalhos de Schiffrin (1981) e Omena (1986). Segundo Schiffrin, a mudança de tempo tem a função de separar certos eventos, embora a sua manutenção não tenha efeito de agrupá-los (cf. p.55) e, segundo Omena, a alternância das formas ocorre em função da mudança de referente, embora também se possa manter a mesma forma, mesmo com a mudança de referente (cf. p.295). Com as colocações acima, entramos então no terceiro ponto de nossa conclusão, que é o da existência das motivações em competição. O Princípio do Processamento com Paralelismo pode estar em competição com um ou outro princípio, dentre os arrolados anteriormente, em função do fenômeno específico estudado. O nosso caso, o da concordância gramatical de número entre os elementos do sintagma nominal, que envolve um mecanismo redundante, tem como principal competidor o Princípio da Economia ou Motivação Econômica que traz em seu bojo "a verdade do axioma geralmente aceito de que o que é previsível recebe menos codificação do que o que não é", nas palavras de Haiman 1983 (cf. p.807). Também nas palavras de Naro (1980), temos que /a/ (...) redundância, não apenas o status de um morfema, é o fator relevante no cancelamento. (...) Então nós podemos formular de forma tentativa um universal: cancelamento de um segmento morfêmico é mais provável do que o cancelamento do segmento correspon-

424

dente não morfêmico se o morfema é redundante(...) (cf. NARO, 1980, p.166)147 Todavia, esta expectativa nem sempre é satisfeita. A nível do SN, uma segunda marca conduz a mais marcas do que a sua ausência. Em verdade, sendo a segunda posição do SN não marcada, a subseqüente será quase que categoricamente não marcada. A nível do discurso, um SN com todas as marcas influencia a presença de outro SN, igual ou semelhante, também com todas as marcas, sendo o inverso também verdadeiro. Todavia, é a Motivação Econômica que, a nosso ver, permite, no caso sob estudo, a possibilidade de variação. A competição entre motivações diferentes para o fenômeno da concordância é colocada explicitamente por Poplack (1980a), a partir do próprio subtítulo de seu artigo: "Competing Constraints on (S) Deletion". Poplack recoloca esta questão nas suas outras duas publicações, sem,

entretanto,

discutir

explicitamente

o

seu

relacionamento

com

motivações de natureza externa, envolvendo o fenômeno estudado. Ao final de um de seus textos, em 1980, ela chega a manifestar uma certa perplexidade diante de seus resultados, afirmando o seguinte: Entretanto, nós temos visto também que, de forma geral, fatores funcionais afetam o cancelamento da marca menos do que qualquer outro grupo de fatores estudado, com exceção do acento seguinte, um resultado que não é prontamente interpretável. Se isto ocorre porque o cancelamento do (S) no Espanhol de Porto Rico não está suficientemente avançado para requerer o funcionamento de fatores funcionais permanece para ser investigado. Os resultados deste estudo indicam, além disso, que problemas levantados por estas restrições em competição não podem ser resolvidos conclusivamente pelo exame apenas do SN. Resposta a estas questões podem também residir em outra área

425

da estrutura lingüística, tal como o sintagma verbal. Um estudo funcional da variabilidade na marcação verbal nos permitiria extrair conclusões claras sobre o cancelamento e desambiguação no Espanhol de Porto Rico. /Grifos nossos/ (POPLACK, 1980a, p.66-7)148 Por todas as variáveis discursivas que apresentamos ao analisarmos as restrições lingüísticas globais, no item 6.3 do capítulo anterior, e pelo exame da concordância verbal em

Português por outros estudiosos,

pudemos ver que os resultados obtidos são "prontamente interpretáveis" pelo Princípio do Processamento com Paralelismo e pudemos ver ainda mais que, na competição entre o Princípio da Economia e o Princípio do Processamento com Paralelismo, aponta-se este segundo como o candidato a vencedor. E, com base em todos os estudos já efetuados, incluindo o nosso, podemos considerar o Princípio do Processamento com Paralelismo como candidato a universal. Resta saber ainda uma questão: há evidências de que os falantes analfabetos da área rural do Português do Brasil praticamente não apresentam o mecanismo da concordância nominal: eles tendem a marcar a pluralidade do SN apenas no seu primeiro elemento. Então, que princípio motivou a existência deste sistema: o Princípio da Economia ou o Princípio do Processamento com Paralelismo?149 Esta é uma questão que se coloca, a qual não temos condições de responder neste trabalho, embora, no próximo capítulo, tenhamos como objetivo (1) apresentar os resultados das variáveis sociais convencionais que envolvem a concordância nominal, e (2) fazer, nos termos de Labov (1981), as melhores inferências a respeito da mudança em progresso que os dados sincrônicos de tempo aparente podem nos oferecer.

426

8 - RELAÇÃO ENTRE VARIAÇÃO E MUDANÇA

8.1 - Introdução

O nosso objetivo central nesta parte do trabalho é trazer evidências que apontem para uma possível resolução da polêmica que se instalou a respeito da concordância de número em Português, no caso específico a nominal, em termos de se ela reflete ou não um processo de mudança lingüística em progresso, em direção a um sistema sem concordância, conjuntamente ou não a um processo aquisitivo individual "imitativo", ou se ela reflete um fenômeno de variação estável precedido de um processo aquisitivo descrioulizante, no sentido literal deste processo. Como já vimos no item 6.2.2, Braga (1977), Scherre (1978), Ponte (1979) e Carvalho Nina (1980) consideram que esta regra está num processo de mudança caminhando para um sistema sem concordância, num processo de perda, portanto. Naro (1981a), por sua vez, afirma que se podem constatar tendências opostas: uma que evidencia um processo lento de perda da regra e outra um ressurgimento do uso desta mesma regra (cf. p.87) e Guy (1981 e 1986), por outro lado, afirma que não há evidência de mudança em progresso e que o estágio atual é de variação estável, precedido de um processo aquisitivo na forma de descrioulização do Português (cf. 1981, p.198; 238-304 e 1986, p.8-9). Pretendemos, neste capítulo, fazer as melhores conjecturas sobre que tipo de fenômeno reflete a regra sob análise, uma vez que, segundo Labov, "qualquer afirmação sobre mudança é naturalmente uma inferên-

427

cia, pois é muito difícil observar a mudança diretamente (...)."

(1981,

p.177).150

8.2 - Sobre a configuração de variáveis sociais 8.2.1 - O comportamento de variáveis sociais na variação lingüística estável A influência de variáveis sociais em fenômenos lingüísticos variáveis, principalmente nos casos em que uma das variantes é estigmatizada, não constitui nenhuma novidade dentro da literatura lingüística. Já é do conhecimento de todos que, em situação de variação que não envolve mudança, ou seja, na variação estável, normalmente se verifica uma relação diretamente proporcional entre Classe social ou Escolarização e uso de formas de prestígio (cf. LABOV, 1975a, p.115-7; 124 e 127; 1980, p.253-4 e 1981, p.180; KEMP, 1981, p.5-8 e OLIVEIRA, 1982, p.72). Além disso, é normalmente aceito que em tais situações os falantes do sexo feminino tendem a se aproximar da norma estabelecida mais do que os falantes do sexo masculino, mesmo se forem crianças (cf. CHAMBERS & TRUDGILL, 1980, p.73), embora se considere que a diferença entre o comportamento lingüístico dos dois sexos ocorra mais na fala cuidada do que na fala espontânea (cf. LABOV, 1972, p.243 e OLIVEIRA, 1982, p.75). No que tange ao papel da Idade, afirma-se que, nestas situações, ela apresenta ou uma distribuição plana sem gradação etária ou uma distribuição curvilinear, indicando gradação etária, com o ápice das for-mas encontrado

nas

faixas

etárias

de prestígio sendo

intermediárias

de-

428

vido a pressões do mercado de trabalho, por exemplo (cf. CHAMBERS & TRUDGILL, 1980, p.91-3 e OLIVEIRA, 1982, p.74-5).

8.2.2 - O comportamento de variáveis sociais na mudança em progresso A análise de variáveis sociais tem também trazido grandes contribuições para se detectar mudança lingüística em progresso com base em dados sincrônicos. Afirma-se, antes de mais nada, que só se pode falar em mudança lingüística através de resultados de análises sincrônicas se se constatar diferença etária, o que ainda não pode ser considerado como condição suficiente para a existência de mudança, uma vez que diferenças etárias podem indicar apenas gradação de idade. No lugar da distribuição curvilinear, essencialmente característica de variação estável, tem-se então uma distribuição inclinada, com o ápice das formas inovadoras na fala dos jovens e o ápice das formas conservadoras nos mais velhos (cf. CHAMBERS & TRUDGILL, 1980, p.92-3). Uma vez que apenas a distribuição etária não é suficiente para indicar mudança em progresso, buscam-se outros padrões associados por exemplo ao comportamento do Sexo e da Classe social ou aos Anos de escolarização, a fim de se tentar resolver as dúvidas que surgem (cf. LABOV, 1981, p. 183-6). Com relação ao comportamento da variável Sexo, afirma-se, de forma geral, que, numa situação de mudança lingüística em direção ao

429

padrão, a liderança cabe às mulheres da classe média e, caso contrário, aos homens da classe trabalhadora (cf. CHAMBERS & TRUDGILL, 1980, p.978). Mesmo com esta diretriz inicial a respeito da variável Sexo, pode-se ver na literatura lingüística que o seu papel, especialmente o do sexo feminino, na questão da mudança, não é muito claro. Labov, por exemplo, já afirmava, em 1972, que as mulheres usam mais formas avançadas na fala casual e menos na fala formal (cf. p.301), mas, em 1981, desvincula a questão da formalidade da conversa, e mesmo da Classe social, ao afirmar que (...) para comunidades onde mulheres favorecem a forma de prestígio de marcadores estáveis, uma variável que mostra mulheres na liderança pode ser muito bem uma nova mudança em progresso (...).(LABOV, 1981, p.185)151 Além do mais, interpretando literalmente a colocação acima, podemos concluir que as mulheres lideram mudanças que se afastam da norma quando elas usam formas de prestígio em variação estável. Considerando-se que tem sido universalmente aceito que as mulheres são mais sensíveis às formas de prestígio do que os homens na situação de variação estável (cf., também, OLIVEIRA, 1982, p.75), o seu comportamento contrário, distante da norma, deveria ser realmente interpretado como um índice de mudança (cf., ainda, CHAMBERS & TRUDGILL, 1980, p.97). Para evidenciar que a questão é ainda mais complexa do que inicialmente parece, faz-se importante relatar a conclusão a que chegou um grupo de pesquisadores do Rio de Janeiro, através de recente levantamento bibliográfico. Em seu relatório, o grupo conclui que a "manifesta

430

preferência feminina pelas formas aceitas socialmente se verifica tanto nos fenômenos de variação estável como nos fenômenos de mudança em curso." (NARO et alii, 1986, p.25) Esta conclusão mostra então que o comportamento do Sexo, especialmente o das mulheres, não contribui muito para se definir se uma dada variação, com gradação etária inclinada, reflete um fenômeno lingüístico estável ou um fenômeno lingüístico em mudança. Trazendo mais evidências da inoperância da variável Sexo na resolução das questões que estão sob foco, podemos ver que Naro utiliza o comportamento padrão da mulher como uma das evidências de mudança lingüística (cf. 1981a, p.86) e Guy utiliza o mesmo raciocínio para concluir sobre variação estável (cf. 1981a, p.198 e 1986,

p.11-2), envolvendo o

mesmo fenômeno lingüístico: o da concordância de número em Português. Além do mais, Oliveira afirma que os homens, e não as mulheres, é que estão liderando o cancelamento de /R/ no Português do Brasil falado em Belo Horizonte, capital do Estado de Minas Gerais, o que ele interpreta como sendo devido à maior mobilidade que os homens têm na sociedade brasileira. Segundo ele, "em nossa sociedade as tendências ainda não são estabelecidas pelas mulheres." (1982, p.86; cf., também, p.84-5). Por outro lado, segundo Callou a liderança da fricativização e posteriorização do /R/ na fala urbana culta do Rio de Janeiro cabe às mulheres (cf. 1979, p.40; 63; 80; 81; 87; 103 e 150). Com relação ao cancelamento do /R/ final, ela não

encontra

nenhum

condicionamento

social

significativo (cf. 1979,

p.164). Diante das observações acima, a conclusão mais segura que pa-

431

rece se poder estabelecer até o presente momento é que há uma tendência geral de as mulheres se aproximarem do padrão e de os homens se distanciarem dele, independente de o fenômeno lingüístico envolver variação estável ou mudança lingüística. Com relação à influência da Classe social e da Escolarização dos falantes, tem-se afirmado que um padrão curvilinear configura uma mudança em progresso. Neste caso, as formas mais inovadoras são encontradas nos grupos que se localizam no centro da hierarquia (cf. LABOV, 1975a, p.133-4 e 1980, p.254). Todavia, Oliveira discute estas colocações, pois afirma que pode não ocorrer padrão curvilinear para todos os informantes e mesmo assim haver mudança em progresso, se se constatar uma distribuição social acentuada para os jovens e não acentuada para os velhos (cf. p.78-83). Conseqüentemente,

Oliveira

considera

que

as

mudanças

não

necessariamente se iniciam nos grupos sociais intermediários, podendo também se iniciar

nos grupos

das

extremidades, dependendo da

configuração da sociedade cuja língua é analisada. No seu caso específico, ele considera que a mudança se inicia no grupo social mais baixo (cf. p.835). Oliveira relembra ainda que todas "as explicações de Labov se apóiam basicamente na noção de prestígio" (p.86). Contudo, ele considera que a estratificação social não se apóia necessariamente em noções desta espécie e propõe então que a estratificação social é um resultado direto da maneira pela qual a sociedade se organiza. Uma vez que sociedades diferentes se estruturam de modos diferen-

432

tes, é de se esperar que diferentes padrões de estratificação social de linguagem sejam encontrados. As novas mudanças serão levadas adiante, nos centros urbanos, por aqueles grupos cujas características sociais determinam as características sociais gerais da comunidade. (...) Nos países não industrializados, ou naqueles onde o processo de industrialização é recente, estes grupos intermediários não se constituem o grosso da população. (OLIVEIRA, 1982, p.88) Oliveira conclui assim que o fato de a mudança lingüística que envolve o cancelamento do /R/ estar sendo liderada pelos homens jovens de classe baixa constitui um "reflexo direto da estrutura da sociedade na cidade de Belo Horizonte." (p.88)

8.2.3 - Sobre o cruzamento de variáveis sociais Tem sido também colocado que o cruzamento de variáveis sociais pode trazer novas luzes a respeito de sua influência, quer com respeito a fenômenos de variação estável, quer com respeito a fenômenos de mudança em progresso. Kemp, em seu artigo "Major sociolingüistic patterns in Montreal French", afirma que conclusões interessantes emergem (...) somente quando certas combinações dos quatro fatores básicos, idade, atividade econômica, sexo e escolarização são levadas em considerações. (KEMP, 1981, p.4)152

Do cruzamento de variáveis como Sexo e Idade, sugere-se, por exemplo, que

433

mulheres mais velhas são mais sensíveis a variantes padrão do que os homens do mesmo grupo de idade. Mulheres mais velhas parecem usar mais variantes padrão na conversação normal, mas adicionalmente, dada à inconsistência relativa de uma variável para outra, é mais provável que elas façam uso mais amplo de mudança de estilo. (KEMP, 1981, p.4-5)153 Conforme acabamos de ver no item anterior, Oliveira (1982) utiliza-se do cruzamento de variáveis como Classe social e Faixa etária, por um lado, e Classe social e Sexo, por outro, a fim de mostrar que a ausência de padrão curvilinear na Classe social como um todo não é condição suficiente para se descartar a possibilidade de um dado fenômeno variável sob estudo refletir um processo de mudança lingüística em progresso. Neste trabalho, vamos também fazer análises cruzadas, objetivando trazer maiores esclarecimentos sobre as questões aqui colocadas.

8.3 - Reflexões sobre a mudança em progresso Por tudo que apresentamos nos itens 8.2.1 a 8.2.3, já se constata que é uma tarefa difícil concluir se um fenômeno lingüístico variável reflete uma mudança em progresso ou um estágio de variação estável. Estas dúvidas foram surgindo com o desenrolar dos estudos variacionistas e culminam num texto de Labov em 1981. Neste texto, intitulado "What can be learned about change in progress from synchronic descriptions?", Labov afirma que muitas mudanças discutidas sob este rótulo não estão provavelmente em progresso, mas em variação que pode estar sendo estável por séculos. (LABOV, 1981, p.177)154

434

A seguir, Labov (1981) coloca que o lapso temporal ideal para se detectar uma mudança lingüística em progresso, permitindo encontrar mudanças relevantes e permitindo eliminar a possibilidade de movimento reverso, seria correspondente, no mínimo, à metade de uma geração e, no máximo, a duas gerações (p.177), ou seja, se situaria num intervalo aproximado de 12 a 50 anos. Labov afirma também que, mesmo com estudos que consideram a comunidade e os indivíduos, com dados do tempo aparente e dados do tempo real, não se pode afirmar com certeza absoluta que estamos diante de uma mudança em progresso ou diante de uma variação estável (cf. p.182). Segundo ele, a única forma de se ter certeza sobre os aspectos em discussão consiste em estudar um fenômeno numa época determinada e, posteriormente, voltar ao mesmo local e reestudar o mesmo fenômeno, procurando ver o que ocorreu, à semelhança do caso clássico e único ocorrido em Charmey na Suíça. Segundo ele, neste estudo, Gauchat realizou análises de uma série de fenômenos lingüísticos em 1905, postulando a existência de seis mudanças em progresso, e Hermann em 1929 reestudou os mesmos fenômenos concluindo que realmente quatro dos fenômenos estudados eram mudanças em progresso, mas os dois restantes eram casos de variação estável (cf. p.177). Estas mudanças em progresso foram detectadas no intervalo de 24 anos. Segundo Labov, o que ocorreu neste caso clássico é raro, o

que implica afirmar que "(...) nós estamos

freqüentemente na posição de tentar as melhores conjecturas que podemos fazer sobre mudança em progresso a partir de dados sincrônicos." (p.183)155

435

Há três estudos em Português que apontam explicitamente fenômenos envolvidos em mudanças em progresso, os quais são: a concordância de número, por Naro (1981a), a fricativização e posteriorização do R, por Callou (1979) e o cancelamento do R, por Oliveira (1982). Estes três fenômenos estão envolvidos em lapsos temporais mais amplos do que o idealmente colocado por Labov (1981), sugerindo-se que as mudanças em questão não são tão fortes e sugerindo-se também cautela para futuros estudiosos, no sentido de considerarem a possibilidade de movimento reverso. Para a concordância verbal de número especificamente, Naro situa a sua origem no processo de desnasalização da sílaba final, que ocorre pelo menos desde 1901 em Portugal (cf. p.91): intervalo temporal de 75 anos. As evidências do tempo real apresentadas por Callou datam de 1883, o que perfaz um intervalo aproximado de 90 anos, considerando que os seus dados foram obtidos entre 1972 e 1975 (cf. p.17-8). Se

observarmos

também

atentamente

as

evidências

do

cancelamento do /R/ no tempo real apresentadas por Oliveira, vamos verificar que, para o cancelamento do /R/ final, encontram-se informações que datam de meados do século XIX e início do século XX, o que perfaz um intervalo de, no mínimo, 80 anos, senão de 130. Mesmo as primeiras evidências relativas ao cancelamento do /R/ interno já se encontram no "final da década de 30 e início da década de 40, no século XX" (p.78), o que perfaz um intervalo de aproximadamente 42 anos. Com relação ainda à concordância de número no Português popular do Brasil, especialmente no que diz respeito à concordância de núme-

436

ro entre os elementos do SN, há, desde 1920, relatos explícitos dos dialetólogos sobre a sua variação na fala das camadas populares, que chegava a se estender até mesmo para o falar das pessoas "educadas e bem falantes" (cf. AMARAL, 1920, p.14 e Introdução), verificando-se então um intervalo de 62 anos, pois a nossa amostra data de 1982. Novos relatos de ausência de concordância nominal são encontrados em Monteiro (cf. 1933, p.63-4), Marroquim (cf. 1945, p.111-3), Melo (cf. 1946, p.63-4) e Nascentes (cf. 1953, p.81-4). Melo coloca explicitamente que até nas camadas acima de médias ainda se pode pescar aqui e ali no falar descuidado ausência de flexão numérica nos nomes e nas terceiras pessoas do verbo. (MELO, 1946, p.64)

Se as supostas mudanças em progresso no Português do Brasil fossem fortes, seria de se esperar que elas já tivessem se completado, à semelhança do que ocorreu em Charmey na Suíça. Como veremos a seguir, o próprio Naro já considera a possibilidade de movimento reverso envolvendo a concordância de número.

8.4 - Posições controversas sobre a concordância de número no português popular brasileiro Em 1981, Naro publica o seu artigo intitulado "The social and structural dimensions of a syntactic change", que constitui versão ampliada de um outro artigo seu, feito juntamente com Lemle em 1976, intitulado "Syntactic diffusion". O Seu objetivo principal é o estabelecimento de

437

uma hipótese geral sobre a mudança sintática (cf. 1981a, p.64). Para tanto, discute a questão da direcionalidade da mudança lingüística, através do estudo de variáveis lingüísticas e sociais envolvendo a concordância verbal de número na terceira pessoa, com base em amostras de fala de pessoas semi-escolarizadas. No desenrolar de sua demonstração, utiliza-se também dos resultados obtidos por Votre (1979) relativos ao processo de desnasalização, e por Scherre (1978), sobre a concordância de número entre os elementos do sintagma nominal. Naro considera que a concordância de número em Português, especificamente a verbal, encontra-se num processo de mudança, caminhando em duas direções opostas: uma em direção a um sistema sem marcas; outra em direção a um sistema com marcas. A primeira direção envolve, portanto, um mecanismo de perda das marcas de concordância e a segunda, um mecanismo de aquisição destas mesmas marcas. Dentre quatro variáveis sociais estudadas, destaca o papel da idade (jovens x velhos) e da Orientação cultural (vicária ou experiencial) no processo de mudança em questão. A variável Orientação cultural é caracterizada por Naro em termos do "grau de penetração do indivíduo na cultura dos níveis sócio-econômicos vizinhos mais altos, como refletido em seus hábitos de ver televisão." (1981a, p.86)156 Os falantes que evidenciaram um maior contato com as novelas foram então classificados como "vicários" e, caso contrário, como "experienciais" (cf. p.84). A passagem transcrita a seguir reflete com clareza a posição de Naro, com relação ao funcionamento das duas variáveis sociais em jogo.

438

Por um lado, nós vimos na variável idade a continuação de um processo lento de morte da regra, relacionado a mudanças similares no SN e em qualquer outra parte. Esta variável é, por assim dizer, exterior ao falante, impingindo sobre ele sem qualquer motivação interna. A variável Orientação, por outro lado, reflete o ressurgimento no uso da mesma regra que vem de dentro do falante, dependendo de sua orientação cultural.(NARO, 1981a, p.87)157 Naro observa, todavia, que a variável Orientação cultural tem um efeito maior do que a variável Idade e, além disso, afirma que ela tem mais efeito entre os jovens do que entre os velhos. Com base nisto, considera que se a orientação vicária continuar a se espalhar entre os falantes jovens, dada a diferença de Idade relativamente pequena, a situação poderia brevemente atingir um ponto onde aquele grupo produziria uma taxa mais alta de concordância do que os falantes mais velhos. Uma vez que não há barreiras sociais entre os dois subgrupos de orientação cultural, a certo ponto no tempo o ressurgimento no uso da regra de concordância poderia até se espalhar através do grupo jovem, independentemente da variável orientação, e produzir um reverso na tendência em direção à eliminação da regra. Estudos futuros determinarão se há alguma validade nesta especulação. (NARO, 1981a, p.88)158 O estudo das variáveis lingüísticas, por sua vez, possibilita a Naro o estabelecimento da hipótese geral sobre a mudança sintática, com base no Princípio da saliência. Dentre

as

variáveis

lingüísticas

analisadas,

observa,

sob

a

perspectiva do Princípio da saliência, a Tonicidade dos itens lexicais na sua forma plural, a Diferenciação material fônica na relação singular/plural e a Posição do sujeito em relação ao verbo. Ele considera então mais salientes os itens acentuados, os que apresentam maior diferenciação na relação singular/plural e os que são antepostos ao verbo. Examina estas dimensões também

na

concordância

nominal,

verificando

relações

bastante

439

paralelas. Especialmente com relação à variável Posição do elemento nominal dentro do SN, considera que o fato da incidência de plural ocorrer de forma decrescente em função da primeira, segunda, terceira, quarta e quinta posição confirma a operação do Princípio da Saliência da mesma forma que grupo da posição verbal (cf. NARO, 1981a, p.95). Fazendo também alusões ao trabalho de Votre (1979), coloca então que é possível se estabelecer o ponto inicial da mudança bem como os ambientes para os quais ela se espalha. O seu modelo estabelece, portanto, o seguinte: (...) a mudança sintática se inicia no ponto onde diferenciação superficial entre o sistema novo e o velho é zero (ou quase); mais tarde ela se difunde através da língua na proporção inversa ao grau de saliência das diferenças superficiais entre sistemas em cada ambiente particular. (NARO, 1981a, p.63; cf., também, p.96-7)159 Naro coloca ainda que a hierarquia da saliência é uniforme para todos os falantes e que a diferença entre grupos mais ou menos avançados repousa apenas na probabilidade global de uso da regra (cf. p.88-90 e 97). Após algumas considerações sobre a forma da mudança se implementar, admite finalmente que uma nova estrutura pode ser (...) parcialmente bloqueada por um certo período de tempo. É somente a longo prazo, não no seu início ou progresso, que mudança lingüística produz resultados relativamente 'naturais' e uniformes. (NARO, 1981a, p.97)160

Uma posição diferente da de Naro é colocada em 1981 por Guy,

440

em "Linguistic variation in Brazilian Portuguese: aspects of the phonology, syntax, and language history" e, novamente em 1986, em "Saliency and the direction of syntactic change". Conforme já é do nosso conhecimento, Guy analisou todos os dados do corpus do projeto desenvolvido por Lemle e Naro, cujos resultados foram publicados em 1977, em Competências básicas do português. Sobre a concordância verbal, Guy analisou então basicamente os mesmos dados analisados por Naro, com variáveis lingüísticas e sociais comuns e diferentes. Como também já sabemos, os dados de Scherre (1978) relativos à concordância nominal, para os falantes semi-escolarizados, foram igualmente obtidos através do projeto referido acima. Sendo assim, parte dos dados de Scherre, cujos resultados são usados por Naro, são também reanalisados por Guy em 1981 e reutilizados em 1986. Com base nas variáveis sociais Idade e Sexo e com base em resultados de Braga (1977) e Scherre (1978) a respeito da diferença de uso da concordância nominal em função da Classe social ou Anos de escolarização, Guy (1981a e 1986) conclui que a regra de concordância de número reflete uma variação sociolingüística estável. Além disso, considera que esta variação é precedida de um processo aquisitivo descrioulizante, a partir de um suposto crioulo de base portuguesa e gramática africana. Para argumentar que o fenômeno em questão é um caso de variação estável, afirma ele o seguinte: 1) a Idade mostra uma distribuição plana; 2) o Sexo evidencia as mulheres usando mais formas de prestígio do que os homens e

441

3) a Classe social mostra uma distribuição inclinada, com formas estigmatizadas nas classes mais baixas e formas de prestígio nas mais altas.

Conclui então, com base em Labov (1981), que os indicadores acima configuram uma variação estável e não um processo de mudança em progresso. Para sustentar a hipótese de que a variação estável da concordância de número no Português popular brasileiro vem da descrioulização de um suposto crioulo de léxico português e gramática africana, Guy apresenta dois tipos de argumentos: um de natureza histórica e outro de natureza lingüística. No que diz respeito ao argumento de natureza histórica, Guy coloca que a história social do Brasil é semelhante à das áreas nas Américas onde línguas crioulas se desenvolveram. (cf. 1981a, p.283-8; 309-13 e 1986, p.10 e 63). Com relação ao argumento de natureza lingüística, Guy apresenta uma longa exposição a respeito da explicação mais plausível para o fato de a marca de plural em Português tender a ocorrer na primeira posição do SN, com base em características de diversas línguas africanas, além de considerar que a escala da Saliência fônica não ocorre da forma encontrada por Scherre (1978) (cf. GUY, 1981a, p.294-305 e 1986, p.41-50.).161 Uma vez que considera que a regra de concordância de número, neste estágio de variação estável, é precedida de um processo de aquisição, Guy discute o papel do Princípio da saliência neste processo, considerando então que ele funciona de forma exatamente contrária à proposta por Naro (1981a),

ou

seja,

a

regra

é

adquirida

a

partir

dos

ambientes

442

mais salientes para os menos salientes, progressivamente (cf. 1981a, p.2949 e 1986, p.10-21;39). Embora Guy seja muito enfático ao colocar que a sua proposta difere da de Naro, é importante salientar que esta forma de funcionamento do Princípio da Saliência encontra-se explicitamente prevista em Naro & Lemle, como se pode constatar na seguinte passagem: (...) embora não tenhamos evidências firmes, nós supomos que mudança sintática implementada por hipercorreção ou por aprendizagem funcionaria de forma oposta, surgindo nos ambientes mais salientes. (NARO & LEMLE, 1976, p.237; 1977, p.267)162 Esta posição é reiterada por Naro, em 1986, como veremos a seguir. Uma série de outras discussões são apresentadas por Guy, mas destacamos aqui apenas os tópicos que achamos interessante retomar e para os quais temos resultados lingüísticos e sociais que podem validar ou refutar questões por ele propostas (cf. 1981a, p.304-9; p.51-8). Antes de mais nada, é oportuno observar que Naro (1986), em "Comments on 'Saliency and the direction of syntactic change'", discute uma série de colocações de Guy, dentre as quais cumpre destacar a que diz respeito à questão da origem descrioulizante do Português popular brasileiro. Segundo Naro, esta hipótese, embora sedutora, não tem base na realidade, pois não há nenhuma possibilidade de se comprovar a existência de um crioulo de léxico português com gramática africana, uma vez que simplesmente não há dados disponíveis (cf. p. 2-4). Além disso, Naro afirma que, já em 1976, Naro & Lemle não estabelecem direcionalidade no funcionamento do Princípio da saliência, podendo este princípio fun-

443

cionar em ambas as direções, dependendo se a mudança caminha para um sistema com ou sem marcas. Então, segundo Naro, (...) dado somente um corte sincrônico de um fenômeno variável qualquer que obedece à restrição da saliência não há forma de se determinar se uma mudança está atualmente em progresso ou se ela foi interrompida por alguma razão antes de se completar, assim como é em princípio impossível de se estabelecer qual é (ou era) a direção da mudança. As questões são mais complicadas pela consideração do local da mudança - na comunidade como um todo, em subcomunidades, ou no indivíduo. (NARO, 1986, p.1)163 Naro relembra que ele tratou a concordância verbal no Português popular brasileiro como um caso de mudança em progresso natural, caminhando para um sistema sem marcas, como uma característica da comunidade e que tratou a mudança em direção contrária como uma característica dos indivíduos, admitindo que ela podia se estender à comunidade, enquanto Guy admite apenas a mudança como um processo aquisitivo em termos de comunidade, num processo de descrioulização, para o qual não se tem documentação disponível. Segundo ele, as evidências existentes são inclusive contrárias à existência

do suposto crioulo (cf.

NARO, 1986, p.1-4). Sendo assim, após uma série de outros comentários, Naro conclui que as idéias de Guy não diferem das suas em princípio, mas apenas em grau, uma vez que a sua grande e principal tese - a da descrioulização - é impossível de ser comprovada (cf., também, p.9). Naro considera finalmente que é possível e interessante se empreenderem estudos que evidenciem que (...) houve uma convergência de motivos para a atuação da perda da CVS e CSN no Brasil: 1) desenvolvi-

444

mento interno natural da língua (Naro 1981); 2) comportamento pidginizante da parte dos Europeus (como visto em Naro 1978, mas para um período anterior e sob condições sociais diferentes); 3) aprendizagem imperfeita pelos falantes de diversas bagagens lingüísticas. (NARO, 1986, p.10)164 Feitas estas considerações, passemos a apresentar os resultados das variáveis de nossa pesquisa.

8.5 - Sobre os resultados das variáveis sociais Com base nas diversas idéias existentes sobre variação e mudança, codificamos os nossos dados em função das características sociais estratificadas da nossa amostra. Vamos então apresentar resultados probabilísticos obtidos em função das seguintes variáveis sociais, com suas respectivas categorizações: 1) Anos de escolarização: um a quatro anos (antigo primário); cinco a oito anos (antigo ginasial) e oito a 11 anos (antigo colegial); 2) Sexo: feminino e masculino; 3) Faixas etárias: sete a 14 anos; 15 a 25 anos; 26 a 49 anos e 50 a 71 anos. É importante relembrar que sempre fizemos

a análise dos dados

dos falantes de sete a 14 anos, as crianças, separada da análise dos demais falantes, os adultos, a fim de observarmos as semelhanças e/ou diferenças entre o comportamento destes dois grupos de falantes. Nesta parte, vamos apresentar também análises conjuntas sempre que isto se mostrar interessante para os objetivos que temos em mente.

445

A tabela 8.5.1, a seguir, contém os resultados relativos às variáveis Anos de escolarização, Sexo e Faixas etárias dos falantes adultos. TABELA 8.5.1 VARIÁVEIS SOCIAIS DOS ADULTOS ANOS DE ESCOLARIZAÇÃO

Apl./Total

%

Prob.

1a 4 5a 8 9 a 11

2413/3903 = 2605/3613 = 2843/3453 =

62 72 82

0,32 0,53 0,65

SEXO Feminino Masculino

4397/5680 = 3464/5289 =

77 65

0,59 0,41

FAIXA ETÁRIA 15/25a 26/49a 50/71a

2244/3126 = 2891/3845 = 2726/3998 =

72 75 68

0,49 0,54 0,47

Os resultados relativos aos Anos de Escolarização evidenciam que há uma relação diretamente proporcional entre o aumento dos anos de escolarização e o índice de plural nos SNs: um a quatro anos de Escolarização com probabilidade de 0,32; cinco a oito com 0,53 e nove a 11 com 0,65. Os resultados relativos à variável Sexo mostram que as mulheres se aproximam do padrão mais do que os homens, com probabilidades respectivas de 0,59 e 0,41. Os resultados relativos às Faixas etárias apresentam uma distribuição curvilinear não acentuada: os falantes das três faixas etárias apresentam, respectivamente, as seguintes probabilidades: 0,49; 0,54 e 0,47. Para termos as

probabilidades

relativas

também

aos

falantes

de

sete

a

446

14 anos, efetuamos uma etapa de análise com todos os falantes e obtivemos os seguintes resultados probabilísticos: 1) 7 - 14 anos: 0,45; 2) 15 - 25 anos: 0,51; 3) 26 - 49 anos: 0,56; 4) 50 - 71 anos: 0,48. A distribuição etária considerando todos os falantes continua a se mostrar levemente curvilinear: a maior diferença encontrada é de 0,09 entre os falantes de sete a 14 anos e os de 26 a 49 anos. Os resultados acima nos levam inicialmente a corroborar as colocações de Guy 1981a e 1986 no sentido de que a concordância de número entre os elementos do sintagma nominal reflete um fenômeno de variação estável, uma vez que (1) as formas de prestígio e as formas estigmatizadas são encontradas, respectivamente, nos grupos de maior ou menor grau de escolarização; (2) as mulheres, por sua vez, apresentam menor uso de formas estigmatizadas e (3) a distribuição das faixas etárias não revela nenhum ápice de uso de formas pelos jovens, quer as de prestígio quer as estigmatizadas. Pela configuração acima, seríamos levados a concluir que o fenômeno lingüístico estudado reflete uma variação lingüística estável, com uma gradação etária pouco acentuada. Os resultados relativos Às variáveis Anos de escolarização e Sexo nos falantes de sete a 14 anos contribuem para esta possível conclusão como se pode ver na tabela 8.5.2.

447

TABELA 8.5.2 VARIÁVEIS SOCIAIS DAS CRIANÇAS ANOS DE ESCOLARIZAÇÃO

Apl./Total

1a4 5a8

544/890 841/1231

738/1065 647/1056

SEXO Feminino Masculino

%

Prob.

= =

61 68

0,45 0,55

= =

69 61

0,59 0,41

As meninas e não os meninos se aproximam mais do padrão e, embora com menor polarização, os falantes de cinco a oito anos de escolarização também se aproximam mais do padrão do que os de um a quatro anos de escolarização. Guy encontrou uma configuração semelhante no que diz respeito á variável Sexo trabalhando apenas com dados de falantes semi-escolarizados e nós obtivemos os resultados acima agrupando falantes de diversos anos de

escolarização.

Parece

bastante

sedutora

esta

uniformidade

de

comportamento em falantes de níveis de escolarização diversos. Todavia, tendo em mente as idéias de Guy de que o estágio atual de variação sociolingüística estável é reflexo de um processo descrioulizante, fruto da aquisição parcial das regras de concordância do dialeto padrão (cf. 1981a, p.340-2 e 1986, p.8-9), decidimos tentar obter em nossos dados suportes empíricos para a sustentação ou não desta hipótese. Para alcançar este objetivo, reagrupamos os falantes adultos de nossa amostra em função de dois aspectos: o seu tipo de ambiente de origem e o seu grau de concordância, categorizados binariamente. Obtivemos assim quatro agrupamentos:

448

1) falantes de ambiente humilde e concordância baixa; 2) falantes de ambiente não humilde e concordância alta; 3) falantes de ambiente humilde e concordância alta; 4) falantes de ambiente não humilde e concordância baixa. Os falantes de ambiente humilde e concordância baixa constituem o protótipo do falante não descrioulizado, pois são de ambientes do qual se espera pouca concordância e apresentam-na da forma esperada; os falantes de ambiente não humilde e concordância alta são falantes que sequer passaram por processo de descrioulização, pois participam de um ambiente que lhes propiciou a aquisição de um sistema padrão, pressupostamente sem

nenhuma

característica

crioula.

Estes

dois

grupos

constituem

exatamente os extremos da situação lingüística que se imagina ter existido no Português do Brasil. Vamos ainda encontrar dois agrupamentos intermediários de falantes: os de ambiente humilde mas de concordância alta, que são os falantes em processo de descrioulização, ou já descrioulizados, ou seja, eles são de ambiente humilde, no qual se

pressupõe uma baixa concordância, mas

apresentam-na alta; e os de ambiente não humilde, de onde se espera um nível de concordância alto, mas cujos percentuais são relativamente baixos. Com base na história de vida dos falantes, delineada pela socióloga Marta Helena Rosa por ocasião de sua participação na equipe do Projeto Censo, e com base em depoimentos orais de uma das entrevistadoras da equipe, Maria da Conceição A. de Paiva, hoje participante ativa

449

da equipe científica do referido projeto, classificamos os 48 falantes adultos de nossa amostra em função do seu ambiente de origem. Após o processo classificatório, obtivemos o seguinte quadro:

1) 16 falantes de ambiente humilde; 2) 15 falantes de ambiente não humilde e 3) 17 falantes de ambiente mais ou menos humilde.

Tivemos o cuidado de separar os casos intermediários, a fim de que pudéssemos trabalhar apenas com os falantes de ambientes inequívocos, ou seja, com 31 dos 48 falantes adultos. Através do índice individual de concordância, obtivemos quatro grupos naturais:

1) 10 falantes de ambiente humilde e concordância baixa; 2) 11 falantes de ambiente não humilde e concordância alta; 3) seis falantes de ambiente humilde e concordância alta; 4) quatro falantes de ambiente não humilde e concordância baixa.

Dos 10 falantes de ambiente humilde e concordância baixa, cinco são do sexo feminino e cinco, do sexo masculino. Para este grupo, a distribuição de sexo é equilibrada, quer em termos de número de falantes, quer em termos do grau de concordância.

450

Mas, dos 11 falantes de ambiente não humilde de concordância alta, apenas um é do sexo masculino, enquanto os outros 10 são do sexo feminino: este aspecto já é suficiente para mostrar porque a variável Sexo apresenta

resultados

lingüísticos

favorecedores

da

presença

de

concordância para as mulheres e não para os homens na análise geral (ver tabela 8.5.1). O favorecimento do sexo feminino encontra também respaldo na distribuição dos quatro falantes de ambiente não humilde e concordância baixa: apenas um é mulher e os outros três são homens. É na distribuição dos seis falantes de ambiente humilde e concordância alta que as mulheres perdem a supremacia de concordarem mais: quatro deles são homens e apenas dois são mulheres. Entretanto, é interessante desde já adiantar que, dentro dos quatro novos subagrupamentos, os percentuais de concordância dos homens são sempre superiores ao das mulheres, o que não se deve necessariamente à variável Sexo. Sabemos que há, por exemplo, uma única mulher de ambiente não humilde e concordância baixa que apresenta menos concordância do que os outros três falantes de igual característica. Mas, enquanto esta mulher só cursou o primário, dois dos três homens cursaram o colegial e o terceiro cursou o ginasial. A distribuição etária destes 31 falantes é bem equilibrada no grupo de ambiente humilde e concordância baixa e no grupo de ambiente não humilde e concordância alta.

Dos 10 falantes do primeiro caso, 1) quatro têm de 15/25 anos;

451

2) dois, de 26/49 anos e 3) quatro, de 50/71 anos.

Dos 11 falantes do segundo caso, 1) quatro têm de 15/25 anos; 2) quatro, de 26/49 anos e 3) três, de 50/71 anos.

A distribuição etária dos outros dois grupos não é completa, pois não há falantes nas três faixas etárias.

Dos seis falantes do grupo de ambiente humilde e concordância baixa, 1) quatro têm de 15/25 anos e 2) dois, de 26/49 anos.

Dos quatro falantes de ambiente não humilde e concordância baixa, 1) dois têm de 15/25 anos e 2) dois, de 50/71 anos.

Mesmo assim, podemos afirmar que, com um número tão pequeno de falantes, a distribuição etária é bastante regular. A distribuição mais irregular desta nova forma de agrupar os falantes diz respeito aos Anos de escolarização. Os de ambiente humilde concentram-se no primário e os de ambiente não humilde, no colegial. Vejamos a distribuição grupo a grupo:

452

1) dos 10 falantes de ambiente humilde e concordância baixa, sete são do primário (70%), dois do ginasial (20%) e um do colegial (10%); 2) dos 11 de ambiente não humilde e concordância alta, 10 são do colegial (91%) e um do ginasial (9%); 3) dos seis de ambiente humilde e concordância alta, três são do primário (50%), dois do ginasial (33%) e um do colegial(17%); 4) dos quatro falantes de ambiente não humilde e concordância baixa, um é do primário (25%), um é do ginasial (25%) e dois do colegial (50%). Embora haja uma correlação bastante estreita entre tipo de ambiente, grau de escolarização e grau de concordância, vista a olho nu, o percentual de falantes do primário de ambiente humilde com concordância alta é bastante significativo: 50% (3/6). Também é significativo o percentual de falantes do colegial de ambiente não humilde com concordância baixa: igualmente 50% (2/4). Consideramos interessante observar detidamente estes casos, uma vez que eles fogem da correlação esperada e normalmente estabelecida, em se tratando de variação sociolingüística estável. Antes de apresentarmos os resultados para os 31 falantes adultos subdivididos em termos de ambiente e de grau de concordância, gostaríamos de observar que temos consciência de que o número de falantes com todas as características sociais em questão (ambiente, grau de concordância, sexo, faixa etária e anos de escolarização), por célula, ficou extremamente subdivido:

em

nenhuma

das

possíveis

combinações

temos

453

cinco falantes com as mesmas características e há combinação possível totalmente vazia. O número de cinco falantes por célula tem sido considerado como um número ideal para que padrões sociais regulares possam emergir (cf. LABOV, 1981, p. 197 e TARALLO, 1985, p.29-30). Mas, considerando que (1) dispomos de muitos dados; (2) possuímos um instrumental estatístico apropriado para tratar destas situações e (3) estamos no campo das conjecturas, achamos válido apresentar os resultados obtidos, extraindo deles as melhores conclusões possíveis. Vejamos então os resultados na Tabela 8.5.3.

454

TABELA 8.5.3 VARIÁVEIS SOCIAIS: TIPO DE AMBIENTE E GRAU DE CONCORDÂNCIA VARIÁVEIS

FALANTES Ambiente humilde conc.baixa

Ambiente não hum. conc.alta

Ambiente humilde conc.alta

Ambiente não hum. conc.baixa

276= 47% 581 0,38

681= 85% 804 0,44

671= 78% 857 (0,46)

266= 65% 412 0,38

295= 54% 546 0,59

934= 92% 1010 0,64

538= 87% 621 (0,54)

xxx

427= 53% 812 0,53

789= 85% 924 0,41

xxx

301= 66% 452 0,62

738= 52% 1428 (0,47)

xxx

398= 75% 529 0,33

156= 61% 254 0,33

129= 48% 268 (0,47)

534= 89% 598 (0,53)

460= 81% 568 0,47

132= 68% 194 0,57

131= 54% 243 (0,56)

1870= 87% 2140 (0,47)

351= 92% 381 0,70

279= 67% 416 0,60

525= 50% 1043 (0,48)

2322= 88% 2648 (0,42)

313= 80% 389 (0,52)

156= 61% 254 (0,39)

473= 53% 896 (0,52)

82= 91% 90 (0,58)

896= 82% 1089 (0,48)

411= 67% 610 (0,61)

FAIXA ETÁRIA 15/25 anos

F. P.

26/49 anos

F. P.

50/71 anos

F. P.

ANOS DE ESCOLARIZAÇÃO 1a4

F. P.

5a8

F. P.

9 a 11

F. P.

SEXO Feminino

F. P.

Masculino

F. P.

455

Pelos resultados da Tabela 8.5.3, podemos verificar que os dois grupos extremos apresentam duas distribuições etárias distintas: no grupo de ambiente humilde e concordância baixa, ela é inclinada, com o ápice de formas não padrão (0,38) no segmento mais jovem (15/25 anos) e com aumento sensível de formas padrão (0,59 e 0,53) nas outras duas faixas etárias (26/49 e 50/71 anos); no grupo de ambiente não humilde e concordância alta, a distribuição etária é curvilinear, mostrando igual probabilidade de formas não padrão (0,44 e 0,41) no segmento mais jovem (15/25 anos) e no segmento mais velho (50/71 anos). O ápice das formas de prestígio (0,64) é encontrado nos falantes do segmento etário intermediário (26/49 anos). A primeira configuração etária pode ser interpretada com índice de mudança lingüística em direção a um sistema sem marcas de concordância e a segunda, como índice de variação estável com gradação de idade. Neste segundo caso, considera-se que os mais jovens apresentam menos concordância, porque lingüisticamente eles são mais influenciados pelos seus pares do que por outros segmentos da sociedade e, à medida que vão se inserindo em redes mais coesivas que envolvem pressões de uso do padrão, como o mercado de trabalho, aumentam a taxa de concordância, assumindo mais as formas de prestígio. Quando diminuem as suas atribuições sociais, após os 50 anos de idade, diminuem-se as pressões e, conseqüentemente, diminuem-se as formas de prestígio (cf. CHAMBERS & TRUDGILL, 1980, p.91-2). O padrão etário inclinado, sugerindo mudança lingüística em direção a um sistema sem marcas, é também encontrado nos falantes de ambiente não humilde e concordância baixa, uma vez que os falantes mais jovens (15/25 anos) e os mais velhos (50/71 anos) apresentam, res-pectivamente, 0,38 e 0,62 de probabilidade de presença de concordância.

456

Os falantes de ambiente humilde e concordância alta não tiveram a Faixa etária selecionada, embora as percentagens e as probabilidades finais indiquem menos formas de prestígio nos falantes de 15/25 (0,46) anos e mais nos de 26/49 anos (0,54). Como falta o último segmento etário, não temos como saber que configuração aí se vislumbraria: se inclinada ou se curvilinear. Neste caso, surge um outro dado: os Anos de escolarização se mostram como variável relevante, evidenciando-se probabilidades de concordância

diretamente

proporcionais

ao

aumento

dos

anos

de

escolarização: 0,32 (1 a 4); 0,48 (5 a 8) e 0,70 (9 a 11). Estes falantes foram considerados

por

nós

como

os

possíveis

"descrioulizantes"

ou

"descrioulizados". Podemos ver, todavia, que não existe padrão etário aí envolvido e se existir ele não apresentará índice de formas de prestígio nos falantes mais jovens. De qualquer forma,

não se trata de aquisição no

sentido etário do termo. Trata-se de aumento dos índices de concordância em função da influência elitizante da escola, que não tem relação direta com a faixa etária, e sim com os anos que se passam em exposição ao padrão, fora da faixa etária de aquisição natural da língua, o que não implica mudança na comunidade, mas sim sobreposição de sistemas a nível individual. A influência da variável Anos de escolarização se evidencia também sobre os falantes de ambiente não humilde e concordância baixa. Neste subagrupamento, desempenham papéis importantes tanto a Faixa etária quanto os Anos de escolarização. Esta segunda variável está atu-

457

ando exatamente sobre os subgrupos de comportamento lingüístico inesperado em termos de ambiente de origem. Estes dois subgrupos evidenciam dois movimentos interessantes. O de ambiente humilde e concordância alta, por um lado, evidencia sim um processo aquisitivo de concordância, mas que não tem relação com a faixa etária e sim com a influência da escola. Por outro lado, o grupo de ambiente não humilde e concordância baixa, embora sensível à exposição da escolarização, apresenta nitidamente um padrão etário de perda, em direção, também, a um sistema não padrão, como o subgrupo humilde de concordância baixa. Nos subgrupos dos extremos, a influência da escola pouco se faz sentir porque aí ambiente e escolarização praticamente se confundem. No primeiro extremo, verifica-se a tendência natural da mudança lingüística, conforme preconizada por Lemle & Naro (1976) e Naro (1981a) e, no segundo extremo, a variação sociolingüística estável conforme estabelecida por Guy (1981a e 1986). Diferimos de Guy no sentido de que estamos mostrando um padrão de variação sociolingüística estável com gradação etária, num grupo de maior grau de escolarização. É provável que se Guy tivesse separado os seus informantes em termos de concordância alta ou baixa, padrões etários pudessem emergir e ele chegasse também à conclusão de que os de concordância baixa evidenciassem movimento de perda da concordância e os de concordância alta evidenciassem variação sociolingüística estável. De uma certa forma, Naro (1981a) fez isto. Dos cinco falantes classificados por ele de "vicários", quatro apresentavam os mais altos índices de concordância, enquanto, dos 12 falantes classificados como "experienciais", nove apresentavam índices de concordância abaixo da média e os outros três apresentavam índices de concordância abaixo dos índices dos quatro falantes "vicários" acima referenciados (cf. NARO, 1981a,

458

p.81 e 84). O corte que fizemos neste trabalho foi ad hoc, mas ele certamente reflete algum aspecto análogo à "Orientação cultural", conforme estabelecida em Naro (1981a). Menção particular merece agora a variável Sexo. Ela não foi selecionada em nenhum dos novos agrupamentos feitos. Para três deles, poder-se-ia dizer que a questão é simplesmente distribucional, conforme já mencionamos. Mas para o quarto restante - o constituído pelos falantes de ambiente humilde e concordância baixa -, tal argumento não se coloca: há igualmente cinco homens e cinco mulheres dentre os seus 10 constituintes. Mesmo assim, não se seleciona a variável Sexo. Nesta nova forma de agruparmos os informantes, quando padrões etários de mudança em progresso emergem, a variável Sexo deixa, portanto, de evidenciar o padrão característico de variação sociolingüística estável: quando mulheres usam mais formas de prestígio do que os homens. Se bem que já concluímos, através da literatura lingüística existente, que o comportamento da variável Sexo é problemático para esclarecer se um fenômeno de variação está ou não em mudança. Mas, mesmo assim, estamos tentando utilizá-lo. Em etapas de análises anteriores, não apresentadas em detalhes aqui, tivemos oportunidade de observar separadamente o comportamento dos falantes em função dos Anos de escolarização. Verificamos que os do primário não apresentavam diferenças probabilísticas fortes para os dois sexos: 0,54 para elas e 0,46 para eles, enquanto os do ginasial e os

459

do colegial apresentavam-nas: respectivamente, 0,63 x 0,37 e 0,62 x 0,38. Os resultados destas etapas de análise relativos às faixas etárias dos falantes já mostravam também um dos padrões que ocorre nos novos agrupamentos feitos: o padrão curvilinear nos falantes do colegial - 0,41 (15/25 anos); 0,65 (26/49 anos) e 0,44 (50/71 anos) - e novamente nos falantes de ambiente não humilde de concordância alta - 0,44 (15/25 anos); 0,64 (26/49 anos) e 0,41 (50/71 anos). O que os agrupamentos tradicionais não evidenciavam com nitidez, e nem o podiam, é o movimento de perda da concordância nos falantes de baixa concordância, quer de ambiente humilde, quer de ambiente não humilde. A análise tradicional deixa, todavia, entrever que os falantes do ginasial estão num processo aquisitivo

- 0,59 (15/25

anos); 0,53 (26/49 anos) e 0,38 (50/71 anos). Esta configuração não emerge em nenhum dos novos agrupamentos feitos, seja porque ela em verdade não existe ou seja simplesmente por acaso: dos 31 falantes novamente categorizados, 11 são do primário (36%); 14, do colegial (45%) e apenas seis são do ginasial (19%). Em resumo, os padrões etários consistentes que temos são: distribuição curvilinear nos falantes não humildes de concordância alta, indicando variação sociolingüística estável com gradação etária e distribuição inclinada nos falantes de baixa concordância, independentemente do ambiente de origem, apresentando um padrão de perda, ao lado também da influência aquisitiva em função dos Anos de escolarização. Os falantes de ambiente humilde com concordância alta não evidenciam qualquer sinal de aquisição em termos da Faixa etária e apresentam-se influenciados em termos

diretamente

proporcionais

aos

Anos

de

escolarização:

460

quanto mais aumentam-se os anos de escolarização, mais aumenta-se a probabilidade de presença de concordância. A variável Sexo, por sua vez, só mostra a sua influência no conjunto completo de falantes e, pelos novos subagrupamentos feitos, o seu efeito é absolutamente neutro, não tendo sido selecionada para nenhum dos subgrupos. Relembramos, todavia, que os falantes de ambiente não humilde com concordância alta são predominantemente do sexo feminino: 91% (10/11). Em termos das variáveis sociais, os novos resultados obtidos não corroboram, portanto, a hipótese da descrioulização levantada por Guy. Além disso, não evidenciam nenhum padrão etário aquisitivo, correlacionado à hipótese de Naro a respeito do ressurgimento da regra no grupo jovem, se a orientação "vicária" continuasse a se espalhar neste grupo (cf. 1981a, p.88). Os nossos últimos resultados mostram, portanto, que a variação da concordância nominal reflete um fenômeno de variação mais complexo do que imaginavam os estudos iniciais, e do que revelam os nossos primeiros resultados, obtidos através da análise de todos os falantes adultos (ver tabela 8.5.1, p.445). Gostaríamos de observar agora os resultados de algumas variáveis lingüísticas conforme os novos subagrupamentos de falantes, a fim de verificarmos se eles trazem alguma contribuição para as discussões em pauta.

461

8.6 - Sobre resultados de variáveis lingüísticas

Se um determinado fenômeno lingüístico sobre estudo apresenta comportamento uniforme dentro de uma comunidade de fala, os resultados obtidos para o grupo certamente são o reflexo do comportamento dos indivíduos. Sendo assim, num caso de variação sociolingüística estável e inerente, a expectativa é de que o comportamento lingüístico dos diversos falantes seja influenciado da mesma forma pelas variáveis lingüísticas, constatando-se, então, uma independência entre variáveis lingüísticas e variáveis sociais. Caso não haja uniformidade no comportamento lingüístico dos diversos falantes com relação às probabilidades atribuídas aos diversos fatores de uma mesma variável, quer nos seus pesos relativos, quer na hierarquia entre os seus pesos, ou mesmo na hierarquia da seleção das diversas variáveis, a literatura lingüística apresenta para isso pelo menos duas possíveis interpretações: estas diferenças podem estar indicando diferenças dialetais ou processos de mudança lingüística ocorrendo na comunidade de fala analisada (cf. LABOV, 1972b, p.223-37; FASOLD, 1978; GUY, 1975 e 1980; NARO, 1981a).165 Neste trabalho, não temos condições de contrapor indivíduo a indivíduo em relação ao grupo, pois os nossos dados foram obtidos a partir de apenas uma hora de gravação para cada informante, o que poderia desvirtuar a convergência dos resultados, simplesmente pelo esfacelamento natural dos dados (cf. GUY, 1975 e 1980). No entanto, podemos fazer comparações entre o comportamento do grupo e dos subgrupos de

462

indivíduos em função das já conhecidas características sociais estratificadas, usadas na configuração da nossa amostra, bem como em função dos novos subgrupos formados em função do ambiente de origem e do grau de concordância. Nesta parte do trabalho, interessa-nos especialmente ver o comportamento das variáveis lingüísticas para estes segundos casos. Até o presente momento, apresentamos os nossos resultados relativos

a

todos

os

dados

comparando

basicamente

apenas

o

comportamento lingüístico dos adultos e das crianças, exceto na parte relativa à saliência fônica, no item 6.2.2.166 Com relação a este aspecto, fizemos uma comparação em termos de subagrupamentos de falantes adultos, considerando apenas a variável Anos de escolarização. Na parte relativa às variáveis lingüísticas globais, item 6.3, comparamos os resultados de subagrupamento de adultos também em termos de Anos

de

escolarização, apenas com relação à variável Pluralidade do contexto. No

desenrolar

de

nosso

trabalho,

temos

então

assumido

implicitamente que as diferenças de comportamento lingüístico dos diversos subagrupamentos dos indivíduos adultos ocorrem predominantemente na percentagem global de aplicação, ou seja, são propriamente mais quantitativas do que qualitativas (cf. NARO, 1981a, p. 88-90 e 97; GUY, 1981a, p. 338-9). Nas comparações feitas, tivemos oportunidade de observar que as influências dos diversos fatores das diversas variáveis são, se não idênticas, bastante semelhantes para todo e qualquer subagrupamento de falantes, no que se refere à hierarquia entre as diversas probabilidades de cada

variável

lingüística.

Até

que

ponto

a

diferença

global

463

reflete ou não ou mudança lingüística é também um ponto que tem sido colocado em discussão (cf. SILVA, 1982, p.390-1). Dentre as cinco variáveis lingüísticas finais, estudadas a nível dos elementos do sintagma nominal, com base em todos os dados, quatro delas são de fundamental importância na discussão aqui colocada. São elas: Marcas precedentes e posição, Relação entre os elementos nucleares e não nucleares e Saliência fônica (envolvendo as dimensões Processos e Tonicidade). Esta última variável, com as suas duas dimensões separadas, e a variável Posição do elemento no SN, contida nas nossas duas primeiras, são utilizadas por Naro & Lemle (1976) e por Naro (1981a), para proporem o modelo universal de mudança sintática brevemente descrito no item 8.4. A dimensão Processos e a variável Posição do elemento no SN são retomadas por Guy, conforme também vimos no item 8.4, para apresentar argumentos da parte lingüística de sua hipótese sobre a crioulização e a descrioulização do Português popular do Brasil. Vamos então retomar a discussão destas variáveis lingüísticas com base nos nossos resultados. Primeiro, vamos apresentar a variável que envolve Processos e Tonicidade, agora denominada Saliência fônica e, segundo, vamos apresentar a variável Posicional, contida em Marcas e Relação.

464

8.6.1 - Saliência fônica

Desenvolvemos no item 6.2.2 uma análise detalhada da Saliência fônica, demonstrando que a melhor análise é aquela que considera Processos e Tonicidade como uma só variável: esta análise foi denominada de análise 3. Desenvolvemos antes uma análise que considera Processos e Tonicidade como duas variáveis distintas, denominada análise 1. Sempre que necessário nos referiremos a estas duas análises através destes rótulos. Vamos apresentar na Tabela 8.6.1 os resultados obtidos para a variável Saliência nos moldes da análise 3, tendo em vista os quatro agrupamentos de falantes em função do tipo de ambiente e do grau de concordância. Estes resultados são baseados nos dados que envolvem apenas os substantivos, adjetivos e categorias substantivadas, por razões já explicitadas no item 6.2.1.3.

465

TABELA 8.6.1 SALIÊNCIA FÔNICA DOS SUBSTANTIVOS, ADJETIVOS E CATEGORIAS SUBSTANTIVADAS POR SUBAGRUPAMENTOS DE FALANTES SALIÊNCIA FÔNICA

FALANTES Ambiente humilde conc.baixa

Ambiente não hum. conc.alta

Ambiente humilde conc.alta

Ambiente não hum. conc.baixa

13= 87% 15 0,89

14=100% 14 +

4=100% 4 +

9= 90% 10 0,79

6= 67% 9 0,76

32= 91% 35 0,56

12=100% 12 +

21= 60% 35 0,61

57= 95% 60 0,60

47=100% 47 +

21= 91% 23 0,85

11= 46 24 0,46

51= 94% 54 0,59

40= 98% 41 0,85

16= 84% 19 0,66

42= 71% 59 0,68

60= 94% 64 0,50

21= 78% 27 0,42

23= 85% 27 0,67

P.

14= 39% 36 0,41

44= 96% 46 0,71

15= 79% 19 0,43

3= 43% 7 0,30

P.

6= 20% 30 0,12

42= 88% 48 0,35

8= 80% 10 0,46

1= 20% 5 0,12

143= 15% 934 0,13

1015= 79% 1291 0,21

449= 67% 673 0,27

147= 36% 414 0,17

Duplo (olho ) (ólhos)

F.

-l (casal ) (casais)

F.

-R (flor ) (flores)

F.

P.

P.

P.

-ão (patrão ) (patrões)

F.

-S (rapaz ) (rapazes)

F.

Regular oxítono e monossílabo tônico

P.

P. F.

Regular proparoxítono Regular paroxítono

F. P.

8=100% 8 +

Comparando-se os resultados do subgrupo de ambiente humilde e

466

concordância baixa (coluna 1) com os do subgrupo de ambiente não humilde e concordância alta (coluna 2), podemos perceber a existência de cortes categoriais distintos ao longo do eixo da Saliência. Neste segundo subgrupo, com exceção do plural duplo, percebe-se com nitidez uma oposição maior em termos da Tonicidade: os itens em -l (0,56), em -R (0,60), em -S (0,50) e em -ão (0,59) não se opõem entre si. Além disso, os regulares oxítonos chegam a ser mais marcados que estes próprios itens (0,71). Esta grande categoria, predominantemente de itens oxítonos, se opõe aos demais regulares que apresentam, por sua vez, uma suboposição entre regulares paroxítonos (0,21) e regulares proparoxítonos (0,35). O que mais importa para o grupo que apresenta indícios de variação sociolingüística estável é, pois, a Tonicidade dos itens lexicais e não o Grau de diferenciação fônica na relação singular/plural, ou seja, Processos. Isto é corroborado pela análise 1, que contém Processos e Tonicidade como duas variáveis distintas, também feita para este grupo, na qual Tonicidade é selecionada como variável relevante em detrimento de Processos. Estes resultados continuam a ser corroborados por uma outra análise feita só para os não regulares, incluindo os de plural duplo, na qual a variável Processos não é selecionada, e por uma última, feita só com os regulares, na qual a Tonicidade é selecionada. Os resultados do subgrupo de ambiente humilde e concordância baixa por sua vez não evidenciam um corte nítido em termos da Tonicidade e em termos dos Processos. Ambos os aspectos são relevantes. Sem contar também o plural duplo, pode-se perceber uma oposição bastante nítida entre os

itens

em

-l

(0,76),

em

-R

(0,61)

e

em

-S

(0,68),

por

467

um lado, e os itens em -ão (0,46) por outro. Entre os três primeiros, constatase também uma suboposição entre os itens em -l (0,76) e os em -R (0,61), colocando-se os em -S (0,68) numa faixa intermediária entre os dois. Observando o comportamento dos itens regulares, vamos verificar que não existe suboposição entre os paroxítonos (0,13) e os proparoxítonos (0,12) entre si, mas eles se opõem conjuntamente aos demais itens, em graus distintos de diferenciação. Todavia, os regulares oxítonos (0,41) têm comportamento diferenciado dos demais regulares, favorecendo mais do que estes a concordância nominal. Processos e Tonicidade entram, portanto, em jogo nos dados deste subgrupo de falantes. Esta conclusão é corroborada em vários momentos: pela análise 1, que seleciona as variáveis Processos e Tonicidade; pela análise dos itens não regulares, que seleciona, pela primeira e única vez, a variável Processos e pela análise dos itens regulares, que também seleciona a variável Tonicidade. Para este subgrupo de falantes, que apresenta indícios de perda da concordância, importam os dois aspectos da Saliência fônica: Processos e Tonicidade. Processos interessa em primeiro plano, pois é uma variável selecionada em segundo lugar com significância 0,0 e Tonicidade o é em quinto com significância 0,000. Na coluna 3 desta mesma tabela, temos os resultados do subgrupo de ambiente humilde e concordância alta, que é exatamente o que se apresenta influenciado pela ação da escola, sem nenhum padrão etário de aquisição.

Este

subgrupo,

diferentemente

dos

dois

anteriormente

comentados, demonstra um comportamento quase que inanalisável em termos de escala da saliência. As três primeiras categorias (duplo, -l, e -R)

468

são totalmente marcadas. Os itens em -ão (0,85) são também muito marcados. O comportamento destes últimos itens (os em -ão) é deveras peculiar, pois eles são bem pouco marcados no subgrupo de ambiente humilde e concordância baixa. Em outras palavras, é muito marcado pelo subgrupo que está adquirindo a concordância através da influência da escola e pouco marcado por um subgrupo que, praticamente sem a influência da escola, está perdendo a concordância, como indicam as probabilidades relativas às faixas etárias, já vistas na tabela 8.5.3. Neste subgrupo agora focalizado, os itens menos marcados são, consistentemente, os regulares paroxítonos (0,27) que se opõem aos regulares proparoxítonos (0,46) e oxítonos (0,43), os quais não apresentam nenhuma suboposição interna. Neste subgrupo, os itens em -S (0,42), diferentemente dos outros dois subgrupos de falantes, se comportam como os regulares oxítonos (0,43) e paroxítonos (0,46). A análise 1 corrobora a não nitidez dos resultados agora descritos: se consideramos todos os dados, seleciona-se a variável Tonicidade; se consideramos apenas os substantivos, adjetivos e categorias substantivadas, seleciona-se a variável Processos, o que não se verifica nos dois subgrupos anteriores. Isto ocorre porque, quando analisamos todos os dados, a categoria -l apresenta-se com um dado não marcado, tendo quatro categorias na variável Processos (-l, -ão, -S e regular), com um conseqüente peso maior para os oxítonos, uma vez que os itens em -l são predominantemente oxítonos. Quando analisamos só as classes pertinentes, os itens em -l se apresentam categoricamente marcados,

no

sentido

positivo,

restando

três

469

categorias na variável Processos: -ão, -S e regulares, favorecendo então a sua seleção. A análise dos itens não regulares isolados, por sua vez, foi impossível de ser feita, pela grande quantidade de ambientes categóricos, e a análise dos regulares não apresenta a seleção da variável Tonicidade. Este fato novamente corrobora a não nitidez do eixo da Saliência, quer com relação a Processos, que com relação à Tonicidade, para o subgrupo de falantes

que

apresenta

padrão

aquisitivo

ao

longo

dos

Anos

de

escolarização. Vamos observar agora, ainda na Tabela 8.6.1, os resultados do último grupo de falantes: os de ambiente não humilde e concordância baixa. Semelhantemente aos falantes humildes de concordância baixa, podemos ver mais nitidez no eixo de Processos. A diferença pertinente localiza-se nos itens em -ão (0,66) que se apresentam mais marcados, embora não tanto quanto aos itens em -l, os quais são sempre marcados. Este subgrupo de falantes, embora de comportamento etário semelhante ao do subgrupo humilde com concordância baixa (processo de perda), tem a diferença de ser também influenciado pela variável Anos de escolarização, o que explicaria maiores índices de plural nos nomes em -ão. Com relação aos itens regulares, verifica-se também a identidade de comportamento entre paroxítonos (0,17) e proparoxítonos (0,12) em oposição, menos acentuada, aos oxítonos (0,30). Na análise 1, a variável Processos é também selecionada e Tonicidade não o é, corroborando-se assim a maior influência de Processos no eixo da Saliência fônica. Todavia, na análise dos não regulares isoladamente, a variável Processos não é selecionada e, na análise

dos

regulares,

Tonicidade

também

não

o

470

é: o número de dados relativos tanto aos regulares oxítonos quanto aos proparoxítonos, neste caso, é, indubitavelmente, o responsável pela não seleção da Tonicidade. Em resumo, podemos concluir que os subgrupos de falantes que apresentam indícios etários de perda da concordância (colunas 1 e 4) são mais sensíveis ao eixo da Saliência fônica, especialmente na sua dimensão Processos, do que os grupos que não apresentam estes indícios. O subgrupo mais influenciado pela escola (coluna 3) é exatamente o que apresenta menor sensibilidade à escala da Saliência fônica, quer na sua dimensão Processos, quer na sua dimensão Tonicidade. Esta sensibilidade chega a ser menor do que a do grupo de ambiente não humilde e concordância alta, que apresenta um padrão nítido de influência da dimensão da Tonicidade. Os grupos de concordância baixa, além de apresentarem padrões etários que corroboram a hipótese de que a concordância de número no Português popular brasileiro está em processo de mudança em direção a um sistema sem marcas, apresentam também evidências lingüísticas (embora baseadas em dados escassos e com uma hierarquia não tão rigidamente estabelecida) de que

a mudança sintática se inicia no ponto onde diferenciação superficial entre o sistema novo e o velho é zero (ou quase); mais tarde ela se difunde através da língua na proporção inversa ao grau de saliência das diferenças entre estes sistemas em cada ambiente particular. (NARO, 1981a, p.63; cf., também, p.96-7)167

É, portanto, em condições naturais que estamos vendo a atuação da Saliência fônica emergir de forma forte nos dados da nossa amostra,

471

uma vez que o subgrupo que a apresenta com maior nitidez é exatamente o de ambiente humilde e de baixa concordância, diferente, portanto, do que é colocado por Guy (1981a e 1986). Os resultados lingüísticos aqui apresentados mostram, todavia, que, com relação à variável Saliência fônica, os grupos de falantes não divergem apenas na propensão geral de uso da regra, conforme colocado por Naro (cf. 1981a, p.97), mas diferem também na hierarquia entre alguns fatores, principalmente os flutuantes, constituídos pelos itens em -S e em -ão, conforme amplamente discutido no item 6.2.1, e diferem também na nitidez da escala da saliência no eixo dos Processos e no eixo da Tonicidade. O padrão encontrado para o grupo não reflete nenhum dos padrões encontrados nestes subgrupos. Para o grupo como um todo encontramos as seguintes oposições: 1) plural duplo: 0,80; 2) itens em -l (0,69), em -R (0,65), em -ão (0,59) e em -S (0,56); 3) regulares oxítonos: 0,38 e 4) regulares proparoxítonos (0,21) e regulares paroxítonos (0,17). Os resultados aqui apresentados mostram ainda mais que os grupos sociais convencionais em termos de Sexo, Anos de escolarização e Faixa etária, sem alguma subcategorização mais sutil do tipo aqui apresentado, em função do ambiente de origem e grau de concordância, ou sem alguma variável do tipo "Orientação cultural", conforme proposta por Naro (1981a), podem

deixar

de

apresentar

aspectos

lingüísticos

interes-

472

santes com relação a variáveis que permitem discutir a direcionalidade da mudança lingüística. Vamos passar, neste momento, à discussão da outra variável em pauta: a Posição do elemento no SN.

8.6.2 - Posição do elemento no SN

Scherre (1978) analisa a variável Posição que o elemento nominal ocupa no SN e conclui, para falantes semi-escolarizados, que a primeira posição é a que mais favorece a incidência de marcas de plural, enquanto as demais posições a desfavorecem, com probabilidades decrescentes, até a ausência total de marcas na última posição. Naro (1981a) considera que estes resultados constituem evidências de que a primeira posição é mais marcada por ser mais saliente e as demais são menos marcadas por serem menos salientes, consoante com a sua hipótese da mudança lingüística estar ocorrendo ao longo do eixo da saliência. Guy (1981 e 1986) considera que a primeira posição do SN é a mais marcada, não por ser mais saliente, mas simplesmente pelo fato de ter havido um crioulo de base portuguesa e gramática africana que marcava a pluralidade do SN na posição inicial, por influência de línguas africanas

que

marcam

a pluralidade no início da

construção. Guy afirma, portanto, que o fato de o Português popular brasileiro

tender

a

marcar

o

primeiro elemento do SN não é

uma

tendência universal, mas específica deste dialeto dadas às circunstâncias da crioulização (cf. 1981a, p.299-304 e 1986, p.45-50).

473

No item 6.2.1 deste trabalho, apresentamos uma reanálise minuciosa das variáveis Posição linear, Marcas precedentes e Classe gramatical, onde demonstramos que (1) conclusões do tipo apresentado por Scherre (1978) relativas às variáveis Posição linear; (2) conclusões relativas à variável Classe gramatical apresentadas por Cedergreen (1973) e Poplack (1980a, 1980b e 1981) e (3) conclusões relativas à variável Marcas precedentes da forma apresentada por todos os estudiosos que se ocuparam do estudo da concordância nominal em Português não dão conta de forma adequada dos fatos. Propusemos, então, uma reanálise destas três variáveis em duas, denominadas (1) Marcas precedentes e posição, nos moldes de Poplack, e (2) Relação entre os elementos nucleares e não nucleares no sintagma nominal, nos moldes de nossa análise. Vamos apresentar a seguir tabelas contendo os resultados relativos a estas duas variáveis com o objetivo de ver o seu comportamento entre os subagrupamentos de indivíduos em função do ambiente de origem e do grau de concordância. Nas tabelas 8.6.2 e 8.6.3, apresentamos, respectivamente, os resultados dos subgrupos dos extremos e dos subgrupos intermediários, relativos à variável Relação. Repetimos os resultados de todos os falantes na primeira coluna para tornar mais clara a exposição.

474

TABELA 8.6.2 RELAÇÃO ENTRE OS ELEMENTOS DO SN POR SUBAGRUPAMENTOS DE FALANTES FATORES

FALANTES Todos

Subst. na primeira posição

F.

Subst. na segunda posição

F.

Subst. na terceira posição

F.

Classe não nuclear anteposta

F.

Classe não nuclear posposta Categoria subst. na 2a. posição

P.

P.

P.

P. F. P. F. P.

Categoria subst. na 3a. posição

F.

Pronome pessoal na 1a. posição

F.

Pronome pessoal na 2a. posição

F.

P.

P.

P.

Ambiente humilde conc.baixa

Ambiente não hum. conc.alta

153= 95% 161 0,66

6= 67% 9 0,35

72= 99% 73 0,88

2756= 53% 5176 0,23

200= 21% 964 0,16

969= 80% 1206 0,19

317= 62% 514 0,38

25= 28% 89 0,32

117= 85% 137 0,44

4291= 97% 4406 0,87

734= 96% 762 0,91

1099= 98% 1125 0,84

242= 43% 565 0,25

13= 16% 83 0,38

127= 73% 175 0,24

59= 64% 92 0,33

13= 65% 20 0,68

20= 91% 22 0,32

16= 70% 23 0,48

1= 20% 5 0,13

9=100% 9 +

12=100% 12 +

4=100% 4 +

1=100% 1 +

27= 82% 33 0,72

6= 86% 7 0,92

2=100% 2 +

475

TABELA 8.6.3 RELAÇÃO ENTRE OS ELEMENTOS DO SN POR SUBAGRUPAMENTOS DE FALANTES FATORES

FALANTES Todos

Subst. na primeira posição

F.

Subst. na segunda posição

F.

Subst. na terceira posição

F.

Classe não nuclear anteposta

F.

Classe não nuclear posposta Categoria subst. na 2a. posição

P.

P.

P.

P. F. P. F. P.

Categoria subst. na 3a. posição

F.

Pronome pessoal na 1a. posição

F.

Pronome pessoal na 2a. posição

F.

P.

P.

P.

Ambiente humilde conc.alta

Ambiente não hum. conc.baixa

153= 95% 161 0,66

12=100% 12 +

10= 91% 11 0,83

2756= 53% 5176 0,23

467= 77% 668 0,30

177= 43% 414 0,20

317= 62% 514 0,38

47= 77% 61 0,78

14= 35% 40 0,17

4291= 97% 4406 0,87

661= 98% 676 0,75

346= 97% 357 0,96

242= 43% 565 0,25

29= 47% 62 0,52

13= 42% 31 0,19

59= 64% 92 0,33

5= 46% 11 0,17

7= 64% 11 0,41

16= 70% 23 0,48

xxx

2=100% 2 +

12=100% 12 +

1=100% 1 +

xxx

27= 82% 33 0,72

5=100% 5 +

3=100% 3 +

476

Os resultados probabilísticos das tabelas 8.6.2 e 8.6.3 evidenciam novamente, e de forma bastante uniforme, que não é simplesmente a primeira posição do SN que determina o índice de marcas plurais, mas sim a colocação da classe não nuclear em relação ao núcleo e o núcleo em relação à posição que ele ocupa no SN. São, então, mais marcados todos os elementos não nucleares antepostos e menos marcados todos os elementos nucleares propostos ao núcleo. São mais marcados os núcleos da primeira posição do que os núcleos das demais posições, mas é possível também se verificar, de forma geral, um aumento de marcas nos núcleos que ocupam a terceira posição, em relação À probabilidade associada aos núcleos da segunda posição. Os resultados das categorias substantivadas e dos pronomes pessoais não merecem comentários uma vez que, relativamente, o número de dados, por subagrupamento, é muito pequeno. Mesmo o total respectivo para todos os falantes já não é alto, conforme se pode ver nos dados da primeira coluna das respectivas tabelas. É importante observar que, numa etapa de análise preliminar com todos os falantes adultos, separamos os elementos nucleares antepostos e os pospostos em função da posição e obtivemos os seguintes resultados: - anteposto na primeira posição: 0,89; - anteposto na segunda posição: 0,87; - posposto na segunda posição: 0,32; - posposto na terceira posição: 0,14. Os resultados acima nos levaram a considerar, para as análises futuras, apenas as duas grandes oposições: anteposição e posposição

477

em relação ao núcleo. Além disso, verificamos a existência destas duas grandes oposições, através do exame exaustivo da relação entre Posição e Classe gramatical no item 6.2.1. Observamos ainda que os antepostos na terceira posição nos dados dos adultos só ocorreram duas vezes, o que nos levou a agrupá-los com os de segunda. Os resultados que temos em mãos são suficientemente claros para se mostrar que as colocações de Guy (1981a e 1986) sobre a variável Posição linear devem ser repensadas. O que está em jogo nesta variável, conforme já discutimos, é a questão da coesão sintagmática e não a influência das línguas africanas. Além disso, os resultados da tabelas 8.6.4 e 8.6.5, relativos à variável Marcas precedentes e posição, vão nos mostrar também, para três dos quatro subagrupamentos de falantes, a consistência das conclusões já obtidas com base nos dados de todos os 48 falantes adultos.

478

TABELA 8.6.4 MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO POR AGRUPAMENTOS DE FALANTES MARCAS E POSIÇÃO

FALANTES Todos

Ausência

F. P.

Zero na 1a. posição

F. P.

Numeral na 1a.pos.

F. P.

-S na 1a. posição

F. P.

ss(s)

F. P.

y(s)x

F. P.

x(y)0

F. P.

Sprep(x)s

F. P.

Sprep0(0)

F. P.

Ambiente humilde conc.baixa

Ambiente não hum. conc.alta

4213= 97% 4223 0,79

726= 96% 754 0,85

1090= 98% 1116 0,61

105=100% 105 +

27=100% 27 +

23=100% 23 +

886= 58% 1529 0,63

99= 31% 316 0,74

290= 90% 323 0,85

2205= 55% 3974 0,55

134= 20% 672 0,51

811= 80% 1018 0,69

258= 70% 368 0,60

8= 33% 24 0,43

119= 81% 147 0,54

207= 54% 382 0,41

23= 27% 84 0,47

69= 81% 85 0,53

13= 6% 200 0,06

1= 2% 53 0,05

2= 12% 16 0,03

11= 69% 16 0,74

1= 50% 2 0,55

8=100% 8 +

68= 38% 177 0,42

6= 18% 34 0,57

23= 70% 33 0,51

479

TABELA 8.6.5 MARCAS PRECEDENTES EM FUNÇÃO DA POSIÇÃO POR AGRUPAMENTOS DE FALANTES MARCAS E POSIÇÃO

FALANTES Todos

Ausência

F. P.

Zero na 1a. posição

F. P.

Numeral na 1a.pos.

F. P.

-S na 1a. posição

F. P.

ss(s)

F. P.

y(s)x

F. P.

x(y)0

F. P.

sprep(x)s

F. P.

sprep0(0)

F. P.

Ambiente humilde conc.alta

Ambiente não hum. conc.baixa

4213= 97% 4223 0,79

622= 98% 634 0,92

340= 97% 350 (0,72)

105=100% 105 +

12=100% 12 +

9=100% 9 +

886= 58% 1529 0,63

97= 31% 114 0,90

65= 53% 123 (0,42)

2205= 55% 3974 0,55

408= 70% 584 0,70

133= 42% 315 (0,35)

258= 70% 368 0,60

38= 70% 54 0,41

15= 54% 28 (0,80)

207= 54% 382 0,41

25= 69% 36 0,31

7= 30% 23 (0,53)

13= 6% 200 0,06

2= 10% 20 0,02

2= 22% 9 (0,39)

11= 69% 16 0,74

1= 33% 3 0,30

1=100% 8 +

68= 38% 177 0,42

16= 48% 33 0,57

5= 31% 10 (0,26)

480

Os resultados acima mostram, para o grupo e para os subgrupos, o seguinte: 1) A ausência fora do SN e ausência no primeiro elemento provocam um índice alto de marcas no segmento seguinte. Em alguns casos do primeiro fator e em todos do segundo, a sua influência é categórica no sentido positivo. 2) O numeral da primeira posição influencia mais a marca no segmento da segunda posição do que o próprio morfema de plural nesta mesma posição. 3) Não é qualquer elemento na terceira posição que é pouco marcado: seu índice de marcas depende da presença ou ausência de marca precedente. Se ela estiver ausente, a probabilidade do item seguinte ser marcado é próxima de zero. Se ela estiver presente, o segmento da terceira posição tem, relativamente, mais chances de ser marcado. Os resultados dos fatores Sprep(s) s- e Sprep0(0) não se mostram consistentes para todos os subgrupos por simples escassez de dados, e os resultados do grupo de ambiente não humilde e concordância alta, embora não selecionados, apresentam a hierarquia esperada. A questão da sua não seleção é estatística. O programa só seleciona resultados com significância a nível máximo de 0,05 e a significância, no nível em que esta variável seria selecionada, foi de 0,064. Concluímos novamente, a partir destes resultados, que a questão em jogo não é, portanto, simplesmente posição linear, mas posição e tipo de marca precedente, o que refuta mais uma vez a argumentação lingüística de Guy (1981a e 1986) relativa à questão da existência de um crioulo

481

de léxico português e gramática africana com marcas apenas na primeira posição da construção. Os resultados acima evidenciam, ainda, que mesmo agrupamentos com um número relativamente pequeno de indivíduos podem revelar padrões regulares, que emergem na análise dos dados de todos os falantes. Com relação a estas duas variáveis não há dúvidas de que a análise de dados suficientes de qualquer falante de qualquer característica social evidenciará diferenças apenas na "propensão geral de aplicação da regra" e não no peso relativo de cada fator e, conseqüentemente, na hierarquia entre eles. Usando as palavras de Guy (1980), poderíamos dizer que, para estas variáveis, as normas dos grupos não são apenas artefatos do ponto de vista macrocósmico, representando meras médias de um agrupamento de normas individuais amplamente dispersas. Ao contrário, elas resumem as normas uniformes gerais dos indivíduos. (GUY, 1980, p.12)168 Fizemos comparações dos resultados de subgrupos de falantes adultos apenas para as variáveis lingüísticas mais fortes, as quais nos permitiam discutir, através de seus resultados, a relação entre variação e mudança envolvendo a concordância de número no sintagma nominal. Por isto, as demais variáveis envolvendo todos os dados não foram aqui abordadas, quais sejam: Contexto seguinte e Função. Passemos à conclusão deste capítulo.

482

8.7 - Conclusão

Do estudo feito por nós neste capítulo, podemos concluir que a concordância de número entre os elementos do sintagma nominal é um fenômeno lingüístico variável que apresenta duas tendências inequívocas em dois subagrupamentos distintos de falantes: 1) variação estável com gradação etária nos falantes de ambiente não humilde e concordância alta; 2) processo de mudança lingüística em direção a um sistema sem marcas nos falantes de ambiente humilde e concordância baixa. Os resultados etários dos falantes de ambiente não humilde e concordância baixa e dos falantes de ambiente humilde e concordância alta sugerem a possibilidade de generalização das conclusões acima: 1) variação estável com gradação etária nos falantes de concordância alta e 2) processo de mudança lingüística em direção a um sistema sem concordância nos falantes de concordância baixa. A variável Sexo não se mostra relevante nos dados dos falantes do mesmo ambiente e com o mesmo grau de concordância, mas evidencia-se como relevante no conjunto de todos os dados, com as mulheres favorecendo as formas de prestígio. A influência da variável Anos de escolarização, por sua vez, indica

483

que, à medida que os falantes passam mais anos na escola, mais concordância eles "adquirem", o que pode até provocar um movimento reverso no processo de perda da concordância. Essa influência confirma parcialmente as conclusões de Naro (1981a), feitas com base no estudo da variável Orientação cultural. Não detectamos, todavia, nenhum padrão etário de aquisição, embora não descartemos a possibilidade de sua existência. Os resultados das variáveis sociais de nossa amostra nos subagrupamentos de falantes em função do tipo de ambiente e do grau de concordância não apresentam, portanto, apenas a configuração inicial de variação sociolingüística estável com leve gradação etária e não apresentam, também, suporte empírico para a existência de um processo descrioulizante, no sentido literal do termo, precedendo a variação estável que se evidencia nos falantes de ambiente humilde e concordância alta. Os resultados das variáveis lingüísticas também não corroboram a hipótese da crioulização e conseqüente descrioulização do português popular brasileiro. A Saliência fônica se mostra mais evidente nos falantes de ambiente humilde e concordância baixa, ou seja, nos que são menos influenciados por "empréstimos" do dialeto padrão; e se mostra menos evidente nos falantes de ambiente humilde e concordância alta, os supostamente descrioulizados ou em processo de descrioulização. A tendência que se vislumbra é, em verdade, a seguinte: para os falantes de baixa concordância, atua em primeiro plano a dimensão Processos da variável Saliência fônica e, para os falantes de alta concordância, a dimensão Tonicidade.

484

A variável Posição não tem efeito desvinculado da Classe gramatical nem das Marcas precedentes, evidenciando-se que a marca formal de plural tende a ocorrer não apenas no elemento nominal que ocupa a primeira posição no SN, mas sim em qualquer elemento não nuclear anteposto ao núcleo do SN e também em elementos até da terceira posição precedidos de elementos marcados. Os princípios que explicam as variáveis Relação e Marcas, nas quais a Posição se encontra inserida, são de natureza geral, regendo o funcionamento de línguas diversas, quais são: o Princípio da Economia, o Princípio da Iconicidade e o Princípio do Processamento Paralelo, já vistos. Explicações de natureza particular não têm, a nosso ver, lugar na análise da concordância de número entre os elementos do sintagma nominal no Português do Brasil.

9 - NOVAS PERSPECTIVAS DE INFLUÊNCIAS SOCIAIS

9.1 - Introdução

No capítulo 8, analisamos a influência de três variáveis sociais tradicionalmente conhecidas: Anos de escolarização, Sexo e Faixa etária. Estas variáveis, além de tradicionais, são estratificadas, uma vez que foram usadas na configuração da nossa amostra. Com base na análise destas três variáveis, nos subgrupos de falantes em função do ambiente de origem e do grau de concordância, concluímos e generalizamos que há, pelo menos, duas situações envolvendo a concordância de número entre os elementos do SN: (1) variação estável com gradação etária nos falantes de concordância alta e (2) mudança em direção a um sistema de perda da concordância nos falantes de concordância baixa. Neste capítulo, pretendemos apresentar a análise de três variáveis não convencionais, cujos resultados apontam para novas perspectivas de influências sociais sobre fenômenos lingüísticos considerados estigmatizados, corroborando em parte resultados obtidos no capítulo 8. As três variáveis não convencionais, e não

estratificadas,

recebem as denominações de Mercado ocupacional, Mídia e Sensibilidade lingüística. A caracterização destas três novas variáveis e a metodologia de sua mensuração foram desenvolvidas pela equipe de pesquisadores do Projeto Censo, já referenciada, e encontram-se descritas no primeiro volume do seu último relatório final de pesquisa apresentado à FINEP em dezembro de 1986 (cf. NARO et alii, p.1-29).

486

Vamos apresentar no item 9.2 uma síntese do que se encontra neste relatório, no que diz respeito à caracterização e mensuração das variáveis em jogo e, a seguir, vamos apresentar resultados do fenômeno que estamos estudando,

considerando também estas três variáveis. Foi impossível

verificar a influência destas três novas variáveis nos subagrupamentos de falantes em termos do ambiente de origem e do grau de concordância, pela inevitável atomização dos dados. Sendo assim, os resultados aqui apresentados só podem ser comparados aos anteriores de forma indireta: eles dizem respeito a todos os falantes e, também, a subgrupos em função do Sexo, por questões estritamente metodológicas a serem esclarecidas no corpo deste capítulo.

9.2 - Caracterização das variáveis não convencionais Por Mercado ocupacional, entende-se a correlação entre o tipo de atividade profissional desenvolvida pelo indivíduo ao longo de sua vida e a necessidade do uso de formas lingüísticas de prestígio, na linha de Bourdieu (1975) e Sankoff & Laberge (1978). Com o seu estudo, pretende-se verificar se existe uma correlação diretamente proporcional entre o uso de formas lingüísticas consideradas corretas e atividades profissionais que propiciam o uso de tais formas. A Sensibilidade lingüística é caracterizada em termos do grau de consciência do falante em relação à diversidade lingüística e da sua atitude com relação a ela. No estudo desta variável,

pretende-se, também,

487

verificar se há ou não uma relação diretamente

proporcional entre a

Sensibilidade lingüística e o uso de formas padrão. A variável Mídia diz respeito ao grau de exposição do falante aos meios de comunicação

de massa. Considerou-se indiferentemente a

influência da televisão, do rádio, de jornais e de revistas. Indubitavelmente, o tempo de exposição à televisão é maior, de acordo com o depoimento dos próprios falantes, e, conseqüentemente, a sua influência deve ser mais forte do que a de qualquer outro meio de comunicação. Há, inclusive, trabalhos que utilizam a influência da mídia como diagnóstico de atitude de vida. A variável

Orientação cultural apresentada no capítulo 8, conforme

desenvolvida por Naro, foi estabelecida em função do tipo de contato do falante com a TV (cf. NARO, 1981a, p.84). No trabalho aqui sintetizado, não foi possível descer a estes detalhes de classificação, e a equipe considerou então a influência dos meios de comunicação de massa de forma geral.169 Com o estudo desta variável, objetiva-se semelhantemente testar se a maior ou menor exposição à mídia influencia um maior índice ou menor índice de formas de prestígio. Considerando-se que a ausência de concordância de número entre os elementos do SN, pelo menos em alguns ambientes lingüísticos, é considerada estigmatizante, espera-se que haja uma relação direta entre o uso

de formas com concordância e (1) a cotação positiva no Mercado

ocupacional, (2) a cotação positiva de Sensibilidade lingüística e (3) a cotação positiva de exposição à Mídia. Inversamente, espera-se

relação

entre formas sem concordância e (1) a cotação negativa no Mercado

488

ocupacional, (2) a cotação negativa de Sensibilidade lingüística e

(3)

cotação negativa de exposição à Mídia.

de 9.3 - Metodologia convencionais

mensuração

das

variáveis

não

Para as três variáveis em foco, adotou-se o critério de classificação dos falantes em termos de mais (+),

menos (-) ou mais ou menos (+). A

classificação positiva (+) ou negativa (-) foi atribuída aos falantes que se apresentavam

nitidamente polarizados. A classificação intermediária foi

reservada para os casos duvidosos, por que razão fosse: carência de informação

para uma classificação segura, falta de consenso entre os

avaliadores

ou, ainda, porque os falantes apresentavam características

realmente intermediárias. A mensuração objetiva destas três variáveis não é fácil. A equipe tentou tomar todos os cuidados necessários para alcançar o máximo de objetividade. No caso da variável Mercado ocupacional, por exemplo, dois problemas precisavam ser contornados: (1) evitar se fazer a caracterização dos falantes em função de outras variáveis sociais como o seu Grau de escolarização, a sua Faixa etária, ou a sua Classe social; (2) evitar que a classificação fosse feita por membros da equipe, uma vez que eles já tinham conhecimento de todas as características sociais dos falantes. A transcrição abaixo dá uma idéia de como a equipe procedeu para contornar os dois problemas mencionados acima.

489

Para a avaliação da importância do Mercado ocupacional em cada falante, adotou-se o seguinte procedimento: para cada falante fez-se uma ficha contendo informações sobre as suas atividades pregressas e as atuais. Evitou-se fornecer dados acerca da escolaridade do falante, local de moradia, classe social e outras que pudessem provocar confusão. O teste de julgamento foi feito por estudantes de graduação com curso de Sociolingüística e por um professor de pós-graduação. Pediu-se a cada um deles que atribuísse, para cada perfil de informante, um valor positivo, negativo ou intermediário de acordo com o seu julgamento do grau de necessidade da linguagem /considerada/ correta. Preferiu-se impor aos juízes o número de graus (três) possíveis de serem atribuídos, não se permitindo que cada um estipulasse a sua própria escala. Este procedimento visava facilitar a obtenção da média (NARO et alii, 1986, p.35). A classificação dos informantes com relação às variáveis Mídia e Sensibilidade

lingüística

foi

feita

por

dois

membros

da

equipe

separadamente, para evitar distorções. Com relação À Mídia especificamente, a classificação se deu com base em informações já existentes sobre os falantes, contidas numa ficha social feita antes da entrevista propriamente dita, e com base também em informações adicionais obtidas através da leitura das entrevistas. Para a classificação

dos

falantes

conforme

a

Sensibilidade

lingüística,

os

pesquisadores se basearam em "respostas dos falantes a perguntas que buscaram captar suas opiniões acerca da diversidade lingüística." (NARO et alii, 1986, p.34; cf., também, SILVA & FERREIRA, 1988). Consideram-se então como "indícios de sensibilidade lingüística a percepção e/ou valorização de diferenças lingüísticas etárias, educacionais ou regionais, assim como a correção e a preocupação com modelos lingüísticos." (NARO et alii, 1986, p.5) Após a classificação feita, obteve-se a seguinte distribuição informantes:

dos

490

1) Mercado ocupacional: 10 de cotação

positiva, 15 de cotação

negativa e 23 de cotação intermediária; 2) Mídia: 20 de cotação positiva, 5 de cotação negativa e 22 de cotação intermediária; 3) Sensibilidade lingüística: 16 de cotação positiva, 5 de cotação negativa e 27 de cotação intermediária. O número maior de falantes na categoria intermediária ocorre porque a equipe foi extremamente rigorosa na atribuição da classificação positiva ou negativa, para que os resultados, em se tratando de variáveis sociais pouco estudadas, fossem confiáveis. Os valores probabilísticos considerados importantes para nós são os das categorias polarizadas. A equipe só não desconsiderou os falantes de classificação intermediária porque eles não são necessariamente os mesmos para todas as variáveis.

9.4 - Resultados das convencionais

variáveis

convencionais

e

não

De posse da classificação dos 48 falantes adultos com respeito a estas três variáveis, recodificamos os nossos dados, acrescentando-as. A sua codificação não ocorreu conjuntamente com a das

variáveis

estratificadas porque esta nova classificação dos informantes foi posterior à análise que apresentamos nas páginas anteriores. Refizemos então algumas etapas de análises que são apresentadas a seguir.

491

Na tabela 9.4.1, temos duas colunas de resultados. Na primeira, apresentamos os resultados já obtidos para as variáveis convencionais sem a interferência das novas variáveis (análise I) e, na segunda, apresentamos também os resultados das mesmas variáveis convencionais, na análise que considera também as variáveis não convencionais (análise II).

TABELA 9.4.1 VARIÁVEIS SOCIAIS CONVENCIONAIS VARIÁVEIS

ANÁLISE I Apl./Total

% Prob.

ANÁLISE II Apl./Total

% Prob.

ANOS DE ESCOLARIZAÇÃO 1a 4 5a 8

2413/3903= 62 0,32

2413/3903= 62 0,40

2605/3613= 72 0,53

2605/3613= 72 0,50

9 a 11

2843/3453= 82 0,65

2843/3453= 82 0,60

Feminino

4397/5680= 77 0,59

4397/5580= 77 0,58

Masculino

3464/5289= 65 0,41

3464/5289= 65 0,42

15/25a

2244/3126= 72 0,49

2244/3126= 72 0,40

26/49a

2891/3845= 75 0,54

2891/3845= 75 0,60

50/71a

2726/3998= 68 0,47

2726/3998= 68 0,50

SEXO

FAIXA ETÁRIA

Pelos resultados da análise II, podemos ver que as diferenças probabilísticas associadas aos fatores da variável Anos de escolarização se tornam menos polarizadas, enquanto há uma polarização mais evidente nos resultados relativos à Faixa etária, evidenciando-se o padrão etário curvilinear esboçado na análise I. Vamos retomar estas duas questões mais à frente. Antes disso, vamos apresentar na tabela 9.4.2 os re-

492

sultados obtidos para as variáveis não convencionais para todos os falantes, ou seja, os demais resultados sociais da análise II. TABELA 9.4.2 VARIÁVEIS SOCIAIS NÃO CONVENCIONAIS COTAÇÃO

VARIÁVEIS Mercado

Positiva

F. P.

Negativa

F. P.

Intermediária

F. P.

Sensibilidade

Mídia

1916= 81% 2361 0,69

2635= 74% 3396 0,57

3582= 74% 4825 0,53

1931= 61% 3153 0,33

799= 71% 1132 0,47

926= 64% 1442 0,48

4014= 74% 5454 0,47

4427= 69% 6440 0,46

3353= 71% 4701 0,49

A variável não convencional de efeito mais forte é o Mercado ocupacional, pois apresenta resultados polarizados, além de ser uma variável selecionada antes da Faixa etária com significância 0,0. Os falantes com cotação positiva no Mercado ocupacional fazem mais concordância (0,69) do que os de cotação negativa (0,33). A Sensibilidade lingüística também exerce influência na direção esperada, pois as pessoas com maior sensibilidade fazem mais concordância (0,57). O efeito da Mídia pouco se faz sentir, embora haja uma leve oposição entre a cotação positiva (0,53) e a negativa (0,48). Nesta análise, que engloba todos os dados, envolvendo 11 variáveis, cinco lingüísticas e seis sociais, observamos a seguinte ordem de seleção estatística das variáveis sociais: 3a.) Anos de escolarização, com significância 0,0;

493

5a.) Sexo, com significância 0,0; 6a.) Mercado ocupacional, com significância 0,0; 7a.) Faixa etária, com significância 0,0; 10a.) Sensibilidade, com significância 0,000 e 11a.) Mídia, com significância 0,046. A ordem da seleção acima continua a mostrar que Anos de escolarização e Sexo são duas variáveis sociais realmente importantes no uso da concordância nominal e que a Faixa etária é menos importante do que o próprio Mercado ocupacional. Como já observamos, com a introdução

das variáveis não

convencionais, acentua-se o padrão etário curvilinear para todos os falantes, característico dos fenômenos que refletem variação social estável com gradação etária, com o ápice das formas de prestígio na faixa etária, onde as pressões de mercado de trabalho mais se fazem sentir. Considerando também que a análise com as variáveis não convencionais

suaviza as

diferenças entre os diversos fatores da variável Anos de escolarização, decidimos

analisar

os

dados

em

mãos

em

termos

de

possíveis

subagrupamentos de falantes. Os únicos subagrupamentos possíveis que apresentavam distribuição uniforme em termos destas novas variáveis são os constituídos pelos homens e pelas mulheres. Fizemos então duas subetapas de análise considerando só os dados das mulheres e só os dados dos homens, cujos resultados vamos apresentar a seguir. Temos na tabela 9.4.3 as probabilidades relativas à variável Anos de escolarização para os homens e para as mulheres no primeiro e no décimo nível de sua

análise (Prob.1 e Prob.10, respectivamente), ou se-

494

ja, sem a influência de qualquer variável e com a influência de todas as variáveis. TABELA 9.4.3 ANOS DE ESCOLARIZAÇÃO E SEXO ANOS DE ESCOLARIZAÇÃO

SEXO

Feminino

Masculino

Freq. %

Prob.1

Prob.10

Freq. %

Prob.1

Prob.10

1 a 4a

1283=64 2006

0,32

0,35

1130=60 1896

0,42

0,51

5 a 8a

1148=83 1384

0,56

0,53

1457=65 2229

0,48

0,53

9 a 11a

1966=86 2289

0,62

0,62

877=75 1164

0,60

0,46

Os resultados da tabela 9.4.3 são extremamente interessantes. Através deles, podemos verificar que a variável Anos de escolarização tem um efeito muito mais efetivo

sobre o comportamento lingüístico das

mulheres do que sobre o dos homens. Os dados delas

apresentam, do

primeiro ao último nível de análise, probabilidades de concordância diretamente proporcionais aos Anos de escolarização, enquanto os dos homens não apresentam esta mesma hierarquia no último nível de análise. Em verdade, o instrumental quantitativo por nós usado considerou que as probabilidades associadas aos Anos de escolarização para os homens não são estatisticamente relevantes: todos os valores se aproximam de 0,50, o que indica a ausência de influência desta variável. A sua seleção indica que esta

é

a

real

configuração

estatística

dos

dados

analisados.

495

Além disso, a variável Anos de escolarização é a última selecionada, ou seja, a décima. Considerando que, no primeiro nível de análise (Prob.1), os dados dos homens apresentam probabilidades de concordância diretamente proporcionais à variável Anos de escolarização, é importante verificar que variável ou que variáveis retira(m) os pesos probabilísticos inicialmente atribuídos aos fatores desta variável. Na tabela 9.4.4, podemos fazer o acompanhamento dos níveis de análise, para os resultados dos dados dos homens. Nesta tabela, temos o comportamento estatístico da variável Anos de escolarização do nível 1 (Prob.1) ao nível 10 (Prob.10). Para maior clareza, sublinhamos as probabilidades onde ocorrem as mudanças, as quais eliminam as diferenças bem nítidas que se observam em Prob.3, junto às variáveis lingüísticas Marcas e Saliência. TABELA 9.4.4 SOBRE INTERFERÊNCIAS NA VARIÁVEL ANOS DE ESCOLARIZAÇÃO: DADOS DOS HOMENS NÍVEIS DE ANÁLISE Prob. 1 (isoladas) Prob. 2 (c/ Marcas) Prob. 3 (c/ Saliência) Prob. 4 (c/ MERCADO) Prob. 5 (c/ Relação) Prob. 6 (c/ SENSIBILIDADE) Prob. 7 (c/ contexto seguinte) Prob. 8 (c/ FAIXA ETÁRIA) Prob. 9 (c/ MÍDIA) Prob.10 (c/ Todas)

ANOS DE ESCOLARIZAÇÃO 1a 4 0,42 0,39 0,37 0,47 0,47 0,47 0,47 0,49 0,51 0,51

5a 8 0,48 0,49 0,50 0,47 0,47 0,50 0,51 0,52 0,53 0,53

9 a 11 0,60 0,62 0,63 0,56 0,56 0,52 0,52 0,48 0,46 0,46

A primeira mudança relevante ocorre em Prob.4 onde se medem os pesos relativos a Anos de escolarização e Mercado ocupacional. Considerase então que a influência dos Anos de escolarização sobre os ho-

496

mens é menos importante: o que mais importa do ponto de vista estatístico é a influência do Mercado ocupacional. Paulatinamente, as outras três variáveis destacadas (Sensibilidade, Faixa etária e Mídia) vão também alterando os valores probabilísticos nos níveis 6, 8 e 9, fazendo com que a variável Anos de escolarização fique com as suas probabilidades esvaziadas de qualquer conteúdo estatístico relevante. Esta situação não ocorre com os dados das mulheres. Podemos fazer semelhante acompanhamento através dos níveis probabilísticos da tabela 9.4.5, a seguir. TABELA 9.4.5 SOBRE INTERFERÊNCIAS NA VARIÁVEL ANOS DE ESCOLARIZAÇÃO: DADOS DAS MULHERES NÍVEIS DE ANÁLISE Prob. 1 (isoladas) Prob. 2 (c/ Marcas) Prob. 3 (c/ Saliência) Prob. 4 (c/ Relação) Prob. 5 (c/ Faixa etária) Prob. 6 (c/ MERCADO) Prob. 7 (c/ Função) Prob. 8 (c/ Contexto seguinte) Prob. 9 (c/ Mídia) Prob.10 (c/ Sensibilidade)

ANOS DE ESCOLARIZAÇÃO 1a 4 0,32 0,29 0,28 0,28 0,28 0,35 0,35 0,35 0,35 0,35

5a 8 0,56 0,58 0,58 0,59 0,58 0,55 0,54 0,54 0,53 0,53

9 a 11 0,62 0,64 0,64 0,64 0,64 0,61 0,61 0,61 0,62 0,62

Pelos diversos níveis probabilísticos da tabela 9.4.5, podemos verificar que a única pequena modificação que merece menção é a que se constata em Prob.6, quando se comparam as variáveis Anos de escolarização e Mercado ocupacional, o que, entretanto, não compromete a hierarquia existente. A variável Anos de escolarização nos dados das mulheres apresenta, portanto, um comportamento uniforme do ponto de vista da hierarquia entre os pesos probabilísticos atribuídos aos seus três

497

fatores. Estatisticamente, verifica-se, portanto, a atuação ativa desta variável sobre o comportamento lingüístico das mulheres e a sua inexistência sobre o dos homens. Além disso, observamos que, se, para as mulheres, Anos de escolarização é uma variável selecionada em segundo lugar com significância 0,0, para os homens, esta variável é selecionada em décimo lugar com significância 0,049. A variável social que assume a liderança de seleção nos dados dos

homens é o Mercado ocupacional que vem em

terceiro lugar com significância 0,0. Nos dados das mulheres, com igual significância (0,0), ela só é selecionada em sexto lugar. Os resultados lingüísticos a respeito da relação entre

Anos de

escolarização e Sexo têm a sua contraparte na realidade social em que vivemos. É do senso comum que as mulheres são mais aplicadas na escola que os homens:

vivemos dentro de uma sociedade que tem como

convenção tácita que elas devem se submeter mais às regras do que eles. Isto se reflete de forma realmente clara nos novos resultados estatísticos aqui obtidos. As mulheres não apenas usam mais formas de prestígio, mas se deixam influenciar

mais pelo processo de escolarização do que os

homens, na relação que se pode estabelecer entre este processo e o uso de formas de prestígio. Vejamos agora como ficam os resultados para Mercado ocupacional, Mídia e Sensibilidade lingüística para as mulheres e para os homens, na tabela 9.4.6.

498

TABELA 9.4.6 RELAÇÃO ENTRE VARIÁVEIS NÃO CONVENCIONAIS E SEXO COTAÇÃO NO MERCADO OCUPACIONAL

SEXO

Feminino

Masculino

Freq. %

Prob.1

Prob.10

Freq. %

Prob.1

Prob.10

Positiva

1081=87 1248

0,64

0,69

835=75 1113

0,60

0,73

Negativa

968=68 1424

0,37

0,29

963=56 1729

0,39

0,31

Intermediária

2348=78 3007

0,49

0,52

1666=68 2447

0,52

0,44

Positiva

2073=81 2563

0,53

0,48

1509=67 2262

0,64

0,76

Negativa

340=57 594

0,46

0,56

586=69 848

0,42

0,33

1984=79 2522

0,51

0,46

1369=63 2179

0,44

0,40

Positiva

1625=79 2063

0,60

0,54

1010=76 1333

0,51

0,41

Negativa

617=74 834

0,33

0,51

182=61 298

0,53

0,60

2155=77 2782

0,57

0,45

2772=62 3658

0,46

0,49

COTAÇÃO DA SENSIBILIDADE LINGÜÍSTICA

Intermediária COTAÇÃO DA EXPOSIÇÃO À MÍDIA

Intermediária

Os resultados da tabela 9.4.6 mostram que, no que diz respeito ao peso probabilístico dos fatores, o Mercado ocupacional exerce influência semelhante para os homens e para as mulheres, o que evidencia a força

499

uniforme das pressões sociais na relação entre tipo de profissão e uso de formas de prestígio. Os resultados da variável Sensibilidade lingüística mostram que os dados dos homens refletem maior correlação entre esta variável e uso lingüístico de formas padrão. Os que foram cotados como sensíveis fazem bem mais concordância do que os cotados como menos sensíveis. Isto não significa

que

as

mulheres

sejam

menos

sensíveis.

Os

probabilísticos indicam que elas apenas não reagem a esta

resultados situação da

forma esperada. Em Prob.1, as probabilidades das mulheres com relação à Sensibilidade lingüística estão na linha por nós esperada, embora com oposição pouco polarizada; e, na etapa em que se mede também o efeito de Mercado ocupacional, os pesos probabilísticos são invertidos. A Mídia, por sua vez, exerce leve influência sobre as mulheres na direção esperada, pois as mulheres com cotação positiva fazem um pouco mais concordância do que as mulheres com cotação negativa. Todavia, a influência da Mídia sobre os homens chega a ser inesperada. Os homens com cotação negativa fazem mais concordância do que os homens com cotação positiva. As nossas expectativas eram que o efeito da Sensibilidade lingüística e da Mídia

fosse semelhante para os homens e para as mulheres. Os

resultados relativos à Sensibilidade lingüística são inesperados para nós. Pelo comportamento das mulheres, relatado neste trabalho e em toda a literatura

lingüística,

esperávamos

que

elas

também

reagissem

positivamente. Pesquisas futuras precisam ser empreendidas para que se verifique a consistência destes resultados. Só então poderemos buscar explicações sociolingüísticas razoáveis. Com relação à influência da Mídia, levemente positiva para elas e negativa para eles, pode-se levantar a

500

hipótese de que o fato de as mulheres ficarem expostas durante mais tempo à televisão do que os homens, vendo principalmente novelas, determine esta diferença. A maior exposição da mulher à televisão foi constatada nas entrevistas pela equipe do Projeto Censo. Cumpre observar, todavia, que as probabilidades associadas aos dados das mulheres são extremamente próximas, contrariando as nossas expectativas de que haveria uma oposição mais acentuada. Já observamos que a análise da influência das variáveis não convencionais por subagrupamentos de indivíduos só foi possível em função do Sexo. Isto ocorreu por causa da distribuição diversificada dos falantes, natural em variáveis sociais não estratificadas. A distribuição do Mercado ocupacional, Mídia e Sensibilidade lingüística em função do Sexo mostrouse regular, mas, com relação à Faixa etária e aos Graus de escolarização, o mesmo não ocorreu. Entre o Mercado ocupacional e Escolarização, por exemplo, existe uma forte correlação: dentre os 10 falantes cotados positivamente, seis têm nove a 11 anos de escolarização e apenas um tem um a quatro anos e, inversamente, para os 15 falantes cotados negativamente, apenas um está com nove a 11 anos de escolarização, enquanto 11 estão com um a quatro anos. Esta correlação estreita entre Mercado ocupacional e Anos de escolarização dos falantes não permite análises em função de novos subagrupamentos. Distribuição diversificada existe também entre Anos de escolarização, Mídia e Sensibilidade lingüística, por um lado, e entre Faixa etária, Mercado ocupacional, Mídia e Sensibilidade, por outro lado. Por tais razões, limitamo-nos a apresentar

501

os resultados gerais e os resultados por Sexo que

apresentam uma

distribuição regular com todas as novas variáveis, mostrando resultados estatisticamente mais confiáveis e sociolingüisticamente interpretáveis. Estamos certos de que os resultados aqui obtidos para as variáveis não convencionais mostram que variáveis desta natureza merecem continuar a

ser

investigadas.

Pesquisas

futuras

podem

ser

empreendidas,

estratificando a amostra em função deste tipo de variável. Desta forma, terse-iam as condições ideais para se refutarem ou não as conclusões por nós obtidas, através de resultados estatísticos mais representativos. Resta ver como ficaram os resultados da variável Faixa etária, agora fortemente curvilinear, em função do Sexo. Os resultados podem ser vistos na tabela 9.4.7, a seguir.

TABELA 9.4.7 FAIXA ETÁRIA E SEXO FAIXA ETÁRIA

SEXO Feminino

Masculino

Freq. %

Prob.1

Prob.10

Freq. %

Prob.1

Prob.10

15/25a

1195=72 1656

0,43

0,33

1049=71 1470

0,56

0,44

26/49a

1702=84 2034

0,68

0,60

1189=66 1811

0,49

0,63

50/71a

1500=75 1989

0,47

0,49

1226=61 2008

0,44

0,43

Os resultados acima, nas suas probabilidades finais, trazem para

502

nós um fato novo: padrão etário curvilinear também para os homens. Este padrão já se mostrava nos dados das mulheres em uma análise por Sexo somente com as variáveis tradicionais, não apresentadas em detalhes no corpo deste trabalho, com os seguintes resultados: 0,42; 0,60 e 0,48 para, respectivamente, mulheres de 15/25 anos; de 26/49 e 50/71. Esta mesma análise, para os homens, não revelara o mesmo padrão, o qual se mostrava muito pouco marcado, com um leve aumento de concordância na faixa mais jovem, em direção, portanto, a um sistema com marcas. Os

resultados

probabilísticos para as respectivas idades no caso dos homens eram: 0,57 (15/25 anos); 0,48 (26/49) e 0,45 (50/71 anos), o que também se pode observar nos valores probabilísticos de Prob.1 da tabela 9.4.7: 0,56; 0,49 e 0,44, respectivamente. O que vai alterar o padrão levemente inclinado para os homens é exatamente a entrada das novas variáveis, conforme podemos observar na tabela 9.4.8.

TABELA 9.4.8 SOBRE A FAIXA ETÁRIA NOS DADOS DOS FALANTES DO SEXO MASCULINO FAIXA ETÁRIA

PROBABILIDADES Isoladas

c/Mercado

c/Sensibilidade

c/Mídia

15/25a

0,56

0,47

0,49

0,46

26/49a

0,49

0,55

0,58

0,60

50/71a

0,44

0,48

0,42

0,43

As variáveis Mercado ocupacional, Sensibilidade lingüística e Mídia provocam alterações nos valores probabilísticos

inicialmente associ-

503

ados aos fatores da variável Faixa etária. As últimas alterações, com probabilidades finais - 0,43; 0,63 e 0,43 - são provocadas pela variável Anos de escolarização. Diante de tais resultados, a conclusão mais segura a se estabelecer sobre o fenômeno em estudo seria a de variação sociolingüística estável com gradação etária, e influências de outras variáveis de papel

estritamente

sincrônico, como Mercado ocupacional, Sensibilidade lingüística e Mídia.170 Todavia, vimos no capítulo anterior que, além do padrão

etário

curvilinear para os falantes de ambiente não humilde e concordância alta, emerge também um padrão etário inclinado em direção a um sistema de perda nos falantes de concordância baixa. Para confirmarmos este segundo padrão, o ideal seria termos os subagrupamentos por ambiente, grau de concordância e sexo, distribuídos regularmente em termos das demais variáveis. Conjuntamente com as novas variáveis, isto é impossível pelo pequeno número de falantes. Mesmo com apenas as variáveis tradicionais, o número de falantes por célula já é bastante desigual, como podemos ver no quadro 9.4.9, a seguir.

504

QUADRO 9.4.9 DISTRIBUIÇÃO DOS FALANTES POR AMBIENTE, GRAU DE CONCORDÂNCIA E SEXO AMBIENTE E GRAU DE CONCORDÂNCIA

SEXO Feminino

Masculino

5

5

Não humilde Alta Humilde Alta

10

1

2

4

Não humilde Baixa

1

3

18

13

Humilde Baixa

Total

Os subagrupamentos que podem nos trazer algumas evidências mais seguras sobre o ponto em discussão são os seguintes: 1) mulheres de ambiente humilde e concordância baixa (5); 2) homens de ambiente humilde e concordância baixa (5); 3) mulheres de ambiente não humilde e concordância alta (10). Dentre os três agrupamentos acima, apenas os das mulheres nos permitem resultados menos problemáticos: elas apresentam uma distribuição bastante uniforme em termos dos Anos de escolarização: dentre as cinco de ambiente humilde, quatro são do primário e uma do ginasial e, dentre as dez de ambiente não humilde, nove são do colegial e apenas uma é também do ginasial. Além disso, apenas elas apresentam as três faixas etárias relativamente bem distribuídas.

505

Sendo assim, vejamos os resultados para estes dois grupos de mulheres na tabela 9.4.10. TABELA 9.4.10 SOBRE O COMPORTAMENTO DAS MULHERES TIPO AMBIENTE E GRAU DE CONCORDÂNCIA FAIXA ETÁRIA

Ambiente humilde Concordância baixa Apl./Total %

15/25a 26/49a 50/71a

Prob.

160/361 = 164/302 = 201/375 =

44 54 54

0,36 0,56 0,58

440/868 = 85/170 = xxx

51 50

(0,51) (0,49)

Ambiente. não humilde Concordância alta Apl./Total %

Prob.

599/714 = 84 934/1010 = 92 789/924 = 85

0,45 0,65 0,42

ANOS DE ESCOLARIZAÇÃO 1a 4 5a 8 9 a 11

xxx 534/598 = 1778/2050 =

89 87

(0,53) (0,47)

Os resultados da tabela 9.4.10 corroboram os dois padrões anteriormente encontrados: mulheres de ambiente humilde e concordância baixa apresentam padrão inclinado em direção a um sistema de perda, e mulheres de ambiente não humilde e concordância alta apresentam variação sociolingüística estável com gradação etária, o que novamente nos permite inferir que estes dois padrões ocorrem para todos os falantes de concordância baixa e de concordância alta, respectivamente.

506

9.5 - Conclusão À luz de todos os resultados e discussões apresentadas neste capítulo e no capítulo anterior, concluímos 1) que há influências sociais de natureza estritamente sincrônica, do tipo Mercado ocupacional, Mídia e Sensibilidade lingüística; 2) que a concordância de número entre os elementos do SN apresenta dois padrões de comportamento: variação sociolingüística estável para os falantes de alta concordância e processo de mudança lingüística em direção a um sistema de perda para os falantes de baixa concordância e 3) que não há evidências de processos descrioulizantes, mas sim de processos "aquisitivos" através da influência da escola ou de outras variáveis de natureza semelhante, sem vinculação direta com a faixa etária. Para se trazerem maiores esclarecimentos em relação às questões que se colocam, restam ainda testes diversos a serem feitos. Avaliações subjetivas pela pistas para

comunidade lingüística, por exemplo, podem apresentar

se determinar a situação

em que se encontra o fenômeno

lingüístico estudado (cf. LABOV, 1972, p.260-325; LABOV, 1981, p.184-96; TARALLO & DUARTE, s/d). A realização de testes de avaliação também se faz importante porque, embora o fenômeno por nós estudado seja estigmatizado, o seu grau de estigmatização não é o mesmo em função de um ou outro fator de uma ou outra variável. Cremos que a maioria dos falantes não estranharia, por exemplo, a produção de dois cachorro-quente, aquelas cruzinha toda; juntamos nossas trouxinha; umas comida braba; um montão

de

bestera;

uns

cara

brabão;

um

punhado

de

507

carro parado; mas, certamente, estranharia os meu filho; os melhor jogador; as ota pessoa; os três avião; as cultura local ou as própria contradição; indubitavelmente, diria que não fazem parte da língua portuguesa estruturas do tipo todos o garoto; o meu meninos e ainda lançaria uma interrogação sobre a existência de na minhas coisas; na casa do meus pais. Há algumas configurações sintagmáticas que se apresentam sem marcas até na escrita pressupostamente padrão. Num bilhete de uma escola de classe média num bairro da Zona Sul do Rio de Janeiro, pudemos ler, por exemplo, "três lápis preto" (Jardim - segundo semestre), em 1987. Em 1988, numa lista de material da mesma escola, continuamos a ler "8 lápis preto" (C.P. -primeiro semestre), embora todas as demais estruturas da referida lista se apresentassem com todas as devidas marcas de plural. A nossa certeza sobre a importância de testes de avaliação subjetiva é inquestionável, mas não tivemos ainda oportunidade de formalizá-los. Esta questão tem aguçado o

nosso interesse, não só pelo fato de termos

possíveis respostas para a relação entre variação e mudança, mas, também, para refletirmos um pouco mais sobre a relação entre língua e sociedade, principalmente numa sociedade em que tanto se estigmatizam os indivíduos em função de seu comportamento lingüístico,

alijando-os do processo

produtivo, por puro preconceito lingüístico. Recentemente, num conhecido jornal do país, o Jornal do Brasil, deparamos com a transcrição de falas de pessoas, presumivelmente não escolarizadas, onde se podia ver a estrutura três negão daqueles bem grandão (cf. MONTINNI, JB, 06/03/87, Caderno Cidade,

p.1),

que

satisfaz

a

todos

os

508

condicionamentos lingüísticos desfavorecedores de marcas de concordância. No dia

seguinte, este mesmo jornal, na mesma seção, apresenta uma

matéria sobre o mesmo assunto, não sabemos se feita pelo mesmo jornalista, na qual utiliza a construção acima citada, devidamente com aspas, mas na forma três negões daqueles bem grandões (cf. MONTINNI, JB, 07/03/87, Caderno Cidade, p.3). Por fatos simples como estes, o pesquisador atento percebe o grau de preconceito lingüístico existente, mesmo nos grupos profissionais que se utilizam da linguagem a todo momento e que sabem muito bem o quão variada ela é, e sabem ainda mais que variação não implica assistematicidade. No mesmo jornal, já tivemos oportunidade de ler, há tempos atrás, que um senhor fugira do hospital porque o médico que ia operá-lo não sabia fazer concordância nominal e verbal.171 Cumpre-nos dizer, finalmente, que uma outra conclusão inequívoca se extrai dos resultados apresentados por nós neste capítulo: a variação que envolve a concordância de número entre os elementos do sintagma nominal, refletindo ou não processos de mudança lingüística, é inerente, uma vez que a influência da maioria das variáveis lingüísticas se dá de forma bastante consistente sobre os diversos subagrupamentos de falantes. Podemos, então, realmente afirmar que as diferenças no comportamento lingüístico dos diversos falantes do Português são mais quantitativas do que propriamente qualitativas.

10 - CONCLUSÃO

Conforme explicitamos na Introdução deste trabalho, não dedicamos uma parte específica para a interpretação lingüística dos resultados estatísticos. No seu decorrer, ao final de cada tópico, fomos apresentando as conclusões a que chegamos, bem como todas as suas implicações teóricas. Por esta razão, limitamo-nos, no presente capítulo, a sintetizar as principais idéias exaustivamente desenvolvidas nos capítulos 6, 7, 8 e 9, com a meta de avaliar o alcance dos objetivos propostos e, conseqüentemente, apresentar uma visão de conjunto do trabalho realizado. Estamos certos de que os quatro objetivos propostos na Introdução deste trabalho foram alcançados. Esta certeza decorre do fato de que, primeiro, descrevemos e explicamos o conjunto de variáveis lingüísticas que regem as tendências sistemáticas da variação que envolve a concordância de número entre os elementos do SN; segundo, discutimos a hipótese funcionalista kiparskiana e mostramos a necessidade da teoria lingüística incorporar mais um princípio de natureza não gramatical, denominado Princípio do Processamento com Paralelismo, para explicar fenômenos diversos de línguas diversas; terceiro, demonstramos que o fenômeno estudado apresenta a configuração de variação estável, para um subgrupo de falantes, e de processo de mudança em progresso, para outro subgrupo, evidenciando-se uma situação bem mais complexa do que a estabelecida pelos estudiosos anteriores; e, quarto, mostramos que a influência de variáveis lingüísticas importantes se dá de maneira uniforme sobre agrupamentos de indivíduos, constatando-se a variação inerente.

510

Para alcançar o primeiro objetivo, analisamos os sintagmas nominais relevantes sob duas perspectivas: uma atomística e outra não atomística. Concluímos que as variáveis que atuam na perspectiva atomística são as seguintes:

1) Marcas precedentes e posição; 2) Saliência fônica: dimensões processos e tonicidade; 3) Relação dos elementos não nucleares em função do núcleo e posição dos elementos nucleares no SN; 4) Formalidade dos substantivos e adjetivos; 5) Grau dos substantivos e adjetivos; 6) Animacidade dos substantivos; 7) Contexto fonético/fonológico seguinte e 8) Função resumitiva.

Sob a perspectiva não atomística, constatamos a seguintes variáveis:

1) Pluralidade do contexto; 2) Configuração sintagmática do SN; 3) Saliência fônica: dimensão processos; 4) Grau/Formalidade do SN; 5) Pluralidade do SN; 6) Função textual e 7) Localização do SN.

influência das

511

Ainda sob esta segunda perspectiva, não se mostraram relevantes as variáveis Status informacional do SN e Animacidade do SN. Marcas precedentes e posição, a nível atomístico, e Pluralidade do contexto, a nível não atomístico, evidenciam que, na relação entre os elementos dentro do SN e na relação entre os SNs no discurso, marcas conduzem a marcas e zeros conduzem a zeros. Estas duas variáveis explicam-se em função do Princípio do Processamento com Paralelismo, que subjaz à tendência de formas semelhantes se agruparem, através de processos mentais associativos presentes no desempenho lingüístico.

A Saliência fônica, por sua vez, além de atuar sobre cada elemento do SN, estende o seu efeito sobre a estrutura sintagmática como um todo. Sendo assim, além do item lexical não regular ter mais chances de ser marcado, um SN que contenha pelo menos um constituinte não regular apresenta também mais chances de conter todas as marcas formais de plural. A seqüência menos marcada é seguramente constituída de elementos nominais regulares paroxítonos. A atuação desta variável explica-se pelo Princípio da Saliência que consiste em estabelecer que formas mais salientes são mais perceptíveis e, portanto, mais marcadas. No caso em questão,

marcam-se

mais

as

construções

que

apresentem

maior

diferenciação fônica na relação singular/plural ou que tenham marca de acento na sílaba que recebe o morfema de plural.

A variável Relação dos elementos não nucleares em função do núcleo e posição dos elementos nucleares no SN, a nível atomístico, e-

512

videncia que os elementos não nucleares antepostos são mais marcados do que os pospostos e que os núcleos da primeira posição tendem a ser muito marcados. Esta variável evidencia também que os núcleos da segunda e terceira posição são menos marcados do que os da primeira, mas não são igualmente marcados na relação entre si, chegando a se vislumbrar a possibilidade de os núcleos da terceira posição serem mais marcados do que os da segunda. A Configuração sintagmática, a nível não atomístico, corrobora os resultados encontrados na análise atomística, evidenciando que os SNs que se finalizam com um substantivo tendem a ser mais marcados do que os que se finalizam com um adjetivo, um quantificador ou um possessivo. O que explica tais fatos é o Princípio da Iconicidade, uma vez que o número de marcas num dado segmento ou numa dada seqüência é função do grau de coesão sintagmática entre os constituintes do SN. Quanto maior a coesão, mais marcas e, quanto menor, menos marcas. Elementos não nucleares antepostos estabelecem com seu núcleo maior grau de coesão do que elementos não nucleares a ele pospostos. Da mesma forma, sintagmas de mais de dois constituintes, cuja última categoria é um substantivo, são de um tipo mais coeso do que aqueles cuja última categoria é um não substantivo.

O Princípio do Processamento com Paralelismo explica a preferência pelas configurações sss ou s00 e a raridade das configurações s0s ou 00s, enquanto o Princípio da Iconicidade explica (1) a preferência pela estrutura sss em SNs cujo último constituinte é um substantivo e (2) a preferência pela estrutura

s00

em

SNs

cujo

último

constituinte

é

um

adje-

513

tivo, um possessivo ou um quantificador. O Princípio da Economia, ao qual relacionam-se as Condições de Distintividade, amplamente utilizado para explicar o comportamento da Posição que o elemento ocupa no SN ou da Classe gramatical dos constituintes do SN, como variáveis isoladas, não tem a posição de destaque que se supunha ter.

A Formalidade e o Grau dos itens lexicais, a nível atomístico, e a Formalidade/Grau da estrutura do SN, a nível não atomístico, atuam tanto de forma localizada quanto de forma global. Um item lexical informal ou diminutivo/aumentativo ou um SN que contenha uma seqüência com pelo menos um destes itens tende a desfavorecer a presença de marcas formais de plural. A explicação que subjaz à atuação desta variável é novamente de ordem não gramatical. É do nosso conhecimento que a formalidade da situação tende a atuar sobre o comportamento da concordância nominal. Se a situação é informal, colocam-se menos marcas e, se a situação é formal, colocam-se mais marcas. Os itens ou estruturas caracterizadas como informais e os itens diminutivos/aumentativos são próprios de um discurso mais relaxado e, por isto, propiciam também menos marcas de plural nas construções nominais.

A Animacidade dos substantivos se mostrou relevante na abordagem atomística, mas não na abordagem não atomística, embora nesta segunda perspectiva ainda se mantivesse com probabilidades diferenciadas até o final da análise. Os substantivos com o traço [+humano] se apresentam ligeiramente mais marcados do que os com o traço [-humano]. Como a

análise

atomística

envolve

um

número

de

dados

consi-

514

deravelmente maior, podemos concluir que a modesta influência desta variável só se mostra estatisticamente relevante quando há grandes massas de dados envolvidas. A explicação para a sua influência encontra-se na linha do Princípio da Saliência de forma mais ampla, considerando que o traço [+humano] é mais saliente do ponto de vista discursivo.

A influência do Contexto fonético/fonológico seguinte mostra, mais uma

vez,

que

a

busca

do

padrão

silábico

CV

não

norteia

a

ausência/presença de marcas de plural no SN. O seu efeito mais forte se evidencia de forma contrária, com consoantes seguintes favorecendo a incidência de marcas e vogais desfavorecendo-a, nos itens em -S (mês/meses). O que subjaz a esta forte influência é o fenômeno da haplologia sintática, ou seja, a tendência a se eliminarem segmentos formalmente idênticos que ocorrem de forma contígua. Os resultados desta variável, considerando somente os itens regulares, não apresentam diferença entre a presença de uma consoante ou de uma vogal seguinte, evidenciando-se

uma

oposição

binária

entre

pausa

e

não

pausa.

Consoante e vogal - não pausa - desfavorecem a presença de marcas e a pausa favorece-a. Todavia, esta atuação não é polarizada. Igualmente não polarizada é a atuação que procurou-se verificar em função dos traços das consoantes. Concluímos que os traços [surdo], [oral] e [velar] tendem a favorecer ligeiramente a presença de marcas, enquanto os traços [sonoro], [nasal] e [labial/dental] tendem a desfavorecê-la. A fraca influência da variável Contexto fonético/fonológico seguinte, ao lado da forte influência das variáveis Marcas, Relação e Saliência,

515

mostra que a variação que envolve a concordância de número no SN é, neste estágio do Português, um fenômeno pouco influenciado por razões fonológicas, sem fortes ligações com a queda do -S de natureza não morfêmica. A concordância nominal é um fenômeno essencialmente morfossintático, cujo funcionamento é explicado por forças alheias ao sistema lingüístico propriamente dito. Este fenômeno é de natureza morfossintática porque envolve, por exemplo, categorias do tipo processos de formação do plural, grau dos itens lexicais, classe gramatical dos constituintes do SN e relação entre estes constituintes, em termos de posição dos elementos na estrutura sintagmática e em termos de tipos e posição das marcas de plural, mas é explicado por forças alheias ao sistema lingüístico propriamente dito, porque os princípios gerais nele envolvidos - o princípio da Saliência, o Princípio da Iconicidade e o Princípio do Processamento com Paralelismo - são de natureza não gramatical, ou seja, são princípios gerais de motivação externa. Em verdade, o fenômeno da concordância nominal transcende o limite dos subsistemas lingüísticos tradicionais e se configura também como um fenômeno discursivo, no sentido de que faz referência a relações que se estabelecem além das fronteiras oracionais, do tipo a pluralidade do contexto ao derredor das estruturas nominais analisadas.

A análise da Função sintática em termos tradicionais, sob a perspectiva atomística,

mostrou-se

irrelevante

para

se

determinar

a

incidência

516

de marcas plurais no fenômeno estudado. Ao final da análise, detectamos apenas uma oposição binária: SNs de função resumitiva, desfavorecendo a presença de marcas e SNs de função não resumitiva, favorecendo-a. A explicação final para o funcionamento desta variável teve como base o Princípio da Baixa Tensão ou o Princípio da Topicidade, uma vez que estes SNs não são ponto de referência no discurso. A hipótese inicial para a interpretação desta variável, na sua forma binária, baseava-se no Princípio da Economia, uma vez que a maioria dos SNs resumitivos se limitam a retomar conteúdos já transmitidos. A reanálise desta variável, denominada de Função Textual, na parte não atomística, teve como objetivo perseguir a idéia de que a concordância se faz menos nas situações em que os SNs portam informação redundante. Os resultados alcançados não foram, todavia, satisfatórios, uma vez que inconsistentes com os objetivos pospostos. Concluímos que os resultados obtidos apontam para o fato de que há outra espécie de regularidade lingüística por detrás desta variável, que não conseguimos captar. Certamente não é uma questão ligada à "tendência à eliminação de redundância". Na análise feita neste trabalho, sob a perspectiva global, a Configuração sintagmática do SN, a Formalidade do SN e a Localização do SN revelaram-se mais consistentes do que a Função textual, a qual apresenta sobreposições com estas outras três variáveis.

O Princípio da Topicidade ou o Princípio da Baixa Tensão continuam, todavia, a explicar o funcionamento da variável Localização dos SNs, uma vez que os SNs que se encontram à esquerda da oração tendem a

517

ser mais marcados do que os que se encontram à direita ou em posição neutra. Este fato é consistente com a idéia de que, em línguas de morfologia não ergativa como o Português, Princípios desta natureza tenham maior relevância. Conforme esta idéia, continua sendo consistente o fato de que a variável Status informacional do SN tenha se mostrado uma variável de influência irrelevante para o fenômeno da concordância nominal em Português.

A Pluralidade do SN, de natureza não atomística, indicou que SNs classificados como "mais de um não inerente" tendem a ocorrer predominantemente com todas as marcas de plural, enquanto os classificados como "partes do corpo" encontram-se no pólo oposto. Esta variável, estudada de forma incipiente neste trabalho, aponta para um estudo ainda não realizado: a análise dos SNs plurais em relação às suas possíveis contrapartes singulares. Neste estudo, será necessário verificar os graus de cristalização de determinadas estruturas que ocorrem predominantemente no singular ou no plural. Um estudo desta natureza poderá trazer grandes contribuições a respeito do que determina a escolha da estrutura singular ou plural, esta parcial ou totalmente marcada, fora a necessidade de se transmitir a idéia de "mais de um", comumente associada à marca formal de plural.

Pela análise das variáveis lingüísticas que fizemos neste trabalho, e que apresentamos em detalhes no capítulo 6 e resumimos nas páginas acima, tivemos condições de atingir o nosso segundo objetivo: o de discutir a hipótese funcionalista kiparskiana, associada ao Princípio da Economia.

518

Concluímos que as Condições de Distintividade ou o Princípio da Economia têm a sua atuação, se é que a têm, apenas sobre a possibilidade da concordância de número entre os elementos do SN em Português ser um fenômeno variável. Mas, uma vez que o falante escolhe uma estrutura plural, formal ou semanticamente marcada na primeira posição, o número de marcas seguintes não se pauta pelo Princípio da Economia ou pelas Condições de Distintividade, mas, sim, e principalmente, pelo Princípio do Processamento com Paralelismo, pelo Princípio da Saliência e pelo Princípio da Iconicidade. Consideramos

oportuno

relembrar

que,

além

das

variáveis

analisadas, apresentamos dois tipos de argumentação independente que evidenciaram a não atuação do Princípio da Economia ou das Condições de Distintividade. Vimos que "a fronteira de morfema" não tem influência sobre a presença ou não do -S, ao concluirmos que a presença do -S nos itens regulares, onde ele é o único segmento que marca a pluralidade, ocorre menos do que nos itens não regulares, onde

ele é apenas um dos

componentes da marca de plural. Além disso, vimos que o tipo de "indefinido" formalmente plural em SNs de dois constituintes não tem a menor relevância sobre a marca no segmento seguinte. Não importa se o indefinido

é ou não semanticamente plural. Pela hipótese funcionalista

kiparskiana, resultados contrários aos por nós encontrados é que seriam esperados. Outros argumentos contra-funcionalistas, no sentido kiparskiano do termo, encontram-se listados abaixo.

519

1) A Ausência de marca na segunda posição em SNs de estrutura [artigo definido + possessivo + substantivo] independe da presença/ausência de marca na primeira posição. 2) O fator "circunstancial" na variável Função textual apresenta

a

probabilidade mais alta de todas. 3) A

variável

Formalidade

dos

substantivos

evidencia

maior

importância probabilística do que a variável Função resumitiva do SN na análise atomística. 4) A variável Função resumitiva é a última variável lingüística a ser selecionada na análise atomística. 5) Na análise não atomística, a variável Formalidade/Grau do SN apresenta resultados mais consistentes do que a variável Função textual do SN. Desta forma, fica definitivamente descartada a relevância da hipótese funcionalista kiparskiana como uma hipótese adequada para explicar, de forma consistente, a ausência/presença de marcas de marcas formais de plural nos elementos flexionáveis do SN em Português. Dentre os três princípios arrolados acima para explicar o fenômeno em questão, o Princípio do Processamento com Paralelismo tem especial relevância neste trabalho, no sentido de que ele é capaz, não apenas de explicar a atuação da variável Marcas precedentes e Posição, a nível atomístico, e a Pluralidade do contexto, a nível global, mas, também, porque ele se mostra eficaz para explicar o funcionamento de um expressivo conjunto de fenômenos do Português do Brasil, bem como o funcionamento de fenômenos de um número nada desprezível de línguas naturais.

520

A variável comum a todos os trabalhos observados no capítulo 7, denominada de Paralelismo formal, consistentemente apresentada de forma direta ou indireta, mostra que o Princípio do Processamento com Paralelismo é um candidato a universal, atuando sobre o comportamento lingüístico e, como tal, deve ser incorporado pela teoria lingüística. Até que ponto o funcionamento deste princípio é capaz de afetar a forma da língua no decorrer do tempo, é um estudo que está por se fazer. O fato é que a concordância com o mais próximo em situações normalmente não previstas já aparece em textos escritos, relidos e revisados. Inclusive no interior deste trabalho, deparamos, por exemplo, após diversas releituras, com a seguinte estrutura: "a presença de marcas levam a marcas e a presença de zeros levam a zeros". Após a "devida" correção, a digitadora do texto corrigido nos perguntara se nós não nos enganáramos na correção da passagem supracitada para "a presença de marcas leva a marcas e a presença de zeros leva a zeros". Fenômenos sistemáticos produzidos no desempenho, mesmo

com

explicações

de

natureza

não

gramatical,

têm

de,

necessariamente, provocar alterações na forma da língua, no decorrer do tempo.

O terceiro objetivo proposto envolve a relação polêmica entre variação e mudança. De uma forma geral, vimos que as variáveis Sexo e Grau de escolarização desempenham papéis importantes no fenômeno estudado. As mulheres e as pessoas mais expostas à escola se aproximam mais das formas de prestígio. A explicação para este tipo de comportamento é

521

constante dentro da literatura lingüística: a pressão que a sociedade exerce em direção às formas lingüísticas legitimadas tem o seu efeito mais efetivo sobre as mulheres, mais sujeitas às regras, e sobre aqueles que freqüentam a escola por mais tempo, local onde se atribui especial relevo às formas de prestígio. A faixa etária, nesta perspectiva, ou seja, no conjunto dos dados, foi a variável social convencional que menos influência revelou ter. Ela apresentava uma configuração levemente curvilinear. O comportamento das três variáveis convencionais parecia indicar, portanto, que a concordância de número no SN refletia um estágio de variação sociolingüística estável. Apenas uma análise sob uma perspectiva não usual, que levou em consideração o ambiente de origem do falante e o seu grau de concordância, se alto ou baixo, no interior de seu grupo, revelou a influência da faixa etária de forma mais polarizada e mais interessante. Duas tendências inequívocas se vislumbram no universo de nossos falantes:

1) variação sociolingüística estável, com gradação etária, para os falantes de ambiente não humilde e de concordância alta; 2) processo de mudança lingüística, caminhando em direção a um sistema sem concordância, para os falantes de ambiente humilde e concordância baixa.

Os resultados da variável Saliência fônica para estes dois agrupamentos de falantes, mais hierarquizados para o segundo grupo do que para o primeiro, nos levaram definitivamente a inferir a existência de uma

522

mudança em progresso para o segundo grupo, ao lado da variação estável para o primeiro. A hipótese da descrioulização não pôde, portanto, ser confirmada com os nossos resultados, quer sociais, quer lingüísticos. Na argumentação lingüística, evidenciou-se também que as marcas não tendem a ocorrer apenas na primeira posição do SN, mas em todos os elementos não nucleares antepostos ao núcleo, independentemente da posição, o que constitui mais uma evidência lingüística contra a hipótese da descrioulização. O

estudo

de

variáveis

sociais

não

convencionais,

atuando

sincronicamente, do tipo Mercado ocupacional, Mídia e Sensibilidade lingüística, apresentou

resultados interessantes, suscitando pesquisas

futuras com amostras estratificadas em função destas variáveis. A variável Mercado ocupacional revelou-se de particular interesse, considerando que seus resultados, além de indicarem que a cotação positiva ou negativa favorece ou desfavorece, respectivamente, a presença de concordância,

evidenciaram,

também,

que

o

seu

efeito

sobre

o

comportamento dos homens é mais contundente do que a influência da escola. Evidenciaram, ainda mais, que as mulheres, além de receberem a influência marcante da escola, recebem, também, a influência do Mercado ocupacional no seu desempenho lingüístico.

O quarto e último objetivo, o de mostrar a variação inerente, foi alcançado ao se detectar a influência uniforme da maioria das variáveis lingüísticas sobre os agrupamentos de falantes. Evidenciamos esta uniformidade explicitamente com duas das três variáveis lingüísticas mais

523

fortes: Marcas e Relação. A terceira variável lingüística forte - Saliência fônica - mostrou algumas diferenças de atuação, mas é precisamente através desta variável que se pode perceber a direcionalidade da mudança lingüística que se encontra em andamento. Através dos resultados das variáveis Marcas e Relação, e também da Pluralidade do contexto, pudemos concluir que as diferenças entre os diversos subagrupamentos de falantes são mais propriamente quantitativas do que qualitativas, ou seja, a variação é inerente. Somos levados a generalizar que, se um dado falante que faz muita concordância deixar de fazê-la, ele deixará de colocar marcas de plural precisamente nos ambientes lingüísticos menos propícios à existência de marcas e, inversamente, o falante que faz pouca concordância, quando a fizer, colocará marcas de plural precisamente nos ambientes lingüísticos que mais provocam a presença de marcas. Podemos, portanto, prever que, se o falante for do sexo feminino, com alto grau de escolarização, de meia-idade, com cotação positiva no mercado ocupacional - o protótipo do falante que faz muita concordância -, ele tenderá a deixar de colocar marcas, por exemplo, 1) em elementos não nucleares pospostos ao núcleo; 2) em núcleos que ocupam a segunda posição; 3) em elementos da terceira posição precedidos de

ausência de

marca na segunda posição; 4) em estruturas contendo seqüências de regulares paroxítonos; 5) em

estruturas

contendo

itens

lexicais

diminutivos/aumentativos; 6) em SNs que se encontram à direita da oração ou

informais

ou

524

7) em contextos discursivos de menor pluralidade. Por outro lado, se o falante for do sexo masculino, com baixo grau de escolarização, jovem ou velho, com cotação negativa no mercado ocupacional - o protótipo do falante que faz pouca concordância -, ele tenderá a colocar marcas, por exemplo, 1) em elementos não nucleares antepostos ao núcleo; 2) em núcleos que ocupam a primeira ou terceira posição; 3) em elementos da terceira posição precedidos de presença de marcas na segunda posição; 4) em estruturas contendo itens não regulares; 5) em estruturas contendo itens não informais e de grau normal; 6) em SNs que se encontram à esquerda da oração ou 7) em contextos lingüísticos de menor pluralidade. Podemos então concluir que, da descrição que fizemos, somos capazes de prever, com baixa margem de erro, em que contextos lingüísticos e sociais a marca de plural tenderá a ocorrer. Finalmente, acreditamos ter demonstrado que este trabalho traz contribuições a nível da descrição/explicação de gramáticas particulares e a nível da teoria lingüística geral.

525

11 - NOTAS

11.1 - Notas dos capítulos 1 a 5 1A equipe científica do Projeto Censo é constituída pelos seguintes professores: 1) Anthony Julius Naro (UFRJ- Faculdade de Letras); 2) Alzira Verthein Tavares de Macedo (UFRJ- Faculdade de Letras); 3) Charlotte Emmerich (UFRJ- Museu Nacional); 4) Giselle Machline de Oliveira e Silva (UFRRJ); 5) Maria Cecília de Magalhães Mollica (UFRJ - Faculdade de Letras); 6) Maria da Conceição Auxiliadora de Paiva (UFJF); 7) Maria Luiza Braga (UFF); 8) Maria Marta Pereira Scherre(UFRJ - Faculdade de Letras); 9) Nelize Pires de Omena (UFRJ - Faculdade de Letras); 10) Sebastião Josué Votre (UFRJ - Faculdade de Letras). 2 Os falantes de cinco anos de escolarização com *(asterisco) são do antigo primário e, por isto, foram assim classificados. 3Construções do tipo a coisa bonita com sentido de plural não são encontradas em Português, embora segundo Poplack elas existam no Espanhol (cf., 1980a, p.61). Todavia, mesmo se existissem, não as consideraríamos como casos de ausência de inserção de marca de plural, mas como casos de plural semântico sem marca formal. 4What is less often recognized is than there exists another, fundamentally different (though logically complementary) mode of theoretical linguistics. (...) Its scientific objective is to describe, not analytic and theoretical constructs, but linguistic phenomena themselves. (...) It seeks to make generalizations about concrete phenomena in language (...). (NICHOLS & WOODBURY, 1985, p.2) 5Linguistic functionalism combines certain theoretical advances of formal grammar with the concerns and theoretical advances of sociolinguistics and ethnography of communication. It aims at closing the gap between the study of language and the study of communication. (NICHOLS, 1984, p.98) 6(...) there is no functionalist theory, although there are preliminary outlines and accounts of what such a theory would look like and what is would handle (...) (NICHOLS, 1984, p.102) 7Functionalist statements may be divided into three types: conservative, moderate, and extreme. The conservative type merely acknowledges the inadequacy of strict formalism or structuralism, without proposing a new

526

analysis of structure. (...) The moderate type not only points out the inadequacy of a formalist or structuralist analysis, but goes on to propose a functionalist analysis of structure and hence to replace or change inherited formal or structural accounts of structure. (...) Extreme functionalism denies, in one way or another, the reality of structure qua structure. It may claim that rules are based entirely on function and hence there are no purely syntactic constraints; that structure is only coded function, or the like. (NICHOLS, 1984, p.102-3) 8(...) the only forces which organize language are forces internal to the system (...) Nothing penetrates from outside: neither iconic motivation nor any other kind of external motivation. (DU BOIS, 1984, p.345) 9(...) all seemingly autonomous syntactic facts are actually the transparent results of the speaker's functional goals, etc, so that no arbitrary syntactic apparatus needs to be postulated for the language (...) Here the only forces governing 'syntax' (which exists in the sense simply of ordering of word tokens in utterances) are the positive forces of external linguistics: perhaps biologically-based processing mechanisms, speaker intentions, etc. (DU BOIS, 1984, p.345-6) 10No theory of discourse and grammar will ultimately be adequate (...) without an explicit theory of the competition and systematic reconciliation of external and internal motivations. (DU BOIS, 1984, p.347) 11If language is said to be adaptive, in that it responds to pressures from the external 'environment', we must reject the theoretical framework of autonomous structuralism, which is limited, in its attempts to account for the structuring of language, to recognizing only system-internal motivating forces. On the other hand, if language is a said to be system, and as such has on the least a degree of continuity of existence, we must reject the theatrical framework of transparent functionalism, which fails to account for the fact that grammaticized categories (...) are retained for reuse (...) in a more or less frozen (...) form. More importantly, perhaps, it fails to properly construe the most fundamental internal aspect of grammar, the process of grammaticization itself. As an alternative to rigidly puristic versions of autonomous structuralism or transparent functionalism, I suggest it will be most fruitful to seek a synthesizing framework for linguistics, one capable of dealing with the interaction of external and internal forces, and with their systematic resolution. (...) Finally, we must seek to understand the nature of the complex interaction between langue and parole, between discourse and grammar. (DU BOIS, 1984, p.362) 12(...) to add to the theory substantive conditions which pertain not to the form of grammars (i.e., to the system of rules that generates a language) but to their output. (KIPARSKY, 1972, p.195)

527

13 A simple illustration of the sort of phenomenon that I will be concerned with here is found in those varieties of American English which have the rule that drops word-final -t, usually optionally. Where this -t is the past tense ending, some speakers drop it only when the present and past tense forms of the verb show a different stem vowel (...) The vowel of the stem cannot in the present theory of generative phonology serve to determine whether or not -t may be dropped. (...) There is no single point in the derivation at which the crucial information, whether a vowel change has taken place, is available. (KIPARSKY, 1972, p.197) 14The rule is blocked (or, in some dialects, applied less frequently) when its application makes the past and present forms indistinguishable (pass:passed), but applies freely where this distinction is retained because of the vowel difference (keep:kep'). (KIPARSKY, 1972, p.198) 15We have (...) distinctness conditions, which, as an initial approximation, state that there is a tendency for semantically relevant information to be retained in surface structure. (KIPARSKY, 1972, p.195) 16Retention of functional information in surface structure would appear to be motivated by the requirements of speech perception (...) (KIPARSKY, 1972, p.195) 17(...) functional factors are to work. (KIPARSKY, 1972, p.198) 18(...) substantive aspects of the morphological conditioning are constant from language to language. (KIPARSKY, 1972, p.198) 19(...) 'functional' constraints are only operative when form and function go hand in hand, when structure and meaning are perfectly parallel. (GUY, 1981a, p.345) 20(...) one linguistic (or formal) dimension does correspond directly to a nonlinguistic (or conceptual) dimension (...) (HAIMAN, 1983, p.781) 21(...) the distance between expressions corresponds to the conceptual distance between the ideas they represent. (HAIMAN, 1983, p.782) 22(...) a correspondence between a linguistic dimension (transparency/opacity, full/reduced form) and a conceptual dimension (unfamiliar/familiar, unpredictable/predictable) (...) (HAIMAN, 1983, p.802) 23(...) one could argue that this correspondence is itself iconic at some level. (HAIMAN, 1983, p.802) 24But the form is not an icon of the concept, or even of the familiarity of the concept. Reduction of form is an ECONOMICALLY motivated index of familiarity, not an iconically motivated index. (HAIMAN, 1983, p.802)

528

25(...) bears out the thesis that, the more unpredictable a piece of information is, the more coding it requires. (HAIMAN, 1983, p.802) 26(...) the truth of the generally accepted axiom that what is predictable receives less coding than what is not. (HAIMAN, 1983, p.807) 27Du Bois continua esta discussão na Language v.63, no.4, de dezembro de 1987, em "The discourse basis of ergativity". 28The apparently 'free' variation disappears. Rather, clauses converge on the basic pattern: a verb followed by one (or, less often, no) full noun phrase direct argument. (...) But clauses with two full noun phrase direct arguments are extremely rare. (DU BOIS, 1984, p.348) 29(...) they nevertheless part company in one crucial respect. The single direct argument with intransitives is most commonly the subject, but with transitives it is the object. These arguments together, of course, constitute the class of absolutives in an ergative language like Sacapultec Hence, we observe a natural unity in discourse to the category of absolutive: it is the category in which full noun phrases appear. (DU BOIS, 1984, p.348) 30If we examine all the instances of nominal reference items in the Sacapultec narratives which have the discourse pragmatic status 'new' (as defined by Chafe 1976), we find that they appear very frequently in certain grammatical categories but very rarely in others. In particular, new mentions occur quite freely in the S or O roles (...) but almost never in the A role (...). This preference of new mentions for the S and O roles. (...) is the basis for the preference, described earlier, of full noun phrases for the S and O roles. A new mention of a referent, of course, typically requires the explicit coding information that a full noun phrase can provide, so that most new mentions will be realized as full noun phrases (though the reverse implication need not hold). Conversely, the fact that new information is virtually never introduced in the A role accounts in large part of the relative scarcity of full noun phrases in this position. (DU BOIS, 1984, p.349-50) 31We may thus hypothesize that the grammaticization of morphological ergativity in Sacapultec is ultimately a crystallization of certain patterns in discourse. (DU BOIS, 1984, p.353) 32(...) the preliminaries to a theory of competing motivations. (DU BOIS, 1984, p.353-9) 33Ver texto original no final da nota 11. 34Ver texto original na nota 10. 35Variável neste trabalho tem o mesmo significado de grupo de fatores.

529

36Trata-se de uma conferência intitulada "A Sociolingüística moderna", que foi proferida no I Encontro Nacional de Lingüística realizado na PUC-RJ, embora não se encontre publicado nos Anais deste encontro. 37 A versão 2S do programa VARBRUL não se encontra documentada. A descrição do seu funcionamento, aqui apresentada, é fruto da experiência, através de seu uso intensivo e das discussões travadas com o nosso orientador Anthony J. Naro. 38 Sobre o teste de qui-quadrado, cf., BLALOCK JR., 1960, p.275-87 e HOEL, 1968, p.197-211. 11.2

-

Notas do capítulo 6

39 Embora animacidade não seja um termo usual em Português, não encontramos outro mais adequado para fazer referência a esta variável. 40 Todavia, é importante relembrar que Braga não codificou formas do tipo mese como plurais. 41(...) are certainly consistent with the salience hypothesis, but do not constitute conclusive proof of its effect. (GUY, 1981a, p.189) 42(...) S-Deletion is rare in stressed syllables but occurs in a majority of unstressed syllables. The same effect is observed, although reduced in magnitude, in the data on plural marking,(...) (GUY, 1981a, p.163) 43 Itens do tipo próprio, negócio etc. foram classificados como paroxítonos, por ser esta a sua produção mais natural na fala semi-espontânea. Conseqüentemente, próprio foi também classificado como dissílabo. 44 O número total de dados da variável Número de sílabas nesta tabela (a 6.2.1.3, p.81) é diferente do total das tabelas anteriores, porque eles foram obtidos através de uma fase não final. Na etapa final, esta variável já havia sido também eliminada pela própria pesquisadora, como base nos resultados estatísticos. 45 Sobre a influência da variável Relação ver item 6.2.3.7, p.198-241, neste trabalho. Esta variável dá conta da classe gramatical e da posição dos elementos no SN. 46 Scherre (1978) trabalhou com dados de seis dos 20 falantes que foram pesquisados por Naro e Lemle, cujos resultados encontram-se em Competências básicas do português. Guy (1981a) analisou os dados de todos os 20 falantes.

530

47(...) the factor values would easily be swayed by random fluctuation in the data and by differing coding systems used in the analysis of other constraints. (GUY, 1981a, p.187) 48(...) means that there is a very strong colinearity between the factor value for regular plurals and the input probability (...) In such a situation, small changes in the data, even in other factor groups, can produce disproportionately large shifts in the position relative of these two values, and therefore in the other values in this factor group. (GUY, 1981a, p.188) 49In any case, our own results are to be preferred, since we have more data (almost 30 than even Scherre) - the sovereign remedy for unstable statistics. (GUY, 1981a, p.188) 50 Nesta tabela, nos dados dos nomes em -S, não se encontram os tipos vez/vezes, os quais foram analisados separadamente. 51 Dos quatro falantes escolarizados da amostra de Scherre (1978), três eram universitários e um cursava o fim do terceiro ano do segundo grau. 52(...) more information risks being lost in this context. (POPLACK, 1981, p.164) 53An identical effect was found in several studies of Brazilian Portuguese (Lemle and Naro 1977, Guy and Braga 1976, Votre 1978), and which Naro has described in terms of phonic salience. (POPLACK, 1981, p.65) 54(...) this inhibitory effect occurs only where morpheme structure and function coincide. (GUY, 1981a, p.165) 55(...) the weak categories are those which register information that is relatively redundant. (KIPARSKY, 1972, p.206) 56 Esta é uma idéia de Naro que se aplica a formas verbais como veio/vieram/vinheram, onde veio é preferido apesar da saliência. 57To test for statistical significance along these lines, we need only find the difference of the logs of the likelihoods for the two analyses, since twice this difference should approximate a chi-square distribution if no significant effect results from the additional factors of the more complex model. The number of degrees of freedom involved in the distribution is the number of factors eliminated from groups-or, if an entire group is eliminated, one less than the number of factors in the group. (NARO, 1981a, p.73) 58 Chegamos a fazer uma análise da posição não linear e constatamos que é a posição linear o que mais importa. Os resultados desta discussão encontram-se num relatório de pesquisa enviado ao FINEP, em 1985 (cf.

531

p.71-7), e não serão retomados aqui por não serem pertinentes para as reflexões que fazemos nesta parte. 59 A forma de codificar a distância em Carvalho Nina é todavia um pouco diferente. Isto novamente impõe ressalvas na comparação com os seus resultados. 60 É bom observar que isto ocorre do ponto de vista do falante. Do lado do ouvinte, elas podem ser necessárias para a análise da cadeia falada. 61 As probabilidades apresentadas pelos estudiosos que trabalham com a regra de cancelamento, e não de inserção, como Poplack, por exemplo, encontram-se invertidas para facilitar a comparação entre os resultados. Aqui, esta inversão foi feita pelo próprio Guy. Sempre que necessário, adotaremos este procedimento. 62 It is clear that the effects are virtually identical, except for first position. The small discrepancy there is no doubt due to the frequent occurrence of the determiner lo (from los) in Poplack's data. (GUY, 1981b, p.90) 63 É importante observar que terceira posição se refere, em verdade, aos elementos que ocupam a terceira, quarta, quinta e sexta posições. O número de dados destas três últimas posições é pequeno e na relação entre Classe e Posição, por exemplo, tornam-se menores ainda. Por isto, na relação entre Posição e qualquer outra variável, vamos trabalhar com as quatro posições acima amalgamadas em uma só, sob o rótulo de terceira. Além disso, relembramos que a simbologia xxx deve ser lida como: não ocorre este tipo de dado. 64 Em 1981a, Guy considera também a variável Marcas precedentes sem correlação com a posição, e não considera a variável Classe gramatical (cf. GUY, 1981, p.157-93). 65 Apresentamos, a seguir, a tabela 6.2.3.3a com a distribuição dos dados das crianças, para eventuais conferências.

532

TABELA 6.2.3.3a DISTRIBUIÇÃO DOS DADOS DAS CRIANÇAS EM FUNÇÃO DA CLASSE GRAMATICAL E DA POSIÇÃO DOS ELEMENTOS NO SN CLASSE

Substantivo Categoria Substantivada Pronome pessoal de 3a. pessoa Adjetivo

POSIÇÃO Primeira

Segunda

Terceira

16= 89% 18

424= 40% 1057

46= 53% 86

486= 42% 1161

13= 65% 20 3= 60% 5

2=100% 2 xxx

15= 68% 22 3= 60% 5

18=100% 18

16= 40% 40

38= 61% 62

xxx xxx

4=100% 4

Total

Quantificador

23=100% 23

xxx

1= 20% 5

24= 83% 28

Possessivo

42= 98% 43

24= 96% 25

2= 50% 4

68= 94% 72

Adjetivo 2

xxx

1=100% 1

0= 0% 1

1= 80% 2

Indefinido

80=100% 80

6= 68% 9

xxx

86= 97% 89

xxx

686= 98% 702

67= 50% 138

1407= 66% 2143

Artigo e demonstrativo

672= 98% 688

14=100% 14

Total

837= 98% 856

503= 44% 1149

66(...) An immediately preceding marker leads more (when S, 0S e SS) precede the token in question, deletion is disfavored (...), zeros leads to zeros, an effect which is clearly structural (...), and counter-functional, in that rather than favoring marking patterns with one inflectional marker of plurality, it favors marking either everywhere(functionally redundant) or nowhere (loss of function). (POPLACK, 1981, p.61; cf., também, 1980a, p.62-7; 1980b, p.61-2.)

533

67(...) was found by Guy and Braga for Brazilian Portuguese, a language that marks plurality on the NP and the VP in much the same way as Spanish.(POPLACK, 1980a, p.64) 68 Nem sempre o numeral foi codificado isoladamente. A maioria dos estudiosos codificou "segmento precedente não flexionável", incluindo o numeral. Todavia, ele constitui a maioria absoluta dos casos. 69 Sabemos, hoje, que esta hipótese não é razoável, pois o /S/ no numeral é muito pouco colocado por qualquer tipo de falante. 70The most obvious plural context in a person's speech would surely be in an NP containing a number which specified some plural quantity. So in the interview situation, the popular dialect speaker who was attempting to accommodate his speech to the standard dialect of the interviewer could plausibly be expected to "correct" more in this most obvious plural environment. (Guy, 1981a, p.180) 71(...) it should not be able to skip over words, producing marked-unmarkedmarked sequences. (Guy, 1981a, p.169) 72 Há apenas dois casos deste tipo porque a ocorrência de estruturas com teus é de baixa freqüência. 73The most favorable context for marker deletion is precisely when the two preceding markers have already been deleted. (POPLACK, 1980a, p.62-3) 74 Os testes de percepção feitos por Poplack são relatados na versão mimeografada do texto de 1980a, datada de 1977. 75 A análise de Guy (1981a) é baseada na de Braga (1977) e na de Scherre (1978), sobre as quais já falamos. Como os dados de Scherre encontram-se inseridos nos de Guy e como sua análise é um pouco mais simplificada, preferimos adotar o seu sistema de codificação e comparar os resultados aqui obtidos com os seus. 76Since there are so few data involved here, this should not introduce any significant distortion. (GUY, 1981a, p.177) 77 Embora na tabela 6.2.3.24 haja apenas 60 dados para os adultos e 13 para as crianças, o número total com fatores que implicam presença de marca categórica é, respectivamente, 135 e 25. Confira este total nas tabelas 6.2.3.14 e 6.2.3.19, p.181 e 194. 78 O número de nove variáveis para os adultos e oito para as crianças ocorre devido ao fato de que esta etapa contém Processos e Tonicidade como duas variáveis separadas (análise 1 da saliência). Fizemos também outra etapa, considerando a transformação de Processos e Tonicidade como uma só variável, denominada Saliência (análise 3 da saliência),

534

conforme visto no item 6.2.2.9. Os valores probabilísticos da variável Relação em quaisquer destas etapas não apresentam alterações relevantes, pois, quando elas ocorrem, são da ordem de centésimos. 79 Ver texto original na nota 21. 80 Os dados da tabela 6.2.3.27 são um pouco diferentes dos dados da tabela 6.2.3.5 (ver página 157), porque, nesta etapa, eliminamos casos do tipo coisas assim bonitas. 81(...) there seems to be a general tendency for particular grammatical forms to cluster together. (...) result from a more mechanical constraint on continuing with one form unless there is a reason to change (...). (SCHIFFRIN, 1981, p.55-6) 82Though the functional factors have a lesser effect than the others, the ranking of factors within the functional groups is clear. Additional plural information favors marker deletion. Whereas when the only possibility for plural marking is inflectional, within the NP itself, a marker tends to be retained. This is a tendency, but it is a rather weak one. (POPLACK, 1980a, p.62-3) 83(...) that speakers (...) consistently avoided suppressing all morphological trace of the plural (...) (POPLACK, 1980a, p.63) 84(...) almost 1000 examples of NP strings containing two to three elements, with no morphological marker at all. Moreover, the deletion rate (...) is even higher when it is preceded by two zeros (94) than when it is preceded by one (82). (POPLACK, 1980a, p.63) 85 Nesta parte, invertemos os resultados de Braga 1977. 86 As probabilidades duplas se referem a falantes escolarizados e semiescolarizados, respectivamente. 87(...) pause cannot a priori be predicted to have any general effect on deletion rules. Rather, its effect appears to be arbitrarily defined for different dialects: sometimes it is treated as non-syllabic, sometimes as nonconsonantal, and sometimes as simply unmarked. (GUY, 1981a, p.145) 88(...) deletion was found to occur more in prevocalic than in preconsonantal position. (POPLACK, 1980a, p.62) 89 Invertemos também os resultados de Poplack (1981). Além disso, não apresentamos os de Braga (1977), por não serem eles diretamente comparáveis aos nossos. 90 Separamos, para os adultos, os SNs de função predicativa (161/223=72) dos SNs de função dúbia: (539/788=68), mas por termos

535

excedido o número de células na rodada, tivemos de fazer amalgama-ções e optamos por amalgamar estes casos. 91 Esta variável foi selecionada em 7º lugar num conjunto de nove variáveis para os falantes adultos. No caso das crianças, ela não chegou a ser processada pelo programa que faz a seleção das variáveis. 92(...) functional factors have a small but regular effect on deletion, in a direction confirming a functional hypothesis. (...) However, functional factors overall affect deletion less than any other factor group studied, except following stress. (POPLACK, 1980a, p.62) 93(...) the functional factor (...) has a regular effect on marker deletion (...) However, this is not an overriding tendency (...) They do not affect marker retention much more than phonological and grammatical factors do. (POPLACK, 1981, p.61) 94(...) actually does carry all the plural information that it must be conserved. Thus functional considerations have not resulted in strictly grammatical (...) conditioning determining the retention of (s). Here we have a case where structural effects and informational effects play competing roles, and where constraints of a purely phonological nature are equally important. (POPLACK, 1981, p.61-2) 95 O item outro neste caso tem emprego substantivado como em "acontece cum os otro." 96 Observamos que os pronomes pessoais também encontram-se incluídos nesta etapa da análise. Todavia, eles perfazem apenas 45 casos nos dados dos adultos e cinco nos dados das crianças. Observamos também que, embora as variáveis Saliência fônica, Posição, Contexto fonético/fonológico seguinte e Função resumitiva tenham sido também consideradas nesta etapa, elas não serão novamente apresentadas, porque todos seus resultados apresentam a mesma hierarquia dos anteriores e a maioria deles permanecem praticamente inalterados. 97 Relembramos que a variável Função resumitiva foi também codificada nesta etapa do trabalho. Embora haja uma certa sobreposição entre os dados dos fatores [+resumitivo] e [+informal], em estruturas contendo o item coisa, a Função resumitiva, junto a todas as variáveis, inclusive as sociais, foi selecionada, nos dados dos adultos. Todavia, a sua seleção ocorreu em último plano, e as probabilidades associadas aos fatores [+resumitivo] e [resumitivo] reduziram-se um pouco. De 0,38 e 0,62 (ver Tabela 6.2.5.3), respectivamente, passaram a 0,43 e 0,57. Durante o reprocessamento dos dados das crianças, perdemos a simbologia associada a esta variável. Mas, com base nos resultados das crianças para os dois fatores desta variável (0,41 X 0,53), cremos poder projetar também a sua seleção.

536

98The reason for including such a factor group is to investigate the issue of functionalism: is a speaker constrained in some way to avoid deletion or omission of elements bearing a high functional load? Poplack 1979 investigates this question in some detail, and concludes that functional factors do significantly constraint deletion of plural -S: when there is additional plural information present in the discourse, a given plural marker is more likely to be omitted than when there is no such additional information. Poplack investigated two types of plural information: morphological and nonmorphological. No significant differences between the two were reported, and the position of the additional information was also apparently unimportant. (GUY, 1981a, p.190) 99(...) for example, the presence and position of a plural-marked verb of which the NP under consideration was the subject, the occurrence of the NP as the complement of a copular sentence with plural subject and/or verb, and the occurrence of lexical or semantic information which might indicate the plurality of a word under consideration.(GUY, 1981a, p.190-1) 100This tendency goes against the functional hypothesis, because it favors plural marking in precisely those contexts where there is other plural information available. (...) This is analogous to the tendency towards stringlevel concord, which Poplack reports for PRS. It could result from a kind of stylistic effect: when a speaker endeavors to mark more plurals, he or she will do so in both the NP and the VP simultaneously. (GUY, 1981a, p.191-2) 101The difference between the last two factors (no plural information and following plural information) is not significant. The difference between the last two factors and the first factor is statistically significant, but it has the grave defect or segregating out only 1 1/2 of the data and opposing it to all the rest. However, the results are in agreement with the previously noted tendency in this dialect to mark plurality at the first opportunity, and the omit it at subsequent 'redundant' sites. This at least follows the functionalist line: there is a lower rate for plural marking in a context where the marker will bear a lighter functional load. (GUY, 1981a, p.192-3) 102 A comparação de nossos resultados com os de Guy (1981a) é indireta, porque esta parte de nossa análise é não atomística enquanto a análise de Guy é toda atomística. 103 (...) functional factors have a small but regular effect on deletion, in a direction confirming a functional hypothesis. Presence of additional plural information, whether morphological or nonmorphological, favors deletion somewhat, whereas absence of additional information favors retention. However, functional factors overall affect deletion less than any other factor group studied, except following stress. (...) The purpose of the functional groups is to ascertain the effect of functional factors on the elimination of redundancy. Though the functional factors have a lesser effect than the others, the ranking of factors within

537

the functional groups is clear (...) this is a tendency, but is a rather weak one. (POPLACK, 1980a, p.62) 104Functional considerations play a regular, though not overwhelming, role in the retention of a plural marker, (...) Functional factors show no greater effect on deletion of (s) from the NP than other factor categories studied. (POPLACK, 1980b, p.379 e 383) 105Although functional factors are significant to deletion, in contrast with aspiration, of plural (s), they do not affect marker retention much more than phonological and grammatical factors do. (...) It should be remembered that the functional hypothesis as stated (...) is really that surface marking patterns, which can carry information will tend to be conserved in the grammar. The weaker functional effect found here against (s) deletion is not of this type. It is only in sentences where the (s) actually does carry all the plural information that it must be conserved. Thus functional considerations have not resulted in strictly grammatical (...) conditioning determining the retention of (s). Here we have a case where structural effects and informational effects play competing rules, and where constraints of a purely phonological nature are equally important. (POPLACK, 1981, p.61-2) 106(...) the S-Deletion rule is actually inhibited by the presence of a morpheme boundary before the final S. (GUY, 1981a, p.164-5) 107(...) it could also be considered a functional constraint favoring retention of grammatical information. (GUY, 1981a, p.165) 108 Este estudo não foi ainda feito por nós por limitação exclusiva de tempo, uma vez que envolverá a análise de aproximadamente 6000 SNs de dois elementos que se encontram no nosso corpus. Ele será feito brevemente. 109 Nesta etapa, não codificamos a tonicidade dos regulares. Mas, se codificada, ela mostrará, indubitavelmente, resultados positivos. 110(...) is definable in terms of the notion cohesion, which is itself a relative rather than absolute concept. Structural distance refers to the degree to which two elements are integrated in terms of some grammatico-semantic relation within a higher-level structure. (CORNISH, 1986, p.187) 111The lowest degree of structural distance existing between two elements is represented by the mutual dependence of word-internal morphemes, between which it is impossible to insert any element (...) This status is marked by the lack of formal concord (...) (CORNISH, 1986, p.187) 112(...) can only precede their head noun, their mutual ordering being strictly constrained (...) (CORNISH, 1986, p.187)

538

113(...) of concord relations between elements. The concord obtaining between elements manifesting this degree of structural distance is always (as expected) formal (i.e. purely grammatical) rather than referential-semantic in character. (CORNISH, 1986, p.187) 114The third degree of structural distance is that represented by the relations obtaining between phrases within a clause. The grammatical relations obtaining between subjects and predicates (...) are reflected in their greater propensity for concord in terms of their controller's relevant referentialsemantic features. (CORNISH, 1986, p.187) 115 Ver texto original na nota 107. 11.3 - Notas do capítulo 7 116A system-external functional force, once appealed to, cannot simply be turned off at will. Volumes of so-called functionalism are filled with ingenious appeals to perception, cognition or other system-external functional domains, which are used to "explain" why the language in question simply has to have the grammatical particularity that it does - when a moment's further reflection would show that another wellknown language, or even just the next dialect down the road, has a grammatical structure diametrically opposed in the relevant parameter. (DU BOIS, 1984, p.353) 117 Relembramos que a primeira versão deste artigo é mimeografada e data de 1977. 118Concord is redundancy, and contrary to what could be expected, redundancy results, as a rule, from least effort: people do not mind repeating if mental effort is thereby reduced (...) (MARTINET, 1962, p.55) 119 Não temos indicações bibliográficas precisas desse texto. Usamos uma versão mimeografada. Neste texto, Labov já cita as conclusões de Poplack publicadas em 1980a. Como já sabemos, há uma versão de Poplack mimeografada, de 1977, que é basicamente idêntica à publicada em 1980a. 120Such parallelism of surface seems to be a powerful factor in determining the choice of active or passive, and passive are favored when the logical object moves into a position parallel with its co-referents. The over-all distribution of this constraints proves to be somewhat larger than the given vs. new effect. When coreferential noun phrases were located in subject position in preceding clauses, the logical object of the agenteless clause appeared in parallel subject position 58 of the time, that is, the passive alternant was chosen, when this was not the case, the passive choice was realized only 29 of the time. (WEINER & LABOV, 1977, p.32)

539

121(...) our earlier decision to treat the choice of active and passive as two alternative ways of saying "the same thing", since it is conditioned by formal, syntactic factors far more than the influence of given vs. new. One might argue that parallel strings are also characteristic of semantically significant choices: there is a cognitively determined tendency to keep talking about the same thing. (WEINER & LABOV, 1977, p.38-9) 122The distribution of information in discourse is not without influence, but it is a relatively minor factor compared to more mechanical tendency to preserve parallel structure: first in the succession of passive constructions, second in the retention of the same structural position for the same referent in successive sentences. There is undoubtedly a stylistic factor operating. (WEINER & LABOV, 1977, p.43) 123(...) there is a tendency of verbs in the same tense to cluster together. Both HP and P verbs are more frequent when the prior verb is in the same tense; in non-initial complicating action clauses, 62 of the 368 HP verbs occur after an HP verb in the prior clause, and 82 of the 847 P verbs follow a P verb in the prior clause. Thus sequence with rapid alternation between the HP and the P verb are not typical.(SCHIFFRIN, 1981, p.51) 124The tendency for verbs in one tense of a cluster together is given a functional, discourse-level explanation: maintenance of one tense groups events into one scene or episode while switching separates events from one another. (SCHIFFRIN, 1981, p.52) 125(...) supports Wolfson's hypothesis that tense switching separate events. However, this does not mean that maintaining one tense has the opposite function - that of uniting acts into one event. Rather, there seems to be a general tendency for particular grammatical forms to cluster together. Thus Weiner & Labov 1977 find that the probability of using a passive increases if a passive has already occurred in the preceding discourse. And Sankoff & Laberge 1978 report for French that, when on and tu/vous occur in a sequence of conjoined or juxtaposed sentences, their switch rate is lower than their over-all proportions. Such sequence constraints suggest that what influences the first occurrence of a form need not to be the same as what influence subsequent occurrences. It is perfectly possible that tense-switching functions in discourse to separate events, but that staying in one tense does not have a comparable discourse function. Rather, the latter may result from a more mechanical constraint on continuing with one form unless there is reason to change (...) (SCHIFFRIN, 1981, p.55-6) 126(...) states that the weaker the syntagmatic relationship between the two tokens, the greater the chance of a switch of variant when the second token is uttered. (SANKOFF & LABERGE, 1978, p.121)

540

127(...) when a single referent is the subject of two (or more) sentences, one of which is embedded in the other. (SANKOFF & LABERGE, 1978, p.120) 128(...) when a single referent is the subset in a sequence of two or more independent sentences which are conjoined or simply juxtaposed. (SANKOFF & LABERGE, 1978, p.120) 129Is sequence constraint a form of text coherence, albeit quantitative, operating on coreferential variables in adjacent syntactic units, or does it simply reflect stylistic homogeneity within relatively short passages of conversation? (SANKOFF & LABERGE, 1978, p.122) 130The first option is at least partly valid (...) the switching rates for unconstrained pairs are not clearly different from the over-all proportion of the variants, indicating little or no effect of stylistic homogenei-ty.(SANKOFF & LABERGE, 1978, p.126) 131(...) The fact that there is a high probability of plural inflection for nouns that are not preceded by a quantifier is in agreement with the functionalism hypothesis. (LEFEBVRE, 1981, p.80) 132If we look at the contribution of the type of plural information contained in the subject NP we find the following results. In cases where the subject pronouns do not appear in surface structure, probability of plural inflection of verbs is very high. This fact fits the functionalism hypothesis (...); conversely in the case of a quantified noun or conjoined subject probability of inflection for plural of verbs is low (...). The remaining factors, however, do not confirm the funcionalist hypothesis as well. This involves both cases for which there is no plural information in the subject NP (...) and cases from which there is plural information in the subject NP (...). The functionalist hypothesis would predict that the former category would favor inflection of verbs for plural in order to preserve plural information at the sentence level, while the latter category would permit less inflection on the verb since plurality is already marked on the subject. The results show the reverse tendency. I suggest the following explanation for these facts: there seems to be a surface concord phenomenon, which accounts for inflection of plural of verbs when the subject NP is inflected for plural and absence of inflection when the subject NP is not inflected. (LEFEBVRE, 1981, p.81-2) 133(...) tend to support the idea that "where you have overt agreement, you can drop the subject " (...). Furthermore, one can now add that the more overt the agreement is, the more subjects can be dropped. (NARO, 1981b, p.356) 134(...) is not 'try to preserve marking' but 'try to eliminate redundancy'. (NARO, 1981, p.354)

541

135If the only relevant consideration were preservation of explicit marking of categories such as plural, the subject would appear more frequently than with agreeing verbs because such categories are not marked in the desinence of the nonagreeing form. Furthermore, we would expect more explicit subjects with strongly nonagreeing verbs than with their weak counterparts. However, none of these expectations are confirmed (...) (NARO, 1981, p.354) 136It is important to bear in mind, however, that in the real world there are many nonagreeing verbs. The fact that these too allow empty subjects, and in the same or greater proportions than agreeing verbs, shows that the overt agreement hypothesis, even in its relativized version, is not correct. The general underlying principle behind the behavior of both types of construction is reduction in amount of surface marking. For agreeing verbs, this reduces subject/verb redundancy and for nonagreeing verbs it reduces subject/verb conflict. Notice especially that in this latter case, marking is reduced even at the cost of loss of all surface marking of semantic categories. (NARO, 1981, p.356) 137(...) a new subject referent and a referent which was mentioned three or more clauses before would favor pronominal subjects. (LIRA, 1982, p.148) 138(...) the reverse happens. If the subject is present one clause before, the pronoun has the highest probability of being realized. (LIRA, 1982, p.149) 139The fact that the pronominal subject occurs more often when the referent was mentioned one clause before might be explained by some kind of parallelism or agreement on the surface. (LIRA, 1982, p.150) 140(...) This indicate that the two rules tend to vary in tandem also appeared in our examination of the NPA rule in Chapter Five. This might be a reflection of degree of self-monitoring; a "stylistic" effect more subtle than we are able to discriminate with our relatively crude, topic based measure of speech style. (GUY, 1981, p.252) 141(...) So what we have, then, is a relatively strong covariance between NPA and SVA, which can be summarized by saying that when the former has failed to apply, the latter is also likely to fail to apply. These data of course encompass only those sentences with a surface subject (...). (GUY, 1981, p.254) 142 Este trabalho foi realizado sob a nossa orientação, no ano de 1987, quando Lage foi nossa auxiliar de pesquisa com bolsa concedida pela UFRJ. 143 It has since become accepted practice to treat successive occurrences of a variable, even in the same utterance, as independent binomial trials. Those who use such a model realize, of course, that

542

various types of co-occurrence relationships may hold between neighboring tokens of a variable (...). We generally proceed under this assumption (independence), however, not only because it simplifies the analysis, but also because in terms of their relative infrequency in the data, co-occurrence relationships should not seriously affect the results of statistical procedures for estimating the effects of other linguistic and sociolinguistic constraints. (SANKOFF & LABERGE, 1978, p.119) 144 Ver texto original na nota 118. 145The formal opposition TRANSPARENT VS. OPAQUE will thus correspond to the pragmatic opposition UNUSUAL VS. FAMILIAR. The motivation for reduction, and hence for opacity, is presumably economic: (...) 'principle of least effort'. (HAIMAN, 1983, p.802) 146The general underlying principle behind the behavior of both types of construction is reduction in amount of surface marking. For agreeing verbs, this reduces subject/verb redundancy and for nonagreeing verbs it reduces subject/verb conflict. Notice especially that in this latter case, marking is reduced even at the cost of loss of all surface marking of semantic categories. (NARO, 1981, p.356) 147(...) redundancy, not merely status as a morpheme, is the relevant factor in the deletion. (...) Thus we may tentatively formulate a universal: "Deletion of a morpheme segment is more likely than deletion of the corresponding non-morphemic segment if the morpheme is redundant (...) (NARO, 1980, p.166) 148However, we have also seen that, overall, functional factors affect marker deletion less than any other factor group studied, with the exception of following stress, a result that is not readily interpretable. Whether this is the case because (s) deletion in Puerto Rican Spanish has not yet advanced far enough to call functional factors into play remains to be investigated. The results of this study, moreover, indicate that the problems raised by these competing constraints on (s) deletion cannot be resolved conclusively by examining the noun phrase alone. Answers to these questions may also reside in another area of linguistic structure, such as the verb phrase. A functional study of variability in verbal marking should allow us to draw clearer conclusions about deletion and disambiguation in Puerto Rican Spanish. (POPLACK, 1980a, p.66-7) 149 Embora o índice de concordância da fala dos analfabetos e, principalmente, de área rural seja bem baixo, é importante verificar de forma sistemática a influência das variáveis Marcas precedentes, Posição e Classe gramatical, bem como a da Configuração sintagmática, da forma analisada neste trabalho. Carvalho Nina, por exemplo, ao trabalhar com os dados de falantes analfabetos de área rural do Pará, conclui que os determinantes da segunda posição antepostos ao núcleo ainda apresentam marcas: "os meus irmão", embora os da terceira posição antepostos ao núcleo se

543

apresentem totalmente sem marcas, à semelhança dos determinantes pospostos (cf. 1980, p.109-11). Além disso, Ponte, ao analisar os dados de falantes semi-analfabetos de Porto Alegre, faz uma série de considerações gerais sobre a estrutura sintagmática dos SNs coletados, apresentando exemplos totalmente marcados do tipo "os primeiros três anos", "todos os netos" e, até, "todos os princípios muito bons", fora uma série de outros exemplos, com apenas uma marca, do tipo "muitos home sério" e "duas sobrinha nossa" (cf. 1979, p.100-6), o que está perfeitamente de acordo com os resultados obtidos na análise de nossos dados. Seria interessante que os dados destas duas pesquisadoras pudessem ser reanalisados de forma a serem comparáveis aos nossos. Isto nos permitiria verificar a generalidade do Princípio da Iconicidade e do Princípio do Processamento com Paralelismo nos dados dos falantes analfabetos e semi-analfabetos do Norte e do Sul do país. 11.4 - Notas do capítulo 8 150Any statement about change is of course an inference, since change could hardly be observed directly (...) (LABOV, 1981, p.177) 151(...) for communities where women favor the prestige form of stable markers, a variable that shows women in the lead may very well be a new change in progress (...) (LABOV, 1981, p.185) 152(...) only appears when certain combinations of the four basic factors, age, economic activity, sex and schooling are taken into consideration. (KEMP, 1981, p.4) 153(...) older women are more sensitive to standard variants than men of the same age group. Older women appear to use more standard variants in normal conversation, but in addition, given the relative inconsistency from one variable to another, it is most likely that they make greater use of style shifting. (KEMP, 1981, p.4-5) 154A good many of the changes discussed under that heading are probably not in progress at all, but variation that may have been stable for centuries. (LABOV, 1981, p.177) 155(...) we will often be in the position of trying to make the best guesses we can about change in progress from synchronic data. (LABOV, 1981, p.183) 156(...) degree of penetration into the culture of the surrounding higher socioeconomic levels, as reflected in his or her habits of television viewing. (NARO, 1981a, p.86) 157On the one hand, we see in the variable the continuation of a slow process of rule death, related to similar changes in the NP and elsewhere.

544

This variable is, so to speak, exterior to the speaker, impinging upon him or her without any internal motivation. The orientation variable, on the other hand, reflects a resurgence in the use of this same rule that comes from within the speaker, depending upon his or her own cultural orientation. (NARO, 1981b, p.87) 158If the vicarious orientation continues to spread among younger speakers, given the relatively small age-differential, the situation could soon reach a point where that group might produce a higher rate for agreement than the older speakers. Since there are no social barriers between the two orientation subgroups, at a certain point in time the resurgence in use of the agreement rule might even spread throughout the younger group, independently of the orientation variable, and produce a reversal in the trend toward the elimination of the rule. Future studies will determine if there is any validity to this speculation. (NARO, 1981b, p.88) 159(...) syntactic change starts at a point where surface differentiation between the old and new systems is zero (or nearly so); later it spreads throughout the language in inverse proportion to the degree of saliency of the surface differences between these systems in each particular environment. (NARO, 1981b, p.63; cf. também, p.96-7) 160(...) can be partially blocked for a certain period of time. It is only in the long run, not in its initiation or progress, that linguistic change produces relatively uniform and 'natural' results. (NARO, 1981b, p.97) 161Já discutimos amplamente este aspecto no item 6.1.2 deste mesmo trabalho. 162(...)although we have no firm evidence, we suppose that syntactic change actuated by learned reaction or hypercorrection would work in the opposite way, turning up in the most salient environments. (NARO & LEMLE , 1976, p.237 e 1977, p.267) 163(...) given only a synchronic cross-section of a variable phenomenon obeying a saliency constraint there is no way of determining whether change is currently in progress or has been interrupted for some reason before reaching full generalization, just as it is in principle impossible to state what the direction of change is (or was). Matters are further complicated by consideration of the locus of change - in the community as a whole, in subcommunities, or in individual. (NARO, 1986, p.1) 164(...) there was a convergence of motives for the actuation of loss of SVA and NPA in Brazil: 1) natural internal development of the language (Naro 1981); 2) pidginization behavior on the part of Europeans (as shown in Naro 1978, but for an earlier period and under different social conditions); 3) imperfect learning by speakers of vastly diverse linguistic backgrounds. (NARO, 1986, p.10)

545

165 É possível ainda se interpretar que a metodologia estatística usada não é adequada para este tipo de situação (cf. KAY, 1978). 166 Os resultados das crianças referentes á Saliência fônica não foram apresentados por ser impossível separá-las em termos de graus de escolarização ou de tipo de ambiente de origem, dada à escassez dos dados. No grupo como um todo, elas apresentam basicamente a oposição regular x não regular. 167 Ver texto original na nota 159. 168The group norms are not just artifacts of the macrocosmic viewpoint, representing mere averages of a collection of widely scattered individual norms. Rather, they recapitulate the generally uniform norms of individuals. (GUY, 1980, p.12) 11.5 - Notas do capítulo 9 169 Esta classificação está sendo feita no presente momento pela equipe do Projeto Censo, a qual está aprimorando o trabalho que envolve todas as variáveis sociais não convencionais. 170 Renda e Ambição foram duas outras variáveis estudadas pelo Projeto Censo que não se mostraram relevantes para o fenômeno da concordância nominal. Observamos ainda que os resultados relativos às variáveis não convencionais ora apresentados diferem um pouco dos que são encontrados no Relatório final de pesquisa deste projeto, porque os desta etapa envolvem todos os dados e todas as variáveis lingüísticas pertinentes. 171 Infelizmente não temos referência desta matéria.

12 - REFERÊNCIAS BIBLIOGRÁFICAS ALI, M. Said. Gramática histórica da língua portuguesa. 7. ed. Rio de Janeiro, Acadêmica, 1971. 375p. AMARAL, Amadeu. O dialeto caipira. São Paulo, O Livro, 1920. BECHARA, Evanildo. Moderna gramática portuguesa. 27. ed. São Paulo, Nacional, 1982. 374p. BIDERMAN, Maria Tereza Camargo. Lingüística matemática e computacional. Estudos Lingüísticos, São Paulo, Centro de Lingüística Aplicada do Instituto de Idiomas Yásigi, 1968. v.III .1-2, p.11-7. BLALOCK Jr., Humbert M. Social statistics. 2. ed. Washington, MacGrawHill, 1972. 583p. BRAGA, Maria Luiza. A Concordância de número no sintagma nominal no triângulo mineiro. Dissertação de Mestrado, PUC, Rio de Janeiro, 1977. 88p. mimeo BRAGA, Maria Luiza. Left-dislocation and topicalization in capederdean creole. Ph.D. Dissertation, University of Pennsylvania, 1982. 172p. mimeo _____. Construções de tópico de discurso. In: NARO, Anthony J. Et alii. (coord.). Relatório final de pesquisa: Projeto subsídios do Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986. v.III. p.393- 453. mimeo BRAGA, Maria Luiza. & SILVA, Giselle Machline de oliveira e. Novas considerações a respeito de um velho tópico: a taxonomia novo/velho. Lingüística: questões e controvérsias. Uberaba, Faculdades Integradas de Uberaba, 1984. Série Estudos-10, p.27-40. BRAGA, Maria Luiza. & SCHERRE, Maria Marta Pereira. A concordância de número no SN na área urbana do Rio de Janeiro. In: ENCONTRO NACIONAL DE LINGÜÍSTICA, 1o, 1976. Anais ... Rio de Janeiro, PUC, 1976. p.464-77. CALLOU, Dinah Maria Isensee. Variação e distribuição da vibrante na fala urbana culta do Rio de Janeiro. Tese de Doutorado, UFRJ, Rio de Janeiro, 1979. 199p. mimeo CÂMARA Jr., J. Mattoso. Estrutura da língua portuguesa. 5. ed. Petrópolis, Vozes, 1975. _____. Introdução às línguas indígenas brasileiras. Rio de Janeiro, Ao Livro Técnico S/A, 1977. 230p. _____. História e estrutura da língua portuguesa. 2. ed. Rio de Janeiro, Padrão, 1976. 262p.

547

_____. Dicionário de lingüística. Petrópolis, Vozes, 1977. 266p. CARVALHO NINA, Terezinha de Jesus. Concordância nominal/verbal do analfabeto na micro-região de Bragantina. Dissertação de Mestrado, PUC, Rio Grande do Sul, 1980. 165p. mimeo CEDERGREN, Henrietta J. The interplay of social and linguistic factors in Panama. Cornell University, Ph.D. Dissertation, 1973. CEDERGREN, Henrietta J. E SANKOFF, David. Variable rules: performance as a statistical reflexion of competence. Language, 50(2):333-55, jun. 1974. CHAFE, Wallace L. Giveness, constrastiveness, definiteness, subjects, topics, and point of view. In: LI, Charles (ed.). Subject & topic. New York, Academic Press, New York, 1976. p.27-55. CHAMBERS, J.K. & TRUDGILL, Peter. Dialectology, 1. ed. Cambridge, Cambridge University Press, 1980. 218p. CHOMSKY, Noam. Aspectos da teoria da sintaxe. Coimbra, Arménio Amado, 1965. 372p. CORNISH, Francis. Anaphoric relations in English and French: a discourse perspective. Great Britain, Biddles Ltd, Guildford and Kingis Lynn, 1986. 242p. CUNHA, Celso e CINTRA, L.F. Nova gramática do contemporâneo. Rio de Janeiro, Nova Fronteira, 1985.

português

DU BOIS, John W. Competing motivations. In: HAIMAN, John. Iconicity in syntax. Amsterdam, John Benjtiming, 1984. P.342-65. _____. The discourse basis of ergativity. Language, LSA, 63(4):805-55, dez. 1987 EMMERICH, Charlotte. Um traço propulsor numa língua de contato. In: ENCONTRO NACIONAL DE LINGÜÍSTICA, 2o., Rio de Janeiro, 1977. Anais ... Rio de janeiro, PUC, 1977. p.393-9. _____. A língua de contato no Alto Xingu - origem, forma e função. Tese de Doutorado. UFRJ, Rio de Janeiro, 1984. 278p. mimeo FASOLD. Ralph W. Linguistic Variation and linguistic competence. In: SANKOFF, David. (eds.). Linguistic variation: models and methods. New York, Academic Press, 1978. p.85-95.

548

FERNANDES, Francisco. Dicionário de verbos e regimes. Porto Alegre, Globo, 1979. FICHER, John L. Influências sociais na escolha de variantes. In: FONSECA, Maria Estela V. & NEVES, Moena F. (orgs.). Sociolingüística. Rio de Janeiro, Eldorado, 1974. p.87-98. GIVÓN, T. Topic continuity in discourse: an introduction. In: GIVÓN, T. (ed.). Topic continuity in discourse: a quantitative cross-language study. Amsterdam and Philadelphia: Jonh Benjamins, 1983. p.1-45. GORSKY, Edair Maria. Condições de entrada e continuidade do referente em narrativas orais. Dissertação de Mestrado, UFRJ, Rio de Janeiro, 1985. 140p. mimeo GRYNER, Helena. A variação de concordância com verbos pessoais na cidade de Petrópolis. Dissertação de Mestrado, UFRJ, 1977. 139p. mimeo GRYNER, Helena. & MACEDO, Alzira Tavares de. La prononciation du s post-vocalic: deux processus de changement linguistic en portugais. In: SANKOFF, David & CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canadá, Linguistic Research Inc., 1981. P.135-49. GUY, Gregory R. Use and applications of the Cedergren- Sankoff variable rule programs. In: FASOLD, Ralph W. & SHUY, Roger W. (eds.). Analyzing variation in language. Georgetown, Georgetown University, 1975. P.59-69. _____. Variation in the group and the individual: the case of final stop deletion. In: LABOV, William. (eds). Locating language in time and space. Philadelphia, University of Pennsylvania, 1980. P.1-36. _____. Linguistic variation in Brazilian Portuguese: aspects of the phonology, syntax, and language history. Ph.D. Dissertation, University of Pennsylvania, 1981a. 391p. mimeo _____. Parallel Variability in American dialects of Spanish and Portuguese. In: SANKOFF, David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canada, Linguistic Inc., 1981b. p.85-93. _____. Saliency and the direction of syntactic change. University of Sydney, Cornell University, 1986. 74p. mimeo HAIMAN, John. The iconicity of grammar. Language, LSA 56 (3):515-40, set. 1980. _____. Iconic and economic motivation. Language, LSA, 59(4):781-819, dez. 1983. HOCHBERG, Judith G. Functional compensation for /s/ deletion in Puerto Rican Spanish. Language, LSA 62(3):609-21, set. 1986.

549

HOEL, Paul G. Estatística elementar. 2. ed. Rio de Janeiro, Fundo de Cultura S/A, 1968. 311p. HOPPER, Paul. Aspect and fore grounding in discourse. In: GIVÓN, . ed. Syntax and semantics. New York, Academic Press, v.II, Discourse and Syntax, 1979. P.213-41. HOPPER, Paul & THOMPSON Sandra. Transitivity in grammar and discourse. Language, LSA, 56(3):251-99, set. 1980. JAKOBSON, Roman. Lingüística e Comunicação. São Paulo, Cultrix, 1969. 162p. KAY, Paul. Variable rules, community grammar, and linguistic change. In: SANKOFF, David. (ed.). Linguistic variation: models and methods. New York. Academic Press, 1978. p.71-83. KAY, Paul & Mac DANIEL, Chad K. On the logical of variable rules. Working papers in linguistic. Bloomington, Indiana University Press, 1977. p.1-21. KEMP, William. Major sociolinguistic patterns in Montreal French. In: SANKOFF, David & CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canada, Linguistic Research, Inc., 1981. p.3-16. KIPARSKY, Paul. Explanation in Phonology. In: PETERS, Stanley. (ed.). Goals of linguistic theory. New Jersey: Prentice Hall, 1972. p.189225. LABOV, William. On the use of the present to explain the past. In: HEILMANN, L. (ed.) THE ELEVENTH INTERNATIONAL CONGRESS OF LINGUISTICS. BolognaFlorence, aug. 28 sept, 1972. v.2. P.825-851. _____. Sociolinguistic patterns. 3. ed. Philadelphia, University of Pennsylvania Press, 1975a. 343p. _____. Language in the inner city. 3. ed. Philadelphia, University of Pennsylvania Press, 1975b. 412p. _____. The social origins of sound change in: LABOV, William. (ed.). Locating language in time and space. Philadelphia, University of Pennsylvania, 1980. P.251-64. _____. What can be learned about change in progress from synchronic descriptions? In: SANKOFF, David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canada, Linguistic Research, Inc., 1981. P.177-99.

550

_____. Resolving the neogrammarian controversy. Language, LSA, 57(2):267-308, jun. 1981. LAGE, Aleria Cavalcante. A concordância verbal no português com as expressões de sentido quantitativo acompanhadas de complemento. 1º. Relatório de pesquisa apresentado à sub-reitoria de ensino para graduados e pesquisa. (SR-2). UFRJ, 1987. 34p. mimeo LEFEBVRE, Claire. Variation in plural marking: the case of cuzco quechua. In: SANKOFF, David. & CEDERGREN, Henrietta.(eds.). Variation Omnibus. Canada, Linguistic Research Inc., 1981. p.12533. LEMLE, Miriam. A ordem dos adjetivos no sintagma nominal em Inglês e Português: implicações para a teoria gramatical. In: ENCONTRO NACIONAL DE Lingüística, III, Rio de Janeiro, 1979. Anais ... Rio de Janeiro, PUC, 1979. p.6-31. _____. Análise sintática (Teoria geral e descrição do português). São Paulo, ática, 1984. LEMLE, Miriam. & NARO, Anthony Julius. Competências básicas do português. Relatório final de pesquisa apresentado às instituições patrocinadoras Fundação Movimento Brasileiro (MOBRAL) e Fundação Ford, Rio, 1977. 151p. LIRA, Solange de Azambuja. Nominal, pronominal and zero subject in Brazilian Portuguese. Ph.D. Dissertation. University of Pennsylvania, 1982. mimeo LOBATO, Lúcia Maria Pinheiro. Sintaxe gerativa do português: da teoria padrão à teoria da regência e ligação. Belo Horizonte, Vigília, 1986. 558p. MACEDO, Alzira Verthein Tavares de. O uso do futuro do subjuntivo em português: regularização de uma forma verbal. Tese de Doutorado, UFRJ, 1981. 201p. mimeo MARROQUIM, Mário. A língua do nordeste - Alagoas e Pernambuco. 2. ed. São Paulo, Nacional, 1945. MARTINET, André. A functional view of language, 1. ed. London, Oxford University Press, 1962. 163p. _____. Elementos de lingüística geral. Lisboa, Sá da Costa, 1973. 223p. MELO, Gladstone Chaves de. A língua do Brasil. Rio de Janeiro, Agir, 1946. _____. Gramática fundamental da língua portuguesa. 3. ed. Rio de Janeiro, Ao Livro Técnico, 1978. 258p. MOLLICA, Maria Cecília. Estudo da cópia nas construções relativas em português. Dissertação de Mestrado, PUC, Rio de Janeiro, 1977. 86p. mimeo

551

MONTEIRO, Clóvis do Rêgo. A linguagem dos cantadores. Tese apresentada em concurso à Congregação do Colégio Pedro II. Rio de Janeiro, 1933. MONTINNI, Marina. Transcrição de gravações. Jornal do Brasil, Rio de Janeiro, 06 mar. 1987. p.1, Caderno Cidade. _____. Reportagem sobre as gravações. Jornal do Brasil, Rio de Janeiro, 07 mar. 1987, p.3, Caderno Cidade. NARO, Anthony J. The SWAMINC program. Departamento de Letras, PUC, 1974. mimeo

Rio

de

Janeiro,

_____. Review article. Linguistic variation, Models and methods. Edited by DAVID SANKOFF. New York: Academic Press, 1978. Language, LSA, 56(1):158-70, mar. 1980. _____. Morphological constraints on subject deletion: In: SANKOFF, David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus, Canada, Linguistic Research Inc., 1981b. p.351-8. _____. The social and structural dimensions of a syntactic change. Language, LSA, 57(1):63-98, 1981a. _____. Comments on saliency and the direction of syntactic change by Gregory R. Guy. Rio de Janeiro, dez. 1986. 11p. mimeo NARO, Anthony J. & LEMLE, Miriam. Syntactic diffusion. In: STEEVER, Sandord B. Et alii (eds.). Papers from the parasession on diachronic syntax. Chicago, Chicago Linguistic Society, 1976. p.221-41. _____. Syntactic diffusion. Ciência e cultura, 29(3):259-68, 1977. NARO, Anthony J. & VOTRE, Sebastião J. SWAVA: Sistema SWAMINC/VARBRUL (Manual do Usuário). UFRJ, 1980. mimeo _____. Emergência da sintaxe como um efeito discursivo. In: NARO, Anthony J. et alii. Relatório final de pesquisa: Projeto subsídios do Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986. V.III, p.45481. mimeo NARO Anthony J. et alii. Relatório final de pequis: Projeto subsídios do Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986. v.I,II e III. 512p. mimeo

552

NASCENTES, Antenor. O linguajar carioca. 2. ed. Rio de Janeiro, Organização Simões, 1953. NICHOLS, Johanna. Functional theories of grammar. In: ANN-REV. ANTHROPOL. Berkeley, University of California, Slavic Department, 1984. p.9-117. NICHOLS, Johanna. & WOODBURY, A. C. Introduction. In: (eds.). Grammar inside and outside the clause. London, Cambridge University Press, 1985. p.1-14. OLIVEIRA, Marco Antônio de. Sobre os reflexos sociais da mudança em progresso. In: VEADO, Rosa Maria Assis. (org.). Ensaios de lingüística. cadernos de lingüística e teoria da literatura. Belo Horizonte, UFMG, (7):71-89, dez. 1982. _____. Variável lingüística: Conceituação, problemas de descrição gramatical e implicações para a construção de uma teoria gramatical. Documentação de Estudos em Lingüística Teórica e Aplicada. São Paulo, Editora da PUC, 3(1):19-34, fev. 1987. OLIVEIRA FERNANDEZ, Maria do Carmo Leite de. et alii. Coisas sobre a palavra coisa. In: ENCONTRO NACIONAL DA ANPOLL, Curitiba, 1986. Anais ... Curitiba, 1986 (a sair). OMENA, Nelize Pires de. Pronome pessoal de terceira pessoa: suas formas variantes em função acusativa. Dissertação de Mestrado, PUC, Rio de Janeiro, 1978. 138p. mimeo _____. A referência variável da primeira pessoa do discurso, no plural. In: NARO, Anthony J. et alii. Relatório final de pesquisa: Projeto subsídios do Projeto Censo à educação. Rio de Janeiro, UFRJ, 1986. V.II, p.286-319. mimeo PEREIRA, Carlos Eduardo. Gramática expositiva. 8. ed. São Paulo, Nacional, 1949. PEREIRA, Maria Angela Botelho. Gênero e número em Português. estudo das relações forma-sentido na gramática. Tese de Doutorado, UFRJ, Rio de Janeiro, 1984. 189p. mimeo PERINI, Mário A. A gramática gerativa: introdução ao estudo da sintaxe portuguesa. Belo Horizonte, Vigília, 1976. 254p. PIKE, Kenneth L. Phonemics: A technique for reducing languages to writing. Michigan, Ann Arbor-The University of Michigan Press, 1976. p.67-173.

553

PONTE, Vanessa Maria Lôbo. A concordância nominal de uma comunidade de Porto Alegre. Dissertação de Mestrado, PUC, Rio Grande do Sul, 1979. 215p. mimeo PONTES, Eunice Souza Lima. Sujeito: da sintaxe ao discurso. São Paulo, ática, 1986. 287p. _____. O tópico no português do Brasil. São Paulo, Pontes, 1987. 169p. POPLACK, Shana. The notion of the plural in Puerto Rico Spanish: competing constraints on /s/ deletion. In: LABOV, William. (eds.). Locating language in time and space. Philadelphia, University of Pennsylvania, 1980a. P.55-67. _____. Deletion and disambiguation in Puerto Rican Spanish. Language, LSA, 56(2):371-385, jun. 1980b. _____. Mortal phonemes as plural morphemes. In: SANKOFF, David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canada, Linguistic Research Inc., 1981. p.59-71. PRINCE, Ellen F. Toward a taxonomy of Given-new information. In: COLE, P. (ed.). Radical pragmatics. New York, Academic Press, 1981. p.223-55. ROCHA LIMA, Carlos Henrique de. Gramática normativa da língua portuguesa. 23. ed. Rio de Janeiro, José Olympio, 1983. 506p. ROUSSEAU, Pascale & SANKOFF, David. Advances in variable rule methodology. In: SANKOFF, David. (ed.). Linguistic variation: models and methods. New York: Academic Press, 1978. p.57-68. SANKOFF, David. Varbrul Version 2. Centre de Mathématiques, Université de Montréal, 1975. mimeo

Réchérches

_____. Varbrul 2S. Programa não publicado e não documentado. 1979. SANKOFF, David. & CEDERGREN, Henrietta. (eds.). Variation Omnibus. Canada, Linguistic Research Inc., 1981. SANKOFF, David & LABERGE, Suzanne. Statistical dependence among successive occurrences of a variable in discourse. In: SANKOFF, David. (ed.). Linguistic variation: models and methods. New York: Academic Press, 1978. P.119-26. _____. The linguistic market and the statistical explanation of variability. In: SANKOFF, David. (ed.) Linguistic variation: models and methods. New York: Academic Press, 1978. p.239-49. SARAIVA, Maria Elizabeth Fonseca. & BITTENCOURT, Vanda de Oliveira. A concordância verbal em estruturas com SN complexo em português: um caso de interferência de fatores metonímicos e metafóricos. Belo Horizonte, UFMG, 1987. 42p. mimeo

554

SAUSSURE, Ferdinand de. Curso de lingüística geral. 5. ed. São Paulo, Cultrix, 1973. 279p. SCHERRE, Maria Marta Pereira. A regra de concordância de número no sintagma nominal em português. Dissertação de Mestrado, PUC, Rio de Janeiro, 1978. 158p. mimeo _____. TRABALHO FINAL DO CURSO: ASPECTOS DA VARIAÇÃO GRAMATICAL. Rio de Janeiro, Faculdade de Letras da UFRJ, 1979. 12p. mimeo _____. Variation de la regle d'accord du nombre dans le syntagme nominal en Portugais. In: SANKOFF, David. & CEDERGREN, Henrietta. (ed.). Variation Omnibus. Canada, Linguistic Research, Inc., 1981. p.125-33. _____. A concordância de número no SN. In: NARO, Anthony J. et alii (coord.). Relatório final de pesquisa apresentado à FINEP, UFRJ, 1984. p.130-49. mimeo _____. A concordância nominal em português. In: NARO, Anthony J. et alii (coord.). Relatório parcial de pesquisa apresentado ao INEP. Rio de Janeiro, UFRJ, 1984. P.87-112. mimeo _____. A regra de concordância de número entre os elementos dos SNs. In: NARO, Anthony J. et alii (coord.). Relatório final de pesquisa apresentado ao INEP. Rio de Janeiro, UFRJ, 1985. p.61-109. mimeo _____. Análise da estratificação social: concordância de número entre os elementos do sintagma nominal. In: NARO, Anthony J. et alii (coord.). Relatório final de pesquisa: Projeto subsídios sociolingüísticos do projeto Censo à Educação. Rio de Janeiro, UFRJ, 1986. v.I, p.58-75. mimeo _____. Análise lingüística da amostra: Visão global de um fenômeno de variação em Português: a regra de concordância de número entre os elementos do sintagma nominal. In: NARO, Anthony J. et alii (coord.). Relatório final de pesquisa: Projeto subsídios sociolingüísticos do projeto Censo à Educação. Rio de Janeiro, UFRJ, 1986. v.II, p.144-231. mimeo _____. Interferências de aspectos semânticos no processo formal de concordância de número entre os elementos do SN. In: X ENCONTRO NACIONAL DE Lingüística, Rio de Janeiro, 1986. Anais ... Rio de Janeiro, PUC, 1986.(a sair) _____. Relação entre classe gramatical e posição na concordância nominal em português. In: XXXIII SEMINÁRIO DE LINGÜÍSTICA DO GEL. São Paulo, UNICAMP, 1987. (a sair)

555

SCHIFFRIN, Deborah. Tense variation in narrative. Language, LSA, 57(1):45-62, mar. 1981. SILVA, Giselle Machline de Oliveira e. Estudo da regularidade na variação dos possessivos no Português do Rio de Janeiro. Tese de Doutorado, UFRJ, 1982. 444p. mimeo SILVA Giselle Machline Oliveira e. & FERREIRA, Estela Maris Alves. Sensibilidade lingüística dos cariocas. Comunicação a ser apresentada na Reunião Anual da SBPC em julho de 1988. 18p. mimeo TARALLO, Fernando. A pesquisa sociolingüística. São Paulo, Ática, 1985. 96p. TARALLO, Fernando. & DUARTE, Maria Eugênia Lamogia. Processos de mudança lingüística em progresso: a saliência vs não saliência de variantes. UNICAMP e PUC, São Paulo, /s.d/. 18p. mimeo TROUBETZKOY, N.S. Principes de phonologie. Paris, Klincksieck, 1976. 395p. VOTRE, Sebastião Josué. Aspectos da variação fonológica no Rio de Janeiro. Tese de Doutorado, PUC, Rio de Janeiro, 1978. 221p. mimeo WEINER, E. Judith. & LABOV, William. Constraints on the agentless passive. University of Pennsylvania, /s.d/. 62p. mimeo

556

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em português. Tese de Doutorado em Lingüística. Rio de Janeiro, Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p. mimeo.

RESUMO

Este trabalho é uma reanálise pormenorizada da concordância de número entre os elementos do sintagma nominal no Português do Brasil, baseada em amostras de fala de pessoas residentes na área urbana do Rio de Janeiro, sob o enfoque da Sociolingüística Quantitativa. Inicialmente, descreve-se e explica-se o conjunto de variáveis lingüísticas, sob perspectivas atomística e não atomística, que regem as tendências sistemáticas da variação da concordância nominal, com exame crítico de estudos anteriores e propostas de resolução dos problemas levantados. Paralelamente, discute-se a hipótese funcionalista kiparskiana e, a seguir, propõe-se um novo princípio universal de motivação externa - o Princípio do Processamento com Paralelismo -, ao lado de outros princípios já incorporados pela teoria lingüística. Além disso, analisase a correlação entre variação e mudança, inferindo-se, através de resultados de variáveis sociais e lingüísticas, a existência de variação sociolingüística estável para um grupo de falantes e a existência de mudança em progresso para outro grupo. Finalmente, demonstra-se a variação inerente, detectando-se influências uniformes de variáveis lingüísticas e explicitam-se influências sociais não convencionais. Este trabalho contribui, portanto, para a descrição/explicação de gramáticas particulares e para a teoria lingüística geral .

557

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em português. Tese de Doutorado em Lingüística. Rio de Janeiro, Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p. mimeo.

ABSTRACT

This thesis is a detailed reanalysis of number agreement between the elements of the noun phrase in Brazilian Portuguese, based on recorded samples of speech of residents of urban Rio de Janeiro, using the methodology of Quantitative Sociolinguistics. First, we describe and explain the linguistic variables, viewed from both an atomistic and a non-atomistic perspective. These variables determine systematic tendencies of variation in nominal agreement. Our discussion is accompanied by a critical examination of earlier work and proposals for solutions of problems which occur. At the same time, we also discuss Kiparky's functionalist hypothesis and propose a new universal principle of external motivation - the Principle of Parallel Processing - which interacts with other principles already accepted by linguistic theory. Furthermore, we analyze the correlation between variation and change, infering, from results of social and linguistic variables, that there is stable sociolinguistic variation for one group of speakers and change-in-progress for another group. Finally, we show the existence of inherent variation through the detection of uniform influence of linguistic variables and we discuss the influence of non-conventional social variables. Thus this thesis contributes to the description/explanation of particular grammars and to general linguistic theory.

558

SCHERRE, Maria Marta Pereira. Reanálise da concordância nominal em português. Tese de Doutorado em Lingüística. Rio de Janeiro, Faculdade de Letras, UFRJ, 1988. Em dois volumes, com 555p. mimeo.

RESUMÉ

Cette thèse est une réanalyse detaillée de l'accord du nombre entre les éléments du syntagme nominal en Portugais du Brésil, fondée sur des échantillons de la conversation de personnes qui resident dans le périmètre urbain de Rio de Janeiro, à la lumière de la Sociolinguistique Quantitative. D'abord, nous faisons la description et l'explication de l'ensemble de variables linguistiques, dans une perspective atomistique et non-atomistique, qui régissent les tendences sistématiques de la variation des accords nominaux, avec un examen critique d'études antérieures ainsi que des propositions e rêsolutions des problèmes soulevés. En même temps, nous discutons l'hypothèse fonctionnaliste de Kiparsky et, en suite, nous faisons la proposition d'un nouveau principe universel de motivation exterieure - le Principe du Processement Parallèle - côte à côte avec d'autres principes déja incorporés par la théorie linguistique. En plus, nous analysons la corrélation entre variation et changement, en faisant l'inférence, au moyen de quelques résultats de variables sociales et linguistiques, de l'existence de variation sociolinguistique stable pour un groupe de parlants et de l'existence de changements en progrès pour un autre groupe. Finalement, nouns démontrons une variation inérente, en faisant la détection d'influences uniformes de variables linguistiques et nous explicitons aussi des influences sociales nonconventionnelles. De cette façon, ce travail contribue à la description/explication de grammaires particulières et à la théorie linguistique générale.

Lihat lebih banyak...

REANÁLISE DA CONCORDÂNCIA NOMINAL EM PORTUGUÊS

Descrição do Produto

Comentários