Padrões rítmicos, fixação de parâmetros e mudança linguística



Sumário do Projeto




O objetivo principal do projeto é modelar a relação entre prosódia e sintaxe na mudança linguística que deu origem ao Português Europeu Moderno a partir do Português Clássico.

Além dos resultados específicos da pesquisa científica, linguística e matemática, a serem desenvolvidos no quadro do projeto, este produzirá também:

  1. o Corpus Anotado do Português Histórico Tycho Brahe, com textos escritos por autores portugueses nascidos entre 1550 e 1850. Este corpus eletrônico, desenvolvido nos moldes do Penn-Helsinki Parsed Corpus of Middle English, será instalado na rede do Instituto de Matemática e Estatística da Universidade de São Paulo e será acessível a todos os pesquisadores da área acadêmica. O objetivo é chegar a 1.000.000 de palavras no final do quarto ano do projeto;
  2. um Corpus Comparativo Anotado de Português Europeu Moderno e Brasileiro Falado, com registros sonoros categorizados de falantes de ambos os dialetos. O objetivo é desenvolver um corpus estatisticamente representativo dos aspectos prosódicos distintivos do Português Europeu Moderno e Brasileiro.
As hipóteses básicas do projeto são as seguintes:
  1. a mudança na sintaxe do Português, ocorrida no século XIX, foi desencadeada por uma mudança prosódica prévia, ocorrida no século XVIII, que alterou o padrão rítmico da língua falada;
  2. a prosódia do Português Clássico é, nos aspectos relevantes para a pesquisa, idêntica à prosódia do Português Brasileiro.
  3. os textos escritos refletem o padrão rítmico de seus autores, através de escolhas lexicais e sintáticas ditadas por considerações prosódicas que escapam à censura da norma.

O projeto tem como quadro teórico o modelo de Princípios e Parâmetros que vem sendo desenvolvido por N. Chomsky e colaboradores. A ligação entre prosódia e sintaxe na interface da gramática com o sistema de desempenho Articulatório-Perceptual será modelada através do Formalismo Termodinâmico . A análise estatística dos textos históricos utilizará o ferramental teórico que vem sendo desenvolvido para os estudos de mudança linguística por A. Kroch e colaboradores. Além de modelos de regressão que serão utilizados na análise estatística dos dados históricos, a análise dos dados fonéticos exigirá um trabalho de modelagem e inferência estatística dos processos estocásticos subjacentes. A constituição do Corpus Tycho Brahe se beneficiará da experiência do Penn-Helsinki Parsed Corpus of Middle English; em particular serão re-elaborados para o português os analisadores morfológicos e sintáticos automáticos desenvolvidos no âmbito desse projeto.

Trata-se de um projeto eminentemente pluridisciplinar exigindo competências variadas. Assim a equipe executora é formada por sintaticistas, fonólogos, foneticistas, especialistas em história do português, físicos-estatísticos, probabilistas, estatísticos e cientistas da computação.

Para desenvolver essa pesquisa, devemos:

O projeto deverá produzir uma descrição da evolução dos padrões rítmicos através de seus traços nos textos históricos, trazendo assim evidências para confirmar a tese de que a mudança sintática no português europeu foi desencadeada por uma mudança prosódica e datando ambas. Além disso, a utilização sistemática de formalizações matemáticas para a modelagem dos fenômenos linguísticos deverá permitir não só avanços na compreensão dos mesmos, como poderá incentivar progressos matemáticos na teoria dos processos estocásticos e na teoria estatística.

A realização do plano inclui:

-reuniões de trabalho periódicas da equipe, com visitas dos pesquisadores aos diversos centros nos quais o projeto será desenvolvido.

- realização de dois encontros gerais de avaliaçãoe síntese do projeto, reunindo todos os pesquisadores principais bem como pesquisadores colaboradores convidados, em 1999 e 2001.

- instalação de equipamento computacional e ferramental acústico, necessários à implantaçãao dos corpora, à análise estatística e acústica dos dados. Esses equipamentos complementarão os recursos atuais da rede IME-USP, da rede IEL-UNICAMP e do Laboratório de Fonética Forense do Departamento de Medicina Legal da FCM-UNICAMP.