Padrões Rítmicos, Fixação de Parâmetros & Mudança Lingüística

Resumo

O projeto Padrões rítmicos, fixação de parâmetros e mudança linguïstica Fase II, situa-se na continuação do projeto homônimo, e tem como primeiro objetivo a ampliação e consolidação do Corpus Histórico do Português Anotado Tycho Brahe, produzido pelo projeto anterior:

  • Diversificação dos tipos, períodos, e espaços de produção dos textos. Nesta nova fase, serão trazidos textos de autores portugueses nascidos nos séculos 14 e 15, textos de autoria incerta ou desconhecida, textos não literários, e textos produzidos no Brasil.
  • Implementação da anotação sintática com base no sistema desenvolvido na primeira fase. No final de quatro anos, o Corpus deverá atingir a meta de 2.000.000 de palavras sintaticamente analisadas.
  • Reestruturação do Corpus em linguagem XML, nos padrões internacionais de codificação de corpora.

O segundo objetivo do projeto é o uso do Corpus revisado para aprofundar o estudo lingüístico da fase intermediária entre o português arcaico e as variantes modernas da língua - que chamaremos de português médio - com as seguintes perguntas em mente:

  • Quais são as características gramaticais do Português Médio?
  • Qual é sua trajetória no tempo?
  • Qual é o papel da mudança prosódica na emergência do Português Europeu Moderno?

O projeto está ancorado, assim, em importantes linhas de investigação da lingüística atual: compreender o que provoca a mudança lingüística, e como essa mudança se dá ao longo do tempo. Como no projeto anterior, enfatiza-se a relação ritmo/sintaxe como um dos motores da mudança gramatical, um ponto pouco explorado dos estudos históricos modernos.

Enfrenta-se ainda um desafio metodológico: o problema da detecção dos padrões prosódicos nos textos escritos. Enfim, pretende-se descrever e analisar o estado de língua que deu origem às duas grandes variantes modernas do português, lançando as bases de uma história comparada do português brasileiro e do português europeu moderno.

Para atingir tais objetivos, articular-se-á análise qualitativa com análise quantitativa, reunindo de um lado a teoria da gramática gerativa e a fonologia prosódica e, de outro lado, a estatística descritiva e modelagem estocástica. Essa abordagem multidisciplinar une o projeto às tendências mais recentes no campo dos estudos da mudança lingüística, aliando o recurso a grandes volumes de dados - possíveis graças à contribuição das tecnologias computacionais - a investigações teóricas solidamente fundadas, reunindo e fomentando a contribuição entre pesquisadores de formação variada - sintaticistas, fonólogos, estatísticos, probabilistas, teóricos da computação e lingüistas computacionais - contribuindo, por fim, na renovação das perspectivas para o campo.

A equipe nuclear do projeto trabalhará em colaboração estreita com outros grupos de pesquisa, no Brasil e no exterior. Desses ressaltam-se, no primeiro caso, o projeto Comportamento estocástico, Fenômenos Críticos e Identificação de Padrões Rítmicos nas Línguas Naturais (Pronex/Fapesp), e o Projeto Lácio-Web do Núcleo Interdisciplinar de Lingüística Computacional (NILC). O Corpus ainda conta com o suporte computacional da rede do IME-USP. Fora do Brasil, o presente projeto se filia ao pioneiro Penn-Helsinki Parsed Corpus of Middle English , coordenado por Anthony Kroch, e se inscreve assim numa corrente internacional de construção de grandes corpora históricos anotados. Além de seminários regulares reunindo a equipe nuclear de pesquisadores, seus estudantes e seus colaboradores mais próximos, faz parte integrante do projeto a realização de encontros nacionais e internacionais, nos moldes dos grandes workshops organizados à iniciativa do projeto anterior.

tycho home Contato | ©2008 PPFF (©2005 MCPS)
[principal]  [novidades]  [resumo do projeto]  [projeto completo]  [relatórios]  [participantes]  [publicações]  [corpus histórico]  [corpus de fala]  [1998-2003]