Sumário

Sumário

Este projeto interdisciplinar tem dois objetivos principais. Do lado da Teoria das Probabilidades, pretende-se desenvolver o ferramental necessário à identificação de padrões em trajetórias de processos estocásticos. Do lado da Lingüística, pretende-se utilizar essas ferramentas para identificar os padrões rítmicos característicos e distintivos do Português Brasileiro (PB) e do Português Europeu Moderno (PE).

Esta pesquisa se inscreve no quadro das Cadeias com Conexões Completas. Pesquisas recentes na área levaram a aproximações markovianas e esquemas de regeneração, que facilitam a manipulação dos dados provenientes desse tipo de fonte. Aplicações recentes incluem a realização de simulações perfeitas e o desenvolvimento de estimadores para a entropia do processo.

Recentes trabalhos em linguística mostram evidências empíricas da a existência de classes rítmicas de línguas. Estados de Gibbs são candidatos naturais a medidas de probabilidade governando a escolha de sentenças por falantes, satisfazendo simultaneamente as restrições da sintaxe e dos padrões característicos da classe rítmica da lingua.

A metodologia do projeto inclui: a constituição de um corpus anotado de fala de PB e PE, uma implementação computacional de modelos gibbseanos para a geração de padrões rítmicos, o desenvolvimento da teoria estatística necessária para a análise desses modelos, a formalização matemática da noção de ritmo nas línguas naturais, e a identificação dos padrões rítmicos do PB e do PE.

Um subproduto tecnológico do projeto será a implementação computacional de critérios estatísticos, permitindo diferenciar automaticamente trechos gravados de Português Brasileiro e Português Europeu.

Página inicial