Este projeto interdisciplinar tem dois objetivos principais. Do
lado da Teoria das Probabilidades, pretende-se desenvolver o ferramental
necessário à identificação de padrões
em trajetórias de processos estocásticos. Do lado
da Lingüística, pretende-se utilizar essas ferramentas
para identificar os padrões rítmicos característicos
e distintivos do Português Brasileiro (PB) e do Português
Europeu Moderno (PE).
Esta pesquisa se inscreve no quadro das Cadeias com Conexões Completas. Pesquisas recentes na área levaram a aproximações markovianas e esquemas de regeneração, que facilitam a manipulação dos dados provenientes desse tipo de fonte. Aplicações recentes incluem a realização de simulações perfeitas e o desenvolvimento de estimadores para a entropia do processo.
Recentes trabalhos em linguística mostram evidências empíricas da a existência de classes rítmicas de línguas. Estados de Gibbs são candidatos naturais a medidas de probabilidade governando a escolha de sentenças por falantes, satisfazendo simultaneamente as restrições da sintaxe e dos padrões característicos da classe rítmica da lingua.
A metodologia do projeto inclui: a constituição de um corpus anotado de fala de PB e PE, uma implementação computacional de modelos gibbseanos para a geração de padrões rítmicos, o desenvolvimento da teoria estatística necessária para a análise desses modelos, a formalização matemática da noção de ritmo nas línguas naturais, e a identificação dos padrões rítmicos do PB e do PE.
Um subproduto tecnológico do projeto será a implementação computacional de critérios estatísticos, permitindo diferenciar automaticamente trechos gravados de Português Brasileiro e Português Europeu.