Corpus Histórico do Português Tycho Brahe

Citação »

Galves, Charlotte, and Pablo Faria. 2010. Tycho Brahe Parsed Corpus of Historical Portuguese. URL: http://www.tycho.iel.unicamp.br/~tycho/corpus/en/index.html.

Apresentação »

O Corpus Histórico do Português Tycho Brahe é um corpus eletrônico anotado, composto de textos em português escritos por autores nascidos entre 1380 e 1845.

Atualmente, 65 textos ( 2.792.217 palavras) estão disponíveis para pesquisa livre, com um sistema de anotação linguística em duas etapas: anotação morfológica (aplicada em 34 textos, num total de 1.508.757 palavras); e anotação sintática (aplicada em 16 textos, num total de 671.694 palavras).

Corpus tem sido desenvolvido junto aos projetos temáticos:


Agradecimentos »

Agradecemos às seguintes instituições e pessoas:

  • Fundação de Amparo à Pesquisa do Estado de São Paulo, FAPESP 04/03643-0.
  • CNPq, projeto 485999/2007-2, "Padrões rítmicos, domínios prosódicos e modelagem probabilística em corpora do português".
  • Anthony Kroch e Beatrice Santorini, pela inspiração e o apoio permanente.
  • Fábio Kepler, por nos permitir utilizar seu etiquetador morfológico em nosso trabalho.
  • Dan Bikel, por nos permitir utilizar seu analisador sintático em nosso trabalho.

Outros corpora »

| : Notícias & Atualizações :|
|: Cadastro :|
|: Contato :|
Acesso aos Textos

[ Página de ferramentas computacionais ]
[ Catálogo de Listas Ordenadas ]
[ Consulta aos textos com CorpusSearch ]

Baixar Corpus Compactado (.zip):

[ Corpus completo, anotação sintática ]
[ Corpus completo, anotação morfológica ]
[ Corpus completo, sem anotação ]

Normas de Edição e Manuais

[ Normas de Edição: apresentação ]
[ Manual Completo de Edição ]
[ Manuais de Anotação Morfológica e Sintática ]

Para uma correta visualização, certifique-se de que seu navegador web esteja com a codificação selecionada para UTF-8.