Citação »
Galves, Charlotte, and Pablo Faria. 2010.
Tycho Brahe Parsed Corpus of Historical Portuguese. URL: http://www.tycho.iel.unicamp.br/~tycho/corpus/en/index.html.
Apresentação »
O Corpus Histórico do Português Tycho Brahe é um corpus
eletrônico anotado, composto de textos em português escritos por autores nascidos
entre 1380 e 1845.
Atualmente,
57
textos (
2.547.504
palavras) estão
disponíveis para pesquisa livre, com um sistema de anotação linguística em duas
etapas: anotação morfológica (aplicada em
33
textos); e
anotação sintática (aplicada em
16
textos).
O Corpus é desenvolvido junto ao projeto temático
Padrões Rítmicos,
Fixação de Parâmetros & Mudança Linguística
Agradecimentos »
Agradecemos às seguintes instituições e pessoas:
- Fundação de Amparo à Pesquisa do Estado de São Paulo, FAPESP 04/03643-0.
- CNPq, projeto 485999/2007-2, "Padrões rítmicos, domínios prosódicos e modelagem probabilística em corpora do português".
- Anthony Kroch e Beatrice Santorini, pela inspiração e o apoio permanente.
- Fábio Kepler, por nos permitir utilizar seu etiquetador morfológico em nosso trabalho.
- Dan Bikel, por nos permitir utilizar seu analisador sintático em nosso trabalho.
Outros corpora »
|
| : Notícias & Atualizações :|
|
|