Projeto CE-DOHS
Corpus Eletrônico de Documentos Históricos do Sertão


FAPESB, Processo 5566/2010/Consepe: 202/2010

Coordenação:

Zenaide de Oliveira Novais Carneiro
(UEFS/Fapesb/CNPq)

Mariana Fagundes de Oliveira Lacerda
(UEFS/Fapesb)

Feira de Santana - BA, Brasil

Corpus Eletrônico de Documentos Históricos do Sertão [ CE-DOHS ]

Voltar

Corpus Compartilhado Diacrônico - Oral (PHPB-BA/Tycho Brahe/PROHPOR)

Os documentos estão editados em XML, utilizando a ferramenta eDictor (desenvolvida por Pablo Faria, Fábio Kepler e Maria Clara Paixão de Sousa). Essa tecnologia de edição digital foi inspirada no Corpus Histórico do Português Tycho Brahe, coordenado por Charlotte Galves.

Amostra/Edição fac-similada (período) Corpus
Piemonte da Diamantina: Piabas – Projeto A Língua portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 11 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Piabas, região de transição entre o processo histórico-econômico que se define como área de pecuária e zona de mineração, é uma comunidade que tem, como formação étnica marcante, a matriz africana. 
Chapada Diamantina: Barra dos Negros/Bananal – Projeto A Língua portuguesa no Semiárido Baiano: fala popular (fase 1 e 2) 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Barra dos Negros e Bananal, representativas da zona de mineração que, atualmente, tem como uma das principais atividades econômicas o turismo, é uma comunidade que tem, como formação étnica marcante, a matriz africana. 
Chapada Diamantina: Mato Grosso – Projeto A Língua portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase I do projeto “A língua portuguesa falada no semiárido baiano”, entre 1997 e 1999. Nesta fase, a intenção era contribuir para o conhecimento da realidade linguística brasileira e, de forma específica, para o estudo da língua falada em áreas do semiárido baiano. As comunidades foram escolhidas de forma que representassem o avanço da língua portuguesa na Bahia, a partir do século XVII, numa perspectiva sócio-histórica. Mato Grosso, representativa da zona de mineração que, atualmente, tem como uma das principais atividades econômicas o turismo, é uma comunidade que tem, como formação étnica marcante, a matriz portuguesa. 
Nordeste/Jeremoabo: Casinhas– Projeto A Língua portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Casinhas é uma comunidade formada de descendentes de africanos, da região Nordeste. 
Nordeste/Jeremoabo: Tapera – Projeto A Língua portuguesa no Semiárido Baiano: fala popular 6 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Tapera é uma comunidade formada de descendentes de indígenas, da região Nordeste. 
Nordeste/Jeremoabo: Lagoa do Inácio – Projeto A Língua Portuguesa no Semiárido Baiano: fala popular 6 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Tapera é uma comunidade formada de descendentes de indígenas, da região Nordeste. 
Paraguaçu: Matinha – Projeto A Língua Portuguesa no Semiárido Baiano: fala popular 12 Entrevistas
Este corpus oral dispõe de 12 entrevistas com falantes analfabetos ou pouco escolarizados, de ambos os sexos, divididos em três faixas etárias. A metodologia de coleta foi feita nos moldes da sociolinguística quantitativa (Labov, 1972, 1982). Os inquéritos foram gravados na fase II do projeto “A língua falada no semiárido baiano”, entre 1999 e 2003. Nesta fase, o projeto voltou-se para duas regiões da Bahia: a Nordeste, uma das mais antigas, e a Paraguaçu, ponto de passagem para o interior do estado. Matinha é uma comunidade formada, majoritariamente, por descendentes de africanos, da Região Paraguaçu, uma zona de transição entre o recôncavo e o sertão baiano. 
Paraguaçu: Feira de Santana: fala popular de feirenses filhos de feirenses, de feirenses filhos de migrantes, de migrantes e fala culta de feirenses 0 Entrevistas
O projeto A Língua Portuguesa no Semiárido Baiano tem três fases: nas fases I e II, traz amostras de fala de zonas rurais, e, na fase III, amostras de fala da zona urbana de Feira de Santana, segunda maior cidade do estado da Bahia. Os dados coletados nessa cidade fornecem importantes subsídios para o entendimento da formação, caracterização e difusão do português brasileiro, notadamente no que se refere ao entrecruzamento das normas populares e cultas e ao contato rural e urbano; a língua falada nesse município agrega características que a fazem ser um “espelho” da realidade sociolinguística brasileira. O corpus de Feira de Santana reúne 72 informantes, dos gêneros masculino e feminino, das faixas etárias I, II e III, em gravações do tipo DID (Diálogo entre Informante e Documentador), assim como nas Fases I e II do projeto. Ainda inédito, esse material traz entrevistas representativas da norma popular (feirenses filhos de feirenses, feirenses filhos de migrantes, migrantes, feirenses da zona rural), da norma culta (feirenses filhos de feirenses) e da norma semiculta (feirenses filhos de feirenses). O objetivo do projeto é responder a questões como: será que o dialeto urbano de Feira de Santana sofreu muitas influências dos dialetos rurais e vice-versa? 
A língua portuguesa falada em áreas indígenas especiais 0 Entrevistas
Este corpus de amostras de fala compõe-se de narrativas coletadas por antropólogos, coordenado por Norma Lucia Fernandes de Almeida, das comunidades foram originárias de antigos aldeamentos, na implantação do Diretório Pombalino em meados do século XVIII. As comunidades são: Jeremoabo (Jeremoabo), Bom Conselho (Cícero Dantas), Santa Tereza de Canabrava, Pombal (Ribeira do Pombal), aldeia de Tupinambás (Soure), Tucano, Saco dos Morcegos/Mirandela, aldeia de índios Moritis e Cariris (Ribeira do Pombal), Maçacará (Euclides da Cunha) e outra da Região Norte como Pambu, Santo Antônio da Glória. Essa área era habitada por grupos indígenas da família lingüística Macro-Jê. Um dos mais numerosos são os Kariris ou Kiriris.  
Região Metropolitana: Salvador – Capital – Fala popular (PEPP) 48 Entrevistas
O corpus do Programa de Estudos sobre o Português Popular de Salvador (PEPP), constituído entre os anos de 1998 e 2000 e coordenado pela professora doutora Norma da Silva Lopes, da Universidade do Estado da Bahia (UNEB), é formado por 48 gravações de, aproximadamente, 40 minutos, transcritas segundo as normas definidas pelo Projeto Norma Linguística Urbana Culta (NURC/Salvador). Os informantes estão distribuídos em quatro faixas etárias: de 15 a 24 anos, de 25 a 35 anos, de 45 a 55 anos e de 65 anos em diante. Quanto à sua escolaridade, varia entre mínima, de 1 a 4 anos (pouca escolaridade), e máxima, de 11 anos de permanência na escola (média escolaridade). O PEPP é um programa pioneiro, tendo com ele sido iniciadas as pesquisas sobre a fala popular na Bahia. 
Região Metropolitana: Salvador – Capital – Fala culta (NURC) 0 Entrevistas
O corpus do Projeto Norma Linguística Urbana Culta (NURC) foi criado em âmbito nacional, em 1969, com o propósito de reunir um banco de dados da fala culta de várias capitais do Brasil. O de Salvador foi constituído entre 1973 e 1983 e reúne 360 inquéritos, com registro de 461 informantes; 58 inquéritos em elocuções em situação formal, 201 em diálogos entre informante e documentador e 101 em diálogos entre dois informantes. A fase de constituição do corpus de Salvador foi coordenada por Nelson Rossi, também coordenador nacional do Projeto NURC/Brasil em vários períodos. 
Chapada Diamantina: Comunidade Quilombola Ramos – Presidente Dutra – Município de Irecê-Bahia 0 Entrevistas
Este corpus é constituído por 24 (vinte e quatro) amostras de língua oral, com falantes analfabetos ou pouco escolarizados (até a quarta série), de ambos os sexos, divididos em três faixas etárias, de comunidades quilombolas do território de identidade de Irecê-Bahia. O objetivo é caminhar em direção à reconstrução da história do português popular brasileiro, por meio do estudo vertical de suas variantes populares, não só urbanas, mas também rurais. 
Amostras de Fala de Luanda-Angola 0 Entrevistas
Este corpus é constituído por amostras de fala, resultante de um trabalho de campo realizada na cidade de Luanda-Angola, referente ao Projeto “Em busca das raízes do português brasileiro (Consepe/UEFS 13/04/2009 036/2009/UEFS/FAPESB Edital 001/2012), coordenado por Eliana Pitombo Teixeira, Silvana Silva de Farias Araújo e Norma Lucia Fernandes de Almeida, em que foi constituída uma amostra da língua falada do português luandense, com entrevistas sociolinguísticas (do tipo DID - Diálogo entre Informante e Documentador) - estratificadas por faixa etária, sexo, escolaridade, língua materna e local de nascimento do informante (TEIXEIRA, 2013). 
Entrevistas-narrativas: redatores e destinatários das Cartas de Inábeis 0 Entrevistas
O conjunto de 12 entrevistas-narrativas, produzidas mediante metodologia baseada na História Oral, com 10 remetentes e 2 destinatários das Cartas de Inábeis, foi utilizado no estudo desenvolvido na tese de doutorado de Huda Santiago, A escrita por mãos inábeis: uma proposta de caracterização. As gravações têm duração, em média, de 15 a 30 minutos e abordam, principalmente, temas relacionados à história da cultura escrita da região de Riachão do Jacuípe, Conceição do Coité e Ichu. 
 
Corpus compactado: Para ter acesso a todo o corpus editado nas
versões texto (TXT) original e modernizado, favor clicar aqui.
Patrocínio e apoio:


Universidade Estadual de Feira de Santana
Departamento de Letras
e Artes

Núcleo de Estudos de Língua Portuguesa (NELP)

Av. Transnordestina, s/n -
Novo Horizonte
Feira de Santana-BA, Brasil
Caixa Postal: 252 e 294
CEP.: 44.036-900
+55 75 31618265

Projeto Vozes do Sertão em Dados: história, povos e formação do português brasileiro (CNPq. Processo 401433/2009-9/Consepe: 102/2009) (acessar)