A transcrição fonética: consoantes no português brasileiro

Plínio A. Barbosa | Dep. Linguística, Instituto de Estudos da Linguagem, UNICAMP

How to cite:

Barbosa, Plínio A. (2022) A transcrição fonética: consoantes no português brasileiro. In: Speech Sciences Entries. Speech Prosody Studies Group. Disponível em: https://gepf.falar.org/entries/42

Este texto forma uma unidade com o verbete "A Transcrição Fonética: vogais no português brasileiro", devendo ambos serem considerados um único documento para uma primeira orientação de como se transcrever sons do português brasileiro.

No primeiro verbete, observamos que a forma de cada símbolo é única e especificada de tal forma que seja reproduzida de maneira idêntica sempre que for usado. Por exemplo, [t] e [ʈ] representam consoantes distintas: o primeiro símbolo é o da oclusiva alveolar não vozeada, enquanto o segundo símbolo é o da oclusiva retroflexa não vozeada encontrada no gaélico escocês em palavras como "ard" (alto).

Como nas vogais, erros de transcrição podem advir por não ouvirmos determinadas distinções consonânticas. Imagine nós brasileiros transcrevendo línguas que distinguem oclusivas pulmonares de ejetivas ou fricativas retroflexas de não retroflexas. Seria necessário um bom treinamento perceptivo antes da empreitada.

Num trabalho de transcrição fonética, especificamente aquele que se serve de programa de software de análise acústica, que permite a escuta de qualquer trecho sonoro, é preciso reiterar que a sílaba é a menor unidade que devemos escutar, porque qualquer tentativa de escutar um som correspondente a um fonema isoladamente gera ilusões auditivas pela quebra de uma informação crucial para o processamento sonoro: a transição entre os elementos constitutivos da sílaba, especialmente a transição C-V.

Com esses cuidados, podemos transcrever foneticamente as consoantes do português brasileiro. Vejamos agora os casos que exigem maior cuidado nas transcrições das consoantes do português brasileiro.

A transcrição das oclusivas de nossa variedade do português ([p t k] e [b d g]) não apresenta grandes dificuldades, a não ser dois aspectos. Primeiro, a necessidade de prestar atenção em não se deixar levar pela ortografia no caso dos sons [k] e [g], bem como usar um símbolo de articulação secundária nos [k g] seguidos de "u" pronunciado, como estes exemplos mostram: "casa" [kazɐ], "equino" [ek^wĩnʊ], "quis" [kis], "guerra" [gɛɣɐ], "igual" [ig^waw], "canto" [kɐ̃tʊ] e "quanto" [k^wɐ̃tʊ].

Em segundo lugar, a questão da possível africação das alveolares [t d]. Nesse caso, o transcritor deve prestar atenção na soltura da oclusão: numa oclusiva, ela é intensa e de curta duração, enquanto nas africadas [t͡ʃ] e [d͡ʒ], ela produz um ruído fricativo cuja duração é bem mais extensa que o ruído oclusivo, como se pode ver no exemplo da Figura 1, em que se marcam os trechos da soltura até o início da vogal num /t/ oclusivo (esquerda) e num /t/ africado (direita), ambos diante de /i/ na palavra "poetisa". O primeiro, na fala de um falante do Rio Grande do Norte e o segundo, na fala de um falante de Minas Gerais. O tempo de produção de ruído após a soltura é de 38 ms no falante potiguar e de 67 ms no falante mineiro. Também no mineiro, o ruído gerado é de fricativa [ʃ].

Figura 1: Extensão de soltura do /t/ oclusivo ([t]) em falante potiguar (esquerda, de 38 ms) e do /t/ africado ([t͡ʃ]) em falante mineiro (direita, de 67 ms).

Também é possível ter uma situação intermediária, em que o falante palataliza o /t/ ou /d/, sem chegar a fazer uma africação, que é um caso comum diante de /i/ em falantes de regiões que não realizam uma africada. Nesse caso se usa a notação [tʲ] ou [dʲ].

Em línguas como o espanhol ou o português europeu, as oclusivas /b/, /d/ e /g/ podem ser realizadas como fricativas sonoras de mesmo ponto de articulação, respectivamente, fricativa sonora bilabial ([β]), alveolar/interdental ([ð]) e velar ([ɣ]). Em fala acelerada também é possível ocorrer esse tipo de realização em português brasileiro, como decorrência de hipoarticulação e não de uma alofonia das oclusivas sonoras. Pode-se ouvir o contraste da palavra "obrigado" em português brasileiro aqui, somente com oclusivas sonoras, e em português europeu aqui, somente com fricativas sonoras.

Fonologicamente, o português brasileiro tem seis fricativas: /f s ʃ v z ʒ/, respectivamente as surdas com pontos de articulação labiodental, alveolar e pós-alveolar e as sonoras com os mesmos pontos. Foneticamente, à realização desse conjunto com os mesmos símbolos, acrescem-se as realizações fricativas do "r".

Um caso que merece atenção na transcrição das fricativas é a pronúncia do /s/ na coda silábica, habitualmente representado pelo arquifonema /S/. Há dois aspectos importantes, um relacionado ao ponto de articulação e outro ao vozeamento. O /s/ na coda silábica pode ser realizado com o ponto de articulação alveolar ([s] ou [z]) ou pós-alveolar ([ʃ] ou [ʒ]), a depender do dialeto do português brasileiro. Sabe-se que, em proporções decrescentes, os falantes natos das cidades do Rio de Janeiro, Belém do Pará e Florianópolis pronunciam o /S/ como fricativa pós-alveolar, também referido vulgarmente como "s" chiado. A transcrição deve levar isso em conta, ponto de articulação que pode ocorrer em dialetos que não têm habitualmente a pronúncia do /s/ chiado na coda. Um exemplo disso é sua pronúncia em palavras como "linguística", em que ele é uma pós-alveolar mesmo na fala de paulistas, por conta do contexto de /i/ e africada alveolopalatal: [lĩg^wiʃt͡ʃɪkɐ].

Independentemente do ponto de articulação, o vozeamento do /s/ na coda depende do contexto fonético seguinte: se seguido de consoante surda ou silêncio, é realizado como [s] ou [ʃ] (nos dialetos e contexto acima apontados) e, se seguido de consoante sonora ou vogal em palavra seguinte, é realizado como [z] ou [ʒ] (nos dialetos e contexto acima apontados). Essa última pronúncia pode, então, se dar mesmo entre palavras, se não houver silêncio entre elas, como em "mais [z] verbas", "mais [z] harmonia". Se houver silêncio, no entanto, pronuncia-se como [s]: "paz [s] # imperiosa". Dentro da palavra, a pronúncia não muda, como em "mes[z]mo", "cas[s]ta", nos dialetos que não chiam o /S/ e "mes[ʒ]mo", "cas[ʃ]ta", nos dialetos que o chiam.

As consoantes nasais em português contrastam os pontos de articulação bilabial, alveolar e palatal: [m n ɲ], enquanto as laterais contrastam os pontos alveolar e palatal: [l ʎ]. As palatais têm um paralelo interessante para o treinamento do transcritor quando comparadas às sequências /ni/ e /li/, como logo veremos. Quanto às demais casos, o único cuidado é não confundir o que está marcado na ortografia com a realidade fonética. Assim, os grafemas e podem não apenas assinalar as respectivas consoantes [m] e [n], como em "mata" e "nata", como também assinalar a nasalização de vogal ou ditongo, como vimos no verbete de transcrição das vogais, como em "tentar", "tempo", "foram", onde não há consoante nasal plena.

Quanto aos casos de /ni/ vs. /ɲ/, a realização pode ser muito semelhante como no par de palavras "Sônia" vs. "sonha", uma vez que, em fala rápida ou casual, "Sônia" se pronuncia [sõnjɐ], com [nj] na última sílaba, podendo em alguns casos ser realizado como [ɲ]. Por outro lado, a pronúncia dessa última consoante pode ser de semivogal palatal nasalizada: [j̃], como em "bainha" [ba'ĩj̃ɐ] ou em "manha" ['mɐ̃j̃ɐ]. Da mesma forma, a sequência /li/, pronunciada de forma rápida ou casual, pode se dar como [lj] ou mesmo [ʎ]. O leitor deve certamente ter encontrado palavras que provocam equívocos ortográficos, como "mobiliado" pronunciado desta forma: [mobi'ʎadʊ] e escrito com . Assim, "família" pode ser pronunciada como [fa'milɪɐ], [fa'miljɐ] iu [fa'miʎɐ], o que requer habitualmente a necessidade de usar um software para tomar decisão com base no espectrograma, por conta da dificuldade de distinção das formas de oitiva. Não esquecer também que, embora na ortografia do português se escreva na coda, como em "mal", sua pronúncia não é consonântica em português brasileiro, devendo ser transcrita de forma indistinta da palavra "mau: [maw]. No entanto, em alguns casos, se ouve uma consoante, que passa a ser de ataque, como em "mal-educado" pronunciado como [maledu'kadʊ].

Mas, sem dúvida, um dos grandes pontos de discussão sobre transcrição das consoantes é aquela dos chamados "róticos", os sons de . A questão se relaciona à variedade interdialetal, especialmente a pronúncia do /R/ na coda silábica e o vozeamento deste e do /r/ de início de sílaba.

Como se sabe, o contraste fonêmico entre /ɾ/, o tap, e /r/ se dá apenas intervocalicamente em pares como "caro" vs. "carro". O primeiro é sempre realizado como tap e portanto sua transcrição é transparente: [ɾ]. O segundo, tanto entre vogais quanto em início de palavra, tem, entre seus pontos de articulação mais comuns, o glotal e o velar, podendo ser não vozeado ou vozeado (segunda posição entre colchetes), respectivamente: [h ɦ] ou [x ɣ]. É preciso conhecer bem a caracterização dialetal e usar conhecimento fonético acústico para tomar a decisão certa, uma vez que de oitiva não é fácil perceber nem o ponto nem o vozeamento (recomenda-se a leitura do capítulo 10, sobre róticos, do livro de Barbosa e Madureira, 2015). Normalmente, entre vogais, o /r/ é vozeado, mas nem sempre, assim alterna entre vozeado e não vozeado. Além disso, a depender de dialeto ou força articulatória, ainda se encontram pronúncias vibrantes do /r/ de ataque ou coda: [r].

Quanto ao /R/ na coda silábica, pode ser realizado com todas as pronúncias acima, isto é, [ɾ h ɦ x ɣ], além de uma pronúncia "caipira" como aproximante que, equivocadamente, recebe o nome de "r retroflexo" aplicado a todos os casos de "r" caipira em muitos textos que circulam no Brasil. Foneticamente, uma retroflexa é um som cujo ponto de articulação tem a ponta da língua flexionada para trás, obrigatoriamente. A confusão vem do fato de que, perceptivamente, as aproximantes como a alveolar do /r/ do inglês americano, transcrita como [ɹ], que não são retroflexas, soam de modo semelhante, efeito decorrente do abaixamento do terceiro formante (F3), que pode ser provocado por diferentes configurações articulatórias: pela aproximação da ponta da língua nos alvéolos, do corpo da língua na região velar, bem como da retroflexão da ponta da língua. Enquanto não houver estudos instrumentais articulatórios (por exemplo, pelo uso de ressonância magnética ou articulômetro), sobre o ponto de articulação dos diversos "r caipiras", não se pode denominar esses "r"s como "retroflexos". Aliás, em alguns dialetos, eles também ocorrem em ataque complexo como em "Bragança" pronunciada em Bragança Paulista. Portanto, a transcrição desse "r" não pode imediatamente ser assumida como a de "r" retroflexo: [ɽ]. Nesse casos melhor conviria deixar o símbolo de arquifonema /R/ e explicar no texto que é uma aproximante cujo ponto precisa ser determinado ou que é uma instância de "r" caipira, homenageando assim o grande Amadeo Amaral.

Ainda na coda ou em ataque, quando há mais "força" articulatória", podem ocorrer pronúncias uvulares do som fricativo de "r": [χ ʁ].

Para terminar, observemos que, com exceção da pronúncia caipira, discutida acima, em ataque complexo o "r" se realiza como tap: "prato" ['pɾatʊ]. Vemos assim que a pronúncia dos nossos "r"s é um prato cheio para discussões sem fim.

Bibliografia básica

BARBOSA, P. A; ALBANO, E. C. Brazilian Portuguese. Illustrations of the IPA. Journal of the International Phonetic Association, 34 (2): 227-232, 2004.

CALLOU, D.; LEITE, Y. Iniciação à fonética e à fonologia. 8a. ed. Rio de Janeiro: Jorge Zahar Editora, 2001.

CÂMARA Jr., J. M. Estrutura da língua portuguesa. 7. ed. Petrópolis, RJ: Editora Vozes, 1976.

Bibliografia avançada

BARBOSA, P. A.; MADUREIRA, S. Manual de Fonética Acústica Experimental. Aplicações a dados do português. São Paulo: Cortez, 2015.