A entoação pode ser definida pela alternância dos valores da frequência fundamental ao longo da cadeia da fala. É a percepção desta alternância entre graves a agudos que possibilita a compreensão das diferentes modalidades de enunciados e das intenções dos falantes.
Diversos autores atribuem uma gama de funções comunicativas para a entoação nas línguas, dentre as quais estão: informacional, ilocucional, atitudinal e estruturadora do texto (COUPER-KUHLEN, 1986; HIRSCHBERG, 2002; HIRSCHBERG e GROSZ, 1992).
A definição e o funcionamento da entoação são melhor compreendidos quando aspectos de produção e percepção são observados de forma interligada, assim como suas propostas de análise e descrição, que relacionam os níveis fonético e fonológico de forma integrada.
Definições amplas e estreitas
Sobre a definição da entoação, existem na literatura da área definições mais amplas e mais estreitas sobre o fenômeno.
Uma das definições amplas da entoação que se aproxima da definição de prosódia é a de Ladd (1996). Para o autor a entoação “se refere ao uso de características fonéticas suprassegmentais para expressar significados pragmáticos no nível da sentença de forma linguisticamente estruturada” (LADD, 1996, p. 6). As características suprassegmentais a que se refere Ladd (1996) são: frequência fundamental (f0), intensidade e duração, os correspondentes de ordem física (fonética), dos fenômenos psicofísicos (fonológicos), de pitch, volume e quantidade (LEHISTE, 1970).
Em uma definição mais estreita, Botinis et al. (2001), define entoação, como sendo a “combinação de características tonais em grandes unidades estruturais associadas ao parâmetro acústico da f0 e sua variações distintivas no processo da fala”. Seguindo a mesma linha, Barbosa (2019) define a entoação como “a organização na cadeia da fala de padrões de variação de graves e agudos ao longo dos enunciados” (BARBOSA, 2019, p. 67). Segundo Barbosa, a percepção dessa dimensão de variação é o que conhecemos por pitch.
Em Hirst e Di Cristo (1998) o termo entoação é apresentado como portador de duas dicotomias entre sentidos amplos e restritos. A primeira dicotomia reside na definição da entoação em si. Em sentido amplo a entoação compreende fatores como acento lexical, tom e período, fatores que são excluídos quando a entoação é considerada em um sentido estreito, quando se refere à entoação propriamente dita, que se restringe a características supralexicais apenas.
A segunda dicotomia apontada pelos autores está nos níveis de análise e descrição, que podem ser feitos de acordo com os níveis formal ou funcional, ou seja, fonético ou fonológico (HIRST e DI CRISTO, 1988). Esta divisão de termos entre sentidos amplo e restrito, faz uma distinção entre lexical versus não-lexical, e linguístico versus físico, porém, mesmo havendo esta distinção, é assumido de alguma forma que a entoação é definida por esta relação entre componentes funcionais na base e formais na superfície.
A definição do fenômeno da entoação apresentada por Xu (2005; 2006) não assume que haja uma dicotomia entre produção e percepção, ou entre forma e função. Este autor emprega o conceito de melodia da fala, fenômeno para o qual convergem características tonais, como padrões de pitch relacionados ao acento lexical, e entoação propriamente dita, representada pela f0.
O modelo de análise adotado por Xu (2005; 2006), considera a melodia da fala portadora de informações comunicativas que são produzidas pelo sistema articulatório e codificadas e transmitidas unicamente por meio da f0. Nesse sentido, podemos considerar que as funções que se encontravam separadas, porém interligadas em algum nível, nas abordagens anteriores entre sistemas físico e psicofísico, se encontram unidas em um único componente articulatório nesta definição. Sendo assim, o que as outras abordagens consideram como entoação em amplo sentido, é definida para Xu dinamicamente apenas em termos da produção da f0.
Assumindo que o fenômeno da entoação possa ser definido e descrito apenas em termos da produção da f0, nos resta entender como as relações entre produção e percepção e forma e função nos guiam para o entendimento da entoação.
Fonética e fonologia da entoação
Moraes (2016) defende que para o estudo da entoação é fundamental uma abordagem integrada da fonética e da fonologia. Assim como sobre a produção e a percepção.
Quando nos referimos à fonética da entoação estamos falando sobre a descrição dos processos físicos da produção da entoação. Ao adotar uma definição estreita de entoação, a fonética da entoação descreve, portanto, os mecanismos de produção e modulação da f0.
A f0 é produzida nas pregas vocais pela ação da musculatura da laringe. Esta musculatura provoca a tensão das pregas vocais, fazendo com que estas funcionem como uma válvula que a passagem do ar deve ultrapassar. A passagem do ar com alta pressão pela glote é responsável pelo movimento de vibração das pregas vocais. A frequência de vibração das pregas vocais em ciclos por segundo, cuja unidade de medida é o Hertz, é o que determina o valor da f0.
Durante o encadeamento da fala é possível realizar variações nos valores da f0 por meio de ajustes na tensão das pregas vocais, basicamente como um mecanismo de controle de pressão. Por exemplo, ao iniciarmos um enunciado na fala ocorre o aumento da f0 com o aumento de pressão subglotal, e como esta pressão vai diminuindo ao longo do tempo a f0 também diminui globalmente nos enunciados, mesmo que localmente haja aumento da f0 para marcação de ênfase no componente segmental. A diminuição da pressão subglotal obriga a realização de pausas ao longo da fala seguidas por um reinício com aumento da pressão e da f0, o chamado reset (ver Figura 1).
Figura 1: para os dois enunciados as linhas pontilhadas mostram a diminuição global da f0, as setas cinzas os pontos de aumento local da f0 e a seta verde o reset após a pausa.
Da perspectiva da percepção, este mecanismo modula a curva melódica em termos de tons graves e agudos. A percepção desta variação é que reconhecemos como pitch: a sensação perceptual da f0.
É a variação discreta (MORAES, 2008; 2016) nos padrões do pitch que torna possível a distinção entre modalidades de enunciados, como, por exemplo, a asserção e a interrogação, fronteiras discursivas e a percepção de funções pragmáticas na fala. No português brasileiro (PB) uma asserção se inicia com um valor de pitch alto e termina com um valor bastante inferior ao inicial, enquanto nas interrogativas diretas se inicia também com um valor alto, porém é finalizada com valor local também alto (ver figuras 2 e 3). Os eventos locais marcadores de prominência dos enunciados são chamados de pitch accents.
Figura 2: padrão da curva melódica para enunciado assertivo neutro (sem ênfase local) do PB com notação do sistema DaTo.
Figura 3: padrão da curva melódica para enunciado interrogativo direto neutro do PB com notação do sistema DaTo.
Figura 4: padrão da curva melódica para enunciado interrogativo retórico neutro do PB com notação do sistema DaTo.
A tentativa de descrição dos movimentos da curva da f0 e da percepção do pitch nos levam à fonologia da entoação, que não se concebe com o mesmo nível de independência da fonética como ocorre na fonologia segmental.
Embora a fonologia entoacional, assim como a segmental, se baseie na distinção de eventos, no caso os graves e agudos da fala, a representação de tais eventos se baseia nos valores e movimentos de subida e descida da f0, o correlato fonético da entoação.
Os sistemas de notação entoacional mais empregados na descrição fonológica da entoação utilizam como rótulos para os eventos tonais as letras L e H, que representam, respectivamente, low e high, do inglês. A proposta de utilização desses rótulos foi feita por Pierrehumbert (1980) e depois utilizada no popular sistema ToBI (SILVERMAN et al, 1992), desenvolvido inicialmente para a notação entoacional do inglês americano, e posteriormente ajustado e aplicado a diversas línguas.
O sistema DaTo (LUCENTE, 2008; 2012; 2017), desenvolvido para o PB, propõe uma notação mais simples, com rótulos de notação para sete contornos entoacionais e dois níveis e fronteira, não considerando, por exemplo, a notação dos acentos frasais (phrase accents) e tipos de fronteiras (break indices) que a notação do sistema ToBI representa. No entanto, este sistema também se utiliza da combinação de Ls e Hs na determinação de seus rótulos de notação.
O funcionamento da notação entoacional de enunciados utilizando esse tipo de sistema se baseia na percepção de prominências, ou pitch accents, simultaneamente à inspeção visual na curva melódica de parâmetros fonéticos como: o valor da f0, a fim de estabelecer uma altura (L ou H); a gama de variação da f0, a fim de estabelecer uma combinação de rótulos (LH ou HL); e o alinhamento da curva melódica com o material segmental, em especial com as sílabas tônicas, a fim de localizar o rótulo da notação (ver notação DaTo nas figuras 2, 3 e 4).
Funções comunicativas
A expressão de funções comunicativas por meio da entoação vai além da distinção entre modalidades de enunciados que apresentam padrões gerais, como assertivos versus interrogativos. É por meio de pequenas variações nos padrões discretos das curvas melódicas que as intenções pragmáticas são comunicadas. Essas variações podem ocorrer em relação à altura de uma curva, ao grau de inclinação, ao alinhamento com as sílabas tônicas, ao formato dos picos, e também envolver outros parâmetros prosódicos, como a duração dos segmentos.
Ao observar os exemplos de enunciado “Alguém me trouxe alguma coisa” nas modalidades assertiva (Figura 2), interrogativa (Figura 3) e interrogativa retórica (Figura 4) temos a seguinte notação para três modalidades: >LH_LHL_L para a assertiva, LH_LHL_L para a interrogativa retórica, e >LH_>LH_H para a interrogativa total. Os rótulos inicias >LH e LH indicam uma diferença de alinhamento entre o pico da curva melódica e a vogal tônica: em LH o pico se alinha à vogal tônica da palavra “alguém” e em >LH o pico ocorre após a vogal tônica. As modalidades assertiva e interrogativa retórica apresentam o mesmo padrão de finalização: LHL com fronteira L, enquanto a interrogativa total finaliza com subida >LH e fronteira alta H.
Nós podemos ver pela notação que a interrogativa retórica tem padrão entoacional semelhante ao da assertiva, no entanto a taxa de declinação da interrogativa retórica é maior, e possivelmente a percepção de uma modalidade distinta da assertiva reside nesta diferença de inclinação, justamente o detalhe que escapa aos sistemas de notação.
Por exemplo, em Moraes (2008) são reportados vários experimentos de percepção que avaliam diferentes funções comunicativas em enunciados após estes terem suas curvas melódicas manipuladas em relação ao seu alinhamento com a sílaba tônica e sua inclinação. Estes experimentos mostraram que pequenas manipulações locais, que não alteram o padrão entoacional geral do enunciado, podem alterar drasticamente a percepção da intenção do enunciado, de uma questão parcial para uma exclamação, por exemplo, podendo chegar a uma taxa concordância de até 100% na percepção dos sujeitos.
No âmbito do sistema DaTo, na observação de dados de fala espontânea, o contorno descendente representado pelo rótulo vLH foi relacionado à expressão de incredulidade, porém, o mesmo contorno, quando associado a uma maior duração pode estar associado à expressão de duração de eventos temporais (LUCENTE, 2020).
Essa variação local da curva melódica que leva à percepção de diferentes funções pragmáticas não é apenas um desafio de representação para os sistemas de notação, mas também para a implementação da entoação em sistemas de síntese de fala, pois consiste em variações finas dentro de padrões gerais, que precisam ser extensamente avaliadas e submetidas a teste de percepção para serem implementadas. Em Pierrehumbert (2010) a autora evidencia um problema redundante na implementação da informação pragmática em sistemas de síntese de fala por meio da entoação. Segundo ela pelo fato da informação pragmática ser central no sucesso dos diálogos, mas muito pouco marcada segmentalmente, a entoação tem potencial para desempenhar um papel central na marcação pragmática em sistemas interativos. Contudo, progressos consideráveis na formalização e inferências pragmáticas são necessários para tornar isso possível. Este é um dos objetivos no desenvolvimento de sistemas de notação entoacional: a possibilidade de implementação dos padrões observados na síntese de fala.
Uma área que ainda necessita de mais estudo é a da percepção da entoação em termos de parâmetros fonéticos, para um melhor entendimento de como ocorre o processamento fonético da entoação pelos ouvintes. Um trabalho nesse sentido foi realizado com o Mandarim (CHEN, EVANS e LEE, 2015) na avaliação perceptiva de pitch accents H por meio de eletroencefalografia. O experimento reportado mostrou que mecanismos de modulação de atenção são acionados quando os ouvintes são expostos a subidas repentinas da f0 na fala.
A ver as novidades futuras na área.
Referências
HSU, C., EVANS, J.P., LEE, C. “Brain responses to spoken F0 changes: Is H special?”. Journal of Phonetics, 51, 82-92, 2015.
COUPER-KUHLEN, Elizabeth. An Introduction to English Prosody. Tübingen: Niemeyer, 1986.
BARBOSA, P. A. Prosódia. Paráboa, São Paulo, 2019.
BOTINIS, A., GRANSTROM, B., MOBIUS, B. Developments and paradigms in intonation research. Speech Communication 33, p. 263-296, 2001.
HIRSCHBERG, J. Communication and prosody: Functional aspects of prosody. Speech Communication 36, pp. 31-43, 2002.
HIRSCHBERG, J. GROSZ, B. J. Intonational features of local and global discourse structure. In Proceedings of the Workshop on Speech and Natural Language, p. 23-26, 1992,
HIRST, D.,DI CRISTO, A. A survey of intonation systems. In: Hirst, D. e Di Cristo, A. Intonation systems: A survey of twenty languages. Cambirdge Univesity Press, 1998.
LADD, D. R. Intonational Phonology. Cambridge: Cambridge University Press, 1996 LEHISTE, I. Suprasegmentals. Cambridge: MIT Press, 1970.
LUCENTE, L. Função comunicativa e alinhamento de contorno entoacional descendente. Anais do I Congresso Brasileiro de Prosódia, v1, p 31-34, 2020.
____________ Introdução à análise entoacional. In: Freitag, R. M. K. e Lucente, L. Prosódia da fala: pesquisa e ensino. São Paulo, Blucher, p. 7-26, 2017.
____________ Aspectos dinâmicos da fala e da entoação do português brasileiro. Ph.D. Thesis, Unicamp, 2012.
___________ DaTo: Um sistema de notação entoacional do português brasileiro baseado em princípios dinâmicos. Ênfase no foco e na fala espontânea. Dissertação de Mestrado. Unicamp, 2008.
MORAES, J. A. Fonética, fonologia e a entoação do português: a contribuição da fonologia experimental. Diadorim, Rio de Janeiro, Especial, p. 8-30, 2016.
MORAES, J. A. Thee pitch accents in Brazilian Portuguese: analysis by synthesis”. Proceedings of the Speech Prosody 2008: Fourth Conference on Speech Prosody, Campinas, 2008, pp. 389-397.
PIERREHUMBERT, J. Prosody, intonation and speech technology. In Bates, M, e Weishedel, R. M. Challenges in natural langueg processing. Cambrigde, Online publication, 2010.
_______________ . The Phonology and Phonetics of English Intonation. PhD. Thesis, MIT, 1980.
SILVERMAN, K., BECKMAN, M., PITRELLI, J., OSTENDORF, M., PIERREHUMBERT, J., HIRSCHBERG, J., PRICE, P. “TOBI: A Standard Scheme for Labeling Prosody”. Proceedings of the International Conference on Spoken Language, 1992.
XU, Y. Speech prosody as articulated communicative functions. In Proceedings of Speech Prosody 2006, Dresden, Germany, 2006.
_____ Speech melody as articulatorily implemented communicative functions. Speech Communication 46, p. 220-251, 2005.
Referências Introdutórias
BILINGER, D. Intonation and its parts. Stanford University Press, 1986
BOTINIS, A., GRANSTROM, B., MOBIUS, B. Developments and paradigms in intonation research. Speech Communication 33, p. 263-296, 2001.
CRUTTENDEN, A. Intonation. Cambridge University Press, 1986.
GUSSENHOVEN, C. The phonology of tone and intonation. Cambridge University Press, 2004.
GUSSENHOVEN, C, and CHEN, A. The Oxford Handbook of Language Prosody. Oxford University Press, 2020
HIRST, D., DI CRISTO, A. A survey of intonation systems. In: Hirst, D. e Di Cristo, A. Intonation systems: A survey of twenty languages. Cambirdge Univesity Press, 1998.
LADD, D. R. Intonational Phonology. Cambridge: Cambridge University Press, 1996
LEHISTE, I. Suprasegmentals. Cambridge: MIT Press, 1970.
PIERREHUMBERT, J. The Phonology and Phonetics of English Intonation. PhD. Thesis, MIT, 1980.
Para de aprofundamento
BARNES, J., MIXDORFF, H., NIEBUHR, O. Phonetic Variation in Tone and Intonation Systems. In: Gussenhoven, C, and Chen, A. (eds) The Oxford Handbook of Language Prosody. Oxford University Press, 2020
LUCENTE, L. Aspectos dinâmicos da fala e da entoação do português brasileiro. Ph.D. Thesis, Unicamp, 2012.
MORAES, J. A. Fonética, fonologia e a entoação do português: a contribuição da fonologia experimental. Diadorim, Rio de Janeiro, Especial, p. 8-30, 2016.
NIEBUHR, O., REETZ, H., BARNES, J., YU, A. Fundamental aspects in the perception of f0. In: Gussenhoven, C, and Chen, A. (eds) The Oxford Handbook of Language Prosody. Oxford University Press, 2020
XU, Y. Speech melody as articulatorily implemented communicative functions. Speech Communication 46, p. 220-251, 2005.