Neste verbete detalhamos como os processos emocionais, entendidos como um conjunto de processos cognitivos fundamentais para o comportamento animal, podem ser utilizados convencionalmente para formar expressões ditas “atitudinais”, selecionando traços vocais e visuais de expressividade emocional para fins comunicativos. Para aprofundar mais sobre os níveis de convencionalização e classificação de atos de fala recomendamos a leitura do verbete “Prosódia e Pragmática” (RASO, 2024).
As emoções são processos psicológicos complexos que acompanham o desenvolvimento filogenético (fenômeno evolutivo) do qual resultaram as atuais espécies animais (BELZUNG; PHILIPPOT, 2007). Esses processos emocionais permitem que um individuo possa reagir a um estimulo novo num contexto especifico. Por isso, ao identificar um evento novo ou não esperado, imediatamente o avaliamos como agradável ou desagradável (em termos de valência). Esse evento com uma valência particular (positiva ou negativa) vai depois ser avaliado por ser relevante (ou não) e conducente (ou não) em relação a nossos objetivos. Dessas avaliações deriva a construção da resposta emocional que temos que dar (ou não) a esse evento. Se avaliarmos que é possível agir para impedir o acontecimento relacionado ao evento, ou seja que temos a capacidade para superar esse evento, ou, ao contrário, se avaliarmos que não podemos impedir ou combater esse evento, as ações resultantes dessa avaliação serão diametralmente opostas. Um exemplo prototípico é a preparação para o combate diante de um adversário menos potente, ou a preparação para a fuga, no caso de um adversário mais potente. Assim, esse processo de avaliação emocional vai nos direcionar para alguma tendência à ação (“action tendency” ou “action readiness”, FRIJDA, 2016). Uma última etapa da avaliação seria a de decidir se o evento combina com as nossas normas pessoais e culturais. A série de avaliações diante de um evento é o que constitui os chamados processos emocionais (SCHERER, 2009), fenômenos que podem ser vistos como possibilidades de adaptação, mais ou menos rápidas (pois algumas avaliações são reflexos instantâneos, enquanto que outras são processos mais demorados) diante de situações que estão sempre evoluindo / mudando e às quais precisamos reagir ou nos adaptar.
Nosso comportamento é induzido pela sequência de avaliações emocionais, a reação emocional, que vamos produzir diante de um determinado evento é o que constitui a “expressão emocional”. Tais expressões emocionais são perceptíveis: se vê um franzimento das sobrancelhas ou um sobressalto, se ouve uma voz forte ou fraca, ou um grito. Tais índices de uma reação emocional em um individuo são percebidos por observadores que podem inferir qual foi a emoção ressentida, e eventualmente agir em função dessa reação.
O processo emocional tem em primeiro lugar uma função adaptativa do individuo ao contexto, entretanto, as expressões emocionais são características e desenvolvem, além dessa função adaptativa, uma função comunicativa, de interação. Se a minha mãe expressa medo, talvez algo perigoso ou ruim esteja acontecendo, é urgente ver do que se trata; se ela expressa raiva, talvez eu tenha feito alguma bobagem. Nessa dimensão comunicativa, a expressão de um estado emocional se constitui enquanto fenômeno social, utilizado pelo grupo.
Como já foi dito inicialmente, as emoções se constroem ao longo do processo evolutivo dos animais (que vai muito além dos mamíferos) de acordo com a proposta de Darwin (1872); sendo assim, as emoções não são uma especificidade humana, sendo resultantes desse processo de evolução. São adaptações que permitem melhorar as chances de sobrevivência no meio ambiente. Por isso, alguns tipos de processos emocionais podem ser ativados muito rapidamente, como um reflexo. Esses seriam processos inatos, automáticos, que servem de base ao desenvolvimento ontogenético (durante a vida de uma pessoa) de outras capacidades emocionais mais complexas com as experiências de cada um. Por serem inatos, esses aspectos das emoções são comuns a todos os seres humanos.
Muito trabalhos mostraram que as características das expressões faciais e vocais típicas de tais programas emocionais básicos podem ser identificados por pessoas das mais diversas origens culturais. Outros trabalhos não concordam com essa visão e defendem a ideia de que há variação entre expressividade emocional de uma cultura por uma outra. Também, as palavras utilizadas para nomear as emoções variam entre línguas e culturas, algumas línguas não têm nenhuma palavra para certas emoções ditas básicas o que nos leva a questionar essa ausência em termos de questionamento do próprio fazer científico: será que essas escolhas de emoções ditas básicas são um artefato da ciência e da descrição científica que vem sendo feita sobretudo em inglês? Como podemos afirmar que essas emoções são universais? O debate sobre esse assunto já é antigo e continua bastante polêmico.
Vimos que as avaliações dentro do processo emocional (os “appraisals”) foram observadas não só em seres humanos, mas também em animais, entretanto com avaliações mais complexas só em animais cognitivamente mais complexos. Portanto, esses processos parecem ser em boa medida compartilhados por todos os seres humanos. Mas de onde vem então essa variação na expressão de emoções? Podemos dizer que os processos de avaliação “empurram” a expressão emocional, provocando inclusive mudanças fisiológicas no corpo – enquanto que outros níveis cognitivos podem criar efeitos que “puxam” essa expressão emocional para se conformar às normas culturais, ao contexto social, e à intenção estratégica do individuo. Por exemplo, eu estou sentindo medo desse cachorrinho, mas não quero mostrar para não passar vergonha. As emoções que podem, ou devem, ser demostradas em publico variam em diferentes culturas (em algumas culturas, um homem não pode chorar, mas a imagem social dele pode ser comprometida e ele pode ser percebido como insensível por pessoas de outras culturas se ele não chorar no velório da mãe, por exemplo). Essa variação também depende dos tipos de grupos sociais dos quais uma pessoa faz parte e onde e com quem está no momento de chorar (na família, no trabalho, no futebol).
Esses dois tipos de efeitos, em inglês efeitos “push” - para empurrar - e “pull” - para puxar - fazem parte da proposta teórica de Scherer (2009) que procura explicar a complexidade das manifestações das expressões emocionais. Essas expressões dependem em parte da sequência de avaliações da situação (efeitos push), e em parte das escolhas pessoais, do que a pessoa deseja manifestar desse sentido emocional, considerando o que é bom ou permitido mostrar em publico nessa sociedade (efeitos pull), mas também do que ela deseja mostrar de si mesma para as pessoas presentes, de acordo com as noções de face e de polidez do seu grupo. Cada um de nós gerencia e cuida da sua imagem social e da imagem dos outros constantemente em nossas interações sociais cotidianas. Sobre face, polidez e interações sociais, ver a trabalho seminal de Brown e Levinson (1987). Para uma discussão mais a fundo da universalidade das emoções, ver Scherer et al. (2011).
A sequência de avaliações que constrói o processo emocional leva a mudanças fisiológicas no corpo da pessoa que sente essa emoção: muda a tensão muscular, o ritmo cardíaco, a apertura da pupila, etc. Existem modelos teóricos que predizem quais mudanças podem ser esperada em função das sequências de appraisals (SCHERER, 2009). Eles nos dizem por exemplo que na avaliação de um evento novo e não esperado, para avaliar a relevância dele, se produz um foco de atenção nesse evento, que se traduz (entre outros) por um direcionamento do olhar, junto com a dilatação das pupilas, a abertura das pálpebras e o levantamento das sobrancelhas. Funcionalmente, tais modificações servem para ver melhor; mas também constituem elementos característicos da expressão visual chamada de “surpresa” em português, que prototipicamente acontece frente a um evento inesperado. Outro exemplo pode ser dado em relação à avaliação da possibilidade de enfrentamento (o “coping potential”), ou seja, a avaliação da nossa capacidade de superar um evento desagradável. Se for possível superar tal evento, a pessoa se orienta na direção de um comportamento dominante, que se traduz fisiologicamente, entre outros, com uma respiração ampla e uma fonação forte, com um fluxo de ar importante, mas uma frequência fundamental baixa – isso produz a voz ampla e forte típica do que pode ser chamado de “raiva” em português.
Assim, as mudanças fisiológicas ligadas ao processo emocional podem explicar porque nossa voz tende a ser mais aguda numa situação que leva ao sentimento de medo, pois nesse caso a musculatura do trato vocal tende a ser mais tensa. Ou, ao contrario, temos uma voz fraca, baixa e mais soprosa no relaxamento muscular relacionada ao sentimento de tristeza. As reações emocionais têm a função principal de ajudar a produzir reações adequadas numa determinada situação; elas não são feitas para comunicar nosso sentido emocional. Por tanto, a reprodutibilidade desse comportamento como reação a situações similares explica a nossa capacidade de identificar, entender, o processo emocional sentido por uma outra pessoa – pois as manifestações (gestual e vocal, a “expressão” emocional que constitui esse comportamento) são similares às que nós mesmos produzimos. Entretanto, em algumas situações sociais, essas manifestações emocionais – e o correlato do que as outras pessoas possam perceber como um sentimento emocional particular – não são desejáveis. Por isso aprendemos a controlar as reações emocionais em função do contexto: são os efeitos “push” que foram apresentados na parte anterior.
Uma vez que sabemos, e controlamos, quais características levam outras pessoas a perceber que estamos sentindo um afeto em particular (que estamos estressados, com medo, com raiva etc.), também se torna possível imitar (produzir de maneira voluntária) essa expressão emocional – sendo desta vez para fins comunicativos mesmo. É possível decidir se vamos mostrar (fingir) nosso sentimento de medo, raiva, tristeza, etc. numa situação especifica, pois é bom pra nós: pode ser bom para nossa face social demonstrar tristeza num velório (mesmo se não gostarmos do falecido); a expressão de raiva em algumas situações pode servir para demonstrar a nossa autoridade. Essa capacidade de imitação das expressões emocionais é fundamental para interagir na sociedade; também é uma das características de bons atores – que conseguem exprimir emoções variadas, à vontade. Para saber mais sobre esses diferentes níveis de controles das emoções e o papel delas na cognição e na interações sociais, vale a pena ler o trabalho de Damásio (2021).
O processo emocional, como fonte de comportamentos regulares e identificáveis, pode ser utilizado para construir significados e comunicar socialmente com outras pessoas, ou mesmo com outros animais (um cachorro entende perfeitamente se alguém está com raiva). Esses comportamentos envolvem o corpo todo: as expressões emocionais são tipicamente multimodais, sendo expressas pelas expressões faciais, pelos gestos e pela postura do corpo, bem como pelas variações da qualidade de nossa voz que pode ser mais aguda, mais grave, mais forte, soprosa ou rouca (ver a verbete sobre “voice quality”; ERICKSON, 2021). Essas variações recorrentes das expressões emocionais são reutilizadas para desenvolver comportamentos prototípicos que permitem a interação entre animais. Elas têm sentidos pois veiculam informações como “cuidado, estou com raiva, posso atacar se não fugir ou mudar de comportamento, sou dominante”, ou, ao contrário, “calma, estou com medo, sou submisso”. A recorrência de tais padrões comunicativos (agressivo, dominante vs. manso, submisso) no reino animal levou Morton (1977) a descrever similaridades marcantes entre gritos dominantes e entre gritos submissos produzidos por muitos mamíferos e aves. Esse trabalho foi retomado por Ohala (1994) para formular a hipótese teórica de um “código de frequência” (o “Frequency code”) utilizado simbolicamente para comunicar nessa dimensão de dominância-submissão. O raciocino é assim: animais dominantes tendem a ser mais fortes e maiores que os outros; animais maiores tendem a ter uma voz de tom mais baixo, mais grave. Então, se eu abaixo o tom de minha voz, eu vou parecer maior, e possivelmente mais potente, perigoso, agressivo. Ao contrário, se eu uso uma voz mais alta, fina, eu vou parecer pequeno, menos, mais fraco, submisso, não agressivo. Desse código simbólico derivam muitas variações expressivas utilizadas para a comunicação no dia a dia. As mais marcantes são a tendência recorrente a utilizar vozes de tom mais baixo / forte (com maior intensidade) para marcar autoridade e assertividade. Ou, ao contrário, usar uma voz de tom mais alto, mais aguda, para marcar polidez ou interrogação. Uma outra consequência seria a explicação de porque o sorriso é considerado um gesto positivo, simpático, de conciliação, mesmo se na sua realização precisamos mostrar os dentes (o que, em si, é agressivo). Pois bem, esticar os lábios reduz o tamanho do trato vocal, e faz a voz soar mais aguda, menos agressiva. O sorriso seria, portanto, um gesto motivado auditivamente segundo essa teoria do frequency code.
Por serem comportamentos regulares e reproduzíveis, que podem ser atuados/imitados, essas expressões emocionais passam a ser também utilizadas social e culturalmente. Alguns desses processos emocionais, numa cultura particular, podem passar a ter um papel mais importante, passando por um processo similar ao processo descrito pela teoria do Frequency code, ou seja, algumas expressões emocionais serão convencionalizadas dentro de um grupo social particular. Esse processo leva à seleção de alguns traços mais relevantes, que expressam algumas características do processo emocional original, para denotar o comportamento prototípico selecionado por esse grupo. Algumas dessas convencionalizações podem ser descritas. A expressão chamada de “surpresa” pode ser um processo emocional completo, mas também é usada para marcar um ato de fala que veicula um estranhamento simples – tipo: “Está comendo camarões!? (mas tinha me dito que era alérgico)”. Na expressão desse ato, é bem possível que as sobrancelhas da pessoa se levantem, e que a voz seja aguda com entoação crescente. São traços também compartilhados com a expressão emocional relacionada a um evento inesperado (veja acima), mas nem todos os traços estarão presentes: por exemplo, não haverá mudanças fisiológicas, tipo mudança do ritmo cardíaco. Alguns traços relevantes foram selecionados para manifestar de maneira eficaz uma mensagem mais complexa do que é expressa somente pelo nível lexical: uma transcrição completa da frase acima com a expressão de surpresa seria “eu não acredito que você está comendo camarões”. Para ler mais sobre o processo de convencionalização e comparação de diferentes tipos de ato de fala em português do Brasil, ver os trabalhos de de Moraes e Rilliard (2014, 2016)
Em vários trabalhos interculturais, foi possível demonstrar que as expressões chamadas de “surpresa” no português do Brasil, ou que correspondem a situações similares em outras culturas e línguas, compartilham as características acima descritas, e são bem identificadas. Traços convergentes também foram escolhidos para produzir expressões prosódicas que vão transmitir um sentido de surpresa em várias línguas. Entretanto, outras expressões são especificas de uma dada cultura. Em cada cultura, conceitualizações especificas foram desenvolvidas para designar determinada situação ou expressão que responde a um conjunto de características pouco observadas em outras culturas – nestes casos agrupadas sob determinados termos, ou etiquetas vocabulares: é o caso famoso do conceito de “saudade”. Tais termos são problemas de tradução por serem considerados como culturalmente marcados.
Essa questão da tradução e da equivalência entre etiquetas utilizadas / selecionadas pelas línguas para designar expressões emocionais em descrições científicas é um problema metodológico importante que deve ser levado em consideração sempre. Como já vimos, as palavras utilizadas nas línguas naturais para nomear emoções não são as mesmas – mesmo se as diversas ciências das emoções concordam em dizer que são processos universais. Isso vale também para os nomes das cores que variam entre culturas e línguas, ainda que o espectro luminoso visível seja o mesmo para todos. Nomes das cores também variam entre falantes da mesma língua e em diferentes grupos sociais: especialistas trabalhando com cores têm um vocabulário bem mais amplo, e preciso, do que as outras pessoas; ou ainda, torcedores do fluminense diferenciam bem o vermelho do grená. A necessidade de fazer distinções cria oportunidade para utilizar traços. Isso também acontece no âmbito das expressões emocionais e no seu processo de convencionalização para uso comunicativo dentro de um determinado grupo social.
Um exemplo de convencionalização culturalmente especifico de uma atitude prosódica é a expressão chamada de “kyoshuku” (恐縮) em japonês, que se traduz literalmente como “medo atrofiado” pois a pessoa deseja se “atrofiar” para mostrar medo / respeito por uma pessoa superior na escala social, no momento da realização deste ato de fala. Para expressar essa atitude (que pertence ao espectro das estratégias de polidez na visão de Brown e Levinson (1987): o kyoshuku pode ser descrito como uma estratégia comunicativa para “ungir a face” ou procurar não aborrecer, o interlocutor, mostrando o sofrimento que se sente ao fazer esse pedido), foram escolhidos traços relacionados ao medo e ao sofrimento, com franzimento de sobrancelhas e uma voz áspera, rouca. Tais traços vocais não foram selecionados nem pela cultura brasileira nem por outras culturas, para expressar comportamentos ditos de polidez (ou cortesia). Apresentando este ato de fala japonês de forma isolada, sem contexto, ou proposto como escolha expressiva possível para uma determinada finalidade, esse tipo de qualidade vocal (voz áspera, rouca) é relacionado por pessoas de culturas ocidentais a comportamentos negativos e dominantes. Entretanto, uma vez contextualizado, por exemplo com apresentações audiovisuais nas quais a expressividade facial expressa (também) dor, e com uma posição corporal típica de polidez (para mais detalhes sobre a multimodalidade da fala, ver a verbete sobre o assunto; RILLIARD, 2020) – as pessoas que não conhecem a cultura japonesa mudam sua interpretação inicial da qualidade de voz, alinhando-se com interpretações mais próxima à polidez (para mais detalhes sobre isso, ver os trabalhos de Shochi et alii, 2020; 2023).
Assim, o processo de convencionalização de atitudes prosódicas consiste numa escolha de traços originalmente relacionados ao processo emocional –universal– que introduz escolhas diferentes entre culturas, em alguns casos. Essa variação expressiva pode parecer estranha, e certamente marca comportamentos culturalmente marcados, mas não necessariamente leva a uma interpretação comunicativa errada. A expressão de kyoshuku leva, quando analisada em contexto, as pessoas ocidentais a tecerem interpretações no espectro da polidez, pois os conceitos de polidez têm uma certa concordância ou convergência (ver descrição acima). Ao contrário dessas expressões culturalmente marcadas, as expressões atitudinais podem ser perfeitamente identificadas (são estratégias comunicativas que estão compartilhas entre culturas), mas podem resultar em graves problemas interacionais, chegando até à violência física, se os conceitos tiverem valores comunicativos opostos. É o que acontece, por exemplo, com o conceito de “ironia”, que exemplifica muito bem o problema do uso de etiquetas e suas traduções nas comparações interculturais, problema levantado há muito tempo já pelos trabalhos de Wierzbicka (1985, 1986, 2008). Assim, a palavra “ironia” tem traduções simples e diretas em muitas línguas, ao contrario de “saudade” ou “kyoshuku”. Mas é esse fato mesmo o que pode levar a dificuldades e confusões interacionais, o conceito cultural de ironia confunde mais do que o uso dos traços simbólicos escolhidos dentro dos processos de seleção cultural. Isso se deve ao fato de que a tradução do conceito transmitido por um ato ade fala irônico, tal como Wierzbicka bem demonstra, em muitos casos não transmite exatamente os mesmos traços cognitivos nas duas culturas. “Irony”, em inglês, veicula traços positivos: tem um lado brincalhão na escolha de uma estratégia comunicativa irônica, que pode ser escolhida especificamente para aliviar uma situação tensa. É uma estratégia de mitigação que funciona bem na cultura dos Estados Unidos. Agora, o conceito de ironia na cultura japonesa não é positivo, mas sim negativo: a ironia é percebida com um ato impolido, um “ataque à face” do interlocutor, uma intensificação do enfrentamento, utilizando-se como equivalente do sarcasmo (sobre impolidez, ver Culpeper et alii, 2003). O ato é bem identificado, mas as valores culturais, que regem as regras de interação, são diferentes nas duas culturas (IDE, 2002). O interlocutor japonês se sente agredido na escolha da estratégia comunicativa irônica (que intensifica o conflito e não o atenua), o que pode inclusive resultar em uma reação violenta.
Neste verbete foram descritos os processos que relacionam a expressividade do fenômeno emocional, com o uso convencionalizado desses traços expressivos nas praticas comunicativas orais, dentro da multimodalidade de nossas interações verbais. Esses processos suscitam muitas questões, por exemplo para o ensino de línguas estrangeiras, já que a prosódia e todos os processos multimodais de interação configuram uma parte fundamental da interação dialógica, que é pouco considerada no ensino e na representação da língua por não ser transcrita.
BELZUNG, C.; PHILIPPOT, P. Anxiety from a Phylogenetic Perspective: Is there a Qualitative Difference between Human and Animal Anxiety? Neural Plasticity, v. 2007, p. 1–17, 2007.
BROWN, P.; LEVINSON, S. C. Politeness: some universals in language usage. Cambridge [Cambridgeshire]; New York: Cambridge University Press, 1987.
CULPEPER, J.; BOUSFIELD, D.; WICHMANN, A. Impoliteness revisited: with special reference to dynamic and prosodic aspects. Journal of Pragmatics, v. 35, n. 10–11, p. 1545–1579, out. 2003.
DAMÁSIO, A. R. O erro de descartes: emoção, razão e o cérebro humano. Tradução: Dora Vicente; Tradução: Georgina Segurado. [s.l.] Companhia das Letras, 2021.
DARWIN, C. The expression of the emotions in man and animals. London: John Murray, 1872.
DE MORAES, J. A.; RILLIARD, A. Illocution, attitudes and prosody: A multimodal analysis. Em: RASO, T.; MELLO, H. (Eds.). Studies in Corpus Linguistics. Amsterdam: John Benjamins Publishing Company, 2014. v. 61p. 233–270.
DE MORAES, J. A.; RILLIARD, A. Prosody and Emotion in Brazilian Portuguese. Em: ARMSTRONG, M. E.; HENRIKSEN, N.; DEL MAR VANRELL, M. (Eds.). Issues in Hispanic and Lusophone Linguistics. Amsterdam: John Benjamins Publishing Company, 2016. v. 6p. 135–152.
ERICKSON, D. Voice quality. Em: Speech Sciences Entries. [s.l: s.n.]. Disponível em: https://gepf.falar.org/entries/15
FRIJDA, N. H. The evolutionary emergence of what we call “emotions”. Cognition and Emotion, v. 30, n. 4, p. 609–620, 18 maio 2016.
IDE, S. The Speaker’s Viewpoint and Indexicality in a High Context Culture. Em: KATAOKA, K.; IDE, S. (Eds.). Bunka, Intaakushon, Gengo [Culture, Interaction, and Language]. Tokyo: Hitsuji Shobo, 2002. p. 3–20.
MORTON, E. S. On the occurrence and significance of motivation-structural rules in some bird and mammal sounds. The American Naturalist, v. 111, n. 981, p. 855–869, 1977.
OHALA, J. J. The frequency code underlies the sound-symbolic use of voice pitch. Em: HINTON, L.; NICHOLS, J.; OHALA, J. J. (Eds.). Sound Symbolism. 1. ed. [s.l.] Cambridge University Press, 1994. p. 325–347.
RASO, T. Prosódia e Pragmática. Em: Speech Sciences Entries. [s.l: s.n.]. Disponível em: https://gepf.falar.org/entries/54
RILLIARD, A. Fala e multimodalidade. Em: Speech Sciences Entries. [s.l: s.n.]. Disponível em: https://gepf.falar.org/entries/3
SCHERER, K. R. The dynamic architecture of emotion: Evidence for the component process model. Cognition & Emotion, v. 23, n. 7, p. 1307–1351, nov. 2009.
SCHERER, K. R.; CLARK‐POLNER, E.; MORTILLARO, M. In the eye of the beholder? Universality and cultural specificity in the expression and perception of emotion. International Journal of Psychology, v. 46, n. 6, p. 401–435, dez. 2011.
SHOCHI, T. et al. The combined Perception of Socio-affective Prosody: Cultural Differences in Pattern Matching. Journal of the Phonetic Society of Japan, v. 24, p. 84–96, décembre 2020.
SHOCHI, T.; RILLIARD, A.; ERICKSON, D. Chapter 8. Perceptual changes between adults and children for multimodal im/politeness in Japanese. Em: JUCKER, A. H.; HÜBSCHER, I.; BROWN, L. (Eds.). Pragmatics & Beyond New Series. Amsterdam: John Benjamins Publishing Company, 2023. v. 333p. 213–249.
WIERZBICKA, A. Different cultures, different languages, different speech acts. Journal of Pragmatics, v. 9, n. 2–3, p. 145–178, jun. 1985.
WIERZBICKA, A. Human emotions: universal or culture-specific? American Anthropologist, v. 88, n. 3, p. 584–594, 1986.
WIERZBICKA, A. Why there are no “colour universals” in language and thought. Journal of the Royal Anthropological Institute, v. 14, n. 2, p. 407–425, 2008.