Recebi, com muita honra, o convite desafiador da Associação Luso-Brasileira de Ciências da Fala (Luso-Brazilian Association of Speech Sciences) para escrever o verbete sobre “Anatomia e Fisiologia da Voz”. Certamente, as temáticas relacionadas às áreas básicas não fazem jus ao seu adjetivo (“básica”), mas nos impõe a árdua missão de sintetizar, da maneira mais clara e coerente possível, a complexa trama subjacente ao sinal acústico que chega aos nossos ouvidos, é processado e ganha sentido no nosso cérebro. Embora pareça redundante, gostaríamos de partir de um ponto comum da nossa compreensão do que estamos chamando de “voz” neste ensaio. Consideramos aqui a voz enquanto a produção sonora advinda da interação entre o fluxo aéreo pulmonar e o mecanismo de vibração laríngea (glótica), acrescido de ressonância nas estruturas supraglóticas (trato vocal).
Nós gostaríamos de ratificar a compreensão de que a voz é por natureza um fenômeno multidimensional, o que inclui em sua constituição aspectos biológicos, físicos, sociais, culturais, atitudinais, comportamentais, emocionais, linguísticos e estilísticos. Para alguns, pode parecer poético ou enviesado insistir nessa natureza, mas, necessariamente, gostaríamos de insistir nessa ideia de interconexão entre esses componentes, que se influenciam mutuamente e justificam a ampla variabilidade intra e inter-sujeitos.
Para este breve texto, consideramos a perspectiva de que o sistema de produção vocal envolve três elementos essenciais: o input, o mecanismo de controle e o output vocal (Jiang et al., 2000). Sendo assim, nos deteremos a abordar a anatomia e a fisiologia da voz a partir de incursões acerca do input e do mecanismo de controle da produção vocal, de maneira integrada, facilitando uma visão abrangente desse processo. Nós entendemos que para os propósitos deste ensaio, tal divisão facilita o acesso às informações principais para aqueles interessados no campo das ciências da fala, sem a necessidade de informações extenuantes acerca de estruturas do sistema respiratório ou digestório relacionadas à produção da voz, e que podem ser consultadas na literatura indicada.
A voz é produzida pela interação de estruturas que fazem parte do sistema respiratório (pulmões, laringe, cavidade nasal, por exemplo), digestório (faringe, cavidade oral, mandíbula, dentes e lábios, por exemplo) e do sistema nervoso (desde estruturas do encéfalo, medula espinhal até os nervos que conduzem o impulso elétrico aos músculos envolvidos). Obviamente, a voz é considerada um dos sinais biológicos mais complexos, por envolver um controle refinado e preciso de diferentes estruturas, e está entre os sinais mais úteis para monitorar estados mentais, intencionalidade e a própria saúde geral de um indivíduo. Sendo assim, praticamente todo o corpo pode influenciar a forma como a voz é produzida e seria exaustivo discorrer nesse sentido.
A laringe é o grande epicentro da produção da voz. Ela é uma estrutura formada por cartilagens (esqueleto laríngeo), mucosa e ligamentos, e influenciada por músculos que têm a sua origem e inserção na própria laringe (músculos intrínsecos) e por músculos que fazem a conexão da laringe com outras estruturas na região da cabeça, pescoço e tórax (músculos extrínsecos). De maneira geral, os músculos intrínsecos da laringe são responsáveis pelos movimentos de fechamento, abertura, alongamento, encurtamento e tensão longitudinal das pregas vocais. Dessa forma, a musculatura intrínseca tem um papel essencial no mecanismo de produção vocal, influenciando a vibração glótica e os parâmetros relacionados à qualidade vocal, frequência fundamental (F0) e intensidade. Por outro lado, os músculos extrínsecos participam da movimentação vertical (elevação e abaixamento) da laringe no pescoço e influenciam de modo mais indireto o posicionamento da laringe, a geometria da glote, a configuração das cavidades supraglóticas, assim como os parâmetros vocais citados anteriormente.
O principal papel da laringe é funcionar como um transdutor de energia aerodinâmica em energia acústica. Por esse motivo, escolhemos falar sobre a anatomia da voz a partir da noção de input vocal, ou seja, abordar as estruturas que, de maneira mais direta, afetam a transdução de energia aerodinâmica em energia acústica, que é transformada no trato vocal, irradiada pelos lábios e escutada como voz. O fenômeno denominado voz inclui dois processos: a fonação, especificamente relacionada ao referido processo de transdução na laringe, e a ressonância, que modifica e amplifica o som gerado pela laringe nas cavidades supraglóticas. Nesse sentido, de acordo com o modelo adotado neste texto, dividimos a abordagem anatômica do input e do mecanismo de controle da produção da voz a partir dos níveis subglótico, glótico e supraglótico.
Anatomicamente, a subglote corresponde à região limitada superiormente pelas pregas vocais, tendo como limite inferior a margem inferior da cartilagem cricóide. Em termos de input vocal, o principal conceito relacionado a essa região (mas não restrito à ela) é a pressão subglótica, que corresponde à pressão exercida pelo fluxo de ar abaixo das pregas vocais, devido à resistência ao fluxo de ar produzido pelo fechamento glótico.
A energia aerodinâmica necessária para a produção da voz é proveniente do fluxo aéreo dos pulmões durante a expiração. Em termos de estruturas anatômicas, a regulação do fluxo de ar expiratório é influenciado pelas propriedades elásticas dos pulmões (expansão e retração), pela atividade muscular dos músculos torácicos, abdominais e do diafragma. Durante a fonação, deve-se acrescentar a essas estruturas, as modificações na geometria da glote, as propriedades viscoelásticas das pregas vocais e o posicionamento dos articuladores como potenciais determinantes da pressão subglótica necessária para manter as pregas vocais justapostas na linha média e em vibração.
Dois conceitos também devem ser considerados no nível subglótico: o limiar de pressão fonatória (LPF) e a resistência glótica (RF). O LPF pode ser definido como a mínima pressão subglótica requerida para colocar as pregas vocais em vibração. O LPF pode ser afetado pelo grau de aproximação e viscoelasticidade das pregas vocais. Por exemplo, pregas vocais com maior grau de constrição mediana ou com lesões teciduais com aumento de massa (tais como os nódulos ou “calos” vocais) podem exigir um maior LPF e esforço respiratório para iniciar a vibração das pregas vocais.
A RF corresponde à razão entre a pressão subglótica e o fluxo de ar transglótico. Dessa forma, a manutenção das pregas vocais justapostas na linha média (em adução), a geometria da glote e a duração da fase fechada dos ciclos glóticos são os principais fatores determinantes da RF.
Classicamente, a glote corresponde ao espaço entre as pregas vocais. Sendo assim, quando consideramos a região glótica como um dos “andares” da laringe, incluímos as pregas vocais e toda a sua estrutura como principal elemento para descrição da glote. O modelo corpo-cobertura proposto por Hirano (1996) define a constituição das pregas vocais em três camadas: 1) Cobertura - que inclui o epitélio que recobre as pregas vocais e a camada superficial da lâmina própria (CSLP); 2) Transição - camadas intermediária (CILP) e profunda da lâmina própria (CPLP); 3) Corpo - músculo vocal (músculo tireoarinetóideo). A partir dessa estrutura de camadas podemos compreender que as CSLP, CILP e CPLP fazem parte da estrutura mucosa das pregas vocais. Especificamente, a CSLP é mais frouxa e flexível, o que possibilita uma maior vibração durante a fonação e no processo de sonorização dos fonemas vozeados de uma língua, por exemplo. A CILP e a CPLP formam o ligamento vocal, cuja função é permitir o acoplamento entre a estrutura mais frouxa da CSLP e o corpo das pregas vocais (músculo vocal), sendo esse último responsável por dar sustentação e estabilidade ao mecanismo de vibração glótica. É essa estrutura trilaminar das pregas vocais que permite a produção de sons quase periódicos pela laringe, primordial na determinação da qualidade vocal e na definição dos segmentos vozeados de uma língua.
Nesse contexto, a energia aerodinâmica advinda do fluxo de ar pulmonar é transduzido em energia acústica no nível da glote, por meio do mecanismo de vibração glótica, também chamado de ciclos glóticos. O número de vibrações das pregas vocais por segundo (ciclos glóticos) correspondem à F0 da voz em Hertz (Hz). Além disso, as propriedades biomecânicas das pregas vocais interagem com os fatores aerodinâmicos e influenciam a F0, entre elas, a massa, a tensão e a viscosidade (resistência do tecido das pregas vocais à deformar-se para entrar em vibração). Como o objetivo do presente texto é discorrer sobre aspectos anatômicos e fisiológicos da voz, não nos aprofundaremos nos aspectos físicos citados e que podem ser consultados na literatura indicada ao final.
Antes de avançar para uma discussão acerca do processo de ressonância que ocorre nas cavidades supraglóticas, gostaríamos de destacar dois pontos em relação à fisiologia da produção vocal: 1) Embora a explicação sequencial do mecanismo de produção pareça um processo linear, inegavelmente, o sistema de produção vocal pode ser caracterizado como um sistema dinâmico não linear. Dessa forma, esse sistema é altamente sensível às modificações no mecanismo de controle, sejam eles aerodinâmicos ou biomecânicos, o que significa que mínimas modificações nessas condições podem ocasionar mudanças significativas no output vocal; 2) O efeito “many-to-one” sempre deve ser considerado para evitar reducionismos nas explicações acerca da anatomia, da fisiologia e do output vocal. Por esse efeito, entende-se que as mesmas variáveis anatômicas e fisiológicas podem produzir diferentes efeitos no output vocal, assim como o mesmo output vocal pode ser produzido a partir de diferentes ajustes anatômicos e fisiológicos.
O som produzido pelas pregas vocais é transformado (filtrado) e amplificado na supraglote (região imediatamente superior às pregas vocais) ou trato vocal supraglótico, o que inclui a própria laringe, faringe, cavidade oral e cavidade nasal. As modificações no posicionamento dos articuladores e na configuração geométrica das cavidades supraglóticas provocam dois tipos de efeitos: afetam o mecanismo de vibração das pregas vocais, por afetar a relação entre a pressão subglótica e supraglótica; modificam as características do som produzido pela glote, reforçando ou abafando determinadas frequências, o que determina o timbre e a clareza da qualidade vocal.
De modo sintético, apresentei os principais componentes relacionados à anatomia e fisiologia da voz, a partir de uma perspectiva relacionada ao input, mecanismo de controle e suas repercussões no output vocal. Reitero a natureza dinâmica e não linear dos processos de produção vocal e sua sensibilidade a uma diversidade de fatores apontados anteriormente. Nesse sentido, qualquer análise reducionista ou estabelecimento de relação causal entre a voz e os aspectos anatômicos e fisiológicos subjacentes deve ser ponderada, dada a reconhecida variabilidade na produção intra e inter-sujeitos.
Referências Indicadas
Barbosa, PA., Madureira, S. Manual de fonética acústica experimental: aplicações a dados do português. São Paulo: Cortez, 2015. 591p.
Beck, JM. The vocal tract as resonator. In: Hewlett, N., Janet, J.M. Introduction to the science of phonetics. Lawrence Erlbaum Associates, Inc., 2006. p. 239-306.
Behlau, M., Azevedo, R., Madazio, G.., Pontes, P. (2001). Avaliação de voz. In M. Behlau (Ed.), Voz: O livro do especialista (pp. 83–172). Revinter.
Buchaillard, E., Perrier, P., Payan, Y. A biomechanical model of cardinal vowel production: muscle activations and the impact of gravity on tongue positioning. Journal of the Acoustical Society of America, 126(4), 2033-2051, 2009.
Fant, G. Acoustic Theory of Speech Production. 2ª ed. Paris: Mouton, 1970.
Fitch, W. T., Neubauer, J., & Herzel, H. Calls out of chaos: The adaptive significance of nonlinear phenomena in mammalian vocal production. Animal Behaviour, 63(3), 407–418, 2002.
Jiang, J., Lin, E., & Hanson, D. G. Vocal fold physiology. Otolaryngologic Clinics of North America, 33(4), 699–718, 2000.
Sataloff, RT. Clinical anatomy and physiology of the voice. ______. Professional voice - The Science and Art of Clinical Care. 2a ed. San Diego: Singular, 1997.
Titze, I. Principles of voice production. Prentice Hall, 1995.
Zhang, Y. et al. A biphasic theory for the viscoelastic behaviors of vocal fold lamina propria in stress relaxation. Journal of the Acoustical Society of America, 123 (3), 1627-1636, 2007.