Return to list
O sistema de notação ToBI
Flaviane Romani Fernandes Svartman | Departamento de Letras Clássicas e Vernáculas/FFLCH/USP

A língua falada não é constituída só por uma cadeia segmental composta por consoantes e vogais, mas também por elementos prosódicos (suprassegmentais) associados a essa cadeia, como tom e acento (ver os verbetes de SERRA, 2020 - Fonologia da Prosódia 2: tom e entoação e Fonologia da Prosódia 1: acento e ritmo). Assim, o fluxo da fala é organizado em agrupamentos dos segmentos em torno desses componentes prosódicos. A essa organização damos o nome de fraseamento prosódico. Um dos elementos relacionados à marcação dos agrupamentos prosódicos é a entoação (ver verbete de LUCENTE, 2021), sequência de tons que define a melodia da fala. De acordo com Ladd (2008, p. 4), a entoação se refere ao uso de características fonéticas suprassegmentais para transmitir significados pragmáticos no nível pós-lexical ou no nível da sentença de um modo linguisticamente estruturado.

O termo ToBI, formado a partir de Tones “tons” e Break-Indices “índices de quebra”, intitula um sistema de notação prosódica criado para a transcrição da entoação e de níveis de fraseamento prosódico de enunciados falados.

Originalmente, esse sistema de notação foi desenvolvido para dados de língua falada do Mainstream American English - MAE “inglês americano padrão” (BECKMAN; HIRSCHBERG, 1994), doravante, designado MAE_ToBI (BECKMAN; HIRSCHBERG; SHATTUCK-HUFNAGEL, 2005). Todavia, ele também começou a ser utilizado como referência para o desenvolvimento de sistemas de anotação prosódica de outras variedades do inglês e de outras línguas e que refletem necessidades particulares da língua ou variedade e posições teóricas de seus desenvolvedores, ver, por exemplo: Mayo, Aylett e Ladd (1997) para o inglês de Glasgow e Fletcher e Harrington (2001) para o inglês australiano; Venditti (1997) para o japonês; Arvaniti e Baltazani (2000) para o grego; Jun (2000) para o coreano; Beckman et al. (2002) para o espanhol; Gussenhoven (2005) para o holandês; Prieto et al. (2009) para o catalão; Khan (2014) para o bengali; Frota et al. (2015) para o português.

O MAE_ToBI foi desenvolvido em uma série de quatro eventos científicos de sessões de trabalho compostos por participantes representando diversas áreas do conhecimento como engenharia, psicologia, ciências da computação, fonética etc. Desses encontros, resultaram os materiais contendo as convenções e o material de treinamento para o uso do MAE_ToBI: Silverman et al. (1992), Beckman e Ayers (1994), Beckman e Hirschberg (1994) e Pitrelli, Beckman e Hirschberg (1994).

As convenções de transcrição de tons e das fronteiras de unidades prosódicas (junturas) do MAE_ToBI são baseadas, respectivamente, nos trabalhos de Pierrehumbert (1980), Ladd (1993) e Beckman e Pierrehumbert (1986) e nos trabalhos de Price et al. (1991) e Wightman et al. (1992).

Um registro completo de um enunciado, com base no MAE_ToBI, inclui seis partes: 1. uma gravação de áudio do enunciado (no formato wav, por exemplo) - Audio; 2. um registro eletrônico ou em papel do contorno da frequência fundamental - F0; 3. uma camada de transcrição autossegmental do contorno entoacional e outras marcações relacionadas aos tons - Tones “Tons”; 4. uma camada de transcrição ortográfica de cada palavra do enunciado, incluindo segmentações das palavras em intervalos de tempo marcado ao final dessas - Words “Palavras”;  5. uma camada de anotação de índices numéricos referentes ao grau de juntura percebido depois de cada palavra ortográfica - Break-Indices (BI) “Índices de quebra/juntura”; 6. uma camada de anotação de marcas de disfluência, comentários e outros eventos diversos - Misc (Misc), de miscellaneous events “eventos diversos”. Dessas seis partes, duas são registros fonéticos contínuos, o áudio do enunciado gravado, representado graficamente pelo oscilograma (e pelo espectrograma) (Audio), e a representação do contorno entoacional associado a esse enunciado (F0), e as outras quatro são camadas de símbolos, i. é., camadas de anotação, ordenadas verticalmente na seguinte sequência de cima para baixo: Tones, Words, BI e Misc.

Quanto às camadas de símbolos, cabem algumas considerações sobre as camadas Tones e BI. A camada Tones é destinada à transcrição dos eventos tonais do contorno entoacional e tais eventos são dos seguintes tipos: a) phrase accents “acentos frasais” - associados às fronteiras de nível 3 - H- (!H-), L-; b) boundary tones “tons de fronteira” - associados às fronteiras de nível 4 - H%, L% e %H (este último marginal, marcado no início de alguns sintagmas entoacioanais depois de pausa); c) pitch accents “acentos tonais” - associados a sílabas portadoras de proeminência - L*, H* (!H*), L+H* (L+!H*), L*+H (L*+!H), H+!H*; d) outros símbolos, como o diacrítico “!” antes de H (exemplos: !H*, L+!H*, !H), que marca o início da compressão da gama tonal (downstep), o diacrítico “?”, que marca incerteza sobre a ocorrência de algum tom, *?, -?, %?, ou marca a incerteza sobre o tipo de tom, X*?, X-?, X%?, “<”, que indica pico atrasado, “HiF0”, indicando o F0 máximo associado a H de um tom em um sintagma intermediário, e “%r”, marcando recomeço.

A camada BI contém a codificação numérica, indicando o nível da fronteira percebida para cada um dos rótulos da camada Words. No MAE_ToBI, há quatro valores básicos de índice de quebra, vários diacríticos e outros rótulos para fenômenos como, por exemplo, um alongamento segmental que indica quebra do contorno entoacional. Os índices numéricos básicos são os seguintes: 0 - juntura muito próxima entre palavras; 1 - fim de palavra comum interna ao sintagma; 3 - final de sintagma intermediário com acento frasal associado; 4 - final de sintagma entoacional com tom de fronteira associado. O índice 2 é utilizado para marcar fronteira de sintagma intermediário ou entoacional, quando há, por exemplo, alongamento marcando quebra do contorno entoacional, mas não há acento frasal e tom de fronteira associados, respectivamente, às fronteiras desses constituintes prosódicos. Os diacríticos da camada BI são “-”, indicando incerteza, por exemplo, 4- (fronteira percebida como intermediária entre 3 e 4), “p”, hesitação percebida, sendo que “1p" é utilizado para marcar “corte" (interrupção) e “2p” e “3p” são utilizados para marcar alongamento. As quatro camadas de anotação, Tones, BI, Words e Misc, juntamente com o áudio e a curva de F0 relativos ao enunciado a ser anotado, são partes obrigatórias para a notação do MAE_ToBI.

No que diz respeito ao ToBI aplicado ao português, temos o P_ToBI (FROTA et al., 2015), que é um sistema de transcrição da gramática entoacional e prosódica do português. Uma vez que esse sistema se utiliza de uma grande base de dados, composta por diversas variedades europeias e brasileiras (e também alguns dados sobre variedades africanas), ele abrange padrões específicos que fazem parte da fonologia da língua ou variedade. O P_ToBI representa o estado atual do conhecimento da gramática entoacional e prosódica do português, com base nos quadros teóricos em que é desenvolvido, Fonologia Autossegmental e Métrica para a abordagem da fonologia da entoação (PIERREHUMBERT, 1980; BECKMAN; PIERREHUMBERT, 1986; LADD, 1996; 2008; entre outros) e Fonologia Prosódica (SELKIRK, 1984, 1986, 2000; NESPOR; VOGEL, 1986, 2007). A Figura 1 consiste em um exemplo de enunciado da variedade de Coimbra (Portugal), anotado segundo os critérios do P_ToBI.

Figura 1 - Representação do enunciado declarativo neutro (foco amplo) “As mini-jóias encantam as empregadas.”, produzido por uma falante da variedade de Coimbra do português europeu, ao realizar uma tarefa de leitura, e anotado de acordo com os critérios do P_ToBI.

Fonte: Frota et al. (2015). Disponível em: https://labfon.letras.ulisboa.pt/InAPoP/P-ToBI/ToBI/ToBI_phr_pw.html. Acesso em 30 de maio de 2020.

Na Figura 1, são apresentados o áudio do enunciado representado pelo oscilograma (primeiro painel) e espectrograma (segundo painel), o registro do contorno da frequência fundamental (linha em preto do segundo painel) e três camadas de anotação: (i) primeira camada de anotação (de cima para baixo), na qual são transcritos os tons associados ao enunciado “As mini-jóias encantam as empregadas” – na Figura 1, são anotados o acento tonal nuclear H+L*, associado à sílaba tônica “ga” de “empregadas”, e L%, associado à fronteira direita do sintagma entoacional que contempla o enunciado completo; (ii) segunda camada de anotação, na qual cada palavra do enunciado é transcrita ortograficamente nos respectivos intervalos de tempo de produção; e (iii) terceira camada, onde aparecem as codificações numéricas relativas aos diferentes níveis de fronteiras associadas ao final das palavras da camada de transcrição ortográfica - na Figura 1, o índice 0 aparece associado à fronteira final do clítico prosódico “As”, o índice 1 é associado à fronteira final da palavra prosódia “mini-”, o índice 3 aparece associado à fronteira final do sintagma intermediário contendo “As” e “mini-jóias” e o índice 4 está associado à fronteira direita (final) do sintagma entoacional que contém o enunciado completo.

Em suma, as convenções do ToBI compõem um sistema consensual para codificar enunciados falados e que distingue rótulos para diferentes tipos de eventos e estruturas fonológicas em camadas paralelas quase independentes. Essas convenções especificam uma maneira de marcar os eventos tonais fonologicamente contrastivos (os tons) separadamente da hierarquia de junções entre palavras (índices de codificação das fronteiras prosódicas), às quais alguns desses eventos tonais estão associados, como os acentos frasais e os tons de fronteira. As convenções originais do ToBI são específicas para o inglês americano padrão, mas outras convenções de anotação baseadas nos mesmos princípios gerais podem ser propostas (como de fato são) para outras variedades do inglês e outras línguas. O uso do sistema ToBI original, como modelo geral para o desenvolvimento de convenções de anotação específicas de uma língua, torna possível comparar sistemas prosódicos entre línguas, usando um vocabulário comum, e buscar universais linguísticos.

Entretanto, a aplicação do conjunto de convenções do ToBI para desenvolver um sistema de transcrição para uma nova língua ou variedade pressupõe o acesso a um corpo de pesquisa estabelecido específico para a língua ou variedade para a qual o sistema de transcrição se destina. Ter um conhecimento amplo sobre outras variedades da mesma língua e ser capaz de estabelecer uma estrutura comum é fundamental. Não se pode presumir que um sistema ToBI desenvolvido para uma variedade de dada língua seja aplicável a outras variedades da mesma língua, sem serem previamente propostas análises entoacionais e prosódicas apropriadas para cada variedade. A afirmação de que os símbolos utilizados são comparáveis entre as variedades deve ser baseada em uma análise específica e completa de cada uma das variedades envolvidas. Isso porque os rótulos da camada de tons em um sistema de estrutura ToBI são comparáveis a uma representação fonêmica de consoantes e vogais, e não a uma transcrição fonética restrita.

Agradecimentos

Agradeço a Tommaso Raso pelo convite para a escrita deste verbete e a Vinícius Gonçalves dos Santos pela leitura atenta e comentários feitos à primeira versão deste trabalho.


Bibliografia geral sobre o MAE_ToBI, o ToBI aplicado a outras línguas, entoação e constituintes prosódicos

ARVANITI, A.; BALTAZANI, M. Greek ToBI: A system for the annotation of Greek speech corpora. In: Second International Conference on Language Resources and Evaluation (LREC 2000), 2000, Atenas. Proceedings of Second International Conference on Language Resources and Evaluation (LREC 2000), vol. II. Paris: European Language Resources Association, 2000, pp. 555-562.

BECKMAN, M.; AYERS, G. M. Guidelines for ToBI labelling. Online MS and accompanying files, 1994. Disponível em: http://www.ling.ohio-state.edu/phonetics/E_ToBI.

BECKMAN, M.; DÍAZ-CAMPOS, M.; McGORY, J.T.; MORGAN, T. A. Intonation across Spanish in the Tones and Break Indices framework. Probus, v. 14, pp. 9-36, 2002.

BECKMAN, M.; HIRSCHBERG, J. The ToBI annotation conventions. Online MS, 1994. Disponível em: http://www.ling.ohio-state.edu/~tobi/ame_tobi/annotation_conventions.html.

BECKMAN, M.; HIRSCHBERG, J.; SHATTUCK-HUFNAGEL, S. The original ToBI system and the evolution of the ToBI framework. In: JUN, S.-A. (Ed.), Prosodic typology: the phonology of intonation and phrasing. Oxford: Oxford University Press, pp. 9-54, 2005.

BECKMAN, M.; PIERREHUMBERT, J. Intonational structure in Japanese and English. Phonology Yearbook, v. 3, n. 1, p. 255-309, 1986.

FLETCHER, J.; HARRINGTON, J. High rising terminals and fall-rises in Australian English. Phonetica, v. 58, n. 4, pp. 215-229, 2001.

FROTA, S.; OLIVEIRA, P.; CRUZ, M.; VIGÁRIO, M. P-ToBI: Tools for the transcription of Portuguese prosody. Lisboa: Laboratório de Fonética, CLUL/FLUL, 2015. Disponível em: http://labfon.letras.ulisboa.pt/InAPoP/P-ToBI/

GRICE, M.; REYELT, M.; BENZMÜLLER, R.; MAYER, J.; BATLINER, A. Consistency in transcription and labelling of German Intonation with GToBI. In: Fourth International Conference on Spoken Language Processing, 1996, Philadelphia. Proceedings of Fourth International Conference on Spoken Language Processing. New Castle, Delaware: Citation Delaware, 1996, pp. 1716-1719.

GUSSENHOVEN, C. Transcription of Dutch intonation. In: JUN, S.-A. (Ed.), Prosodic typology: the phonology of intonation and phrasing. Oxford: Oxford University Press, 2005, pp. 118–145.

JUN, S.-A. K-ToBI (Korean ToBI) Labeling Conventions: Version 3. The Korean Journal of Speech Sciences, v. 7, n. 1, pp. 143-169, 2000.

KHAN, S. ud D. The intonational phonology of Bangladeshi Standard Bengali. In: JUN, S.-A. (Ed.), Prosodic typology II: the phonology of intonation and phrasing. Oxford: Oxford University Press, 2014, pp. 81–117.

Ladd, D. R. Constraints on the gradient variability of pitch range (or) pitch level 4 lives! In: KEATING, P. (Ed.), Papers in Laboratory Phonology III. Cambridge, UK: Cambridge University Press, 1993, pp. 43-63.

Ladd, D. R. Intonational Phonology. Cambridge: Cambridge University Press,1996.

Ladd, D. R. Intonational Phonology (2nd ed.). Cambridge: Cambridge University Press, 2008.

LUCENTE, L. Entoação. In: Verbetes LBASS, 2021. Disponível em: http://www.letras.ufmg.br/lbass/.
MAYO, C.; AYLETT, M.; LADD, D. R. Prosodic transcription of Glasgow English: An evaluation study of GlaToBI. In: ESCA Workshop on Intonation: Theory, Models and Applications, 1997, Atenas. Proceedings of the ESCA Workshop on Intonation: Theory, Models and Applications. Atenas: ESCA and University of Athens,1997, pp. 231-234.

Nespor, M.; Vogel, I. Prosodic Phonology. Dordrecht: Foris Publications, 1986.

NESPOR, M.; VOGEL, I. Prosodic phonology: With a new foreword. Berlin/New York: Mouton de Gruyter, 2007.

Pierrehumbert, J. The phonology and phonetics of English intonation. Tese (Doutorado) - M.I.T., Cambridge, Mass., 1980.

Pitrelli, J. F.; Beckman, M. E.; Hirschberg, J. Evaluation of prosodic transcription labelling reliability in the ToBI framework. In: Third International Conference on Spoken Language Processing, 1994, Yokohama, Japão. Proceedings of Third International Conference on Spoken Language Processing. Yokohama, Japão: ICSLP, 1994, pp. 123-126.

Price, P.; Ostendorf, M.; Shattuck-Hufnagel, S.; Fong, C. The use of prosody in syntactic disambiguation. Journal of the Acoustic Society of America, v. 90, n. 6, pp. 2956-2970, 1991.

Prieto, P.; Aguilar, L.; Mascaró, I.; Torres Tamarit, F. J.; Vanrell, M. DEL M. L’etiquetatge prosòdic Cat_ToBI. Estudios de Fonética Experimental XVIII, pp. 287–309, 2009.

Selkirk, E. O. Phonology and Syntax: the relation between sound and structure. Cambridge: The M.I.T. Press, 1984.

Selkirk, E. O. On derived domains in sentence phonology. Phonology Yearbook, n. 3, p. 371-405, 1986.

Selkirk, E. O. The interaction of constraints on prosodic phrasing. In: Horne, M. (Ed.), Prosody: Theory and Experiment. Netherlands: Kluwer Academic Publishers, 2000, p. 231-261.

SERRA, C. Fonologia da Prosódia 1: acento e ritmo. In: Verbetes LBASS, 2020. Disponível em: http://www.letras.ufmg.br/lbass/.

Serra, C. 2020. Fonologia da Prosódia 2: tom e entoação. In: Verbetes LBASS, 2020. Disponível em: http://www.letras.ufmg.br/lbass/.

Silverman, K.; Beckman, M.; Pitrelli, J.; Ostendorf, M.; Wightman, C.; Price, P.; Pierrehumbert, J.; Hirschberg, J. TOBI: a standard for labeling English prosody. In: Second International Conference on Spoken Language Processing, 1992, Banff, Alberta, Canada. Proceedings of Second 1992 International Conference on Spoken Language Processing. Banff, Alberta, Canada: ICSLP, pp. 867-870.

Venditti, J. J. Japanese ToBI labelling guidelines. Ohio State University Working Papers in Linguistics, v. 50, pp. 127-162, 1997.

Wightman, C.; Shattuck-Hufnagel, S.; Ostendorf, M.; Price, P. J.  Segmental durations in the vicinity of prosodic phrase boundaries. Journal of the Acoustical Society of America, v. 91, n. 3, pp. 1707-1717, 1992.

Referências relativas ao P_ToBI e a trabalhos sobre a relação entre entoação e constituintes prosódicos em português

BRAGA, G.; FERNANDES-SVARTMAN, F. R. Associação de eventos tonais em português de São Tomé. DIACRITICA, v. 33, n. 2, p. 19-40, 2019.

FERNANDES, F. R. Tonal association in neutral and subject-narrow-focus sentences of Brazilian Portuguese: a comparison with European Portuguese. Journal of Portuguese Linguistics, v. 6, n. 1, p. 91-115, 2007a.

Fernandes, F. R. Ordem, focalização e preenchimento em português: sintaxe e prosódia. 2007. Tese (Doutorado em Lingüística) - Universidade Estadual de Campinas, Campinas, 2007b.

FROTA, S. Prosody and focus in European Portuguese: phonological phrasing and intonation. New York: Garland Publishing, 2000.

Frota, S. Surface and Structure: Transcribing intonation within and across languages. Laboratory Phonology: Journal of the Association for Laboratory Phonology, v. 7, n. 1, 2016.

FROTA, S.; MORAES, J. A. Intonation in European and Brazilian Portuguese. In: WETZELS, W. L.; COSTA, J.; MENUZZI, S. (Eds.), The Handbook of Portuguese Linguistics. Chichester: John Wiley & Sons, Inc, 2016, pp. 141-166.

FROTA, S. The intonational phonology of European Portuguese. In: JUN, S.-A. (Ed.), Prosodic typology II: The phonology of intonation and phrasing. Oxford: Oxford University Press, 2014, pp. 6-42.

Frota, S.; Cruz, M.; Fernandes-Svartman, F.; Collischonn, G.; FONSECA, A.; Serra, C.; Oliveira, P; Vigário, M. Intonational variation in Portuguese: European and Brazilian varieties. In: FROTA, S.; PRIETO, P. (Eds.), Intonational variation in Romance. Oxford: Oxford University Press, 2015, pp. 235–283.

FROTA, S.; OLIVEIRA, P.; CRUZ, M.; VIGÁRIO, M. P-ToBI: Tools for the transcription of Portuguese prosody. Lisboa: Laboratório de Fonética, CLUL/FLUL, 2015. Disponível em: http://labfon.letras.ulisboa.pt/InAPoP/P-ToBI/

SANTOS, V. Aspectos prosódicos do português angolano do Libolo: entoação e fraseamento. 2020. Tese (Doutorado em Letras) — Universidade de São Paulo, São Paulo, Brasil, 2020.

Serra, C. R. Realização e percepção de fronteiras prosódicas no português do Brasil: fala espontânea e leitura. 2009. Tese (Doutorado) – Universidade Federal do Rio de Janeiro, Rio de Janeiro, 2009.

TENANI, L. E. Domínios prosódicos no português: Implicações para a prosódia e para a aplicação de processos fonológicos. 2002. Tese (Doutorado em Linguística) – Universidade Estadual de Campinas, Campinas, 2002.

TONELI, P. A palavra prosódica em português brasileiro. 2014. Tese (Doutorado em Linguística) – Universidade Estadual de Campinas, Campinas, 2014.

VIGÁRIO, M. The Prosodic Word in European Portuguese. Berlin: Mouton de Gruyter, 2003.

VIGÁRIO, M. Prosodic structure between the Prosodic Word and the Phonological Phrase: Recursive nodes or an independent domain? The Linguistic Review, v. 27, n. 4, p. 485-530, 2010.