Return to list
Sílaba
Luiz Schwindt | Universidade Federal do Rio Grande do Sul

Em perspectiva ampla, pode-se dizer que sílaba é uma unidade de base sonora que se constitui do agrupamento de unidades menores do que ela, segmentos ou matrizes de traços distintivos correspondentes. Segundo essa definição, a palavra do português cabeça, por exemplo, poderia ser escandida em três sílabas. Essa definição, contudo, não dá conta da caracterização específica dessa unidade sonora — se fonética ou fonológica —, das estratégias implicadas para determinar onde começa e termina uma sílaba ou de sua entidade superordenada, já que se pode identificar silabificação no interior de um morfema, de uma palavra ou mesmo entre palavras numa frase.

Usuários proficientes de um idioma, e sobretudo falantes nativos, não têm dificuldade para identificar sílabas em suas línguas. Por exemplo, a grande maioria dos falantes do português dirá que a palavra casa possui duas sílabas, e a maioria dos falantes do inglês, que house possui uma sílaba. Os usuários dessas línguas recorrerão possivelmente a diferentes critérios, que podem atuar individual ou conjuntamente, para chegar a esse juízo. Esses critérios podem ser de natureza fonética (articulatória, perceptual, acústica), fonológica e mesmo ortográfica, no caso dos usuários alfabetizados. É comum, por isso, fazer-se referência a silabificação fonética e silabificação fonológica. Por exemplo, a palavra cabeça, acima referida, apesar de fonologicamente se constituir de três sílabas, /ka.be.sa/, pode eventualmente ser produzida com duas, correspondendo à transcrição fonética [ka.'bes] (em que um ponto indica o limite de cada sílaba e um apóstrofo precede a sílaba tônica à qual, no caso deste exemplo, se juntou a consoante inicial da última sílaba, após a queda da vogal final da palavra). Por outro lado, ainda que a escrita possa exercer papel sobre a forma como construímos a representação da sílaba, não é adequado se falar em separação silábica quando estão em jogo letras. Nesse sentido, convenções sobre separação de letras (ex. ed-u-ca-tion 'educação', em inglês; pas-so, em português) não se confundem com regras de silabificação; servem em geral à atividade de translineação, sem correspondência necessária entre cada subconjunto de letras e as sílabas da palavra, sejam fonéticas sejam fonológicas.

A literatura registra muitas tentativas de se definir sílaba foneticamente. Entre essas definições estão a associação de sílaba a uma atividade respiratória, um pulso torácico, a cada intervalo entre abertura e fechamento de articuladores e, ainda, a cada pico de proeminência na cadeia sonora, que pode se valer de indicadores como acento, tom, duração e grau de sonoridade. Não há, contudo, consenso em torno de um parâmetro capaz de definir silabicidade em termos articulatórios ou acústicos.

Assumida uma perspectiva que distinga fonologia de fonética, pode-se dizer que, apesar de toda sílaba apresentar uma inegável face fonética, sua definição tem maior sustentação em bases abstratas, de natureza fonológica.

De fato, parece que o domínio sobre os limites das sílabas de uma palavra integra o rol do que se costuma designar em linguística gerativa como conhecimento internalizado, ou competência fonológica, nesse caso. Uma boa evidência disso são os jogos linguísticos ou as línguas secretas, sistemas dominados muitas vezes por crianças mesmo antes da idade escolar, como é o caso da Língua do P. Numa das variedades desse sistema, o falante introduz [p] entre a primeira parte da sílaba, que se estende até a vogal, e sua parte final, como em ca-par-ta-pa, para a palavra portuguesa carta. Esse exemplo é particularmente interessante porque não apenas evidencia o conhecimento sobre o limite inicial e final de cada sílaba, mas também sobre sua possível estruturação interna.

Na perspectiva abstrata, sílaba é entendida tanto como uma unidade que comporta acento e serve para ancorar tom em determinadas línguas quanto como domínio de processos fonológicos, como assimilações, metátese e mesmo de processos morfofonológicos, como a reduplicação. No sistema acentual de línguas românicas como o espanhol, por exemplo, dizemos que o acento incide sobre uma das três últimas sílabas da palavra, preferencialmente sobre a penúltima, como em [ka.pi.ta.'lis.mo] ('capitalismo'). Numa língua tonal como o igbo (Nigéria), dizemos que a primeira sílaba da palavra àkwá ('ovo') apresenta tom baixo (L, de low) e a segunda sílaba apresenta tom alto (H, de high), ao passo que na palavra ákwà ('roupa'), o padrão é HL. Processos como a assimilação de ponto de articulação que atinge consoantes nasais em catalão, por exemplo, têm por domínio a porção final da sílaba (ex. so[m] [p]ocs 'são poucos'; so[ɱ] [f]eliços 'são felizes'; so[n] [d]os 'são dois'; so[ɲ] [ʎ]iures 'são livres'; s[o]ŋ [g]rans 'são grandes'). Em uma língua como o tagalog (Filipinas), grande parte do processo morfológico de reduplicação toma como base uma sílaba ou parte dela, como ocorre em kauntî ('um pouco') → kakauntî, em que a cópia da sequência de consoante e vogal do início da primeira sílaba da palavra indicam pluralidade.

Do ponto de vista prosódico, é mais ou menos consensual que sílabas (σ) estão subordinadas a palavras fonológicas (ω). Outra hipótese é a de que a relação entre sílabas e palavras prosódicas seja intermediada por pés métricos (Σ), unidades rítmicas acentuais assumidas como constituintes por muitos autores. Assim, uma palavra como borboleta seria constituída de dois pés métricos, neste caso troqueus silábicos — pés formados de duas sílabas com núcleo à esquerda, sendo o pé da direita, em virtude da direcionalidade do processo de atribuição do acento, no caso do português, o que comporta a proeminência principal da palavra.

A cada novo afixo, a palavra prosódica é reestruturada em sílabas, confirmando o caráter cíclico da silabificação (ex. /kaɾ.ta/+eiroSufixo → /kaɾ.tej.ro/). Sílabas podem extrapolar uma palavra prosódica, fenômeno comum em línguas românicas. Nesse caso, diz-se que há ressilabificação, termo que designa a silabificação que se processa em níveis mais altos da hierarquia prosódica, como a frase fonológica (ex. ressilabificação imposta pelo processo de elisão em ['ka.zɐ] [is.'ku.ɾɐ] ~ [ka.zis.'ku.ɾɐ]). Para lidar com essa aparente violação ao Princípio de Licenciamento Prosódico (Itô, 1986), isto é, à demanda de escansão exaustiva da sílaba em seu constituinte superordenado (o pé métrico e/ou a palavra prosódica), teorias de gramática fonológica costumam lançar mão de níveis ordenados ou do estabelecimento de domínios sobre regras ou restrições. Nessa perspectiva, a ressilabificação se processaria em um nível tardio, pós-sintático, em certos modelos chamado de nível pós-lexical ou nível da palavra reestruturada.

Muitos consideram a sílaba o menor constituinte da hierarquia prosódica, uma vez que, em princípio, subordina elementos indecomponíveis, os segmentos ou feixes de traços que estruturam esses segmentos. Há evidências, por outro lado, de que sílabas apresentam uma constituência interna, como a sugerida a seguir.

O diagrama acima mostra o monossílabo do inglês bat ('morcego') subdividido em dois constituintes maiores, o ataque (ou onset) e a rima, e este último subdividido em núcleo, o único elemento obrigatório, e coda. Esses constituintes podem, ainda, ser ramificados, isto é, ocupados por mais de um segmento. É o caso do ataque da primeira sílaba da palavra prato, em português, [pɾ], ou da coda final da palavra park ('estacionamento'), em inglês, [ɽk]. O núcleo da sílaba é em geral ocupado por apenas uma vogal (ou consoante silábica), ainda que vogais longas e ditongos possam ser interpretados como resultantes de núcleos ramificados na estrutura fonológica, como [i:], em feet ('pés') ou [eɪ], em day ('dia'), em inglês.

Um exemplo de processo típico do ataque silábico é a aspiração em inglês, que afeta as consoantes oclusivas /p,t,k/ quando se localizam no início de uma palavra, como ocorre com a palavra pet [phɛt] ('filhote'). Já processos como a palatalização da consoante fricativa alveolar, atestado em variedades do português brasileiro e europeu, atinge /s/ em coda silábica, como na primeira sílaba da palavra caspa [kaʃ.pɐ] ou astro ['aʃ.tɾʊ]. Não há consenso sobre a plausibilidade da rima enquanto constituinte da estrutura silábica. Entre outros exemplos da literatura em defesa da rima, estão os fenômenos de aspiração de /s/ e velarização de /n/ atestados em variedades do espanhol. Aspiração se aplica à rima constituída por vogal+/s/ (ex. puede[h] 'podes'), enquanto velarização afeta /n/ tanto final quanto seguido por /s/, o que prova não se tratar de processo limitado à fronteira da sílaba (ex. c[oŋs.]t[aŋ.]te 'constante'). Embora [ŋ] e [h] não sejam segmentos típicos de ataque, podem ser observados eventualmente nesse contexto, como evidência de que os processos que atingem a rima precedem a ressilabificação (ex. puede[.hen.]trar 'deves entrar'; jamó[.ŋes.]tropeado 'presunto estragado').

A rima tem relevância também na definição do que se rotula como peso silábico. Rimas constituídas por uma vogal breve são classificadas como leves e sílabas constituídas por uma vogal longa ou por uma vogal seguida de uma consoante são classificadas pesadas. Outra abordagem é a que considera que unidades de peso, chamadas moras (μ), são, a rigor, constituintes da sílaba. Nessa perspectiva, uma sílaba pesada consiste em duas moras e uma sílaba leve em apenas uma mora. Consoantes do início da sílaba não possuem moras independentes; vogais longas e ditongos correspondem a duas moras. Isso está ilustrado a seguir, na análise de moras da palavra barbeiro, do português.

Em algumas línguas, o acento da palavra é sensível ao peso silábico. Em latim, por exemplo, o acento incide tipicamente sobre a antepenúltima sílaba (ex. impetus 'ímpeto'), mas se a penúltima sílaba for pesada, é sobre ela que incide (ex. magister 'mestre').

As línguas do mundo se diferenciam quanto ao seu molde silábico. O molde silábico de uma língua como o inglês permite 12 padrões distintos a partir da combinação de consoantes (C), vogais (V) e de glides, segmentos considerados, a depender da abordagem fonológica da sílaba, como unidades do tipo C ou V.

V C it ('ele/a') V V eye ('olho')
C V C cat ('gato') V V C aisle ('corredor')
C C V C treat ('tratar') C V V die ('morrer')
C V C C hint ('dica') C V V C site ('lugar')
C C V C C front ('frente') C V V C C point ('apontar')
C C V V C float ('flutuar')
C C V V C C blind ('cego')

O padrão CV é universalmente preferido. Embora línguas possuam sílabas com outros padrões, é comum se atestarem processos fonológicos que muitas vezes militam para convertê-los em CV. É o caso da epêntese em português brasileiro. Numa palavra como intelecto, uma sílaba do tipo CVC, [lɛk], fechada por uma coda obstruinte, reestrutura-se em duas sílabas de padrão CV, [lɛ.ki]. A complexidade da estrutura da sílaba está refletida na aprendizagem, ou seja, não se espera que crianças adquiram, por exemplo, ataques complexos antes de ataques simples, ou codas complexas antes de codas simples.

Há, em princípio, duas abordagens para formação da sílaba, uma que se vale de ordenamento extrínseco de regras e outra que se vale de condições não ordenadas, nos moldes de princípios e parâmetros. Na primeira abordagem, regras dão conta da formação do núcleo, em seguida do ataque e, por fim, da coda. Na segunda abordagem, entre outras restrições, está em jogo a satisfação às condições impostas pelo Princípio de Sequenciamento de Sonoridade, condicionado a uma escala universal.

VOGAL > GLIDE > LÍQUIDA > NASAL > OBSTRUINTE
4 3 2 1 0

Nessa perspectiva, o elemento mais sonoro de qualquer sílaba é seu núcleo, e tanto os elementos do ataque quanto da coda apresentarão sonoridade crescente na direção desse núcleo. É o que se observa em palavras como cristal, em português, tanto na primeira sílaba, [k0ɾ2i4s0], quanto na segunda [t0a4w3].

Além de seguir a escala de sonoridade, a estruturação silábica está sujeita a restrições idiossincráticas nas línguas, que garantem, por exemplo, que uma palavra como zebra em português não seja silabificada como [zeb.ɾɐ], uma vez que essa silabificação não constitui violação à expectativa universal de sequenciamento de sonoridade, [z0e4b02ɐ4], sendo perfeitamente possível em uma língua que comporte obstruintes oclusivas em posição de coda.

Todo segmento deve ser associado a uma sílaba, conforme o Princípio de Licenciamento Prosódico. Quando, por qualquer razão, essa associação deixa de ocorrer, a estrutura é reparada, em geral por apagamento ou epêntese. Por exemplo, no caso de um vocábulo que apresenta um platô de sonoridade, fenômeno evitado em muitas línguas, como mnemonics, em inglês, ou mnemônico, em português, o ataque inicial é reduzido no caso da primeira língua ([n]emonics) e desfaz-se por epêntese no caso da segunda (m[i]nemômico). Também podem ser admitidos como reparos à violação do Princípio de Licenciamento Prosódico a admissão de estruturas ambissilábicas — segmentos de borda que pertencem simultaneamente a duas sílabas — e estruturas extramétricas — segmentos que, apesar de não associados, são invisíveis ao apagamento. A consoante /t/, no vocábulo do inglês petrol ('gasolina'), pode ser analisada como ambissilábica, se assumimos que a vogal que a antecede, /ɛ/, só ocorre em sílabas fechadas na língua, e que, ao mesmo tempo, pode provocar desvozeamento de /ɾ/, que a segue na segunda sílaba. A consoante /t/, por outro lado, pode ser considerada extramétrica no vocábulo do francês petit, na expressão petit garçon ('garotinho'), uma vez que não se realiza em tal contexto em função da proibição de obstruintes na coda nessa língua. A evidência de que, apesar de invisível, está estruturalmente presente reside no fato de que se realiza quando encontra contexto para ser silabificada como ataque da palavra seguinte quando esta começa por vogal, como em petit ami ('namorado').

Também restrições fonotáticas, lexicais em dado sentido dessa expressão, podem caracterizar a silabificação nas línguas. Por exemplo, palavras com o encontro consonantal [tl] e [vɾ] são raras em português e, quando ocorrem, restringem-se ao interior da palavra (ex. atleta; livro).


Bibliografia

Sobre sílaba do ponto de vista fonético

Barbosa, P. A. (2019) Prosódia. S. Paulo Parábola. Coleção Linguística para o Ensino Superior 2.

Cagliari, L. C. (1981). Elementos de fonética do português brasileiro. Tese de Doutorado. Universidade Estadual de Campinas.

Ladefoged, P. (1982) A course in phonetics. 2 ed. New York: Harcourt Brace Jovanovich.

Stetson, R. H. (1951). Motor phonetics: a study of speech movement in action. 2 ed., North Holland Publishing Co., Amsterdam.

Sobre sílaba do ponto de vista fonológico

Hayes. B. (2009). Introductory phonology. Wiley-Blackwell.

Hooper, J. (1976). An introduction to natural generative phonology. New York: Academic Press.

Hyman, L. (1985). A theory of phonological weight. Dordrecht: Foris.

Hogg, R.; McCully, C. B. (1987). Metrical phonology: a coursebook. Cambridge University Press.

Itô, J. (1986). Syllable theory in Prosodic Phonology. PhD dissertation. University of Massachusetts, Amherst.

Nespor, M.; Vogel, I. (2007). Prosodic phonology. With a new foreword. Mouton de Gruyter.

Selkirk, E. (1982). The syllable. In H. V. d. Hulst, & N. Smith (eds.). The structure of phonological representations, part 2, pp. 337-384. Dordrecht: Foris.

Teoria e descrição da sílaba em línguas particulares

Bisol, L. (1999). A sílaba e seus constituintes. In M. H. Moura Neves (ed.) Gramática do português falado, vol. VII, pp. 701-742. Campinas: Unicamp/FAPESP.

Camara Jr., J. M. (1970). Estrutura da língua portuguesa. Petrópolis: Vozes.

Collischonn (2010). A sílaba em português. In L. Bisol (org.) Introdução a estudos de fonologia do português brasileiro. 5 ed., pp. 99-131. Porto Alegre: EDIPUCRS.

Collischonn, G.; Wetzels, W. L. (2016). Syllable structure. In J. Costa; S. M. Menuzzi; W. L. Wetzels (eds.) The Handbbook of Portuguese Linguistics, pp. 86-106. Wiley-Blackwell.

Harris, J. (1983). Syllable structure and stress in Spanish: a nonlinear analysis. Cambridge, MA: MIT Press.

Kahn, D. (1976) Syllable-based generalizations in English phonology. PhD dissertation. MIT, Cambridge, MA.

Lee, S. H. (1999). Teoria da Otimalidade e silabificação do PB. In V. Benn-Ibler; E. A. M. Mendes; P. M. Oliveira (eds.). Revisitações: edição comemorativa dos 30 anos da FALE/UFMG, pp. 43-156. Belo Horizonte: UFMG.

Mateus, M. H. M. e D'Andrade, E. (2000). The phonology of Portuguese. Oxford: Oxford University Press.