FERRAMENTAS DE AVALIAÇÃO DE VOZ PARA IDENTIFICAR EFEITOS IMEDIATOS
DE EXERCÍCIOS VOCAIS.
Regina Aparecida Pimenta1, Maria Eugenia Dajer2, Arlindo Neto Montagnoli3
1

Programa de Pós-Graduação Interunidades Bioengenharia/USP, São Carlos, Brasil, [email protected]
2
Faculdade de Medicina da Universidade de São Paulo, São Paulo, Brasil, [email protected]
3
Departamento de Engenharia Elétrica/UFSCar, São Carlos, Brasil, [email protected]

Resumo: Foram utilizadas análises acústica e perceptivoauditiva para identificar os efeitos imediatos na voz do
exercício de vibração sonorizada. Shimmer, jitter, níveis de
ruído na espectrográfica e a análise perceptivo-auditiva
apresentaram diferencia estatística. As ferramentas
comprovaram efeitos imediatos positivos na voz após o
exercício de vibração sonorizada.

Nas últimas décadas, as ferramentas de análise acústica
têm-se incorporado com sucesso na clínica fonoaudiológica
[5]. Os softwares de análise de voz são baseados em técnicas
de processamento de sinais para obtenção de informações
sobre a fonte sonora e fornecem diversas medidas objetivas
[8]. Além de avaliar, essas ferramentas podem ser úteis para
acompanhar a evolução de tratamentos e são consideradas
técnicas auxiliares aos métodos de inspeção direta das
pregas vocais, diminuindo a regularidade dos exames mais
invasivos [9], [10].
Sendo assim o objetivo desta pesquisa é utilizar
parâmetros acústicos, espectrografia e análise perceptivoauditiva para identificar os efeitos imediatos do exercício de
vibração sonorizada em vozes masculinas.

Palavras-Chave: Análise acústica, avaliação de voz,
qualidade vocal.
1. INTRODUÇÃO
A voz é uma habilidade predominante na comunicação
humana e uma boa qualidade vocal é importante para
estabelecer, com sucesso, as relações sociais [1]. Um
treinamento orientado para economia vocal baseia-se na
premissa de que as lesões de pregas vocais possam ser
minimizadas ou prevenidas se o impacto de colisão for
reduzido [2].
Exercícios de trato vocal semi-ocluído promovem uma
oscilação das pregas vocais levemente aduzidas pela pressão
retroflexa do trato vocal, minimizando o fluxo de ar glótico
e as colisões entre as pregas vocais [2]. Um destes
exercícios é a vibração sonorizada de lábios ou língua, o
qual é amplamente usado na clínica fonoaudiológica e
consiste na rápida e repetidas oscilações dos lábios ou língua
pela passagem do fluxo aéreo expiratório com emissão
simultânea de voz [3]. O exercício é considerado o mais
eficiente para aumentar amplitude de vibração das pregas
vocais e balancear forças aerodinâmicas e mioelásticas [4],
[5].
Existem ferramentas que permitem avaliar as possíveis
mudanças da qualidade vocal, sejam causadas por patologias
ou por exercícios de reabilitação de voz [4], [5]. As
ferramentas mais comuns na clínica fonoaudiológica são as
análises acústica computadorizada e a perceptivo-auditiva.
A análise perceptivo-auditiva pode ser realizada com
escalas padronizadas de reconhecimento internacional para
caracterizar a qualidade vocal e quantificar o desvio de voz.
A escala analógica-visual é, atualmente, a mais utilizada por
ser considerada robusta, menos tendenciosa e não
influenciável aos aspectos culturais [6], [7].

2. METODOLOGIA
Participaram deste estudo 26 indivíduos adultos,
homens, com idade entre 21 e 35 anos. Para a seleção da
amostra os participantes passaram por triagem
fonoaudiológica, preencheram um questionário com
perguntas relevantes à pesquisa de saúde vocal e a um
protocolo de qualidade de vida em voz, com o intuito de
investigar possíveis queixas vocais [11].
Como critérios de inclusão foram aceitos indivíduos não
fumantes, livres de alterações digestivas, hormonais e
processos inflamatórios das vias aéreas no momento da
coleta, e sem queixa vocal de acordo com o protocolo de
qualidade de vida em voz (escore maior ou igual a 71,6%)
[11]. Seis indivíduos foram reprovados na triagem
fonoaudiológica constituindo a amostra final com 20
participantes.
2.1. Procedimentos
A gravação de voz foi realizada em uma sala silenciosa
com controle das superfícies refletoras e do ruído ambiente.
Os sinais foram diretamente digitalizados em um notebook
com processador Intel Dual-Core T4400, 2.2 GHz, placa de
som externa USB com microfone headset, unidirecional de
sensibilidade mínima de 44dB e frequência de resposta de
60Hz a 12kHz.
Durante a coleta o microfone ficou posicionado à
distância de 4 centímetros da boca do indivíduo, formando

1

FERRAMENTAS DE AVALIAÇÃO DE VOZ PARA IDENTIFICAR EFEITOS IMEDIATOS DE EXERCÍCIOS VOCAIS.
Regina Aparecida Pimenta 1, María Eugenia Dajer 2, Arlindo Neto Montagnoli 3.

Foram encontradas diferenças estatísticas para as
medidas acústicas Jitter e Shimmer. Os resultados da análise
acústica estão apresentados na tabela 1.

com esta um ângulo de 45º a 90º [12]. Foram gravados 5
segundos da vogal sustentada /a/ em dois momentos: antes e
depois de exercícios vocais de vibração sonorizada de lábios
ou de língua. Os participantes realizaram três séries do
exercício, sendo estas compostas de 15 repetições com
intervalos de descanso de trinta segundos [3].
Os sinais de voz foram armazenados em formato .wav,
com taxa de 44.100 amostras por segundos. Para as análises
foram selecionados os 2 segundos mais estacionários de
cada sinal.

Tabela 1. Médias (M) e desvios-padrão (DP) das medidas acústicas
pré e pós-exercícios de vibração sonorizada.
Fo: Freqüência fundamental. GM: Mobilidade glótica.
*valor com diferença estatística significante (Teste T 0,05).
Pré-exercícios
Pós-exercícios
Parâmetros
P-valor
acústicos
M
DP
M
DP

2.2. Análise acústica
Foi utilizado o software Análise de Voz versão 4.10 para
gravação da voz e para análise acústica quantitativa e
espectrográfica [14]. O software normaliza os sinais de voz
para a padronização dos níveis de amplitude e os parâmetros
são extraídos automaticamente.
Parâmetros de perturbação:
O jitter indica a variação da frequência fundamental
entre os ciclos glótico e o shimmer a variação da amplitude.
Ambos são calculados utilizando a abordagem de
autocorrelação do sinal e são expressos em porcentagens.
Parâmetros acústicos:
A frequência fundamental indica a quantidade de ciclos
glóticos por segundos e é expressa em Hertz. O parâmetro
mobilidade glótica (GM) sugere a atividade de contato das
pregas vocais e seu cálculo é dado pelo valor médio dos
picos de amplitude do sinal derivado.
Análise espectrográfica:
O espectrograma é expresso a partir do cálculo da
transformada de Fourier [14]. Esta análise foi realizada por
meio da avaliação visual da banda estreita do
espectrograma. Os parâmetros analisados foram: grau de
escurecimento dos harmônicos (azul para fraco, amarelo
para normal e vermelho para forte), estabilidade dos
traçados (estabilidade ou instabilidade do traçado
espectrográfico) e presença de ruído [15].

Fo (Hz)

111,5

10,03

113,4

7,91

0,58

Jitter (%)

0,19

0,06

0,15

0,02

0,012*

Shimmer (%)

1,42

0,71

1,13

0,34

0,004*

GM

0,52

0,14

0,54

0,12

0,68

Quanto à análise espectrográfica, o grau de
escurecimento dos harmônicos não apresentou mudanças na
maior parte da amostra (80%), melhora em 15% da mesma,
sendo que o grau diminuiu de forte para normal (vermelho/
amarelo), e piora em 5%, com diminuição do grau de
escurecimento de normal para fraco (amarelo/ azul). A
estabilidade dos harmônicos não apresentou mudanças após
os exercícios vocais em 95% da amostra. Destes os traçados
de 80% são instáveis e de 15% estáveis. A presença de ruído
diminuiu em 70% da amostra após os exercícios de vibração
sonorizada com significância estatística (p=0,028*).
A figura 1 apresenta a espectrografia da amostra vocal 4
antes das vibrações sonorizadas. Pode-se observar grau
normal (amarelo) de escurecimento dos harmônicos,
instabilidade dos traçados e a presença de ruído entre os

2.3. Análise perceptivo-auditiva
Foi construído um banco de dados aleatório com as
vozes gravadas antes e depois dos exercícios vocais. Uma
fonoaudióloga treinada realizou a avaliação perceptivoauditiva das vozes avaliando o grau global de desvio vocal
de acordo com os conceitos da escala Consensus AuditoryPeceptual Evoluation of Voice (CAPE-V). Esta escala tem a
característica de ser analógico-visual, subjetiva e de
verificar a consistência de parâmetros da qualidade vocal
[13].
2.4. Análise estatística
Foi utilizado o teste de comparação Qui-quadrado para a
análise das avaliações subjetivas (percepção-auditiva e
visual do espectrograma) e o teste T de Student para a
análise acústica, ambos com nível de significância 0,05.
3. RESULTADOS
3.1. Análise acústica

2

harmônicos.
A figura 2 apresenta a espectrografia da mesma amostra
vocal (4) após o exercício de vibração sonorizada. Não são
observadas mudanças no grau de escurecimento dos
harmônicos e na instabilidade dos traçados, entretanto, é
possível observar diminuição do ruído entre os harmônicos.

O grau de escurecimento dos harmônicos, na análise
espectrográfica, está relacionado com a tonicidade da
laringe e o Loudness existente na produção vocal [15].
Nesta pesquisa não houve mudanças deste parâmetro após
as vibrações sonorizadas, porém os resultados são
esperados, uma vez que as vozes estudadas apresentaram
adequação do Loudness, mesmo antes do exercício vocal.
Uma única amostra vocal apresentou piora dos
parâmetros espectrográficos após os exercícios vocais, com
diminuição na intensidade dos harmônicos, instabilidade dos
traçados, antes estáveis e aumento dos níveis de ruído entre
os harmônicos. Contudo na análise perceptivo-auditiva e
acústica, a mesma apresentou melhora da voz após as
vibrações.

3.2. Análise perceptivo-auditiva
A tabela 2 demonstra os resultados da análise
perceptivo-auditiva. A maior parte da amostra apresentou
melhoras após a vibração sonorizada com relevância
estatística (p