Vous êtes sur la page 1sur 25

Universidad del Cauca

Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

ANÁLISIS ACÚSTICO PERCEPTUAL DE LA VOZ: en la evaluación de la voz se debe


tener en cuenta la voz hablada y la cantada.

La atención se dirige a la observación del tono, la intensidad, el timbre, la duración de la


emisión vocal, al ataque y cese de la misma. Se presenta interés a las inspiraciones audibles
o alteraciones bruscas y fugaces de la voz.

A continuación se describe el proceso de evaluación:

Parámetros vocales
Parámetros acústicos perceptibles por el
receptor humano Parámetros físicos Evaluación perceptual
Intensidad habitual utilizada: -normal-suave-
Intensidad Amplitud fuerte-variabilidad posible
Gama tonal (hz)-tono habitual de voz hablada,
variabilidad posible-entonación. Extensión
Altura o Tono Frecuencia tonal (tonos posibles del mas grave al más
agudo).
Tiempo máximo de fonación (TMF)
/a/ /i/ /u/
Eficiencia fonatoria con
Duración Tiempo /s/ /z/.
Cantidad de palabras por minuto Fluidez.
Timbre claro, velado, ronco.
Calidad Timbre Resonancia laríngea, facial, nasal, pectoral.
Tabla. El cuadro resume los parámetros a evaluar (Farías en Diamante, 2004).

Evaluación de habilidad fonatoria: la habilidad fonatoria del paciente es estimada por (Hirano,
1981):
 El tiempo que puede sostener una fonación.
 El rango de frecuencias que puede emitir.
 El control de registros vocales.
 El rango de intensidades que puede producir.
 Y la eficiencia para convertir la energía aerodinámica en acústica

Se evalúa tiempo de prolongación de vocales a-i-u, el promedio normal debe ser equivalente
a 12 a 15 segundos, en profesionales de voz deben alcanzar de 20 a 25 segundos. Otro
aspecto a evaluar es la eficiencia del cierre glótico: se evalúa mediante la emisión
prolongada del fonema /s / o /f/. El parámetro normal en mujeres es de 14 seg, en hombres
15 seg.
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Tiempo máximo de fonación (TMF): Para Farías 2010, se le pide al paciente (posición:
preferentemente de pie, aunque puede hacerse sentado) que con una inspiración profunda
sostenga una vocal /a/todo lo que sea posible. La fonación se efectúa en un nivel de frecuencia
fundamental e intensidad confortables. En algunos casos, como en cantantes se debe controlar
dicho nivel. La duración de la máxima fonación sostenida es llamada TMF.la medición de hace
con cronometro. Se efectúa 3 veces tomando como valor de referencia el máximo obtenido.
Además de la /a/ podemos medir la /i/ y la /u/ (vértices de triangulo de Helwag).

El tiempo posible de emisión sostenida nos da información sobre la eficiencia del cierre
glótico y el control respiratorio.
Valor normal en hombres: 25 a 35 seg.
Valor normal en mujeres: 15 a 25 seg.

Se consideran anormales valores menores a 10 seg. Hirano cita a Shigemori (1977) que
investigó que en chicos el TMF se incrementa con la edad, y que la diferencia entre niños y
niñas no es significativa excepto a partir de 7mo gado (pubertad).

El tiempo aproximado en niños es de 10 seg, este valor varía según la edad (Wilson,
1973,1979). Hirano reporta que el TMF decrece en algunas patologías especialmente en
casos de cierre glotal incompleto. Se acorta particularmente en parálisis recurrencial.
También en pólipo cordal sésil, nódulos grandes. Obviamente el TMF se debe incrementar
postratamiento quirúrgico o logopédico. El TMF puede verse incrementado en
hiperfunciones o en un cuadro distónico, por ser bajo el flujo aéreo transglotal y por
prolongación del tiempo de cierre.

Índice s/z: Este índice fue sugerido por Boone en 1971. Es el cociente entre el TMF para la
/s/ y el TMF para la /z/: en nuestro idioma implica el sonido de una “y” prestando atención
a que se efectué en forma sonora y no sorda (sorda se escucharía como “sh”). Precisamente
la eficacia de la prueba se basa en contraponer un sonido sordo a uno sonoro para
relacionar las funciones pulmonar y laríngea. Se considera como valor normal, es decir,
tiempos iguales de /s/ y de /z/ (ejemplo: /s/ 20 seg, /z/ 20 seg, por lo que s/z=1). Boone (1989)
obtiene valores levemente mayores de /z/ y dice que la posible causa es que el agregado del
valvulaje laríngeo inhibe el flujo aéreo, contribuyendo al aumento de duración.
Si la eficiencia glótica esta disminuida se reducirá la capacidad de sostener la fonación pero
no disminuirá la espiración el numerador/s/ tendrá un valor mayor que el denominador /z/-
el índice será mayor a 1.
Se considera patología laríngea un índice igual o mayor a 1.2.
Los resultados menores a 1 tienen significancia clínica. Si explicamos lo explicado sobre
TMF en hiperfunciones severas, podríamos tener algún paciente con /s/ normal y /z/
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

alargada por sobrecierre, caso en el cual el índice sería menor a 1; pero el resultado
obtenido frecuentemente es de un índice patológico mayor que 1.

Rango de frecuencias de fonación – extensión tonal: Farias 2010 refiere a la cantidad


de tonos que el paciente puede emitir desde el tono más bajo en registro modal hasta el tono
más alto en falsetto (no incluye el registro pulso). Generalmente se describe es semitonos.
Para obtener este rango podemos utilizar un instrumento musical e instruimos al paciente
para qué cante ascendiendo en la escala tonal a partir de un tono grave cómodo en registro
modal (acompañamos con el instrumento). Se consigna cual es el tono más alto o agudo que
puede producir y cuál es el más bajo o grave (canta la escala descendente) y lo consigamos
en su ficha con la cantidad de semitonos que abarca. Otra forma de notación es en hertz,
buscando la correspondencia entre nota musical y hz en la tabla, o utilizando un medidor
digital que nos indique el valor de Fo en hertz.

Hirano (1981) menciona el rango de frecuencias de fonación fisiológico (RFF) y el rango


de frecuencias musical (RFM). El musical se evalúa especialmente en cantantes y se refiere
a los semitonos que puede abarcar cada cuerda (soprano, mezo, etc.).
El promedio normal de RFF para hombres y mujeres es de 2 octavas y media a 3 octavas
(36 semitonos). Se estabiliza desde la adolescencia y se mantiene aproximadamente hasta
los 60 años, edad a partir de la cual empieza a disminuir.

Frecuencia fundamental: En el habla la frecuencia fundamental varía con los patrones


entonativos. Este rango, llamado rango tonal de voz hablaba, en el que se mueve la Fo suele
ser 4 o 5 tonos, siendo uno de ellos el más usado en promedio y considerado de la frecuencia
fundamental de la voz del sujeto. Si bien la medición de la Fo es un test vocal de valor clínico,
no guarda relación con la habilidad fonatoria.( Farias 2010).
Se puede medir la Fo en el habla habitual en conversación, en lectura, contando o en una
vocal sostenida. El clínico vocal entrenado (obviamente con oído musical) puede obtener la
Fo mientras realiza la historia clínica, cotejando el tono que escucha con el teclado;
considero esta forma como la más eficaz, ya que en emisiones no espontaneas como lo son
la lectura o el sostén de una vocal el paciente suele modificar su Fo.
Cuando el tono correspondiente a la Fo del paciente podemos consignarlo en hertz
buscando el valor en la tabla. También puede obtenerse mediante histogramas de frecuencia
obtenidos por computadora. La Fo promedio habitual es de 190 a 262 hz en mujeres y de
100 hz a 165 hz en hombres (Jackson Menaldi, 2002).
Koishi, Tsuji y cols. (2003) encuentran una Fo promedio habitual de 209,34 hz en mujeres y
138,80 hz en hombres que se desplazan en intensidad elevada a 238,65 hz y 223,44 hz,
respectivamente.
La Fo es más aguda en mujeres que en hombres pero con la menopausia

Do 0 Do #0 Re 0 Re #0 Mi 0 Fa 0 Fa #0 Sol 0 Sol #0 La 0 La #0 Si 0
33 35 37 39 41 44 46 49 52 55 58 62
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Do 1 Do #1 Re 1 Re #1 Mi 1 Fa 1 Fa #1 Sol 0 Sol #1 La 1 La #1 Si 1
65 69 73 78 82 87 92 498 104 110 117 123
Do 2 Do #2 Re 2 Re #2 Mi 2 Fa 2 Fa #2 Sol 0 Sol #2 La 2 La #2 Si 2
131 139 147 156 165 175 185 196 208 220 233 247
Do 3 Do #3 Re 3 Re #3 Mi 3 Fa 3 Fa #3 Sol 0 Sol #3 La 3 La #3 Si 3
262 277 294 311 330 349 370 392 415 440 466 494
Do 4 Do #4 Re 4 Re #4 Mi 4 Fa 4 Fa #4 Sol 0 Sol #4 La 4 La #4 Si 4
523 554 587 622 659 698 740 784 831 880 932 988
Do 5 Do #5 Re 5 Re #5 Mi 5 Fa 5 Fa #5 Sol 0 Sol #5 La 5 La #5 Si 5
1047 1109 1175 1245 1319 1397 1480 1568 1661 1760 1865 1976
Do 6 Do #6 Re 6 Re #6 Mi 6 Fa 6 Fa #6 Sol 0 Sol #6 La 6 La #6 Si 6
2093 2218 2349 2489 2637 2794 2960 3136 3322 3520 3729 3951
Do 7 Do #7 Re 7 Re #7 Mi 7 Fa 7 Fa #7 Sol 0 Sol #7 La 7 La #7 Si 7
4186 4435 4699 4978 5274 5588 5920 6272 6645 7040 7459 7902
Tabla. Notas musicales y sus equivalentes frecuencias en hertz.
Escala temperada La 3 =440 hz( Tomado Farías 2010)

Se agrava en mujeres y se agudiza en los hombres (más de 50 años). El promedio de Fo suele


ascender en lectura, grito y voz proyectada.
En voces patológicas se observa generalmente un descenso de Fo ya que la presencia de
masa (nódulos, pólipo, edema, otros.) disminuye la vibración cordal, lo mismo pasa en
disfonías sin lesión cordal en las que el aire se escapa sin lograr hacer vibrar las cuerdas o
haciéndolas vibrar mucho menos de lo esperado.

Registros vocales. Se relacionan con la frecuencia fundamental de fonación, apareciendo en


el orden mencionado desde la frecuencia posible más baja hasta la más alta. En algunas
frecuencias pueden superponerse, desde el punto de vista clínico es importante la capacidad
de producción en los distintos registros, sobre todo en modal y falsete, las voces patológicas
suelen tener una extensión tonal acortada con pérdida de extremos tonales lo que implica
pocos tonos de modal y a veces pocos o ningún tono falsete.( Farías 2010).

Otras mediciones
Puede realizarse también la valoración aerodinámica, efectuada en el equipo
multidisciplinario por el profesional neumonólogo. Se mide la capacidad vital y puede
entonces obtenerse el cociente fonatorio (PQ) que resulta de dividir esta por el tiempo
máximo de fonación (Farías 2010).

𝑃𝑄 = 𝐶𝑉/𝑇𝑀𝐹
Se considera normal un valor de 145 ml/seg en hombres y 137 ml/seg en mujeres. Medidas
de un PQ por debajo de 69 ml/seg o por encima de 307 ml/seg para los hombres y un PQ
menor a 78 ml/seg o mayor a 241 ml/seg para las mujeres son consideradas anormales
(Hirano, 1981; Prater & Swift, 1986).
Los problemas más comunes encontrados según Jackson Menaldi (1992) son enfisemas,
asma, bloqueamientos nasales, neoplasmas laríngeos, sinequias laríngeas, paresias de
abductores y parálisis de cuerdas vocales.
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

También puede medirse el flujo medio del aire con un neumotacógrafo. Se llama flujo medio
de aire a la proporción de flujo de aire durante la fonación y se mide en mm/seg.

Tesitura: se define como aquella, que clasifica la voz por su amplitud tonal, en la que el
locutor se emite con comodidad sin apurar las notas extremas. Esta amplitud tonal, se sitúa
entre dos octavas y evidentemente hay bastantes excepciones.
Un sentido correcto de interpretar la tesitura, es el que sitúa el conjunto de sonidos, en los
que la voz de adapta mejor, es decir, la parte de la gamma vocal, en que el sujeto se siente
cómodo, sin ningún tipo de fatiga ni esfuerzo.

Duración: la duración de la fonación se evalúa cronometrando cuantos segundos se pueden


mantener una vocal, después de una inspiración profunda. En general se usa la vocal /a/.
El tiempo de duración de la emisión es proporcional a la capacidad pulmonar del sujeto.

Intensidad: para evaluar la intensidad se mide su volumen con un sonómetro a 30cm de la


boca, la prueba se realiza durante la emisión con voz confidencial, conversacional y
proyectada. Los valores aproximados de intensidad se encuentran entre 55 y 65dB para voz
confidencial, 65 a 80dB para voz conversacional y entre 80 a 90 db SPL para voz proyectada.
Para evaluar la producción de una nota con variación de intensidad se utiliza el Efecto
Kaisser el cual debe tener un ataque suave y armónico, un cuerpo constante, sonoro, potente,
proyectado y una filatura que termine en una inflexión descendente.

Timbre: el timbre se podrá evaluar perceptualmente verificando si durante la conversación


espontánea o la voz cantada se evidencia signos de afección. Se realiza además prueba de
Glatzer, identificación del registro y valoración del comportamiento o suficiencia velar.
Para evaluar la resonancia se solicita al trabajador que emita una /m/ y vocales
prolongadas brindando la respectiva demostración, durante esta emisión se separan los
segmentos craneal, facial, laríngeo, nasal, faríngeo y pectoral. Se debe prestar atención
también a los cambios de registro resonancial durante la emisión.

La bibliografía describe múltiples adjetivos para caracterizar la cualidad vocal: ronca, áspera,
soplada, raspada, etc. Utilizándose más de cien términos distintos (Boone, 1997).
Aún hoy la definición de estos términos es controversial y no común a todos los vocólogos.
Acústicamente el timbre se define por el espectro. Depende de la forma, el tamaño y la longitud
del tracto vocal. Se hace necesaria la unificación de términos a emplear y la estandarización de
la evaluación psicoacústica de la voz patológica, y establecer un consenso entre el juzgamiento
auditivo y su correlato fisiológico y acústico.
Evaluar la calidad vocal implica consignar las alteraciones que percibimos (voz ronca, gutural,
velada, etc.) y si estas son estables o limitadas a determinados sonidos. Los trastornos pueden
originarse por señales acústicas defectuosas desde la glotis suelen dar una cualidad vocal
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

defectuosa pareja, mientras que los originados desde el acoplamiento resonancial inadecuado se
limitan a aquellos sonidos que se producen vinculados a dichos acoples. Estos últimos serán
abordados en el capítulo de patologías específicas. Farias 2010

Oído musical: se evalúa mediante la voz cantada, determinando la capacidad del individuo de
repetir una melodía previamente escuchada del evaluador (oído receptivo) para evocar y
reproducir por si solo una melodía aprendida (oído expresivo).

Escalas GRBAS y RASAT


En la literatura mundial se presentaron varias propuestas de evaluación vocal perceptiva
(Hisshiki, 1996; Isshiki et al, 1969; Hiroto, 1969; Takahashi y Kolie, 1976, Yoshida, 1979).
Una de las escalas de evaluación vocal perceptiva más difundida es la escala GRBAS, creada por
el Comité para Tests de la Función Fonatoria de la Sociedad Japonesa de Logopedia y Foniatría
en 1969, para evaluar la ronquera (hoarseness). Consiste en cinco escalas: grade-grado (G),
rough-aspereza (R), breathy-soplosidad (B), asthenic-astenia (A) y strained-tension (S). Cada
escala se mide con cuatro puntos: “0”normal, “1” leve, “2” moderado, y “3” severo.
 G: Representa el grado de ronquera, grado general de desvío de la voz.
 R: Representa la impresión psicoacústica de irregularidad vibratoria se corresponde con
fluctuaciones irregulares en Fo y/o amplitud del sonido de fuente glotal.
 B: Representa la impresión psicoacústica de aumento del escape de aire a través de glotis.
Es relativo a la turbulencia.
 A: Representa quiebres o falta de potencia en la voz. Se pierden armónicos agudos y la Fo
y la amplitud se vuelven inestables.
 S: Representa la impresión psicoacústica de un estado de fonación hiperfuncional. Se
correlaciona con una Fo anormalmente alta, presencia de ruido en altas frecuencias.

Pinho & Pontes (2002) consideran necesario distinguir entre ronquera y aspereza basándose en
los siguientes conceptos:
Para Isshiki (1980) la ronquera se corresponde con la irregularidad vibratoria de la mucosa de
las cuerdas vocales durante la fonación por:
 Presencia aislada de hendidura glótica mayor o igual a 0,5 𝑚𝑚2 .
 Presencia aislada de alteración orgánica en la mucosa vibratoria.
 Hendidura de cualquier dimensión asociada a la presencia de alteración orgánica de la
mucosa vibratoria.
Los cuadros comunes de ronquera son los nódulos cordales, hiperemias y edemas, esto genera
ruidos adventicios en bajas frecuencias. La voz es irregular con u ruido similar al sonido de una
bandera temblando frente a un viento fuerte.
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

La esperanza se relaciona con la rigidez de mucosa, la que también causa irregularidad vibratoria
que depende de la presencia o ausencia de hendidura glótica y de la asociación con otras
alteraciones laríngeas como el edema. La voz áspera (que impresiona seca y sin proyección) se
caracteriza acusicamente por la presencia de ruido en altas frecuencias, tal vez por el exceso de
aire necesario para iniciar la vibración de la mucosa rígida, lo que favorecería la visualización
de los armónicos inferiores. Un ejemplo típico sería la voz áspera por rigidez de mucosa en sulcus,
sinequias.

Según Prater & Swift (1986) la voz áspera se caracteriza por aperiodicidad del tono laríngeo y la
ronquera consiste en la combinación de soplo más voz áspera. De tal forma la ronquera varía
según la contribución relativa de los componentes de soplo y aspereza.

Pinho & Pontes (2002) adaptan la escala a Brasil y la nombran RASAT, siendo:
 R ronquera
 A aspereza
 S soplosidad
 A astenia
 T tensión
Se utiliza el mismo puntaje propuesto en GRBAS: 0, 1, 2 y 3.
RASAT no presenta controversias con el GRBAS en cuanto a la soplosidad la astenia y la tensión;
pero reemplaza grado de ronquera (G), por ronquera (R), distinguiéndolo del segundo parámetro
(A) aspereza.
Se sugiere evaluar estas escalas mediante vocales sostenidas (/a/-/e/) y habla encadenada

Las observaciones realizadas como producto de la experiencia de Patricia Farias en la atención


de pacientes con disfonías clasifica la sintomatología en una escala de severidad que se resume
en el siguiente cuadro:

Leve Moderado Severo


TMF De 10 a 15 segundos Alrededor de 10 segundos Menor de 10 segundos
Eficiencia de cierre glótico y Levemente ineficiente Mayor falta de cierre y escape de Ineficiencia absoluta de cierre
respiratoria de aire glótico y de control respiratorio
Relación S/Z Cociente 1 o ligeramente Cociente aumentado, 1.2 Cociente elevado, más de 1.2, o
aumentado (1.1) menor a 1
Efecto Kayser Alteración inestable de ataque y/o Ataque y filatura alterados; Ataque, cuerpo y filatura muy
filatura cuerpo sin alteración o con leve alterados (golpe glótico, temblor,
inicio de alteración cortes, cese brusco de emisión,
etc.)
Desplazada 1, 1 1⁄ o 2 tonos
Frecuencia fundamental Adecuada o desplazada por Desplazada más de dos tonos
momentos 2
Presencia de registro Conservados, con posible soplo Conservados pero con cortes, Pérdida de alguno o más
en agudos, o reemplazo agujeros tonales, dificultades de registros: de frito y de falsete, o
(modificable) de tonos de modal pasaje de falsete, o de frito y modal
por falsete y viceversa
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Intensidad Regulación conservada Se regula con dificultad, se Se pierde en forma permanente


dificulta la emisión en pianos o en la emisión en pianos o en fortes
fortes
Timbre Adecuado o levemente fuera de Alteración tímbrica modificable Alteración tímbrica permanente
foco (ej:nasal) con estimulación que influye en la falta de
inteligibilidad
Ligados en escala Conservado Aparecen dificultades Pérdida de ligado
intermitentes
Ruidos en la voz Ninguno Aparición intermitente de Presencia de ruidos
aspereza, disfonía, tensión, permanentemente: voz áspera y
cortes ronca con pérdida de
musicalidad.
Fatigabilidad al examen Ninguna o muy leve Aparece después de un tiempo Aparece enseguida
considerable

Si por otra parte es importante considerar que esta gradación o severidad sintomatología influirá
en el pronóstico así como también influirán la antigüedad de la disfonía y el tiempo de
recuperación de los estados críticos.

ANALISIS ACUSTICO OBJETIVO DE LA VOZ

Para Jorge Gurlekian en el 2005, el análisis objetivo de la voz es un estudio no invasivo que
proporcionan datos cualitativos y cuantitativos. Provee herramientas para realizar
operaciones de entrada y salida de información analógica hacia y desde un sistema
computarizado. A través del equipo se puede obtener una descripción de las características
de la voz y el habla en base a diversos parámetros acústicos.

Se utilizan algoritmos y técnicas de análisis para determinar valores y evalúa aspectos como:
Intensidad sonora sobre distintas bandas espectrales, modelo del tracto vocal y frecuencias
de resonancia es decir los formantes( F1 F2 F3, F4 ), estimación de la frecuencia de
vibración de las cuerdas vocales, frecuencia fundamental ( Fo), analiza el shimmer :
variación y perturbación de la amplitud, el Jitter: medida de variabilidad de la frecuencia
fundamental armónico/ruido: relación del sonido emitido y el ruido generado por el propio
usuario.
La valoración se realiza a través de un análisis en el espectrograma en los ejes de
frecuencia, energía y tiempo. La herramienta que frecuentemente usa el Fonoaudiólogo para
analizar subjetivamente la voz, es su audición, pero esta valiosa información no puede ser
cuantificada, siendo necesario valerse para esto de un “Laboratorio de Voz”, donde sea
posible realizar la evaluación objetiva de la misma.

El análisis acústico de la voz es un método utilizado para comparar la voz antes y después
de alguna intervención preventiva o rehabilitadora por el Fonoaudiólogo. De igual manera
ayuda a caracterizar la voz y verificar los cambios vocales de acuerdo a la edad, género y
utilización de la voz.
Los parámetros acústicos de la voz:
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Tomado: Libia María Botero nov. 2008

ANCHO DE BANDA: Valor en Hz correspondiente a la diferencia de frecuencias que se


obtiene al descender 3 decibeles (dB) del valor máximo del pico del espectro.

ARMÓNICOS: En una señal periódica, son las frecuencias múltiplo de la frecuencia


fundamental. Algunos armónicos pueden coincidir con las frecuencias de los formantes.
CAVIDADES RESONANCIALES: Segmentos volumétricos en que puede dividirse el tracto
por encima de la glotis hasta los labios. Puede clasificarse en cavidad anterior, media y
posterior para modelos de 3 tubos o cavidad faríngea, constricción, cavidad oral. Existen
también las cavidades, nasal, faríngea y extra, entre otras.
CRUCES POR CERO – ZC: Mide los contenidos de frecuencias presentes en la señal. Se
basa en la cantidad de veces que la señal cruza el nivel cero de referencia, se cuantifica el
cambio de signo en las muestras de la señal digitalizada.
ENERGÍA: Representación de la onda basada en la sumatoria al cuadrado de los valores de
la amplitud de todas las frecuencias durante un corto tiempo. Se mide en dB y caracteriza la
sonoridad.
ESPECTROGRAMA: Visualización del espectro conformado por la representación de las
energías (eje y) para cada componente de frecuencia (eje x) para un segmento de onda de
corta duración de 2 a 3 ciclos de frecuencia fundamental (Fo)
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

FORMANTES: Frecuencias naturales de resonancia de todas las cavidades supraglóticas,


en el momento de producir un sonido determinado. F1, abertura de la mandíbula; F2, forma
del cuerpo de la lengua; F3, posición de la punta de la lengua; F4, F5, formantes del
cantante. Estos caracterizan el timbre.
FORMA DE ONDA: Representación de una señal acústica continuamente variable en
amplitud y frecuencia en el tiempo.

FRECUENCIA FUNDAMENTAL O ALTURA TONAL: corresponde a la vibración de los


pliegues vocales, se mide en Hz, y cuantifica el número de aperturas y cierres de la glotis
por segundo. Este aspecto no tiene diferencias entre personas con o sin educación vocal, lo
que hace la diferencia es de qué manera se hacen la fase de apertura y cierre. Cuando se
habla de diferencia de frecuencias, se refiere a que un sonido con mayor frecuencia da como
resultado uno agudo, menor frecuencia será un sonido grave, por lo que se clasifica la voz
del hombre de 70 a 220 Hz y la de la mujer de 150 a 330 Hz; la voz del niño entre 200 y
440Hz.

FRECUENCIAS NATURALES DE RESONANCIA: Frecuencias de la máxima energía de


una cavidad resonancial. Estas frecuencias varían constantemente de acuerdo a la posición
de los órganos móviles.
JITTER: Mide la variación del período del tono fundamental ciclo a ciclo. Se basa en la
detección de picos periódicos máximos en la señal y en la premediación de la desviación en
cada ciclo. Se mide en milisegundos.
MÁXIMO RENDIMIENTO DE ENERGÍA: Se produce cuando la frecuencia del armónico y
la frecuencia del formante se aproximan hasta igualarse.
En esta condición la energía del formante se eleva y disminuye el ancho de banda.
RELACIÓN ARMÓNICO RUIDO: Mide la relación de energía en dB que tiene un
componente periódico de la señal con respecto a los componentes ruidosos. Según Yumoto
et al, 1982 si el Jitter es alto, la medida no es válida.
SHIMMER: variación de la amplitud de la onda ciclo a ciclo. Se basa en el grado de
correlación que tienen los picos periódicos de la función de autocorrelación.

Derivada de R/M: medición de la pendiente inicial de la curva de energía total. Este valor
junto con la presencia o no del sobre pulso más la valoración subjetiva, determinan la
modalidad de ataque vocal.

Se consignan las características acústicas percibidas en la emisión vocal en el siguiente


cuadro diseñado por Facal 1998, con modificaciones desarrolladas en Colombia:

Parámetro acústico Variación acústica Correlato acústico


Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Energía total: Normal Sonoridad media


Ascendida Sonoridad fuerte
Descendida Sonoridad débil
Regular y continua Emisión ligada
Irregular Emisión temblorosa
Con cortes repentinos Emisión con quiebres
Crecimiento inicial gradual Ataque vocal normal
Crecimiento inicial rápido Ataque vocal duro
Ausente en final de frase Final de frase
“Abortado”

Frecuencia Fundamental: Regular Emisión ligada


Irregular Con componente de ruido

Ausente Afonía
Cuchicheo
Valores normales Tono medio
Ascendida Tono agudizado
Descendida Tono agravado
Sin variación Modulación monótona
Con doble contorno Diplofonía
Con cortes de diferente tono *Bitonalidad *
Rango disminuido Extensión vocálica
limitada

Formantes: Valores normales Articulación correcta


Valores desplazados Articulación incorrecta
Formantes altos normales Voz con mordiente
Formantes altos atenuados Voz opaca
Formantes bajos normales Voz con volumen
Formante 1 de /a/ valor bajo Hipernasalidad en /a/

Formantes altos atenuados Voz sin volumen


Banda de los formantes normales Voz con mordiente
Banda Formante 1 aumentada Voz
hiponasalizada

Banda formantes 3,4 aumentada Voz sin mordiente

Ruido: En todo el espectro Ruido acoplado


Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

En posición inicial de la emisión Ataque soplado

Los datos obtenidos de la evaluación objetiva permiten:


 Organizar estadísticas y bases de datos.
 Llevar a cabo trabajos de investigación científica.
 Realizar comparaciones en un mismo paciente antes y después de un tratamiento
fonoaudiológico o de una cirugía vocal.
 Mostrar en forma concreta al paciente los avances del tratamiento.
 Documentar los cambios que se producen en el tratamiento.
 Complementar el estudio subjetivo y otorrinolaringológico.

El laboratorio de análisis de la voz está compuesto por:


1. Micrófono
2. Computadora.
3. Placa de sonido
4. Programa de análisis: su función es la de obtener una descripción de la voz en términos
de distintos parámetros acústicos característicos de la misma.
5. Ventana de gráficos: se puede observar:
- En la parte superior, el espectrograma que representa la frecuencia vs. tiempo vs.
energía.
- en la parte media la forma de onda (amplitud vs. tiempo) que muestra la variación
de la amplitud de la onda ciclo a ciclo.
- en la parte inferior se encuentra el tono fundamental (fo) y la energía total, ambos
en sincronía temporal con el espectro.
6. Ventana de valores numéricos: se puede observar:
- Valores instantáneos de tiempo, frecuencia, energía, amplitud, energía total,
frecuencia fundamental, cruces por cero.
- Valores de formante, ancho de banda y energía de cada formante de acuerdo al
instante temporal que se haya especificado con la flecha y activado con la tecla
izquierda del Mouse.
- Valores calculados para un segmento previamente pintado. Estos son: jitter,
shimmer, Fo promedio, relación armónico-ruido (H/N) y Duración.
- Valor correspondiente a la pendiente de la curva de Energía Total: derivada de R/M.

MODELO ANALISIS ACUSTICO FARÍAS 2010

Para obtener un registro acústico de la voz se debe realizar una grabación digital, para luego
efectuar el análisis acústico de dicha voz. Se utiliza un micrófono unidireccional que capte la gama
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

de frecuencias de sonidos del habla (0hz a 20khz) conectado a la grabadora digital o directamente
a la computadora. Se le coloca a 10 cm de la boca del paciente.
Una vez grabada la voz del paciente tendremos registrados archivos de vocales sostenidas (/a/, /i/,
/u/) y habla conectada. En la vocal sostenida descartaremos el ataque y la filatura de la emisión.
Estos archivos wav son ondas sonoras que analizaremos con programas diseñados a tales fines
(ANAGRAF, CSL, Doctor Speech, Praat, Visipich entre otros) obteniendo las siguientes
mediciones:

Frecuencia fundamental o altura tonal o periodo fundamental

a. Fo promedio en una emisión sostenida.


b. Rango de frecuencias de fonación en habla conectada.
c. Contorno de pitch.
d. Fluctuación en una emisión sostenida: periodicidad o aperiodicidad de la señal ciclo
a ciclo: jitter.

Intensidad o presión sonora o amplitud

a. Intensidad promedio en una emisión sostenida.


b. Rango de intensidad de fonación en habla conectada.
c. Contorno de energía.
d. Fluctuación en una emisión sostenida: Periodicidad o aperiodicidad ciclo a ciclo:
Shimmer.

Espectro

a. De banda ancha (LPC) – Formantes.


b. De banda angosta (FFT) – Armónicos.
c. Envolvente espectral.
d. Proporciones de la señal respecto al ruido (HNR).

El Jitter, el shimmer y la proporción de armónicos versus ruido, son los índices de


estabilidad de la señal acústica de un periodo al siguiente, es decir, reflejan la estabilidad
fonatoria a corto plazo, y se miden obviamente en vocales sostenidas. A partir del espectro
acústico podemos valorar la calidad de la voz: soplada, áspera y ronca.

Clasificación de ronquera según Yangihara (Farías 2010)


Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

En base al análisis espectrográfico de voces disfónicas, Yanagihara (1967) propone una


clasificación de la ronquera en cuatro tipos (el análisis espectrográfico normal se considera
Tipo 0:
 Tipo I: existe una mezcla sutil entre los componentes armónicos de las vocales y
componente de ruido principalmente en la zona de los formantes de las vocales.
 Tipo II: las componentes de ruido en el segundo formante de /e/ y de /i/ predominan
sobre los componentes armónicos y aparecen componentes de ruido adicional en
altas frecuencias alrededor de 3000 hz en dichas vocales.
 Tipo III: el segundo formante de /e/ y de /i/ es totalmente reemplazado por
componentes de ruido y se incrementan los componentes de ruido adicional
alrededor de 3000 hz.
 Tipo IV: el segundo formante de /a/, de /e/ y de /i/ es reemplazado por componentes
de ruido, e incluso el primer formante de todas las vocales a menudo pierde sus
componentes armónicos siendo reemplazados por componentes de ruido. Se suman
componentes de ruido aún mayores en altas frecuencias.

Las mediciones mencionadas son las básicas de todos los programas. Según el programa
con el que se efectúe el análisis se agregaran otras medidas tales como distintos tipos de
jitter (factor, ppq, rap, etc.), distintos tipo de shimmer (local, apq, local db, etc.), el índice
de turbulencia vocal (VTI), numero de quiebres vocales (NVB), energía de ruido
normalizado (NNE).

Al comparar la situación previa y posterior al tratamiento, además del uno del mismo
programa, es importante controlar los factores de intensidad y frecuencia de la producción
vocal, ya que influyen en los grados de perturbación y ruido (Morrison, 1994, 1996).
Los programas de análisis acústico también difieren en el empleo de algoritmos (formulas
matemáticas). De estas ecuaciones dependen las medidas clínicas que se obtendrán como
resultado. La data normativa utilizada con la que se comparan los datos clínicos debe
basarse en el empleo de los mismos aparatos, programas y funciones.

Habría que plantearse como se obtiene en las investigaciones un grupo control (de supuesta
voz normal) para comparar con los grupos patológicos. Según distintos autores de los
últimos años se considera que un sujeto es el más próximo a tener una voz normal si se
cumple los siguientes requisitos: no fumador, sin historia previa de trastorno vocal, sin
problemas respiratorios, neurológicos, nasosinusales y faringolaríngeos previos, sin
antecedentes de alergia, audición normal y sin uso profesional de la voz (Casado Morente y
cols, 2001).
En el campo del análisis de disfonías, el estudio que nos dará mayor información es el
estudio de las vocales, ya que lo que nos interesa en una disfonía es la alteración de la fuente
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

glótica. El estudio del hala en contexto nos da información adicional en cuanto a promedios
de frecuencia e intensidad utilizados, así como la influencia de la coarticulación sobre la
fuente de emisión.

Clasificación de voces según el National Center for Voice and Speech

No siempre es posible realizar los análisis acústicos, dependiendo esto de lo caótica que
pueda resultar la emisión. El National Center for Voice and Speech (Titze, 1995) recomendó
que la evaluación de la voz patológica debe comenzar con la realización de un análisis
espectográfico para clasificarla con el fin de determinar los métodos de estudio más idóneos
para ese caso en particular. Clasifica las voces en tres niveles:

 Tipo 1: voz normal y voz patológica con vibraciones casi periódicas. Debería ser
analizada por medio de los parámetros de perturbación a corto plazo (jitter,
shimmer, NNE y HNR).
 Tipo 2: voces patológicas con subarmonicos y modulaciones. Perturbación mayor
del 5%. No puede ser analizada de forma fiable con los parámetros antes
mencionados. Se estudiará mediante algún método perceptual como el GRBAS y por
medio de un método visual como el espectrograma.
 Tipo 3: voces caóticas o random. Solo pueden ser estudiadas mediante métodos
perceptuales (GRBAS).
Así como los resultados de la valoración perceptual (independientemente de la escala
utilizada) deben coincidir con los hallazgos laringológicos, es necesario que tanto los
primeros como los segundos se correspondan con los hallazgos clínicos acústicos.

Evaluación del riesgo vocal


Farias en el 2010 describe que según la Organización Mundial de la Salud – OMS- la salud
es un estado de completo bienestar físico, mental y social, y no solo la ausencia de
enfermedad o dolencia (1974). La época actual (aproximadamente, desde 1941 hasta ahora)
es la de la tecnificación (aparatología) y de la colectivización de la medicina.

En el mundo de hoy estamos expuestos a tal grado de contaminación sonora que sobreexige
el aparato vocal a los fines de lograr un rendimiento mayor. Por otro lado, la competitividad
creciente en el mercado en función del incremento de oferta ha generado el desarrollo de
modelos de venta basados en un “speech” preciso, ágil y rápido que pretende aumentar la
demanda del consumidor, tal es el caso, por ejemplo, de lo que les ocurre a los telemarketers.
En consecuencia las enfermedades vinculadas al uso de la voz se han acrecentado.

Para ello Farías 2010 construyó una escala de Valoración en escala sugerida para
determinar el riesgo vocal.
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Ante las posibles demandas laborales por parte de los empleados y de las administradoras
de riesgo ocupacional las empresas pretenden evaluar el posible riesgo vocal en forma
previa al contrato del empleado. A tales fines se solicita dentro de los exámenes
preocupacionales un examen ORL y una “espectrometría” (tal es el nombre que utilizan las
empresas para denominar a la evaluación acústica que efectúa el fonoaudiólogo
capacitado). Si una empresa pretende evaluar el posible riesgo vocal de un sujeto ante la
eventual exigencia laboral, sugiero la evaluación por parte de un fonoaudiólogo y medico
ORL completando las siguientes fichas:

Valoración en escala del examen ORL


0 equivale a laringe normal.
1 equivale a alteración funcional sin lesión en cuerdas vocales (ej: hiatus, cierre de bandas, constricción supra glótica, etc.).
2 equivale a alteración funcional con lesión en cuerdas vocales (nódulos, esbozos de nódulos, engrosamiento).
3 equivale a lesión orgánica (pólipo, surco, edema, quiste).

Valoración en escala del examen perceptual y espectrometría


0 equivale a voz normal.
1 equivale a alteración vocal leve.
2 equivale a disfonía de grado moderado.
3 equivale a disfonía de grado severo.

De tal manera los 0 y 1 se consideran aptos, siempre que q sea controlado. 2 y 3 no serían aptos.

Índice de discapacidad vocal


Más allá de la evaluación por parte del profesional capacitado, se hace necesaria una
evaluación de la función vocal global por parte del paciente. Su percepción de la disfonía
nos informará acerca del deterioro en su calidad de vida. Las expectativas y necesidades
vocales varían de un individuo a otro y no pueden conocerse en profundidad a través del
examen convencional.
En 1997 Jacobs y cols Proponen el Voice Handicap Index (VHI) o Índice de Discapacidad
Vocal. Consiste en 30 items igualmente distribuidos en 3 dominios: funcional, físico y
emocional, que contemplan las percepciones del paciente.
Lo transcribimos a continuación:

Instrucciones: las siguientes son afirmaciones que mucha gente utiliza para describir su voz
y efectos de ella en su vida cotidiana. Marque con un círculo las respuestas que indican con
qué frecuencia Ud tuvo una experiencia similar.
Puntuación:
0 = Nunca; 1 = Casi Nunca; 2 = A Veces; 3 = Casi siempre; 4 = Siempre.

Parte I: Funcional
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

1. A la gente le resulta difícil oír su voz.


2. La gente tiene dificultad para oírme donde hay ruido.
3. Mi familia tiene dificultad de oírme cuando los llamo adentro del hogar.
4. Yo utilizo el teléfono menos de lo que me gustaría.
5. Yo tiendo a evitar la conversación en grupo debido a mi voz.
6. Yo hablo poco con amigos, vecino o parientes debido a mi voz.
7. La gente me hace repetir cuando hablamos cara a cara.
8. Mi voz restringe mi vida personal y social.
9. Debido a mi voz me siento fuera de las conversaciones.
10. Mi problema de voz me lleva a perder ingresos.

Parte II: Física

1. Me quedo sin aire al hablar.


2. El sonido de mi voz varía a lo largo del día.
3. La gente me pregunta ¿qué pasa con tu voz?
4. Mi voz suena seca y quebradiza.
5. Siento que tengo que ponerme tenso para generar la voz.
6. La claridad de m i voz es impredecible.
7. Trato de cambiar mi voz para tener otro sonido.
8. Hago un gran esfuerzo para hablar.
9. Mi voz empeora a lo largo del día.
10. Mi voz se reciente en la mitad de la conversación.

Parte III: Emocional

1. Debido a mi voz me pongo tenso al hablar con los demás.


2. La gente parece irritarse con mi voz.
3. Pienso que la gente no entiende mi problema con la voz.
4. Mi problema con la voz me supera.
5. Salgo menos debido a mi problema de voz.
6. Mi voz me hace sentir disminuido.
7. Me siento incómodo cuando la gente me hace repetir.
8. Me siento anulado cuando la gente me hace repetir.
9. Mi voz me hace sentir incompetente.
10. Estoy avergonzado debido a mi problema con la voz.
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

En cada ítem la puntuación máxima que se puede obtener es de 40 puntos y clasificamos de


incapacidad vocal leve (menos de 20 puntos), incapacidad moderada (21-30 puntos) e
incapacidad severa (más de 30 puntos). Sumando las tres escalas, la puntuación máxima
obtenible es de 120 puntos; y clasificamos de incapacidad vocal leve (menos de 30 puntos),
moderada (31-60 puntos), severa (61-90 puntos) y grave (91-120 puntos).
Los autores dicen que el índice puede ser utilizado para evaluar la efectividad de técnicas
de tratamiento específicas como los ejercicios de función vocal, o el método del acento, etc.,
y terapias médicas o quirúrgicas.
Señaris González y cols. (2006) estudian la relación del índice con otros parámetros y
concluyen: la puntuación del VHI se relaciona con la relación armónico-ruido (HNR) y con
los parámetros B y S del sistema GRBAS. Las subescalas funcional y emocional son las que
contribuyen a dicha relación, pero no la física, por lo que esta subescala del VHI es
independiente de los parámetros analizados.
Rosen y cols en el años de 2004 proponen una forma más corta del VHI para el seguimiento
de la función vocal en la evaluación inicial y de control de los pacientes con desórdenes
vocales:

3.8.7 Voice Handicap Index-10 (Rosen y cols., 2004)


(Puntuación: 0 n-1 cn-2 av-3 cs-4 s)

Fu1 A la gente le resulta difícil oír mi voz.


Fu2 La gente tiene dificultad para oírme donde hay ruido.
Fu8 Mi voz restringe mi vida personal y social.
Fu9 Debido a mi voz me siento fuera de las conversaciones.
Fu10 Mi problema de voz me lleva a perder ingresos.
Fi5 siento que tengo que ponerme tenso para generar la voz.
Fi6 La claridad de mi voz es impredecible.
E4 Mi problema con la voz me supera.
E6 Mi voz me hace sentir disminuido.
Fi3 la gente me pregunta ¿Qué pasa con tu voz?

La ventaja de la forma corta del índice es que puede ser administrado y evaluado
rápidamente. Los autores que lo proponen demostraron mediante análisis estadísticos
diferencias no significativas entra la aplicación de un índice o el otro. Concluyen diciendo
que el VHI-10 es una poderosa representación del VHI que le toma menos tiempo al paciente
para ser completada, sin perder por ello validez y eficacia diagnostica.

3.8.8 Índice de discapacidad vocal. Adaptado de Koschkee


Jackson Menaldi (2002b) cita el siguiente Índice de discapacidad vocal adaptado de
Koschkee (1993) que ayuda a determinar el grado de discapacidad percibida por el
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

individuo en su casa, trabajo y vida social. La autora lo utiliza para determinar la


discapacidad pre y post tratamiento:

Índice de Discapacidad Vocal


Apellido__________________________ Fecha_________________________
Trabajo
Mis problemas afectan mi trabajo

7 6 5 4 3 2 1
Normal Mínimo Suave Moderado Significante Severo Profundo
Vida Social: Actividades de placer
Mis problemas vocales afectan mi vida social

7 6 5 4 3 2 1
Normal Mínimo Suave Moderado Significante Severo Profundo
Vida Familiar: Responsabilidad en el hogar
Mis problemas vocales afectan mi vida familiar- Responsabilidades hogareñas

7 6 5 4 3 2 1
Normal Mínimo Suave Moderado Significante Severo Profundo

Adaptado de Koschkee (1993) Disability Sacle, Psychiatric Clinic, University of Wisconsin.


Hospital and Clinics. Madison, Wisconsin.

3.8.9 Siete niveles de calidad vocal


En el Laboratorio de Voz en donde ejerce la Dra. Jackson Menaldi (2002b) envían al
paciente una ficha de control con los siete niveles de calidad vocal, para ser reenviada con
comentarios del estado de su voz después de haber sido dado de alta (varios meses
posteriores):

Nombre del paciente:


Fecha de la última entrevista:
Por favor marque con una X su elección

Profundo Severo significante Moderado Suave Mínimo Normal


1 2 3 4 5 6 7

Nivel 1: Imposible usar la voz para comunicarse.


Nivel 2: La mayoría del tiempo la voz no es funcional para comunicarse.
Nivel 3: La voz es funcional para comunicarse pero es inestable e interfiere con la comunicación.
Nivel 4: La voz es funcional pero algunas veces distrae al interlocutor.
Nivel 5: Algunas veces la voz suena normal. La voz se modifica cuando la demanda es alta.
Nivel 6: La voz suena normal la mayoría del tiempo.
Nivel 7: La voz es normal.

Valoración en escala sugerida por la autora para determinar el riesgo vocal


Ante las posibles demandas laborales por parte de los empleados y de las administradoras
de riesgos laborales, las empresas pretenden evaluar el posible riesgo vocal en forma previa
al contrato del empleado. A tales fines se solicita dentro de los exámenes preocupacionales
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

un examen ORL y una “espectrometría” (tal es el nombre que utilizan las empresas para
denominar a la evaluación acústica que efectua el fonoaudiólogo capacitado). Si una
empresa pretende evaluar el posible riesgo vocal de un sujeto ante la eventual exigencia
laboral, sugiero la evaluación por parte de un fonoaudiólogo y medico ORL completando
las siguientes fichas:

EVALUACION DE LA FUNCIÓN RESPIRATORIA (Apartes trabajo Investigación


Campo , Cárdenas y cols Unicauca 2012, Farías 2010).

Son pruebas subjetivas que son de apoyo para determinar la mecánica respiratoria y la
coordinación fonorespirarticulatoria. Los parámetros a tener en cuenta para la valoración
de la función respiratoria son:

Modo Respiratorio: Bustos, I. (1995),indica que es la vía mediante la cual se produce un


flujo de aire durante la inspiración es decir cuando se hace una inspiración tranquila y entra
por la nariz exclusivamente o respiración nasal, que es la que se efectúa por la nariz quien
tiene como función filtrar, calentar y humedecer el aire: la respiración por la boca o
respiración oral, se produce a través de la cavidad bucal por diversos factores ya sean
anatómicos, fisiológicos o como hábito, este modo respiratorio es anormal e impide los
procesos de filtrar, calentar y humedecer el aire, o por las dos vías conocido como modo
respiratorio mixto; se presenta cuando el aire atraviesa por nariz y boca, pero generalmente
tiene alguna predominancia, ya sea nasal o bucal. Se evalúa mediante observación tanto en
reposo como en fonación.

Se observa desde el momento en que la persona llega a la evaluación y el transcurso de ella.


Registrando un modo respirador nasal, cuando su respiración sea solamente por la nariz,
manteniendo la boca cerrada, un modo respiratorio oral, cuando este permanece la mayor
parte del tiempo con la boca abierta y mixta cuando se presente las dos características
mencionadas. Posteriormente y con el fin de corroborar el modo respiratorio se le colocara
en la parte inferior de la nariz del evaluando un espejo de Glatzer, se le pedirá realizar 20
inspiraciones, si el paciente es respirador oral, abrirá la boca antes de finalizar la prueba,
mientras aumenta la frecuencia del pulso y la respiración. Bustos Inés (1995)

Tipo Respiratorio: Autores como Bustos, I. (1995), Boone, D. (1983) y Prater y Swift (1986),
definen el tipo respiratorio como las diferentes formas en que el aire inspirado se concentra
en la cavidad torácica, este puede determinarse por la observación atenta de la región del
cuerpo en la cual efectúa el mayor grado de movimiento durante el ciclo respiratorio, se
distinguen tres tipos respiratorios: para Bustos se clasifican en costal superior, medio o
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

costo diafragmático abdominal e inferior o abdominal. Para Boone, D. (1983) y Prater y


Swift (1986); clavicular, diafragmático - abdominal y torácica.

Para la primera clasificación, el tipo respiratorio costal superior hace referencia al aire
inspirado que se concentra en la zona de las costillas superiores y de la clavícula,
movilizándolas en mayor grado cuando más profunda es la respiración. Esta constituye la
forma de respirar más usual en las mujeres y no es la más adecuada para lograr una
completa ventilación de los pulmones; este tipo respiratorio es inadecuado e insuficiente
tanto para la función respiratoria como para la fonatoria.

El tipo medio o costo diafragmático abdominal hace referencia al aire que se concentra en
la zona de las falsas costillas y el diafragma, participa en movimientos respiratorios
ascendiendo y descendiendo, empujando el abdomen, es el tipo respiratorio fisiológico
correcto en el que se consigue buena ventilación pulmonar y es el apoyo necesario para la
función vocal.

Se evalúa mediante la observación y medición de la región corporal que efectúa mayor grado
de movimiento durante el ciclo respiratorio. Los registros se realizaran de la siguiente
manera: tipo costal superior, cuando se evidencie elevación de hombros y expansión de la
parte superior del tórax en el momento de inspirar; medio o costo diafragmático abdominal,
cuando exista mayor expansión de la región torácica media durante la inspiración; inferior
o abdominal, cuando hay mayor expansión torácica inferior y de la zona abdominal durante
la inspiración.

Para corroborar el tipo respiratorio encontrado se colocara al paciente de espaldas al


examinador, este colocara las manos con los dedos pulgares sobre la columna y el resto de
dedos hacia afuera. Primero se efectúa a la altura de la primera y segunda vértebra dorsal,
mientras el paciente respira normalmente; luego se van desplazando las manos hasta la zona
de cintura observando en cada lugar y a lo largo del tórax: si los pulgares se desplazan
hacia afuera en la inspiración, si estas separación es simétrica y en que sitio se desplaza
más lateralmente. Esta última dará una noción acertada sobre el tipo de respiración del
paciente, ya que el mayor desplazamiento lateral de los pulgares, corresponde a la zona de
mayor concentración del aire. Se espera encontrar en las personas encuestadas una
respiración costo diafragmática. Bustos, Inés (1995).

FRECUENCIA RESPIRATORIA: Se le pedirá a la persona evaluada que respire mientras el


evaluador contabiliza el número de respiraciones por minuto. Este aspecto se encuentra
normal, si esta en un rango de 16 a 18 respiraciones por minuto para hombres y de 18 a 20
respiraciones por minuto para mujeres.
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

Cuando la frecuencia es mayor de 20 respiraciones por minuto o menor de 16 (reposo) se


podría considerar anormal, encontrándola aumentada o disminuida. Bustos, Inés (1995).
Se requiere un cronometro para su evaluación.

TIEMPO MAXIMO DE FONACIÓN: Se evalúa pidiéndole a la persona emitir la vocal /a/


de forma sostenida; el evaluador cronometrara el tiempo desde el inicio de la fonación hasta
el cese de esta, posteriormente el resultado será registrado, el valor para el hombre es 15
segundos y para la mujer 14.3 segundos. Si presenta un número igual, mayor o menor a este
se anotara como normal, aumentado o disminuido respectivamente. Prater y Swift (1986).
Se requiere de un cronometro para su evaluación.

COORDINACIÓN FONOARTICULORESPIRATORIA: Se evalúa mientras la persona está


hablando, en conversación espontanea o dirigida, se observara coordinación adecuada
cuando no haya presencia de inspiraciones audibles, falta de aire al fonar, fatiga
(cansancio), modulación articulatoria (subir y bajar el volumen, cambiar el ritmo, acentuar
las palabras) y velocidad (rápida o lenta), por el contrario la coordinación será inadecuada.
Una alteración en este aspecto puede deberse a la insuficiencia del control glótico,
insuficiencia respiratoria, problemas neurológicos y patrones erróneos del uso de la voz
hablada. Bustos, Inés (2003).

TIEMPO MÁXIMO DE ESPIRACIÓN: Se evaluara pidiendo a la persona realizar una toma


de aire y luego que lo expulse diciendo la /s/, posteriormente vuelva a hacer lo mismo pero
con la /g/. El evaluador cronometrara el tiempo de espiración de cada uno de estos sonidos.
Se encuentra que en adultos el tiempo es aproximadamente de 20 a 25 segundos. Si se
presenta un número igual, mayor o menor a este se anotara como normal, aumentado o
disminuido respectivamente. Prater y Swift (1986). Se requiere de un cronometro para su
evaluación.

PRUEBA DE ROSENTHAL: Se evaluara pidiéndole a la persona que respire por la cavidad


nasal manteniendo el selle labial. Se le tapara las narinas de forma alterna y se solicita que
refiera si siente alguna incomodidad. Cada narina se ocluirá durante un minuto o 20
respiraciones, sin desviar o presionar fuertemente las alas de la nariz. Se considera normal
y simétrico, cuando puede llevar a cabo el patrón de respiración nasal sin dificultad alguna
por ambas narinas.
Se interpreta la prueba alterada, cuando el algún momento del procedimiento se evidencia
alguna manifestación clínica de sensación de ahogo, aleteo nasal exagerado, compresión de
una de las narinas, esfuerzo para sostener el selle labial o dificultad significativa para
respirar por la nariz. Corral, Nelcy (2010)

PRUEBA DE GLATZER: En estado de reposo se evaluara pidiéndole al sujeto que selle los
labios y realice un ciclo de inspiración y espiración nasal, en el momento de la espiración
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

nasal se ubica el espejo debajo de las narinas para evidenciar el grado y simetría del
empañamiento nasal y con la medición, e logra identificar la medida precisa del
empañamiento de cada narina. De esta manera coma, se determina si es simétrico cuando
los niveles de empañamiento son iguales, o asimétrico cuando los niveles de empañamiento
son diferentes, la forma de empañamiento puede ser redonda, ovalada o en forma de
mariposa. En fonación la persona debe realizar la emisión de un sonido oral /s/ y un sonido
nasal /m/, de forma aislada e independiente y durante la emisión de cada uno de los fonemas
se ubica el espejo de Glatzer debajo de las narinas y se retira antes de terminar la emisión,
para determinar la presencia o no del empañamiento durante la emisión. Se realiza además
con vocales /aeiou/ y combinación poco, coco, moño, ñoño.
Se interpreta como normal cuando existe empañamiento simétrico durante la emisión del
sonido nasal y se considera los resultados alterados cuando se identifique presencia de
nasalización uni o bilateral durante la producción de sonidos orales o cuando no haya
empañamiento nasal o este sea unilateral durante la emisión del sonido /m/, es decir cuando
no se identifique su componente nasal en una o ambas narinas. Corral Nelcy (2010).El
material a utilizar para la evaluación es el espejo de Glatzer.

UNIVERSIDAD DEL CAUCA


PROGRAMA DE FONOAUDIOLOGIA
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

INSTRUMENTO DE EVALUACIÓN DE LA FUNCIÓN RESPIRATORIA

Tomado: Trabajo Investigación Campo, Cárdenas, y cols Unicauca. 2012


POSTURA FACIAL CORPORAL
Tercios Simetría Asimetría Correcta
BIOTIPO BIOTIPO Anteroversión de cintura escapular
CRANEAL FACIAL
Dolicocefálico Leptoprosopo Retroversión de cintura escapular
Mesocefálico Mesoprosopo Anteroversión de cintura escapular
Braquicefálico Euriprosopo Retroversión de cintura escapular
EXPLORACIÓN DE ESTRUCTURA FUNCIÓN
ORGANOS
FONOARTICULADORES
Forma Tamaño Color Velocidad Coordinación Fuerza
Mejillas
Labios
Lengua
Paladar Duro
Paladar Blando
Úvula
En En Costal Superior
MODO Reposo Fonación
Nasal Nasal
TIPO Medio o costo diafragmático
Oral Oral
Inferior o Abdominal
Mixto Mixto
FRECUENCIA HOMBRES 16 Y 18 RES/ MIN MUJERES 18 Y 20 RES/ MIN
RESPIRATORIA
Normal Aumentada Disminuida Normal Aumentada Disminuida

TIEMPO MAXIMO DE FONACIÓN


Vocalizaciones H. 15 seg M. 14.3 seg A: Normal Aumentado Disminuido
Tiempo Máximo de Espiración 20-25 seg S: G: Normal Aumentado Disminuido
Respiración-Fonación Tiempo Numero Normal Aumentado Disminuido
COORDINACIÓN Adecuada Inadecuada
FONOARTICULORESPIRATORIA
PRUEBA DE ROSENTHAL Narina Derecha Narina Izquierda
Fatiga Esfuerzo Ruido Ahogo
Universidad del Cauca
Área de Voz
Docente: Claudia Ximena Campo Cañar

Tomado Arias, L. Botero, Farías del 1999-2010.

OBSERVACIONES Dilatación de las Narina Narina Izquierda


Narinas Derecha
PRUEBA DE GLATZER: PERMEABILIDAD NASAL S: M:
Narina Derecha Permeable No Permeable
Narina Izquierda Permeable No Permeable
DIAGNOSTICO RESPIRATORIO Normal Alterado