Vous êtes sur la page 1sur 158

Catalogación en la publicación Universidad Nacional de Colombia

Ángel, Luisa Fernanda, 1966-


Terapia vocal : práctica basada en evidencia / Luisa Fernanda Ángel . -- Primera edición. -- Bogotá :
Universidad Nacional de Colombia (Sede Bogotá). Facultad de Medicina, 2017
170 páginas. -- (Desarrollo Humano).

Incluye referencias bibliográficas al final de cada capítulo


ISBN 978-958- 783-117- 7 (e-book)

1. Fonoaudiología -- Métodos 2. Terapia del lenguaje – Métodos 3. Práctica clínica basada en la evidencia 4.
Trastornos de la voz -- Terapia 5. Voz 6.
Calidad de la voz 7. Patología del habla y lenguaje 8. Terapia cognitiva I.
Título II. Serie

CDD-21 616.85506 / 2017

Terapia vocal. Práctica basada en evidencia


© Universidad Nacional de Colombia - Sede Bogotá. Facultad de Medicina
© Luisa Fernanda Ángel

Primera edición, 2017


ISBN: XXX-XXX-XXX-XXX-X (e-book)

Facultad de Medicina
Decano Ariel Iván Ruiz Parra
Vicedecano de Investigación y Extensión Fernando Pío de la Hoz Restrepo
Vicedecano Académico Juan Manuel Arteaga Díaz
Coordinadora Centro Editorial Angela Manuela Balcázar Muñoz
Preparación editorial
Centro Editorial Facultad de Medicina
upublic_fmbog@unal.edu.co
Diseño de carátula Diagramación
Said Cantor Gutiérrez Oscar Gómez Franco
Corrección de estilo Corrección ortotipográfica
Laura Flórez Millán/Shaunny Ariza Salas Javier Carrillo Zamora
Colección
Desarrollo Humano

Hecho en Bogotá, D. C., Colombia, 2017

Prohibida la reproducción total o parcial por cualquier medio sin la autorización escrita del titular de los derechos
patrimoniales.

Los conceptos emitidos son responsabilidad de los autores y no comprometen el criterio del Centro Editorial ni de la
Facultad de Medicina de la Universidad Nacional de Colombia.
LUISA FERNANDA ÁNGEL

Fonoaudióloga, magíster en Discapacidad e Inclusión Social, profesora asociada del


Departamento de Comunicación Humana, Facultad de Medicina, Universidad Nacional
de Colombia. Cuenta con 28 años de ejercicio profesional asistencial en el ámbito
clínico y 20 años de experiencia docente. Tiene certificación en tratamiento de voz de
Lee Silverman (LSVT) y entrenamiento en Lessac-Madsen, terapia confidencial y
ejercicios de la función vocal. Su interés investigativo y publicaciones se han centrado
en los procesos de habla y deglución de población adulta, en particular los
relacionados con la voz y la disfagia. Ha construido y apoyado diversos procesos en
torno a los asuntos gremiales de la práctica fonoaudiológica y la práctica basada en
evidencia. Es miembro fundador del Colegio Colombiano de Fonoaudiólogos (CCF),
miembro activo de la Asociación Colombiana de Fonoaudiología (Asofono) y miembro
internacional de la American Speech–Language–Hearing Association (ASHA).
CONTENIDO

PREFACIO

SIGLAS Y ABREVIATURAS

1. LA TERAPIA VOCAL
Referencias

2. ENFOQUES
2.1. Terapia indirecta
2.1.1. Higiene vocal
2.1.2. Amplificación de voz
2.2. Terapia directa
2.2.1. Sintomática
2.2.2. Fisiológica
2.2.3. Psicogénica
2.2.4. Ecléctica
Referencias

3. NUEVAS FRONTERAS
3.1. Repotencialización del comportamiento vocal o Behavioral voice–lift
3.2. Inmersión en el tratamiento o Boot camp
3.3. Tecnologías emergentes
3.3.1. Procedimiento
Evidencia
Referencias

EVIDENCIA
4.1. Estado del arte
4.2. Indicadores de eficacia
Resultado
Referencias
CONCLUSIONES
PREFACIO

Este libro es el producto del año sabático de la autora en su labor como docente del
Departamento de Comunicación Humana de la Facultad de Medicina, Universidad
Nacional de Colombia – Sede Bogotá. Su propósito es describir las estrategias de
tratamiento utilizadas por los profesionales de Fonoaudiología en las denominadas
terapias comportamentales de la voz, que comúnmente se agrupan en un solo
procedimiento conocido como terapia vocal. Este trabajo se construyó a partir de la
revisión exhaustiva de la literatura periódica, disponible hasta el año 2014, sobre los
efectos de la terapia vocal comportamental. Los contenidos se desarrollan según la
propuesta de Stemple (2011, 2012) para facilitar la comprensión de la información
recopilada.
Dado que en la actualidad es prioritario implementar prácticas basadas en evidencia
que den cuenta de la efectividad y la eficacia de las orientaciones comportamentales, en
esta obra se recopila evidencia sobre el tema en cuestión, se exponen algunos de sus
aspectos metodológicos y se enuncian las herramientas o instrumentos utilizados por los
investigadores con el fin de determinar los resultados de la terapia vocal. Considerando
el alcance de la práctica fonoaudiológica, los tratamientos farmacológicos y
quirúrgicos no se tratan de manera puntual.
Debe advertirse al lector que los profesionales en Fonoaudología ―también
conocidos como patólogos de habla y lenguaje, logopedas, ortofonistas, foniatras,
terapeutas del habla, terapeutas de la voz― en adelante se denominarán clínicos,
aunque se desenvuelvan en escenarios de salud o educación. Las técnicas serán
llamadas también aproximaciones, métodos y programas, términos empleados por los
autores e investigadores de las mismas que no implican diferencias semióticas. De
igual forma, se conservarán otras expresiones tal y como fueron empleadas por los
investigadores. Dado su carácter polémico, la cualidad vocal también se referirá como
calidad vocal, bajo la premisa de que el vocablo utilizado (cualidad/calidad) refleja
la concepción epistemológica (atributo descrito/valoración atribuida) de quien lo
emplea. Asimismo, se preservarán las siglas en inglés mediante las cuales se reconocen
algunos conceptos en la literatura internacional.
LA AUTORA
SIGLAS Y ABREVIATURAS

AFFN Analizador de función fonatoria Nagashima


ASSIDS Evaluación de inteligibilidad en el habla disártrica
CAPE‒V Consenso perceptual–auditivo de voz
CETI–M Índice de efectividad de la modificación de la comunicación
CSCFT Terapia de fluidez confidencial Casper–Stone
CSL Analizador computarizado del habla
C‒SV Cuestionario de síntomas vocales
DME Evaluación perceptual para la estimación de magnitudes directas
DSI Índice de severidad de la disfonía
EAC Escala de aptitud comunicativa
ECV Escala cualidad/calidad vocal
EF Esfuerzo fonatorio
EMG Electrolaringógrafo
Endosc Endoscopia laríngea
Espec Espectrograma
Espir Espirómetro
Estrob Videoestroboscopia laríngea
ESV Escala de severidad vocal
ExE Protocolo estándar para evaluar la voz
GRBAS Escala de ronquera, voz con escape de aire, astenia y tensión
HSDI Imágenes digitales de alta velocidad
Laring Laringoscopia indirecta
LMRVT Terapia resonante de Lessac‒Madsen
LMT Terapia manual laríngea
LSVT Tratamiento de voz de Lee Silverman
MCT Terapia manual circunlaríngea
MDVP Programa multidimensional de voz
MSS Escala de suficiencia Minnesota
Otro Ac Análisis acústico no especificado
PAE Percepción articulación y entonación
PAS Sistema fonatorio aerodinámico
PIW‒IE Índices de inteligibilidad
PT Percepción de la terapia
PV Perfil vocal
SF‒36 Encuesta de salud 36 formato corto
SIT Índice de estabilidad espacio temporal
SOVTE Terapia con tracto vocal semiocluido
SPL Nivel de presión sonora (sonómetro)
TOM Medida de resultado de terapia
VAI Índice de articulación vocálico
VAS Escala visual analógica
VFE Ejercicios de la función vocal
VHI Índice de discapacidad vocal
VoiSS Escala de severidad de síntomas vocales
VP Visi‒Pitch
VPA Análisis del perfil vocal
VPQ Cuestionario de interpretación vocal
VRP Perfil de rango vocal o fonetograma
VRQOL Calidad de vida relacionada con la voz
VSA Área del espacio vocálico
VTD Escala de incomodidad del tracto vocal
CAPÍTULO 1
LA TERAPIA VOCAL

La terapia vocal es una táctica comportamental empleada para cambiar la manera de


producir la voz. Su objetivo primario es restablecer cuando sea posible los niveles
óptimos de la voz y su funcionalidad en contextos laborales, interacciones sociales y
actividades de la vida diaria. Para cumplir este propósito, el profesional en
Fonoaudiología cuenta con una amplia gama de orientaciones comportamentales.
Ahora bien, no hay una fórmula específica para cada situación problemática de la voz,
en parte porque el diagnóstico médico no determina la manera como una persona usa el
mecanismo vocal. Por ello, los terapeutas de la voz integran una variedad de técnicas
para rebalancear este mecanismo. Estas se aplican, por lo general, con una variedad de
enfoques terapéuticos «híbridos», los cuales suelen denominarse programas de
tratamiento individualizado o terapia vocal ecléctica (Stemple, 2009).
Las metas de este programa terapéutico deben establecerse de manera individual
según el diagnóstico inicial. El objetivo ideal de normalización de la función vocal no
siempre puede alcanzarse, por ende, el terapeuta debe reconocer los factores limitantes
y preparar al sujeto para aceptar un objetivo realista. El pronóstico y la eficacia del
programa terapéutico dependen de: el comportamiento vocal inicial, la patología
subyacente, la adecuada elección del sujeto —de acuerdo con las recomendaciones
indicadas para la aplicación del método— y la adherencia del sujeto a
recomendaciones generales y de higiene vocal en el futuro. En última instancia, la
técnica terapéutica vocal elegida dependerá de la comparación de la respuesta del
sujeto con los indicadores pronósticos (Rattenbury, Carding y Finn, 2004, apéndice 3).
Las numerosas orientaciones con las que cuenta el profesional en Fonoaudiología
pueden implementarse en el marco de la terapia vocal convencional o del tratamiento
preventivo, que difieren principalmente en sus objetivos. Mientras que el primero
apunta a la recuperación de una disfunción vocal, el segundo se orienta a la prevención
de esta. Asimismo, ambos enfoques terapéuticos se dirigen a usuarios diferentes. Los
candidatos a terapia vocal suelen tener manifestaciones iniciales de síntomas vocales y
ser examinados primero por un médico general. Por el contrario, los candidatos a
tratamiento preventivo no suelen manifiestar síntomas en la voz o la laringe y se
muestran interesados en la preservación de su salud vocal debido a que sus
ocupaciones les exigen un uso excesivo de la voz. Este tratamiento no implica un
examen médico y suele administrarse en el lugar de trabajo o en un escenario no
médico. Por último, el tratamiento preventivo se realiza de forma grupal, en tanto que la
terapia vocal convencional se lleva a cabo de forma individual.
Según el modelo tradicional, la terapia vocal se administra en una o dos sesiones de
40 a 45 minutos por semana, durante un período de ocho semanas (Carding, Horsley y
Docherty, 1999) con un solo clínico. La evidencia disponible sugiere que este modelo
es exitoso, pero no tanto como se desea (Speyer et al., 2002; Gordon, Pearson, Paton y
Montgomery, 1997). La eficacia inmediata del tratamiento no es clara en los informes,
que van del 41 % al 96 % (Speyer et al., 2002; Speyer, Wieneke y Dejonckere, 2004;
Gordon et al., 1997). El resultado a largo plazo (más de un año) sugiere una alta tasa de
recurrencias parciales de disfonía, que oscilan entre el 51°% y 68°% de los individuos.
Por otra parte, el éxito de la terapia vocal tradicional puede sobreestimarse porque no
incluye la deserción del sujeto, que según los reportes, tiende a aumentar debido a su
dificultad para adherirse al régimen de tratamiento.
La tasa de deserción entre 16 % y 65 % (Roy et al., 2003; Van Lierde, Claeys, De
Bodt y Van Cauwenberge, 2007; Sellars, Carding, Deary, MacKenzie y Wilson, 2002;
MacKenzie, Millar, Wilson, Sellars y Deary, 2001; Hapner, Portone–Maira y Johns,
2009), junto con la reducción de las tasas de éxito de la terapia vocal tradicional,
sugiere la necesidad de desarrollar nuevas aproximaciones de aplicación del
tratamiento para mejorar la eficacia del mismo.
Aun así, no se encontraron investigaciones sistemáticas para determinar la duración
ideal del tratamiento en condiciones vocales específicas, excepto la terapia vocal de
Lee Silverman (LSVT, por su sigla en inglés), desarrollada para tratar las alteraciones
de la voz en sujetos con Parkinson. Esta terapia ha revelado efectos benéficos en un
período de cuatro sesiones por cada una de las cuatro semanas de duración total, bajo
un régimen terapéutico intensivo (Ramig, Countryman, Thompson y Horii, 1995; Sapir,
Spielman, Ramig, Story y Fox, 2007). Sin embargo, existe poca evidencia científica
sobre la longitud ideal y el número más eficaz de sesiones para otros desórdenes de la
voz.

Referencias
Carding, P., Horsley, I., y Docherty, G. (1999). A study of the effectiveness of voice therapy in the treatment of 45
patients with nonorganic dysphonia. Journal of Voice, 13(1), 72–104.
Gordon, M., Pearson, L., Paton, F., y Montgomery, R. (1997). Predictive assessment of vocal efficiency (PAVE). A
method for voice therapy outcome measurement. The Journal of Laryngology & Otology, 111(1), 129–133.
Hapner, E., Portone–Maira, C., y Johns, M. (2009). A study of voice therapy dropout.Journal of Voice, 23(1), 337–
340.
MacKenzie, K., Millar, A., Wilson, J., Sellars, C., y Deary, I. (2001). Is voice therapy an effective treatment for
dysphonia? A randomized controlled trial. British Medical Journal, 323(1), 658–661.
Ramig, L., Countryman, S., Thompson, L., y Horii, Y. (1995). Comparison of two forms of intensive speech treatment
for Parkinson disease. Journal of Speech Language and Hearing Research, 38(6), 1232–1251.
Rattenbury, H., Carding, P., y Finn, P. (2004). Evaluating the effectiveness and efficiency of voice therapy using
transnasal flexible laryngoscopy: a randomized controlled trial. Journal of Voice, 18(4), 522-533.
Roy, N., Weinrich, B., Gray, S., Tanner, K., Stemple, J., y Sapienza, C. (2003). Three treatments for teachers with
voice disorders: a randomized clinical trial. Journal of Speech Language and Hearing Research, 46(3), 670–688.
Sapir, S., Spielman, J., Ramig, L., Story, B., y Fox, C. (2007). Effects of intensive voice treatment (the Lee Silverman
Voice Treatment [LSVT]) on vowel articulation in dysarthric individuals with idiopathic Parkinson disease: acoustic
and perceptual findings. Journal of Speech Language and Hearing Research, 50(4), 899–912.
Sellars, C., Carding, P., Deary, I., MacKenzie, K., y Wilson, J. (2002). Characterization of effective primary voice
therapy for dysphonia. The Journal of Laryngology & Otology, 116(12), 1014–1018.
Speyer, R., Wieneke, G., y Dejonckere, P. (2004). Documentation of progress in voice therapy: Perceptual, acoustic,
and laryngostroboscopic findings pretherapy and posttherapy. Journal of Voice, 18(3), 325–340.
Speyer, R., Weineke, G., Hosseini, E., Kempen, P., Kersing, W., y Dejonckere, P. (2002). Effects of voice therapy as
objectively evaluated by digitized laryngeal stroboscopic imaging. Annals of Otology, Rhinology & Laryngology,
111(10), 902–908.
Stemple, J. (2009). Principles of voice therapy. 3.a ed. San Diego, EE.UU.: Plural Publishing, Inc.
Van Lierde, K., Claeys, S., De Bodt, M., y Van Cauwenberge, P. (2007). Long–term outcome of hyperfunctional
voice disorders based on a multiparameter approach. Journal of Voice, 21(2), 179–188.
CAPÍTULO 2
ENFOQUES

Por tradición, el programa de terapia vocal utiliza una combinación de los enfoques de
tratamiento directo e indirecto, cuya diferencia se concentra en la acción directa o
indirecta sobre la producción de la voz, como se analizará más adelante.
Al principio, los investigadores intentaron describir y comparar la eficacia de las
terapias vocales directas e indirectas. Por un lado, Roy et al. (2002) concluyeron que
las indirectas fueron más eficaces que las directas. Por otro lado, Speyer (2008) y
Behrman, Rutledge, Hembree y Sheridan (2008) argumentaron que las terapias de voz
directas parecían más eficaces que las indirectas. Pese a lo anterior, la literatura ha
reconocido que los tratamientos directos e indirectos no son excluyentes entre sí; por el
contrario, los primeros requieren alguna técnica indirecta como parte de su protocolo.
Esta es quizás la razón por la que: a) no se encuentran estudios que evalúen solo la
eficacia de la terapia directa (Ruotsalainen, Sellman, Lehto, Jauhiainen y Verbeek,
2007) y b) existen pocos datos que comparen la aplicación de la terapia indirecta y la
directa en la práctica clínica (Gartner–Schmidt, Roth, Zullo y Rosen, 2013).
La evidencia que sustenta los beneficios y la eficacia de la confluencia de ambos
enfoques se expone en cinco estudios (Carding, Horsley, y Docherty, 1999; Gillivan–
Murphy, Drinnan, O’Dwyer, Ridha y Carding, 2006; MacKenzieet al., 2001;
Rattenbury et al., 2004; Simberg, Sala, Tuomainen, Sellman y Rönnemaa, 2006).
También se usaron tres estudios de ensayos aleatorizados (Gillivan–Murphy et al.,
2006; MacKenzie et al., 2001; Carding et al., 1999) que muestran cómo la combinación
de la terapia vocal directa e indirecta mejora el funcionamiento vocal.

2.1. Terapia indirecta

La terapia vocal indirecta o entrenamiento indirecto no implica ninguna acción sobre la


producción de la voz; busca modificar los factores externos que mantienen o agravan un
problema de voz —por ejemplo, los patrones de abuso de la voz o de falta de higiene
vocal— a fin de disminuir o eliminar sus efectos. También interviene otras estructuras y
funciones mentales o corporales que influyen de forma colateral en la producción de
voz.
Sus técnicas se desarrollan como un proceso educativo que ayuda a las personas a
identificar, evitar o cambiar los factores que afectan los comportamientos vocales antes
de cualquier daño, para luego potencializar los factores saludables que permiten un
óptimo desempeño vocal. Entre los enfoques indirectos están la educación del sujeto, el
entrenamiento auditivo y los programas de higiene vocal.
Este método parte del supuesto de que un comportamiento fonatorio inadecuado es
síntoma de la demanda excesiva de la voz, la ansiedad personal, los niveles de tensión
o la falta de conocimiento sobre la producción vocal saludable. Por lo tanto, en el
enfoque indirecto se busca que la gestión de los factores precipitantes, predisponentes y
perpetuantes (Stemple, 1984) restaure la normalidad de la voz. Debido a este propósito
se le reconoce una orientación o tendencia etiológica a nivel conceptual.
Ahora bien, la terapia vocal etiológica presume que cada desorden de voz tiene una
causa que puede ser identificada, modificada o eliminada, para mejorar así la
cualidad/calidad vocal. Según esta tendencia, cuando el factor etiológico ha sido
tratado, el comportamiento vocal mejora sin la manipulación directa de la voz. Entre
los muchos factores etiológicos que contribuyen a los desórdenes de voz se incluyen el
abuso, el mal uso, algunas condiciones médicas y ciertos factores de la personalidad.
La terapia indirecta asume que la persona necesita desarrollar un enfoque informado y
racional de su condición vocal. Es decir, el sujeto debe ser capaz de identificar los
factores psicológicos y sociales que influencian la salud de su voz. Esta intervención
busca que el usuario pueda modificar dichos factores para disminuir o eliminar sus
efectos nocivos sobre la voz y, así, mejore su cualidad/calidad vocal. Por lo general, lo
anterior se logra mediante una combinación de algunas de las siguientes opciones:
educación del sujeto, tranquilidad, relajación general, asesoramiento, entrenamiento
auditivo, eliminación del abuso/mal uso diario de voz, programa de higiene vocal, no
consumo de sustancias irritantes y conciencia ambiental. Los clínicos reportan que esta
sesión dura entre 10 y 20 minutos y la implementación de estrategias indirectas se
prolonga el doble de tiempo (Carding et al., 1999).
En resumen, el enfoque terapéutico indirecto pretende regular un problema de voz,
mejorar la comprensión de la producción vocal y fomentar la modificación del entorno
y los estilos de vida. Esto con el fin de facilitar las condiciones ideales de una buena
producción vocal. Las categorías y técnicas específicas del tratamiento indirecto que
han sido objeto de investigación se describen a continuación.

2.1.1. Higiene vocal


En la mayoría de los casos, la higiene vocal no trata la producción de la voz de manera
directa sino marginal. En general, los programas de higiene vocal suelen centrarse en
los factores que pueden afectar la salud genérica de la mucosa vocal, tales como los
comportamientos fonotraumáticos, la hidratación, el reflujo laringofaríngeo, el
aclaramiento agresivo de la garganta o el tipo de inicio de la fonación.
El programa de higiene vocal tradicional hace hincapié en la conservación de la voz,
incluyendo —pero sin limitarse a— la dosificación de esta, el reposo vocal combinado
con la hidratación, el monitoreo del volumen y la elusión de los llamados patrones
vocales abusivos. En resumen, es una actividad educativa que brinda información sobre
asuntos la ergonomía de la voz y sobre cómo modificarla en una situación con
demandas vocales particulares.
Los programas de higiene vocal suelen ser grupales, ya que no se adaptan al perfil de
cada persona, sino a listas generales sobre «qué hacer» y «qué no hacer», según
comportamientos que se creen pertinentes para la salud vocal. Por ello, estos
programas pueden ser valiosos para la prevención de los problemas vocales
(Nanjundeswaran et al., 2012).

Procedimiento

Cabe aclarar que, aunque existe gran diversidad de estrategias, solo se describen las
reportadas en los artículos de investigación. La higiene vocal incluye: a) educación del
usario acerca de cómo se produce la voz normal, b) identificación de usos abusivos
relacionados con la voz (gritar) y usos abusivos no relacionados con la voz (el medio
ambiente lleno de humo), c) educación sobre las posibles etiologías, entre ellas los
nódulos vocales y los efectos en la producción de la voz, y d) reducción/eliminación
del abuso vocal a través de programas para tal fin. Los asistentes ven un video con
información estándar acerca de cómo se produce la voz y cuál es la descripción de las
fuentes de abuso vocal. El clínico presenta información sobre la patología vocal
relacionada. Clínicos y participantes identifican fuentes de abuso vocal específicos en
la vida diaria y discuten cómo limitar o eliminar estas fuentes (Holmberg, Hillman,
Hammarberg, Sodersten y Doyle, 2001).
Las instrucciones deben ser extensivas. Se recomienda hidratación constante y
abstención de gritos, chillidos o aullidos, tos, inicios glóticos duros para el habla,
consumo de alcohol o cafeína y carraspeo. También se aconseja hablar con frases
cortas y optimizar el soporte respiratorio durante la fonación (Nanjundeswaran et al.,
2012).
Del mismo modo, se enseña que todos los participantes: a) eviten o reduzcan el uso
vocal excesivo, b) reduzcan el consumo de tabaco o dejen de fumar (cuando el caso
aplique), c) eviten consumir alimentos que puedan provocar reflujo gastroesofágico
(ERGE) y d) beban dos litros de agua diarios. Para monitorear las conductas de higiene
vocal modificadas, cada participante debe completar un seguimiento diario de uso
vocal, en el que se pide identificar los factores de riesgo y cómo lidiar con ellos.
Después, los beneficiarios presentan y discuten estas anotaciones en cada sesión, lo
cual aumenta la autoconciencia del uso e higiene vocal. Se sugiere negociar un número
ideal de recomendaciones con cada individuo, entre tres o cuatro y máximo ocho por
sujeto. Luego, la información que se introdujo al inicio en una conferencia suele ser
reiterada y discutida durante alrededor de 10 o 15 minutos en cada sesión de terapia
directa, cuando esta se implementa (Simberg et al., 2006).

Evidencia

La efectividad del entrenamiento en higiene vocal como único método de prevención de


los desórdenes de voz ha sido investigada en ciertas poblaciones: cantantes en
capacitación (Broaddus–Lawrence, Treole, McCabe, Allen y Toppin, 2000), maestros
en jardín infantil (Chan, 1994), profesores en formación (Bistritsky y Frank, 1981;
Verdolini et al., 2012) y en ejercicio (Ilomaki, Laukkanen, Leppanen y Vilkman, 2008;
Niebudek–Bogusz et al., 2008; Roy et al., 2001; Roy et al., 2002). A pesar de su uso
generalizado, el soporte de la utilidad de los programas de higiene vocal no arroja los
resultados deseados. Los estudios aleatorizados y no aleatorizados no han logrado
detectar beneficios claros de la higiene vocal, aunque para ello emplearan un amplio
rango de medidas de resultado (funcionales, perceptuales y acústicas).
En los estudios más notables, realizados con profesores, los resultados vocales de un
programa estándar de higiene vocal como método único de tratamiento son
insuficientes. En concreto, los estudios de Roy et al. (2001) y Roy et al. (2002) no
reportaron mejoras significativas en el índice de discapacidad vocal (VHI), una medida
clásica del impacto de la voz en la calidad de vida, y mejoras leves en el producto
vocal, la facilidad y la claridad vocal. Por su parte, Niebudek–Bogusz et al. (2008) no
observaron progresos en ninguna de las medidas vocales. De igual forma, los sujetos
que solo recibieron el programa de higiene vocal en el estudio de Ilomaki et al. (2008)
mostraron resultados más dispersos, pues solo un tercio manifestó voces mejoradas.
Por último, el estudio de Verdolini et al. (2012) concluyó que los programas de higiene
vocal no bastaron para disminuir los problemas de voz. Así pues, resulta paradójico
que estas investigaciones hayan mostrado un mayor cumplimiento en la administración
del programa de higiene vocal (en comparación con otros programas de intervención
directa) y que, sin embargo, las voces de los sujetos no mejoraran (Roy et al., 2001).
Por el contrario, Bistritsky y Frank (1981), Chan (1994), Pasa, Oates y Dacakis
(2007) y Silverio et al. (2008) encontraron que el entrenamiento solo con higiene vocal
indicó progresos en la voz, cuando se empelaron medidas acústicas y
electroglotográficas, y reducción significativa de los síntomas vocales. Por su parte, el
estudio de Chan (1994) no pudo concluir que la intervención de higiene fuera útil para
prevenir un problema de voz en individuos sanos, debido a que tales problemas, en
general, no surgieron durante el período experimental del grupo de control. En cambio,
se podría pensar que el programa de higiene hizo que profesores saludables aumentaran
tal estado a nivel vocal. En las otras investigaciones, la disminución de síntomas
vocales en el grupo de higiene vocal se debió, probablemente, a formación en el
cuidado de la voz, detección de síntomas de deterioro vocal y estrategias para reducir
el mal uso vocal. Estos factores pueden haber generado en el grupo de higiene vocal
más conciencia de su voz y de cómo cuidarla, de modo que experimentaron síntomas
vocales menos frecuentes.
Cuando los sujetos recibieron higiene vocal y tratamiento directo individual
(Gillivan–Murphy et al., 2006) o grupal (Ilomaki et al., 2008), las investigaciones
mostraron mejorías significativas en: jitter y shimmer, esfuerzo vocal al final de la
jornada de trabajo, puntuaciones del cuestionario de calidad de vida relacionada con la
voz (V-RQOL, por su sigla en inglés), y mayor conocimiento sobre el cuidado de la voz
en comparación con los sujetos del grupo control sin tratamiento (Gillivan–Murphy et
al., 2006). Dos tercios de los sujetos sintieron que sus voces habían mejorado como
resultado del tratamiento y las calificaciones del clínico también indicaron mejoría en
la cualidad/calidad vocal (Ilomaki et al., 2008).
Por último, es pertinente señalar que incluso los datos negativos proveen apoyo
indirecto a las técnicas de higiene vocal: si bien las personas que experimentaron estas
técnicas no mostraron cambios relacionados con la voz, los resultados mostraron que
aquellos no tratados hubiesen empeorado después del período de intervención (Roy et
al., 2001; Roy et al., 2002). Con ese panorama se puede concluir que los programas de
higiene vocal son preferibles a ninguna intervención. Además, puede ser prematuro
descartar el valor de estos programas para algunas personas.
Con excepción del estudio de Verdolini et al. (2012), todos los programas analizados
en la literatura han sido genéricos que no se han adaptado al perfil particular del sujeto.
Parece probable que algunos de sus objetivos fueran irrelevantes para algunos sujetos y
que otros, con probabilidad de relevancia, no se incluyeron o se perdieron en la
instrucción, la cual involucra un gran número de indicaciones bastante detalladas y
desalentadoras para los sujetos. Podría decirse que los programas de higiene vocal
puntuales, individualizados y simplificados tienen valor para los individuos, en
contraste con los programas genéricos que se han evaluado de manera usual (Ziegler,
Gillespie y Abbott, 2010).
En cuanto al tiempo que requiere implementar este programa y obtener efectos
favorables, el entrenamiento en higiene vocal que recibieron los participantes del
estudio de Pasa et al. (2007) fue más corto (una sesión de dos horas y otra de 30
minutos después de tres semanas) que el recibido durante dos meses por los profesores
del estudio de Chan (1994). Aunque estos hallazgos sugieren que un curso breve puede
ser tan eficaz como uno largo para reducir los síntomas vocales, es necesaria más
investigación.
En conclusión, tanto la higiene vocal individual como grupal —ambas de naturaleza
instructiva― evidencian, por lo general, menos beneficios que los obtenidos en los
programas de entrenamiento directo, independientemente de su instrucción en higiene
vocal. La higiene vocal puede producir beneficios sobre algunos aspectos de la voz de
determinados individuos. No obstante, los datos sugieren que produce mejores
resultados que cualquier intervención, de modo que sus efectos pueden mejorar
mediante la reducción del número de instrucciones y su adaptación a cada sujeto.

2.1.2. Amplificación de voz

El sistema electrónico de amplificación de voz es una estrategia indirecta que considera


el volumen o la sonoridad vocal como el principal factor a modificar, de modo que
apunta a preservar o restablecer la voz sin restringir la cantidad usada. Asimismo,
requiere cambios insignificantes de estilo de vida o comportamientos (Roy et al.,
2003).
Una de las técnicas para reducir la dosis de vibración es proporcionar al orador un
sistema de amplificación electrónica de la voz para su uso en el salón. Así, se cree que
la amplificación de la voz reduce la carga vocal impuesta a la laringe e incluso la
protege de las demandas de uso extendido. Mediante la reducción de los niveles de
sonoridad y, por lo tanto, de la dosis de vibración se disminuye el grado de lesión en
los tejidos, ocasionado por colisión y fuerzas cortantes. Esto conlleva una mejora en la
cualidad/calidad vocal.

Procedimiento

Comienza con una sesión de entrenamiento que demuestre la funcionalidad del


dispositivo de amplificación portátil. Se realiza, de preferencia, con un micrófono de
cabeza que garantice la transmisión de la totalidad del producto vocal, a pesar de los
movimientos de cabeza del hablante. Existen diversos dispositivos en el mercado que
pueden cumplir esta función, entre ellos está el equipo utilizado en los estudios de Roy
et al. (2003) y McCormick y Roy (2002) quienes emplearon un ChatterVox™ (Modelo
#61071) y un micrófono de cabeza HiGain (Modelo #16007; Luminaud Inc.,EE.UU). El
bajo costo y la facilidad de transporte del dispositivo de amplificación portátil lo
convierten en una opción de tratamiento atractiva para oradores (profesores,
conferencistas y similares) con desórdenes de voz. Aunque los dispositivos de
amplificación más costosos (incluso los sistemas FM) producen mayor cantidad de
ganancias, son menos portátiles y sus beneficios reales deben verificarse de manera
experimental.
Para un mejor desempeño, los usuarios deben entrenarse en la utilización del
dispositivo mediante una práctica guiada y una retroalimentación correctiva. Asimismo,
los clínicos deben revisar los materiales escritos sobre el uso y mantenimiento correcto
del aparato antes de darlos a los usuarios. Estos materiales de instrucción se extraen
solo de la literatura proporcionada por el distribuidor que acompaña la unidad de
amplificación y el micrófono de cabeza. En el caso del programa de amplificación
electrónica de la voz, el clínico revisa el cumplimiento de las hojas de registro de
control, observa al sujeto utilizar el amplificador y proporciona orientación y
retroalimentación correctiva sobre el desempeño.

Evidencia

El efecto positivo de esta técnica observado en el ensayo clínico aleatorizado de Roy et


al. (2003) corrobora los resultados ya reportados por Sapienza, Crandell y Curtis
(1999), Roy et al. (2002) y McCormick y Roy (2002), quienes utilizaron diseños de
investigación comparables para evaluar la eficacia de la amplificación electrónica de
la voz.
Sobre la base de comparaciones pre y postratamiento, el grupo de amplificación
experimentó reducciones significativas en las puntuaciones medias del índice de
discapacidad vocal, la autoevaluación de la severidad de la voz y las medidas
acústicas de porcentaje de jitter y shimmer. Tales resultados son la primera evidencia
objetiva de la eficacia de este método como tratamiento alternativo para los oradores y,
en particular, los profesores con problemas de voz (Ziegler et al., 2010).
Tras seis semanas de seguimiento, las altas tasas de cumplimiento y, por ende, la falta
de deserción que reportaron los estudios de Roy et al. (2002) y Roy et al. (2003)
sugieren que la amplificación electrónica de la voz es un método que reduce la dosis de
vibración sin mayor dificultad. Después del tratamiento, no solo se verificaron los
beneficios que el sujeto recibió, sino que en comparación con otras técnicas, se reportó
más claridad en la voz y facilidad al hablar y cantar. En una línea similar, McCormick y
Roy (2002) examinaron la eficacia del sistema de amplificación de voz portátil para
reducir el nivel de presión sonora (SPL, por su sigla en inglés) de un hablante —medido
a nivel de la boca— durante una conferencia simulada en un salón de clase. Al realizar
la amplificación con dispositivo portátil, los participantes experimentaron una
disminución de la intensidad vocal media, a nivel de la boca de 6.03 dB SPL (p<0.002).
Además, se observó un aumento promedio de 2.55 dB SPL (p<0.038) en la parte
posterior del aula.
Los anteriores resultados indicaron que el dispositivo de amplificación redujo el
nivel de intensidad vocal del hablante hacia el micrófono, mientras que aumentaba la
sonoridad de la voz en la parte posterior del salón de clases. Sapienza et al. (1999)
encontraron resultados similares al usar un sistema de amplificación de frecuencia
modulada (FM) en campo sonoro. Estos autores concluyeron que cuando se amplifica la
voz, la atenuación de la intensidad medida a nivel de la boca contribuye a la reducción
deseable de la dosis de vibración, minimizando así el riesgo de problemas de voz
relacionados con sobredosis vibratorias.

2.2. Terapia directa

La terapia vocal directa busca modificar la producción de voz defectuosa para


promover su carácter adecuado y eficiente. Estas técnicas se enfocan en modificar los
componentes de la producción vocal inadecuada, tales como la respiración, el
posicionamiento laríngeo o la compresión medial de las cuerdas vocales. Este enfoque
se basa en el supuesto de que el usuario de la voz ha adoptado métodos incorrectos y
potencialmente perjudiciales para la producción vocal, de manera que debe aprender a
modificar o sustituir la fonación problemática por un modelo más adecuado. Así, este
tratamiento busca identificar los aspectos de la función fonatoria que generan dificultad,
modificarlos y luego dejar que la persona los corrija, asumiendo que la voz volverá a
la normalidad.
Esta terapia modifica la fisiopatología específica de la laringe exhibida por la voz del
usuario y, por ende, se centra en los cambios fisiológicos subyacentes que mejoren el
uso del sistema vocal. Requiere instrucción sobre cómo realizar movimientos
específicos de la laringe para reducir el patrón fonatorio desordenado. Para esto, se han
diseñado muchas técnicas vocales que consisten, por lo general, en una combinación
individualizada —que se ajusta a las necesidades y particularidades de cada
individuo― de algunas de las siguientes técnicas: relajación laríngea específica,
manipulación laríngea, método bostezo–suspiro, técnica de masticación, alteración de
la posición de la lengua, respiración diafragmática, coordinación de la respiración con
la fonación, reducción de la intensidad o sonoridad vocal, eliminación del ataque
glótico fuerte, creación y mantenimiento del tono laríngeo apropiado, variación y
control del tono, establecimiento de un tono óptimo, posicionamiento de la voz,
desarrollo de la resonancia y mantenimiento y generalización de un óptimo control
fonatorio.
También ha sido necesario incoporar algunos tratamientos indirectos, por lo que los
modos de intervención directos e indirectos no se describieron como mutuamente
excluyentes. Respecto al tiempo empleado, los clínicos usan de 10 a 90 minutos para la
implementación de estrategias directas en cada sesión (Carding et al., 1999).
A partir de la década de los 90, se han publicado estudios sobre la eficacia de las
terapias directas y la evidencia sobre sus beneficios ha tomado fuerza en el último
quinquenio. Solo hasta años recientes, las denominadas terapias empaquetadas u
holísticas como el tratamiento de Silverman, los ejercicios de la función vocal, el
masaje laríngeo, la terapia de resonancia vocal de Lessac–Madsen y el método del
acento están impulsando la investigación rigurosa sobre la eficacia de la terapia
directa.
En resumen, este enfoque se concentra en modificar las falencias de la producción
vocal y promover la producción apropiada y eficiente de la voz. En otras palabras, a
través de cambios en la respiración, la fonación, la resonancia y la articulación, se
modifica la técnica de habla de manera directa.
En el enfoque directo, se reconocen cuatro orientaciones o tendencias de trabajo: las
centradas en el producto vocal (sintomáticas), también conocidas como aproximaciones
facilitadoras; aquellas enfocadas en la fisiología del mecanismo vocal (fisiológicas);
las que enfatizan los sustratos de la conducta y los procesos mentales de la voz
(psicológicas), y aquellas que combinan todas las anteriores (eclécticas). Las
orientaciones y sus técnicas específicas de tratamiento directo se enumeran y describen
a continuación.

2.2.1. Sintomática
Según Boone (1988), el tratamiento sintomático de la voz funciona sobre la premisa de
que los desórdenes de voz son causados por un mal uso o abuso del apoyo respiratorio,
el tono, la intensidad/sonoridad o la tensión muscular. La terapia vocal sintomática
utiliza diversas técnicas de facilitación con la finalidad de modificar los síntomas
vocales que se detectan durante el proceso de diagnóstico, reducir o eliminar los
componentes inadecuados y promover una mejor producción de la voz. En la terapia
vocal con orientación sintomática se reduce la tensión no fisiológica y debe construirse
suficiente tensión fisiológica (Seifert y Kollbrunner, 2005). Los aspectos primordiales
aquí son: percepción, regulación de la tensión en el cuerpo y de la respiración y mejora
de la fonación y articulación. La modificación de los síntomas exige gran participación
y motivación del sujeto para trabajar directamente sobre su voz, manipulando los
parámetros vocales. Por este motivo, los resultados del estudio de Gelfer y Van Dong
(2013) sugieren que el tratamiento vocal sintomático juega un rol muy importante en la
feminización vocal de la población transgénero.
Una de las ventajas de esta tendencia es que la modificación directa de los síntomas
puede ofrecer resultados inmediatos. No obstante, las críticas señalan que no se aborda
el aspecto fisiológico subyacente o causante de la producción vocal alterada y, por
ende, el problema vocal puede reaparecer (recidivar), aun tras haber trabajado y
eliminado los parámetros audibles, palpables y visibles de la voz alterada, es decir, los
síntomas. Por lo tanto, aunque rápida, la recuperación puede ser aparente.

Métodos de relajación

El objetivo de esta técnica es reducir o eliminar el exceso de tensión muscular en la


región laríngea. Se enseña a los sujetos cómo relajar los músculos de la laringe,
utilizando técnicas de distensión muscular en todo el cuerpo, incluso las sugeridas por
Jacobson (1938). Un programa de relajación de siete días instruye al usuario para que
identifique las tensiones en los músculos grandes del cuerpo. Esta habilidad se
generaliza en la zona de los hombros, cuello y laringe. Después de la enseñanza inicial
del programa, se ofrece una relajación de quince minutos de calentamiento como
precursor del tratamiento. El programa de Bollinger, citado por Treole y Trudeau
(1997), desplaza la tensión de la zona laríngea hacia el bajo abdomen, mediante una
serie de más o menos 45 ejercicios. Este enseña un patrón de respiración abdominal
bajo por medio de un programa de desplazamiento de la tensión.

Evidencia

Hay dos estudios que emplean técnicas de relajación para el tratamiento de los nódulos
vocales: a) Treole y Trudeau (1997), con un programa resumen del trabajo de Jacobson
(1938) adaptado para usarse en la clínica junto con otro programa que resume los 10
ejercicios de Bollinger; y b) Holmberg et al. (2001), quienes utilizaron en un programa
de relajación generalizada una combinación entre técnicas de relajación progresiva
(diferencial), imaginaciones e instrucción básica en el manejo del estrés. El primer
estudio no encontró cambios significativos, pero el segundo reportó disminución de la
disfonía general, presión, inestabilidad, aspereza, ronquera y fricción vocal. Sin
embargo, no halló ningún efecto significativo en la cualidad/calidad con escape de aire,
los episodios afónicos y la falta de sonoridad. Una explicación para esta diferencia
entre resultados puede sustraerse del empleo de versiones reducidas (Treole y Trudeau,
1997) versus versiones completas (Holmberg et al., 2001) de los programas de
relajación.

Soporte respiratorio

El trabajo sobre la respiración no se centra en el desarrollo de uno de sus tipos


específicos per se (por ejemplo, la diafragmática), sino que se orienta hacia dos áreas
relacionadas: a) la facilitación (refuerzo) de la respiración para que el habla esté libre
de esfuerzos externos y b) la identificación y mejora de los comportamientos que
reflejan un manejo pobre del soporte de aire para la producción de la voz o el habla. El
control del flujo espiratorio se facilita mediante una serie de ejercicios que enfatizan la
respiración fácil y relajada, que empiezan con una descansada o sin ninguna producción
vocal para progresar, mediante una jerarquía de tareas de voz y habla, hasta el nivel
coloquial. Se hace hincapié en el buen manejo del suplemento del aire, la coordinación
entre la respiración y la iniciación de la fonación, la cual es proseguida por la
inhalación de un cantidad normal de aire en los puntos de conexión adecuados
(Holmberg et al., 2001).
Aunque muchos sujetos con disfonía no necesitan modificar sus patrones
respiratorios, Boone (1988) ofrece un programa tradicional de cuatro puntos simples
que, la mayoría de veces, ayudan al sujeto a desarrollar un mejor control espiratorio.
En primer lugar, se les enseña que la respiración inspiratoria-espiratoria es un
movimiento en curso continuo; las imágenes mentales o imaginación se usan para
mostrar que hay poco o ningún espacio discernible entre la inspiración-espiración.
Luego, el sujeto comienza a trabajar en el control de la espiración prolongando la
fonación, pero sin recibir la instrucción de tomar aire. Así, la tarea del participante no
presenta esfuerzo inspiratorio notorio para prolongar un sonido. También se le pide que
coincida con un modelo verbal meta, evitando cualquier esfuerzo especial para tomar
una bocanada de aire antes de producir el modelo. Por último, se le instruye para
desarrollar habilidades que le permitan tomar nuevas respiraciones (inspiraciones
catch-up) al decir o cantar un enunciado.
Para documentar la eficacia de este tipo de tratamiento, los estudios de Hoffman–
Ruddy, Sapienza, Lehman, Davenport y Martin (2001), Royet al. (2003), Baker et al.
(2003), Sapienza, Brown, Martin y Davenport (1999), Sapienza, Davenport y Martin
(2002), y Sapienza, Troche, Pitts y Davenport (2011) aplicaron estrategias de
entrenamiento de los músculos respiratorios. Por su parte, los estudios de Dromey,
Ramig y Johnson (1995), Ramig, Countryman, Thompson y Horil (1995) y Spielman,
Borod y Ramig (2003) aplicaron estrategias para el control de la respiración. Detalles
de ambos énfasis se exponen a continuación.

Entrenamiento de la respiración

Esta técnica fue diseñada para fortalecer los músculos espiratorios con el fin de ayudar
a los cantantes y demás individuos con desórdenes de voz a incrementar su capacidad
para generar presiones espiratorias controladas, protegiendo de esta manera al hablante
de potenciales comportamientos vocales fonotraumáticos. Este entrenamiento puede
rehabilitar la voz —siempre y cuando el sujeto lo requiera— y se centra en mejorar la
mecánica respiratoria para la producción de voz, sin integrar de forma directa la
fonación.
El principio fundamental de dicho entrenamiento es el siguiente: si la bomba
respiratoria proporciona insuficiente conducción de aire para la voz, de manera
compensatoria puede darse una hiperfunción laríngea. Esta última puede generar una
lesión de los tejidos y voz muda o áfona. Al mejorar la fortaleza de los músculos
espiratorios, la carga en la laringe parece disminuir, al igual que el comportamiento
compensatorio hiperfuncional de la laringe y el trauma en el tejido. Por consiguiente, si
los músculos respiratorios pueden fortalecerse, la hiperfunción laríngea compensatoria
debe disminuir y la eficiencia vocal debe mejorar, en especial si es secundaria a un
soporte respiratorio pobre o a una alteración de la función de las cuerdas vocales. De
lo anterior, se concluye que es necesario e importante comprobar y ajustar el patrón de
respiración del sujeto durante la respiración y la vocalización.
Los proponentes del entrenamiento de los músculos respiratorios sugieren que estos
son como otros músculos esqueléticos, de modo que responden a programas de
fortalecimiento y acondicionamiento. El entrenamiento para fortalecer los músculos
espiratorios de Sapienza et al. (2011) se ha convertido en una herramienta valiosa para
mejorar la fuerza respiratoria de las vocalizaciones y la deglución, cuando el impulso
respiratorio es inadecuado. En años más recientes, se ha desarrollado un dispositivo de
umbral de presión para lograr el entrenamiento de los músculos respiratorios.

Procedimiento

El entrenador del umbral de presión espiratorio es un dispositivo calibrado que consta


de una boquilla unida a una válvula accionada en una vía por un resorte. Los bloques de
flujo de aire se producen en la válvula hasta un umbral de presión predeterminado, con
el fin de superar la fuerza del resorte. Para generar el umbral de presión, el individuo
debe exhalar con el suficiente esfuerzo espiratorio para liberar la válvula contra el
resorte ajustable. Una vez que la válvula se libera, se escucha una ráfaga de aire.
Siempre que se mantenga el umbral de presión, el aire debe fluir a través del
dispositivo. Hasta que se complete el entrenamiento de los músculos espiratorios, el
umbral de la presión se ajusta con algún porcentaje fijo (por lo general 80%) de la
presión espiratoria máxima de una persona. Si existen ajustes más altos en el
entrenador, debe desarrollarse una mayor presión respiratoria por parte del individuo,
para mantener el umbral de presión. El entrenador de los músculos espiratorios y su
carga de trabajo no dependen del flujo de aire o del rango respiratorio, un factor que
difiere considerablemente de los programas de entrenamiento de resistencia
tradicionales (Hoffman–Ruddy et al., 2001).
Bajo la propuesta de Sapienza et al. (2011), readaptada por Roy et al. (2003), el
sujeto debe completar el programa de entrenamiento cinco días a la semana, de modo
que realice cinco series de ejercicios, con cinco repeticiones por cada vez que termine
su entrenamiento. Para esto, se le entrega un entrenador respiratorio que puede usar en
casa durante seis semanas y se le pide llevar un registro de cumplimiento. Una semana
de entrenamiento incluye los siguientes pasos (Roy et al., 2003):
1. Coloque una pinza nasal plástica en la nariz.
2. Respire tanto aire como sea posible y coloque la boquilla en su boca.
3. Tan pronto como la boquilla esté en la boca, sople tanto aire como pueda. Además,
mantenga un sellado hermético con la boca alrededor de la boquilla y un movimiento
bucal (mejilla) mínimo; y cuando la presión espiratoria sea lo suficientemente fuerte
para abrir la válvula, se escuchará una ráfaga de aire que se mueve a través del
dispositivo.
4. Repita este ejercicio de espiración cinco veces (pasos 1-3), descansando de 15 a 30
segundos entre cada espiración.
5. Cuando haya terminado las cinco espiraciones, descanse durante dos minutos (se ha
completado un set)
6. Después de haber descansado durante dos minutos, repita los pasos 1-4 (las cinco
repeticiones).
7. Se continuará con este patrón de cinco espiraciones y dos minutos de descanso hasta
que haya completado los cinco procedimientos de espiración, durante cinco veces
(se han completado cinco sets).
8. En el diario de entrenamiento, registre la fecha y hora en que se completan estos
ejercicios.
9. Se completan los pasos 1 a 8, cinco veces durante la semana (de lunes a viernes).
10. Después de cada intervalo de dos semanas, en una cita con el clínico, este toma la
presión espiratoria máxima (PEM) y recalibra el entrenador respiratorio. Luego de
que el entrenador respiratorio es recalibrado, deberán seguirse los procedimientos
descritos con anterioridad.
En la primera sesión de tratamiento, se registran tres medidas de presión espiratoria
máxima (PEM) y se selecciona la medida más alta (la mejor). Entonces, se establece el
80% del nuevo PEM en el entrenador de umbral de presión, mientras el clínico observa
cómo el individuo completa la sesión de entrenamiento con el nuevo objetivo. Roy et
al. (2003) proveen en su artículo investigativo (anexo C) información sobre cómo
adquirir, mediante el uso de un manómetro calibrado, el PEM máximo, calcular el
objetivo del umbral de presión y, según este, ajustar la configuración adecuada del
entrenador.
En resumen, el programa de entrenamiento de los músculos respiratorios requiere que
el participante inspire al máximo y luego exhale, con vigor, en un dispositivo de
entrenamiento del umbral de presión, 25 veces por día (es decir, cinco series de cinco
repeticiones) y cinco días a la semana durante seis semanas. Después, el clínico revisa
el registro del entrenamiento y establece un nuevo PEM con ayuda del manómetro. Así,
el entrenador de umbral de presión se fija, al inicio, en el 80% del PEM del individuo y
se ajusta dos veces durante el tratamiento (es decir, al final de las semanas dos y
cuatro, respectivamente).

Evidencia

Se han reportado resultados positivos del entrenamiento respiratorio en artistas de alto


riesgo y otros individuos con desórdenes de voz. Los que experimentaron mejoras
significativas aumentaron la resistencia de la vía aérea laríngea luego de una parálisis,
estenosis o altos grados de hiperfunción laríngea (Baker et al., 2003; Hoffman–Ruddy
et al., 2001; Sapienza et al., 1999). Sin embargo, en la actualidad no hay evidencia que
apoye su utilidad como un tratamiento de alta efectividad para una variedad de
desórdenes de voz.
Aunque el entrenamiento de los músculos respiratorios ha demostrado beneficios para
los actores callejeros ―cuyos puestos de trabajo exigen una fonación extrema
(Hoffman–Ruddy et al., 2001)―, no se observaron beneficios similares en los
profesores con problemas de voz, teniendo en cuenta que sus demandas vocales son
menores (Roy et al., 2003). En el estudio prospectivo de Roy et al. (2003), los sujetos
informaron un mayor cumplimiento de sus programas de tratamiento. Además, la
comparación pre y postratamiento reveló una mejoría en la presión máxima espiratoria,
pero no mostró ningún cambio significativo en: las puntuaciones del índice de
discapacidad vocal, la autopercepción de la voz y la escala de severidad de los
síntomas vocales. Así, los resultados sugieren que, pese a la aparente existencia de un
entrenamiento muscular espiratorio, no necesariamente hay mejoras funcionales de la
voz.
Por ello, los investigadores sugirieron la posibilidad de hacer modificaciones más
frecuentes del PEM para producir mayores mejoras. Estas pueden generar más efectos
sobre la función vocal y originar un estudio del grado de entrenamiento requerido para
producir reducciones deseables en la autopercepción del esfuerzo, la cual se encuentra
en las vías respiratorias y el esfuerzo vocal. Por lo anterior, se concluye que la
ausencia de cambios significativos en el grupo de profesionales de la voz pone en duda
la utilidad del entrenamiento de los músculos respiratorios como una aproximación de
terapia de amplio espectro.

Control de la respiración

El tratamiento de control respiratorio permite entrenar el incremento de la actividad


muscular respiratoria para los procesos de inspiración-espiración y espiración
sostenida. Lo anterior busca que los sujetos generen mayor volumen y presión del aire
por debajo de la glotis para el habla. Sin embargo, no aborda la fonación ni el aumento
del esfuerzo fonatorio, la aducción de las cuerdas vocales o las modulaciones del tono
vocal.

Procedimiento

Este tratamiento emplea ejercicios de alto esfuerzo que incluyen tareas de inhalación y
exhalación máxima, producción sostenida máxima de sonidos fricativos continuos sin
voz (tales como /s/ y /f/) y sostenimiento de la presión de aire intraoral —para lo cual
se utiliza el instrumento de desempeño oral de Iowa (IOPI, por su sigla en inglés)— a fin
de lograr el máximo apoyo respiratorio para el habla. Los sujetos también reciben
instrucciones sobre la toma de inspiraciones profundas y frecuentes para hablar.
Además, los participantes reciben motivación para maximizar su esfuerzo respiratorio
y un estímulo frecuente para respirar en dos momentos, antes de cada fonación
sostenida y durante las pausas entre las tareas de lectura o de habla conversacional. Es
importante aclarar que estas técnicas de apoyo respiratorio se practican durante tareas
de comunicación funcional (lectura en voz alta y habla espontánea), usando la siguiente
jerarquía: labores centradas en las palabras y frases, luego en oraciones, más adelante
en párrafos largos leídos y hablados y, por último, en conversación. Después se realiza
una retroalimentación sobre la expansión del tórax y el abdomen mediante sistemas de
monitoreo no invasivos (NIMS, por su sigla en inglés).
Luego, cada participante identifica su tipo de respiración y aprende respiración
diafragmática y soporte medio. Sin embargo, esta práctica no se centra de manera
directa en la respiración diafragmática. En su lugar, se enfoca en la reducción del
esfuerzo respiratorio. Más adelante, estos principios básicos se implementan, de forma
gradual, en palabras aisladas, frases y habla continua. Durante esta etapa del ejercicio,
se busca reducir el ataque glótico fuerte —muy común en los hablantes— y
reemplazarlo por la aparición de un inicio vocal suave con consonantes específicas
(especialmente /g/ y /j/).

Evidencia

Según los objetivos del tratamiento de control respiratorio, se detectaron cambios en el


tiempo de las pausas (Dromey et al., 1995) y la duración máxima de la fonación
sostenida y de frases. Es probable que el tratamiento contribuyera al aumento
significativo en la duración, magnitud y frecuencia de la inspiración y la espiración, y
en el control de volumen, presión y flujo respiratorio (Ramig et al., 1995).
Bostezo–suspiro (yawn–sigh)

Propuesta por Boone y Mcfarlane (1988), la técnica del bostezo–suspiro es un enfoque


de facilitación utilizado con frecuencia para reducir o eliminar el exceso de tensión
muscular en la región laríngea y disminuir el esfuerzo y brusquedad del inicio vocal, lo
cual reduce, a su vez, la hiperfunción vocal. Se ofrece como un método efectivo para
minimizar los efectos de la tensión laríngea en la hiperfunción, mediante la facilitación
del descenso laríngeo y el ensanchamiento hipofaríngeo. Se suele emplear este patrón
en el bostezo y su posterior espiración sonora relajada (suspiro). La técnica está al
alcance de la mayoría de los sujetos dada su relativa facilidad.
Se probó en cantantes de ópera occidentales, quienes aprendieron un método de
vocalización con un patrón de bostezo-respiración (Xu, Ikeda y Komiyama, 1991).
Según esta modalidad, el patrón de respiración que se utiliza al bostezar es similar al
empleado mientras se canta el bel canto italiano, cuyo efecto permite la máxima
expresión de la voz humana. Esta técnica es muy útil para ampliar la capacidad vocal
cuando una disfonía es causada por sobreesfuerzo del individuo. El efecto científico de
esta aproximación consiste en mantener el diafragma en estado constrictivo de empuje y
la laringe en posición baja al vocalizar. Con esta particular focalización sobre el
diafragma, Xu et al. (1991) recomiendan el uso de la biorretroalimentación, la cual
permite aprender esta técnica respiratoria especial, dar forma a la conducta y clasificar
la capacidad de implementarla de forma apropiada. Dicha técnica facilita que los
sujetos sepan ajustar su patrón de respiración, aunque más tarde suela ser muy difícil
trabajar sin biorretroalimentación tanto para el alumno como para el clínico.
Asimismo, al terapeuta se le ofrece una técnica para observar objetivamente la
cinemática de la caja torácica del hablante y evaluar su rendimiento. De acuerdo a su
capacidad para practicar el método, las formas de las curvas que muestra el monitor se
pueden clasificar en tres tipos, según la capacidad del diafragma y de los otros
músculos inhaladores que apoyan o controlan la respiración durante la fonación.

Procedimiento

En primer lugar, el clínico explica la fisiología del bostezo con énfasis en la


ampliación de la vía aérea y la relajación de la musculatura asociada. Después, cada
uno de los pasos del método es demostrado por el clínico y realizado por el sujeto.
Al parecer, hay varias maneras de emplear el bostezo–suspiro en la terapia vocal; una
de ellas, aunque sea obvia, es el uso de una voz suspirada que produzca un sonido
relajado. Para el sujeto con problemas severos de hiperfunción vocal, la voz suspirada
puede ser su primer intento de generar una sensación auditiva de voz relajada. La
sensación y el sonido de la producción deben ser revisados por el clínico y el sujeto.
Otra forma útil de utilizar el bostezo–suspiro es extenderlo con sílabas que comiencen
por /h/. Así, el individuo recibe instrucciones para mantener la laringe descendida y
producir sonidos calmados, con una serie de palabras que contengan la /h/, vocales
medias y posteriores. De esta forma, y mediante poca práctica, las frases y oraciones se
pueden decir con el suspiro.
Los sujetos suelen controlar la posición de la laringe baja al colocar sus dedos con
suavidad sobre el cartílago tiroides y, si sienten una elevación laríngea, se les dice que
regresen de nuevo al suspiro (lo que descenderá la laringe), para continuar hacia una
extensión del método en una conversación. Cabe advertir que en este último nivel de
complejidad se podría producir solo una mínima elevación de la laringe, sobre todo en
las vocales agudas anteriores.
Un uso más reciente del bostezo–suspiro se ha aplicado a hablantes normales, quienes
a veces experimentan una voz tensa. En esta clase de situación, se solicita que el sujeto
produzca un bostezo–suspiro invisible o silencioso, es decir, bostezar y luego suspirar
con la boca cerrada, de modo que solo sea visible una pequeña dilatación de la fosa
nasal.
Aunque no hay diferencia en la capacidad de los sujetos para dominar el método de
bostezo–respiración, se necesita de su esfuerzo sostenido en las primeras dos o tres
semanas. Ellos tienen que practicarla tanto como les sea posible, al menos 30 minutos
cada día.

Evidencia

El método bostezo–suspiro en la terapia vocal y sus efectos han sido investigados por
Boone y Mcfarlane (1993) y Xu et al. (1991). Estos últimos han empleado este método
como aproximación homóloga. En la investigación de Boone y Mcfarlane (1993), las
observaciones en videoendoscopias de la faringe y la laringe durante la producción de
la técnica confirmaron el descenso de la posición laríngea, la elevación retraída de la
lengua y la dilatación de la faringe. Al parecer, el descenso de la laringe y la
ampliación de la faringe permiten una fonación más relajada, caracterizada por un
ligero aumento en la respiración (por lo general, como resultado de una disminución de
la tensión glotal), una ligera elevación del jitter y un descenso de los segundos y
terceros formantes. Los autoanálisis del hablante y de sus oyentes concluyeron que la
voz producida durante el suspiro se sentía y sonaba relajada.
El experimento clínico de Xu et al. (1991) demostró que la mayoría de los sujetos
mejoraron su curva de producción original después de un tratamiento ambulatorio de
tres meses aproximadamente. Los resultados mostraron una ampliación del rango vocal
del sujeto, un aumento de la intensidad de la voz y una disminución en la tasa de flujo
de aire en comparación con el pretratamiento. El examen laringoscópico y la
evaluación subjetiva de los síntomas por parte de los sujetos mostraron la misma
mejoría. Este ensayo clínico indicó que la mayoría de los sujetos pueden llegar a
dominar esta técnica para vocalizar y sus síntomas pueden desparecer o mejorar
después de esta terapia. Asimismo, los resultados de los exámenes de voz y las
evaluaciones subjetivas de mejora concordaron, de manera significativa, con la
evaluación que los terapeutas hicieron de la capacidad para realizar la vocalización
mediante el patrón bostezo-respiración, a partir de las curvas cinemáticas.
En conclusión, los efectos analizados en estadísticas muestran que la terapia con el
patrón de bostezo–suspiro o bostezo–respiración son eficaces para los síntomas de la
disfonía. Ambos métodos emplean el bostezo como estrategia facilitadora de la
producción vocal, aunque cada uno concentra la atención del sujeto en la sensación
experimentada por la laringe (en el método de bostezo–suspiro) o el diafragma (en el
método de bostezo–respiración).

Métodos de terapia manual perilaríngea

Aronson (1990) describió y abogó por la terapia manual de la laringe como principal
aproximación para los sujetos con trastornos de la tensión músculo esquelética. Su
objetivo principal es relajar la tensión excesiva de la musculatura laríngea y
perilaríngea, la cual inhibe la función fonatoria normal.
El término de terapia manual perilaríngea se ha utilizado como una expresión
sombrilla que puede referirse a cualquier tratamiento manual sobre la laringe para
disminuir la tensión laríngea y perilaríngea. A la fecha, se han reconocido y evaluado al
menos tres aproximaciones de terapia manual perilaríngea: a) terapia manual laríngea
(LMT, por su sigla en inglés), b) terapia manual circunlaríngea (MCT, por su sigla en
inglés) y c) masaje vocal. En años más recientes, Rosing–Schow y Pedersen (2010)
presentaron una nueva propuesta denominada VoiceRelease (VozLibre). Solo unos
pocos estudios de Bélgica, Finlandia, Reino Unido yEE.UU. han investigado los efectos
de la terapia manual, ya sea aislada o en comparación con otra técnica.
Ahora bien, como precaución de seguridad, antes de realizar esta técnica en sus
diversas modalidades, los clínicos deben tener en cuenta los posibles riesgos y
sensaciones experimentadas durante la terapia, en particular por sujetos vulnerables. En
especial, deben considerar la proximidad del seno carotídeo durante el masaje, presión
y estiramiento de la musculatura perilaríngea adyacente. Es importante ser consciente
de los problemas que pueden surgir en la aplicación de la presión digital en el cuello y,
en particular, de los tipos de individuos aptos para esta aproximación. Durante el
procedimiento se observan, de manera permanente, las expresiones faciales de los
sujetos para detectar signos de malestar o dolor.
Terapia manual laríngea

Con base en la propuesta de Aronson (1990), practicantes de diversas disciplinas —


incluidas la osteopatía y la terapia física— han desarrollado técnicas de tratamiento
manual para reducir la tensión musculoesquelética asociada con la hiperfunción vocal.
Estos métodos varían de acuerdo con los antecedentes del profesional que los aplique.
La terapia manual para el tratamiento de desórdenes vocales suele ser más vigorosa que
los métodos implementados por los profesionales de Fonoaudiología Clínica. Las
técnicas de LMT aquí descritas han sido desarrolladas, en su mayoría, para ser usadas
por estos clínicos, a fin de ser lo menos invasivas y lo más efectivas posible.
El objetivo principal de las terapias manuales en la zona laríngea y perilaríngea es
relajar la musculatura tensa en exceso —la cual inhibe la función normal fonatoria—,
modificar el estado de tensión de los músculos del tracto vocal y mejorar el rango de
movimiento de las articulaciones de la laringe. A diferencia de las terapias vocales
tradicionales, en esta se refuerza la retroalimentación propioceptiva.

Procedimiento

El tiempo que requiere este proceso varía según la respuesta del sujeto al
procedimiento. En los casos con niveles más altos de tensión muscular no es necesario
un período más largo de tratamiento. En muchas situaciones, el proceso de LMT toma
cerca de 10 minutos y se puede repetir durante una misma sesión.
El detalle con que se describen estas intervenciones cambia bastante según el autor y
el estudio. De la variedad de protocolos, dos han sido objeto de estudio por parte de
los investigadores: el primero desarrollado por Lieberman (1998, como se citó en Van
Lierde, De Bodt, Dhaeseleer, Wuyts y Claeys, 2010) y el segundo por Mathiesonet al.
(2009). Como requisitos para iniciar el tratamiento, este último incorpora en la
evaluación la escala de incomodidad del tracto vocal (autoevaluación del sujeto) y un
protocolo de evaluación a través de la palpación.
El sistema estructurado de la terapia manual incluye un masaje del músculo
esternocleidomastoideo, un masaje digital de la zona supralaríngea y el estiramiento de
los músculos supralaríngeos en la depresión del cartílago tiroides, mediante la
aplicación de presión en el borde superior del cartílago tiroides. Esta presión digital
lateral en el cartílago tiroideo se utiliza para supervisar los cambios en la tensión de la
musculatura perilaríngea. Esta técnica no trabaja en el espacio tiroideo ni solicita
vocalizaciones durante todo el proceso.
La falta de trabajo en el espacio tiroideo se debe a que, después del masaje digital y
el estiramiento de la musculatura perilaríngea durante la terapia, el espacio tirohioideo
se alarga de manera espontánea, la musculatura se relaja más y la laringe desciende. La
no vocalización durante todo el proceso terapéutico obedece a que muchos sujetos con
tensión muscular desarrollan una postura habitual de los músculos asociados con la
fonación; en consecuencia, si vocalizan durante el tratamiento, hay una tendencia a
utilizar patrones fonatorios habituales que podrían lentificar o revertir los efectos de la
intervención. Por lo tanto, la vocalización no se solicita durante la terapia, sino hasta
después de obtener una respuesta de la laringe a la presión digital lateral en la etapa
final de la intervención. Cuando se alcanza la relajación máxima de la musculatura
laríngea, es posible intentar la fonación con el tono muscular óptimo y la incomodidad
reducida o eliminada. Entonces, se anima al sujeto mediante conteo de los días de la
semana, producción de escalas vocales y uso del habla espontánea.
La terapia manual de la laringe propuesta por Lieberman (1998, como se citó en Van
Lierde et al., 2010) describe la manipulación de los diferentes músculos. La tabla 2.1
muestra las técnicas empleadas sobre músculos específicos, las dolencias expresadas
por los sujetos y el propósito de la manipulación (duración aproximada: 20 minutos).
Tabla 2.1. Terapia manual de la laringe según Lieberman (1998).
Músculo Acción Problema/Dolencia Propósito
Disminuir o eliminar la
hipertonicidad o
Esternocleidomastoideo Inclinación de la cabeza hacia atrás (o Hipertonicidad con dolor a la sobreuso del ECM.
(EMC) giro del cráneo) palpación Estimular la conciencia de
la normalidad en tensión
y postura de la cabeza.
Disminuir o eliminar la
Posición subida de hombros elevación de los
Trapecio Estabilización de los hombros Tensión hombros.
Dolor a la palpación Eliminar el sobreuso del
músculo trapecio.
Esternohioideo Descenso del hueso hioides Hipertonicidad Relajar el músculo
Posición alta de hioides debido a
hipertonicidad del músculo Descender el hioides.
Movimiento del hioides en dirección
Genihioideo genihioideo Disminuir la incomodidad
anterosuperior
Imposibilidad de palpar el hioides en la región faríngea.
debido a su alta posición
Posición alta de hioides debido a
hipertonicidad del músculo
Movimiento del hioides en dirección estilohioideo Descender el hioides.
Estilohioideo
posterosuperior Imposibilidad de palpar el hioides Eliminar el dolor.
debido a su alta posición
Dolor en la región aural
Tensión laríngea Descender la laringe a la
Descenso del hueso hioides y muy Dolor laríngeo posición normal.
Tirohioideo
probable elevación de la laringe Incomodidad después de ejecutar Eliminar la tensión y el
tareas vocales dolor.
Descender la laringe a la
Tensión laríngea posición normal.
Esternohioideo Descenso de la laringe
Dolor laríngeo Eliminar la tensión y el
dolor.
Tensión en la región laríngea
Cricofaríngeo Posición laríngea en el cuello Eliminar la tensión.
Globus faríngeo
Incrementar la distancia
de los cricotiroideos.
Tensión laríngea
Ajustar de manera fina
Dificultades para alternar entre
Aducción de los cartílagos cricoides y las cuerdas vocales
sonidos altos y bajos o pasajes
Cricotiroideo tiroides con incremento en la longitud durante el canto (en
durante el canto
de la cuerda vocal y el tono vocal teoría).
Báscula cricotiroidea cerrada por lo
Reducir la
general
cualidad/calidad vocal
hiperquinética.
Dolor en la articulación
Elevación de la mandíbula para cerrar temporomandibular en posición de
Masetero Relajar y eliminar el dolor.
la boca descanso y durante la apertura
mandibular
Fuente: adaptada de Van Lierde et al. (2010).

La terapéutica descrita por Mathieson et al. (2009) se dirige, sobre todo, a los
músculos ECM al inicio de la intervención y, luego, al área supralaríngea. El masaje
digital y el consiguiente ablandamiento del área supralaríngea permiten que la laringe
descienda.
L a LMT se lleva a cabo después de la evaluación, mediante palpación de la
musculatura perilaríngea. Durante este procedimiento, el clínico se encuentra detrás del
sujeto, quien debe estar sentado en una silla de espaldar bajo, bien apoyado contra este,
con la columna recta y la cabeza en posición neutral, sin la barbilla levantada,
deprimida, retraída o protruida. Luego, se invita al sujeto a relajar sus hombros y
mandíbula, no apretar los dientes, tener la lengua relajada y no hacer contacto fuerte; si
lo hace, que sea contra el paladar duro. La LMT consta de masaje de rotación, masaje
digital (amasado 1) y estiramiento de los músculos perilaríngeos.
Como es habitual, el procedimiento se inicia en los músculos EMC de manera
simultánea, usando las yemas de los dedos índice, corazón y anular de ambas manos. El
número de dedos utilizados puede variar según el tamaño de las manos del clínico y del
cuello del sujeto. Se puede empezar el masaje en los puntos de unión de los músculos
ECM, sea en la mastoides o esternal, el vientre muscular o cuerpo de los músculos, o la
zona que se haya encontrado menos tensa en la evaluación palpatoria. La experiencia
sugiere que trabajar en las zonas de menor tensión y avanzar hacia las de mayor tensión
es más cómodo para el sujeto y logra reducir más rápido la tensión muscular general.
Se aconseja que, durante el masaje, los movimientos de las puntas de los dedos de cada
mano no sean totalmente sincrónicos, pues la presión simultánea en los ECM y a cada
lado del cuello podría generar una presión indeseable en los senos carotídeos. Por esta
razón, el clínico debe identificar los ECM con exactitud y no desviar el masaje del curso
del músculo. A medida que el masaje se repite en la misma área, puede sentirse que el
músculo cambia de forma gradual: de ser tenso y similar a un cordón, pasa a ser mucho
más suave y con menos definición. Cuando se ha alcanzado este punto, la atención
puede dirigirse a la zona supralaríngea.
El área supralaríngea se masajea con los dedos de la mano dominante. La otra mano
acuna el occipucio del sujeto, de modo que la cabeza no se mueva hacia atrás cuando se
aplique presión en la zona supralaríngea. Se ejerce una acción de amasado hacia arriba
y hacia atrás desde el punto medio de la mandíbula, con las yemas de los dedos índice,
corazón y anular. En la práctica, la mayor parte de la presión tiende a aplicarse con el
dedo corazón, debido a que es el más largo. El participante debe relajar la mandíbula,
evitar apretar los dientes y permitir que la lengua descanse en el suelo de la boca, de
manera que la tensión innecesaria se reduzca al mínimo. Después de trabajar en la línea
media, el masaje digital se realizará desde una posición más lateral en la mandíbula,
hacia la laringe. Como la tensión de los músculos supralaríngeos se reduce, la suavidad
del área posibilita el aumento de la presión ―sin incomodar al sujeto―, hasta que las
yemas de los dedos puedan ser presionadas más allá del borde de la mandíbula.
Las primeras dos etapas pueden repetirse hasta lograr la máxima reducción de la
tensión muscular sin incomodar al sujeto. Si la laringe está retenida arriba durante la
evaluación de palpación, en esta etapa se puede aplicar la presión bilateral en el borde
superior del cartílago tiroides, de manera que la laringe descienda con firmeza y
cuidado.
Luego, cuando la musculatura perilaríngea esté más relajada que al inicio de la
técnica, se aplica presión digital bilateral a la lámina tiroidea. En comparación con el
estado preterapéutico, el incremento del movimiento lateral de la laringe en respuesta a
esta presión indica la reducción de la tensión en la musculatura perilaríngea. Para
finalizar, se pide al sujeto que trague y luego vocalice, en respuesta a la pregunta: ¿qué
tal se siente esto?
Según los procedimientos descritos, es necesario recordar las precauciones de
seguridad frente a los riesgos, debido a la proximidad del seno carotídeo durante el
masaje, presión y estiramiento de la musculatura perilaríngea adyacente.

Evidencia

Los efectos de esta técnica han sido publicados por Van Lierde et al. (2010), Mathieson
et al. (2009) y Mathieson (2011). El primer estudio encontró que esta técnica fue un
tratamiento efectivo para los síntomas de disfonía causada por cambio de tensión
muscular de moderada a severa. Después de la terapia, todos los casos mejoraron los
puntajes GRBAS y DSI (aunque no hasta la normalidad): la impresión perceptiva de la
cualidad/calidad vocal mejoró un poco, la percepción de la tensión (S) de la voz se
redujo, la producción de la frecuencia más alta fue mayor, la frecuencia fundamental
(F0) estuvo más cerca de la norma y los parámetros acústicos jitter y shimmer
mejoraron, lo cual se acerca a la norma. Aunque los resultados de Mathieson et al.
(2009) no fueron estadísticamente significativos, mostraron que el efecto durante el
análisis acústico fue de gran tamaño. Los promedios relativos de las medidas tomadas
antes e inmediatamente después de esta terapia no fueron diferentes, pero el resultado
después de una semana fue bastante inferior a estas. Aunque ninguna otra variable fue
significativa, el tamaño del efecto en el rango del ruido de los armónicos (NHR), en el
índice de fonación suave (SPI) y en la irregularidad de la perturbación de la frecuencia
fundamental indica una tendencia a la normalización de la señal glótica. Asimismo, los
síntomas en la escala de autovaloración del malestar del tracto vocal (VTD) tuvieron
una reducción significativa desde el pretratamiento hasta una semana después de la
terapia. Incluso después de la terapia, los sujetos suelen hacer comentarios como «es
más fácil tragar» o «mi garganta se siente más abierta». Muchas personas también
comentan sobre los cambios kinestésicos relacionados con la fonación y la mejoría en
la cualidad/calidad vocal.
Terapia manual circunlaríngea

Es el método de reducción de la tensión muscular utilizado por Roy y Leeper (1993) y


se basa en la técnica de Aronson (1990). La MCT (por su sigla en inglés) está dirigida a
la reducción o eliminación manual del exceso de tensión muscular laríngea. Se realiza
mediante masajes sobre lugares específicos de la musculatura laríngea mientras se
observan cambios en la cualidad/calidad vocal. No involucra maniobras de
reposicionamiento laríngeo.
Este tratamiento involucra una presión circular en lugares específicos de la
musculatura extralaríngea (sobre el hueso hioides, en el espacio tirohioideo y sobre el
borde superior del cartílago tiroides) en dirección anteroposterior, ejerciendo al mismo
tiempo presión de la laringe hacia abajo. De forma simultánea, se presentan estímulos
de voz meta mientras ocurren cambios en la cualidad/calidad vocal. El masaje digital y
la presión sostenida comienzan de forma superficial y se profundizan gradualmente.

Procedimiento

El protocolo (tabla 2.2) se completa en una única sesión que puede durar de 50 minutos
a 3 horas. Es necesario tener en cuenta las precauciones de seguridad frente a los
riesgos, debido a la proximidad del seno carotídeo durante el masaje, presión y
estiramiento de la musculatura perilaríngea adyacente.

Tabla 2.2. Protocolo de terapia manual circunlaríngea.


Zona Técnica
1. El hueso hioides se rodea con el dedo pulgar y el índice, el cual se masajea hacia atrás hasta que se sienta
Hueso hioides la punta de las astas principales.
2. Se ejerce una presión ligera con los dedos, en un movimiento circular, sobre la punta del hueso hioides.
3. Este procedimiento de movimiento circular se repite desde la hendidura o ranura tiroidea. Asimismo, se
realiza el masaje hacia atrás.
Cartílago tiroides
4. Se localizan los bordes superiores del cartílago tiroides, que deben estar justo en medio de los músculos
ECM y, después, se repite el procedimiento.

5. Con los dedos ubicados sobre los bordes superiores del cartílago tiroides, se masajea toda la laringe hacia
Toda la laringe
abajo y, al mismo tiempo, se mueve de manera lateral.
6. Se solicita que los sujetos tarareen o prolonguen vocales durante los procedimientos anteriores mientras
se observan los cambios en la cualidad/calidad vocal. Luego se producen palabras —esto se suele dar en
Fonación series automáticas, es decir, el conteo de los días de la semana—, después frases cortas —por ejemplo,
«muchas mujeres en la montaña», «mi mamá me mima» o «un martes en la mañana»—, frases largas y, al
final, una conversación.
7. La mejoría de la cualidad/calidad vocal se refuerza de inmediato. Los sujetos reciben entrenamiento para
Retroalimentación escuchar la cualidad/calidad vocal más óptima (retroalimentación auditiva) y sentir la cualidad/calidad vocal
más apropiada (realimentación propioceptiva).
Fuente: elaboración propia.

Evidencia
Los efectos de esta técnica han sido publicados por Roy y Leeper (1993), Roy, Bless,
Heisey y Ford (1997), Roy y Ferguson (2001), Roy y Hendarto (2005), Roy, Nissen,
Dromey y Sapir (2009), Awan y Roy (2009), Van Lierde et al. (2010) y D’haeseleer,
Claeys y Van Lierde (2013). Roy et al. (1997) encontraron que, si bien los resultados a
corto plazo son impresionantes, los de largo plazo son menos evidentes. Por lo tanto,
esta terapia puede verse desde dos perspectivas: como un remedio incompleto —según
la mayoría de beneficiarios— y como una terapia que proporciona un alivio permanente
de los síntomas. Durante e inmediatamente después del procedimiento manual, la
mayoría de sujetos informaron una reducción gradual y disminución del dolor laríngeo.
En el 2005, demostraron que, aunque esta técnica no esté orientada hacia la
modificación del tono y no genere una variación significativa en la media de la
frecuencia fundamental durante el habla, suele ir acompañada de un cambio en esta
frecuencia y en el tono habitual del 80% de los sujetos (cuya magnitud es un semitono).
De igual modo, aunque la técnica no se centra en la modificación de la articulación ni
exige al sujeto que dedique recursos cognitivos a la producción articulatoria, en el
2001 y 2009, estos autores confirmaron un descenso en la frecuencia de los tres
formantes, los cuales son estadísticamente significativos en el segundo formante. Por
consiguiente, es posible que el cambio del espacio vocal después de la terapia manual
circunlaríngea se deba a vínculos biomecánicos entre los músculos mandibulares,
linguales, laríngeos y faríngeos.
Van Lierde et al. (2010) evaluaron el resultado de la terapia por medio del índice de
severidad de la disfonía (DSI), un correlato cuantitativo y objetivo de la percepción de
la cualidad/calidad vocal. En este caso, el valor de D SI de los sujetos mejoró de -5.9
(9%) a -2 (30%) después del tratamiento. El análisis de los componentes del DSI
muestra que las principales variables responsables de explicar esta diferencia después
del tratamiento son el tiempo máximo de fonación, la intensidad más baja y el jitter.
Por último, D’haeseleer et al. (2013) propusieron que la MCT no solo era eficaz en
sujetos con desórdenes de voz funcional, sino que también podía mejorar las
capacidades de voces saludables y entrenadas de futuros intérpretes musicales de élite.
Dentro del grupo de estudiantes de música que recibieron esta técnica, la mediana en el
DSI aumentó una cantidad significativa de 6.2 a 7.2 después del tratamiento. Sin
embargo, las mejorías en el TMF, intensidad baja, frecuencia alta y jitter no fueron
significativas. De manera subjetiva, el 75% de los estudiantes de música reportaron
mínimo una mejora de la voz al hablar o cantar, después de la terapia. Asimismo,
ninguno de los estudiantes informó una disminución en la cualidad/calidad de su voz
para el canto, el habla o el rango vocal. Solo el 50% evaluó esta terapia como
agradable, mientras que los demás la calificaron de bastante desagradable (37.5%) o
incluso dolorosa (12.5%).
L a MCT puede tener efectos deseables en los sistemas fonatorio y articulatorio El
objetivo de esta técnica no es encontrar, establecer o referirse a un nivel de tono mejor
u óptimo ni mejorar la articulación. Su propósito es normalizar la tensión muscular
laríngea y mejorar la voz, la cual parece subyacer al cambio del tono y al descenso de
los formantes (mucho más el segundo formante). Impedir manualmente la elevación de
la laringe puede prevenir que el sujeto asuma una postura laríngea inadecuada o no
natural, la cual es una explicación plausible del cambio repentino de la producción
vocal. Sin embargo, dado que existe una compleja interacción entre los componentes
psicológico y fisiológico en los desórdenes funcionales de la voz, y los efectos
reactivos psicológicos de la interacción clínica no se pueden controlar (efectos
placebo, instrucciones, expectativas, experiencia, confianza en el clínico), sería
presuntuoso atribuir los cambios en la voz solo a la reducción de la tensión muscular
laríngea.
Las diferencias entre la terapia manual laríngea y la terapia manual circunlaríngea
incluyen la presencia o ausencia de una evaluación palpatoria por parte del clínico
antes del procedimiento (en la LMT) o durante el procedimiento (en la MCT). Esta
intervención activa se lleva a cabo utilizando las dos manos (en la LMT) o solo una
mano (en la MCT); además, al sujeto se le solicita vocalizar después del procedimiento
(en la LMT) o durante la terapia manual (en la MCT). A diferencia de la LMT, la MCT se
orienta a disminuir el espacio tirohioideo mediante masaje circular en esta área. En
resumen, las principales diferencias radican en si: a) los sujetos autoevalúan sus
molestias del tracto vocal antes de la intervención, b) la evaluación mediante palpación
se lleva a cabo antes o durante el procedimiento, c) la intervención activa se realiza
utilizando dos o una sola mano, d) se pide que el sujeto vocalice después o durante la
terapia manual y e) se enfatiza la disminución del espacio tirohioideo. La tabla 2.3
resume las diferencias y similitudes entre estas dos técnicas.
Tabla 2.3. Comparación entre la terapia manual laríngea y la terapia manual circunlaríngea.
Característica Terapia manual laríngea Terapia manual circunlaríngea
Escala de
autoevaluación
de malestar en Antes y después de la intervención
el tracto vocal
del sujeto
Evaluación
Antes de la terapia Durante el proceso de intervención
palpatoria
a) Unimanual
a) Bimanual y unimanual b) Con el dedo pulgar e índice
b) Con la yema de los dedos índice, medio y anular c) Trabajo desde zonas de menor a
Intervención
c) Trabajo desde zonas de menor a mayor resistencia muscular guiado mayor tensión muscular guiado por la
manual
por la tolerancia del sujeto a la intervención tolerancia del sujeto a la intervención
d) Atención más prolongada en las áreas de mayor resistencia muscular d) Mayor atención a los sitios focales
de dolor, tirantez o nodularidad
a) Hueso hioides
a) Músculos ecm
Orden de b) Espacio tirohioideo
b) Área supralaríngea
estructuras c) Laringe
c) Hueso hioides
meta d) Musculatura medial y suprahioidea
d) Laringe
lateral, según se necesite
a) Presión circular del hueso hioides
(unimanual)
a) Masaje circular de ecm (bimanual)
b) Repetición del procedimiento
b) Masaje digital de área supralaríngea (unimanual)
dentro del espacio tirohioideo
c) Masaje del hueso hioides (unimanual, de un lado a otro)
c) Repetición sobre los bordes
Métodos d) Depresión bimanual de la laringe, con los dedos en el borde superior
superiores del cartílago tiroides
del cartílago tiroides.
d) Presión hacia debajo de la laringe
e) Movimiento lateral de laringe con aplicación alternada de presión
con los dedos sobre el borde superior
digital bimanual
del cartílago tiroides. Movimiento
lateral ocasional
Se pide que el sujeto sostenga
vocales o tararee durante el
No se requiere vocalización del sujeto durante la terapia hasta que la
procedimiento manual.
laringe responda con facilidad a la presión digital lateral, después que la
La voz mejora desde vocalizaciones
intervención finalice.
hasta palabras, frases, oraciones,
Cada día de la semana se alientan las escalas vocales y el habla
párrafos recitaciones y
Vocalización espontánea.
conversaciones.
del sujeto Justificación: los patrones fonatorios de los sujetos son
Justificación: el clínico es capaz de
hiperfuncionales y las posturas musculares, asociadas con la disfonía,
monitorear los cambios en la
se han habituado. Hay que esperar hasta que se logre la relajación
cualidad/calidad vocal durante el
máxima de la musculatura laríngea, lo cual permite la fonación con tono
tratamiento, por lo cual puede
muscular óptimo y reduce o elimina la incomodidad.
modificar la intervención, según el
progreso.
Fuente: adaptada de Mathieson et al. (2009).

Masaje vocal™

Es un método de masaje desarrollado por la finlandesa Leena Koskinen en 1980 con el


apoyo de fisioterapeutas, terapeutas del habla, profesores de canto y profesionales de la
voz. Su objetivo es aumentar la movilidad de la caja torácica durante la respiración y
evitar una tensión excesiva en los diversos músculos que se usan para la producción de
la voz, de manera que el sujeto retorne a la postura correcta, el movimiento —sobre
todo en la caja torácica y el área del diafragma— y la relajación. Se utilizan, además,
ejercicios de respiración y estiramiento. El cuerpo y la mente crean una producción de
voz balanceada.

Procedimiento

Este es un tratamiento basado en los movimientos del masaje clásico, que consiste en la
manipulación integral y holística de los músculos respiratorios, laríngeos y
articulatorios relacionados directa o indirectamente con la producción vocal. La técnica
incluye golpes, masaje digital, fricción y empuje intercostal, con el objetivo de
aumentar la movilidad de la caja torácica en la respiración y evitar la tensión excesiva
de los músculos que se usan para producir la voz: torso medio y superior, nuca y
cuello, cabeza y músculos faciales. Los movimientos del masaje se aplican con bastante
cuidado en cada área.
Este tipo de masaje se enfoca en el trabajo de los músculos respiratorios, los
músculos de la masticación y la lengua. La presión manual de la laringe o los ajustes
posturales de la cabeza y el cuello pueden emplearse, al principio, para establecer una
posición descendida de la laringe antes y durante la fonación.
Puede realizarse en una sesión de 45 a 75 minutos y, por lo general, se necesitan
cinco sesiones. Las primeras tres sesiones se administran con intervalos de una semana
y las dos restantes con intervalos de un mes. Los casos con problemas de respiración y
voz presentes desde hace mucho tiempo o que producen agotamiento necesitarán más
sesiones.
El masaje vocal solo puede ser ejecutado por personal entrenado y certificado en el
método. Este procedimiento no es terapia física, del habla, alternativa o invasiva, ni
requiere la utilización de equipos o tratamiento térmico. Asimismo, no está relacionado
con ninguna filosofía. Se utiliza para apoyar la terapia vocal, evitar que los músculos
funcionen mal en las personas que utilizan su voz de manera profesional y ayudar a
resolver problemas de soporte respiratorio y de posición de los labios en los
instrumentistas de viento.

Evidencia

Los efectos del masaje vocal han sido publicados por Laukkanen, Leppänen, Trymi y
Vilkman (2005), Laukkanen, Leppänen y Ilomäki (2009), Leppänen, Laukkanen, Ilomäki
y Vilkman (2009) y Leppänen, Ilomäki y Laukkanen (2010). Estos autores reportan:
facilidad de la fonación, reducción de la tensión en el cuello, hombros y espalda,
mejoría en la relajación corporal, resistencia vocal y cualidad/calidad vocal, y una
percepción sólida de la disminución en la intensidad durante la lectura en voz alta. Lo
anterior sugiere una producción vocal más relajada, una conciencia corporal con visión
holística de esta producción y menos síntomas de fatiga vocal durante un año de
seguimiento. No se observan cambios significativos en los parámetros de voz ni en
mediciones perceptuales de la cualidad/calidad. Por lo tanto, los efectos de esta técnica
pueden relacionarse con aspectos psicológicos, por un lado, y con una búsqueda del
balance fonatorio, por el otro.

VozLibre

Durante la 8.a Conferencia Paneuropea de Voz en 2009, Rosing–Schow y Pedersen


(2010) presentaron una nueva propuesta denominada VozRelease (VozLibre). Algunas
técnicas de este método son utilizadas por los osteópatas y fisioterapeutas; sin embargo,
los autores quisieron crear un sistema estructurado que los terapeutas del habla y
lenguaje pudieran implementar. Este sistema se estructura de forma progresiva y
pretende liberar la voz reduciendo la tensión muscular mediante terapia manual.

Procedimiento

La VozLibre se lleva a cabo en cuatro pasos diseñados para que el clínico pueda
aplicar, de manera gradual, habilidades de palpación desde un nivel simple hacia uno
más complejo. Como las técnicas anteriores, esta siempre debe ir precedida de una
preparación vocal y mental muy cuidadosa del sujeto para posibles malestares y
reacciones. El participante debe esperar y enfrentar las consecuencias del tratamiento.
Algunos sujetos se pueden beneficiar de técnicas de terapia manual como un suave
toque de su propia laringe. Sin embargo, ciertos individuos no deben recibir terapia
manual, por ejemplo, aquellos con ansiedad severa y condiciones de choque. Por
encima de todo, es de vital importancia que el clínico se sienta seguro para crear un
ambiente de tranquilidad y confianza.
El tratamiento se lleva a cabo con el sujeto en posición supina, a quien se le instruye
para coordinar la respiración con los tramos. El primer tratamiento implica un escaneo
del cuerpo con el propósito de hacer un diagnóstico general del sistema muscular. Esta
exploración dura cerca de 30 minutos. Las siguientes sesiones se planifican según los
hallazgos del escaneo del cuerpo y duran de 10 a 15 minutos. El tiempo de los
estiramientos y masajes debe ajustarse según los niveles de tensión. La intensidad de la
terapia disminuye a medida que se libera y estabiliza la función vocal saludable. La
tabla 2.4 presenta los cuatro niveles de progresión.
Tabla 2.4. Niveles de progresión de la VozLibre.
Nivel I Estiramiento de los músculos relacionados de cabeza, cuello y mandíbula
Nivel II Estiramiento y masaje de la fibra muscular
Estiramiento y masaje de los músculos constrictores
Nivel III
Solo masaje del músculo cricotiroideo
Nivel IV Masaje al interior de la boca con el fin de tratar los músculos de la mandíbula y los suprahioideos
Fuente: adaptada de Rosing–Schow y Pedersen (2010).

Evidencia

A la fecha no existen en la literatura investigaciones que evidencien los beneficios de


este programa.

Terapia de canto

El canto y sus respectivos ejercicios pueden mejorar el uso funcional de la voz, en


especial, la fatiga vocal. Con frecuencia, las terapias de voz incorporan ejercicios de
canto bajo la premisa de que su uso prolongado facilita la producción vocal eficiente y
permite adaptar (generalizar) estos comportamientos vocales al habla. Otro objetivo de
la terapia es aumentar la media de la frecuencia fundamental estirando las cuerdas
vocales y logrando una mayor aducción a lo largo de toda su longitud. Lo anterior
permite que los hablantes tengan una mejor respuesta a las dosis de voz requeridas por
sus puestos de trabajo.
El canto tiene muchas formas, pero se caracteriza por una fuerte conexión retórica con
el texto que transmite. Una de dichas modalidades emplea un patrón de canto de la
tradición gregoriana, basada en ocho modos de recitación o tonos de salmo 2. Su función
es obtener una mayor proyección de las lecturas bíblicas en los espacios litúrgicos más
grandes desarrollados después del siglo IV. El canto gregoriano es un patrón de canto
monódico compuesto de varias secciones las cuales imitan la prosodia natural que se
encuentra en la mayoría de los enunciados. Este patrón de recitación particular sirve
como una plantilla sobre la cual puede encajarse cualquier frase u oración. Las
características sobresalientes de este patrón incluyen: tono de recitación apropiado
para el habla, rango tonal que cubre una quinta musical y fluctuaciones de tono que
están relacionadas con la fuerza prosódica de la oración.
Según algunos modelos, estos comportamientos deberían centrarse en el uso
diferencial de los músculos intrínsecos, extralaríngeos y los involucrados en los tres
subsistemas de producción de la voz (McCabe y Titze, 2002). Es probable que cantar
un patrón implique un uso mayor y más variable de los subsistemas respiratorio,
fonatorio, articulatorio y de resonancia, en especial un uso aumentado de la presión
subglótica. Si bien este contexto de oraciones completamente retóricas puede expandir
el esquema muscular o comportamental mediante la coordinación entre las diversas
partes del sistema, el uso intensificado de las tres áreas tradicionales del mecanismo
fonatorio (respiración, fonación y articulación, y resonancia) también puede generar una
gran flexibilidad de todos los componentes prosódicos de la retórica (sonoridad,
duración e inflexiones tonales) y lograr la habituación de la flexibilidad o uso variable
de pares musculares agonistas y antagonistas. Asimismo, el sistema respiratorio se
utiliza más como una fuente de presión que como una fuente de flujo y la regulación se
logra por la resistencia de la laringe.

Procedimiento

A los participantes se les debe informar que la técnica se ejecuta con brevedad, como
un dispositivo de entrenamiento de la voz. Después de que los beneficiarios hayan
aprendido a cantar, se les pide que lean frases de diferentes longitudes en canto y en
voz normal. Poco a poco, las producciones de voz aumentan y varían, hasta que todos
los participantes sean capaces de producir una charla cantada con relativa facilidad.
Luego, se les pide reducir de modo gradual la cualidad/calidad cantada, de manera que
mantengan el ataque glótico suave y la resonancia vocal. El criterio para el éxito en el
aprendizaje de la terapia de canto es que cada sujeto sea capaz de conversar con el
terapeuta de forma espontánea, utilizando el patrón de recitación en el tono más
apropiado. Sin embargo, un número de participantes experimentarán dificultades para
producir voz cantada o durante el proceso de generalización. Para ellos, se emplearán
aproximaciones individuales y facilitadores adicionales, tales como el bostezo–suspiro,
boca abierta y de masticación.
El patrón del canto gregoriano contiene una entonación inicial que asciende hacia la
nota recitada. Esta última se canta tanto tiempo como sea apropiado, según determinada
cláusula. Además, una mediación o flexus se utiliza como énfasis prosódico adicional,
por lo general, en la penúltima o antepenúltima sílaba de la cláusula antecedente. De
manera subsecuente, las cláusulas dependientes empiezan en la nota recitada y
continúan hasta el patrón final o cauda, la cual indica el retorno del tono hablado hacia
el tono inicial. Todo el rango del patrón abarca una quinta musical: 7 semitonos o una
proporción de 3:2 entre la frecuencia fundamental de los tonos más altos y bajos. Esta
modalidad comprende seis sesiones de una hora, distribuidas en un período de dos
semanas (McCabe y Titze, 2002).

Evidencia

Aunque la literatura investigativa ha proporcionado pocos estudios que validen el éxito


clínico de esta terapia, los estudios de McCabe y Titze (2002) y De Bodt, Clement,
Wuyts, Borghs y Van Lierde (2012) demostraron algunos de sus beneficios en casos de
fatiga vocal. Esta terapia produjo una elevación del tono, prolongación de las vocales,
falta de estrés en la sílaba, disminución significativa del cierre glotal y, por
consiguiente, suavización del ataque glotal.

Retroalimentación visual

Terapia vocal asistida con nasolaringoscopia

La nasolaringoscopia flexible (laringoscopia transnasal flexible) se usa como


herramienta diagnóstica, pero también como herramienta terapéutica para mostrar al
sujeto la repercusión del tratamiento en el comportamiento de sus cuerdas vocales. De
igual manera, se emplea como herramienta visual de biorretroalimentación (bio–
feedback) laríngea, pues permite que el sujeto vea los resultados directos de su práctica
en terapia vocal. Además, el participante puede intentar una técnica terapéutica
específica mientras se observa a sí mismo en el monitor de televisión en tiempo real.
La aplicación de la nasolaringoscopia brinda: a) una retroalimentación visual que
complementa la información propioceptiva y auditiva que el sujeto percibe cuando fona
y b) una biorretroalimentación visual de la laringe en forma permanente, la cual ayuda a
garantizar que el sujeto realice de forma correcta la técnica terapéutica. Sin este apoyo
visual, los participantes podrían intentar seguir el modelo auditivo del clínico y, sin
advertencia, deteriorar aun más su mecanismo laríngeo en lugar de reducir los
comportamientos vocales inapropiados.
Según lo anterior, puede afirmarse que la nasolaringoscopia no solo ofrece
retroalimentación visual al sujeto, sino que también brinda evidencia sobre los
beneficios de la técnica terapéutica que se esté implementando.

Procedimiento

Implementado bajo los protocolos formulados en la literatura médica, el examen


nasolaringoscópico inicial muestra características fonatorias que se discuten en detalle
con los sujetos. Este examen se puede realizar durante todo el proceso terapéutico, a
discreción del clínico.
La comparación directa de este examen con una muestra de voz sin disfonía ayuda al
sujeto a entender mejor sus características vocales aberrantes. El número total de
procedimientos nasolaringoscópicos empleados varía según la tolerancia de cada
sujeto, por ejemplo, todos los participantes del estudio de Rattenbury et al. (2004)
recibieron un mínimo de dos exámenes nasolaringoscópicos durante el proceso
terapéutico, sin incluir el examen diagnóstico preterapéutico y el evaluativo
posterapéutico.

Evidencia

Hay poca evidencia científica que avalúe el uso de la nasolaringoscopia como


herramienta visual de biorretroalimentación laríngea, excepto la proporcionada por el
estudio prospectivo, controlado y aleatorizado de Rattenbury et al. (2004), que examinó
el efecto de la nasolaringoscopia en conjunto con técnicas de tratamiento directas e
indirectas. En ambos grupos de tratamiento (con y sin nasolaringoscopia), los sujetos
mostraron mejoras estadísticamente significativas después de la terapia vocal:
percepción auditiva de la cualidad/calidad vocal p<0.01, medición instrumental
electroglotográfica p<0.01, y medición de los efectos de la voz en la calidad de vida
mediante el Cuestionario de Interpretación Vocal (VPQ, por su sigla en inglés) del sujeto
p<0.01.
El tiempo promedio (mediana) para completar la terapia vocal en el grupo de
tratamiento asistido con nasolaringoscopia fue de dos horas menos que el del grupo de
tratamiento tradicional (p<0.01). Por ello, los investigadores concluyeron que la terapia
vocal con nasolaringoscopia fue más eficiente que la terapia vocal tradicional como
herramienta de apoyo terapéutico.

2.2.2. Fisiológica
Como su nombre lo indica, el tratamiento fisiológico involucra la alteración y
modificación de la fisiología de los mecanismos vocales (mecánica respiratoria, fuerza
muscular laríngea, control de la resistencia glótica y modificaciones supraglóticas) para
mantener un balance de los tres subsistemas involucrados en la producción de la voz
(Colton y Casper, 1990).
Este tratamiento se fundamenta en el conocimiento de la fisiología vocal evaluada de
forma objetiva (acústica, aerodinámica y estroboscópica) y se opone al trabajo
individual de los síntomas y parámetros vocales. Su objetivo es rebalancear el
desequilibrio fisiológico, lo cual normaliza de forma secundaria los parámetros o
síntomas alterados sin abordarlos directamente.
Una de las críticas hechas al enfoque fisiológico es que no considera el
comportamiento vocal ni los aspectos psicológicos. En muchos casos, el sujeto no es
consciente de los ejercicios fisiológicos que realiza para trabajar en paralelo la función
respiratoria, la fonación y la resonancia. Por el contrario, el clínico debe estar muy
consciente de ello.
La terapia de estiramiento y flujo, los ejercicios de la función vocal, la terapia de
resonancia vocal de Lessac–Madsen, la terapia vocal de Lee Silverman y el Método de
Acento son programas de terapia vocal holísticos y muy estructurados que buscan
establecer el equilibrio entre los subsistemas respiratorio, fonatorio y de resonancia
durante la producción de la voz.

Fonación fluida

Stone y Casteel (1982) propusieron el uso terapéutico de ciertos ejercicios de flujo de


aire denominados terapia de fonación fluida o flow phonation. La fonación fluida es la
correcta transmisión de la corriente de aire, la cual requiere una posición relajada de la
laringe para facilitar una cualidad/calidad vocal clara. Se cree que los ejercicios
favorecen la relajación y reducen la cualidad/calidad vocal tensa y la tensión en la
musculatura extralaríngea. Puede que esta fonación involucre una configuración laríngea
apenas abducida.
Esta técnica ha sido definida como «ese tipo de fonación que tiene el glotograma con
la mayor amplitud posible, pudiendo combinarse con un cierre glotal completo»
(Gauffin y Sundberg, 1989, p. 559). De hecho, la inspección de formas de onda filtradas
a la inversa para la fonación fluida revela una ligera compensación del flujo positivo
mínimo, lo cual implica pliegues vocales apenas abducidos.
La terapia de fonación fluida propone por lo menos tres ejercicios: gargarizar, soplar
burbujas en una taza (preludio de las estrategias de tracto vocal semiocluido) y el
denominado estiramiento y flujo. Todos ellos se utilizan en conjunto para reentrenar
los músculos laríngeos con el propósito de permitir que el aire fluya a través de la
laringe sin voz, con voz y, luego, empleando diferentes tonos y tipos de vocalizaciones.
El ejercicio de estiramiento y flujo da más información visual que los otros dos; pero
es, sin duda, el más difícil, pues demanda un flujo de aire más constante y consistente
para lograr una ejecución óptima de la actividad propuesta.
Las razones que subyacen al éxito de los ejercicios de flujo de aire se consolidan
sobre la idea de este en estado relajado y una focalización hacia el frente. La
inclinación de la cabeza hacia atrás durante el ejercicio de gárgaras inhibe ―o así se
cree― la elevación laríngea típica de voces hiperfuncionales y estira los músculos
extralaríngeos (Gartner–Schmidt et al., 2013). Al soltar el aire de forma suave y
constante durante este ejercicio, se complementa la relajación de los músculos
extralaríngeos y, a su vez, se logra una mayor claridad en la cualidad/calidad vocal. A
medida que los participantes progresan en el ejercicio, se les instruye a mover de forma
gradual la cabeza hacia el frente para alcanzar la generalización de la voz clara, incluso
sin que la cabeza esté inclinada. El otro principio de estos ejercicios es enfocar la voz
hacia el frente en lugar de enfocarla en la laringe. Los comportamientos entrenados
durante los ejercicios de soplar burbujas y de estiramiento y flujo reducen la actividad
laríngea y cambian la sonorización, pues la centran más arriba en las cavidades orales y
nasales. Semejante configuración puede resultar en la estabilización del flujo versus la
resistencia.

Procedimiento

Como se ha mencionado, la tradición reconoce tres ejercicios de flujo de aire:


gargarizar, soplar burbujas en una taza (tracto vocal semiocluido) y soplar un pañuelo
de papel suave (estiramiento y flujo). Cada ejercicio emplea un constructo en forma de
biorretroalimentación (agua o pañuelo de papel) y la misma progresión básica de las
actividades (con pequeñas modificaciones): a) tareas de flujo de aire sin voz para
establecer un flujo de aire positivo, b) adición de tareas vocales, c) movimiento hacia
arriba y abajo del rango tonal durante las tareas vocales, d) variación hacia tareas
discursivas y e) eliminación de la biorretroalimentación. Durante cada intento de
vocalización, el clínico debe escuchar una cualidad/calidad vocal clara y sin esfuerzo,
y debe entrenar la escucha de los participantes.
El ejercicio de gargarizar requiere que el participante ponga una pequeña cantidad de
agua en su boca, recline la cabeza y haga gárgaras sin voz, 10 veces, durante 5–6
segundos, con pausas entre estos. Se instruye a los participantes para relajar la garganta
y hacer gárgaras con suficiente flujo de aire, a fin de que las burbujas revienten fuera de
la boca. El siguiente paso es hacer gárgaras de la misma forma pero con voz, de nuevo
asegurándose que las burbujas exploten fuera de la boca. En el tercer paso se hacen
gárgaras con voz, 10 veces, subiendo y bajando por la escala tonal de manera libre y
relajada. El cuarto paso implica inclinar la cabeza hacia adelante, hacer gárgaras con la
boca cerrada y permitir que el sonido salga por las fosas nasales en un zumbido. Los
beneficiarios tragan el agua, toman una respiración fácil, repiten /mmmma/, /ama ma/,
/mmmmayo mayo, mayo, mayo/ y continúan con otras vocales. Cuando la producción
suene relajada y nasal, sin tensión laríngea, se puede realizar con palabras como mamá,
Mary, maní y mármol. Es importante tener en cuenta que este ejercicio puede tener
contraindicaciones en sujetos con disfagia; por lo que se sugiere que ellos realicen el
ejercicio de hacer burbujas en una taza.
El último ejercicio mencionado —primigenio de las técnicas de tracto vocal
semiocluido vigentes— requiere que los participantes tomen una taza de plástico
transparente llena de agua (cerca de 2/3 de su altura), coloquen su boca sobre la taza y
la hagan caer hasta que el labio superior toque el agua. Después, ellos deben tomar una
inspiración y soplar burbujas sin usar la voz para establecer un flujo de aire positivo.
Mientras esto sucede, las burbujas deben aparecer activas en la taza. Esto se hace 10
veces y luego se añade sonoridad durante 10 ensayos, de modo que suene como el
motor de un barco. Cuando se añade sonoridad, las burbujas se mantienen igual de
activas a las hechas sin voz. En el tercer paso, los participantes soplan burbujas con
voz al tiempo que se mueven relajados hacia arriba y abajo de la escala tonal. En la
cuarta etapa, los participantes empiezan soplando burbujas con voz y luego alejan con
lentitud la taza de la boca. A medida que la taza se aparta, los labios se mantienen
fruncidos y el sonido continúa con un /ooh/ relajado y susurrado. Después de una
inspiración se repite el /ooh/. Este paso se practica 10 veces. Otras versiones de
fonación fluida involucran diferentes ejercicios con el tracto vocal semiocluido y
estiramiento y flujo. Se presentan con mayor detalle en apartados posteriores por su
carácter estructurado y de interés especial para las comunidades científicas de la
actualidad.
El objetivo inicial de la fonación fluida es exagerar un poco el flujo de aire durante el
ejercicio para facilitar la producción de la voz y normalizar el flujo de aire. Así, cada
ensayo debe modificarse hasta que se logre la voz meta. Cuando el sujeto pueda
producir la voz meta con consistencia utilizando el facilitador, se debe eliminar su uso
gradualmente, hasta que la voz meta pueda ser producida con frecuencia independiente
del facilitador. Como precaución en la implementación del procedimiento, debe
advertirse que si el tratamiento es exagerado y no se supervisa, es muy probable que
ocasione diferentes desequilibrios de la laringe.
Los participantes comienzan con gárgaras o soplan burbujas en una taza. A medida
que dominan uno o ambos ejercicios, avanzan hacia otros de estiramiento y flujo.
Aunque hay espacio para una cierta variabilidad de participante a participante,
dependiendo del éxito con los ejercicios y de la dificultad, la mayoría parece
beneficiarse de hacer gárgaras o soplar burbujas en una taza antes del estiramiento y
flujo.
Para el ejercicio en casa, cada participante practica, como se indica, cuatro veces al
día durante unos 10 minutos por sesión. Este régimen ayuda a prevenir el uso excesivo
y la exacerbación de la hiperfunción y promueve el mantenimiento del habla durante
todo el día. Los beneficiarios mantienen un registro que les obliga a marcar con un visto
bueno cada intento de ejercicio exitoso y con una X cada intento que consideren
infructuoso. Todos estos registros se completan y regresan como demostración de su
cumplimiento.

Evidencia

Las variaciones de la fonación fluida han sido utilizadas con éxito por diversos clínicos
e investigadores y discutidas en varios textos (Stone y Casteel, 1982; Gartner–Schmidt,
2010; Andrews, 2006; Verdolini, 2000). Sin embargo, en la literatura investigativa no
existen datos que validen su éxito clínico, excepto los aportados por el estudio de
McCullough et al. (2012). Los seis participantes de dicho estudio buscaban rebalancear
el flujo de aire espiratorio y la resistencia laríngea. Al concluir la quinta sesión del
tratamiento, los tres ejercicios empleados normalizaron las mediciones en tres áreas del
flujo de aire: la media del flujo espiratorio durante la fonación confortable, la media de
flujo de aire durante una tarea vocal eficiente y la resistencia aerodinámica durante una
tarea vocal eficiente.
Aunque la muestra fue pequeña, la evidencia inicial demuestra que los cambios en el
flujo de aire y la resistencia en los sujetos disminuyeron el NHR de 290 a 0.178 —una
medida sensible a la aspereza vocal—, la percepción de la voz (CAPE–V) de 43.00 a
10.33 y la discapacidad vocal autopercibida (VHI) de 80.5 a 40.83. Por tanto, los
ejercicios realizados en este estudio piloto rebalancearon el flujo de aire de la laringe
y, así, optimizaron la resistencia para la vocalización. Estas mejoras pueden traducirse
en cambios positivos en la autopercepción del deterioro vocal y las características
perceptuales y acústicas de la cualidad/calidad vocal.

Tracto vocal semiocluido

También llamado SOVTE (por su sigla en inglés) o resonancia en tubo, ha sido una
estrategia de terapia vocal en Finlandia desde 1960 (Sovijärvi, 1965; Laukkanen, 1992;
Simberg, 2001). Bajo los mismos fundamentos, Denizoglu y Sihvo (2010) desarrollaron
la terapia Lax Vox. Los ejercicios de tracto vocal semiocluido tienen por objeto reducir
la tensión excesiva en el tracto vocal y facilitar la cualidad/calidad vocal resonante.
Esta técnica implementa una serie de posturas que buscan alargar u ocluir el tracto
vocal para generar un cambio en el patrón vibratorio de los pliegues vocales. Dichas
posturas producen una adaptación de la impedancia entre el tracto vocal y las cuerdas
vocales, lo cual alimenta la energía de la glotis, pues entre la presión supraglótica y la
columna de aire se provoca una velocidad en fase.
La gran variedad de ejercicios de tracto vocal semiocluido desarrollados a lo largo
de los años incluye vibraciones labiales y linguales, zumbidos (humming), fonación
con consonantes fricativas labiodentales, bilabiales fricativas o explosivas, oclusión de
la boca con la mano o con un dedo (finger kazoo), uso de tubos de resonancia o
canulillas resistentes al flujo, Lax Vox, etc. Entre estos hay diferencias significativas en
lo que respecta a la aplicación y la fisiología: algunos presentan una obstrucción frontal
constante del tracto vocal (zumbido y oclusión de la boca con la mano); otros se
caracterizan por alargar el tracto vocal mediante el acoplamiento de tubos de
resonancia (Lax Vox). Por otra parte, unos utilizan una sola fuente de vibración
(cuerdas vocales) en el tracto vocal (mano sobre la boca, zumbido y pitillos) y otros
imparten una fuente secundaria de vibración en el tracto vocal (vibración de labios y
lengua y Lax Vox). En estos últimos, una segunda fuente de vibración ubicada en la
parte distal del tracto vocal crea una variación de la presión supraglótica que afecta el
patrón de vibración de las cuerdas vocales, lo cual produce, a su vez, una vibración de
todo el tracto vocal en su ejecución. Este aspecto de algunos ejercicios de tracto vocal
semiocluido ha sido explorado y considerado como un efecto masaje en estudios
recientes, puesto que los cambios en la presión intraoral masajean el tracto vocal y las
cuerdas vocales (Andrade et al., 2014).
La fonación en tubo de resonancia, ya sea sujetando el tubo en el aire o con un
extremo del tubo dentro de un recipiente de agua, hace que la laringe sea más eficiente y
mejora la cualidad/calidad de la voz. También promueve una cualidad/calidad vocal
que no se produce con escape de aire ni presión, una característica deseable para el
cuidado de la voz. Según Laukkanen (1992), la razón de la mejoría puede ser la
retroalimentación acústico–mecánica que favorece la interacción fuente–tracto. Los
cambios acústicos supraglóticos logrados con los ejercicios de tracto vocal
semiocluido son los causantes de la disminución del primer formante del tracto vocal
(F1), lo cual permite que la frecuencia fundamental (F0) durante el habla esté más cerca
de F1 y, por consiguiente, que el aumento de la reactancia inertiva del tracto vocal y la
producción de un patrón de vibración de las cuerdas vocales sea más eficiente
(Laukkanen, Horácek, Krupa y Svec, 2012).
Además, algunos ejercicios de tracto vocal semiocluido amplían la faringe en
relación con la epilaringe, causando una agrupación del tercer, cuarto y quinto
formante. Los ejercicios de tracto vocal semiocluido se recomiendan para patologías
vocales tales como la fatiga vocal, la paresia del nervio laríngeo recurrente, la
hiperfunción vocal y la laringitis crónica o los nódulos vocales.

Procedimiento

Los participantes fonan un sonido con el tono e intensidad habitual dentro de un tubo de
vidrio con un diámetro interior de 9 mm. El otro extremo del tubo se mantiene 1–2 cm
por debajo de la superficie del agua. Durante la fonación, el agua debe burbujear y el
sujeto debe mantener el tubo entre los labios con firmeza pero relajado. La fonación
debe hacerse sin esfuerzo, seguida de una respiración normal rítmica. Durante las dos
primeras semanas, se pide que los sujetos hagan el ejercicio de resonancia de tubo
durante 1 o 2 minutos, una vez cada hora, cuando estén en casa. Durante las siguientes
semanas, los participantes deben realizar este ejercicio al menos tres veces al día, 5
minutos cada vez.
Otras variaciones de la técnica original emplean un tubo de silicona suave con una
longitud de 25 cm y un diámetro interior de 9 mm (Lax Vox), cánulas de 12.5 cm de
longitud y 4 mm de diámetro o pitillos de 2.8 mm de diámetro. En otras modalidades, se
solicita hacer vibrar labios y/o lengua, producir zumbidos y colocar una mano o un
dedo sobre la boca mientras se realizan tareas como mantener una fonación sostenida
y/o producir logotomas, glissandi ascendentes y descendentes, acentos ascendentes y
descendentes, y melodías de una canción. Cada tarea se ejemplifica primero y se
ejecuta durante 3 minutos, permitiendo las inspiraciones necesarias y manteniendo
siempre la sensación de «garganta abierta» durante la práctica de los ejercicios.

Evidencia

Los efectos de esta técnica se reportan en estudios desarrollados, al principio, en


Finlandia (Laukkanen, 1992; Laukkanen, Lindholm y Vilkman, 1995; Laukkanen,
Lindholm, Vilkman, Haataja y Alku, 1996; Laukkanen, Päivi y Vilkman, 1998;
Laukkanen, Titze, Hoffman y Finnegan, 2008; Laukkanenet al., 2012; Simberg y Laine,
2007) y, más recientemente, en Suecia (Enflo, Sundber, Romedahl y McAllister, 2013),
Reino Unido (Andrade, 2014), Brasil (Sampaio, Oliveira y Behlau, 2008) y Chile
(Guzmán, Higueras, Fincheira, Muñoz y Guajardo, 2012; Guzmán et al., 2013).
El estudio sobre los efectos de los ejercicios en tubo desarrollado por Laukkanen
(1992) mostró que esta técnica mejora la función vocal de los sujetos en las frecuencias
medias del rango de habla. Después, Laukkanen et al. (1996) estudiaron el efecto de la
consonante fricativa bilabial /ß:/ y los resultados electroglotográficos mostraron
descenso laríngeo, actividad muscular laríngea reducida, pendiente más acentuada en el
espectro de la voz y mayor economía vocal. Por su parte, Simberg et al. (2006)
implementaron esta técnica en forma grupal y reportaron mejoras significativas en los
parámetros de la cualidad/calidad vocal (grado, ronquera, escape de aire y fricción
vocal), incluso tres meses después del tratamiento. En contraste, el examen laríngeo no
reveló diferencias significativas, a pesar de que los eritemas y edemas de la cuerda
vocal disminuyeran.
Al comparar los ejercicios de finger kazoo y la fonación con pitillos, los hallazgos de
Sampaio et al. (2008) arrojaron resultados positivos y similares en la autoevaluación
vocal y el análisis acústico, mientras que la evaluación perceptual auditiva indicó
efectos positivos solo en la fonación con pitillos. El beneficio de los tubos de
resonancia en la evaluación perceptual también fue corroborado por el estudio de Enflo
et al. (2013). A partir de las diferencias estadísticamente significativas en los
parámetros acústicos (cepstrum, jitter, shimmer y NHR) y una percepción subjetiva de
mejoría en la producción de la voz, Guzmán et al. (2012) concluyeron que el uso de
tareas fonatorias dentro de tubos de resonancia puede tener un efecto fisiológico,
terapéutico e inmediato en sujetos con voces disfónicas. Otros estudios sugieren que los
individuos con voces normales presentan más claridad, brillo y mayor sonoridad vocal
después de realizar los ejercicios de semioclusión (Guzmán et al., 2013; Laukkanen,
1992; Laukkanen et al., 1995; Laukkanen et al., 2008).

Estiramiento y flujo (stretch and flow)


Creada por Stone y Casteel (1982), la técnica de estiramiento y flujo (stretch and flow)
se centra en el aumento de la facilidad y calidad de producción de la voz mediante el
aumento del flujo de aire durante la fonación. Su objetivo fundamental es iniciar el
control volitivo sobre los subsistemas vocales utilizando estímulos de flujo de aire
sonoro y sordo, mientras se mantiene una percepción de esfuerzo muscular mínimo
durante la fonación. Para lograrlo, se instruye al usuario para que: controle mejor los
patrones respiratorios que apoyan la producción de la voz, coordine el comportamiento
respiratorio y laríngeo durante el habla mientras se centra en la resonancia orofaríngea,
y reduzca el esfuerzo fisiológico general durante la fonación. Es una intervención vocal
fisiológicamente estructurada, caracterizada por una jerarquía de tareas vocales que se
vuelven cada vez más desafiantes y diseñada para rebalancear los subsistemas de la
producción vocal respiratorio, fonatorio y de resonancia.

Procedimiento

El estiramiento y flujo se caracteriza por una jerarquía de comportamientos vocales que


deben demostrarse en un nivel específico de rendimiento mediante un gradiente
ascendente de contextos difíciles. Estos, a su vez, responden a requisitos rigurosos para
la instrucción clínica y la progresión de los usuarios mediante los contextos y
comportamientos vocales.
Para este ejercicio, los participantes toman un pañuelo de papel, separan sus capas y
doblan una de estas por la mitad. El pañuelo se toma cerca de su parte superior entre el
dedo índice y corazón y se sostiene en frente de la cara. La boca se centra alrededor de
la unión de la parte inferior y el tercio medio del pañuelo. En la primera parte, los
participantes soplan aire hacia el pañuelo de modo que este se mueva hacia atrás,
paralelo al suelo durante 4–5 segundos, para proporcionar una indicación visual del
flujo de aire. Esto se hace 10 veces con pausas entre tiempos. El flujo de aire debe
sentirse fácil y sin esfuerzo y debe confirmarse esta sensación con el participante. A
continuación, los participantes soplan aire en el pañuelo. Cuando este último esté
paralelo al suelo, los sujetos adicionan la voz. El pañuelo debe permanecer paralelo al
suelo, por lo que la voz debe susurrarse. Esto se hace 10 veces con pausas suficientes.
En la etapa siguiente, los participantes comienzan a soplar aire en el pañuelo y
vocalizan de manera simultánea, asegurándose de que el pañuelo permanezca paralelo
al suelo. Luego, dicen «uno» con la misma voz fácil susurrada y bajan el pañuelo
después. Esto se repite contando los números hasta el diez. El cuarto paso se lleva a
cabo de la misma forma pero con frases que inician con /h/ en lugar de palabras, por
ejemplo, «jamás lo hagas» y «junto a ti». Así, se identifican cinco niveles de habilidad,
al emplear un pañuelo de papel suave como forma de retroalimentación visual y
progresión hacia el siguiente nivel hasta obtener el 90% de precisión en 10 ensayos
consecutivos (Watts et al., 2014). Dichos niveles son:
Nivel I – flujo: la meta es que el hablante gane control sobre el flujo de aire hasta
obtener un flujo constante de aire sin voz y sin esfuerzo, a través de labios
redondeados, es decir, un flujo prolongado y una exhalación fácil.
Nivel II – estiramiento y flujo: la meta es producir un flujo de aire a través de la
glotis para lograr una voz suave con movimientos de los articuladores lentos
(estiramientos) haciendo el mínimo esfuerzo. El producto es obtenido sin esfuerzo,
susurrado y en un habla conectada con un ritmo reducido.
Nivel III – estiramiento y flujo sonoro: la meta es producir un flujo de aire sonoro a
través de la glotis con movimientos de los articuladores lentos (estiramiento) haciendo
el mínimo esfuerzo. El producto obtenido con un ligero escape de aire fortalece la
cualidad/calidad vocal en habla conectada y reduce su ritmo.
Nivel IV – reducción de estiramiento con un aumento del flujo: la meta es producir
un flujo de aire sonoro que atraviese la glotis con un ritmo más rápido de habla
haciendo el mínimo esfuerzo. El producto obtenido es una voz sin esfuerzo pero con
habla y escape de aire a un ritmo normal.
Nivel V – reducción del flujo de aire: la meta es producir una cualidad/calidad vocal
normal con un ritmo de habla apropiado haciendo el mínimo esfuerzo. El producto
obtenido es la sonoridad conversacional perceptualmente apropiada (sin escape de
aire), con flujo normal del aire, velocidad normal y frecuencia fundamental o tono
modal (natural para esa persona).

Evidencia

Aunque los ejercicios de estiramiento y flujo se han implementado en el cuidado clínico


desde hace algún tiempo, la evidencia que apoya su eficacia es escasa. El estudio de
McCullough et al. (2012) logró probar de forma empírica la eficacia del tratamiento
desde un enfoque ecléctico, combinado con ejercicios de tracto vocal semiocluido. La
investigación de Watts et al. (2014) encontró cambios estadísticamente significativos
entre el pretratamiento y el postratamiento con esta metodología en cuatro medidas de
resultado: el índice de discapacidad vocal (VHI), la relación s/z, el tiempo máximo de
fonación (TMF) y la prominencia del pico cepstral en las frases, las cuales reflejan
menos percepción de la discapacidad vocal, mayor control de flujo de aire con
sonoridad y una mejoría de la estabilidad fonatoria.

Terapia confidencial

Según Colton y Casper (1990), este método promueve un modo de fonación con un
ligero escape de aire y un mínimo esfuerzo e intensidad. Desde el punto de vista
fisiológico, la voz confidencial resulta ser una franca postura abductora, menor en
comparación con la voz resonante. Los exámenes videoendoscópicos muestran que la
fonación con escape de aire se asocia con una brecha persistente de la glotis durante su
ejecución, en una ubicación variable a lo largo de la dimensión anteroposterior de los
pliegues. Sin embargo, debido a la mayor aducción asociada con la voz confidencial, si
se le compara con la voz resonante, esta fonación puede ser superior en un aspecto
fisiológico, según su potencial para la reversión de la lesión.
En años más recientes, este método ha evolucionado y generado una variación
denominada terapia de flujo confidencial o Casper–Stone confidential flow therapy
(CSCFT). Esta emplea estrategias de fonación fluida, sobre todo de estiramiento y flujo
(Stone y Casteel, 1982) y un protocolo idéntico al utilizado en la terapia resonante de
Lessac–Madsen (Verdolini‒Marston, Burke, Lessac, Glaze, y Caldwell, 1995), pero sin
explicitar el uso del tracto vocal semiocluido ni centrarse en las sensaciones
vibratorias orofaciales.
La terapia vocal confidencial se considera útil durante las etapas iniciales del
tratamiento para la reducción precoz y máxima de las lesiones, la disfonía y los
nódulos. En la práctica real, algunos clínicos consideran que la terapia confidencial y
la resonante son complementarias, por lo que implementan la voz confidencial en las
etapas tempranas de la terapia bajo el supuesto de que produce una rápida reducción de
las lesiones. Asimismo, la terapia de resonancia y los métodos afines se utilizan en
etapas posteriores para mejorar el producto vocal y, además, proteger de una lesión
mayor.
Teniendo en cuenta la autoeficacia o percepción del sujeto sobre su capacidad técnica
para producir un tipo de voz entrenada, la terapia vocal confidencial puede generar
mayor adherencia debido a la impresión informal de que la mayoría de sujetos logran
producir una voz confidencial a nivel conversacional con poco entrenamiento, en
comparación con otras aproximaciones. Sin embargo, existe una consideración que
puede compensar la posible ventaja de la terapia de voz confidencial: por definición, la
voz confidencial implica una fonación tranquila; así pues, los sujetos pueden dejar de
utilizar este tipo de sonoridad en situaciones que requieren niveles más normales y, por
el contrario, preferir otras técnicas en situaciones que requieren una fonación más
fuerte.

Procedimiento

El método de terapia vocal confidencial se modela según las descripciones de Colton y


Casper (1990) y se centra en: a) la producción con mínimo esfuerzo, intensidad mínima
y un ligero escape de aire, como si se estuviera hablando en confidencia a corta
distancia, sin apretar de modo perceptible la región perilaríngea, y b) la relajación
general del cuerpo obtenida, por ejemplo, mediante la agitación u oscilación de la
mandíbula y los hombros y una respiración fácil.
A discreción del clínico, se puede cambiar el orden de las actividades propuestas por
el método: higiene vocal, calentamiento, ejercicios nucleares de fonación con ligero
escape de aire (voz confidencial), cantados con voz confidencial, comunicativos con
voz confidencial, breves con voz confidencial, messa di voce —incremento y descenso
del volumen manteniendo el mismo tono— con voz confidencial y conversación. Se
realizan 8 sesiones de entre 30 y 45 minutos cada una si se desarrolla el programa
completo. El único requisito es que todas las actividades propuestas sean
implementadas en algún momento durante el programa y se destinen los primeros cinco
minutos de cada sesión para el chequeo inicial y los últimos cinco para dar
instrucciones de refuerzo en casa.

Evidencia

Al igual que la fonación fluida, diversos clínicos e investigadores han citado e


implementado con éxito la terapia confidencial. Sin embargo, la literatura no
proporciona datos suficientes para validar su éxito clínico, excepto los hallados en el
estudio de Verdolini et al. (1995), que mostraron beneficios específicos en el esfuerzo
fonatorio y en las medidas perceptuales auditivas de la terapia confidencial durante las
pruebas de seguimiento a las dos semanas. Aun así, las estadísticas no confirmaron una
tendencia similar en las medidas de percepción visual de la laringe. Los autores
plantean que, desde un punto de vista fisiológico, la terapia de voz confidencial puede
reducir más los nódulos laríngeos y la disfonía que la terapia de voz resonante. No
obstante, hay poca evidencia de lo anterior.

Ejercicios de la función vocal

Esta aproximación holística descrita por Stemple, Lee, D’Amico y Pickup (1994) y
Sabol, Lee y Stemple (1995) es un tipo de terapia vocal fisiológica que se orienta hacia
el mecanismo vocal y, por tanto, no se ocupa de los síntomas vocales específicos.
Stemple et al. (1994) la define como «una serie de manipulaciones de la voz que fueron
diseñadas para fortalecer y equilibrar la musculatura laríngea y el flujo de aire para el
esfuerzo muscular» (p. 271). Es un programa sistemático de ejercicios con objetivos
terapéuticos y efectos de rehabilitación en la producción de la voz (Sabol et al., 1995)
diseñado para mejorar: a) el balance entre los subsistemas de producción de la voz
(respiración, fonación y resonancia), b) la fuerza muscular laríngea, c) el control de la
voz y la resistencia y d) la modificación supraglótica del tono laríngeo. Este tipo de
terapia se basa en que, si el mecanismo de producción vocal está balanceado en
términos de la actividad de varios grupos musculares, mejorará la salud vocal y la voz.
Aunque los VFE (por su sigla en inglés) se diseñaron para prevenir los desórdenes
vocales en individuos con voces saludables, con el tiempo se han aplicado para
corregir los desórdenes de voz. Han demostrado ser útiles para mejorar e incrementar
determinados aspectos de la interpretación vocal de voces saludables (Stemple et al.,
1994), cantantes (Sabol et al., 1995), profesores con voces desordenadas (Roy et al.,
2001) y personas de edad avanzada (Gorman, Weinrich, Lee y Stemple, 2008).
Como lo indica su nombre, el programa de ejercicios de la función vocal está creado
para «ejercitar» el mecanismo fonatorio siguiendo principios de la fisiología del
ejercicio con el fin de lograr balance en la actividad muscular laríngea y una columna
de aire adecuada. La ventaja del ejercicio fisiológico es que implica la coordinación de
los músculos de la laringe y la respiración; ni el mecanismo de la respiración ni la
laringe son tan importantes como la coordinación entre ellos. Los principios de la
fisiología del ejercicio —calentamiento, ejercicio con diferentes intensidades, períodos
de descanso y enfriamiento— se incluyen en el balance y acondicionamiento de los
músculos para la producción vocal. Los VFE tienen un efecto terapéutico sobre la fuente
vocal al brindar a los músculos laríngeos y respiratorios un entrenamiento isométrico
sostenido y refinado en un nivel dinámico muy suave.
Teniendo en cuenta los efectos fisiológicos del ejercicio, el método considera que el
ejercicio sistemático del mecanismo vocal puede aumentar la función de la musculatura
vocal y reorganizar el programa neuromuscular de la función muscular, revirtiendo, por
ejemplo, los efectos de la edad inducidos por la atrofia. Estas mejoras pueden
contribuir, por una parte, a aumentar la compresión medial (disminución de la
curvatura) y mejorar la elongación y contracción de las cuerdas vocales, lo cual facilita
su vibración eficiente. Por otra parte, ayuda a adquirir una mejor eficiencia de la glotis
al disminuir las tasas de flujo de aire, incrementar el tiempo máximo de fonación y
aumentar los volúmenes de fonación.
Los VFE comprenden una serie de cuatro ejercicios implementados en un tracto vocal
con forma de megáfono invertido. Se usan vocales específicas en contracciones
isométricas-isotónicas y se crea una respuesta natural no impuesta de la musculatura. La
elección de las vocales para los ejercicios se relaciona con la fonética de la función
vocal. La /o/ se utiliza debido a su ligera redondez que permite una faringe abierta y
una posición descendida de la laringe menor que la de una /u/ y mayor que la de una /e/
o una /a/. Por su parte, los ejercicios como el deslizamiento o glissando requieren el
balance antagónico entre la función muscular del cricotiroideo y el tiroaritenoideo.
Asimismo, con los ejercicios de calentamiento, estiramiento, contracción y
fortalecimiento se busca mejorar la fuerza, resistencia, estabilidad, flexibilidad y
coordinación de los tres subsistemas de la voz, equilibrar la musculatura laríngea,
balancear el flujo de aire con el esfuerzo muscular y producir efectos positivos en el
comportamiento vibratorio de las cuerdas vocales.
De la fisiología del ejercicio a un programa específico de entrenamiento muscular
como los VFE puede generarse un mayor rango, resistencia, fortaleza y estabilidad de la
voz, y una reducción del riesgo de disfonía (Stemple et al., 1994). Por esto, los
ejercicios de la función vocal son útiles en cantantes y voces normales y, desde hace
una década, se ha evaluado su contribución a las voces desordenadas. Es fundamental
recalcar que los ejercicios de la función vocal contienen el principio isométrico–
isotónico, que puede ser particularmente benéfico para la población cantante al
modificar y mejorar el funcionamiento general de su mecanismo vocal.
Ahora bien, el cantante debe limitarse a responder a la dinámica del ejercicio. A esto
se le podría llamar conexión, una coordinación entre la acción muscular espiratoria y la
actividad de las cuerdas vocales. Si se tiene en cuenta que el cantante, al igual que un
atleta, necesita ejercicios de fuerza, resistencia, ritmo y agilidad, entonces el principio
isométrico–isotónico es un ingrediente esencial en el régimen de entrenamiento del
canto atlético, para evitar que cualquier músculo se contraiga de manera rígida o que
cualquier cartílago se frene. Esto implicaría que un nuevo ajuste sea imposible sin la
ruptura del tono que se está produciendo. Estos ejercicios se diferencian de otros
usados en el canto en que no tienen que ver con el volumen o color aceptable del tono
para el canto popular, lo cual es una cuestión de articulación más que de recurso vocal.
Los VFE se han empleado con éxito para mejorar la función de las cuerdas vocales
hiper o hipofuncionales, aun cuando ofrecen mayor apoyo para mejorar el cierre de las
cuerdas vocales, disminuir el flujo de aire glotal y aumentar la resistencia aerodinámica
cuando el cierre de las cuerdas vocales está comprometido (Gorman et al., 2008). De
igual manera, su racionalización como método para la rehabilitación de la laringe debe
hacerse de la misma manera que se implementa la terapia física para lesiones en otras
áreas del cuerpo. Stemple et al. (1994) concluyeron que mediante la mejora de la
«fortaleza, resistencia y coordinación» de los sistemas involucrados en la producción
de la voz, los ejercicios ayudarían a rehabilitar la voz y aislar al sujeto de los efectos
vocales negativos por el uso amplio de la misma. La suposición implícita es que el
entrenamiento muscular reduce las influencias negativas en la mucosa, las cuales, en
muchos casos, desarrollan las lesiones benignas de las cuerdas vocales (Verdolini,
Rosen y Branski, 2006). Por ello, esta técnica suele recomendarse a personas con un
alto riesgo de lesiones benignas de la mucosa, tales como locutores, cantantes,
profesores, oradores, vendedores y similares. Por lo tanto, es razonable la siguiente
hipótesis: el ejercicio regular del mecanismo vocal también puede mejorar el
acondicionamiento y la función vocal para paliar los efectos de la edad.

Procedimiento
El entrenamiento en V F E tiene cuatro ejercicios: calentamiento, estiramiento,
contracción y ejercicios de fortalecimiento aductor. En términos generales, estos
implican prolongaciones máximas de las vocales y deslizamiento del tono (glissando),
utilizando tonos específicos y contextos fonéticos. Todos los ejercicios se producen de
forma tan suave como sea posible, combinados con una colocación del tono anterior
(hacia adelante). Los participantes son instruidos en la producción de una fonación en
la zona más suave de sus rangos dinámicos, con énfasis en un enfoque frontal del
sonido, es decir, maximizando las sensaciones vibratorias del tercio medio facial: una
focalización extrema hacia delante, casi, pero no del todo nasal. Este entrenamiento
proporciona una pequeña cantidad de información sobre la producción de la voz como
una parte integral de la enseñanza de los ejercicios vocales. La relativa simplicidad de
la aproximación y la carga temporal mínima que impone, tanto a los clínicos (en el
entrenamiento) como a los sujetos (en la implementación), hacen de esta una técnica
compatible con otras terapéuticas. Los ejercicios se desarrollan en los siguientes cuatro
pasos (Sauder, Roy, Tanner, Houtz y Smith, 2010):
Ejercicio 1 – Calentamiento: sostenga la /i/ tanto como sea posible, usando una nota
musical confortable, en voz baja pero focalizada en extremo hacia delante, casi nasal.
Las mujeres en nota musical fa, por encima del do medio, y los hombres en nota musical
fa, por debajo del do medio. La meta es mantener /i/ durante todo el tiempo que pueda.
Ejercicio 2 – Estiramiento: se desliza (glissando) con suavidad hacia arriba de la
gama frecuencial, desde su nota más baja hacia su nota más alta, usando el sonido /o/.
La meta es producir voz sin quiebres vocales.
Ejercicio 3 – Contracción: descienda desde su nota más alta hasta su nota más baja
de la gama frecuencial, usando el sonido /o/. La meta es producir voz sin quiebres
vocales.
Ejercicio 4 – Fortalecimiento: sostener cada una de las notas musicales entre do y
sol (C/do–D/re–E/mi–F/fa–G/sol) el tiempo que sea posible, usando el sonido /o/,
mientras protruye los labios para ocluir parcialmente el tracto vocal. Las mujeres
comienzan en el do medio (C4–D4–E4–F4–G4) y los hombres comienzan una octava
por debajo del do medio. Debe centrarse en la faringe abierta y la vibración en los
labios estrechos. Deben repetirse estas notas dos veces hasta lograr un /o/ sostenido
tanto tiempo como sea posible.
Importante: todos los sonidos deben producirse tan suave como sea posible, pero
manteniendo la voz, sin ningún ataque glotal. Hay que iniciar el sonido en los labios y
mantener el zumbido de los labios, el cual ayuda a la descarga del esfuerzo laríngeo.
Además, es necesario asegurar que el tono se produce hacia delante (pensando en la
forma de un megáfono invertido). Por último, se debe utilizar un buen soporte
respiratorio todo el tiempo y hacer seguimiento de su progreso cada día, usando el CD
grabado para ayudarle.
Con población de edad avanzada, Gorman et al., 2008 eligieron las notas musicales
C3 (130.81 Hz), D3 (146.83 Hz), E3 (164.81 Hz), F3 (174.61 Hz), y G3 (196 Hz), o
A2 (110 Hz), B2 (123.47 Hz), C3 (130.81 Hz), D3 (146.83 Hz) y E3 (164.81 Hz), para
realizar los ejercicios basados en el rango tonal fisiológico de cada participante. El
objetivo del entrenamiento es asegurar la precisión y el tono de producción vocal en
todos los ejercicios.
Uno de los principios de esta técnica es la práctica regular. El programa se realiza en
repeticiones de los cuatro ejercicios completos dos veces al día cada uno, siete días a
la semana, bajo supervisión de un clínico entrenado. El entrenamiento tiene una
duración total de seis a ocho semanas, dependiendo del participante, con un tiempo
menor para voces entrenadas (15–20 minutos) y uno mayor para voces desordenadas o
en proceso de envejecimiento 3 (no menos de 40–60 minutos). Asimismo, los cuatro
ejercicios se practican en casa, dos veces al día cada uno, durante el mismo período.
La enseñanza de los VFE se complementa con un programa de ejercicios escritos y en
audio, y hojas de práctica para registrar los tiempos de fonación. Los sujetos están
obligados a registrar su tiempo máximo de fonación al realizar el calentamiento y
fortalecimiento aductor en casa, para que la tarea de grabación motive a los
participantes a cumplir con los ejercicios y a monitorear su progreso.
Hay sujetos ―sobre todo en la población de edad avanzada― que pueden ser
incapaces de cumplir todas las instrucciones e igualar el tono al mismo tiempo.
Simplificar el régimen de ejercicios podría ayudar a los sujetos a seguir la tarea y a
disminuir la tasa de deserción. Por ello, Pasa et al. (2007) modificaron el programa
original para minimizar la dificultad y obtener el máximo cumplimiento de los
participantes. En lugar de exigirles la ejecución de los ejercicios con notas musicales
específicas, se les permite producir tonos altos, cómodos y bajos. Radhakrishnan y
Scheidt (2012) animaron al participante a continuar con un paso tonal más hasta llegar
al cuarto paso, por encima del tono confortable, utilizando como analogía el subir por
una escalera. Al hacer esto, el participante no necesita preocuparse por notas
específicas a medida que se incrementa la altura del tono. No obstante, se debe tener
precaución al seleccionar estas versiones modificadas, por cuanto los beneficios
reportados por las investigaciones no fueron tan alentadores como los obtenidos con la
versión original.

Evidencia

En la literatura, los efectos de este programa se investigaron primero en un grupo de


mujeres típicas (Stemple et al., 1994), cantantes entrenados (Sabol et al., 1995) y, en
años más recientes, personas en proceso de envejecimiento (Gorman et al., 2008; Berg,
Hapner, Klein y John, 2008; Sauder et al., 2010; Tay, Phyland y Oates, 2012;
Radhakrishnan y Scheidt, 2012; Ziegler et al., 2013), grupos transgénero (Gelfer y Van
Dong, 2013) y personas con altas demandas vocales como los profesores. Los
resultados de VFE con este último grupo poblacional se obtuvieron aisladamente (Roy et
al., 2001; Pasa et al., 2007; Nguyen y Kenny, 2009; Patel et al., 2012) o como parte de
un enfoque de terapias múltiples (Gillivan–Murphy et al., 2006; Niebudek–Bogusz et
al., 2008; Berg et al., 2008).
Al principio, en el estudio original de validación de Stemple et al. (1994) con
mujeres normales, las participantes redujeron su tasa de flujo de aire, incrementaron el
tiempo máximo de fonación, aumentaron el rango frecuencial y manifestaron altos
niveles de satisfacción con los ejercicios, lo que podría mejorar la adherencia de las
personas al tratamiento. Al trabajar con cantantes jóvenes Sabol et al. (1995),
declararon que a la tercera semana el programa de ejercicios incrementó la capacidad
pulmonar y, por ende, la cantidad de aire disponible para la fonación. También aumentó
los tiempos máximos de fonación y disminuyó las tasas de flujo de aire, en especial
durante el nivel tonal alto. Además, mejoró el rango frecuencial, sobre todo en el
extremo superior, y el análisis videostroboscópico mostró una mejoría en la fase
simétrica, cuando las cuerdas vocales se mueven en direcciones opuestas.
El tiempo máximo de fonación mejoró en el postest durante los niveles de tono
confortable, alto y bajo, así como también en la sesión diaria de ejercicio, como
resultado de incrementar la potencia de los músculos inspiratorios, aumentar la
coordinación muscular, la fuerza y la resistencia durante la exhalación, y mejorar las
capacidades de los sujetos para cerrar la glotis de manera más eficiente —una
actividad cricotiroidea mayor para mantener constante el tono— con bajos volúmenes
pulmonares, evitando un tipo de fonación presionada. A consecuencia de lo anterior,
los participantes pueden inspirar un mayor porcentaje y espirar uno menor de su
capacidad pulmonar total (menor volumen residual), lo que conlleva un aumento de la
cantidad de aire disponible para la fonación.
La disminución significativa en las tasas del flujo postest podrían explicarse como
resultado de los ejercicios de la función vocal, los cuales contribuyen, por una parte, a
mejorar el equilibrio entre la aducción glotal, el tipo de fonación y la presión
subglótica y, por otra, a mejorar la coordinación de la ejecución laríngea. Esto último
es necesario porque la cantidad de aire desperdiciado antes, durante y después de la
fonación se reduce debido a un mejor inicio y menor escape de aire durante y al final de
la fonación con bajos volúmenes pulmonares. Lo anterior permite incrementar la
eficiencia de la fonación.
Ahora bien, la implementación de VFE a menores niveles sonoros de los
acostumbrados por los cantantes parecía darles la capacidad de disminuir de manera
significativa sus tasas de flujo de aire en un nivel tonal alto y uno dinámico inferior.
Los investigadores concluyeron que estos valores reducidos fueron resultado de un
mejor equilibrio de los músculos laríngeos de los participantes en cuestión y de un uso
modificado de la presión subglótica.
Al estudiar los efectos de los ejercicios de la función vocal en el tratamiento de la
presbifonía, se ha demostrado un éxito parecido. Gorman et al. (2008) estudiaron los
VFE en hombres de edad avanzada y encontraron que, después del entrenamiento, hubo
un aumento significativo del tiempo máximo de fonación y una mejora del cierre
glótico, con la cual disminuyó la cualidad/calidad con escape de aire. También
demostraron una disminución del flujo de aire glotal (flujo de aire glotal mínimo, pico
máximo, flujo de aire glotal mínimo/pico máximo) y un incremento de la presión
subglótica (presión subglótica, media cuadrática).
Por su parte, en un estudio retrospectivo de casos y controles combinado con otras
técnicas terapéuticas, Berg et al. (2008) reportaron una mejoría en la calidad de vida
relacionada con la voz (VRQOL). Aunque Sauder et al. (2010) no observaron mejoras
postratamiento en medidas perceptuales o acústicas cuantificables, encontraron
disminución en la severidad de la disfonía percibida, mejoría en la autoevaluación de
la disfonía y reducción del esfuerzo fonatorio después de la terapia, con volúmenes de
fonación bastante altos en todos los niveles tonales, sobre todo en el nivel bajo. Estas
mejoras fueron corroboradas por oyentes que observaron reducción de la
cualidad/calidad tensa y con escape de aire durante tareas de lectura después del
tratamiento.
Asimismo, Tay et al. (2012) compararon cohortes con y sin tratamiento en un grupo
coral de 65 años de edad. Encontraron mejoría en las mediciones acústicas jitter,
shimmer y NHR, aumento del tiempo máximo de fonación y reducción de la percepción
de ronquera vocal. La mayoría de participantes percibieron el efecto positivo que el
programa de entrenamiento tuvo sobre sus voces. Estos también manifestaron que,
después del entrenamiento, fueron capaces de cantar por un período de tiempo más
largo sin fatigarse y recibieron comentarios positivos de otros individuos acerca de sus
voces.
Por otro lado, no se detectó ningún cambio significativo entre las puntuaciones
perceptuales de la cualidad/calidad con escape de aire y tensa ni en los rangos
frecuenciales. Radhakrishnan y Scheidt (2012) realizaron un estudio con sujeto único
que mostró una considerable mejoría en varias áreas, incluyendo la autopercepción de
la voz (VHI–10), la percepción auditiva de la severidad general (CAPE–V), la duración
de la fonación, la perturbación de la frecuencia fundamental y el cociente de cierre en
la electroglotografía. Por su parte, Ziegler et al. (2013) documentaron cambios
significativos en la calidad de vida relacionada con la voz (V–RQOL), una práctica
bastante habitual de los programas caseros que parecía reflejar una adherencia al
tratamiento. Sin embargo, no los autores no identificaron mejoras significativas en el
esfuerzo fonatorio percibido.
Con pocas perspectivas de éxito para feminizar las voces en población transgénero,
los resultados del estudio preliminar de Gelfer y Van Dong (2013) sugieren que la
adición de los VFE a la terapia vocal sintomática más tradicional —centrada en el tono,
la cualidad/calidad vocal y la entonación— no representó una mejoría notable del
resultado terapéutico.
Con este enfoque, el último grupo poblacional más investigado ha sido el de los
profesores, dadas sus altas demandas de uso de voz. Cuando los ejercicios de la
función vocal solo se enfocan en los profesores, los resultados revelan contradicciones.
El ensayo aleatorio de Roy et al. (2001) reportó una reducción significativa en las
puntuaciones del índice de discapacidad vocal (VHI), cambios autopercibidos en la voz,
y gran facilidad y claridad de la voz al hablar después del tratamiento individual. Lo
anterior se dio a pesar de la baja confidencia con el clínico durante la administración
del programa.
Por el contrario, los resultados de Pasa et al. (2007) fueron bastante diferentes,
puesto que después del tratamiento grupal no se reportó ninguna mejoría en los síntomas
vocales ni cambios significativos a lo largo del tratamiento en ninguno de los tiempos
máximos de fonación o rango frecuencial máximo. En cambio, se presentaron altos
niveles de deserción, pues cerca del 40% no realizaron las tareas de voz tan bien como
se había previsto. Lo anterior puede deberse a que el tiempo de práctica supervisada
que los participantes recibieron no fue suficiente para que ganaran el entrenamiento
correcto antes de completar los ejercicios de forma independiente. Además, es posible
que los participantes no siempre cumplieran con sus requisitos de práctica.
Comparando estos dos estudios puede interpretarse que los tratamientos VFE
individuales ofrecen beneficios (Roy et al., 2001), mientras que los VFE grupales son
menos eficaces (Pasa et al., 2007). La diferencia podría deberse a que los propósitos
de los estudios son distintos, lo cual pudo haber influido en los resultados: el propósito
de Roy et al. (2001) era llevar a cabo un estudio del tratamiento, mientras que Pasa et
al. (2007) realizaron un estudio para la prevención. Aun así, en ambos estudios los
sujetos reportaron síntomas vocales desde el principio pero con diferentes grados de
severidad y, por lo tanto, de motivación.
Otro aspecto a considerar es el rigor del método: aunque los sujetos del estudio de
Pasa et al. (2007) recibieron entrenamiento, los clínicos de Roy et al. (2001) estaban
mejor entrenados; quizá hubo menos uniformidad y atención a los detalles específicos
en el caso del primero. La versión corta del programa VFE utilizada en el estudio de
Pasa et al. (2007) puede no ser eficaz en su totalidad para la prevención de los
desórdenes vocales. Es posible que deba usarse la versión original de los VFE, que
implica un período de entrenamiento más largo, con el fin de lograr más eficacia
siempre y cuando se use de forma óptima. Dicho de otra manera, es probable que la
diferencia entre el entrenamiento de los clínicos y el de los participantes fuera el
motivo de la disparidad en los resultados de ambos estudios.
Estudios posteriores con un único enfoque de tratamiento han presentado resultados
más homogéneos. Nguyen y Kenny (2009) analizaron la idoneidad de este método con
hablantes de lenguas tonales y encontraron una vibración de las cuerdas vocales más
estable, que se reflejó en la disminución del jitter, shimmer y tamaño de la brecha
glotal, y en una modulación del flujo de aire transglotal más eficaz. Esta última se
evidencia en un mejor NHR, una disminución del desperdicio de aire durante la fonación
y un mejor equilibrio en las actividades musculares laríngeas. Se concluyó que el
programa puede generar una mejor capacidad de variar con precisión el tono durante la
producción del mismo.
Por su parte, Patel et al. (2012), en su estudio de sujeto único con patología orgánica
(granuloma), encontraron una mejoría en la media del tiempo máximo de fonación (de
35.21 a 45.1 segundos), un incremento menor del 4.07% en el volumen espiratorio, una
disminución del 54.16% en la tasa de flujo de aire espiratorio, una mejor calificación
de la evaluación perceptual de la cualidad/calidad vocal —ligeramente desviada
(18.33/100 mm) a cualidad/calidad vocal normal (0/100 mm)—, un incremento del
26.7% en el nivel de intensidad (60.55–79.80 dB) un leve aumento de la frecuencia
fundamental y un mejor cierre de los pliegues vocales membranosos y del pequeño
espacio glotal posterior.
No obstante, el mayor porcentaje de variación en las mediciones se observó en las
imágenes de alta velocidad, las cuales mostraron que el tiempo de inicio de la voz del
participante disminuyó (de 140 a 77 milisegundos) y alcanzó un rango normal y una
mejor flexibilidad vocal por el aumento de la amplitud máxima de vibración (de 7.8% a
10% de la longitud glotal) y el cociente de apertura.
Asimismo, las mediciones del cociente de velocidad mostraron un mayor equilibrio
en el ritmo y las fases (abierta/cerrada) del ciclo vibratorio. Lo más revelador es que la
función de velocidad del pico a la media de ambos pliegues vocales disminuyó,
reduciendo así la fuerza de impacto de la vibración de las cuerdas vocales 4. Lo
anterior se dio, en especial, durante la fase de cierre, lo cual sugiere una fuerza
constante del pliegue vocal, con un control muscular más equilibrado para la
vocalización. Además, la apertura y cierre de las fases del ciclo vibratorio parecían ser
casi iguales, tanto antes como después del tratamiento.
Cuando los VFE se utilizan en conjunto con otras modalidades de tratamiento, los
hallazgos son consistentemente más favorables. Por supuesto, la interpretación de esa
evidencia es algo difícil, pues no es claro qué parte de los beneficios se debe a los
ejercicios de la función vocal y qué parte a otras intervenciones. Tal es el caso del
estudio de Gillivan–Murphy et al. (2006), quienes encontraron mejoras significativas
en la escala de calidad de vida relacionadas con la voz, importantes mejoras en la
subescala emocional de la escala de síntomas vocales, y un mayor conocimiento acerca
de la voz en profesores que habían recibido un programa que combinaba ejercicios de
la función vocal, postura y respiración con un programa de higiene vocal.
Del mismo modo, Niebudek–Bogusz et al. (2008) reportaron los resultados de una
terapia que combina la educación en higiene vocal con trabajo en la respiración,
relajación y ejercicios de la función y resonancia vocal. Cabe añadir que, para
satisfacer las necesidades individuales, el tratamiento se adaptó a cada participante.
Los resultados mostraron que el grupo de terapia combinada obtuvo una mejora
significativa en: ronquera crónica, fatiga vocal, resequedad de la garganta (o tos),
afonía, sensación de globo, hiperfunción, nódulos de las cuerdas vocales, tiempo
máximo de fonación, rango frecuencial de la voz, regularidad y amplitud de vibración
de las cuerdas vocales, onda mucosa y cierre de las cuerdas vocales después del
tratamiento. Los sujetos también informaron que sus voces estaban más cerca de lo
normal después del tratamiento en comparación con su estado anterior.
Aunque las investigaciones que emplearon versiones modificadas (Pasa et al., 2007;
Radhakrishnan y Scheidt, 2012) reportaron beneficios, estos no fueron tan alentadores
como los obtenidos con la versión original. Esta conclusión es reforzada por el estudio
de Nguyen y Kenny (2009), quienes compararon una versión breve del método con la
versión completa y hallaron que los logros de ambas fueron disímiles.
En suma, los resultados sugieren que los ejercicios de la función vocal pueden haber
dado lugar a mejoras en: a) la función aerodinámica de la voz, caracterizada por una
disminución del flujo de aire glotal y un incremento de la presión subglótica; b) la
estabilidad vocal, caracterizada por una mejor regularidad vibratoria de las cuerdas
vocales y, por ende, una reducción en la ronquera regular que puede reducir la
perturbación en la amplitud, la frecuencia, shimmer y jitter; c) la coordinación
fonorrespiratoria, la fuerza y la resistencia que, a su vez, generó un mayor tiempo
máximo de fonación y valores inferiores de NHR; d) la autopercepción de la voz, el
esfuerzo vocal y las calificaciones perceptuales auditivas de la cualidad/calidad vocal.
Después del entrenamiento, algunos aspectos específicos de la función vocal, tales
como el tiempo máximo de fonación y las medidas de estabilidad fonatoria, pueden ser
más sensibles o responder mejor al programa que otros. Los ejercicios de la función
vocal pueden producir mejorías audioperceptuales y funcionales significativas en la
voz envejecida, aunque es probable que haya una limitación fisiológica para mejorías
considerables en este grupo etario.
La evidencia sobre los ejercicios de la función vocal sugiere que este programa
aplicado en forma aislada puede tener valor en el tratamiento cuando los clínicos y los
sujetos reciben un buen entrenamiento. Puede producir resultados positivos en las
personas con problemas de voz, siempre y cuando la terapia se proporcione en un
formato individual y en su versión original.
Por último, los investigadores reiteran que las posibilidades de este programa como
tratamiento dependen de una capacitación de alta calidad del clínico y el sujeto. Como
tratamiento combinado con otras técnicas puede ser valioso en la terapia cuando tiene
múltiples enfoques, aunque la contribución concreta a los resultados es difícil de medir
con los datos existentes.

Terapia resonante

La voz resonante se ha definido como una cualidad/calidad vocal bien proyectada y


fácil de producir, que implica una sensación de vibración en la máscara facial y se
caracteriza por un amplio contenido de armónicos. Por consiguiente, la terapia vocal
resonante es el nombre genérico para describir las terapias que buscan aumentar las
sensaciones vibratorias y orales en la región del tercio medio facial, por lo general, en
la cresta alveolar anterior o en una parte más superior de la cara. Esta técnica también
puede dirigirse a generar una sensación «focalizada hacia adelante» durante una
fonación fácil (Verdolini y Titze, 1995). El objetivo de esta aproximación es lograr una
voz más fuerte con el menor esfuerzo e impacto entre las cuerdas vocales para reducir
al mínimo la probabilidad de una lesión.
La justificación de este método está vinculada a las observaciones del fenómeno de la
voz resonante efectuadas por Verdolini y Titze (1995), quienes proponen que los
pliegues vocales apenas abducidos producen máxima economía vocal (Ev–max). Esta
última se define como el cociente maximizado entre la salida de voz (dB) y la fuerza de
impacto intraglotal (kPa), bajo presión subglótica constante y condiciones de
frecuencia. Por ello, la voz resonante se define como la tendencia asociada con los
pliegues vocales que apenas se tocan o están separados por muy poca distancia
(Verdolini, Druker, Palmer y Samawi, 1998), por lo cual tienden a optimizar la relación
entre la intensidad de la salida vocal (grande) y la intensidad del impacto (pequeña) de
las cuerdas vocales (Berry et al., 2001).
Cabe decir que la sensación vibratoria en la cara durante la fonación indica la
conversión efectiva de la energía aerodinámica en energía acústica (Titze, 2001). En
teoría, se representa un equilibrio óptimo entre la salida vocal (maximizada) y la fuerza
de impacto intraglotal (minimizada), lo cual es un objetivo deseable en muchos sujetos
con desórdenes de voz. Esta configuración de la glotis produce una voz que es
relativamente fuerte y que, a la vez, proporciona cierta protección contra la lesión de
los tejidos de las cuerdas vocales. Así, los individuos que producen voz resonante
pueden alcanzar una buena salida vocal y, al mismo tiempo, lograr una relativa
protección frente al fonotrauma.
Con una postura laríngea apenas abducida o aducida, se puede reducir la presión de
impacto de las cuerdas vocales y, por tanto, disminuir las lesiones de las mismas (Jiang
y Titze, 1994). Además, datos recientes sugieren que la gran amplitud de las
oscilaciones de las cuerdas vocales involucrada en la voz resonante puede tener un
valor reparador real en la inversión de la lesión aguda o, incluso, crónica de la cuerda
vocal (Verdolini et al., 2012). Las características biomecánicas de la voz resonante
hacen de esta una aproximación de rehabilitación atractiva por sus propiedades
terapéuticas potenciales frente al fonotrauma agudo.
Respecto a las vibraciones relativamente grandes de las cuerdas vocales asociadas
con la voz resonante, se cree que pueden funcionar como una especie de factor
biológico de curación en la lesión aguda. Al mismo tiempo, la característica de bajo
impacto de la voz resonante puede funcionar como un mecanismo de prevención
biológica, limitando la aparición de nuevas lesiones en el tejido durante el período de
recuperación.
La característica de gran vibración de la voz resonante puede ayudar a reducir la
afluencia de mediadores inflamatorios en el tejido y, de manera simultánea, aumentar
las concentraciones de los mediadores antinflamatorios desatados por el movimiento
del tejido. Los datos biológicos de Verdolini et al. (2012) sugieren que los ejercicios
de resonancia vocal producen 24 horas después mejores perfiles de inflamación
postraumática. Usando tres marcadores (IL–1Beta, IL–6, MMP–8), estos autores
hallaron que los mediadores inflamatorios enunciados disminuyeron y las
concentraciones normalizadas promedio del mediador antiinflamatorio IL–10 fueron
mayores.
Como tal, la terapia resonante es una aproximación de entrenamiento neuromuscular
que se esfuerza enseñando al sujeto un nuevo patrón neuromuscular; todo para la
producción de la voz como condición básica. También implica el entrenamiento de la
voz de la persona para fonar de una manera más fácil, más resonante. Cuando se
establece este nuevo patrón neuromuscular, se mejora la producción vocal y se reduce
al mínimo el fuerte impacto de las cuerdas vocales.
A lo largo de todas las fases del entrenamiento en voz resonante, en lugar de las
explicaciones verbales biomecánicas, se establece un enfoque en la experiencia con
preguntas como: «¿Sientes las vibraciones en la parte frontal de tu cara?» y «¿la voz es
fácil?». Es decir, se dan instrucciones orientadas hacia el descubrimiento del sujeto de
la voz resonante en vez de prescripciones biomecánicas alrededor de su producción.
Por ello, esta aproximación comportamental asigna una mayor responsabilidad al sujeto
y exige una mayor sofisticación técnica del clínico.
La terapia resonante muestra quizás mayor regularidad en los dominios del
rendimiento vocal tales como el teatro y la música clásica. Es también una meta clave
en la educación de la voz de actores y cantantes y ha sido un componente importante en
la pedagogía vocal durante décadas. Como ha sido descrito por Cooper (1973) y
Verdolini et al. (1995), la voz resonante implica sensaciones vibratorias en la cresta
alveolar y en otras placas faciales durante la fonación.
Al parecer, estas sensaciones surgen, en parte, de una relación acústica de precisión-
sincronía entre las cavidades supraglóticas y la fuente del espectro glotal. Con esta
aproximación, la salida de voz no es necesariamente tranquila. Las observaciones
videoscópicas (Verdolini et al., 1995) indican que la voz resonante se produce, por lo
general, con un cierre anteroposterior casi completo de las cuerdas vocales durante la
fonación. La razón más probable de esto es que el cierre de las cuerdas vocales más o
menos completo y rápido es un requisito previo para la producción de suficientes series
de armónicos con el propósito de facilitar el incremento supraglótico (Titze y
Sundberg, 1992).
En el campo de la patología del habla, el objetivo de la terapia en condiciones de
hiperaducción (nódulos) sería entrenar la configuración laríngea apenas abducida o
aducida disminuyendo la aducción. En las condiciones de hipoaducción (parálisis y
arqueamiento de la cuerda vocal), el objetivo sería entrenar una configuración similar
mediante el incremento de la aducción. Por lo tanto, el mismo objetivo fisiológico
puede ser utilizado en diferentes poblaciones.
Existen múltiples variaciones de la terapia resonante con importantes diferencias de
procedimiento. Sin embargo, hay consenso en que la terapia, para ser eficaz, requiere
un control del entrenamiento básico demostrable (modelado) y una práctica diaria de
ejercicios en un orden jerárquico y sistemático (Stemple, 2000; Verdolini, 2000). La
terapia resonante de Stemple (2000) no debe ser confundida con la Lessac–Madsen
Resonant Voice Therapy (LMRVT, por su sigla en inglés), descrita y popularizada por
Verdolini (2000). La terapia vocal resonante de Stemple (2000) y la LMRVT de
Verdolini (2000) comparten similitudes en sus entrenamientos básicos y modelados —
que acentúan sensaciones vibratorias en la parte media de la cara y un tono focalizado
de modo frontal— y en su enfoque hacia aproximaciones vivenciadas con pasos dentro
de un marco de entrenamiento jerárquico. Sin embargo, hay diferencias procedimentales
importantes (tabla 2.5).
Tabla 2.5. Comparación entre la terapia resonante de Stemple (2000) y la de Verdolini (2000).
Stemple (2000) Verdolini (2000)
Introduce el concepto de resonancia empleando un
Introduce el concepto de resonancia a través de etapas formales, cada una modelo vivencial, mediante el cual el sujeto descubre
con pasos específicamente prescritos que el sujeto debe seguir. la resonancia a través de una serie de amoldamientos
y ejercicios vocales.
El objetivo vocal deseado es dirigido, sobre todo, por el terapeuta, aunque
el modelo de aprendizaje sea experimental. Es decir, el sujeto debe
experimentar las sensaciones vibratorias apropiadas del tercio medio facial
como modelo de aprendizaje básico.
Asigna un tono modal cómodo durante las tres primeras etapas, en un
esfuerzo por reducir la producción de un tono bajo, centrado en la zona No asigna un tono meta.
posterior, y una fonación con frote o fricción glotal.
Proporciona grabaciones de cada paso al sujeto dentro de cada etapa para
No proporciona estas grabaciones de audio.
ayudar a modelar las sesiones de práctica en casa.

Fuente: adaptada de Roy et al. (2003).

En resumen, la terapia de resonancia plantea como principio que la producción de voz


implica sensaciones vibratorias orales, por lo general, en la cresta alveolar y las placas
faciales adyacentes o más elevadas de la cara. Lo anterior se da cuando los sujetos la
perciben como una fonación fácil, donde la voz resonante es una serie de sensaciones
orales y la fonación fácil se construye a partir de la demostración básica del habla en
una forma coloquial.
El entrenamiento se basa en experiencias centradas en el procesamiento de la
información sensorial y en aproximaciones similares para la restauración de la voz y la
potenciación de la voz normal (entrenamiento de excelencia). El objetivo perceptual
fundamental son las sensaciones vibratorias orales dentro del contexto de una fonación
fácil. También se espera que el entrenamiento individual focalizado afecte múltiples
niveles de la fisiología (la respiración y la laringe), para lo cual se utilizan un gran
número de repeticiones en diferentes contextos de habla. Por último, el entrenamiento
tiene metas (resultados) que involucran una persistente insistencia en el logro de las
tareas perceptuales con la mayor precisión posible.

Evidencia

Este método es fácil de aprender; por ello, se usa fuera de la clínica para incrementar la
voz normal. El estudio de Peterson, Verdolini–Marston, Barkmeier y Hoffman (1994)
indicó que los sujetos vocalmente sanos entrenados para producir voz resonante con
pliegues vocales apenas abducidos o aducidos lograban un rango de producción de
máxima economía vocal. Los datos de Verdolini et al. (1998) reportaron que durante la
videoendoscopia rígida, los sujetos con laringes sanas y los sujetos con nódulos
producían voz resonante con una configuración laríngea apenas abducida o aducida. Por
ende, la aducción en voces resonantes no es diferente de la aducción en voces
normales. Esta postura se distingue de la hiperaducción de la voz presionada y de la
hipoaducción de la voz con escape de aire. Smith, Finnegan y Karnell (2005) han
encontrado evidencia en el primer formante de una mayor afinación durante la fonación
sostenida con voz gritada que con voz conversacional normal. Estos autores también
han hallado evidencia de un incremento de armónicos de frecuencias más altas en el
rango de 2 kHz‒4 kHz asociados con la producción de voz resonante. En comparación
con la sonoridad normal, la voz resonante se ha caracterizado por un rango mayor de
declinación máxima del flujo (mfdr 5), un mayor flujo de aire y un similar flujo mínimo
de aire.
En el ámbito clínico, varios estudios sobre el tratamiento de problemas de voz en
profesores han evaluado la utilidad de la terapia vocal resonante. Esta reduce los
problemas de voz, mejora la resonancia vocal y aumenta la eficiencia vocal, resultados
que pueden aumentar la calidad de la comunicación. La evidencia indica que esta
terapia puede ayudar a los profesores con problemas de voz a mejorar una serie de
parámetros relacionados con su voz cuando se aplica como una modalidad de
tratamiento único (Verdolini‒Marston et al., 1995; Roy et al., 2003; Chen, Hsiao,
Hsiao, Chung y Chiang, 2007) y es útil —o al menos no es perjudicial— cuando se
incluye en un programa de tratamiento más amplio (Bovo, Galceran, Petruccelli y
Hatzopoulos, 2007; Niebudek‒Bogusz et al., 2008).
Al ser empleada como una aproximación de tratamiento único, la terapia resonante
parece disminuir de manera exitosa los problemas vocales en los profesores a través de
una reducción significativa de las puntuaciones medias del VHI. Esto también se
evidencia en la autoclasificación de los síntomas vocales como menos severos después
de la terapia (Roy et al., 2003). Por su parte, Chen et al. (2007) encontraron que el
tratamiento mejoró la subescala física en el VHI. En las medidas acústicas, se observó
una mejora significativa en la frecuencia fundamental máxima del rango de habla y en el
rango de intensidad del habla, y en las medidas aerodinámicas solo mejoró el umbral
de la presión fonatoria.
Cuando se combina con otras aproximaciones de tratamiento, la terapia de resonancia
vocal parece ser útil o al menos no obviamente perjudicial. No obstante, las relativas
contribuciones de esta en comparación con otras formas de terapia son difíciles de
interpretar. Los resultados del tratamiento con múltiples modalidades en el estudio de
Bovo et al. (2007) revelaron una mejoría significativa e impresionante a los 3 y 12
meses de seguimiento en comparación con la línea de base en las puntuaciones totales
d e VHI, jitter, shimmer, tiempo máximo de fonación y grado global de disfonía
valorado por el clínico. Los hallazgos laríngeos no se modificaron. Cabe señalar que
las puntuaciones de VHI entre los 3 y 12 meses de seguimiento decayeron para el grupo
experimental, si bien todavía eran mejores que las de la línea base.
Niebudek‒Bogusz et al. (2008) observaron mejoras significativas posintervención en
la ronquera crónica, la fatiga vocal, la garganta/tos seca, la afonía, la sensación de
globo, la hiperfunción, los nódulos en las cuerdas vocales, el tiempo máximo de
fonación, el rango de frecuencia vocal, la regularidad y amplitud de la vibración de las
cuerdas vocales, la onda mucosa normal y el cierre de las cuerdas vocales. Los sujetos
autoinformaron que sus voces eran más normales después del tratamiento.
Otro elemento reportado en la literatura y que debe considerarse al momento de
implementar esta terapia tiene que ver con el número de individuos que no continuaron
el régimen de tratamiento (deserción) por una variedad de razones. Entre estas se
incluyen la pérdida de interés de los participantes, los efectos adversos experimentados
con la intervención, los requerimientos terapéuticos que excedían los beneficios
percibidos por los sujetos y los cambios en la condición subyacente del participante,
para mencionar solo unos pocos.
En resumen, tanto en sus formas genéricas como específicas —la LMRVT o sus
precursores— la terapia resonante ha producido resultados positivos en los profesores
con problemas vocales, ya sea suministrada como tratamiento único o como parte de un
paquete de tratamiento más grande. Una advertencia importante acerca de este método
es que su cumplimiento (adherencia) es más pobre que el de otros métodos por diversos
problemas (Roy et al., 2003), a pesar de que la LMRV T se construyó específicamente
para compensarlos (Ziegler et al., 2010).

Terapia resonante de Stemple

La terapia resonante de Stemple (2000) no solo hace hincapié en las sensaciones


vibratorias del tercio medio de la cara durante la fonación, sino que requiere que todos
los sujetos eleven su tono ligeramente para evitar la producción de la voz «con
focalización posterior».

Procedimiento

En esta aproximación de entrenamiento neuromuscular, el sujeto progresa a través de


tres etapas —con varios pasos dentro de cada etapa— en una jerarquía cada vez más
compleja y cambiante de tareas de sonorización. El avance a través de la jerarquía
exige la adquisición de habilidades en etapas previas de la secuencia del tratamiento.
Para emplear la terapia resonante de Stemple, todos los clínicos deben poseer un
silbato de tono clave de C (chromatic pitch pipe) con selección de notas, dado que esta
requiere que el clínico identifique una nota musical específica que guíe las sesiones de
terapia y la práctica en casa. A la vez, los clínicos deben contar con cuatro grabaciones
de audio para la práctica en casa, las cuales difieren según el género del participante.
De ese modo, el conjunto de cuatro grabaciones corresponde a las notas musicales A‒
B‒C‒D para las mujeres y B‒C‒D‒E (una octava más baja) para los hombres. Cada
una de las grabaciones de audio está marcada de manera específica según cada una de
las cuatro notas musicales. En cada grabación de audio se demuestran los pasos de la
secuencia en el nivel tonal deseado según la nota musical objetivo. Cada participante
recibe una grabación de audio que corresponde con su nota musical destino para
cumplir el propósito de las sesiones de práctica en casa dos veces al día.
Al momento de elegir el tono apropiado para la terapia se debe: a) emplear un
instrumento de tono (pitch pipe o diapasón) clave de C y hacer que la persona cuente
del uno al cinco con una voz natural; b) relacionar el tono de la voz del sujeto con la
nota más cercana en el diapasón. En voces femeninas, esta nota estará típicamente entre
G‒A‒B‒C‒D (donde C es el do central) y, en voces masculinas, será una octava más
abajo. El tono más bajo a emplearse es A para mujeres y B para hombres; el tono más
alto es D para mujeres y E para hombres; c) una vez que el tono ha sido encontrado,
mover el diapasón hacia una nota más alta hasta establecer la nota que va a utilizar
durante todas las sesiones de terapia. También se debe seleccionar la nota musical
objetivo para practicar en casa y dar al sujeto la grabación de audio que coincide con
esta nota. El sujeto utilizará esta cinta de audio solo para las sesiones de práctica diaria
en casa —que duran entre 8 y 10 minutos en la mañana y en la noche— durante toda la
terapia. Estos ejercicios de práctica en casa están diseñados para reforzar habilidades
adquiridas durante las sesiones de terapia. Se le pide al sujeto realizar un seguimiento
de su cumplimiento en una hoja de registro (Roy et al., 2003, anexo F).
El tratamiento se inicia trabajando con sonidos vocálicos y consonánticos de forma
aislada. A continuación, se procede por etapas hacia niveles de conversación y
aplicaciones a la vida real por fuera del ambiente terapéutico. Para avanzar, se requiere
evidencia de que el sujeto es eficiente en el paso anterior, según los siguientes los
criterios: a) el clínico determina el momento en que cada sujeto está listo para pasar a
la siguiente etapa; b) el sujeto es capaz de producir las frases en el último paso de cada
etapa con la resonancia meta el 80% de los intentos; c) en algunos sujetos, la
adquisición de las habilidades puede ocurrir muy rápido y el paciente puede progresar
de igual manera, por lo que el clínico debe sentirse cómodo con todas las etapas del
proceso a fin de no restringir sin necesidad el progreso del sujeto, y d) la práctica en
casa puede comenzar de inmediato desde la etapa 1.
Sin embargo, durante la práctica en casa, los sujetos no deben avanzar a etapas
posteriores por su cuenta hasta que hayan demostrado la pericia necesaria en sus
sesiones de terapia presencial. Cuando existe evidencia de que el sujeto domina un
paso o una etapa particular, se puede empezar la práctica en casa del mismo paso o
etapa con la grabación de audio. Cabe recordar que esta grabación está diseñada para
complementar la terapia. Al final de cada sesión de tratamiento, el sujeto debe ser
aconsejado sobre el paso o etapa de la cinta de audio que debe utilizar en la práctica en
casa.
Los ejercicios deben ser lo más interesantes posible, se deben incluir numerosas
repeticiones de los comportamientos objetivos y debe proporcionarse frecuente
retroalimentación positiva acerca de las ejecuciones de los sujetos. La tabla 2.6
presenta la secuencia de la terapia resonante.

Tabla 2.6. Secuencia de la terapia resonante de Stemple (2000).


Etapa 1 Etapa 2 Etapa 3
Todo es sonoro Contrastes entre sonoro y sordo Cualquier frase
El primer paso del tratamiento consiste en modelar el entrenamiento básico. Se produce el sonido /hmmm–molm–molm–molm–
molm/, que parece un suspiro. Para esto, se requiere enfocarse en la porción facial delantera con el soporte respiratorio adecuado
y utilizar la respiración abdominal para apoyar la producción del tono con el punto de constricción del tracto vocal al extremo
final de los resonadores. En otras palabras, hacer la conexión de los músculos abdominales con los labios. El sujeto debe sentirse
muy relajado al final de la demostración.
Paso 1
Cante la frase en la nota x y
luego exagere la inflexión
focalizándola de manera
excesiva hacia adelante. Repita
Paso 1 con habla natural focalizada
Produzca el sonido /molm–molm–molm/ con hacia adelante.
tono sostenido en x nota y variación de la Estos tres pasos deben
velocidad (lento‒rápido‒lento). realizarse con cada una de las
Descubra las vibraciones, experimente con las
vibraciones estrechas y amplias.
Paso 1 siguientes frases * por
Produzca el sonido /mamapapa/ variando solo separado:
Eventualmente, concéntrese en la vibración
la velocidad (lento‒rápido‒lento) en x nota. All the girls were laughing.
estrecha, como un «haz de luz estrecho».
Aumente la facilidad de la producción Get there before they close.
mediante la reducción del esfuerzo por 1/2 y Did you hear what she said?
1/2 de nuevo. Come in and close the door.
Eleve la altura del tono. Are you going tonight?
Put everything away.
Come whenever you can.
We heard that yesterday.
The player broke his leg.
The children went swimming.
Paso 2 Paso 2
Produzca el sonido /molm–molm–molm/. Produzca el sonido /mamapapa/. Combine
Combine velocidad lenta–rápida–lenta e velocidad lenta–rápida–lenta e intensidad
intensidad suave–fuerte–suave en x nota. Es suave–fuerte–suave en x nota. Es decir, la Paso 1
decir, la velocidad puede variar, pero debe velocidad puede variar, pero debe enfatizar los Cante la frase en la nota x y
enfatizar los cambios de intensidad. cambios de intensidad. luego exagere la inflexión
focalizándola de manera
Paso 3 Paso 3
excesiva hacia adelante. Repita
Produzca el sonido /molm–molm–molm/, como Produzca el sonido /mamapapa/, como en el
con habla natural focalizada
el habla, con la entonación de frases habladas. habla, con la entonación de frases habladas.
hacia adelante.
Utilice frases no lingüísticas, varíe la Utilice frases no lingüísticas; varíe la
Estos tres pasos deben
velocidad, el tono y la intensidad. velocidad, el tono y la intensidad.
realizarse con cada una de las
Use la respiración abdominal para apoyar la Use la respiración abdominal para apoyar la
producción del tono con el punto de producción del tono con el punto de siguientes frases * por
constricción del tracto vocal al extremo final de constricción del tracto vocal al extremo final de separado:
los resonadores. En otras palabras, haga la los resonadores. En otras palabras, haga la All the girls were laughing.
conexión de los músculos abdominales con los conexión de los músculos abdominales con los Get there before they close.
labios. labios. Did you hear what she said?
Come in and close the door.
Come in and close the door.
Paso 4 Are you going tonight?
Paso 4
Cante las siguientes frases * sonoras en la nota Put everything away.
Cante las siguientes frases * sonoras–sordas Come whenever you can.
musical x.
en la nota musical x. We heard that yesterday.
My mother made marmalade.
Mom may put Paul on the moon. The player broke his leg.
Mary made me mad.
Mom told Tom to copy my manner. The children went swimming.
My merry mom made marmalade.
My manner made Pete and Paul mad.
My mom may marry Marv.
Mom may move Polly’s movie to ten.
My merry mom may marry Marv.
My movie made Tim and Tom sad.
Marv made my mother merry.
Paso 5
Exagere la inflexión de estas frases durante el habla.
*Está pendiente definir sus equivalentes fonéticamente balanceados en español.
Fuente: adaptado de Roy et al. (2003).

Las sesiones de práctica en casa —de 8 a 10 minutos, 2 veces al día con el apoyo de
las grabaciones de audio— son un elemento esencial del programa.

Terapia resonante de Lessac‒Madsen

El método de terapia vocal resonante modelado por Arthur Lessac y Mark Madsen en
1967 (LMRVT) y desarrollado por Verdolini (2000) se fundamenta en: a) la producción
concentrada de sensaciones vibratorias en el paladar anterior (reborde alveolar)
durante la fonación, empleando una postura facial conocida como megáfono invertido y
b) la relajación de la parte superior del cuerpo, con manipulaciones manuales para
revertir cualquier tensión obvia de la cabeza, cuello y hombros, a fin de obtener una
buena alineación de cabeza y cuello. Todo esto en el contexto de una fonación fácil.
La postura de megáfono invertido se caracteriza por una cavidad faríngea ampliada,
una mandíbula descendida y ligeramente sobresaliente, una lengua relajada en posición
anterior y un tracto vocal alargado con protrusión labial. Estos cambios del tracto vocal
afectan las frecuencias de los formantes de forma predecible (Titze, 1994). Las
frecuencias del formante —también referidas como frecuencias resonantes del tracto
vocal— son componentes del espectro de la fuente glotal, reforzados cuando la señal se
propaga a través del tracto vocal.
Ahora bien, la ampliación faríngea sirve para bajar F1 y elevar F2. La reducción de
la primera frecuencia del formante puede afinarse para la frecuencia fundamental o para
el segundo armónico. La afinación formante‒armónico se produce cuando un armónico
está cerca o coincide exactamente con una frecuencia del formante, lo que permite que
el hablante produzca un tono más sonoro sin aumentar el esfuerzo. Del mismo modo, la
ampliación faríngea podría cumplir con la proporción requerida (6:1) del área
vestibular faríngea–laríngea, que se encuentra en el modelamiento acústico del formante
del cantante. Esto, a su vez, ayuda a aumentar la energía espectral alrededor de 3.0 kHz
(Sundberg, 1974). Estas modificaciones en los formantes del tracto vocal podrían
producir una voz que se proyecte bien y tenga un amplio contenido de armónicos.
El programa LMRVT se basa en un modelo que considera tres parámetros importantes:
el objetivo biomecánico, el enfoque de aprendizaje y el enfoque de compromiso. El
objetivo biomecánico involucra una configuración de laringe apenas aducida/abducida
que optimiza la relación entre la intensidad de salida (grande) y la intensidad del
impacto del pliegue vocal (pequeña). Este objetivo es ideal para las personas que
utilizan mucho sus voces en su práctica profesional. El enfoque de aprendizaje está
basado en gran medida en la ciencia cognitiva y aplicada que indica que el aprendizaje
físico se facilita al dirigir la atención del aprendiz hacia los resultados de las tareas en
lugar de hacia la biomecánica. Indica, además, que la generalización de las conductas
entrenadas se facilita por la práctica cambiante de los comportamientos meta. El
enfoque de compromiso se fundamenta en la literatura sobre el cuidado de la salud, en
particular, aquella que enfatiza la importancia de la autoeficacia de los aprendices
durante una tarea como predictor de compromiso. Por lo tanto, la metodología de esta
aproximación se centra en el procesamiento de la información sensorial para
automonitorear la sensación y concentrarse en la retroalimentación auditiva.
Los efectos fisiológicos de la terapia vocal resonante son la aducción más estándar de
las cuerdas vocales, mejor vibración de las cuerdas vocales y bajos umbrales de
presión de la fonación después de la terapia. También se pueden reclutar neuronas
motoras adicionales y lograr una mayor frecuencia de activación de las unidades
motoras, lo que podría resultar en la contracción del músculo liso y causar menor
irregularidad de la cuerda vocal. Además, el sistema límbico y los sistemas neocortical
y subcortical pueden ser estimulados constantemente para controlar la preparación de la
fonación (Jürgens y Von Cramon, 1982; Sapir y Aronson, 1985). Por lo tanto, estos
efectos fisiológicos pueden reducir la severidad de la cualidad/calidad vocal, aumentar
la flexibilidad durante el habla y mejorar la comunicación funcional.

Procedimiento

Comienza con estiramientos y maniobras de respiración seguidas del entrenamiento


básico modelado. Se estructura una jerarquía de tareas de habla en contextos con
complejidad creciente para la adquisición de las habilidades. En general, el programa
se administra de manera individual en aproximadamente 8 sesiones de 30 a 45 minutos,
durante 4‒8 semanas. Las actividades propuestas por el método son: higiene vocal,
calentamiento, ejercicios nucleares de voz resonante, ejercicios cantados con voz
resonante, ejercicios comunicativos con voz resonante, ejercicios breves con voz
resonante, ejercicios messa di voce con voz resonante y conversación. Cada actividad
se administra en el orden y la sesión que determine el clínico. El único requerimiento
es que todas se implementen en algún momento durante el programa y se destinen los
primeros 5 minutos de cada sesión para el chequeo inicial y los últimos 5 minutos para
dar las instrucciones del refuerzo en casa.

Evidencia

Las investigaciones de Chen, Huang y Chang (2003), Chenet al. (2007) y


Nanjundeswaran et al. (2012) emplearon específicamente LMRVT, pero solo los dos
primeros estudios presentaron los efectos del método. Por su parte, Nanjundeswaran et
al. (2012) comprimieron y administraron el programa de manera grupal en combinación
con un enfoque indirecto y concluyeron que la LMRVT no mostró cambios significativos
en voces saludables, pero optimizó los resultados de la terapia indirecta en personas
con problemas de voz.
Chen et al. (2003) y Chen et al. (2007) mostraron en ambos estudios que la terapia
tuvo efectos positivos en la cualidad/calidad vocal, la vibración de las cuerdas
vocales, el cierre de las cuerdas vocales, la flexibilidad durante el habla, el esfuerzo
fonatorio y la comunicación funcional. Los exámenes videostroboscópicos mostraron
que la onda mucosa y la amplitud de las cuerdas vocales retornaron a la normalidad.
Una mejor onda mucosa y amplitud indican aumento de la elasticidad de las cuerdas
vocales y disminución de la tensión de las mismas. Por otra parte, se apreció mejoría
en el cierre vocal —aducción más normal de las cuerdas vocales— y reducción en la
severidad de la patología de las cuerdas vocales. En el ámbito acústico, la frecuencia
fundamental y su rango máximo durante el habla incrementaron hasta alcanzar un nivel
normal.
Aunque no se reportaron cambios significativos de la perturbación y la
cualidad/calidad vocal con escape de aire —a pesar de que el umbral de presión de la
fonación y el cierre de las cuerdas vocales había mejorado—, el valor del shimmer y el
NHR disminuyeron. El valor de la diferencia entre el primer y el segundo armónico fue
dos veces más bajo después de la terapia. Estos resultados indican aumento de la
flexibilidad, disminución de la fatiga de los músculos fonatorios durante el habla,
incremento en la función, y disminución en el esfuerzo para el habla diaria. A su vez, el
umbral de presión de la fonación y la puntuación en la escala física del índice de
discapacidad vocal se redujeron significativamente. La escala funcional no mostró
cambios, pero las escalas física y emocional se redujeron al nivel de severidad leve, si
bien el análisis estadístico solo mostró cambios significativos en la primera. La mejora
en la escala física sugiere que las perturbaciones de salida vocal se redujeron tras la
terapia, lo que resulta en un menor impacto del desorden vocal en las actividades
diarias.

Terapia twang (sonido vibrante)


La técnica terapéutica twang, descrita por Lombard y Steinhauer (2007) como una
estrategia novedosa para el tratamiento de voces hipofónicas débiles o con escape de
aire, emplea la producción de una cualidad/calidad vocal vibrante‒nasal mediante la
constricción de la epilaringe (o filtro), tal y como se usa para impulsar la potencia
vocal del orador o cantante experto. Si la optimización de la resonancia por medio de
twang es posible para el hablante con una laringe saludable, entonces la constricción
epilaríngea en hablantes con atrofia o parálisis unilateral de cuerda vocal puede
aumentar el poder de las voces con escape de aire o débiles.
La resonancia twang —sonido vibrante con variaciones orales y nasales posteriores y
cerradas— es una cualidad/calidad vocal brillante, estridente, resonante, empleada en
el canto country, como el cloqueo, usada en la burla cantada «lero, lero, candelero» de
los niños y que se equipara a menudo con el graznido de un pato. Fisiológicamente, la
vibración es producida por el estrechamiento de la constricción de la vía epilaríngea
del esfínter ariepiglótico.
La teoría dominante subyacente a este método es la teoría de la potencia de salida
vocal (Titze, 2001), cuya premisa fundamental aprovecha las relaciones glotis‒
epilaringe. La teoría de la potencia de salida de la voz presenta interacciones fuente‒
filtro como un modelo dinámico no lineal. En este caso, la forma del filtro —
correspondiente con el espacio epilaríngeo justo por encima de las cuerdas vocales—
puede optimizar el patrón oscilatorio de las cuerdas vocales que están por debajo (la
fuente). De acuerdo con esta teoría, este incremento en la potencia acústica se atribuye
a las propiedades de un tracto vocal que se estrecha en la epilaringe y está libre por
encima. Esta es una configuración que evita la interferencia de los articuladores
involucrados en la producción vocálica, es decir, lengua, labios, velo del paladar. Así,
el tracto vocal no activo aumenta la vibración de las cuerdas vocales porque la presión
supraglótica que conduce el flujo de aire está sincronizada con la velocidad del patrón
oscilatorio de las cuerdas vocales. El hablante puede mejorar la oscilación de las
cuerdas vocales, gracias a la constricción del esfínter ariepiglótico y un tracto vocal no
activo, al aumentar la amplitud del formante del orador o cantante y capitalizar el
timbre vocal necesario para la proyección de la voz resonante.
Por esta razón, los proponentes del método plantearon la hipótesis de que el
estrechamiento epilaríngeo en la cualidad/calidad twang primero propicia la oscilación
de las cuerdas vocales, lo que conduce a una fase cerrada mayor. A la vez, esta glotis
pequeña balanceada con una epilaringe pequeña puede generar una relación fuente‒
filtro eficiente; pues conforme al teorema de máxima transferencia de potencia, la
relación de la fuente y la impedancia de carga se aproxima a 1.0. Por consiguiente, una
ventaja de esta relación glotal‒epilaríngea es el aumento en la potencia vocal
emparejada con una producción vocal fácil.
El resultado acústico del estrechamiento de este vestíbulo laríngeo es una agrupación
del tercero, cuarto y quinto formante. Esto resulta en una mayor amplitud de todos los
espectros vocálicos en las proximidades de 3.0 kHz (Sundberg, 1987).
Perceptualmente, la voz se amplifica con una intensidad penetrante porque este aumento
de energía de 2.8 kHz a 4.3 kHz corresponde a la frecuencia de resonancia del meato
auditivo externo. Como resultado, las frecuencias fundamentales inferiores a 1.0 kHz
reciben un aumento de 15 dB a 20 dB en sonido transmitido por el oído medio sin un
aumento del esfuerzo vocal por parte del hablante (Yanagisawa, Estill, Kmucha y
Leder, 1989). Esta producción ha sido explotada por los oradores y cantantes expertos
para aumentar la resonancia vocal o squillo, conocida como el timbre del hablante o
formante del cantante (Yanagisawa et al., 1989; Sundberg, 1987; Oliveira, Heuer, Dean
y Sataloff, 2001).

Procedimiento

El clínico facilita una serie de tareas para alcanzar la conducta objetivo de resonancia
twang. La primera tarea es de imitación sin instrucción. El clínico produce habla
automática —por ejemplo, los días de la semana— utilizando la resonancia twang. Al
sujeto se le pide que imite la misma cualidad/calidad vocal y se proporcionan
instrucciones no comportamentales.
La segunda tarea es imitar al clínico usando twang con los sonidos y palabras más
facilitativos, por ejemplo, /ae/, maybe, back. Para evitar el exceso de esfuerzo vocal y
aumentar la naturalidad, la tercera tarea incluye más imitación del mismo objetivo que
la segunda, excepto en lo relativo a la instrucción para minimizar el esfuerzo
articulatorio. En ese momento, el sujeto es sondeado con frecuencia sobre la evaluación
y reducción del esfuerzo vocal y articulatorio.
Una vez se establece la consistencia de los objetivos twang, se introduce la cuarta
tarea, la práctica negativa, para establecer un entendimiento propioceptivo. Se le pide
que repita el objetivo twang, por ejemplo, el sonido o la palabra con los que tienen más
exactitud y consistencia. Luego, se le pide que alterne el objetivo de contar hasta tres
usando su cualidad/calidad vocal anterior, la cual suele ser típicamente entrecortada y
débil. Después de la tarea, el sujeto debe identificar y verbalizar su estrategia de
producción.
Cuando se ha establecido una estrategia, se introduce la quinta tarea, que es extender
la longitud de la frase a fin de facilitar la capacidad del sujeto para implementar la
técnica de producción de frases más complejas. Después de lograr la consistencia y la
percepción de la naturalidad de la cualidad/calidad vocal, se le pide al sujeto que
califique su esfuerzo vocal o fatiga. Si la autopercepción incluye una sensación de
esfuerzo físico, se repite la segunda tarea para establecer la meta sin esfuerzo. Cuando
se completa la última tarea, se solicita al participante poner en práctica la técnica en el
habla coloquial durante una semana. Si el participante reporta éxito sin la percepción
de esfuerzo físico o tensión, es dado de alta y se retira la terapia.
Los sujetos reciben sesiones semanales de terapia vocal individual de 30 minutos
cada una. El número total de sesiones terapéuticas por sujeto oscila entre 2 y 8. Todos
los sujetos deben tener una revaloración programada un mes después de finalizada la
terapia.

Evidencia

Los resultados del estudio piloto de Lombard y Steinhauer (2007) revelaron que el uso
de la cualidad/calidad twang como una intervención para la hipofonía fue una
alternativa exitosa en la rehabilitación de la voz débil. Todos los sujetos mejoraron en
uno o más de los resultados vocales medidos, lo que indicó que las manipulaciones de
la epilaringe pueden influenciar la potencia de salida de la voz, incluso cuando la
oscilación de las cuerdas vocales o la fuente de sonido se ven comprometidas. La voz
fuerte audible se verificó gracias a las mejoras en las medidas acústicas, fisiológicas y
autoevaluativas de la voz; es decir, disminución de la media en la tasa de flujo de aire,
aumento del nivel de presión sonora, incremento del tiempo máximo de fonación y
disminución del puntaje VHI.
Todos los sujetos comentaron cuán contentos estaban al lograr por fin la sonoridad sin
el alto grado de fatiga y esfuerzo que habían experimentado previamente. También se
sintieron aliviados de que el twang añadiera sonoridad a su voz, aunque sonara más
natural que el twang penetrante modelado por el clínico. Tal vez se produjo este
fenómeno debido a la interacción dinámica entre el funcionamiento epilaríngeo y la
fuente glotal comprometida. Por ende, se disminuyó la cualidad/calidad penetrante
«fastidiosa» inherente a una cualidad/calidad twang saludable. Uno de los sujetos con
personalidad introvertida se opuso a hacer una cualidad/calidad twang tan marcada y,
sin embargo, eligió utilizarla para hablar en espacios sociales, profesionales y
ruidosos. Su habilidad para moverse entre las técnicas de habla fue viabilizada gracias
a la facilidad para la adquisición de la técnica twang.
Esta nueva técnica de terapia vocal promete un potencial clínico interesante, pues la
estrategia es fácil de enseñar para los clínicos y de aprender para los sujetos. Por esta
razón, twang puede utilizarse como un complemento a las terapias tradicionales.

Método de acento

El método de acento fue desarrollado en los años 30 por el profesor e investigador


danés Svend Smith del Instituto Danés de Habla y Audición. Es uno de los métodos de
terapia vocal holísticos y es integral en el sentido general de la comunicación verbal,
ya que integra la mejoría de los sistemas respiratorio, fonatorio, articulatorio y las
actividades gesticulatorias. El método de acento ayuda a coordinar la respiración, la
función vocal, la articulación, el movimiento corporal y el lenguaje. También es
integral desde el punto de vista vocal, puesto que aborda de manera colectiva y
simultánea los distintos parámetros de la voz como el tono, el volumen y el timbre. Los
métodos integrales consideran la voz como resultado de una combinación de todas las
partes de la voz, el habla y la totalidad de sus características. Se da importancia al
volumen, la intensidad, la resonancia, el ritmo, el tempo y la entonación. Estas
características de la voz deben ser tratadas individualmente.
El objetivo terapéutico —es decir, las indicaciones— del método hoy en día es tal y
como Svend Smith lo introdujo en el siglo XX para lograr una mejor expresión y
producción de la voz. Se trata de una terapia vocal racional desarrollada para ayudar a
personas con voces débiles o patológicas. El método de acento utiliza los ejercicios de
voz como un buen calentamiento vocal y es muy utilizado por cantantes y actores para
desarrollar patrones de respiración buenos y eficaces. Los cantantes y actores que
utilizan el método de acento a diario mantienen sus voces flexibles y fuertes, incluso en
los períodos en que no las emplean en su trabajo (Møller, 2006). En el dominio de los
desórdenes de voz, el método de acento se puede aplicar como una corriente
terapéutica o una estrategia complementaria. Las principales indicaciones en el primer
caso son desórdenes de voz habituales no orgánicos en adultos y niños, trastornos
psicógenos de voz no orgánicos, tipos seleccionados de lesiones patológicas mínimas
asociadas como los nódulos vocales, y tipos seleccionados de desórdenes de voz
orgánicos.
Del mismo modo, este método se aplica para tratar algunos desórdenes del habla
como la tartamudez y el control respiratorio, a fin de corregir la respiración, la
articulación defectuosa y la disprosodia en los trastornos del lenguaje en niños y
adultos, en la disartrofonía y cualquier disfonía adjunta. Las principales indicaciones
del método de acento como una línea complementaria del tratamiento se desarrollan en
asociación con la farmacoterapia o la fonocirugía. El papel del método en una línea
complementaria de la terapia, como en estos casos, es permitir al sujeto hacer el
máximo uso del potencial de su aparato vocal para optimizar la técnica vocal y evitar la
recurrencia de la patología vocal.
El principio fundamental del método de acento es desarrollar y fortalecer las
funciones normales de la voz, para proveer al orador, cantante o paciente una base
segura para el uso de la misma (Møller, 2006) y, en consecuencia, reducir o eliminar
con ello el exceso de tensión muscular en la región laríngea. El método de acento se
basa en tres principios específicos: a) un óptimo apoyo respiratorio
abdominodiafragmático, b) un juego rítmico de acentuación relajada de las vocales con
progresivo traspaso al habla continua, y c) los movimientos rítmicos dinámicos del
cuerpo y los brazos. En consecuencia, su implementación enfatiza la respiración
diafragmática, la producción vocal rítmica y los ejercicios con fricativas bilabiales
sonoras.
Pankas, Sepić, Pitlović, Rosso y Starcević (2011) argumentan que la razón del éxito
de este método yace en el nivel de conciencia o la activación de las funciones de habla
específicas en el cerebro. La retroalimentación táctil y kinestésica cíclica constante son
responsables de la realización del tempo, volumen, cualidad/calidad y articulación de
la voz. El método de acento subraya la importancia de la respiración y su conexión con
el movimiento y la fonación. Además, los ejercicios fricativos bilabiales sonoros tienen
un efecto favorable sobre la calidad de la voz posiblemente debido a un efecto de
calentamiento y mejoramiento de la economía vocal. Los movimientos liberan la
tensión y utilizan el cuerpo humano como un gran resonador y un instrumento para la
creación vocal. Durante el acondicionamiento de estos ejercicios considerados inútiles
se van creando de forma instantánea los mapas motores en el cerebro y, por
consiguiente, se utiliza un mayor nivel de funciones del habla en el mismo.

Procedimiento

El método de acento se caracteriza por la respiración diafragmática con contracciones y


relajaciones, el aclaramiento del tracto y las cuerdas vocales, los movimientos rítmicos
de todo el cuerpo, la creación de nuevos programas motores en el cerebro, el ajuste de
la fonación, la respiración y la articulación y los cambios de acento en palabras y
sílabas con diferentes ritmos.
Durante el programa terapéutico, hay un esfuerzo por economizar tiempo, por lo que
no se asigna un lapso específico para ejercicios de relajación y meditación. La
relajación se logra a través de los ejercicios respiratorios y los movimientos rítmicos
dinámicos del cuerpo y los brazos. Hay también un tiempo muy limitado para la
explicación teórica al sujeto con respecto a la naturaleza de la patología, el tipo de
daño vocal o los detalles técnicos del método. Al construir una relación con el sujeto es
necesario, sin embargo, aclarar por qué el método se centrará al inicio en ejercicios de
respiración y por qué debe ser abdominodiafragmática.
En la producción de la voz, la laringe y las cuerdas vocales son como el motor del
automóvil, mientras que el aire espirado es como la gasolina que impulsa el motor. Así,
se resalta la relación entre un mejor control sobre el pedal del acelerador y mejores
maniobras en el motor. La técnica del método de acento resuelve en sí misma los
ejercicios respiratorios, fonatorios y de transferencia articulatoria a discurso
conectado.
Ejercicios respiratorios

Se instruye al sujeto a utilizar la inspiración oronasal con el fin de facilitar el dominio


de la respiración abdominodiafragmática. Luego, se le entrena en la posición sentada,
aunque se puede comenzar en la posición reclinada en algunos sujetos tensos y rígidos.
Se le pide al sujeto acentuar la fase espiratoria, que comenzará con un segmento inicial
corto y débil, seguido por un segmento acentuado más largo y fuerte, mientras produce
las fricativas sordas /f/, /s/ y /ch/. La producción de estas fricativas durante la
espiración prepara al sujeto para sentir la resistencia del aire que ha de ser
experimentada más tarde en la producción de la voz y el habla, allanando así el camino
para los ejercicios de fonación.
El método de acento se basa en la respiración abdominal y, a través de ejercicios
progresivos, se establece una función de la respiración natural. Cuando se ha aprendido
el patrón correcto de respiración, la fonación se relaciona con la respiración a través
de ejercicios de voz. Estos ejercicios se entrenan por primera vez en un tono bajo de
voz entrecortada suave, con una fricativa o una vocal cerrada. De ese modo, el flujo de
aire eficiente pasa suavemente entre los pliegues vocales juntos. Los ejercicios se
traducirán en una mejora de la elasticidad y la flexibilidad en el tejido de las cuerdas
vocales y los músculos subyacentes.

Ejercicios fonatorios

La transición de los ejercicios de respiración a la fonación se logra al sustituir las


fricativas sordas por sonoras. Una vez que las vibraciones fonatorias son percibidas
por el sujeto, se introducen las diversas vocales de la lengua materna. Los ejercicios
fonatorios proceden de una serie de producciones vocales rítmicas acentuadas. Esta
vocal se ejecuta siguiendo primero un ritmo relativamente lento (pulso 3/4 a largo).
Esto, con el objetivo de obtener una producción larga relajada al final de la frase,
eliminar el ataque glotal duro, suprimir la fricción al final y asegurar un apoyo
espiratorio óptimo durante toda la tarea fonatoria. Acto seguido, la ejecución de la
vocal sigue un ritmo más rápido (pulso 4/4 de andante a allegro con el doble de
velocidad). Esta fase posibilita al sujeto transferir la técnica vocal recién adquirida a
una producción de serie de fonaciones cortas más rápidas y largas, que mantenga la
misma calidad vocal sonora relajada desarrollada en el tempo rítmico anterior. Las
series de fonaciones cortas preparan la producción vocal a las necesidades de habla
conectada.
En las fases iniciales del ejercicio fonatorio, las vocales se producen con suave
escape de aire para eliminar la hiperfunción y el ataque glotal duro. Los ejercicios
fonatorios básicos proceden con una alternancia entre estos dos sets de patrones
rítmicos (tempos) hasta que la técnica vocal recién adquirida involucre el soporte
respiratorio completo y produzca una fonación relajada en el tono óptimo de reciente
aparición ya estabilizado. Durante el ejercicio fonatorio, el terapeuta centrará la
atención en la postura general del cuerpo a fin de asegurar una alineación óptima y
cómoda de la cabeza, cuello y hombros, que permita mover libremente la pared
abdominal y controlar el muy importante soporte espiratorio. A su vez, se ordena al
sujeto ampliar su faringe tanto como le sea posible para fonar. Los articuladores son
activados a través de los ejercicios fonatorios, incluso antes de introducir el habla
conectada. Además, los ejercicios de fonación siguen variaciones de sonoridad
planeadas con el objetivo de aumentar el rango dinámico de la voz.
Los ejercicios de voz se dividen en tres tiempos: largo, andante y allegro. Cada
tempo prepara la voz para diferentes aspectos del habla normal, aumentando
gradualmente la velocidad y dificultad. Los ejercicios se llevan a cabo por primera vez
en fricativas y vocales cerradas en cada tempo, luego se implementan con todas las
vocales y, al final, se introducen consonantes. Todos los ejercicios en el método de
acento se efectúan rítmicamente con un pulso constante —a veces acompañado por un
tambor— a estos tres tempos y se extienden al habla y la lectura de textos. Los
ejercicios con textos todavía se llevan a cabo de una manera controlada y en cada
tempo. Los principios fundamentales se mantienen y se practican antes de cada
ejercicio. En el tempo largo, el sujeto aprende frases con sílaba acentuada. En andante
se practican las frases con dos sílabas acentuadas y en allegro el sujeto aprende a
destacar dos sílabas acentuadas consecutivas. En diversas etapas de los ejercicios
fonatorios, se introducen los movimientos rítmicos dinámicos del cuerpo y los brazos,
según cada patrón rítmico. Para el tempo largo, el cuerpo se balancea de adelante hacia
atrás sobre una base relativamente amplia con un pie delante del otro. El balanceo
hacia atrás es más energético, pues sigue al elemento del tempo acentuado. Los
movimientos de los brazos para este tempo se hacen con un dominio libre de las
extremidades superiores en la articulación del hombro, como en el esquí de fondo o
esquí a campo traviesa. Los movimientos del brazo están coordinados con el balanceo
del cuerpo en un movimiento rítmico suave. Para el tempo andante, el cuerpo se mueve
rítmicamente de lado a lado alrededor del eje vertical del cuerpo. Los brazos siguen el
movimiento del cuerpo por los movimientos de los antebrazos hacia los codos. En el
tempo allegro, el movimiento del cuerpo es más rápido y se da en forma de rebote y
movimientos de lado a lado que siguen al tempo. Las manos disfrutan de rangos de
movimientos pequeños y rápidos en las muñecas, los cuales acompañan todo el patrón
rítmico. El acople de la respiración abdominodiafragmática rítmica profunda con el
movimiento rítmico dinámico del cuerpo y los brazos asegurará la relajación suficiente
para facilitar el camino a los ejercicios de fonación, a fin de que emerja el tono óptimo.
Durante todos estos ejercicios el sujeto trata de copiar al terapeuta de manera
alternativa como en un juego de ping‒pong. Así, el terapeuta actúa como un modelo de
optimización e idealización del comportamiento vocal objetivo y se centra en corregir
un comportamiento a la vez, con el apoyo constante de la producción correcta y
evitando criticar los defectos. El programa se adapta en pasos de dificultad creciente
siguiendo el ritmo del sujeto.
El método de acento se puede utilizar de manera fácil en grupos, ya que los ejercicios
se pueden realizar en forma de llamada y respuesta, donde los patrones rítmicos de los
tres tempos mantienen unido al grupo.

Ejercicios articulatorios de transferencia al discurso conectado

El objetivo final del programa de terapia vocal es la transferencia de una técnica vocal
saludable recién adquirida al habla conectada. A través de un conjunto de medidas
jerárquicas, la nueva técnica vocal se transfiere al habla conectada durante el diálogo
al pasar por las etapas de ejecución vocal rítmica acentuada de vocales o sílabas
consonánticas sin sentido, con la prosodia natural de la lengua materna del sujeto, hacia
la repetición de una serie de expresiones comunes cortas por parte del terapeuta. Esto
es seguido por una lectura, un monólogo y, finalmente, un diálogo. El programa de
entrenamiento continúa hasta que la nueva técnica vocal con habla conectada se
convierte en un comportamiento automático. Es importante anotar que a diario las
personas tienen bastantes problemas para encontrar qué decir y, en consecuencia,
dedican poca energía para pensar en cómo decirlo. Sin embargo, el terapeuta debe ver
que el sujeto está observando y aplicando durante el diálogo las siguientes
características fonatorias articulatorias:
Uso del apoyo respiratorio con espiración abdominodiafragmática.
Mejor coordinación de buenas inspiraciones espaciadas.
Mejor producción de las frases con pausas adecuadas.
Velocidad del habla óptima.
Entonaciones rítmicas acentuadas del discurso articulado.
No habla sobre el aire residual.
Ataque suave, con uso del tono óptimo natural emergente y evitando la reverberación
al final.
Por lo general, el programa terapéutico se realiza en 25 sesiones individuales (o
menos) de 20 minutos cada una, 2 o 3 veces por semana. En ocasiones, la terapia se
puede brindar de manera apropiada a grupos seleccionados. En pocos casos, el
programa se da en 2 sesiones intensivas al día. Algunas condiciones como el granuloma
de contacto y el grupo de disartrofonías pueden requerir un programa con mucho más
tiempo. No obstante, cualquiera que sea la longitud del programa terapéutico, debe
evitarse la dependencia del sujeto al terapeuta. El sujeto tiene que ser apartado
gradualmente. Los siguientes criterios deben alcanzarse, en la medida de lo posible,
antes de terminar la terapia: satisfacción de los sujetos en situaciones de la vida real,
mejoramiento en la evaluación perceptual auditiva de la voz juzgada por expertos,
mejor aspecto de la glotis como se ha documentado por los diversos métodos de
laringoscopia clínica, y mejores mediciones de los instrumentos diagnósticos.
En adición, se deben considerar algunas pautas durante el programa terapéutico. Es
necesario crear un ambiente de cordialidad y tranquilidad en la sala de terapia, con
mínimas fuentes de distracción. La habitación suele ser tratada acústicamente al menos
de modo parcial para reducir el ruido ambiental y mejorar las condiciones de escucha.
Esto ayuda al sujeto a seguir la ejecución vocal del clínico y optimizar su
automonitoreo vocal (retroalimentación auditiva). Por lo general, se utilizan golpes de
tambor para intensificar los diferentes tempos y facilitar la capacidad del sujeto para
escuchar y seguir los ritmos en diferentes etapas del programa terapéutico.
También se pueden utilizar otros tipos más simples de temporización y mantenimiento
del ritmo, como tocar sobre la mesa, aplaudir o zapatear. El golpe del tambor puede
tener un efecto relajante durante el procedimiento. La grabación y reproducción de la
voz con dispositivos de audio o video ayuda a demostrar a los sujetos ciertos
comportamientos positivos que necesitan ser reforzados. Las grabaciones también
capturan el mejoramiento de la interpretación vocal. De esa forma, se tranquiliza y
anima al sujeto sobre sus progresos. La tabla 2.7 presenta algunas consideraciones
prácticas adicionales.

Tabla 2.7. Otras consideraciones prácticas del método de acento.


Aspectos respiratorios Aspectos fonatorios
El soporte respiratorio se ilustra al sujeto con la
La producción de la vocal abierta /a/ resiste la corrección por un período
analogía de la crema dental en tubo que sale a
más largo que las vocales cerradas /i/ y /e/.
presión.
El sujeto a veces necesita aclaración adicional para comprender que el
El apoyo de la espiración debe ser enérgica, pero no
ritmo con que se produce la segunda frase es el doble de largo que el de
brusca como ocurre en el levantamiento de pesas.
la primera frase.
Reducción del movimiento asociado a cuello, hombro Durante la fase inicial de la vocal con escape de aire en el ejercicio con
y espalda, manteniendo solo el patrón de abdomen ritmo largo, el sujeto puede malinterpretar la expresión final como si fuera
sin involucrar el pecho. más suave por ser más larga.
Los esfuerzos respiratorios no deben sonar, pero Pueden presentarse dificultades cuando el sujeto oye los tres golpes del
pueden mostrarse levemente. ritmo largo pero se le pide que solo produzca dos notas.
Fuente: adaptada de Kotby y Fex (1998).

Como se ha indicado, el modo de acción y la justificación terapéutica del método de


acento se sustentan en la mejora del apoyo aéreo espiratorio y el momento del inicio de
la fonación. La respiración rítmica abdominodiafragmática acentuada, el movimiento
dinámico del cuerpo y brazos y la activación de los articuladores reducen la
hiperactividad y la tensión excesiva del aparato vocal. El aumento del flujo de aire
puede mejorar la aerodinámica de la glotis, lo que conduce a la restauración de la
simetría, el aumento de la amplitud de la onda glotal, la reducción de los espacios
fonatorios o hiperaducción, la obtención del tono óptimo, la libertad de llegar a los
extremos de la escala tonal, el aumento del rango dinámico, y una mejor proyección del
habla.

Evidencia

Varios estudios (Kotby, El‒Sady, Bassiouny, Abou Rass y Hegazi, 1991; Kotby,
Shiromoto y Hirano, 1993; Kotby, 1995; Kotby y Fex, 1998; Fex, Fex, Shiromoto y
Hirano, 1994; Pankas et al., 2011) muestran la eficacia del método de acento en el
manejo de todos los desórdenes de voz no orgánicos, en casos seleccionados como
nódulos vocales y granuloma de contacto y en casos seleccionados de desórdenes de
voz orgánicos como la disfonía paralítica y la displasia (Kotby et al., 1991). Fex et al.
(1994) reportaron cambios acústicos después del tratamiento al emplear el método del
acento en diez sujetos con diagnósticos mixtos. El tono y los cocientes de perturbación
de la amplitud, el ruido de la energía normalizada de 1 kHz a 4 kHz y la frecuencia
fundamental evidenciaron una mejoría significativa después de diez sesiones de terapia.
La mejora de la cualidad/calidad vocal se basó en la evaluación perceptual por parte
del clínico y el usuario. No se proporcionaron datos de seguimiento para evaluar la
durabilidad de los cambios observados. Pankas et al. (2011) se centraron en el éxito de
la recuperación vocal a través de una comparación del método de acento y el método de
terapia resonante. Los sujetos que utilizaron el método de acento tuvieron una
rehabilitación más exitosa que quienes usaron el otro método.
En conclusión, está documentado y probado que el método de acento da resultados
significativos, a nivel clínico pero no a nivel estadístico, en la potencialización de la
voz y la restauración de muchos de los problemas funcionales y orgánicos de la voz,
entre ellos, la tartamudez.

Tratamiento de voz de Lee Silverman

El desarrollo inicial del LSVT (por su sigla en inglés) se basó en las características que
subyacen a los desórdenes de voz en personas con Parkinson idiopático. El objetivo
principal del tratamiento era aumentar el control de los músculos respiratorios y de la
laringe mediante la estimulación y entrenamiento del aumento de la sonoridad (Ramig,
Pawlas y Countryman, 1995). El entrenamiento de la intensidad (sonoridad) y la técnica
específica de LSVT reúnen conceptos clínicos de la literatura sobre la dimensión motora
del habla y la voz. El tratamiento es administrado de manera consistente con los
principios de la ciencia del ejercicio, la adquisición de habilidades, el aprendizaje
motor —de alto esfuerzo, con repeticiones múltiples, intensivo, simple— y una
focalización en la conciencia sensorial. Cabe resaltar que estos elementos nunca habían
sido combinados de forma sistemática en un programa de tratamiento de voz para
personas con Parkinson idiopático (Yorkston, 1996). Hoy en día, los programas LSVT
para sistemas motores del habla (LSVT LOUD) y de las extremidades (LSVT BIG) de
® ®

individuos con enfermedad de Parkinson son protocolos de tratamiento basados en la


investigación con probada eficacia para esta enfermedad.
El entrenamiento LSVT LOUD tiene como objetivo: a) potencializar la fuente vocal al
®

mejorar el «portador», según el concepto clásico de ingeniería de transmisión de la


señal, b) utilizar la sonoridad vocal como un detonante de distribución de los efectos
—mejor articulación, cualidad/calidad vocal, entonación y rango reducido— en todo el
sistema de producción del habla, c) recalibrar la percepción sensoriomotora para una
lograr mejor sonoridad vocal y d) capacitar el automonitoreo individual y facilitar la
generalización de los efectos del tratamiento en la comunicación funcional (Fox,
Ebersbach, Ramig y Sapir, 2012). Los autores sugieren que el LSVT puede afectar la
producción del habla en dos niveles. En primer lugar, puede aumentar la sonoridad,
mejorar el cierre de la cuerda vocal y potencializar la fuente fonatoria. En segundo
lugar, puede estimular un mayor esfuerzo y coordinación a través de los sistemas
respiratorio, laríngeo y orofacial. Es importante tener en cuenta que el resultado final
de la salida de habla (voz más sonora) está dentro de los límites normales; la señal de
«sonoro» o «hablar duro» se utiliza solo para aumentar la salida motora a través de los
sistemas motores con una amplitud más normal. En consecuencia, el entrenamiento de la
intensidad vocal puede aumentar la amplitud y la coordinación de la salida motora —
más allá del sistema fonatorio— y del sistema orofacial.
Los autores señalan que los patrones motores centrales para el habla pueden
desencadenarse si se enfocan en el tratamiento de la intensidad vocal bien establecida.
Es posible que las mejoras en la fuente fonatoria de individuos con Parkinson
idiopático post‒LSVT estén relacionadas con el aumento del impulso nervioso, el cual
puede anular los movimientos hipocinéticos y bradicinéticos de la musculatura
respiratoria, laríngea y orofacial. Por otro lado, los cambios producidos por el aumento
del esfuerzo vocal y la sonoridad pueden implicar un mecanismo central común, como
el sistema frontolímbico y su relación con los ganglios basales, la sustancia gris del
periacueducto y la formación reticular. El LSVT no pretende alterar el procesamiento
sensorial ni el funcionamiento neuropsicológico para cambiar la función motora; más
bien, busca solucionar estos problemas para lograr resultados positivos.
El modo de entrenamiento de los programas LSVT es coherente con algunos principios
que promueven la neuroplasticidad dependiente de la actividad. Tiene como conceptos
esenciales: a) el enfoque centrado en la voz, específicamente en la intensidad/sonoridad
vocal, b) la estimulación de producciones de alto esfuerzo con múltiples repeticiones,
c) la administración intensiva del tratamiento, 4 sesiones individuales a la semana
durante 4 semanas, es decir, 16 sesiones en un mes, d) el incremento de la conciencia
sensorial sobre el aumento de la sonoridad vocal y el esfuerzo (calibración) y e) la
cuantificación de los comportamientos. El objetivo terapéutico central es incrementar la
sonoridad vocal al aumentar la amplitud del movimiento. Este objetivo actúa como un
detonante para aumentar el esfuerzo y la coordinación de todo el sistema de producción
de habla. Mediante el entrenamiento de la conciencia sensorial con ejercicios motores,
e l LSVT facilita la aceptación y comodidad con el aumento de la sonoridad y la
capacidad de automonitorear la sonoridad vocal.
En el LSVT, el entrenamiento de la conciencia sensorial se ha incorporado en el
tratamiento mediante el concepto básico de calibración, definida como «el
conocimiento y aceptación de la cantidad de esfuerzo necesario para aumentar
constantemente la sonoridad vocal a un nivel que esté dentro de los límites normales»
(Fox, Morrison, Ramig y Sapir, 2002, p. 116). La calibración siempre ha sido un
componente fundamental de la generalización de los efectos del tratamiento, pero se ha
hecho un mayor énfasis en esta al reconocer que, aunque las personas con Parkinson
idiopático pueden usar con facilidad la sonoridad incrementada —sonoridad que está
entre límites normales— en la sala de tratamiento, pueden encontrar dificultades para
usar el volumen incrementado en actividades de la vida diaria. Esto, porque sienten que
la sonoridad es muy fuerte o requiere esfuerzo excesivo. La incongruencia sensorial
entre el esfuerzo vocal percibido y la salida vocal puede representar una barrera
significativa para la generalización y el mantenimiento de los efectos del tratamiento a
largo plazo. El LSVT facilita la superación de esta barrera al ayudar a las personas con
Parkinson idiopático a reconocer que la voz pretratamiento es muy suave y al
convencerlos de que la nueva voz con intensidad más alta está dentro de los límites
normales.
Asimismo, el LSVT proporciona entrenamiento motor continuo, directo e intenso en la
conciencia sensorial a través de interpelaciones como: «¿Siente usted el esfuerzo?,
¿oye lo sonoro que es? Esa es la cantidad de esfuerzo y sonoridad que usted necesita
utilizar cuando habla si quiere que la gente lo escuche y entienda». Esto permite al
sujeto aprender la cantidad adecuada de esfuerzo vocal necesario para generar una voz
más fuerte (programación interna). Por ende, los programas LSVT están diseñados para
enseñar a las personas a recalibrar sus sistemas perceptuales y motores.
Como la adquisición de la habilidad motora (voz más sonora) no es suficiente por sí
sola para sostener la neuroplasticidad —reorganización del mapa sensoriomotor,
sinaptogénesis— o para transferirla y mantenerla a largo plazo, se enfatiza en la
transferencia directa de los ejercicios motores estructurados (los ejercicios diarios)
hacia actividades diarias funcionales para propiciar la generalización por fuera de la
sala de tratamiento. Es primordial establecer hábitos de práctica casera estructurada
con ejercicios de voz que continúen más allá del mes de tratamiento. En este caso, el
simple uso de la voz más sonora cada día proporciona una práctica adicional. El
incremento de la práctica mediante las actividades del tratamiento, los ejercicios
sobreejecutados y el trabajo en casa ayudan a estos individuos a sentirse cómodos con
el uso incrementado de la sonoridad, puesto que la producción de habla es un
comportamiento motor aprendido que se automatiza. Por lo tanto, el entrenamiento
intensivo de la sonoridad puede proporcionar el estímulo necesario para activar y
modular de manera apropiada los programas motores del habla que siguen intactos.
De acuerdo con esto, el incremento del volumen no implica la desautomatización de
la producción de habla al requerir que los individuos se centren de modo específico en
parámetros vocales como la velocidad, las pausas o la precisión articulatoria. El
entrenamiento de la fonación fuerte puede modificar el comportamiento vocal al apuntar
a un sistema neural filogenéticamente antiguo, emotivo, que implica el sistema límbico,
los ganglios basales, el tálamo, la sustancia gris del periacueducto y los circuitos que
interconectan estos subsistemas.
Como ya se ha mencionado, el diseño de LSVT ha sido desarrollado a partir de una
perspectiva motora que incluye componentes del tratamiento simple, redundante e
intensivo. Estos componentes pueden ser favorables en el tratamiento de individuos que
manifiestan dificultades neuropsicológicas como: bradifrenia o velocidad ralentizada
del procesamiento cognitivo, problemas de movimiento constante en escenarios
cognitivos, problemas de procesamiento interno, capacidad deficiente para acceder a
información almacenada recientemente, capacidad deficiente para cambiar los
esquemas cognitivos (flexibilidad mental), problemas de memoria procedimental a
corto plazo y dificultades con el aprendizaje de nueva información. Todas estas
condiciones pueden interferir en las etapas iniciales de procesamiento de la
información y, potencialmente, en el éxito del tratamiento. No obstante, el LSV Tparece
ser muy adecuado para las personas con estas dificultades cognitivas, ya que los
objetivos y los procedimientos del tratamiento son simples.
En efecto, el concepto de hablar más fuerte es fácil de comprender y concretar, reduce
al mínimo el cambio de esquemas cognitivos durante el tratamiento, no requiere de
largas explicaciones difíciles de seguir, pues los sujetos dependen en gran medida del
modelado («haz lo que yo hago») y es probable que las instrucciones no excedan la
capacidad de la memoria procedimental, incluso de individuos con Parkinson
idiopático y demencia leve. Además, las instrucciones son redundantes; la considerable
repetición de tareas para aumentar la intensidad de la voz durante las sesiones de
tratamiento proporciona la suficiente reiteración a fin de que la información perdida
por las personas durante la primera presentación pueda ser captada cuando se presenta
de nuevo. En ese sentido, la repetición del objetivo de aumentar la sonoridad promueve
el sobreaprendizaje y el material sobreaprendido es más fácil de recordar que la
información reciente. El LSVT es un programa intensivo que ayuda a solucionar las
deficiencias de velocidad de procesamiento, memoria y función ejecutiva en un período
finito de tratamiento (16 sesiones en un mes) e incorpora tareas de ejercicios caseros y
tareas de transferencia para la generalización de los beneficios terapéuticos en
situaciones cotidianas.
La concentración del tratamiento favorece factores como el cumplimiento y la
motivación. Uno de los objetivos del LSVT es demostrar de inmediato un impacto
funcional positivo de mayor sonoridad en la vida cotidiana de los individuos. Cuando
las personas reciben refuerzo positivo por incrementar su volumen fuera de la sala de
tratamiento, se alienta el cumplimiento y, con frecuencia, aumenta la motivación. Esto
es de particular importancia para los individuos que no están motivados a mejorar el
habla desde el inicio —por ejemplo, quienes son traídos a tratamiento por un cónyuge
frustrado— o que pueden estar experimentando algún grado de depresión.

Procedimiento

Cada sujeto recibe un total de 16 sesiones de 60 minutos durante un período de 4


semanas bajo el cuidado de un clínico certificado en LSVT (Ramig, Pawlas y
Countryman, 1995). En los primeros 30 minutos de cada sesión se realizan ejercicios
de entrenamiento —mínimo 15 repeticiones de cada uno— diseñados para maximizar el
tiempo de fonación y el rango tonal de un conjunto de frases cortas (habla funcional),
usando una voz fuerte con intensidad vocal. Los siguientes 30 minutos se dedican al uso
de esfuerzos respiratorios y fonatorios altos (con sonoridad vocal) en varias tareas de
habla como lecturas orales, preguntas improvisadas, generación de palabra y
conversación. Los sujetos practican el uso de su voz durante tareas de habla funcional
dispuestas de forma jerárquica desde la primera semana del tratamiento hasta la cuarta.
La primera semana se centra en las palabras y frases, la segunda en las oraciones, la
tercera en los párrafos largos leídos y hablados, y la cuarta en conversación. Además
de las sesiones de tratamiento in situ, también se requiere que cada sujeto complete los
ejercicios en casa para integrar y reforzar los conocimientos adquiridos. Cuando el
tratamiento concluye, se espera que los sujetos mantengan una práctica diaria de los
ejercicios en casa con fines de retención.
Sin embargo, algunos individuos con enfermedad de Parkinson en etapa avanzada o
síndromes de Parkinson‒Plus pueden requerir una semana adicional (quinta) de
tratamiento (Countryman, Ramig y Pawlas, 1994). En este caso, el objetivo final puede
cambiar. De usar de manera espontánea una mayor sonoridad en el habla coloquial
puede pasar a utilizar una mayor sonoridad en diez frases u oraciones funcionales
entrenadas. El protocolo LSVT®LOUD se resume en la tabla 2.8.

Tabla 2.8. Protocolo LSVT ®LOUD.


Meta
Incremento de la amplitud de movimiento dirigido mayormente a los sistemas respiratorio o laríngeo.
Sonoridad
Dosis: 4 días consecutivos a la semana durante 4 semanas (16 sesiones por mes).
Intensidad Repeticiones: mínimo 15 repeticiones por tarea.
Estandarizada Esfuerzo: presione al máximo cada día el esfuerzo percibido por el sujeto, 8 o 9 en una escala de 1 a 10, siendo 10
el mayor esfuerzo.
Primera mitad de la sesión de tratamiento (30 minutos)
Tarea 1: Movimientos sostenidos al máximo
Sostenga /a/ con voz fuerte y buena cualidad/calidad tanto como sea posible. 15 repeticiones.
Tarea 2: Movimientos dirigidos
Diga /a/ con voz fuerte y buena cualidad/calidad en tono alto. 15 repeticiones.
Ejercicios
Diga /a/ con voz fuerte y buena cualidad/calidad en tono bajo. 15 repeticiones.
diarios
Tarea 3: Frases funcionales
El sujeto identifica 10 frases u oraciones que emplee en actividades diarias (por ejemplo, «buenos días»).
Lea las frases usando la misma sonoridad y esfuerzo empleados durante la /a/ prolongada. 5 repeticiones de cada
frase.
Segunda mitad de la sesión de tratamiento (30 minutos)
Diseñada para entrenar la amplitud reescalada y el esfuerzo del movimiento a través de ejercitación diaria y frases
funcionales en un contexto específico y diversas actividades de habla. La complejidad de las tareas aumenta con
el transcurrir de las semanas (palabras–frases–oraciones–lecturas–conversación) y estas pueden ajustarse a las
Jerarquía
metas e intereses de cada sujeto; por ejemplo, deportes vs. cocinar. La dificultad de las tareas aumenta a medida
que incrementa su duración —mantener la sonoridad por períodos más largos de tiempo— y su complejidad —
procesamiento dual, ruido ambiental y distractores de la atención—.
Meta: entrenamiento de la sonoridad vocal que tiene buena cualidad/calidad y es saludable; por ejemplo, sin
tensión vocal no deseada o cierre excesivo de las cuerdas vocales.
Técnica: moldear la sonoridad y la cualidad/calidad vocal a través del uso de modelamientos o claves visuales y
Técnicas de
táctiles; por ejemplo, la orden «obsérveme y haga lo que yo hago».
moldeo
Búsqueda cognitiva mínima: los comportamientos no requieren instrucciones o explicaciones muy complejas
para que el sujeto las generalice por fuera del recinto terapéutico. En su lugar, el sujeto es entrenado a través del
modelamiento.
Tratamiento: el sujeto debe centrar su atención en los sonidos y en cómo se siente al hablar «duro».
Consideraciones de las actividades: desde el primer día deben implementarse las tareas diarias (los días de
tratamiento y sin tratamiento) con buena cualidad/calidad vocal sonora en situaciones de la vida real. La
dificultad de las tareas debe corresponder con el nivel de complejidad que la persona está trabajando. El sujeto
Recalibración
debe hacerse responsable y el terapeuta debe indagar por comentarios que las personas les han dicho del tipo
sensorial
«yo puedo oírte mejor».
Práctica en casa: debe empezar desde el primer día con tareas diarias para practicar en casa (ejercicios diarios y
ejercicios de jerarquía), que ocurren los días de tratamiento una vez de 5 a 10 minutos y los días sin tratamiento,
dos veces de 10 a 15 minutos. Proveer un diario de trabajo en casa para que el sujeto registre sus experiencias.
Fuente: adaptada de Fox et al. (2012).

Realizar el tratamiento en sesiones presenciales diarias durante 4 semanas es inviable


para sujetos con barreras geográficas y de movilidad y para clínicos con cargas
pesadas de trabajo. Por fortuna, las nuevas formas de prestar estos servicios ofrecen
soluciones potenciales para satisfacer las necesidades de los sujetos y los clínicos, a
fin de que un mayor número de individuos pueda beneficiarse del tratamiento. Algunas
opciones son: el LSVT administrado bajo un cronograma de tratamiento alternativo, es
decir, 16 sesiones durante 2 meses en lugar de 1 mes; el LSV Tpor videoconferencia o
telepráctica (e–LOUD), y el LSVT®Companion (LSVT–C), un sistema de tratamiento
asistido desarrollado hace poco que permite al participante recibir la mitad de las
sesiones en casa.
La versión de tratamiento prolongado (LSVT–X) es similar al LSVTconvencional,
excepto que se administra 2 veces a la semana en sesiones de 1 hora durante 8 semanas
consecutivas y requiere mucha más práctica en casa. El tratamiento sigue las tareas y
jerarquía del LSVT tradicional, pero dedica 2 semanas a cada tipo de tarea y requiere
una mayor cantidad de práctica en casa (96 tareas en LSVT–X frente a 40 tareas en LSVT),
por lo que el clínico comienza cada sesión con un chequeo de todas las tareas asignadas
y las actividades de transferencia. La opción de entrega por telepráctica requiere 16
horas de tiempo (de terapia, no de viaje), sin costes adicionales por combustible o
kilometraje u otros gastos. La atención en línea mediante videoconferencia brinda el
tratamiento al participante en su casa a través de un sistema de telerehabilitación por
computador.
E l LSVT®Companion (LSVT–C) es un asistente personal digital (PDA, por su sigla en
inglés) diseñado para afrontar los retos de la accesibilidad y frecuencia del tratamiento,
especialmente programado para recopilar datos sobre las variables entrenadas en el
protocolo de tratamiento LSVT LOUD, como el nivel de presión vocal sonora, la
®

frecuencia fundamental y la duración de la fonación. Este asistente personal dirige al


participante a través de los ejercicios de una sesión completa de LSVT®LOUD y
proporciona retroalimentación auditiva y visual interactiva, lo que permite la
participación en las sesiones terapeúticas desde el hogar. Los datos son recogidos por
el LSVT–C cuando el sujeto practica en la clínica y cuando practica por cuenta propia.
Estos se descargan por el clínico en cada reunión con el propósito de evaluar el
progreso y programar los nuevos objetivos en el LSVT–C, según corresponda. Los datos
de la sesión en casa, las tareas y las ejecuciones se deben examinar en cada sesión
presencial. De este modo, si un participante no completa de manera correcta las
actividades o las completa en el día equivocado, se revisa y se dan instrucciones
adicionales, según sea necesario. La única variación de este programa es que los
participantes están presentes durante 30 minutos adicionales para que el terapeuta
descargue y análice los datos del LSVT–C y, si es nhecesario, brinde entrenamiento o
explicación adicionales sobre el uso del dispositivo.

Evidencia

Diferentes ensayos controlados aleatorizados han probado la eficacia nivel I del


tratamiento LSVT. En 20 años, cerca de 70 artículos de eficacia clínica con diferentes
niveles de evidencia han ilustrado los resultados del LSVT en el tratamiento de
individuos con enfermedad de Parkinson idiopático (Ramig, Bonitati, Lemke y Horii,
1994; Ramig et al., 1995; Smith, Ramig, Dromey, Pérez y Samandari, 1995; Dromeyet
al., 1995; Ramig, Countryman, O’Brien, Hoehn y Thompson, 1996; Ramig y Dromey,
1996; Countryman, Hicks, Ramig y Smith, 1997; Liottiet al., 1999; Theodoros,
Thompson–Ward, Murdoch, Lethlean y Silburn, 1999; Dromey, 2000; Ward,
Theodoros, Murdoch y Silburn, 2000; Ramiget al., 2001; Ramig et al., 2001;
Baumgartner, Sapir y Ramig, 2001; Spielman, Ramig y Borod, 2001; El Sharkawi et al.,
2002; Spielman, Borod y Ramig, 2003; Liotti et al., 2003; Huber, Stathopoulos, Ramig
y Lancaster, 2003; Halpern et al., 2005; Theodoros et al., 2006; Spielman, Ramig,
Mahler, Halpern y Gavin, 2007; Sapir, Spielman, Ramig, Story y Fox, 2007; Cannitoet
al., 2008; Tindall, Huebner, Stemple y Kleinert, 2008; Howell, Tripoliti y Pring, 2009;
Constantinescu et al., 2010; Narayana et al., 2010; Spielman et al., 2011; Tripoliti et
al., 2011; Constantinescu et al., 2011; Theodoros y Ramig, 2011; Halpern et al., 2012;
Cannito et al., 2012), los resultados del tratamiento en individuos con otros trastornos
neurológicos distintos al Parkinson (Solomon, McKee y García‒Barry, 2001; Sapiret
al., 2001; Sapir et al., 2003; Solomon, Makashay, Kessler y Sullivan, 2004; Wenke,
Theodoros y Cornwell, 2008; Mahler, Ramig y Fox, 2009; Fox y Boliek, 2012; Mahler
y Ramig, 2012; Mahler y Jones, 2012) y los resultados en individuos con presbifonía
(Ramig et al., 2001; Lu, Presley y Lammers, 2013).
En suma, estos resultados apoyan la hipótesis de que un solo objetivo de tratamiento
puede activar el incremento de la amplitud del movimiento en todos los sistemas y así
mejorar la eficiencia y simplicidad del mismo (Fox et al., 2002). La evidencia
anecdótica indica un impacto directo en la comunicación funcional en la casa y el lugar
de trabajo, así como un aumento de los niveles de confianza y mejor calidad de vida
entre los receptores del tratamiento.
Los individuos con Parkinson idiopático que recibieron LSVT incrementaron el nivel
de presión vocal sonora (SPL, por su sigla en inglés) de 8 dB a 13 dB (dB a 30 cm) a
través de una variedad de tareas de habla en comparación con cambios de 1 dB a 2 dB
SPL para un grupo alternativo de tratamiento (Ramig et al., 1996). Además, se ha
reportado el aumento de la presión subglótica (2 cm‒3 cm H2O) y la mejora del rango
de declinación máxima de la corriente de aire (200 l/s/s‒300 l/s/s) (Ramig y Dromey,
1996). Los estudios de seguimiento documentaron que el aumento de la presión vocal
sonora se mantuvo por encima de los niveles pretratamiento para el grupo LSVT (Ramig
y Dromey, 1996) al año y dos años después del tratamiento (Ramig et al., 1996; Ramig
et al., 2001; Baumgartner et al., 2001).
Los cambios que acompañaron el incremento de la presión vocal sonora en
individuos con Parkinson idiopático fueron aumento en la duración de la fonación de
una vocal sostenida en el rango máximo de la frecuencia fundamental, variabilidad de
la frecuencia fundamental durante el habla, reducciones en el ritmo del habla, aumento
del tiempo de las pausas y disminución de la duración de la frase (Ramig et al., 1995).
Todos estos cambios conducen a una mejora de la prosodia. Estos resultados están
apoyados por calificaciones perceptuales de oyentes que identifican una mayor
sonoridad y una mejor cualidad/calidad vocal durante el tratamiento (Baumgartner et
al., 2001; Ramig y Dromey, 1996; Ramig et al., 1995; Ramig et al., 1996).
Es importante reconocer que el entrenamiento aumenta el volumen de las personas con
Parkinson idiopático, lo que resulta en un nivel de sonoridad dentro de los límites
normales con una cualidad/calidad vocal saludable, es decir, no apretada o gritada. Así
mismo, no hay evidencia de un aumento de la hiperfunción (hiperaducción ventricular o
torción anteroposterior) después del tratamiento. Por el contrario, el cambio en la
hiperfunción de leve a moderada observado durante el pretratamiento de algunos
individuos con Parkinson idiopático —bajo la hipótesis de ser una compensación por la
hipoaducción de los pliegues vocales verdaderos— fue resuelto post–LSVT
(Countryman et al., 1997).
También se han documentado diversos cambios fisiológicos como el aumento de la
amplitud de movimiento de la caja torácica (expansiones más grandes) durante la
respiración para el habla (Huber et al., 2003), la disminución del cociente de apertura,
el incremento de la presión subglótica, y el incremento post–LSVT de la tasa de
declinación máxima del flujo (Ramig y Dromey, 1996). Cambios de este tipo podrían
dar lugar a una disminución de la inclinación espectral y una mayor amplitud de las
frecuencias armónicas por encima del nivel del primer armónico (F0). Los exámenes
videoestroboscópicos pre y postratamiento de las características de la fuente fonatoria
han documentado mejoras en la aducción de las cuerdas vocales verdaderas, con mejor
cierre y movimientos más simétricos de las cuerdas vocales (Smith et al., 1995). Así
mismo, se han documentado incrementos positivos en la actividad muscular del
tiroaritenoideo post‒LSVT con la EMG laríngea o electroglotografía en comparación con
individuos envejecidos saludables (Ramig et al., 2000). Tomados en conjunto, estos
hallazgos apoyan el impacto del entrenamiento intensivo en la sonoridad de la fuente
fonatoria para los individuos con Parkinson idiopático y son consistentes con la
hipótesis de que el aumento del control de los sistemas respiratorios y laríngeos
incrementa la amplitud de la salida vocal, mejorando de ese modo la intensidad y la
cualidad/calidad vocal.
Asimismo, el tratamiento genera otros efectos importantes en todo el tracto vocal, los
cuales abarcan cambios positivos en la articulación, la deglución y la expresión facial.
Esta mejora puede reflejar una mayor amplitud de movimientos de la lengua, los labios
y la mandíbula, posiblemente debido al acoplamiento biomecánico y neural de los
subsistemas del habla y la activación incrementada de todo el sistema neuromuscular
del habla. Los cambios en las medidas articulatorias post‒LSVT son funcionalmente
relevantes cuando hay articulación imprecisa y reducción de la amplitud y velocidad de
los movimientos articulatorios. Las mejoras en la articulación después de LSVT se
reflejan en las medidas de duración del formante de transición, velocidad y extensión
del movimiento (Dromey et al., 1995) y aumentos en el espacio vocal (disminución de
la centralización) durante el habla (Sapir et al., 2007; Sapir, Ramig, Spielman y Fox,
2010). El incremento en el espacio vocal refleja cambios diferenciales en el formante 1
y el formante 2, los cuales crecen o caen en función de la vocal, a pesar de un aumento
general en la presión sonora. Esto sugiere que los cambios en la frecuencia de los
formantes pueden representar mejorías en el rango articulatorio y la coordinación más
que un simple aumento de la presión sonora.
En adición, el aumento neuronal para controlar los músculos orofaciales se ha
asociado con un crecimiento del esfuerzo vocal (McHenry, 1997; Wohlert y Hammen,
2000) y puede haber contribuido también a las mejorías en la función articulatoria. Los
datos derivados del índice espacio‒temporal (STI) —una medida de la variabilidad
espacial y temporal— proporcionan evidencia adicional de los cambios en el sistema
orofacial relacionados con la intensidad vocal (Kleinow, Smith y Ramig, 2001;
Dromey, 2000). Estos resultados revelaron que la manipulación de la intensidad
produce índices espaciotemporales más cercanos a los patrones de habla habituales y el
incremento de la intensidad deriva en mayor estabilidad de la salida motora (valores
más bajos de STI) 6. Es posible que la actividad de la boca y la mandíbula con los
ejercicios de fonación LSVT pueda aumentar la estimulación de la totalidad del
complejo orofacial, de tal manera que una mayor activación en un área (en este caso, la
laringe) puede hacer crecer la activación general a través de los sistemas relacionados.
Otros hallazgos apoyan el uso de LSVT como un método para aumentar la
inteligibilidad de hablantes con Parkinson idiopático. Los resultados evidenciaron
mejorías estadísticamente significativas después de LSVT en el porcentaje de palabras
contenidas en frases, que son percibidas por oyentes con audición normal (Cannito et
al., 2008; Cannito et al., 2012). Posibles explicaciones de este resultado tienen que ver
con el aumento en la variabilidad de la frecuencia fundamental (F0) y una consecuente
mejora de la prosodia, la cual a su vez puede haber contribuido a incrementar la
inteligibilidad de la frase. O tal vez la explicación está en los posibles cambios en las
características espectrales de la fuente vocal con el aumento de la energía armónica en
la región frecuencial del primer, segundo y tercer formante. Esto genera formantes con
picos más intensos y anchos de banda reducidos, modificaciones que pueden resaltar
las relaciones de los formantes como claves para percibir el habla.
Además, se ha reportado progreso positivo en la función motora de la deglución
(actividad no locutiva) en individuos con Parkinson idiopático y trastorno deglutorio
leve. Los trastornos de la deglución que se resolvieron con el tratamiento vocal fueron
los orales de lengua y de base de lengua, con un incremento estadísticamente
significativo de la fuerza de la lengua, una reducción del 51% en desórdenes de la
motilidad deglutoria con varios tipos de bolo (Ward et al., 2000) y mejorías en algunos
aspectos de la fase oral de la deglución, entre ellos, la reducción del tiempo de tránsito
oral (El Sharkawi et al., 2002).
De igual manera, los datos postratamiento vocal han documentado cambios en la
expresión facial (Spielman et al., 2001; Spielman et al., 2003). El hallazgo más
sorprendente de estos estudios fue la percepción del incremento de la movilidad facial
en el grupo LSVT después del tratamiento, acompañada por la mejoría del volumen y de
la entonación de la voz. Estas observaciones indican que los cambios faciales
mencionados pueden revelar algo más que los sentimientos de felicidad postratamiento
o los resultados del refuerzo positivo de un mes de tratamiento. Más bien, sugieren que
el entrenamiento de la fonación con voz sonora también puede estimular centros
neuronales considerados importantes en la regulación y experiencia consciente del
afecto, la emoción y la expresión vocal de la emoción.
Dos estudios de imagen del cerebro que emplearon tomografía por emisión de
positrones (PET, por su sigla en inglés) en un número pequeño de personas con
enfermedad de Parkinson han documentado cambios en la función cerebral
inmediatamente después del tratamiento LSVT (Liotti et al., 2003; Narayana et al.,
2010). Los cambios neurales asociados con las mejoras en el comportamiento
post‒LSVT revelaron una reducción del incremento de la activación anormal en las áreas
premotoras corticales detectadas antes del tratamiento —normalizó la hiperactividad
del área motora suplementaria—, un cambio a una mayor activación en los ganglios
basales y la región insular anterior, y un aumento de la actividad en la ínsula anterior
derecha y en la corteza prefrontal dorsolateral derecha, todo lo cual sugiere una mayor
movilización de circuitos corticolímbicos involucrados en la comunicación emocional
(Liotti et al., 1999; Liotti et al., 2003).
Estas observaciones indican un cambio desde un control volitivo del esfuerzo
anormal para compensar sus desórdenes de voz y habla (en corteza) hacia una
implementación más fácil y automática de acciones motoras del habla (ganglios
basales, ínsula anterior). En otras palabras, en la salida motora del habla se producen
cambios de una activación motora cortical anormal hacia una organización subcortical
más normal. El estudio más reciente (Narayana et al., 2010) examinó los mecanismos
neuronales que subyacen a los efectos del entrenamiento de aumento de la sonoridad
vocal y planteó que los resultados estarían mediados por el hemisferio derecho e
involucrarían áreas corticales premotoras y motoras del habla —relacionadas con el
aumento de la sonoridad vocal—, la corteza auditiva —vinculada con la recalibración
en la percepción de la intensidad producida por sí misma— y la corteza prefrontal
dorsolateral —en relación con la mejora de atención en la acción—. Por consiguiente,
los datos iniciales documentan potenciales cambios neuronales que acompañan al LSVT.
Estos efectos de LSVT se han evidenciado en reiteradas ocasiones en sujetos con
Parkinson idiopático leve a moderado, pero han sido menos alentadores en condiciones
atípicas relacionadas con esta enfermedad como las cirugías de resección o la
estimulación cerebral profunda (DBS, por su sigla en inglés). Aunque los efectos del
tratamiento LSVT después de talamotomía y palidotomía (Theodoros et al., 1999)
mostraron una marcada mejoría en la inteligibilidad reflejada por el incremento del
volumen vocal, estabilidad fonatoria, control respiratorio‒fonatorio y disminución en el
rango de habla, las ganancias en la inteligibilidad y el control respiratorio‒fonatorio no
se mantuvieron a los seis meses. Por otra parte, mientras que la estimulación cerebral
profunda del núcleo subtalámico (DBS‒STN) ha sido un tratamiento valioso de los
síntomas del Parkinson para muchos, los resultados en el habla han sido variables. Si
bien no existe un acuerdo uniforme sobre si la estimulación DBS‒STN exacerba los
problemas del habla, un creciente número de investigaciones está documentando
degradación de la función del habla y la inteligibilidad después de la cirugía. Las
personas que han tenido este tipo de neurocirugía (DBS) son más difíciles de tratar
durante la terapia debido a factores como la dificultad para proporcionar el máximo
esfuerzo, mayor dificultad para concentrarse en la tarea, propensión a la confusión o
efectos de la activación‒desactivación de los medicamentos (Trail et al., 2005).
Para evaluar si los individuos con DBS‒STN se benefician con el método LSVT, datos
preliminares (Tripoliti et al., 2011; Spielman et al., 2011) han reportado resultados en
personas con Parkinson después de DBS‒STN en comparación con aquellas sin esta
intervención quirúrgica. Los cambios de presión sonora, los juicios de cualidad/calidad
vocal, el volumen y las medidas significativamente más altas de VAI en estos dos grupos
fueron comparables e indican que las personas pueden aprender con éxito a hablar con
una mayor sonoridad después de la cirugía DBS‒STN. Sin embargo, este último grupo en
particular no mantuvo los efectos del tratamiento dos meses después del mismo
comparado con el grupo sin cirugía. Los puntajes altos del VHI y los reportes de
disminución de la inteligibilidad en el seguimiento evidencian la necesidad de
considerar entrenamiento adicional, incluyendo dos semanas adicionales de LSVT
tradicional y otras dos de tratamiento para mantener la sonoridad vocal mientras se
abordan los problemas específicos de articulación que pudieran ser causados por la
DBS‒STN.
Por lo anterior, con las personas que padecen Parkinson avanzado o con quienes han
tenido una intervención quirúrgica, muchas veces se ajustan los resultados finales del
tratamiento: en lugar de esforzarse para mejorar la autogeneración de sonoridad en la
conversación diaria, el objetivo final del tratamiento puede ser la autogeneración de
diez frases funcionales y oraciones con voz fuerte durante el habla coloquial. Aunque
los resultados del tratamiento se ajustan a estos individuos, ellos pueden obtener —y lo
hacen— ganancias significativas en habilidades de comunicación, importantes para la
persona con Parkinson y los miembros de su familia (Trail et al., 2005).
El tratamiento LSVT en individuos seleccionados con trastornos neurológicos distintos
al Parkinson idiopático —entre ellos, la ataxia, la esclerosis múltiple, el accidente
cerebrovascular, la lesión cerebral traumática, la parálisis cerebral y el síndrome de
Down— han documentado mayores niveles de presión vocal sonora después del
tratamiento corroborados con calificaciones perceptuales de la mejora de la intensidad,
la cualidad/calidad vocal y la comunicación funcional. Además, se han reportado datos
acústicos articulatorios sobre la mejora del formante de transición y el aumento del
espacio vocal junto con la percepción de una mejoría en la precisión articulatoria de
una mujer con disartria atáxica (Sapir et al., 2003).
De igual manera, frente a la naturaleza y extensión de las deficiencias sensoriales
asociadas con otros desórdenes neurológicos, la experiencia clínica indica que estos
individuos parecen adaptarse de modo más fácil a un aumento de la intensidad,
reconocer con más facilidad que el incremento de la sonoridad está dentro de los
límites normales, y llevar con más rapidez el incremento de la sonoridad a la
comunicación diaria, según lo autorreportado durante el tratamiento (Sapir et al.,
2001). Los efectos terapéuticos en niños con parálisis cerebral y disartria espástica
(Fox y Boliek, 2012) mostraron una sonoridad vocal altamente sobresaliente, pero con
cambios mínimos en las medidas acústicas y sin mejorías en el habla. Según lo
indicado por los comentarios de los oyentes, es posible que la necesidad de
comportamientos compensatorios pudiera haber sufrido una considerable disminución
con el tratamiento y ser sustituida con mejores estrategias vocales.
Pese a lo anterior, los clínicos deben ser prudentes al considerar esta aproximación
para personas con otros desórdenes neurológicos, ya que las medidas de resultado de
individuos tratados con trastornos neurológicos distintos del Parkinson idiopático se
limitan a estudios de caso y diseños de sujeto único. Así, los efectos de estos
resultados son limitados y no se consideran comparables a los estudios de eficacia
controlados aleatorizados que se han realizado en individuos con Parkinson idiopático.
Como se puede ver, la evidencia reportada por extensas investigaciones en la
literatura apoya la eficacia de LSVT para el tratamiento de la incompetencia vocal en
hablantes con desórdenes neurogénicos de la comunicación y manifiesta que el
programa tiene los mismos efectos en individuos con presbifonía. Al emplear ejercicios
vocales rigurosos para aumentar la contracción y la coordinación de los músculos
laríngeos, el LSVT disminuye el arqueamiento del pliegue vocal y aumenta así el cierre
de la glotis, por lo que se planteó como una aproximación para la rehabilitación de la
disfonía relacionada con la presbilaringe —de esta propuesta surgió PhoRTE—. El
progreso significativo en la intensidad de la voz y la aducción de las cuerdas vocales
en personas de 61–90 años con presbifonía después del tratamiento LSVT (Ramig et al.,
2001; Lu et al., 2013) se corrobora en una mayor presión de aire subglótico y un
aumento en la actividad electromiográfica en el músculo tiroaritenoideo. Los hallazgos
laringostroboscópicos también indicaron cambios positivos relacionados con la
apariencia de la mucosa y la vibración de las cuerdas vocales, pues la decoloración,
sequedad e hiperemia observada al inicio del tratamiento disminuyó y la vibración de
la mucosa se acercó a un patrón casi normal en términos de amplitud y periodicidad.
Los sujetos demostraron una disminución del arqueamiento de la cuerda vocal y
reducción de la brecha glotal después del tratamiento. De hecho, el tamaño del espacio
glotal se normalizó al disminuir entre 83–84% cuando concluyó la terapia y la tasa de
cierre de la glotis por ciclo vibratorio aumentó de 0% a 20‒30% después del
tratamiento. Además de las obvias mejorías en la intensidad vocal, el tiempo máximo
de fonación, el rango tonal y la calificación perceptual de la cualidad/calidad vocal
también mostraron una mejoría. Los sujetos no desarrollaron ninguna lesión de las
cuerdas vocales ni aumento del comportamiento hiperfuncional de la laringe.
Un área adicional que emergió de la continua investigación con este método está
abordando los desafíos prácticos en la administración de un tratamiento intensivo para
el habla. Estudios preliminares han documentado el impacto de la telepráctica y los
programas de software en la disponibilidad de tratamiento de LSVT®LOUD y sugieren
que este tipo de tecnología puede ser eficaz y aumentar la viabilidad de dosis intensivas
y seguimiento a largo plazo (Howell et al., 2009; Tindall et al., 2008; Constantinescu et
al., 2010; Theodoros et al., 2006; Theodoros y Ramig, 2011). El LSVT administrado
bajo un cronograma alternativo para el tratamiento —16 sesiones administradas durante
2 meses— parece tan efectivo como el protocolo original (Spielman et al., 2007). La
utilización de LSVT en línea (LSVT e‒LOUD) por videoconferencia también demuestra ser
un tratamiento clínicamente válido y confiable para los sujetos con Parkinson idiopático
(Spielman et al., 2007; Constantinescu et al., 2011; Howell et al., 2009; Theodoros et
al., 2006; Tindall et al., 2008).
Así mismo, el sistema LSVT®Companion (LSVT‒C), que permitió que los participantes
recibieran 9 sesiones de tratamiento con un clínico y 7 sesiones en el hogar con el
dispositivo, alcanzó logros similares a los obtenidos con el tratamiento LSVT estándar
presencial. Los datos acústicos demostraron que las personas lograron avances
significativos en la sonoridad vocal a través de una variedad de tareas de voz y habla
después del tratamiento (Halpern et al., 2005; Halpern et al., 2012). Estos hallazgos
experimentales evidencian que los participantes fueron capaces de usar las técnicas
enseñadas durante las sesiones con el clínico y lograron una cualidad/calidad vocal
buena y sonora cuando practicaron solos con el dispositivo. Esto apoya la viabilidad
del LSVT‒C y los desarrollos de futuras aproximaciones basadas en la tecnología para
mejorar la accesibilidad al tratamiento.
Por último, deben mencionarse los desafíos del LSV Texpuestos en la literatura (Trail
et al., 2005). En primer lugar, existe la necesidad de definir mejor las variables
pronóstico de quiénes responderán mejor a programas LSVT y qué resultados se pueden
esperar en los individuos con factores como depresión severa, demencia moderada a
severa, apatía, complicaciones ortopédicas, discinesias, enfermedad de Parkinson
atípica —por ejemplo, atrofia multisistémica, parálisis supranuclear progresiva— y
personas que han tenido neurocirugía como la estimulación profunda del cerebro (DBS).
De igual manera, necesitan estudiarse y validarse de modo sistemático los conceptos
hipotéticos que subyacen a la calibración sensorial y a la comprensión de los
mecanismos neuronales relacionados con los cambios producidos por el tratamiento.
Esto, para entender por completo qué elementos del tratamiento contribuyen a mejorar
el funcionamiento del habla y el movimiento.
Otra labor en curso asumida por los autores del programa LSVT LOUD consiste en
®

abordar cuestiones relacionadas con la importancia de la meta del tratamiento versus el


modo de proveerlo (Fox et al., 2012). En especial, se comparan dos objetivos de
tratamiento: el entrenamiento de la sonoridad vocal (LSVT LOUD) frente al entrenamiento
®

orofacial‒articulación (LSVT ARTIC) y los efectos sobre las mediciones de


inteligibilidad del habla, la acústica del habla, la expresión facial y la deglución. Los
dos tratamientos están estandarizados y asimilados en términos del modo de
administración —la dosificación, la recalibración sensorial, las tareas caseras y las
asignaciones a ejecutar—. Sin embargo, el LSVT®LOUD se centra en el entrenamiento de
una sonoridad vocal saludable a través de tareas de habla —mantenimiento de vocales,
vocales altas y bajas, frases funcionales y jerarquías en el habla— con la atención
enfocada en cómo suena y se siente hablar con sonoridad, mientras que el LSVT ARTIC se
enfoca en la articulación o la enunciación con una mayor fuerza a través de tareas de
habla —diadocoquinesis, pares contrastantes, frases funcionales y habla jerarquica—,
centrando la atención en cómo se siente enunciar con gran fuerza. Hipotéticamente, la
práctica intensiva de la enunciación discursiva del régimen LSVT ARTIC debe fortalecer
la mediación cortical para la articulación del habla más allá de la mejoría asociada con
el LSVT LOUD.
®

En conclusión, los datos combinados de estos estudios ofrecen un fuerte apoyo sobre
la eficacia a corto y largo plazo del tratamiento. Los resultados positivos expuestos
pueden estar relacionados con la mejora en la estabilidad motora o incremento de la
coordinación de los sistemas respiratorio, laríngeo y orofacial que acompañan el
entrenamiento intensivo de la sonoridad. Los datos experimentales publicados sobre el
entrenamiento de la sonoridad (LSVT) han documentado que los efectos se generalizan
más allá de la intensidad vocal para mejorar la deglución, la articulación, los gestos
comunicativos, la expresión facial y el funcionamiento neural. Considerar un
tratamiento simple, redundante e intenso puede ser importante para las personas con
Parkinson idiopático o con trastornos neurológicos distintos que tienen múltiples
problemas en el mecanismo de habla y limitaciones cognitivas. Por todo lo anterior, los
estudios controlados aleatorizados en curso están examinando aún más estos efectos.

PhoRTE

PhoRTE es una adaptación del LSVT y se le denomina con un término homófono de la


palabra italiana forte, que significa en voz alta y fuerte (Ziegler et al., 2013). Sus
objetivos laríngeos son el aumento de la aducción, la reducción a la mitad de la anchura
de la glotis para rebajar el requerimiento de presión subglótica y, en consecuencia, la
disminución en el esfuerzo fonatorio percibido (Titze y Verdolini–Abbott, 2012).
Debido a su naturaleza de alta intensidad, estos ejercicios parecen inducir cambios en
la estructura y la función muscular para revertir el proceso degenerativo ocasionado
por la sarcopenia.
El programa emplea un tracto vocal en forma de megáfono. La interacción fonatoria‒
resonancial a través de una boca amplia y una faringe estrecha crea una situación
acústica que permite al hablante gritar de forma segura. A su vez, se ha demostrado que
las vocales abiertas /a, æ/, usando una faringe estrecha y una laringe alta, causan mayor
aducción de la cuerda vocal y el acoplamiento del tubo epilaríngeo reducido con una
mayor aducción proporciona la máxima transferencia de energía desde la glotis a los
labios para aumentar aún más la sonoridad vocal (Titze y Verdolini–Abbott, 2012).
Además, esta forma de megáfono de la boca con tonos bajos a tonos medio altos
plantea el refuerzo de la frecuencia del primer formante para fortalecer el fundamental y
el segundo armónico en la fuente. Por lo tanto, el resultado de la interacción fonatoria‒
resonancial ayuda a la calibración del esfuerzo fonatorio, la vibración de las cuerdas
vocales y la maximización de la eficiencia fonatoria. El programa PhoRTE se suscribe
en un modelo de control motor dependiente de tareas al incluir frases funcionales que
contribuyan a la generalización de las técnicas vocales para la conversación (Ziegler,
2013). La inclusión de tareas de habla funcional promueve el aprendizaje rápido, ya
que orienta la especificidad de la tarea y la generalización a situaciones por fuera de la
terapia. Del mismo modo, la práctica de tareas de habla funcional para transferir la
técnica a situaciones comunicativas únicas y el énfasis en el aumento de la intensidad
vocal satisface las expectativas del sujeto, al aumentar la autoeficacia y conducir a una
mejor adherencia al tratamiento.
Si bien el método PhoRTE se deriva de los estudios terapéuticos sobre LSVT, hay
varias diferencias entre ambos. Las sesiones del primero se brindan una vez por
semana, el LSVT se da 4 días a la semana durante 4 semanas. Además, PhoRTE incorpora
dos maneras diferentes de producir frases funcionales específicas para el participante:
con voz aguda y fuerte y con voz grave y fuerte. Por último, la práctica en casa con este
método requiere menos repeticiones —2 repeticiones de cada ejercicio— que las que
por lo general requiere el LSVT —10 repeticiones por sesión de práctica—.
Por otra parte, desde un punto de vista fisiológico, con los ejercicios de la función
vocal PhoRTE puede tener una ligera ventaja en la generación de beneficios, ya que
exige una mayor intensidad de esfuerzo y aborda mejor los principios de sobrecarga
requerida para inducir cambios neuromusculares. El incremento de la actividad
neuromuscular en los sistemas respiratorio y laríngeo debe conducir a una mejora aun
mayor en la biomecánica respiratoria y laríngea durante el habla conversacional. Esto
causaría, en última instancia, una reducción significativa en el esfuerzo fonatorio
percibido.

Procedimiento

Este programa consta de cuatro ejercicios: a) fonación con alta intensidad sostenida al
máximo con /a/, b) ascenso y descenso tonal con intensidad alta deslizándose a través
de todo el rango tonal con /a/, c) frases funcionales específicas para cada participante
con voz aguda y alta intensidad y d) las frases del ejercicio anterior con intensidad alta
y tono bajo. Con estos ejercicios, se fortalece la respiración abdominal baja. Todas las
retroalimentaciones se limitan a recordar a los participantes mantener una voz fuerte y
sonora. El clínico reevalúa siempre la carga de trabajo semanal del ejercicio y la
aumenta progresivamente hacia el objetivo de intensidad vocal mediante incrementos
de 5 dB por semana, hasta que el usuario alcance el objetivo final de 20 dB SPL por
encima de la intensidad vocal media (idealmente, 80 dB‒90 dB SPL). El usuario realiza
repeticiones en tono alto y fuerte (alrededor de 8 a 10 repeticiones) usando diferentes
estímulos del habla hasta el punto de experimentar fatiga muscular. Durante las
sesiones, el usuario completa dos series de ejercicios PhoRTE y, entre cada serie, tiene
un período de descanso de un minuto. En el transcurso de las sesiones, se espera que
los participantes alcancen un SPL entre 80 dB y 90 dB, medido con un sonómetro
situado a una distancia de 30 cm entre el micrófono y la boca.
Los participantes asisten una vez a la semana durante 4 semanas. Además, reciben por
escrito las instrucciones sobre cómo completar la práctica en casa cada día, un disco
compacto con demostraciones de audio de los respectivos ejercicios y los registros de
práctica a diligenciar con los ejercicios realizados. Son instruidos a llevar a cabo cada
ejercicio dos veces y efectuar la práctica todos los días dos veces al día. Una vez dado
de alta del tratamiento, el usuario sigue llevando a cabo el tercer y cuarto ejercicio
PhoRTE, tres veces por semana, pero no más de una vez al día. De esa forma, mantiene
su objetivo de intensidad vocal y el estado de la voz.

Evidencia

Por ser de reciente aparición en el panorama terapeútico, solo se puede citar el estudio
comparativo de PhoRTE con ejercicios de la función vocal efectuado por Ziegler et al.
(2013). Los resultados preliminares de este estudio mostraron un incremento
significativo en las puntuaciones del índice de calidad de vida relacionados con la voz
(V‒RQOL), acompañado de disminuciones numéricas en el esfuerzo fonatorio percibido
para el grupo PhoRTE. En especial, PhoRTE pudo requerir menos tiempo de práctica que
el otro programa para generar los cambios neuromusculares en la fortaleza muscular.

2.2.3. Psicogénica
El tratamiento vocal psicogénico (Aronson, 1980) se enfoca en la causa emocional y
psicosocial subyacente a un problema de voz, es decir, en la relación entre los estados
emocionales y los desórdenes de voz. Factores como ansiedad, depresión, estrés o
desórdenes de la personalidad pueden generar desórdenes de la voz. En ese sentido, al
resolver las causas psicógenas, se pueden resolver los problemas de la voz. Sin
embargo, a este enfoque se le critica que la comprensión de la dinámica emocional no
asegura una buena producción vocal; incluso el individuo puede estar ansioso por
lograr una mejor producción vocal. Por lo tanto, el clínico debe poseer habilidades
para la interacción, la consejería y para reconocer cuando el problema emocional o
psicosocial está más allá de sus habilidades, de manera que, según la complejidad de la
causa, pueda involucrar a un consejero profesional, psicólogo o psiquiatra experto en el
tratamiento de la condición mental subyacente.

Terapia cognitiva

En la actualidad, el tratamiento elegido para muchas enfermedades sin explicación


médica es la terapia cognitiva del comportamiento. El modelo cognitivo de síntomas
clínicos inexplicables asume que los factores predisponentes y precipitantes —como
rasgos de personalidad, adversidad en la infancia, acontecimientos estresantes en la
vida y diferentes tipos de virus— sirven para desencadenar un período inicial de
síntomas físicos. Estos síntomas se mantienen por la interacción de factores físicos,
cognitivos, comportamentales y sociales que generan un ciclo de automantenimiento.
Este modelo reconoce el papel de la voz como un «barómetro de la emoción», donde el
comportamiento es considerado un signo de estrés emocional y debe ser observado
antes de iniciar la terapia.
Por este motivo, al comienzo el tratamiento suele centrarse en desmantelar la
conexión con factores que hipotéticamente perpetúan los síntomas. El objetivo es
cambiar el proceso y los patrones de pensamiento poco saludables para aprender
respuestas saludables y realistas ante situaciones difíciles. La terapia cognitiva del
comportamiento es una forma de conversación terapéutica. Esto significa que la persona
discute sus pensamientos, sentimientos y comportamientos con un profesional en salud
mental. Se enfoca en la manera en que el pensamiento afecta la forma en la que se siente
y actúa. Por ejemplo, una misma situación puede ser percibida de manera positiva por
una persona y mejorar su bienestar, pero de manera negativa por otra y acarrear
sentimientos de tristeza o ansiedad. El terapeuta ayuda al sujeto a identificar
pensamientos negativos y evaluar qué tan realistas son; luego, le enseña a
«desaprender» patrones negativos de pensamiento y «aprender» unos nuevos y útiles.
Es un método de solución de problemas.
Aunque no se puede controlar personas o situaciones, se puede controlar cómo estas
perciben y reaccionan ante una situación en particular. La terapia cognitiva enseña las
habilidades necesarias para cambiar la manera de pensar y controlar las reacciones
ante personas y situaciones estresantes. En la discusión psicológica, el sujeto puede
detectar posibles causas de la enfermedad que no influyen en la voz sino en el estado de
ánimo. Solo al resolver estas causas —que a menudo remiten a experiencias profundas
en la vida del sujeto— se despeja el camino para tratar el desorden de voz.
Visto de esta manera, el desorden de voz puede ser entendido como una señal
somática que apunta a conflictos emocionales subyacentes. Si se considera la
incidencia de estos factores sobre el desarrollo de un desorden de voz no orgánico, la
terapia vocal tendrá un enfoque holístico y abordará aspectos funcionales, personales y
emocionales (Seifert y Kollbrunner, 2005).

Procedimiento

El sujeto se entrena para identificar factores de predisposición y perpetuación durante


la evaluación, formulación y entrega de una lógica de tratamiento y el uso de técnicas
específicas destinadas a cambiar los factores de perpetuación. La terapia vocal
cognitiva comportamental «mejorada» (Daniilidou, Carding, Wilson, Drinnan y Deary,
2001) se estructura de acuerdo a los siguientes principios: a) construcción de una
fórmula que explica la disfonía de los sujetos en relación con factores predisponentes,
precipitantes y perpetuantes, b) intervenciones para disminuir los factores perpetuantes,
intervenciones comportamentales de las actividades e intervenciones cognitivas para
identificar y cambiar patrones de pensamiento negativos y c) prevención de recaídas
mediante identificación de probables estresantes y creación de estrategias para
afrontarlos. El clínico también emplea algunas técnicas de terapia vocal
«tradicionales», según cada caso.
La terapia cognitiva se puede dividir en dos momentos: análisis funcional y
entrenamiento de habilidades. En el análisis funcional, la persona y el terapeuta
identifican situaciones estresantes. La persona también determina los pensamientos que
originan o empeoran estas situaciones, para ver si son realistas y apropiados. Por
ejemplo, el terapeuta le señala a la persona patrones de pensamientos negativos como
«no puedo manejar esto» o «la gente se está burlando de mí». Después, mediante
entrenamiento de habilidades, el terapeuta lo guía para reducir hábitos poco saludables
de pensamiento y aprender maneras más saludables. En vez de pensar «no puedo
controlar esto», se le enseña cómo recurrir a su propia fortaleza: «fui capaz de
controlar situaciones difíciles antes, entonces puedo controlar esto ahora ». A la vez, la
persona aprende a hacer más preguntas sobre sí misma antes de llegar a una conclusión,
por ejemplo: «¿esas personas podrían estar burlándose de otra cosa y no de mí?». El
objetivo es reemplazar patrones irracionales de pensamiento con unos más apropiados
y racionales.
El entrenamiento de habilidades requiere mucha práctica que, por lo general, se
asigna como tarea en casa. La persona puede practicar ejercicios de respiración
profunda o representaciones sobre cómo actuar en algunas situaciones sociales. Un
sujeto que lidia con abuso vocal podría practicar maneras de no abusar de su voz. La
tarea en casa es vital para el éxito de la terapia. El paciente debe practicar nuevas
respuestas racionales hasta que reemplace sus respuestas anteriores poco saludables.
La tarea también le permite intentar nuevas habilidades y dar retroalimentación al
terapeuta sobre la estrategia más efectiva.
La duración de cada sesión individual es de 50–100 minutos. Las sesiones grupales
pueden tardar más tiempo. El entrenamiento cognitivo del comportamiento suele ser un
programa intensivo de 5 días con 2 sesiones de seguimiento por día. La supervisión
continua postratamiento es de 1 hora semanal durante los primeros 3 meses y luego
cada 2 semanas o según se requiera. Las sesiones de tratamiento se pueden realizar 1 o
2 veces por semana durante 12‒16 semanas. Este es un lineamiento general; de acuerdo
a la situación, el tratamiento puede durar más o menos tiempo. Cabe recordar que
pueden necesitarse varios intentos para desaprender malos hábitos y para aprender unos
más saludables.

Evidencia
Una evaluación funcional de la terapia cognitiva estructurada para varios sujetos con
disfonía funcional ejecutada por Daniilidou et al. (2001) indicó que este modelo
multifactorial de la disfonía era apropiado y aceptable para este grupo de sujetos, lo
que confirma los primeros trabajos de Butcher, Elias, Raven, Yeatman y Littlejohns
(1987). A pesar de las limitaciones de este estudio piloto, es factible incorporar las
habilidades de terapia cognitiva al repertorio del terapeuta de habla, ya que puede ser
eficaz en la reducción de la angustia asociada con la disfonía funcional. Muchos sujetos
perciben una mejoría en los síntomas en un lapso de 3–4 semanas después de comenzar
la terapia cognitiva y hacer su tarea en casa (Seifert y Kollbrunner, 2005).

Terapia grupal

Con frecuencia, la terapia grupal se adopta como un modelo de prestación de servicios


para la terapia vocal. Por tradición, esta modalidad terapéutica se implementa cuando
las personas con desórdenes de voz han sido atendidas por los clínicos de manera
individual. Si bien se ha empleado un amplio rango de modelos de prestación de
servicios —terapia grupal, consultoría y programas de educación— en el manejo de los
desórdenes de voz, su efectividad se ha estudiado muy poco. Como una modalidad de
aplicación de diversos tratamientos para los desórdenes de voz, cuenta con una
considerable cantidad de literatura que soporta su efectividad (Carding et al., 1999;
MacKenzie et al., 2001; Ruotsalainen et al., 2007; Roy et al., 2003; Chen et al., 2007;
Simberg et al., 2006; Speyer, 2008; Gillivan‒Murphy et al., 2006; Ziegler et al., 2010).
Sin embargo, aunque contribuyen al éxito del tratamiento, la literatura no se ha enfocado
en entender los procesos subyacentes y únicos de la terapia grupal.

Programa de curso de voz

Se conoce como un curso de voz a las prácticas de voz en escenarios grupales incluso
antes de que los participantes se quejen de su voz. Estos cursos de voz proporcionan un
contexto de tratamiento único, en el que los participantes son marcadamente
heterogéneos: algunos de ellos presentan patologías laríngeas diagnosticadas, mientras
que otros no tienen quejas de su voz. Por consiguiente, estos cursos de voz pueden ser
vistos como terapia vocal en grupo para algunos sujetos y como tratamiento preventivo
de voz para otros.

Procedimiento

Se incorporan elementos de enfoques terapéuticos indirectos y directos. La aplicación


de un enfoque combinado se escoge con base en los estudios previos que sugieren que
una sola aproximación de higiene vocal para los participantes tratados podría no ser tan
eficaz (Roy, 2001). A manera de ejemplo, el curso de voz propuesto por Amir, Dukas y
Shnaps‒Baum (2005) consiste en 8 sesiones de 45 minutos. La primera sesión es una
presentación personal de todos los participantes, seguida por una visión general de la
anatomía y fisiología del mecanismo vocal. Después, se aplica una aproximación de
higiene vocal en la que el clínico y los participantes identifican y discuten fuentes de
abuso vocal específicas en las actividades diarias del grupo. La segunda y tercera
sesiones se centran en controlar la respiración; cada participante identifica su tipo de
respiración y a todos los participantes se les enseña la respiración diafragmática y
soporte medio. Las cinco sesiones siguientes se enfocan en la producción de voz.
Durante esta parte del curso, se practica la terapia de canto (McCabe y Titze, 2002)
como la mejor técnica terapéutica 7.
Si bien las cinco sesiones terminan con ejercicios de producción de voz, cada una de
ellas se inicia con la práctica de ejercicios respiratorios. Así mismo, cada sesión
incluye una discusión grupal sobre diversos temas relacionados con la higiene vocal,
propuestos por el clínico o por miembros del grupo. Después de la última sesión de
terapia grupal (Simberg et al., 2006), los sujetos reciben aproximadamente media hora
de orientación personal planificada y un programa de entrenamiento personal en el
hogar según las necesidades y demandas vocales personales.

Evidencia

Aunque las investigaciones reportadas en la literatura científica han manifestado poco


interés sobre el tratamiento grupal en sí mismo, los estudios de Amir et al. (2005) y
Simberg et al. (2006) ilustran los efectos obtenidos bajo esta modalidad. Hace poco, el
estudio de Law, Lee, Ho, Vlantis, van Hasselt y Tong (2012) profundizó en uno de los
procesos de la terapia grupal, al investigar el rol del ambiente grupal en esta modalidad
de terapia.
Amir et al. (2005) inscribieron profesores en un curso de voz para entrenar técnicas
de respiración, control respiratorio y producción de la voz. Los resultados de la
intervención revelan mejoras significativas en ambos grupos en el jitter, el shimmer y
la relación del ruido armónico, lo que exhibe una mejoría mayor en el grupo con
desórdenes que en el grupo sin desórdenes de voz. No hubo cambios estadísticamente
significativos en ninguna de las medidas perceptuales efectuadas por el clínico, aunque
las medidas para el grupo con desórdenes de voz tendían más hacia la mejoría que las
medidas en el grupo control. Los autores concluyeron que, con base en los resultados
del análisis acústico, el programa de tratamiento mejoró las voces de los sujetos de
ambos grupos, con una mayor mejora en el grupo que originalmente presentó
desórdenes de voz. Por su parte, el estudio de Simberg et al. (2006) —quienes
emplearon ejercicios de voz con fricativas bilabiales en las sesiones de terapia grupal
dos veces al día durante 5– 10 minutos por ejercicio a lo largo de todo el período de
terapia vocal— reporta la alta adherencia revelada en la motivación de los sujetos y su
asistencia a todas las sesiones de terapia grupal.

2.2.4. Ecléctica
La terapia vocal ecléctica (Stemple, 1984) incluye una combinación de todos los
tratamientos terapéuticos ya descritos para producir el cambio vocal. Una estrategia de
tratamiento eficaz es aquella en la que un terapeuta adapta una o varias de las técnicas
para solucionar el problema de voz del sujeto. A menudo, el problema de voz de una
persona es una combinación de manifestaciones comportamentales, emocionales, físicas
y estructurales. Como resultado, el enfoque de manejo debe involucrar una combinación
de técnicas orientadas hacia la solución de todos los componentes que subyacen al
problema de voz. El clínico que adopta un enfoque ecléctico a menudo involucra la
participación de otros profesionales o expertos capacitados en áreas diferentes a la
patología del habla y lenguaje.
La principal ventaja de esta filosofía terapéutica es el mayor número de recursos para
el tratamiento de las disfonías. Sin embargo, puede producir desorientación en
terapeutas poco experimentados. Por otra parte, el sujeto puede ser «bombardeado» con
un excesivo número de técnicas sin lograr un resultado eficiente o lograrlo después de
una cantidad innecesaria de sesiones de tratamiento vocal. Es bastante difícil controlar
la multiplicidad de variables involucradas en esta modalidad, por lo que las
investigaciones reportan los efectos del tratamiento ante tal complejidad, aunque no se
han generado estudios de eficacia rigurosos. Por ende, se carece de evidencia de mayor
complejidad.
A continuación, la tabla 2.9 resume los enfoques de tratamiento de la terapia vocal
que se analizaron en este capítulo.
Tabla 2.9. Enfoques de la terapia vocal.
Tratamiento Enfoque Categoría/Estrategia Terapia/Técnica
Higiene vocal
Indirecta
Amplificación de la voz
Métodos de relajación
Entrenamiento respiratorio
Directa Sintomática Soporte respiratorio
Control respiratorio
Bostezo–suspiro
Terapia manual laríngea

Métodos de terapia manual Terapia manual circunlaríngea


perilaríngea Masaje vocal
Sintomática VozLibre
Terapia de canto
Terapia vocal asistida con laringoscopia transnasal flexible
Retroalimentación visual
(TFL)
Fonación fluida Tracto vocal semiocluido
Terapia confidencial Stretch and flow

Directa Ejercicios de la función vocal


De Stemple
Fisiológica Terapia resonante De Lessac–Madsen (LMRVT)
Terapia Twang
Método de acento
LSVT
PhoRTE
Terapia cognitiva
Psicogénica
Terapia grupal
Ecléctica
Fuente: elaboración propia.

Notas al pie
1 Amasar significa utilizar la base de la mano para elevar el cuerpo del músculo, mientras se aplica un movimiento
circular.

2 Un tono de salmo es un patrón tradicional de notas que se puede ajustar a cualquier texto.

3 Téngase en cuenta que en las investigaciones cada sesión de ejercicio requirió un promedio de 15 a 20 minutos
durante cuatro semanas (Sabol et al., 1995), de 40 a 60 minutos en la misma cantidad de semanas (Ziegler,
Verdolini, Johns, Klein y Hapner, 2013), por seis semanas (Pasa et al., 2007; Sauder, Roy, Tanner, Houtz y Smith,
2010; Patel, Pickering, Stemple y Donohue, 2012; Gelfer y Van Dong, 2013), en ocho semanas (Gillivan-Murphyet
al., 2006), y durante 12 semanas (Gorman et al., 2008).
4 La reducción del cociente de velocidad fue menor en el pliegue afectado (0.58 a 0.53) que en el otro pliegue (0.90 a
0.48). El cociente de apertura fue de 0.674 postratamiento, el incremento de la longitud glótica para ambos pliegues
fue de 18.0 a 24.0 vs. 18.5 a 27.1, la velocidad de apertura y de cierre disminuyó en ambas cuerdas, siendo todos
los valores mencionados levemente menores en la cuerda afectada.

5 Inclinación durante el cierre.

6 Más que los cambios en la velocidad (velocidad lenta) o hablar con articulación exagerada. La primera produjo la
mayor cantidad de variabilidad motora y la segunda valores más altos de STI.

7 Para mayor detalle, remitirse a la evidencia presentada en cada uno de los apartados de las técnicas mencionadas.

Referencias

Enfoques
Behrman, A., Rutledge, J., Hembree, A., y Sheridan, S. (2008). Vocal hygiene education, voice production therapy,
and the role of patient adherence: a treatment effectiveness study in women with phonotrauma. Journal of Speech
Language and Hearing Research, 51(2), 350–366.
Carding, P. N., Horsley, I.A., y Docherty, G.J. (1999). A study of the effectiveness of voice therapy in the treatment
of 45 patients with nonorganic dysphonia. Journal of Voice, 13(1), 72–104. doi: http://doi.org/dkvw8r.
Gartner-Schmidt, J. L., Roth, D. F., Zullo, T. G., y Rosen, C. A. (2013). Quantifying component parts of indirect and
direct voice therapy related to different voice disorders. Journal of Voice, 27(2):210–6.
Gillivan-Murphy, P., Drinnan, M. J., O’Dwyer, T. P., Ridha, H., y Carding, P. (2006). The effectiveness of a voice
treatment approach for teachers with self-reported voice problems. Journal of Voice, 20(3), 423–431.
MacKenzie, K., Millar, A., Wilson, J. A., Sellars, C., y Deary, I. J. (2001). Is voice therapy an effective treatment for
dysphonia? A randomised controlled trial. British Medical Journal, 323(7314), 658–61.
Rattenbury, H. J., Carding, P. N., y Finn, P. (2004). Evaluating the effectiveness and efficiency of voice therapy using
transnasal flexible laryngoscopy: a randomized controlled trial. Journal of Voice, 18(4):522-533.
Roy, N., Weinrich, B., Gray, S. D., Tanner, K., Toledo, S. W., Dove, H.,et al. (2002). Voice amplification versus
vocal hygiene instruction for teachers with voice disorders: a treatment outcomes study. Journal of Speech
Language and Hearing Research, 45(4), 625–638.
Ruotsalainen, J., Sellman, J., Lehto, L., Jauhiainen, M., y Verbeek, J. (2007). Interventions for treating functional
dysphonia in adults. Cochrane Database of Systematic Reviews, 18(3), CD006373. doi: http://doi.org/bjfj28.
Simberg, S., Sala, E., Tuomainen, J., Sellman, J., y Rönnemaa A-M. (2006). The effectiveness of group therapy for
students with mild voice disorders: a controlled clinical trial. Journal of Voice, 20(1), 95–102.
Speyer, R. (2008). Effects of voice therapy: a systematic review. Journal of Voice, 22(5), 565–580.

Terapia indirecta
Stemple, J. C. (1984). Clinical Voice Pathology. New York, USA: Macmillan.

Higiene vocal
Bistritsky, Y., y Frank, Y. (1981). Efficacy of voice and speech training of prospective elementary school teachers.
Israel J Speech Hear, 10, 16-32.
Broaddus-Lawrence P. L., Treole, K., McCabe, R. B., Allen, R. L., y Toppin, L. (2000). The effects of preventative
vocal hygiene education on the vocal hygiene habits and perceptual vocal characteristics of training singers. Journal
of Voice, 14(1), 58-71.
Chan, R. (1994). Does the voice improve with vocal hygiene education? A study of some instrumental voice measures
in a group of kindergarten teachers. Journal of Voice, 8(3), 279-291.
Holmberg, E. B., Hillman, R. E., Hammarberg, B., Sodersten, M., y Doyle, P. (2001). Efficacy of a behaviorally based
voice therapy protocol for vocal nodules. Journal of Voice, 15(3), 395-412.
Ilomaki, I., Laukkanen, A. M., Leppanen, K., y Vilkman, E. (2008). Effects of voice training and voice hygiene
education on acoustic and perceptual speech parameters and self-reported vocal well-being in female teachers.
Logoped Phoniatrics Vocology, 33(2), 83–92.
Nanjundeswaran, C., Li, N. Y., Chan, K. M., Wong, R. K., Yiu, E. M., y Verdolini-Abbott, K. (2012). Preliminary data
on prevention and treatment of voice problems in student teachers. Journal of Voice, 26(6), 816.e1-816.e12.
Niebudek-Bogusz, E., Sznurowska-Przygocka, B., Fiszer, M., Kotylo, P., Sinkiewicz, A., Modrzewska, M.,et al.
(2008). The effectiveness of voice therapy for teachers with dysphonia. Folia Phoniatrica et Logopaedica, 60(3),
134–141. doi: http://doi.org/ckxnxx.
Pasa, G., Oates, J., y Dacakis, G. (2007). The relative effectiveness of vocal hygiene training and vocal function
exercises in preventing voice disorders in primary school teachers. Logoped Phoniatrics Vocology, 32(3), 128–
140.
Roy, N., Gray, S. D., Simon, M., Dove, H., Corbin‒Lewis, K., y Stemple, J. C. (2001) An evaluation of the effects of
two treatment approaches for teachers with voice disorders: A prospective randomized clinical trial. Journal of
Speech, Language and Hearing Research, 44, 286–96. doi: http://doi.org/b2h9wc.
Silverio, K. C., Goncalves, C. G., Penteado, R. Z., Vieira, T. P., Libardi, A., y Rossi, D. (2008). Actions in vocal
health: a proposal for improving the vocal profile of teachers. Pró-Fono Revista de Atualização Científica, 20(3),
177–182.
Verdolini, K., Li, N. Y., Branski, R. C., Rosen, C. A., Grillo, E., Steinhauer, K.,et al. (2012). Vocal exercise may
attenuate acute vocal fold inflammation. Journal of Voice, 26(6):814.e1-13.
Ziegler, A., Gillespie, A. I., y Abbott, K. (2010). Behavioral treatment of voice disorders in teachers.Folia
Phoniatrica et Logopaedica, 62(1-2), 9-23. doi: http://doi.org/c6pjr3.

Amplificación de la voz
McCormick, C. A., y Roy, N. (2002). The ChatterVox ™ Portable Voice Amplifier: A means to vibration dose
reduction in occupational voice users. Journal of Voice, 16(4), 502–508.
Sapienza, C. M., Crandell, C. C., y Curtis, B. (1999). Effects of sound-field frequency modulation amplification on
reducing teacher’s sound pressure level in the classroom. Journal of Voice, 13(3), 375–381.

Terapia directa
Sintomática
Aronson, A. E. (1990). Clinical Voice Disorders: An Interdisciplinary Approach. 3rd ed. New York: Thieme
Stratton.
Awan, S. N., y Roy, N. (2009). Outcomes measurement in voice disorders: application of an acoustic index of
dysphonia severity. Journal of Speech Language and Hearing Research, 52(2):482-99.
Baker, S., Sapienza, C., Davenport, P., Martin, D., Hoffman-Ruddy, B., y Woodson, G. (2003). Inspiratory pressure
threshold training for upper airway limitation: a case of bilateral abductor vocal fold paralysis. Journal of Voice,
17(3), 384-94.
Boone, D. R. (1988). Respiratory training in voice therapy. Journal of Voice, 2(1), 20-25.
Boone, D. R., y McFarlane, S. C. (1988). The voice and voice therapy. 4th ed. New Jersey, EE.UU.: Prentice Hall.
Boone, D. R. y McFarlane, S. C. (1993). A critical view of the yawn-sigh as a voice therapy technique.Journal of
Voice, 7(1):75-80.
De Bodt, M. S., Clement, G., Wuyts, F. L., Borghs, C., y Van Lierde, K. M. (2012). The impact of phonation mode
and vocal technique on vocal fold closure in young females with normal voice quality. Journal of Voice,
26(6):818.e1-4.
D’haeseleer, E., Claeys, S., y Van Lierde K. (2013). The effectiveness of manual circumlaryngeal therapy in future
elite vocal performers: a pilot study. Laryngoscope, 123(8):1937-41.
Dromey, C., Ramig, L. O., y Johnson, A. B. (1995). Phonatory and articulatory changes associated with increased
vocal intensity in Parkinson disease: a case study. Journal of Speech, Language, and Hearing Research, 38(4),
751–64. doi: http://doi.org/bzr2.
Gelfer, M. P., y Van Dong, B. R. (2013). A preliminary study on the use of vocal function exercises to improve voice
in male-to-female transgender clients. Journal of Voice, 27(3):321-334.
Hoffman-Ruddy, B., Sapienza, C., Lehman, J., Davenport, P., y Martin, D. (2001). Acoustic and Physiological
Characteristics of High-Risk Vocal Performers following Expiratory Pressure Threshold Training. EnVoice
Singing (pp. 8-9). EE.UU.: Sessions.
Jacobson, E. (1938). Progressive Relaxation. Illinois, USA: University of Chicago Press.
Laukkanen, A-M., Leppänen, K., y Ilomäki, I. (2009). Self-evaluation of voice as a treatment outcome measure.Folia
Phoniatrica et Logopaedica, 61(1):57–65.
Laukkanen, A-M., Leppänen, K., Tyrmi, J., y Vilkman, E. (2005). Immediate effects of ‘Voice Massage’ treatment on
the speaking voice of healthy subjects. Folia Phoniatrica et Logopaedica, 57(3):163–172.
Leppänen, K., Ilomäki, I., y Laukkanen, A. M. (2010). One-year follow-up study of self-evaluated effects of voice
massage, voice training, and voice hygiene lecture in female teachers. Logopedics, Phoniatrics, Vocology,
35(1):13-8.
Leppänen, K., Laukkanen, A-M., Ilomäki, I., y Vilkman, E. (2009). A comparison of the effects of Voice Massage
and vocal hygiene lecture on self-reported vocal well being and acoustic and perceptual speech parameters in
female teachers. Folia Phoniatrica et logopaedica, 61(4):227–238.
Mathieson, L. (2011). The evidence for laryngeal manual therapies in the treatment of muscle tension dysphonia.
Current Opinion in Otolaryngology & Head and Neck Surgery, 19(3):171-6.
Mathieson, L., Hirani, S. P., Epstein, R., Baken, R. J., Wood, G., Rubin, J. S. (2009). Laryngeal manual therapy: a
preliminary study to examine its treatment effects in the management of muscle tension dysphonia. Journal of
Voice, 23(3):353-66.
McCabe, D. J., y Titze I. R. (2002). Chant therapy for treating vocal fatigue among public school teachers: A
preliminary study. American Journal of Speech-Language Pathology, 11(4): 356-69.
Ramig, L. O., Countryman, S., Thompson, L., y Horii, Y. (1995). A comparison of two forms of intensive speech
treatment for Parkinson disease. Journal of Speech Hear Res, 38(6), 1232–51. doi: http://doi.org/bzvs.
Rosing-Schow A, Pedersen SG. (2010). VoiceRelease. Logopedics, Phoniatrics, Vocology, 35(4):166-8.
Roy, N., y Ferguson, N. (2001). Formant frequency changes following manual circumlaryngeal therapy for functional
dysphonia: evidence of laryngeal lowering? Journal of medical speech-language pathology, 9(3):169-175.
Roy, N., y Hendarto, H. (2005) Revisiting the pitch controversy: changes in speaking fundamental frequency (SFF)
after management of functional dysphonia. Journal of Voice, 19(4):582-91.
Roy, N., y Leeper, H. A. (1993). Effects of the manual laryngeal musculoskeletal tension reduction technique as a
treatment for functional voice disorders: perceptual and acoustic measures. Journal of Voice, 7(3):242–249.
Roy, N., Bless, D. M., Heisey, D., y Ford, C. N. (1997). Manual circumlaryngeal therapy for functional dysphonia: an
evaluation of short- and long-term treatment outcomes. Journal of Voice, 11(3):321-331.
Roy, N., Nissen, S. L., Dromey, C., y Sapir, S. (2009) Articulatory changes in muscle tension dysphonia: evidence of
vowel space expansion following manual circumlaryngeal therapy. Journal of Communication Disorders,
42(2):124-35.
Roy, N., Weinrich, B., Gray, S. D., Tanner, K., Stemple, J. C., y Sapienza, C. M. (2003). Three treatments for
teachers with voice disorders: a randomized clinical trial. Journal of Speech Language and Hearing Research,
46(3), 670–688.
Sapienza, C. M., Brown, J., Martin, D., y Davenport, P. (1999). Inspiratory pressure threshold training for glottal
airway limitation in laryngeal papilloma. Journal of Voice, 13, 382–388.
Sapienza, C., Davenport, P., y Martin, D. (2002). Expiratory muscle training increases pressure support in high school
band students. Journal of Voice, 16(4), 495–501.
Sapienza, C., Troche, M., Pitts, T., y Davenport, P. (2011). Respiratory strength training: Concepts and intervention
outcomes. Semin Speech Lang, 32(1), 21-30.
Seifert, E., y Kollbrunner, J. (2005). Stress and distress in non‒organic voice disorder. Swiss Medical Weekly,
135(27‒28), 387–97.
Spielman, J. L., Borod, J. C., y Ramig, L. O. (2003). The effects of intensive voice treatment on facial expressiveness
in Parkinson disease: preliminary data. Cognitive and Behavioral Neurology, 16(3):177-88.
Treole, K., y Trudeau, M. D. (1997). Changes in sustained production tasks among women with bilateral vocal nodules
before and after voice therapy. Journal of Voice, 11(4), 462-469.
Van Lierde, K. M., De Bodt, M., Dhaeseleer, E., Wuyts, F., y Claeys, S. (2010). The treatment of muscle tension
dysphonia: a comparison of two treatment techniques by means of an objective multiparameter approach. Journal
of Voice, 24(3):294-301.
Xu, J. H., Ikeda, Y., y Komiyama, S. (1991). Bio–feedback and the yawning breath pattern in voice therapy: a clinical
trial. Auris Nasus Larynx, 18(1), 67–77. doi: http://doi.org/b6wp.

Fisiológica
Andrade, P. A., Wood, G., Ratcliffe, P., Epstein, R., Pijper, A., y Svec, J. G. (2014). Electroglottographic study of
seven semi-occluded exercises: LaxVox, straw, lip-trill, tongue-trill, humming, hand-over-mouth, and tongue-trill
combined with hand-over-mouth. Journal of Voice, 28(5):589-595.
Andrews, M, L. (2006). Manual of Voice Treatment: Pediatrics Through Geriatrics. 3rd ed. Nueva York:
Thomson/Delmar Learning.
Baumgartner, C., Sapir, S., y Ramig, L. (2001). Perceptual voice quality changes following phonatory‒respiratory
effort treatment (LSVT ) vs. respiratory effort treatment for individuals with Parkinson disease. Journal of Voice,
15(1), 105–14. doi: http://doi.org/ct2rgr.
Berg, E. E., Hapner, E., Klein, A., y John, M. M. (2008). Voice therapy improves quality of life in age–related
dysphonia: A case control study. Journal of Voice. 2008;22:70–4.
Berry, D. A., Verdolini, K., Montequin, D., Hess, M. M., Chan, R. W., y Titze, I. R. (2001). A quantitative output-cost
ratio in voice production. Journal of Speech Language and Hearing Research, 44(1): 29–37.
Bovo, R., Galceran, M., Petruccelli, J., Hatzopoulos, S. (2007). Vocal problems among teachers: evaluation of a
preventive voice program. Journal of Voice, 21(6), 705–22. doi: http://doi.org/fsb2nx.
Cannito, M. P., Suiter, D. M., Beverly, D., Chorna, L., Wolf, T., y Pfeiffer, R. M. (2012). Sentence intelligibility before
and after voice treatment in speakers with idiopathic Parkinson’s disease. Journal of Voice, 26(2), 214‒9. doi:
http://doi.org/fzbpmp.
Cannito, M. P., Suiter, D. M., Chorna, L., Beverly, D., Wolf, T., y Watkins, J. (2008). Speech intelligibility in a speaker
with idiopathic Parkinson’s disease before and after treatment. Journal of Medical Speech‒Language
Pathology, 16(4), 207–12.
Chen, S. H., Huang, J. L., y Chang, W. S. (2003). The efficacy of resonance method to hyperfunctional dysphonia
from physiological, acoustic and aerodynamic aspects: the preliminary study. Asia Pacific Journal of Speech,
Language and Hearing, 8(3), 200–3. doi: http://doi.org/bzps.
Chen, S. H., Hsiao, T. Y., Hsiao, L. C., Chung, Y. M., y Chiang, S. C. (2007). Outcome of resonant voice therapy for
female teachers with voice disorders: perceptual, physiological, acoustic, aerodynamic, and functional
measurements. Journal of Voice, 21(4), 415–25. doi: http://doi.org/cptz5h.
Colton, R. H., y Casper, J. K. (1990).Understanding voice problems: a physiological perspective for diagnosis
and treatment. Baltimore: Williams & Wilkins.
Constantinescu, G. A., Theodoros, D. G., Russell, T. G., Ward, E. C., Wilson, S. J., y Wootton, R. (2010). Home‒
based speech treatment for Parkinson’s disease delivered remotely: a case report. Journal of Telemedicine and
Telecare, 16(2), 100–4. doi: http://doi.org/fnk6wd.
Constantinescu, G., Theodoros, D. G., Russell, T., Ward, E., Wilson, S., y Wootton, R. (2011). Treating disordered
speech and voice in Parkinson’s disease online: a randomized controlled non‒inferiority trial. International Journal
of Language & Communication Disorders, 46(1), 1–16.
Cooper, M. (1973). Modern Techniques of Vocal Rehabilitation. Springfield: Thomas.
Countryman, S., Ramig, L., y Pawlas, A. (1994). Speech and voice deficits in Parkinsonian Plus syndromes: can they
be treated? Journal of Medical Speech‒Language Pathology, 2(3), 211–25.
Countryman, S., Hicks, J., Ramig, L., y Smith, M. (1997). Supraglottal hyperadduction in an individual with Parkinson’s
disease: a clinical treatment note. American Journal of Speech‒Language Pathology, 6(4), 74–84. doi:
http://doi.org/bzvq.
Denizoglu, I., y Sihvo, M. (2010). LaxVoxVoice Therapy Technique. Current Practice in Otorhinolaryngology,
6(2):284-295.
Dromey, C. (2000). Articulatory kinematics in patients with Parkinson disease using different speech treatment
approaches. Journal of Medical Speech‒Language Pathology, 8(3), 155–61.
El Sharkawi, A., Ramig, L. O., Logemann, J., Pauloski, B., Rademaker, A., Smith, C., et al. (2002). Swallowing and
voice effects of Lee Silverman Voice Treatment (LSVT ®): a pilot study. Journal of Neurology, Neurosurgery &
Psychiatry, 72(1), 31–6. doi: http://doi.org/cf6qdq.
Enflo, L., Sundber, J., Romedahl, C., y McAllister, A. (2013). Effects on Vocal Fold Collision and Phonation Threshold
Pressure of Resonance Tube Phonation With Tube End in Water. Journal of Speech Language and Hearing
Research, 56(5);1530-1538.
Fex, B., Fex, S., Shiromoto, O., y Hirano, M. (1994). Acoustic analysis of functional dysphonia: before and after voice
therapy (accent method). Journal of Voice, 8(2),163–7. doi: http://doi.org/cj3bwt.
Fox, C. M., Morrison, C. E., Ramig, L. O., y Sapir, S. (2002). Current perspectives on the Lee Silverman Voice
Treatment (LSVT ) for individuals with Idiopathic Parkinson disease. American Journal of Speech‒Language
Pathology, 11(2), 111–23. doi: http://doi.org/dm8pm3.
Fox, C. M., y Boliek, C. A. (2012). Intensive voice treatment (LSVT ®LOUD) for children with spastic cerebral palsy and
dysarthria. Journal of Speech, Language and Hearing Research, 55(3), 930‒45. doi: http://doi.org/fzhsd7.
Fox, C. M., Ebersbach, G., Ramig, L., y Sapir, S. (2012).LSVT ®LOUD and LSVT ®BIG: Behavioral treatment programs
for speech and body movement in Parkinson disease. Parkinson’s Disease, 2012, 1‒12. doi: http://doi.org/bzqp.
Gartner-Schmidt, J. (2010). Flow phonation. En J. Gartner-Schmidt,Voice Therapy–Clinical Case Studies (pp. 84–
92). San Diego, EE.UU.: Plural Publishing.
Gauffin, J., y Sundberg, J. (1989). Spectral correlates of glottal voice source waveform characteristics.Journal of
Speech, Language, and Hearing Research, 32(3):556-650.
Gorman, S., Weinrich, B., Lee, L., y Stemple, J. (2008). Aerodynamic changes as a result of vocal fold function
exercises in elderly men. Laryngoscope, 118(10):1900-1903.
Guzmán, M., Higueras, D., Fincheira, C., Muñoz, D., Guajardo, C. (2012). Efectos acústicos inmediatos de una
secuencia de ejercicios vocales con tubos de resonancia. Revista CEFAC, 14(3):471-480.
Guzmán, M., Higueras, D., Fincheira, C., Muñoz, D., Guajardo, C., y Dowdall, J. (2013). Immediate acoustic effects of
straw phonation exercises in subjects with dysphonic voices. Logopedics, Phoniatrics, Vocology, 38:35–45.
Halpern, A., Matos, C., Ramig, L., Petska, J., Spielman, J., y Will, L. (2005). Technology supported speech treatment
for Parkinson’s disease. Movement Disorders, 20(10), S134.
Halpern, A. E., Ramig, L. O., Matos, C. E., Petska‒Cable, J. A., Spielman, J. L., Pogoda, J. M., et al. (2012).
Innovative technology for the assisted delivery of intensive voice treatment (LSVT ®LOUD) for Parkinson disease.
American Journal of Speech‒Language Pathology, 21(4), 354‒67. doi: http://doi.org/bsmg.
Howell, S., Tripoliti, E., y Pring, T. (2009). Delivering the Lee Silverman Voice Treatment L( SVT ) by web camera: a
feasibility study. International Journal of Language & Communication Disorders, 44(3), 287–300. doi:
http://doi.org/fr2p8x.
Huber, J. E., Stathopoulos, E. T., Ramig, L. O., y Lancaster, S. L. (2003). Respiratory function and variability in
individuals with Parkinson disease: pre‒ and post‒Lee Silverman voice treatment. Journal of Medical Speech‒
Language Pathology, 11(4), 185–201.
Jiang, J. J., y Titze, I. R. (1994). Measurement of vocal fold intraglotal pressure and impact stress.Journal of Voice,
8(2):132–144.
Jürgens, U., y von Cramon, D. (1982). On the role of the anterior cingulated cortex in phonation: a case report.Brain
and Language, 15(2), 234–48. doi: http://doi.org/chd2rc.
Kleinow, J., Smith, A., y Ramig, L. (2001). Speech motor stability inIDP: effects of rate and loudness manipulations.
Journal of Speech, Language and Hearing Research, 44(5), 1041–51. doi: http://doi.org/ck58gt.
Kotby, M. (1995). The accent method of voice therapy. San Diego, EE.UU.: Singular.
Kotby, M. N., El‒Sady, S. R., Bassiouny, S. E., Abou Rass, Y. A., y Hegazi, M. A. (1991). Efficacy of the accent
method of voice therapy. Journal of Voice, 5(4), 316‒20. doi: http://doi.org/cgmhqv.
Kotby, M., y Fex, B. (1998). The accent method: behavior readjustment voice therapy. Logopedics, Phoniatrics,
Vocology, 23(1), 39–43. doi: http://doi.org/bd7433.
Kotby, M., Shiromoto, O., y Hirano, M. (1993). The accent method of voice therapy: effect of accentuations onFO,
SPL and air flow. Journal of Voice, 7(4), 319‒25. doi: http://doi.org/bjnvsr.
Laukkanen, A. (1992). About the so called ’resonance tubes’ used in Finnish voice training practice. Scandinavian
Journal of Logopedics and Phoniatrics, 14(3-4):151-161.
Laukkanen, A. M., Horácek, J., Krupa, P., y Svec, J. G. (2012). The effect of phonation into a straw on the vocal tract
adjustments and formant frequencies. A preliminary MRI study on a single subject competed with acoustic results.
Biomedical Signal Processing and Control, 7(1):50–57.
Laukkanen, A-M., Lindholm, P., y Vilkman, E. (1995). Phonation into a tube as a voice training method: acoustic and
physiologic observations. Folia Phoniatrica et Logopaedica, 47(6):331–338.
Laukkanen, A-M, Lindholm, P., Vilkman, E., Haataja, K., y Alku, P. (1996). A physiological and acoustic study on
voiced bilabial fricative/beta:/as a vocal exercise. Journal of Voice, 10(1):67-77.
Laukkanen, A-M., Päivi, L., y Vilkman, E. (1998). Vocal exercising and speaking related changes in glottal resistance:
A pilot study. Logopedics Phoniatrics Vocology, 23(2):85-92.
Laukkanen, A-M., Titze, I. R., Hoffman, H., y Finnegan, E. (2008). Effects of a semioccluded vocal tract on laryngeal
muscle activity and glottal adduction in a single female subject. Folia Phoniatrica et Logopaedica, 60(6):298–311.
Liotti, M., Ramig, L., Vogel, D., New, P., Cook, C., Ingham, R. J.,et al. (2003). Hypophonia in Parkinson disease:
neural correlates of voice treatment with LSVT revealed by P ET. Neurology, 60(3), 432‒40. doi:
http://doi.org/bzvc.
Liotti, M., Vogel, D., New, P., Ramig, L., Mayberg, H., Cook, C.,et al. (1999). A P ET study of functional
reorganization of premotor regions in Parkinson’s disease following intensive voice treatment (LSVT).Neurology,
52(6), 348–9.
Lombard, L. E., y Steinhauer, K. M. (2007). A novel treatment for hypophonic voice: twang therapy. Journal of
Voice, 21(3):294‒9. doi: http://doi.org/c73kcs.
Lu, F. L., Presley, S., y Lammers, B. (2013). Efficacy of intensive phonatory‒respiratory treatment (LSVT) for
presbyphonia: two case reports. Journal of Voice, 27(6), 786.e11‒23. doi: http://doi.org/f2w4hb.
Mahler, L. A., y Jones, H. N. (2012). Intensive treatment of dysarthria in two adults with Down syndrome.
Developmental Neurorehabilitation, 15(1), 44‒53. doi: http://doi.org/fxj5vd.
Mahler, L. A., y Ramig, L. O. (2012). Intensive treatment of dysarthria secondary to stroke.Clinical Linguistics &
Phonetics, 26(8), 681‒94. doi: http://doi.org/bzr5.
Mahler, L., Ramig, L., y Fox, C. (2009). Intensive voice treatment (LSVT®LOUD) for dysarthria secondary to stroke.
Journal of Medical Speech‒Language Pathology, 17(4), 165–82. doi: http://doi.org/bzr5.
McCullough, G., Zraick, R., Balou, S., Pickett, H., Rangarathnam, B., y Tulunay-Ugur, O. (2012). Treatment of
laryngeal hyperfunction with flow phonation: A pilot study. Journal of Laryngology and Voice, 2(2):64-69.
McHenry, M. (1997). The effect of increased vocal effort on estimated velopharyngeal orifice area. American
Journal of Speech‒Language Pathology, 6(4), 55–61. doi: http://doi.org/bzrq.
Møller, K. (2006). The accent method. Milton Keynes, UK: Voicesource Publishing.
Narayana, S., Fox, P. T., Zhang, W., Franklin, C., Robin, D. A., Vogel, D.,et al. (2010). Neural correlates of efficacy
of voice therapy in Parkinson’s disease identified by performance‒correlation analysis. Human Brain Mapping,
31(2), 222–36. doi: http://doi.org/c82m56.
Nguyen, D. D., y Kenny, D. T. (2009). Randomized controlled trial of vocal function exercises on muscle tension
dysphonia in Vietnamese female teachers. Journal of Otolaryngology-Head & Neck Surgery, 38(2):261-78.
Oliveira, V. M., Heuer, R. J., Dean, C. M., y Sataloff, R. T. (2001). Comparison of singer’s formant, speaker’s ring,
and LTA spectrum among classical singers and untrained normal speakers. Journal of Voice, 15(3), 344–50. doi:
http://doi.org/fjf9jk.
Pankas, J., Sepić, T., Pitlović, V., Rosso, M., y Starcević, R. (2011). Importance of correct therapeutic procedure
selection in voice recovery. Collegium Antropologicum, 35(Supl. 2), 259–262.
Patel, R. R., Pickering, J., Stemple, J., y Donohue, K. D. (2012). A case report in changes in phonatory physiology
following voice therapy: application of high-speed imaging. Journal of Voice, 26(6):734-741.
Peterson, K. L., Verdolini‒Marston, K., Barkmeier, J. M., y Hoffman, H. T. (1994). Comparison of aerodynamic and
electroglottographic parameters in evaluating clinically relevant voicing patterns. Annals of Otology, Rhinology &
Laringology, 103(5), 335‒46. doi: http://doi.org/bzpm.
Radhakrishnan, N., y Scheidt, T. (2012). Modified vocal function exercises: a case report. Logopedics Phoniatrics
Vocology, 37(3):123-126.
Ramig, L. O., Bonitati, C. M., Lemke, J. H., y Horii, Y. (1994). Voice treatment for patients with Parkinson’s disease:
development of an approach and preliminary efficacy data. Journal of Medical Speech‒Language Pathology,
2(3), 191–209.
Ramig, L. O., Countryman, S., O’Brien, C., Hoehn, M., y Thompson, L. (1996). Intensive speech treatment for
patients with Parkinson’s disease: short and long‒term comparison of two techniques. Neurology, 47(6), 1496–504.
doi: http://doi.org/bzvr.
Ramig, L. O., y Dromey, C. (1996). Aerodynamic mechanisms underlying treatment–related changes inSPL in patients
with Parkinson disease. Journal of Speech and Hearing Research, 39(4), 798–807. doi: http://doi.org/bzvg.
Ramig, L. O., Gray, S., Baker, S., Corbin‒Lewis, K., Buder, E., Luschei, E., et al. (2001). The aging voice: a review,
treatment data and familial and genetic perspectives. Folia Phoniatrica et Logopaedica, 53(5), 252–65. doi:
http://doi.org/c47wxm.
Ramig, L. O., Pawlas, A. A., y Countryman, S. (1995).The Lee Silverman Voice Treatment: a practical guide to
treating the voice and speech disorders in Parkinson disease. Iowa City, EE.UU.: National Center for Voice
and Speech.
Ramig, L. O., Sapir, S., Baker, K., Hinds, S., Spielman, J., Brisbie, A.,et al. (2000). The «big picture» on the role of
phonation in the treatment of individuals with motor speech disorders: Or «what’s up with loud?». At the Bilennial
Motor Speech Conference. Conference held by the National Institute of Neurological Disorders and Stroke, San
Antonio, EE.UU.
Ramig, L., Sapir, S., Fox, C., y Countryman, S. (2001). Changes in vocal loudness following intensive voice treatment
(LSVT ) in individuals with Parkinson disease: a comparison with untreated patients and normal age‒matched
controls. Movement Disorders, 16(1), 79–83.
Ramig, L., Sapir, S., Countryman, S., Pawlas, A., O’Brien, C., Hoehn, M., et al. (2001). Intensive voice treatment
(LSVT) for individuals with Parkinson’s disease: a two‒year follow‒up. Journal of Neurology, Neurosurgery &
Psychiatry, 71(4), 493–8.
Sabol, J. W., Lee, L., y Stemple, J. C. (1995). The value of vocal function exercises in the practice regimen of singers.
Journal of Voice, 9(1), 27–36.
Sapir, S., y Aronson, A. E. (1985). Aphonia after closed head injury: aetiologic considerations. International Journal
of Language & Communication Disorders, 20(3), 289–96. doi: http://doi.org/b5z8hb.
Sapir, S., Pawlas, A., Ramig, L., Seeley, E., Fox, C., y Corboy, J. (2001). Effects of intensive phonatory‒respiratory
treatment (LSVT) on voice in individuals with multiple sclerosis. Journal of Medical Speech‒Language
Pathology, 9(2), 141‒51.
Sapir, S., Spielman, J., Ramig, L. O., Hinds, S. L., Countryman, S., Fox, C., et al. (2003). Effects of intensive voice
treatment (the Lee Silverman Voice Treatment [LSVT]) on ataxic dysarthria: a case study. American Journal of
Speech‒Language Pathology, 12(4), 387‒99. doi: http://doi.org/dgghmj.
Sapir, S., Spielman, J. L., Ramig, L. O., Story, B. H., y Fox, C. (2007). Effects of intensive voice treatment (the Lee
Silverman Voice Treatment [LSVT]) on vowel articulation in dysarthric individuals with idiopathic Parkinson
disease: acoustic and perceptual findings. Journal of Speech, Language and Hearing Research, 50(4), 899–912.
doi: http://doi.org/frv567.
Sapir, S., Ramig, L. O., Spielman, J. L., y Fox. C. (2010). Formant centralization ratio: a proposal for a new acoustic
measure of dysarthric speech. Journal of Speech, Language and Hearing Research, 53(1), 114–25. doi:
http://doi.org/b4g92k.
Sauder, C., Roy, N., Tanner, K., Houtz, D. R., y Smith, M. E. (2010). Vocal function exercises for presbylaryngis: A
multidimensional assessment of treatment outcomes. Annals of Otology Rhinology and Laryngology-Including
Supplements, 119(7): 460.
Simberg, S. (2001). The resonance tube—a versatile device in voice therapy. En B. E. Kjær (editor),Nine Papers on
Logopedics and Phoniatrics (81–5). Audiologopædisk Forening: Forlaget alf, Odense.
Simberg, S., y Laine, A. (2007). The resonance tube method in voice therapy: Description and practical
implementations. Logopedics Phoniatrics Vocology, 32(4):165-70.
Smith, C. G., Finnegan, E. M., y Karnell, M. P. (2005). Resonant voice: spectral and nasendoscopic analysis.Journal
of Voice, 19(4), 607‒22. doi: http://doi.org/ck2b2f.
Smith, M. E., Ramig, L. O., Dromey, C., Perez, K. S., y Samandari, R. (1995). Intensive voice treatment in
Parkinson’s disease: laryngostroboscopic findings. Journal of Voice, 9(4), 453–9. doi: http://doi.org/fc4rck.
Solomon, N. P., McKee, A. S., y García‒Barry, S. (2001). Intensive voice treatment and respiration treatment for
hypokinetic‒spastic dysarthria after traumatic brain injury. American Journal of Speech‒Language Pathology,
10(1), 51‒64. doi: http://doi.org/bkm8bz.
Solomon, N. P., Makashay, M. J., Kessler, L. S., y Sullivan, K. W. (2004). Speech‒breathing treatment and LSVT for
a patient with Hypokinetic‒Spastic Dysarthria after TBI.Journal of Medical Speech‒Language Pathology,
12(4), 213‒9.
Sovijärvi, A. (1965). Die bestimmung der stimmkategorien mittels resonanzröhren. Basel: Karger.
Spielman, J. L., Ramig, L. O., y Borod, J. C. (2001). Preliminary effects of voice therapy on facial expression in
Parkinson’s disease. Journal of the International Neuropsychology Society, 7, 244.
Spielman, J. L., Borod, J. C., y Ramig, L. O. (2003). The effects of intensive voice treatment on facial expressiveness
in Parkinson disease: preliminary data. Cognitive and Behavioral Neurology, 16(3), 177‒88. doi:
http://doi.org/fqm6hd.
Spielman, J. L., Mahler, L., Halpern, A., Gilley, P., Klepitskaya, O., y Ramig, L. O. (2011). Intensive voice treatment
(LSVT®LOUD) for Parkinson’s disease following deep brain stimulation of the subthalamic nucleus.Journal of
Communication Disorders, 44(6), 688‒700. doi: http://doi.org/ctd9j3.
Spielman, J. L., Ramig, L. O., Mahler, L., Halpern, A., y Gavin, W. (2007). Effects of an extended version of the Lee
Silverman voice treatment on voice and speech in Parkinson’s disease. American Journal of Speech‒Language
Pathology, 16(2), 95–107. doi: http://doi.org/br8c49.
Stemple, J. (2000). Voice therapy: Clinical studies. San Diego, EE.UU.: Singular.
Stemple, J. C., Lee, L., D’Amico, B., y Pickup, B. (1994). Efficacy of vocal function exercises as a method of
improving voice production. Journal of Voice, 8(3), 271–278.
Stone, R. E., y Casteel, R. L. (1982). Intervention in non-organically based dysphonia. En M. Filter (editor),
Phonatory Disorders in Children. New York: CC Thomas Co.
Sundberg, J. (1974). Articulatory interpretation of the «singing formant». The Journal of the Acoustical Society of
America, 55(4):838–44. doi: http://doi.org/d2wpdd.
Sundberg, J. (1987). The Science of the Singing Voice. DeKalb, EE.UU.: Northern Illinois University Press.
Titze, I. R. (2001). Acoustic interpretation of resonant voice. Journal of Voice, 15(4):519–528. http://doi.org/dr4kkt.
Titze, I. R., y Sundberg, J. (1992). Vocal intensity in speakers and singers. The Journal of the Acoustical Society of
America, 91(5):2936-46.
Theodoros, D. G., Constantinescu, G., Russell, T. G., Ward, E. C., Wilson, S. J., y Wootton, R. (2006). Treating the
speech disorder in Parkinson’s disease online. Journal of Telemedicine and Telecare, 12 (Supl. 3), 88–91. doi:
http://doi.org/d8cc7j.
Theodoros, D. G., y Ramig, L. (2011). Telepractice supported delivery of LSVT®L O U D . Perspectives on
Neurophysiology and Neurogenic Speech and Language Disorders, 21(3), 107–19.
Theodoros, D. G., Thompson‒Ward, E. C., Murdoch, B. E., Lethlean, J., y Silburn, P. (1999). The effects of the Lee
Silverman Voice Treatment Program on motor speech function in Parkinson disease following thalamotomy and
pallidotomy surgery: a case study. Journal of Medical Speech‒Language Pathology, 7(2), 157–60.
Tindall, L. R., Huebner, R. A., Stemple, J. C., y Kleinert, H. L. (2008). Videophone‒delivered voice therapy: a
comparative analysis of outcomes to traditional delivery for adults with Parkinson’s disease. Telemedicine Journal
and e‒Health, 14(10), 1070–7. doi: http://doi.org/fdrjh5.
Titze, I. R. (1994). Principles of Voice Production. Englewood Cliffs, EE.UU.: Prentice Hall.
Titze, I. R., y Verdolini–Abbott, K. (2012). Vocology: The Science and Practice of Voice Habilitation. Salt Lake
City, EE.UU.: National Center for Voice and Speech.
Trail, M., Fox, C., Ramig, L. O., Sapire, S., Howardf, J., y Laib, E. (2005). Speech treatment for Parkinson’s disease.
NeuroRehabilitation, 20(2005), 205–21.
Tripoliti, E., Strong, L., Hickey, F., Foltynie, T., Zrinzo, L., Candelario, J.,et al. (2011). Treatment of dysarthria
following subthalamic nucleus deep brain stimulation for Parkinson’s disease. Movement Disorders, 26(13), 2434‒
6. doi: http://doi.org/cm4nk3.
Tripoliti, E., Zrinzo, L., Martínez‒Torres, I., Frost, E., Pinto, S., Foltynie, T.,et al. (2011). Effects of subthalamic
stimulation on speech of consecutive patients with Parkinson disease. Neurology, 76(1), 80‒6. doi:
http://doi.org/c6kqdw.
Verdolini, K. (2000). Resonant voice therapy. En J. C. Stemple (2.a ed.), Voice therapy: Clinical studies (pp.46–61).
San Diego, EE.UU.: Singular.
Verdolini, K., y Titze, I. R. (1995). The application of laboratory formulas to clinical voice management. American
Journal of Speech-Language Pathology, 4(2):62-9.
Verdolini, K., Rosen, C. A., y Branski, R. C. (2006).Classification Manual for Voice Disorders. Nueva Jersey:
Erlbaum.
Verdolini, K., Druker, D. G., Palmer, P. M., y Samawi, H. (1998). Laryngeal adduction in resonant voice.Journal of
Voice, 12(3), 315–27. doi: http://doi.org/b82zbc.
Verdolini‒Marston, K., Burke, M. K., Lessac, A., Glaze, L., y Caldwell, E. (1995). Preliminary study of two methods
of treatment for laryngeal nodules. Journal of Voice, 9(1), 74‒85.
Ward, E. C., Theodoros, D. G., Murdoch, B. E., y Silburn, P. (2000). Changes in maximum capacity tongue function
following the Lee Silverman Voice Treatment Program. Journal of Medical Speech‒Language Pathology, 8(4),
331‒5.
Watts, C. R., Diviney, S. S., Hamilton, A., Toles, L., Childs, L., y Mau, T. (2014). The Effect of Stretch-and-Flow
Voice Therapy on Measures of Vocal Function and Handicap. Journal of Voice, 28(6):pii: S0892-1997(14)00112-
X.
Wenke, R. J., Theodoros, D., y Cornwell, P. (2008). The short‒ and long‒term effectiveness of theLSVT for
dysarthria following TBI and stroke. Brain Injury, 22(4), 339‒52. doi: http://doi.org/c8bk7w.
Wohlert, A., y Hammen, V. (2000). Lip muscle activity related to speech rate and loudness. Journal of Speech,
Language and Hearing Research, 43(5), 1229–39. doi: http://doi.org/bzr4.
Yanagisawa, R., Estill, J., Kmucha, S. T., y Leder, S. B. (1989). The contribution of aryepiglottic constriction to
«ringing» voice quality—a videolaryngoscopic study. Journal of Voice, 3(4), 342–50. doi: http://doi.org/drz85n.
Yorkston, K. M. (1996). Treatment efficacy: dysarthria. Journal of Speech and Hearing Research, 39(5), S46–
S57. doi: http://doi.org/bzqm.
Ziegler, A., Verdolini Abbott, K., Johns, M., Klein, A., y Hapner, E. R. (2013). Preliminary data on two voice therapy
interventions in the treatment of presbyphonia. The Laryngoscope, 124(8), 1869‒76.

Psicogénica
Amir, O., Dukas, M., y Shnaps‒Baum, R. (2005). The effect of a «voice course» on the voices of people with and
without pathologies: preliminary observation s . Logopedics, Phoniatrics, Vocology, 30(2), 63‒71. doi:
http://doi.org/cr534x.
Aronson, A. (1980). Clinical voice disorders: An interdisciplinary approach. New York, EE.UU.: Decker.
Butcher, P., Elias, A., Raven, R., Yeatman, J., y Littlejohns, D. (1987). Psychogenic voice disorder unresponsive to
speech therapy: psychological characteristics and cognitive‒behaviour therapy. The British Journal of Disorders
of Communication, 22(1), 81‒92. doi: http://doi.org/fspqks.
Daniilidou, P., Carding, P., Wilson, J., Drinnan, M., y Deary, V. (2001). Cognitive behavioral therapy (CBT ) for
functional dysphonia: a pilot study. Annals of Otology, Rhinology & Laryngology, 116(10), 717‒22. doi:
http://doi.org/bzr3.
Law, T., Lee, K. Y., Ho, F. N., Vlantis, A. C., van Hasselt, A. C., y Tong, M. C. (2012). The effectiveness of group
voice therapy: a group climate perspective. Journal of Voice, 26(2), e41‒8. doi: http://doi.org/cvcnz4.
McCabe, D. J., y Titze, I. R. (2002). Chant therapy for treating vocal fatigue among public school teachers: a
preliminary study. American Journal of Speech‒Language Pathology, 11(4), 356‒69. doi: http://doi.org/ftdmsz.
Speyer, R. (2008). Effects of voice therapy: a systematic review. Journal of Voice, 22(5), 565–80. doi:
http://doi.org/cc5rjc.
CAPÍTULO 3
NUEVAS FRONTERAS

Los nuevos paradigmas en la terapia vocal responden a las necesidades de una


sociedad en constante evolución, que requiere nuevos servicios, una ampliación de las
perspectivas ya existentes y nuevas formas de implementación. Esto, con el propósito
de brindar mayores niveles de funcionalidad vocal y participación en contextos que
implican el uso de una voz eficiente y efectiva.
Dichos paradigmas deben tener en cuenta el manejo de factores que, según se cree,
aumentan o disminuyen la tasa de éxito en la terapia vocal tradicional y reducen la
deserción. Estos factores pueden incluir la cronicidad, la naturaleza etiológica, la
historia médica, la presencia o ausencia de ganancias secundarias, la variabilidad de
las técnicas de tratamiento, la duración del tratamiento (Van Lierde, 2007), la habilidad
y conocimiento del clínico (Van Lierde, 2007; Andrews y Schmidt, 1995), la
personalidad del clínico (Crane y Cooper, 1983), la motivación de los sujetos (Van
Leer, Hapner y Connor, 2008; Koufman y Blalock, 1982; Behrman, 2006), la falta de
confianza en el tratamiento (Van Lierde, 2007; Andrews y Schmidt, 1995), el
cumplimiento del sujeto (Verdolini–Marston et al., 1995), las perspectivas del sujeto
sobre la terapia vocal (Van Leer y Connor, 2010), la necesidad de tomar tiempo libre o
destinar tiempo no previsto para asistir a la terapia, la necesidad de practicar los
objetivos del comportamiento vocal y el tiempo necesario para desplazarse hacia la
terapia.
Para lograr una mayor tasa de éxito en la terapia vocal, las nuevas aproximaciones
deben permitir la manipulación de varios de los factores mencionados que sean
indispensables y estén basados en las necesidades individuales de los sujetos. Los
paradigmas terapéuticos relacionados con algunos de estos factores e involucrados en
la modificación del comportamiento han recibido considerable atención en los campos
de la neurobiología, la fisiología del ejercicio, el aprendizaje motor, la psicología y las
ciencias de la comunicación humana y sus desórdenes. Estos paradigmas pueden
alimentar la comprensión de la terapia vocal con enfoques que busquen mejorar su tasa
de éxito (Patel, Bless y Thibeault, 2011).
En la literatura científica se han planteado propuestas novedosas para dar respuesta a
los nuevos paradigmas. Entre estas se encuentran la repotencialización del
comportamiento vocal, la inmersión en el tratamiento y el empleo cada vez mayor y más
sofisticado de tecnologías emergentes.

3.1. Repotencialización del comportamiento vocal o Behavioral voice–lift

La investigación ha demostrado que los adultos mayores activos tienen una


independencia física superior a aquellos con un estilo de vida sedentario. Del mismo
modo, los cantantes mayores han demostrado un tono de voz más fuerte y más claro que
sus contemporáneos no cantantes. Este hallazgo sugiere que una mayor actividad de la
voz puede prevenir su envejecimiento y aumentar su longevidad. Aunque no se pueden
cambiar algunas declinaciones físicas naturales de la voz, se puede preservar la
funcionalidad esencial. Se trata de usarlo o perderlo (Ziegler y Hapner, 2013).
En el tratamiento vocal para personas de tercera edad, los clínicos deben atender las
dolencias específicas manifestadas por los pacientes. Los objetivos con este grupo
etario son: aumentar la intensidad vocal, la sinergia del apoyo respiratorio y el control
fonatorio, y mejorar la cualidad/calidad vocal. Para esto, solo dos técnicas terapéuticas
han sido analizadas y ambas están basadas en los principios de la fisiología del
ejercicio: los ejercicios de la función vocal (VFE, por su sigla en inglés) y los
ejercicios de entrenamiento de la resistencia a la fonación (PhoRTE, por su sigla en
inglés). Las investigaciones han encontrado que estos dos programas controlan los
cambios de voz relacionados con la edad, disminuyen el esfuerzo fonatorio y aumentan
la calidad de vida de la voz. Estas técnicas se explicaron con mayor detalle en los
apartados previos.
En general, muchos adultos mayores creen que el deterioro de su voz es una
consecuencia inevitable del envejecimiento y no saben que existe un tratamiento para
ello. Los programas de terapia vocal, como los ejercicios de la función vocal y PhoRTE,
son prometedores en la rehabilitación de la voz envejecida. Los sujetos que se someten
a estos tratamientos reportan satisfacción con la mejoría del estado funcional de su voz.
Todo lo anterior justifica aún más la investigación en este campo.

3.2. Inmersión en el tratamiento o Boot camp

La terapia vocal intensiva a corto plazo, también conocida como campo de


entrenamiento vocal, fue un procedimiento novedoso desarrollado en la Universidad
de Wisconsin–Madison por Thibeault, Zelazny y Cohen (2009). La terapia vocal campo
de entrenamiento se deriva de los constructos de la neurobiología, la fisiología del
ejercicio, el aprendizaje motor, la psicología y la terapia del lenguaje, relacionados
con la intensidad requerida para facilitar el cambio de comportamiento dentro de un
corto periodo de tiempo. La terapia vocal intensiva a corto plazo es una práctica única
que demanda un gran número de clínicos, con una variedad de técnicas terapéuticas
vocales en un marco de tiempo concentrado (1–4 días con 4–7 horas de terapia por
día). La terapia se ajusta en grandes cantidades a la naturaleza del problema vocal y a
las necesidades del sujeto, para así maximizar su capacidad de aprender y alcanzar los
objetivos en entornos no clínicos.
Este enfoque es similar al aprendizaje acelerado en el aula, método que identifica en
un corto plazo las necesidades de los sujetos que desean acelerar su proceso o no
pueden asistir a las sesiones en ambientes tradicionales. La terapia vocal campo de
entrenamiento está diseñada para cubrir en un día lo que usualmente se cubre en dos
semanas con la terapia tradicional y está dirigida a las personas que necesitan con
urgencia mejorar su voz o que han fracasado con la terapia vocal tradicional. De ese
modo, esta técnica proporciona un marco estructural distintivo para que los sujetos se
centren en los aspectos de la producción vocal que están dentro de sus capacidades
pero fueron inaccesibles mediante la terapia vocal tradicional.
Aunque la extrapolación desde otras áreas de la terapia de habla debe hacerse con
precaución, los resultados de la experiencia de Patel et al. (2011) sugieren que la
terapia vocal intensiva a corto plazo proporcionada por tres horas o más al día para la
disfonía crónica resistente al tratamiento puede ser más eficiente que el mismo
tratamiento repartido en periodos más largos de tiempo. Muchos de los sujetos con
disfonía crónica que fueron tratados con el campo de entrenamiento habían sido
sometidos previamente a un tratamiento similar de una o dos sesiones de terapia vocal a
la semana durante varios meses; no obstante, la disfonía persistía. Estos resultados no
empíricos indican que las investigaciones sistemáticas son fundamentales para
comparar la eficacia de la terapia vocal intensiva a corto plazo con los resultados de la
terapia vocal tradicional.

3.3. Tecnologías emergentes

Es indispensable encontrar soluciones alternativas para aumentar la accesibilidad al


tratamiento, mantener su fidelidad y preservar los elementos esenciales para su éxito.
Una posible solución es la intervención con apoyo tecnológico. Se afirma que el uso de
la tecnología puede aumentar la accesibilidad, mejorar la eficacia y reducir la carga
financiera de muchos programas de rehabilitación intensiva (Halpern et al., 2012).
La exploración reciente con tecnología innovadora ofrece medios alternativos para
implementar el tratamiento de una manera viable y costo–efectiva. Este puede ser un
factor que motive a los posibles beneficiarios de la terapia vocal a iniciar el
tratamiento. Así mismo, una forma de fomentar y controlar los logros del tratamiento a
largo plazo podría ser el uso de programas informáticos interactivos, que se están
convirtiendo en herramientas poderosas para la intervención clínica en una variedad de
poblaciones y desórdenes. Estos programas pueden personalizar protocolos de
tratamiento específicos y ser utilizados de forma remota por los beneficiarios. De esta
manera, se superan las principales barreras para el suministro de protocolos clínicos
intensivos.
Los programas de software compatibles con asistentes digitales personales (PDA, por
su sigla en inglés) —como los reportados por Halpern et al. (2012)— ofrecen
posibilidades para el autoentrenamiento individual en casa, debido a su portabilidad y
facilidad de uso. El LSVT–C aumenta la frecuencia de la práctica y mejora el rendimiento
ensayo por ensayo, al proporcionar conocimiento de los resultados en línea (feedback).
Así, se promueve la independencia y se refuerzan los objetivos del comportamiento
vocal. Una limitación de esta opción es su incapacidad para determinar exactamente
qué tipo de voz están produciendo los participantes en las sesiones de práctica en el
hogar.
Recientemente, la telepráctica o teleasistencia también ha sido considerada como un
medio para mejorar el acceso a la evaluación y tratamiento del habla y la voz
(Mashima, Birkmire–Peters, Syms, Holtel, Burgess y Peters, 2003; Hillman, Heaton,
Masaki, Zeitels y Cheyne, 2006; Mashima y Doarn, 2008; Constantinescuet al., 2010).
Esta práctica es cada vez más utilizada por personas de edad avanzada y personas
enfermas para lograr independencia dentro de sus hogares y, a la vez, mejorar su acceso
al cuidado de la salud. Esto puede reducir las barreras de acceso a servicios, como,
por ejemplo, la dificultad de desplazarse hasta las instalaciones para recibir atención
especializada.
Las aplicaciones en línea son fáciles de usar y permiten la implementación efectiva
del tratamiento a través de la red. La videoconferencia en tiempo real para capturar los
datos acústicos de la voz y visualizar en línea los materiales de la terapia es importante
para lograr un tratamiento exitoso; pues permite que el clínico: a) proporcione
instrucciones oportunas al participante y asesore las producciones correctas y
calibración general de la voz, b) monitoree el nivel de sonoridad, el nivel tonal y la
cualidad/calidad vocal y c) mantenga una buena relación con el participante.

3.3.1. Procedimiento
El sistema de telerrehabilitación debe ser capaz de: a) proporcionar videoconferencias,
b) presentar material de lectura al participante, c) hacer una captura de video de alta
calidad (resolución 640 X 480 pixeles) y de audio comprimido a 384 kbit/s para un
examen posterior, d) obtener medidas mediante el sistema de procesamiento acústico
de la voz y e) manipular las cámaras web del sitio del participante —por ejemplo, a
través de un brazo robot— para mantener una visión clara de la persona durante toda la
sesión.
Un computador se sitúa en el sitio del clínico y otro en la casa del participante. Antes
del tratamiento, el sistema del participante debe ubicarse en una habitación tranquila
para reducir cualquier distracción y ruido del hogar. Por la misma razón, no deben
recibirse llamadas telefónicas durante las sesiones. En la videoconferencia, el clínico y
el participante se comunican a través de un micrófono de cabeza. El clínico enseña al
participante a realizar las funciones básicas necesarias para el tratamiento, como
encender y apagar el computador, activar y cerrar la aplicación y posicionar el
micrófono de cabeza. El micrófono debería ubicarse a 5 cm de la esquina de la boca
del participante para reducir la distorsión del sonido, maximizar la visibilidad de la
cara y permitir grabaciones precisas de la voz. El participante debe tener mucho
cuidado en garantizar que se mantenga esta distancia.
Para verificar la posición del micrófono, se usa un sonómetro digital convencional
durante tres fonaciones sostenidas de la vocal /a/. El procesador acústico de la voz
debe conectarse al computador portátil con la conexión de videoconferencia habilitada
y una resolución mínima de 320 X 240 pixeles entre los dos sistemas. El participante no
debe ajustar el brazo del micrófono durante el tratamiento y debe tener cuidado de
dónde coloca el micrófono de cabeza cuando no está en uso. Esto, para asegurar que los
niveles acústicos sean constantes entre las sesiones. Sería útil que el clínico
proporcionara grabaciones de audio del desempeño de los participantes como
retroalimentación. Al finalizar cada sesión, se envían los materiales de tarea–refuerzo
al participante por correo electrónico.
Las estrategias que contribuyen a la implementación habitual del tratamiento y son
útiles para mejorar la calidad de video incluyen: que el clínico use señales de mano
para una rápida entrada y que el paciente se siente relativamente quieto frente a la
cámara durante las sesiones, siga en mayor medida las instrucciones verbales
específicas y la retroalimentación de los participantes en lugar de la información
visual, y use la modalidad de almacenamiento y envío (store–and–forward) para
registrar la tarea deseada cuando sea necesario.
Cuando se establece una conexión de internet entre los dos sistemas de
videoconferencia, algunas dificultades en las redes reducen considerablemente la
calidad de audio y video. Para resolverlo, se desconecta y restablece la conexión. Una
conexión de internet de banda ancha mejora la interfaz, reduce las dificultades de audio
y video, y disminuye la necesidad de estrategias compensatorias, simulando mejor la
modalidad cara a cara.

Evidencia
Varios estudios han explorado herramientas tecnológicas para monitorear
ambulatoriamente la voz (Hillman et al., 2006). Estos han demostrado la viabilidad de
la potencialización del habla mediante la amplificación (Cariski y Rosenbek, 1999;
Greene, Watson, Gay y Townsend, 1972) y el mejoramiento de la voz con ayuda de la
biorretroalimentación (Rubow y Swift, 1985), el enmascaramiento del ruido o
retroalimentación auditiva retardada (Adams y Lang, 1992; Adams, Moon, Dykstra,
Abrams, Jenkins y Jog, 2006; Downie, Low y Lindsay, 1981; Hanson y Metter, 1980) y
el suministro de tratamientos mediante la telepráctica (Constantinescu et al., 2010,
2011; Howell et al., 2009; Tindall et al., 2008; Theodoros et al., 2006).
Hal per n et al. (2012) investigaron la aplicación del protocolo LSVT®LOUD
suministrado a través de un asistente digital personal, interactivo, personalizado y
basado en un programa de software, el LSVT®Companion (LSVT–C). Los resultados
indican que los participantes fueron capaces de utilizar de forma independiente el
LSVT–C en el hogar y la mayoría calificó el dispositivo como muy útil. Además de
mejorar el nivel de presión vocal sonora, los participantes sostuvieron esta mejoría
seis meses después del tratamiento sin usar el LSVT–C durante este periodo. Todo lo
anterior señala que los pacientes aprendieron a producir, de forma independiente, una
voz de intensidad mayor a la que habían producido antes de la terapia.
Podría creerse que las personas mayores tienen dificultades para utilizar la tecnología
por falta de experiencia, miedo a la tecnología, temblor del brazo‒mano o discinesia en
la parte superior del cuerpo. Sin embargo, los cuestionarios postratamiento indicaron
que los participantes acogieron con entusiasmo el LSVT–C. Incluso los participantes
hasta los 81 años, con poca experiencia en informática y con temblores de brazo‒mano
y discinesia en la parte superior del cuerpo fueron capaces de completar el programa
de tratamiento.
Por otra parte, el estudio que empleó un sistema de telerrehabilitación
(Constantinescu et al., 2010) no solo alcanzó las metas del tratamiento, sino que mostró
satisfacción del participante con la totalidad del tratamiento en línea. De igual forma, el
paciente indicó que prefería las sesiones en línea a las sesiones presenciales en el
manejo futuro de su condición. En general, las sesiones del estudio transcurrieron sin
problemas ni dificultades técnicas, con audio adecuado y buena calidad de video.

Referencias
Andrews, M., y Schmidt, C. (1995). Congruence in personality between clinician and client: Relationship to ratings of
voice treatment. Journal of Voice, 9(3), 261–269.
Behrman, A. (2006). Facilitating behavioral change in voice therapy: The relevance of motivational interviewing.
American Journal of Speech–Language Pathology, 15(3), 215–25. doi: http://doi.org/cn9dk7.
Crane, S., y Cooper, E. (1983). Speech–language clinician personality variables and clinical effectiveness. Journal of
Speech and Hearing Disorders, 48(2), 140–145. doi: http://doi.org/br3r.
Koufman, J., y Blalock, P. (1982). Classification and approach to patients with functional voice disorders. Annals of
Otology, Rhinology & Laryngology, 91(4), 372–377. doi: http://doi.org/br3s.
Van Leer, E., Hapner, E., y Connor, N. (2008). Transtheoretical model of health behavior change applied to voice
therapy. Journal of Voice, 22(6), 688–698. doi: http://doi.org/fhsb96.
Van Leer, E., y Connor, N. (2010). Patient perceptions of voice therapy adherence. Journal of Voice, 24(4), 458–
469. doi: http://doi.org/d3z58g.
Van Lierde, K., Claeys, S., De Bodt, M., y Van Cauwenberge, P. (2007). Long-term outcome of hyperfunctional voice
disorders based on a multiparameter approach. Journal of Voice, 21(2), 179–188. doi: http://doi.org/fpccqw.
Verdolini–Marston, K., Burke, M., Lessac, A., Glaze, L., y Caldwell, E. (1995). Preliminary study of two methods of
treatment for laryngeal nodules. Journal of Voice, 9(1), 74–85. doi: http://doi.org/dj2tkm.

Behavioral voice–lift
Ziegler, A., y Hapner, E. (2013). The behavioral voice-lift. Learn how SLPs can help restore the youthful voice of an
aging population. The Asha Leader, 18(3).

Boot camp
Patel, R., Bless, D., y Thibeault, S. (2011). Boot camp: A novel intensive approach to voice therapy. Journal of
Voice, 25(5), 562-569. doi: http://doi.org/dh6bkt.

Tecnologías emergentes
Adams, S., y Lang, A. (1992). Can the Lombard effect be used to improve low voice intensity in Parkinson’s disease?
International Journal of Language & Communication Disorders, 27(2), 121–127. doi: http://doi.org/c997tg.
Adams, S., Moon, B., Dykstra, A., Abrams, K., Jenkins, M., y Jog, M. (2006). Effects of multi–talker noise on
conversational speech intensity in Parkinson’s disease. Journal of Medical Speech–Language Pathology, 14(4),
221–228.
Cariski, D., y Rosenbek, J. (1999). The effectiveness of the speech enhancer. Journal of Medical Speech–
Language Pathology, 7(4), 315–22.
Constantinescu, G., Theodoros, D., Russell, T., Ward, E., Wilson, S., y Wootton, R. (2010). Home–based speech
treatment for Parkinson’s disease delivered remotely: A case report. Journal of Telemedicine and Telecare,
16(2), 100–104. doi: http://doi.org/fnk6wd.
Constantinescu, G., Theodoros, D., Russell, T., Ward, E., Wilson, S., Wootton, R. (2011). Treating disordered speech
and voice in Parkinson’s disease online: A randomized controlled non-inferiority trial. International Journal of
Language & Communication Disorders, 46(1), 1–16.
Downie, L., Low, J., y Lindsay, D. (1981). Speech disorder in Parkinsonism: Usefulness of delayed auditory feedback
in selected cases. International Journal of Language & Communication Disorders, 16(2), 135–139. doi:
http://doi.org/b62n5q.
Greene, M., Watson, B., Gay, P., y Townsend, D. (1972). A therapeutic speech amplifier and its use in speech
therapy. Journal of Laryngology & Otology, 86(6), 595–605. doi: http://doi.org/d59jmq.
et al. (2012). Innovative technology for
Halpern, A., Ramig, L., Matos, C., Petska–Cable, J., Spielman, J., Pogoda, J.,
the assisted delivery of intensive voice treatment (LSVT®LOUD) for Parkinson disease.American Journal of
Speech–Language Pathology, 21(4), 354–367. doi: http://doi.org/bsmg.
Hanson, W., y Metter, J. (1980). DAF as instrumental treatment for dysarthria in progressive supranuclear palsy: A
case report. Journal of Speech and Hearing Disorders, 45(2), 268–276. doi: http://doi.org/bsmb.
Hillman, R., Heaton, J., Masaki, A., Zeitels, S., y Cheyne, H. (2006). Ambulatory monitoring of disordered voices.
Annals of Otology, Rhinology & Laryngology, 115(11), 795–801.
Howell, S., Tripoliti, E., y Pring, T. (2009). Delivering the Lee Silverman Voice Treatment (LSVT ) by web camera: a
feasibility study. International Journal of Language & Communication Disorders, 44(3), 287–300. doi:
http://doi.org/fr2p8x.
Mashima, P., Birkmire–Peters, D., Syms, M., Holtel, M., Burgess, L., y Peters, L. (2003). Telehealth: Voice therapy
using telecommunications technology. American Journal of Speech–Language Pathology, 12(4), 432–439. doi:
http://doi.org/cgsvq3.
Mashima, P., y Doarn, C. (2008). Overview of telehealth activities in speech–language pathology. Telemedicine and
e–Health, 14(10), 1101–17. doi: http://doi.org/cwbmmq.
Rubow, R., y Swift, E. (1985). A microcomputer–based wearable biofeedback device to improve transfer of treatment
in Parkinsonian dysarthria. Journal of Speech and Hearing Disorders, 50(2), 178–185. doi: http://doi.org/bsmf.
Theodoros, D., Constantinescu, G., Russell, T., Ward, E., Wilson, S., y Wootton, R. (2006). Treating the speech
disorder in Parkinson’s disease online. Journal of Telemedicine and Telecare, 12 (Supl. 3), 88–91. doi:
http://doi.org/d8cc7j.
Thibeault S, Zelazny S, Cohen S. (2009). Voice boot camp: intensive treatment success.The ASHA Leader, 14(7),
26–27.
Tindall, L., Huebner, R., Stemple, J., y Kleinert, H. (2008). Videophone–delivered voice therapy: A comparative
analysis of outcomes to traditional delivery for adults with Parkinson’s disease. Telemedicine and e–Health,
14(10), 1070–1077. doi: http://doi.org/fdrjh5.
CAPÍTULO 4
EVIDENCIA

4.1. Estado del arte

Aunque existe consenso sobre los beneficios de las estrategias terapéuticas de


comportamiento —significativos en el contexto clínico y, con frecuencia, en el
estadístico—, la información sobre cómo cuantificar el proceso multifacético de la
terapia vocal es escasa. La eficacia de la terapia vocal depende de la extensión de los
cambios estructurales y funcionales de la laringe (Mau, Jacobson y Garrett, 2010), pero
el análisis de resultados de la eficacia en sujetos con desórdenes de voz no orgánicos
es muy difícil. Por ello, las cifras sobre el éxito del tratamiento citadas en la literatura
se refieren sobre todo a cambios fenomenológicos para mejorar la función vocal. De
allí que se mida el resultado del desempeño en la actividad y la participación vocal,
además de las actividades relacionadas con la estructura y la función vocal. Esta
consideración se ha hecho en investigaciones recientes.
Los resultados obtenidos en estos estudios no pueden generalizarse ni ser
completamente representativos de los efectos de la terapia vocal, debido a la poca
adopción de lineamientos para documentar los estudios clínicos. Ninguno de los
artículos publicados hasta el 2010 se adhiere totalmente a lo que a menudo se considera
el «estándar de oro» para los estudios clínicos según los Consolidated Standards of
Reporting Trials (CONSORT).
Después de esta fecha, se han diseñado estudios con base en lineamientos cada vez
más complejos y elaborados. En esta discusión, Ziegler et al. (2010) ilustran tres
parámetros relacionados con los métodos. El primero tiene que ver con las
intervenciones, su razón de ser y, en especial, sus detalles; el segundo se relaciona con
la consistencia de las medidas; y el tercero con la carencia de información acerca de la
fiabilidad y validez de las medidas en general.
Salvo pocas excepciones, los estudios publicados no proporcionan una base lógica
para elegir una aproximación y determinar qué medidas podrían ser afectadas por esta y
por qué. Además, proveen información muy escasa sobre el contenido real de las
intervenciones. Por esto, la capacidad de generalizar muchos de los resultados y
replicar los procedimientos es casi nula. Las excepciones son algunos estudios que
utilizan tratamientos estandarizados aislados de otros tratamientos, por ejemplo, LSVT,
VFE, RVT o LMRVT y sus precursores. Por otro lado, los estudios comparativos cruzados
son difíciles de ejecutar por la falta de medidas consistentes.
Algunos estudios han utilizado medidas en la calidad de vida relacionadas con la voz,
incluyendo, variablemente o no, medidas perceptuales del clínico (datos acústicos y
aerodinámicos) y del participante (autoevaluación). Por otro lado, casi ninguno de los
estudios proporciona información sobre los efectos de las intervenciones en el estado
de salud de la laringe y cuando se trata de analizar el cegamiento del estudio,
generalmente se ha ignorado o no se informa al respecto. En la actualidad,
prácticamente es imposible realizar cualquier metaanálisis de los datos de los estudios.
Por lo general, la literatura carece de datos de seguimiento a largo plazo sobre los
efectos de los tratamientos en este órgano.
En consecuencia, el comentario final de Ziegler et al. (2010) debe considerarse en
futuras investigaciones sobre el tratamiento de los problemas de voz: en general, parece
ser buena idea seguir el diseño CONSORT u otro estándar aceptado de estudios e
informes. Entre los lineamientos que más han faltado en los estudios hasta ahora son: a)
una justificación y una descripción detallada de las intervenciones, b) el uso de un
corpus de medidas coherentes en todos los estudios para analizar la comparación
cruzada, c) la inclusión de medidas de la laringe para evaluar los efectos de las
intervenciones sobre la salud laringea, d) al menos el cegamiento simple de las
medidas, e) la fiabilidad y validez de las medidas y f) los datos de seguimiento a largo
plazo. Se espera que el cumplimiento de estos requisitos mejore la calidad y el análisis
de los datos sobre los tratamientos comportamentales para los problemas de voz y, en
consecuencia, los resultados del tratamiento en sí mismo.
Por su parte, Verdolini‒Marston et al. (1995) propusieron una serie de
consideraciones útiles en la planificación de futuros estudios. En primer lugar, la
terapia debe ser administrada a un número de sujetos mayor durante un periodo de
tiempo más largo para tener más datos y así evaluar mejor el tratamiento. A su vez,
trabajar con sujetos clínicos reales —en comparación con voluntarios pagados— puede
afectar los resultados. En segundo lugar, al ser más grandes los grupos de estudio, se
puede evaluar con mayor precisión la magnitud de los efectos de la terapia (variables
continuas) y no solo su probabilidad (variables dicotómicas). Las magnitudes no suelen
considerarse en el nivel apropiado de análisis, por lo que deberían incluirse en futuros
estudios a gran escala. En tercer lugar, es adecuado intentar establecer una distribución
equitativa de la severidad a través de los grupos experimentales. La falla en este intento
—debido a la deserción y pérdida de datos— conlleva utilizar estadísticas no
paramétricas de bajo poder en la evaluación de los datos. En ese sentido, los futuros
estudios deberán garantizar la igualdad de las distribuciones de severidad entre los
grupos, lo que se puede lograr más fácilmente con una gran cantidad de sujetos.
En cuarto lugar, si el compromiso es un foco de futuros estudios, deberían utilizarse
los métodos de escala más completos para verificar los niveles de compromiso en los
reportes del sujeto. Si se emplean cuestionarios para evaluar los factores que pueden
afectar el compromiso, se deberá considerar el problema de los datos sesgados en el
cuestionario. En quinto lugar, otros factores del diseño experimental se consideran
positivos y deben mantenerse en futuros estudios. Estos factores incluyen una
descripción a priori de la terapia, la formación preexperimental de los terapeutas, el
trabajo de más de un terapeuta para controlar los efectos de la terapia, el intento de
controlar los niveles de severidad de los sujetos en todos los grupos experimentales y
el intento de comprobar los comportamientos extraclínicos (fumar, gritar, consumir
alcohol y cafeína) que podrían afectar el resultado del tratamiento. De hecho, el
impacto de estas prácticas generales de higiene vocal también puede ser evaluado
específicamente.
De todas maneras, los avances investigativos posteriores al 2010 deben ser
reconocidos como investigaciones con niveles de evidencia más complejos cuyos
orígenes se sustentan en logros anteriores, en un intento por encontrar evidencia que
apoye los beneficios de la terapia vocal. Como no toda evidencia es creada de la
misma forma, debe considerarse una escala del nivel de evidencia. Así, los diferentes
tipos de evidencia han sido caracterizados en un continuum basado en la metodología
usada para generar la evidencia. Otras escalas de niveles de evidencia incluyen el uso
de revisiones sistemáticas y metaanálisis. Dicho esto, en los estudios sobre la terapia
vocal revisados se identifican dos revisiones sistemáticas (Speyer, 2008; Ruotsalainen,
Sellman, Lehto y Verbeek, 2008). De esa forma, los 131 artículos restantes se han
distribuido según el tipo de estudio (figura 4.1) y según la aproximación estudiada
(figura 4.2).

Figura 4.1. Tipo de estudio de los artículos investigativos.


Fuente: elaboración propia.
Figura 4.2. Aproximaciones estudiadas en los artículos investigativos.
Fuente: elaboración propia.

4.2. Indicadores de eficacia

La demostración de los resultados del desempeño en un modelo de calidad tiene que


ver con los componentes del suministro de servicios, es decir, la capacidad de
suministro (estructura), la provisión real (proceso) y el producto final (resultado).
Aunque ya se han expuesto algunos aspectos de las técnicas de la terapia vocal
relacionados con los dos primeros componentes 1, a continuación se expondrán los
indicadores relacionados específicamente con el resultado en la salud vocal.

Resultado
La voz no se puede medir con una sola escala o prueba, ya que es un fenómeno
multidimensional que requiere fortaleza física, entre otros factores. Para medir los
aspectos de la función vocal, se han desarrollado muchas técnicas e instrumentos
aerodinámicos, electromiográficos, perceptuales, acústicos, fonatorios y de impacto
sobre los problemas de voz autorreportados o reportados por familiares y conocidos.
Por lo anterior, deberían emplearse múltiples medidas de resultado para evaluar los
efectos del tratamiento en al menos seis aspectos: resultados funcionales y de impacto
en la calidad de vida, perceptuales, acústicos, aerodinámicos, fisiológicos y
comunicativos.
La revisión de Ruotsalainen et al. (2008) distingue las medidas de autorreporte de la
discapacidad vocal, los síntomas de la voz y la calidad de la voz como indicadores
primarios de efectividad de la intervención. Esta aproximación suele emplearse dada la
variabilidad entre los individuos y la forma en que se percibe la afectación ocasionada
por el disturbio de la voz en la comunicación o la capacidad para cumplir requisitos
sociales y profesionales. Como resultados secundarios se identifican: a) mediciones
instrumentales (niveles aerodinámicos, estroboscópicos, acústicos), b) apreciaciones
de los observadores y análisis perceptual de la cualidad/calidad de la voz (GRBAS), y c)
medidas multidimensionales combinadas (DSI).
Debe comprenderse la falta de una fuerte asociación entre las medidas basadas en el
sujeto —sobre la severidad del desorden vocal y la discapacidad funcional— y las
medidas acústicas, sobre todo en los casos de disfonía leve (Wheeler, Gollins y
Sapienza, 2006). Esta falta de correlación refleja, por lo general, la diferencia en la
naturaleza de las medidas: las medidas acústicas sirven como una evaluación de la
deficiencia, mientras que las medidas del nivel de discapacidad —como el VHI— son
sensibles a las restricciones de la voz en la participación y la actividad, lo que refleja
las experiencias de la persona que tiene el desorden (Sauder et al., 2010).
Las herramientas e instrumentos que se han empleado en las investigaciones para
medir los beneficios de las técnicas terapéuticas comportamentales para la función de
la voz se describen a continuación, según el indicador genérico al que pertenecen y en
el orden de preferencia de los investigadores (figura 4.3). Solo se enunciarán las
características, aplicaciones y medidas de cada herramienta que los investigadores
contemplaron al efectuar sus respectivos estudios. No se mencionarán otros beneficios
de medición que se puedan obtener con estas herramientas porque los investigadores no
dieron cuenta de ellos en sus reportes. Las siglas y categorías de las herramientas se
referirán en inglés, según se identifican y reconocen en la literatura científica
internacional.

Protocolo estándar para evaluar la voz

Se basa en la recolección de medidas específicas como el tiempo máximo de fonación


(MPT), el indicador S/Z, el tono habitual y la intensidad conversacional, obtenidas de
una muestra representativa del habla del examinado, a través de tareas de habla
espontánea, habla automática o lecturas cortas.

Herramientas funcionales autorreportadas

Escalas visuales analógicas

También conocidas como VAS por su sigla en inglés, tienen su origen en la psicología y
son instrumentos de tipo gráfico que utilizan representaciones visuales concretas para
valorar un estado o aspecto en particular. Una VAS se compone de una línea vertical u
horizontal sobre la cual el sujeto evaluado o el clínico evaluador marcan el contínuum
del objetivo a determinar, sea este la cualidad/calidad vocal percibida o el
conocimiento sobre el cuidado vocal. Existen diversas escalas para determinar el
efecto de la voz en: la calidad de vida, el habla y la comunicación, los conocimientos
del cuidado vocal, la cualidad/calidad vocal y el movimiento de la cuerda vocal.

De calidad de vida: Speyer et al. (2004) emplearon tres escalas visuales analógicas
para cuantificar la severidad del desorden y la extensión de la deficiencia
experimentada por la persona evaluada. La primera escala se refiere a la severidad
general del desorden en términos del efecto en la producción vocal; la segunda, al
impacto psicosocial en una actividad ocupacional (si es relevante), y la tercera, al
impacto en actividades de la vida diaria. Un puntaje de 0 indica condiciones de voz
normal y un puntaje máximo de 100 indica deficiencia vocal extrema o discapacidad
severa.
Figura 4.3. Distribución de uso de herramientas e indicadores de eficacia en estudios sobre la terapia vocal (1990–
2013).
Fuente: elaboración propia.

Del habla y la comunicación: Aplicada por Fox y Boliek (2012) y respondida por los
padres de los participantes con base en la percepción del habla de su hijo la mayor
parte del tiempo. Esta escala obtuvo calificaciones de 10 variables relacionadas con la
voz (fuerte, nasal, ronca o áspera, monótona, entrecortada, tensa), el habla (locuciones
que otros puedan entender) y la comunicación oral (habla al jugar con otros niños,
comienza a hablar con otros niños, se frustra cuando habla). La escala requería que el
padre colocara una barra vertical transversal a una línea horizontal sólida (15.2 cm)
que representaba una calificación continua desde la presencia permanente de una
característica hasta la ausencia completa de la misma.

Del conocimiento del cuidado vocal: Como la desarrollada por Gillivan–Murphy et al.
(2006, apéndice 1), es una herramienta de cinco ítems que mide el conocimiento
corriente de un sujeto y la confianza en el cuidado de la voz, su producción y sus
ejercicios. Con este mismo enfoque, Pasa et al. (2007) aplicaron dos escalas en su
investigación, cada una de 100 mm que van desde «nunca» a «cada vez que uso mi
voz». La primera, para indicar con qué frecuencia se utilizan comportamientos vocales
negativos en el trabajo (cuestionario de patrones de uso vocal en el trabajo), y la
segunda, para identificar el grado en que cada participante experimenta síntomas
vocales asociados con malestares en la garganta, control de la respiración, tono,
volumen, cualidad/calidad vocal y proyección (cuestionario de capacidades vocales).

De la cualidad/calidad vocal: El uso de estas escalas se analiza en detalle en el


apartado de medidas de percepción de la cualidad/calidad vocal.

Del movimiento de la cuerda vocal: Esta escala se explica a profundidad en el


apartado de medidas fisiológicas.

Índice de discapacidad vocal

También conocido como VHI 2 por su sigla en inglés. Es un cuestionario desarrollado


por Jacobson et al. (1997) y validado psicométricamente con una fuerte consistencia
interna, fiabilidad y estabilidad test–retest, que indaga sobre los efectos psicosociales
de los desórdenes de voz. El cuestionario consta de 30 declaraciones sobre aspectos de
la voz en la vida diaria, distribuidas en partes iguales en tres subescalas: funcional,
física y emocional, y calificadas en cinco escalas: nunca (0), casi nunca (1), algunas
veces (2), casi siempre (3) y siempre (4). El VHI genera una puntuación total que va
desde 0 hasta 120, de manera que una mayor puntuación indica un mayor nivel de
discapacidad vocal. Las personas con un VHI de 18 o menos gozan de una «voz
saludable» (Nanjundeswaran et al., 2012, p.816e4). Este índice se utiliza con
frecuencia para medir la eficacia de las técnicas de un tratamiento específico, pero,
sobre todo, para medir resultados funcionales. Por ello, suele ser la herramienta más
empleada por investigadores y clínicos para medir los progresos en el rendimiento
vocal.
Calidad de vida relacionada con la voz

También conocida como V–RQOL por su sigla en inglés, esta escala evalúa la percepción
del sujeto sobre el impacto del problema de voz en su calidad de vida. El V–RQOL es un
instrumento validado para medir la percepción del deterioro vocal. Los puntajes se
determinan de acuerdo con la descripción inicial de Hogikyan y Sehuraman (1999) y
oscilan entre un mínimo de 0 (no hay calidad de vida vocal con insuficiencia máxima) a
un máximo de 100 (calidad de vida vocal total sin deterioro). Las puntuaciones se
estratifican de la siguiente manera: puntuaciones de 75–100, 50–75, 25–49 y 0–24
corresponden a una percepción de la disfonía leve, moderada, severa y profunda,
respectivamente (Hogikyan, Wodchis, Terrell, Bradford y Esclamado, 2000; Murry,
Medrado, Hogikyan y Aviv, 2004).

Medición del esfuerzo fonatorio

Se basa en un procedimiento descrito originalmente por Colton y Brown (1973) y


utilizado en los estudios de Verdolini‒Marston et al. (1995) y Ziegler (2010). Para la
medición, los evaluados califican el esfuerzo general percibido durante la fonación en
una escala de estimación de magnitud en la que 100 indica una «cantidad confortable de
esfuerzo durante la fonación», 200 indica el «doble del esfuerzo para ser confortable»
(es decir, «muy esforzado»), y 50 indica la «mitad del esfuerzo» (es decir, «muy
fácil»). Por su parte, Sauder et al. (2010) aplicaron una escala de esfuerzo fonatorio
con un rango de 0 a 3, en el que 0 equivale a «ningún esfuerzo», 1 indica «mínimo
esfuerzo», 2 señala «esfuerzo moderado» y 3 marca «esfuerzo máximo».

Cuestionario de interpretación vocal

También denominado VPQ por su sigla en inglés, fue diseñado para permitir al sujeto
evaluar variaciones de su interpretación vocal y determinar la gravedad de estas con
respecto al uso normal de su voz (Carding y Horsley, 1992). Esta es una medida válida
y fiable (Deary, Webb, MacKenzie, Wilson y Carding, 2004) que se ha utilizado en
diversos estudios sobre la efectividad vocal (Carding et al., 1999; MacKenzie et al.,
2001). El VPQ consta de 12 preguntas de respuesta múltiple —cada una con cinco
opciones de selección— sobre las cuales se calcula el puntaje total asignando un valor
numérico a cada respuesta, por ejemplo, 1 a cada respuesta A, 2 a cada respuesta B,
etc. Una puntuación total de 12 equivale a «función normal» y de 60 a «disfunción
severa» o «muy limitada». De ese modo, a mayor puntuación (máximo 60), mayor es el
impacto del problema de voz en la calidad de vida del sujeto.
Perfil de actividad y participación vocal

Es un cuestionario autoadministrado y conformado por 28 ítems que analizan el impacto


de los desórdenes de voz en el funcionamiento diario de una persona (Ma y Yiu, 2001).
A los participantes se les pide ubicar sus respuestas en una escala de 10 puntos en la
que 1 indica «nunca» y 10 indica «con frecuencia». El VAPP —por su sigla en inglés—
contiene cinco secciones: la percepción subjetiva de la gravedad del desorden de voz
con una pregunta, la sección de trabajo (WS) con cuatro preguntas, la sección de
comunicación diaria (DS) con doce preguntas, la sección de comunicación social (SS)
con cuatro preguntas y la sección de la emoción (ES) con siete preguntas. En las
secciones WS, DS y SS se incluyen diez situaciones de limitación de la actividad y
restricción de la participación.

Escala de severidad de los síntomas vocales

El Voi SS —por su sigla en inglés— es un inventario de 30 ítems de síntomas vocales


con tres dominios de contenido (dificultades de comunicación, síntomas faríngeos y
ansiedad psicosocial) y un puntaje total (Deary, Wilson, Carding y Mackenzie, 2003;
Wilson et al., 2004). Esta escala analiza los problemas experimentados y planteados
por los sujetos mismos bajo los criterios de la Organización Mundial de la Salud
(OMS).

Cuestionario sobre síntomas vocales

Fue diseñado para proporcionar información sobre la prevalencia de siete síntomas


vocales: carraspeo o tos, ronquera, cansancio o tensión en la voz, quiebres de voz,
sensación de dolor o un cuerpo extraño en la garganta, dificultades para ser oído y
pérdida de la voz (Simberg et al., 2006, tabla 6). Se pide a los evaluados reportar si
estos síntomas vocales ocurrieron durante el último año y con qué frecuencia, según la
siguiente escala: 1 = todos los días o casi todos los días, 2 = semanal o la mayoría de
las semanas, 3 = mensual o la mayoría de los meses, 4 = con menos frecuencia, 5 = solo
síntomas periódicos, 6 = sin síntomas.
Por su parte, Leppänen, Ilomäki y Laukkanen (2010, anexo 1) elaboraron para su
investigación un cuestionario sobre la prevalencia de síntomas de fatiga vocal que
incluían tensión excesiva, ronquera sin un resfriado, secreción de moco o masas en la
garganta, irritación, cansancio o dolor en la garganta, pérdida de la voz sin un resfriado,
quiebre de la voz, y fatiga vocal causante de problemas en la vida social después de un
día de trabajo. La escala oscilaba entre 1 y 8, que equivalían a «casi nunca o menos de
una vez al año» y «muy a menudo o por lo menos una vez a la semana».
Escala de incomodidad del tracto vocal

También conocida como VDT por su sigla en inglés, esta escala ha sido desarrollada
como una herramienta para cuantificar la gravedad y la frecuencia de las molestias en la
garganta de un individuo mediante el uso de descriptores cualitativos. Se trata de una
escala autocalificada, es decir, diligenciada por el sujeto evaluado. Su última versión
(Mathieson et al., 2009) permite la autoevaluación por separado de la frecuencia y la
severidad de ocho síntomas: quemazón, tensión, resequedad, dolor, cosquilleo,
ulceración, irritabilidad y cuerpo extraño. La escala emplea un rango de 0 a 6, donde 0
equivale a «nunca/ninguna», 2 a «algunas veces/leve», 4 a «frecuentemente/moderado»,
y 6 a «siempre/severo».

Cuestionario conocimiento de la voz

En el estudio de Pasa et al. (2007), se utiliza este cuestionario para medir el


conocimiento sobre el mecanismo vocal. Se compone de 11 preguntas de selección
múltiple para estimar el conocimiento sobre la anatomía y la fisiología del mecanismo
vocal, 12 preguntas de falso o verdadero para determinar la comprensión de las causas
de los problemas de voz y 10 preguntas de falso o verdadero para evaluar la
comprensión de los factores que pueden impedir que un individuo desarrolle problemas
de voz.

Cuestionario de salud SF–36

Fue desarrollado para indicar el estado de salud de poblaciones particulares, ayudar


con la planificación de servicios y medir los beneficios a la salud de las intervenciones
clínicas y sociales. El manual del usuario SF–36 recomienda que las puntuaciones se
basen en datos normativos culturalmente específicos (NBS) en cada una de las ocho
dimensiones de la escala (Jenkinson, Coulter y Wright, 1993).

Herramientas de percepción auditiva o psicoacústica

Escalas de severidad vocal

Son utilizadas por jueces expertos para clasificar la gravedad de cada muestra de voz
en una escala de intervalo de cinco categorías ordinales (Verdolini‒Marston et al.,
1995; Chen, 2007): 1 = voz saludable, 2 = voz levemente deficiente, 3 = voz
moderadamente deficiente, 4 = voz moderada a severamente deficiente, 5 = voz
severamente deficiente.
También utiliza siete puntos equidistantes en los que 0 indica «tono de voz normal» y
6 señala «trastorno de voz severo/afonía» (Roy et al., 1997). Los puntos intermedios de
la escala son 1 (leve), 3 (moderado) y 5 (severo). Las definiciones para distinguir cada
nivel de severidad se encuentran en el formulario de respuesta computarizado (Awan y
Roy, 2009). Con el mismo propósito, se emplea una escala más sencilla, pero en este
caso el participante asigna la calificación. Para clasificar la severidad del problema de
voz, esta escala propone solo cuatro categorías: 0 equivale a normal, 1 a leve, 2 a
moderado, y 3 a severo (Roy et al., 2002; Roy et al., 2003; Sauder et al., 2010).

Escala GRBAS

Fue propuesta por el Comité de Pruebas de la Función Fonatoria de la Sociedad


Japonesa de Logopedia y Foniatría (Hirano, 1981). Se trata de un análisis mínimo de la
cualidad/calidad vocal que usa cuatro puntos de calificación —de 0 (normal) a 3
(extremo)— para cada uno de los cinco parámetros contemplados. Cada parámetro
representa una dimensión de la fonación: G (grado) representa la severidad global de la
anormalidad vocal, R la ronquera o aspereza; B (breathiness), la cualidad/calidad de
escape de aire, A la astenia o debilidad, y S la tensión o esfuerzo. Muchos autores
consideran la GRBAS como la escala de percepción auditiva actual más fiable como
medida de resultado (De Bodt, Wuyts, Van de Heyning y Croux, 1997).

Clasificación auditiva de la cualidad/calidad vocal

Es una escala empleada por Carding (1998) que utiliza 7 puntos —donde 1 corresponde
a «normal» y 7 a «muy severo»— y es calificada por jueces expertos.

Escala de características vocales

Propuesta por Amir et al. (2005), esta escala evalúa la cualidad/calidad vocal en seis
niveles, uno para cada característica vocal: tono, ronquera, tensión, aspiración,
resonancia y estabilidad. Cada nivel contiene siete marcas X; el extremo izquierdo de la
escala se marca como normal y el extremo derecho como severo. Se pide a los jueces
entrenados que escuchen cada característica vocal y luego dibujen un círculo sobre la X
que corresponda con la evaluación de la característica vocal escuchada.
Chen (2007) empleó la misma escala de calificación, pero con diferentes parámetros:
cualidad/calidad con escape de aire, ronquera, tensión, monotonía, resonancia, duro
ataque glotal y fricción glótica. Por otra parte, Gelfer y Van Dong (2013)
implementaron tres herramientas en el análisis de características vocales transgénero:
una escala de agrado, una escala de masculinidad y una escala de feminidad. Cada
escala tenía intervalos iguales de siete puntos: 1 corresponde a «muy agradable» para
la primera escala, «muy masculino» para la segunda escala y «muy femenino» para la
tercera escala, y 7 corresponde a «nada agradable», «para nada masculino» o «para
nada femenino», respectivamente.

Escala visual analógica de la cualidad/calidad vocal

Propuesta por Holmberg et al. (2001), se respondió por evaluados y evaluadores


mediante marcas en formularios de papel milimetrado. Los extremos de las escalas se
marcaron desde «nada/nunca» hasta «mucho/con frecuencia». Las cualidades/calidades
analizadas incluyeron presión/hiperfunción, cualidad/calidad con escape de aire,
afonía, falta de sonoridad, inestabilidad, voz chillona, ronquera, fricción
glotal/crujiente, voz chirriante y disfonía general. Por su parte, diversos estudios (Roy y
Ferguson, 2001; Roy y Hendarto, 2005; Royet al., 2009; Dromey, Nissen, Roy y
Merrill, 2008; Sauder et al., 2010) pidieron a oyentes expertos indicar la gravedad
global de cada muestra de habla a través de una marca en una escala visual analógica
de 13 cm o 10 cm —o con el movimiento del cursor en una pantalla que oscilaba de 0 a
100— para calificar como «voz normal» en el extremo izquierdo y «voz profundamente
anormal» en el extremo derecho.
Simberg et al. (2006) también solicitaron a oyentes expertos que usaran la escala
visual analógica para determinar la fricción glotal y el tono, y Sauder et al. (2010) lo
hicieron para determinar la cualidad/calidad con escape de aire de la voz y la tensión.
En una escala de 100 mm de largo se evaluó la fricción glotal con extremos marcados
como «ningún grado» y «alto grado», la cualidad/calidad con escape de aire se calificó
en un rango desde «sin escape de aire» a «con marcado escape de aire», y la tensión se
midió en un rango entre «sin tensión» y «profundamente tensa». Para el tono se utilizó
una escala de 200 mm de largo con el centro marcado como «normal» y los extremos
como «muy bajo» y «demasiado alto». Otro instrumento para la evaluación perceptual
por parte de oyentes expertos fue el usado por Speyer et al. (2004), que consistió de
tres escalas analógicas visuales que representan el grado —la impresión global de la
desviación de la cualidad/calidad vocal—, la cualidad/calidad con escape de aire y la
aspereza en la forma propuesta por Hirano (1981). Sus puntuaciones oscilaron entre
0 mm y 100 mm, lo que representa un tono de voz normal en un extremo de la escala y
un trastorno extremadamente grave o cualidad/calidad vocal desviada en el otro
extremo.
En el estudio de Spielman et al. (2007), con la ayuda de una escala visual analógica
desde -50 (mucho peor) hasta 50 (mucho mejor), los oyentes decidieron si una segunda
muestra sonaba mejor que la primera (entre 1 y 50), lo mismo que la primera (0), o
peor que la primera (entre -50 y -1). Solo en el estudio de Baumgartner et al. (2001), la
escala visual analógica se basó en una línea indiferenciada en un computador en la cual
los oyentes debían hacer clic sobre el punto en el que percibían el grado de
cualidad/calidad vocal con escape de aire o ronquera. Para cada calificación, el
computador calculó automáticamente un porcentaje en función del lugar donde se marcó
la línea de la escala.

Índice de severidad de la disfonía

Está diseñado para establecer un correlato objetivo y cuantitativo de la


cualidad/calidad vocal percibida (Wuyts et al., 2000). El DSI (por su sigla en inglés) se
basa en la combinación ponderada del tiempo máximo de fonación (MPT), la frecuencia
más alta (Fo–ligh), la intensidad más baja (I–low) y el jitter. El DSI se construye
mediante la fórmula DSI = 0.13 x MPT + 0.0053 x Fo–High - 0.26 x I–Low - 1.18 x Jitter
(%) + 12.4. Para las voces perceptivamente normales equivale a +5 (100 %) y para las
voces disfónicas severas, a -5 (0 %). Así, el índice más negativo del sujeto, el peor, es
su cualidad/calidad vocal (Van Lierde et al., 2010).

Consenso perceptual–auditivo de la voz

También llamado CAPE–V por su sigla en inglés, fue desarrollado en una reunión de
consenso patrocinada por la División 3 (Voz y desórdenes de voz) de la American
Speech–Language–Hearing Association (ASHA) y el Departamento de Ciencias de la
Comunicación y sus Desórdenes de la Universidad de Pittsburgh (2002), con el
objetivo de describir la gravedad de los atributos de un problema de voz percibidos
auditivamente (Kempster et al., 2009, apéndice C). El CAPE–V contempla los atributos
vocales perceptuales sobresalientes: severidad general, ronquera, cualidad/calidad con
escape de aire, tensión, tono y sonoridad. El CAPE–V muestra cada atributo acompañado
de una línea de 100 mm que forma una escala analógica visual (VAS). El clínico indica
en esta escala el grado de desviación percibida para cada parámetro. A la derecha de
cada escala se encuentran la letra C (coherente) y la letra I (intermitente), que
representan la presencia de un atributo particular de la voz. Esta herramienta también
incluye las calificaciones ordinales de «leve», «moderada» y «severa» impresas bajo
la línea de medición como indicadores de gravedad suplementarios. La persona realiza
tres tareas vocales específicas: a) mantener las vocales /a/ e /i/ tres veces cada una, b)
leer seis frases específicas con diferentes contextos fonéticos y c) conversar
naturalmente respondiendo preguntas estándar.

Análisis del perfil vocal

El VPA (por su sigla en inglés) fue desarrollado por un fonetista y un terapeuta del habla
y lenguaje (Laver, Wirz, Mackenzie y Hiller, 1981) como un sistema descriptivo que
permite a un oyente entrenado describir y analizar la cualidad/calidad vocal de una
conversación o una lectura. Cada característica de la voz se compara con una línea de
base definida como «neutral» y una opinión para cada parámetro. El evaluador juzga
sobre una escala de cuatro puntos la cualidad/calidad con escape de aire,
aspereza/ronquera, tensión, inestabilidad, astenia, afonía, falsete, fricción vocal,
diplofonía y temblor.

Perfil vocal perceptual

Evalúa los parámetros de cualidad/calidad con escape de aire, ronquera y tensión en


una escala de seis puntos que van desde «normal» a «severo» (Tay et al., 2012).

Herramientas acústicas

Laboratorio computarizado de habla

Desarrollado por Kay Elemetrics (en la actualidad Kay Pentax), es un paquete robusto
de procesamiento de la señal acústica que permite la toma y análisis de los datos
acústicos de la voz y el habla. El CSL (por su sigla en inglés) es complementado con
cerca de 20 tipos de software que evalúan una variedad de desórdenes de
comunicación, entre ellos los relacionados con la voz, el aspecto motor del habla, la
fluidez y la articulación. Las medidas que más suelen registrarse con este equipo son el
tiempo máximo de fonación o MPT (en segundos), la frecuencia fundamental media
(Hertz), el jitter (%), la frecuencia fundamental más baja (Hertz), la frecuencia
fundamental más alta (Hertz), el shimmer (decibelios) y la relación de ruido a
armónico.

Programa multidimensional de voz

También llamado MDVP (por su sigla en inglés) es un programa del Laboratorio


Computarizado del Habla (CSL–Kay Elemetrics) para evaluar de forma acústica
cuantitativa la cualidad/calidad vocal y analizar más de 22 parámetros en una única
vocalización. La muestra de una vocal prolongada —en especial, la segunda mitad de la
vocal prolongada— es digitalizada y analizada por el programa. Los parámetros
acústicos de esta herramienta que suelen emplearse más son las perturbaciones de la
frecuencia (jitter), las perturbaciones de la amplitud (shimmer) y el NHR. El jitter
representa la variabilidad relativa de periodo a periodo; el shimmer corresponde a la
variabilidad relativa de la amplitud de pico a pico, y el NHR es una relación media de
la energía de los componentes inarmónicos en el rango 1500–4500 Hz con la energía de
los componentes armónicos de la señal analizada.

Praat

Es un software libre desarrollado por Paul Boersma y David Weenink de la


Universidad de Amsterdam para el análisis de la fonética del habla. Ofrece una amplia
gama de procedimientos estandarizados y no estandarizados, incluyendo análisis
espectrográficos, síntesis articulatoria y redes neurales.

Perfil del rango vocal o fonetograma

Desarrollado por KayPENTAX y Laryngograph Ltd., el VRP (por su sigla en inglés)


evalúa los rangos tonales en semitonos —desde la frecuencia más alta hasta la más baja
—y los rangos de intensidad —desde la sonoridad más fuerte hasta la más suave—. Las
personas deben producir una /a/ sostenida lo más fuerte y suave posible en las
frecuencias seleccionadas y varios glissandi o extensiones tonales.

Visi–Pitch

Al igual que sus homólogos Multi–Speech acoustic analysis program y el Real–Time


Pitch, el VP es un software del laboratorio computarizado del habla (CSL–KayPENTAX),
que provee una amplia gama de medidas pertinentes con la voz y el habla, en especial
aquellas relacionadas con la frecuencia fundamental, la amplitud y las mediciones
espectrales.

Herramientas aerodinámicas

Nivel de presión sonora

También conocido como SPL por su sigla en inglés, es el correlato acústico de la


sonoridad vocal y se mide con el uso de un sonómetro o un programa de extracción
durante actividades de repetición de frases, lectura, descripción de láminas y monólogo
espontáneo.

Sistema fonatorio aerodinámico

Desarrollado por KayP EN TA Xpara medir el flujo de aire, la presión sonora y otros
parámetros relacionados con el habla y la producción de la voz, el PAS (en inglés)
calcula la tasa promedio de flujo fonatorio, el nivel de presión acústica, la frecuencia
fundamental, la capacidad vital, la resistencia glótica, la presión subglótica (derivada)
y las medidas de eficiencia fonatoria. Al igual que el Aerophone II (su antecesor), el
PAS emplea una máscara con sensores de presión de flujo y un micrófono firmemente
ajustados a la boca y nariz del sujeto, mientras este produce tareas
fonatorias/aerodinámicas típicas como, por ejemplo, la producción del estímulo /pi/
cinco veces en sucesión. Con el mismo propósito, el neumotacógrafo emplea una
máscara acoplada a transductores de presión para detectar flujo de aire de banda ancha
y señales de presión de aire durante tareas de habla (Gorman et al., 2008).

Analizador de la función fonatoria de Nagashima

Fue desarrollado por Nagashima Medical Instruments y evalúa la frecuencia, la


fonación, la tasa de la columna de aire, la intensidad y el volumen del aire espirado.

Herramientas fisiológicas

Videoestroboscopia

Mediante un patrón de vibración permite visualizar partes secuenciales de eventos


cíclicos que ocurren rápido como si ocurrieran de manera lenta. No solo posibilita una
observación detallada de la anatomía laríngea, sino también de la fisiología fonatoria
del sujeto. Muestra una imagen inmediata de la presencia o ausencia de patología, la
naturaleza de la vibración cordal y la grabación permanente de la actividad laríngea.
Speyer et al. (2002) analizaron tres imágenes con el propósito de medir objetivamente
los efectos del tratamiento: una durante la posición de reposo de los pliegues vocales
para obtener una imagen clara de cualquier lesión presente y otras dos durante la
vibración de las cuerdas vocales con luz estroboscópica. La segunda imagen se eligió
en el momento de máxima apertura de las cuerdas vocales y la tercera, en el momento
de cierre máximo. El momento de máxima apertura durante la vibración se considera
una medida global de la elasticidad de las cuerdas vocales, mientras que el momento de
cierre máximo podría revelar insuficiencia glótica, que puede relacionarse con una
cualidad/calidad vocal con escape de aire.
Con la ayuda de software específicos (p. ej., Scion Image, Scion Corporation), se
pueden medir las distancias y áreas de superficie en las imágenes digitalizadas. Las
doce variables evaluadas en los exámenes laringoestroboscópicos incluyen estos tres
parámetros: configuración glotal durante la fonación, incompetencia glótica y función
supraglótica. Mediante las imágenes fijas, se pueden valorar tres parámetros con ayuda
del formato para la evaluación estroboscópica (SERF): el tamaño de la separación
glotal, el patrón de cierre de la glotis y la hiperfunción supraglótica (mediolateral y
anteroposterior) (Poburka, 1999). El tamaño de la brecha glotal se califica con 0
(ningún espacio), 1 (brecha leve), 2 (brecha moderada) y 3 (brecha grave).

Escalas visuales analógicas para el movimiento de la cuerda vocal

Fueron usadas por Speyer et al. (2004) para calificar seis parámetros a partir de las
imágenes estroboscópicas: grado de insuficiencia del cierre de las cuerdas vocales,
amplitud máxima de vibración de las cuerdas vocales, calidad de la onda mucosa,
regularidad del patrón vibratorio de las cuerdas vocales aprovechando el movimiento
videoestroboscópico lento, presencia de una lesión y su impacto en la vibración de la
cuerda vocal. Por su parte, Verdolini et al. (1998) solicitaron que jueces expertos
evaluaran el movimiento medial de los pliegues vocales en una escala ordinal, en la
cual -5 indicaba «hipoaducción extrema», 0 indicaba una aducción «neutral» y +5
indicaba «hiperaducción extrema». Se les permitió el uso de valores intermedios no
enteros.

Electrolaringógrafo ‒ electroglotógrafo

Registra actividad eléctrica para generar un gráfico denominado glotograma, que


corresponde a los acontecimientos de cierre y apertura de la glotis. Los electrodos de
superficie se colocan en el cuello del sujeto a nivel de la laringe y se le solicita al
sujeto prolongar la vocal /i/. Los trazos se califican en una escala de 0 a 5, donde 0
representa la normalidad y 5 representa un rastro laríngeo (Lx) muy anormal. La
calificación es, por tanto, una impresión cualitativa total de cómo se compara el trazo
obtenido con la forma de onda ideal (Carding et al., 1999).

Endoscopia laríngea

Se emplea para observar las estructuras de la laringe con un endoscopio flexible o


rígido, mientras que se escucha la producción vocal del sujeto. En el estudio de
Verdolini‒Marston et al. (1995), se solicitó a los examinadores calificar cada imagen
en una escala ordinal de 5 puntos: 1 para «cuerdas vocales saludables», 2 para
«nódulos, pólipos o relacionados leves» (p. ej., eritema), 3 para «moderados», 4 para
«moderadamente severo» y 5 para «nódulos, pólipos o relacionados severos».

Laringoscopia indirecta

Este examen se efectúa con espejo (rinoscopia anterior y posterior) para inspeccionar
la faringe en busca de signos de infección. Los signos de eritema y edema en los
pliegues vocales y en la hipofaringe se califican por separado en una escala de cuatro
puntos: 0 = no, 1 = leve, 2 = moderado y 3 = abundante. Los valores de 0 a 1 se
interpretan como «normales». Si el eritema y el edema obtienen 2 o 3, el estado se
define como «laringitis crónica». También se registra la presencia de nódulos vocales,
pólipos y cambios de menor importancia, tales como signos de inflamación entre los
dos tercios anteriores de las cuerdas vocales.

Imágenes digitales de alta velocidad

Las HSDI (por su sigla en inglés) utilizan un modelo de sistema de alta velocidad cuyas
imágenes se registran en 4 000 cuadros/seg con una duración máxima de 4 094
segundos y una resolución espacial de 5 123 256 píxeles. Se hacen grabaciones de
fonación sostenida de la vocal /i/ en tono y volumen habitual y se asignan tareas
diadococinéticas de repetir monosílabos cuatro veces con respiraciones cortas entre
sílabas. Con el uso de un software de procesamiento de imagen, se derivan del
movimiento vibratorio las características espacio–temporales del inicio de la voz, el
cociente de apertura (duración del ciclo en que las cuerdas vocales permanecen
abiertas dividida entre la duración de todo el ciclo), la amplitud máxima, el cociente de
velocidad (duración del movimiento lateral dividida entre la duración del movimiento
medial) y otras medidas relacionadas.

Otras herramientas comunicativas

Escala de aptitud comunicativa

Desarrollada por Franken, Van Bezooijen y Boves (1997) para sujetos con tartamudez y
adaptada por Van der Torn, Verdonck–de Leeuw, Kuik y Mahieu (2002), es una escala
de 10 puntos para calificar muestras de voz en tres situaciones de habla diferentes y
cuya puntuación es asignada por oyentes no entrenados. Las situaciones de habla deben
tener baja exigencia (hablar de acontecimientos cotidianos con un amigo), exigencia
media (pedir orientación sobre una dirección a un transeúnte) y exigencia alta (dar una
conferencia). Los evaluadores asignan una calificación en un rango que oscila entre 1
(extremamente pobre) y 10 (excelente). Con el mismo propósito de evaluar la aptitud
comunicativa, Wenke et al. (2008) aplicaron un cuestionario de opción múltiple
mediante el cual el participante clasificaba cinco aspectos de su comunicación
respondiendo a preguntas como: ¿con qué frecuencia su habla es un murmullo?, ¿qué tan
temblorosa o ronca es la voz?, ¿qué tan bien le entiende la gente cuando habla?, ¿con
qué frecuencia participa en conversaciones con personas desconocidas?, y ¿con qué
frecuencia inicia una conversación con otras personas? Para responder estas preguntas,
el participante debe elegir uno de los cinco estados que mejor representen su habla:
siempre, por lo general, a veces, casi nunca, nunca.
Se sugirió aplicar un cuestionario similar a los pares comunicativos del participante
para complementar el resultado. Dicho cuestionario debe evaluar los mismos cinco
aspectos de las habilidades conversacionales cotidianas del participante en una escala
de 1 a 7, en la que 7 indica «muy buena capacidad» y 1 indica «muy baja capacidad».
Las preguntas incluyen: ¿qué tan fácil es entenderle al hablante?, ¿con qué frecuencia
usted le solicita al hablante que repita?, ¿con qué frecuencia el hablante inicia la
conversación con usted?, ¿con qué frecuencia el hablante inicia una conversación con
una persona desconocida?, y, en general, ¿cómo calificaría el habla y la voz del
hablante?

Área del espacio vocálico

Es un índice acústico de uso común en la investigación clínica para evaluar


indirectamente la normalidad de la articulación de vocales. El VSA (sigla en inglés) se
construye típicamente sobre un espacio cuyos lados son las escalas del primer formante
F1 y del segundo formante F2. Sobre ese espacio se marcan los puntos F1 y F2 de cada
vocal cardinal /i/, /u/ y /a/ (triángulo vocálico) y se toman las distancias euclidianas
entre estas o entre las vocales de las esquinas /i/, /u/, /a/ y /æ/ (cuadrilátero VSA o
QVSA) en el plano F1–F2. En varios estudios existe una correlación positiva entre el
VSA y la inteligibilidad del habla reportada (Sapir et al., 2010; Roy et al., 2009).

Índice de articulación vocálico

También llamado VAI por su sigla en inglés, es una nueva medida acústica de
producción de formantes vocálicos, diseñada para minimizar los efectos de la
variabilidad interlocutor 3 y maximizar la sensibilidad a la centralización de los
formantes. Se expresa mediante la fórmula (F2i + F1a) / (F2u + F2a + F1i + F1u),
donde F1i es la primera frecuencia del formante de la vocal /i/, F2i es la segunda
frecuencia del formante y así sucesivamente. Un aumento de VAI de pre a postratamiento
sugeriría menos centralización vocal y, teóricamente, una mejor articulación vocal.

Valoración perceptual de la precisión articulatoria y la entonación

Empleada en el estudio de Sapir et al. (2003), requiere que un oyente compare dos
segmentos e indique si la primera o la segunda muestra de un par suena mejor o si las
dos muestras son iguales sobre el parámetro que se esté juzgando, ya sea la entonación
o la precisión articulatoria.

Índices de inteligibilidad del habla


Sapir et al. (2003) emplearon tres índices de inteligibilidad del habla: el porcentaje de
palabras inteligibles (PIW) en ambiente ruidoso, la facilidad de inteligibilidad (IE) —
que se mide mediante una escala de calificación donde 1 equivale a «fácil de entender»
y 5 a «difícil de entender»— y la relación entre estos dos índices (PIW/IE).

Evaluación de la inteligibilidad del habla disártrica

Conocida como ASSIDS por su sigla en inglés, requiere que cada participante lea y repita
después del examinador 50 palabras sueltas y 22 frases seleccionadas de manera
aleatoria (Yorkston y Beukelman, 1984). Las medidas obtenidas a partir de estas
muestras incluyen el porcentaje de inteligibilidad de la palabra, el porcentaje de
inteligibilidad de la frase, el número de palabras por minuto (WPM) y un índice de
eficiencia comunicativa (CER).

Técnica de evaluación perceptual para la estimación de magnitudes directas

Denominada también DME, se usa para evaluar perceptualmente la inteligibilidad, la


sonoridad y la precisión articulatoria del habla. Cada estándar tiene un valor numérico
asignado de 100 sobre el que los oyentes expertos asignan un valor para calificar la
muestra en comparación con el estándar (Sitler, 1981; Weismer y Laures, 2002). Una
calificación de 50 en las variables de nivel de sonoridad y variabilidad —variabilidad
del tono, inteligibilidad del habla en general durante la conversación y precisión global
articulatoria— sugiere que la muestra es solo la mitad de clara que el estándar,
mientras que una valoración de 200 indica que la muestra es dos veces más clara que el
estándar. Sin embargo, para las variables de ronquera y escape de aire, una muestra
inferior a 100 representa una mejora en la cualidad/calidad.

Escala de suficiencia de Minnesota

Evalúa el impacto del tratamiento sobre la comunicación en el lugar de trabajo al


sondear la impresión del habla del individuo y su efecto en su habilidad para
comunicarse, trabajar y socializar. La MSS (por su sigla en inglés) es un cuestionario de
28 ítems en cinco áreas: desempeño, conformidad, dependencia, ajuste personal y
satisfacción general, diligenciado por el empleador y el empleado. Se calculan los
puntajes brutos para las cinco categorías y se convierten en rangos percentiles según el
tipo de labor. Los puntajes clasificados por encima del percentil 75 se consideran «muy
satisfactorios», mientras que aquellos ubicados por debajo del percentil 25 se
consideran «insatisfactorios».
Índice de estabilidad espaciotemporal

Evalúa la estabilidad de los movimientos del habla mediante múltiples repeticiones de


una frase con manipulaciones de intensidad y ritmo. En palabras más sencillas, mide la
variabilidad espacial y temporal de secuencias de movimiento del labio inferior y la
mandíbula. El STI (por su sigla en inglés) revela el grado en que un conjunto de
trayectorias de movimientos producidos en varias repeticiones de un comportamiento
motor converge en una sola plantilla de movimiento después de una normalización
lineal (Smith, Goffman, Zelaznik, Ying y McGillem, 1995).

Índice de efectividad de modificación de la comunicación

También llamado CETI–M por su sigla en inglés, mide la efectividad de la comunicación


del participante mediante 10 preguntas sobre diferentes situaciones desde la
perspectiva de otras personas significativas (Ball, Beukelman y Pattee, 2004).

Herramientas de resultado del tratamiento

Medida de percepción de los sujetos sobre la terapia

Propuesta por Verdolini‒Marston et al. (1995, apéndice A), aplica un cuestionario que
se administra al finalizar el tratamiento. El cuestionario incluye 12 preguntas a las que
los participantes responden con puntuaciones ordinales de 1 (máxima respuesta
negativa) a 5 (máxima respuesta positiva). Por su parte, Pasa et al. (2007) aplicaron un
cuestionario que constaba de 13 afirmaciones para determinar la percepción de los
sujetos sobre la prestación y el cumplimiento del programa de intervención. Los
participantes respondieron en escalas de intervalo entre 0 (totalmente en desacuerdo) y
5 (totalmente de acuerdo) a declaraciones como «aprendí cosas que yo no sabía acerca
de mi voz» y «mi producción de voz se ha hecho más fácil después del entrenamiento
vocal». Este cuestionario incluyó además dos preguntas abiertas para describir en una o
dos frases qué fue lo mejor del entrenamiento que recibió y cómo podría haberse
mejorado el entrenamiento recibido. Con el mismo propósito, Nguyen y Kenny (2009)
aplicaron un cuestionario de 16 ítems en el que los participantes autoevaluaron sus
voces y calificaron el grado de mejoría de cada síntoma después del tratamiento
mediante una escala analógica visual de 5 puntos, en la que 1 indicaba «sin cambios» y
5 «volvió a la normalidad».
Por otro lado, el cuestionario de Tay et al. (2012) constaba de tres afirmaciones que
reflejaran la percepción sobre la eficacia del programa. Los participantes calificaron
sus respuestas en una escala de intervalos iguales de 0 (totalmente en desacuerdo) a 6
(totalmente de acuerdo), en la que 1 corresponde a «mi voz es más estable y suena más
clara después del entrenamiento», 2 a «seguiré utilizando las técnicas de entrenamiento
en el futuro», y 3 a «la capacitación en general ha ayudado a mejorar mi voz».
Asimismo, Nanjundeswaran et al. (2012, apéndices A y B) aplicaron en su estudio dos
cuestionarios de selección múltiple para sondear la satisfacción de los participantes.

Medida de resultado de la terapia

Es un indicador que compara los resultados de la terapia en personas con desórdenes


de voz (John, Enderby y Hughes, 2005). La TOM (por su sigla en inglés) es una medida
única con cuatro dimensiones: deficiencia (grado de severidad del desorden de voz),
discapacidad–actividad (grado de limitación en el uso de la voz para comunicarse),
restricción–participación (cantidad de desventaja para la participación social) y
bienestar del sujeto (efecto sobre las emociones/nivel de angustia). Cada dimensión
TOM tiene una escala de calificación ordinal de 11 puntos y cada escala tiene seis
enteros definidos por descriptores operacionales con puntos medios indefinidos, para
aumentar la sensibilidad de la medida. El desarrollo y las propiedades psicométricas
d e l TOM se han descrito en el Therapy Outcome Measures: Speech & Language
Pathology Technical Manual (Enderby y John, 1997), a través de diferentes Servicios
Nacionales de Salud del Reino Unido (NHS, por su sigla en inglés).
Por ser la única herramienta creada de modo expreso para medir los resultados del
tratamiento, la tabla 4.1 la presenta en detalle a continuación.
Tabla 4.1. Medida de resultado de la terapia.
Identificar el descriptor que mejor lo califica. El sujeto no tiene que tener cada característica mencionada. Use 0.5 para indicar
si el sujeto es un poco mejor o peor que el descriptor.
Deficiencia
Valor
(Según sea apropiado para la edad)
0 Grave afonía persistente. Incapaz de fonar. No fona.
1 Disfonía consistente. Fonación ocasional. Puede ser disfónico con episodios áfonos.
2 Disfonía leve. Pueden fonar, pero ocurren episodios frecuentes de marcado deterioro vocal.
Disfonía leve o moderada. Episodios menos frecuentes de disfonía (p. ej., se produce en algún momento cada día o hay
3
ronquera leve persistente).
4 Disfonía moderada. Se producen episodios ocasionales de disfonía (p. ej., una vez por semana o menos).
5 No disfonía. Uso habitual de voz modal o apropiada.
Actividad–discapacidad
Valor
(Según sea apropiado para la edad)
0 La producción de la voz es completamente ineficaz o inadecuada en todas las situaciones.
La producción de voz es completamente ineficaz o inadecuada en la mayoría de las situaciones, excepto en ocasiones con
1
oyentes familiares o ambientes modificados.
2 La producción de voz es efectiva o apropiada en ambientes modificados (p. ej., situaciones tranquilas, familiares).
La producción de voz es efectiva o apropiada, pero puede ser impredecible en algunas situaciones. La producción de la voz
3
requiere menos atención y esfuerzo personal en la mayoría de las situaciones.
La producción de voz es efectiva o apropiada en la mayoría de las ocasiones. Rara vez requiere esfuerzo. Muy
4
ocasionalmente experimenta dificultades.
5 La producción de voz espontáneamente es eficaz y adecuada.
Participación–restricción en la participación
Valor
(Según sea apropiado para la edad)
No puede cumplir ninguno de los roles social, educacional, familiar. No participan en la toma de decisiones, sin autonomía,
0
sin ningún control sobre el medio ambiente. Sin integración social.
Baja autoconfianza, pobre autoestima, integración social limitada, socialmente aislado, contribuye a algunas decisiones
1
básicas y limitadas. No puede lograr el potencial en ninguna situación.
2 Alguna autoconfianza, alguna integración social, toma algunas decisiones y controla influencias en situaciones familiares.
Alguna autoconfianza, autonomía emergente. Toma decisiones y tiene el control de algunos aspectos de la vida. Capaz de
3 alcanzar algo de integración social, actividades educativas limitadas. Reticente a asumir el control sobre su vida. Necesita
estímulo para lograr su potencial.
Mayor confianza, dificultades ocasionales para integrarse o desempeñarse socialmente, rol activo. Participa en la toma de
4
decisiones apropiadas. Ocasionalmente puede tener dificultades para lograr el potencial en algunas situaciones.
5 Logra el potencial, de forma autónoma y sin restricciones. Es capaz de cumplir un rol social, educativo y familiar.
Bienestar e incomodidad
Valor
(Según sea apropiado para la edad)
0 Constantemente severo: malestar, frustración, rabia, angustia, vergüenza, preocupación, retirada.
1 Frecuentemente severo: malestar, frustración, rabia, angustia, vergüenza, preocupación, retirada.
2 Consistentemente moderado: malestar, frustración, rabia, angustia, vergüenza, preocupación, retirada.
3 Frecuentemente moderado: malestar, frustración, rabia, angustia, vergüenza, preocupación, retirada.
4 Ocasionalmente leve: malestar, frustración, rabia, angustia, vergüenza, preocupación, retirada.
5 No inapropiado: malestar, frustración, rabia, angustia, vergüenza, preocupación, retirada.
Fuente: adaptada de John, Enderby y Hughes (2005, apéndice).

Finalmente, la tabla 4.2 presenta un resumen de los diferentes indicadores de eficacia


descritos en este capítulo.

Tabla 4.2. Clasificación de indicadores de eficacia.


Indicadores de eficacia
VAS de calidad de vida
VAS del habla y la comunicación
Escalas visuales analógicas (VAS) VAS del conocimiento del cuidado vocal
VAS de la cualidad/calidad vocal
VAS del movimiento de la cuerda vocal
Índice de discapacidad vocal (VHI)
Calidad de vida relacionada con la voz (V-RQOL)
Herramientas funcionales autorreportadas Medición del esfuerzo fonatorio
Cuestionario de interpretación vocal (VPQ)
Perfil de actividad y participación vocal (VAAP)
Escala de severidad de síntomas vocales (VoiSS)
Cuestionario sobre síntomas vocales
Escala de incomodidad del tracto vocal (VTD)
Cuestionario conocimiento de la voz
Cuestionario de salud SF-36
Escalas de severidad vocal
Escala GRBAS
Clasificación auditiva de la cualidad/calidad vocal
Escala de características vocales
De percepción auditiva o psicoacústica VAS de la cualidad/calidad vocal
Índice de severidad de la disfonía (DSI)
Consenso perceptual–auditivo de la voz (CAPE-V)
Análisis del perfil vocal (VPA)
Perfil vocal perceptual
Laboratorio computarizado de habla (CSL)
Programa multidimensional de voz (MDVP)
Acústicas Praat
Perfil del rango vocal (VRP) o fonetograma
Visi-Pitch (VP)
Nivel de presión sonora (SPL)
Aerodinámicas Sistema fonatorio aerodinámico (PAS)
Analizador de la función fonatoria de Nagashima
Videoestroboscopia
VAS para el movimiento de la cuerda vocal
Electrolaringógrafo - electroglotógrafo)
Fisiológicas
Endoscopia laríngea
Laringoscopia indirecta
Imágenes digitales de alta velocidad (HSDI)
Escala de aptitud comunicativa
Escala de aptitud comunicativa
Área del espacio vocálico (VSA)
Índice de articulación vocálico (VAI)
Valoración perceptual de la precisión articulatoria y la entonación
Índices de inteligibilidad del habla (PIW, IE)
Otras comunicativas
Evaluación de la inteligibilidad del habla disártrica (ASSIDS)
Técnica de evaluación perceptual para la estimación de magnitudes directas (DME)
Escala de suficiencia de Minnesota (MSS)
Índice de estabilidad espaciotemporal (STI)
Índice de efectividad de modificación de la comunicación (CETI-M)
Medida de percepción de los sujetos sobre la terapia
Medidas de resultado del tratamiento
Medida de resultado de la terapia (TOM)
Fuente: elaboración propia

Notas al pie
1 Entre estos, cabe reiterar en cuanto a la estructura: el entrenamiento particular, la certificación de los profesionales
y los dispositivos técnicos y tecnológicos que ellos emplean; y respecto al proceso: la adherencia y autorregulación
de los participantes y las dosis y periodicidad del tratamiento.

2 Puede ser traducido literalmente como “índice de dificultad vocal” o “índice de incapacidad vocal”, pero en este
documento se emplea el término “discapacidad” dado que su filosofía corresponde con la propuesta de la
Clasificación Internacional del Funcionamiento, de la Discapacidad y de la Salud (CIF).

3 Se ha demostrado que la variabilidad entre los hablantes se puede reducir considerablemente mediante el uso de
procedimientos de normalización del hablante como la información extrínseca de la vocal, la información intrínseca
del formante y las proporciones de los formantes. Estos procedimientos de normalización incluyen métodos
intrínsecos, que se basan en las relaciones entre todas las propiedades en estado estacionario (Fo, F1, F2, F3) de la
señal vocálica de los individuos y métodos extrínsecos, que implican las relaciones entre las frecuencias de los
formantes de la totalidad del sistema vocálico del hablante (Roy et al., 2009).

Referencias

Estado del arte


Mau, T., Jacobson, B., y Garrett, C. (2010). Factors associated with voice therapy outcomes in the treatment of
presbyphonia. Laryngoscope, 120(6), 1181–1187. doi: http://doi.org/dnff2d.
Speyer, R. (2008) Effects of voice therapy: a systematic review. Journal of Voice, 22(5), 565–580. doi:
http://doi.org/cc5rjc.
Verdolini‒Marston, K., Burke, M., Lessac, A., Glaze, L., y Caldwell, E. (1995). Preliminary study of two methods of
treatment for laryngeal nodules. Journal of Voice, 9(1), 74‒85. doi: http://doi.org/dj2tkm.
Ziegler, A., Gillespie, A., y Abbott, K. (2010). Behavioral treatment of voice disorders in teachers. Folia Phoniatrica
et Logopaedica, 62(1–2), 9–23. doi: http://doi.org/c6pjr3.

Resultado
Ruotsalainen, J., Sellman, J., Lehto, L., y Verbeek, J. (2008). Systematic review of the treatment of functional
dysphonia and prevention of voice disorders. Journal of Otolaryngology–Head and Neck Surgery, 138(5), 557–
565. doi: http://doi.org/d3ftc6.
Sauder, C., Roy, N., Tanner, K., Houtz, D., y Smith, M. (2010). Vocal function exercises for presbylaryngis: A
multidimensional assessment of treatment outcomes. Annals of Otology, Rhinology & Laryngology, 119(7), 460–
467. doi: http://doi.org/bs94.
Wheeler, K., Gollins, S., y Sapienza, G. (2006). The relationship between VHI scores and specific acoustic measures
of mildly disordered voice production. Journal of Voice, 20(2), 308–317. doi: http://doi.org/dcrnzm.

Herramientas funcionales autorreportadas


Carding, P., y Horsley, I. (1992). An evaluation study of voice therapy in non–organic dysphonia. International
Journal of Language & Communication Disorders, 27(2), 137–158. doi: http://doi.org/b9rc8d.
Carding, P., Horsley, I., y Docherty, G. (1999). A study of the effectiveness of voice therapy in the treatment of 45
patients with nonorganic dysphonia. Journal of Voice, 13(1), 72–104. doi: http://doi.org/dkvw8r.
Colton, R., y Brown, W. (1973). Some relationships between vocal effort and intra–oral air pressure. The Journal of
the Acoustical Society of America, 53(1), 296. doi: http://doi.org/ctvf9v.
Deary, I., Wilson, J., Carding, P., y Mackenzie, K. (2003). VoiSS: a patient–derived voice symptom scale.Journal of
Psychosomatic Research, 54(5), 483–489. doi: http://doi.org/b8wcpj.
Deary, I., Webb, A., MacKenzie, K., Wilson, J., y Carding, P. (2004). Short, self–report voice symptom scales:
psychometric characteristics of the vocal handicap index–10 and the vocal performance questionnaire. Journal of
Otolaryngology–Head and Neck Surgery, 131(3), 232–234. doi: http://doi.org/b3xxkd.
Fox, C., y Boliek, C. (2012) Intensive voice treatment (LSVT®LOUD) for children with spastic cerebral palsy and
dysarthria. Journal of Speech, Language and Hearing Research, 55(3), 930–945. doi: http://doi.org/fzhsd7.
Gillivan–Murphy, P., Drinnan, M., O’Dwyer, T., Ridha, H., y Carding, P. (2006). The effectiveness of a voice
treatment approach for teachers with self–reported voice problems. Journal of Voice, 20(3), 423–431. doi:
http://doi.org/ftw39f.
Hogikyan, N., y Sehuraman, G. (1999). Validation of an instrument to measure voice–related quality of life (V–
RQOL). Journal of Voice, 13(4), 557–569. doi: http://doi.org/fkhnc6.
Hogikyan, N., Wodchis, W., Terrell, J., Bradford, C., y Esclamado, R. (2000). Voice–related quality of life (V–RQOL)
following type 1 thyroplasty for unilateral vocal cord paralysis. Journal of Voice, 14(3), 378–386. doi:
http://doi.org/c4gc4j.
Jacobson, B. H., Johnson, A., Grywalski, C., Silbergleit, A., Jacobson, G., Benninger, M. S., et al. (1997). The voice
handicap index: development and validation. American Journal of Speech–Language Pathology, 6, 66–70. doi:
http://doi.org/bsxw.
Jenkinson, C., Coulter, A., y Wright, L. (1993). Short form 36 (SF36) health survey questionnaire: normative data for
adults of working age. British Medical Journal, 306(6890), 1437–1440. doi: http://doi.org/d3ggfz.
Leppänen, K., Ilomäki, I., y Laukkanen, A. (2010). One‒year follow‒up study of self‒evaluated effects of voice
massage, voice training, and voice hygiene lecture in female teachers. Logopedics, Phoniatrics, Vocology, 35(1),
13‒18. doi: http://doi.org/bzpwpg.
Ma, E., y Yiu, E. (2001). Voice activity and participation profile: assessing the impact of voice disorders on daily
activities. Journal of Speech, Language, and Hearing Research, 44(3), 511–524. doi: http://doi.org/bjs4r4.
MacKenzie, K., Millar, A., Wilson, J., Sellars, C., y Deary, I. (2001). Is voice therapy an effective treatment for
dysphonia? A randomized controlled trial. British Medical Journal, 323(7314), 658–661. doi: http://doi.org/cwd7pp.
Mathieson, L., Hirani, S., Epstein, R., Baken, R., Wood, G., y Rubin, J. (2009). Laryngeal manual therapy: a
preliminary study to examine its treatment effects in the management of muscle tension dysphonia. Journal of
Voice, 23(3), 353–366. doi: http://doi.org/dgdh6h.
Murry, T., Medrado, R., Hogikyan, N., y Aviv, J. (2004). The relationship between ratings of voice quality and quality
of life measures. Journal of Voice, 18(2), 183–192. doi: http://doi.org/b5t9hf.
Nanjundeswaran, C., Li, N., Chan, K., Wong, R., Yiu, E., y Verdolini–Abbott, K. (2012). Preliminary data on
prevention and treatment of voice problems in student teachers. Journal of Voice, 26(6), 816.e1–12. doi:
http://doi.org/btp3.
Pasa, G., Oates, J., y Dacakis, G. (2007). The relative effectiveness of vocal hygiene training and vocal function
exercises in preventing voice disorders in primary school teachers. Logopededics, Phoniatrics, Vocology, 32(3),
128–140. doi: http://doi.org/bq5n3g.
Simberg, S., Sala, E., Tuomainen, J., Sellman, J., y Rönnemaa A. (2006). The effectiveness of group therapy for
students with mild voice disorders: a controlled clinical trial. Journal of Voice, 20(1), 97–109. doi:
http://doi.org/dtxnpw.
Speyer, R., Wieneke, G., y Dejonckere, P. (2004). Documentation of progress in voice therapy: Perceptual, acoustic,
and laryngostroboscopic findings pretherapy and posttherapy. Journal of Voice, 18(3), 325–340. doi:
http://doi.org/ch5jgf.
Wilson, J., Webb, A., Carding, P., Steen, I., MacKenzie, K., y Deary, I. (2004). The voice symptoms scale (VoiSS)
and the vocal handicap index (VHI): a comparison of structure and content. Clinical Otolaryngology, 29(2), 169–
174. doi: http://doi.org/cpqnbk.

Herramientas de percepción auditiva o psicoacústica


Amir, O., Dukas, M., y Shnaps–Baum, R. (2005). The effect of a «voice course» on the voices of people with and
without pathologies: preliminary observations. Logopedics Phoniatrics Vocology, 30(2), 63–71. doi:
http://doi.org/cr534x.
Awan, S., y Roy, N. (2009) Outcomes measurement in voice disorders: application of an acoustic index of dysphonia
severity. Journal of Speech, Language and Hearing Research, 52(2), 482–499. doi: http://doi.org/chffhv.
Baumgartner, C., Sapir, S., y Ramig, T. (2001). Voice quality changes following phonatory–respiratory effort treatment
(LSVT) versus respiratory effort treatment for individuals with Parkinson disease.Journal of Voice, 15(1), 105–
114. doi: http://doi.org/ct2rgr.
Chen, S., Hsiao, T., Hsiao, L., Chung, Y., y Chiang, S. (2007). Outcome of resonant voice therapy for female teachers
with voice disorders: perceptual, physiological, acoustic, aerodynamic, and functional measurements. Journal of
Voice, 21(4), 415–425. doi: http://doi.org/cptz5h.
De Bodt, M., Wuyts, F., Van de Heyning, P., y Croux, C. (1997). Test–retest study of GRBAS scale: influence of
experience and professional background on perceptual rating of voice quality. Journal of Voice, 11(1), 74–80. doi:
http://doi.org/fptf24.
Dromey, C., Nissen, S., Roy, N., y Merrill, R. (2008). Articulatory changes following treatment of muscle tension
dysphonia: preliminary acoustic evidence. Journal of Speech, Language and Hearing Research, 51(1), 196–208.
doi: http://doi.org/bbmv6d.
Gelfer, M., y Van Dong, B. (2013). A preliminary study on the use of vocal function exercises to improve voice in
male–to–female transgender clients. Journal of Voice, 27(3), 321–334. doi: http://doi.org/f2w4mc.
Holmberg, E., Hillman, R., Hammarberg, B., Södersten, M., y Doyle, P. (2001). Efficacy of a behaviorally based voice
therapy protocol for vocal nodules. Journal of Voice, 15(3), 395–412. doi: http://doi.org/ds243j.
Hirano, M. (1981). Clinical Examination of Voice. New York, EE.UU.: Springer–Verlag.
Kempster, G., Gerratt, B., Verdolini–Abbott, K., Barkmeier–Kraemer, J., y Hillman, R. (2009). Consensus auditory–
perceptual evaluation of voice: development of a standardized clinical protocol. American Journal of Speech–
Language Pathology, 18(2), 124–132. doi: http://doi.org/c8bzs8.
Laver, J., Wirz, S., Mackenzie, J., y Hiller, S. (1981). A perceptual protocol for the analysis of vocal profiles: work in
progress. University of Edinburgh, 139–155.
Roy, N., Bless, D., Heisey, D., y Ford, N. (1997). Manual circumlaryngeal therapy for functional dysphonia: an
evaluation of short– and long–term treatment outcomes. Journal of Voice, 11(3), 321–331. doi:
http://doi.org/cfgpv8.
Roy, N., y Ferguson, N. (2001). Formant frequency changes following manual circumlaryngeal therapy for functional
dysphonia: evidence of laryngeal lowering? Journal of Medical Speech‒Language Pathology, 9(3), 169‒175.
Roy, N., Weinrich, B., Gray, S., Tanner, K., Toledo, S., Dove, H.,et al. (2002). Voice amplification versus vocal
hygiene instruction for teachers with voice disorders: a treatment outcomes study. Journal of Speech, Language
and Hearing Research, 45(4), 625–638. doi: http://doi.org/dzps9b.
Roy, N., Weinrich, B., Gray, S., Tanner, K., Stemple, J., y Sapienza, C. (2003). Three treatments for teachers with
voice disorders: a randomized clinical trial. Journal of Speech, Language and Hearing Research, 46(3), 670–
688. doi: http://doi.org/fwftgm.
Roy, N., y Hendarto, H. (2005). Revisiting the pitch controversy: changes in speaking fundamental frequency (SFF)
after management of functional dysphonia. Journal of Voice, 19(4), 582–591. doi: http://doi.org/dz54jh.
Roy, N., Nissen, S., Dromey, C., y Sapir, S. (2009). Articulatory changes in muscle tension dysphonia: evidence of
vowel space expansion following manual circumlaryngeal therapy. Journal of Communication Disorders, 42(2),
124–135. doi: http://doi.org/fnjqk6.
Spielman, J., Ramig, L., Mahler, L., Halpern, A., y Gavin, W. (2007). Effects of an extended version of the Lee
Silverman voice treatment on voice and speech in Parkinson’s disease. American Journal of Speech–Language
Pathology, 16(2), 95–107. doi: http://doi.org/br8c49.
Tay, E., Phyland, D., y Oates, J. (2012). The effect of vocal function exercises on the voices of aging community
choral singers. Journal of Voice, 26(5), 619–672. doi: http://doi.org/btqm.
Van Lierde, K., De Bodt, M., Dhaeseleer, E., Wuyts, F., y Claeys, S. (2010). The treatment of muscle tension
dysphonia: a comparison of two treatment techniques by means of an objective multiparameter approach. Journal
of Voice, 24(3), 294–301. doi: http://doi.org/cws2qp.
Wuyts, F., De Bodt, M., Molenberghs, G., Remacle, M., Heylen, L., Millet, B.,et al. (2000). The dysphonia severity
index: an objective measure of vocal quality based on a multiparameter approach. Journal of Speech, Language
and Hearing Research, 43(3), 796–809. doi: http://doi.org/bs9g.

Herramientas aerodinámicas
Gorman, S., Weinrich, B., Lee, L., y Stemple, J. (2008). Aerodynamic changes as a result of vocal fold function
exercises in elderly men. Laryngoscope, 118(10), 1900–1903. doi: http://doi.org/ckt3vc.

Herramientas fisiológicas

Poburka, B. (1999). A new stroboscopy rating form. Journal of Voice, 13(3), 403–413. doi: http://doi.org/fj9nkw.
Speyer, R., Weineke, G., Hosseini, E., Kempen, P., Kersing, W., y Dejonckere, P. (2002). Effects of voice therapy as
objectively evaluated by digitized laryngeal stroboscopic imaging. Annals of Otology, Rhinology & Laryngology,
111(10), 902–908. doi: http://doi.org/bt9c.
Verdolini, K., Druker, D., Palmer, P., y Samawi, H. (1998). Laryngeal adduction in resonant voice. Journal of Voice,
12(3), 315–327. doi: http://doi.org/b82zbc.

Otras herramientas comunicativas


Ball, L., Beukelman, D., y Pattee, G. (2004). Communication effectiveness of individuals with amyotrophic lateral
sclerosis. Journal of Communication Disorders, 37(3), 197–215. doi: http://doi.org/fcc2rb.
Franken, M., Van Bezooijen, R., y Boves, L. (1997). Stuttering and communicative suitability of speech.Journal of
Speech, Language and Hearing Research, 40(1), 83–94. doi: http://doi.org/bs9w.
Sapir, S., Spielman, J., Ramig, L., Hinds, S., Countryman, S., Fox, C., et al. (2003). Effects of intensive voice treatment
(the Lee Silverman Voice Treatment [LSVT]) on ataxic dysarthria: a case study. American Journal of Speech–
Language Pathology, 12(4), 387–399. doi: http://doi.org/dgghmj.
Sapir, S., Ramig, L., Spielman, J., y Fox, C. (2010). Formant centralization ratio: a proposal for a new acoustic measure
of dysarthric speech. Journal of Speech, Language and Hearing Research, 53(1), 114–125. doi:
http://doi.org/b4g92k.
Sitler, R. (1981). Construct validity of direct magnitude estimation and interval scaling of speech intelligibility: evidence
from a study of the hearing impaired. Journal of Speech, Language and Hearing Research, 24(3), 441–445. doi:
http://doi.org/bs92.
Smith, A., Goffman, L., Zelaznik, H., Ying, G., y McGillem, C. (1995). Spatiotemporal stability and patterning of
speech movement sequences. Experimental Brain Research, 104(3), 493–501. doi: http://doi.org/bpw2tk.
Van der Torn, M., Verdonck–de Leeuw, I., Kuik, D., y Mahieu, H. (2002). Communicative suitability of voice
following radiotherapy for T1a glottic carcinoma: testing the reliability of a rating instrument. Journal of Voice,
16(3), 398–407. doi: http://doi.org/d6bvb9.
Weismer, G., y Laures, J. (2002). Direct magnitude estimates of speech intelligibility in dysarthria: effects of a chosen
standard. Journal of Speech, Language and Hearing Research, 45(3), 421–433. doi: http://doi.org/bzqp6t.
Wenke, R., Theodoros, D., y Cornwell, P. (2008). The short– and long–term effectiveness of the LSVT for dysarthria
following TBI and stroke. Brain Injury, 22(4), 339–352. doi: http://doi.org/c8bk7w.
Yorkston, K., y Beukelman, D. (1984). Assessment of intelligibility of dysarthric speech. Tigard, EE.UU.: C. C.
Publications.

Herramientas de resultado del tratamiento


Enderby, P., y John, A. (1997) Therapy Outcome Measures: Speech–Language Pathology. San Diego, EE.UU.:
Singular.
John, A., Enderby, P., y Hughes, A. (2005). Comparing outcomes of voice therapy: a benchmarking study using the
therapy outcome measure. Journal of Voice, 19(1), 114‒123. doi: http://doi.org/fjxk2n.
Nanjundeswaran, C., Li, N., Chan, K., Wong, R., Yiu, E., y Verdolini–Abbott, K. (2012). Preliminary data on
prevention and treatment of voice problems in student teachers. Journal of Voice, 26(6), 816.e1–12. doi:
http://doi.org/btp3.
Nguyen, D., y Kenny, D. (2009). Randomized controlled trial of vocal function exercises on muscle tension dysphonia
in Vietnamese female teachers. Journal of Otolaryngology–Head and Neck Surgery, 38(2), 261–278.
CONCLUSIONES

Con el fin de actualizar la información disponible sobre el tema, la presente obra surgió
del análisis de dos revisiones sitemáticas y 131 artículos de investigación publicados
hasta octubre de 2014. De esta investigación se puede concluir que los profesionales en
Fonoaudiología disponen de una amplia gama de tratamientos comportamentales para la
voz, que han sido descritos y analizados para identificar sus alcances y efectos.
Los resultados de los diferentes tratamientos muestran mayor significancia clínica que
estadística; es decir, sea que reflejaran o no cambios estadísticamente significativos,
los efectos fueron reportados como cambios muy favorables para el beneficiario. A su
vez, se prefiere usar los resultados funcionales autorreportados —sobre todo, el VHI—
como herramientas para evaluar el tratamiento, en principio, porque dan cuenta del
impacto del cambio sobre la voz, la calidad de vida y el bienestar comunicativo del
beneficiario.
Los estudios analizados no cumplen los requisitos mínimos para ser considerados
como insumos y referentes de práctica basada en la evidencia. Los hallazgos de estas
investigaciones se clasifican en niveles de evidencia I I y III según estándares
reconocidos. Solo la metodología LSVT ha presentado desde hace poco resultados con
un nivel de evidencia I. Estos niveles de evidencia pueden obedecer a desaciertos
metodológicos de las investigaciones o a omisiones en la información reportada. Por
esta razón, resulta más difícil recomendar estos tratamientos en la práctica clínica. Es,
pues, un compromiso de los investigadores refinar estas prácticas metodológicas y
documentales.
Al integrar valoraciones físicas y fisiológicas, la terapia vocal busca posicionarse
científicamente como una modalidad comportamental desde la perspectiva de las
ciencias naturales. No obstante, al igual que las ciencias comportamentales y sociales,
en la actualidad enfrenta diferentes obstáculos para ser reconocida como práctica
sustancial de la asistencia en salud.
Este libro fue digitalizado
por Hipertexto Ltda. en septiembre de 2017,
año del sesquicentenario de la
Universidad Nacional de Colombia,
patrimonio de todos los colombianos.
Bogotá, D. C., Colombia