Académique Documents
Professionnel Documents
Culture Documents
RESUMEN
L
a fiabilidad del análisis acústico de la voz es una cuestión retest obtenida en cada par de medidas. Los datos muestran una
relevante poco estudiada todavía. Se presenta aquí un es- alta estabilidad intra-sujeto en los parámetros de Frecuencia
tudio correlacional sobre la fiabilidad de los parámetros de Fundamental; estabilidad aceptable en los parámetros de Pertur-
la voz en una muestra de 148 adultos sanos. El análisis se llevó bación de Frecuencia y de Amplitud, Ruido, Subarmónicos e Irre-
a cabo mediante el MDVP- Multi-Dimensional Voice Program ins- gularidad de la voz; y una consistencia muy baja en los paráme-
talado en una unidad de CSL-Computerized Speech Lab de Kay tros de Temblor. Los parámetros relacionados con el shimmer
Elemetrics. Por cada sujeto se obtuvieron 29 parámetros de voz son más fiables que los relacionados con el jitter. De acuerdo
a partir de dos registros de la vocal /a/ sostenida. Se ofrecen los con los resultados obtenidos se extraen conclusiones útiles para
resultados generales separados por géneros y la fiabilidad test- la práctica clínica.
ABSTRACT
A
correlational study of the reliability of acoustic voice para- liability in each pair of measures was calculated. Data show a
meters was made of 148 healthy adults. Acoustic analysis high intra-subject stability of Frequency Fundamental parameters;
was performed with MDVP- Multi-Dimensional Voice Pro- acceptable stability in parameters of Frequency and Amplitude
gram implemented in a CSL-Computerized Speech Lab of Kay Perturbation, Noise, Subharmonics and Voice irregularities; and a
Elemetrics. A set of 29 voice parameters were obtained from two very low consistency in Tremor parameters. Parameters related
samples of sustained vowel /a/ recorded from each subject. Ge- with shimmer were more reliable than parameters related with jit-
neral results separated by sex are showed and the test-retest re- ter. According to results several conclusions are reported.
Correspondencia: J. González. Departamento de Psicología Básica, Clínica y Psicobiología. Universidad Jaume I. 12080 Castellón
E-mail: gonzalez@psb.uji.es
Fecha de recepción: 17-9-2001
Fecha de aceptación: 3-1-2002
Por otra parte, los datos normativos que acom- sis un fragmento de 3 segundos de la parte más
pañan al MDVP son de origen americano y corre- estable de la señal, desechándose en todo caso
ponden a un número muy limitado de casos (siete los primeros 250 milisegundos, en los que el ata-
varones y ocho mujeres)8. Para llenar esa laguna, que de la voz confiere inestabilidad a la señal.
en este trabajo se proporcionan los resultados ob-
tenidos en una muestra amplia de voces sanas Análisis
pertenecientes a adultos jóvenes de ambos géne-
ros, al tiempo que se evalúa la fiabilidad test-retest El análisis acústico se realizó de forma automa-
de las medidas mediante la comparación de dos tizada por medio del programa MDVP, obteniéndo-
registros de voz consecutivos obtenidos en cada se por cada muestra un total de 29 parámetros
individuo. clasificados en las siguientes dimensiones: Pará-
metros de Frecuencia Fundamental, de Perturba-
ción de Frecuencia, de Perturbación de Amplitud,
Parámetros de Ruido, Parámetros de Temblor, de
MATERIAL Y MÉTODOS Componentes Subarmónicos, Parámetros de Ape-
riodicidad y de Interrupción de la voz (ver Apéndi-
Sujetos ce).
Tabla 1: Resultados de los Parámetros del MDVP (Multi-Dimensional Voice Program) obtenidos al analizar
la fonación sostenida de la vocal /a/ en una muestra de 148 sujetos de ambos géneros
nésimas de segundo) ciclo a ciclo, ha sido uno de resante considerarlo de forma relativa a la misma,
los más empleados en la clínica y cuenta con una en términos porcentuales (Jitt). La muestra total
larga tradición en la literatura científica. El valor de sujetos presenta un promedio de 0,83% de va-
medio de todos los sujetos se sitúa en 52,35 mi- riabilidad respecto al período fundamental, siendo
crosegundos (ms) con un amplio rango compren- ésta significativamente mayor en las mujeres
dido entre 5,84 y 192,23 ms, si bien el 75% de la (0,94%) que en los hombres (0,68%). Estos datos
muestra se coloca por debajo de 66 ms y el 90% se sitúan entre los obtenidos en otras investiga-
por debajo de 95 ms. Estos valores son ligera- ciones. Hollien et al.11 obtienen 0,48% para varo-
mente inferiores a los ofrecidos en el manual del nes con una frecuencia fundamental Fo en torno
MDVP como normativos (83,2 ms) y más en con- a 102 Hz, y 0,76% para varones con Fo en torno
sonancia con los que aporta la literatura anterior. a 142 Hz. Orlikoff12 obtiene 0,42% en varones de
Por otra parte, como el jitter guarda relación con 26-33 años.
la frecuencia fundamental de la voz, es más inte- Es creciente la tendencia a usar medidas de
Tabla 2: Resultados de los Parámetros del MDVP (Multi-Dimensional Voice Program) separados
por géneros
(*) Diferencia significativa en la prueba Mann-Whitney con p<0,05. (**) Ídem p <0,01. (***): Ídem p<0,001.
perturbación de frecuencia con un cierto grado de al que encuentran en España con otro programa
suavización, que no sean tan sensibles a posibles (Dr Speech Science) Fernández Liesa et al 2 en
alteraciones erráticas entre dos ciclos consecuti- una muestra de 154 adultos no fumadores
vos, o a los errores que pueda cometer el algorit- (PPQ=0,23), e incluso al del grupo de fumadores
mo de extracción de períodos. Las preferencias se del estudio de Damborenea et al. 13 (PPQ=0,27).
decantan por el promediado de 3 períodos conse- También es superior al del estudio de Walton y Or-
cutivos (RAP), o 5 períodos (PPQ). Cuando se likoff14 (RAP=0,28) y está más próximo a los valo-
aplican estos suavizados los valores se rebajan res encontrados por Preciado et al.15, 16 en su grupo
sensiblemente, ofreciendo 0,49 para ambos pará- control de 64 docentes españoles (RAP=0,35), o
metros en nuestra muestra total, inferiores a los los trabajos de Dwire y McCauley17 en sujetos nor-
datos normativos del manual del MDVP (0,68 para teamericanos (RAP=0,38 para varones y
RAP y 0,84 para PPQ). Nuestro dato es superior RAP=0,89 para mujeres, ambos de 18-25 años de
edad) o Takahashi y Koike18 para japoneses varo- muestra de no fumadores de los trabajos de Fer-
nes (RAP =0,57) y mujeres (RAP=0,61). Las dife- nández 2 y Damborenea 13 arrojan APQ=2,02%, y
rencias significativas entre géneros encontradas los fumadores de este último estudio, 2,56%. En
en nuestros parámetros de perturbación frecuen- trabajos extranjeros, el "clásico" de Horii19 con 31
cial Jita (test Mann-Whitney, p<0,05), Jitt (p<0,01), hombres y 20 mujeres obtiene shimmers de 0,47
RAP (p<0,001), y PPQ (p<0,01), apunta en la lí- dB y 0,33 dB respectivamente para la vocal /a/, sin
nea de lo declarado por Baken y Orlikoff en su re- diferencias significativas entre los géneros. Orlikoff
ciente revisión de 20001: "la evidencia preliminar y Kahane20 demuestran que el shimmer se reduce
señala la posibilidad de que las mujeres adultas cuando la intensidad de la voz aumenta; sus datos
podrían tener más jitter vocal que los hombres, al promedio para voces masculinas a una intensidad
menos para algunas vocales. Afortunadamente, moderada, equivalente a nuestro nivel confortable,
las diferencias observadas entre los géneros no se sitúan en 0,31 dB.
son lo suficientemente grandes como para dar lu-
gar a errores diagnósticos". Parámetros de ruido
Si el promediado se realiza a través de 55 pe-
ríodos consecutivos (sPPQ), la variabilidad fre- Los parámetros basados en la relación entre la
cuencial no alcanza significación entre los géne- energía armónica y la energía de ruido tienen una
ros. De nuevo, el promedio (0,72%) es inferior al extensa aplicación en la clínica de la voz, por su
umbral ofrecido por el manual (1,02%). Tampoco estrecha relación con muchas disfonías 21-23. Por
surgen diferencias inter-género en la variación de otra parte, son muy sensibles a los sistemas de
largo recorrido de Fo, medida a través del paráme- registros empleados ya que éstos pueden introdu-
tro vFo. cir niveles de ruido ajenos a los que comportan la
propia voz, alterando los resultados. La formula-
Perturbación de la amplitud ción concreta de estos parámetros varía de unos
algoritmos a otros: HNR o Harmonic-to-noise ratio,
Los parámetros que miden la perturbación de o su recíproco, NHR Noise-to-Harmonic ratio, co-
amplitud a través de los ciclos de la voz (ShdB, mo es el caso del programa MDVP. El promedio
Shim, APQ, sAPQ, y vAm) tienen, al igual que sus de NHR a través de los 148 sujetos es 0,13 (es
homólogos frecuenciales, una relevante significa- decir, la energía del ruido equivale a un 13% de la
ción clínica. Sus valores se presentan en las Ta- energía armónica); el 70% de los sujetos tienen
blas 1 y 2, sin diferencias estables entre géneros, valores igual o inferiores a 0,14; el 90% de los su-
a excepción de vAm. Los valores medios de shim- jetos se sitúa por debajo de 0,16. Estos datos son
mer absoluto y relativo a través de los 148 sujetos ligeramente inferiores al 0,19 dado como umbral
(0,34 dB y 3,86%, respectivamente) son muy se- de normalidad por el manual del MDVP. La exigua
mejantes a los valores normativos del manual diferencia que surge en nuestra muestra entre va-
(0,31 dB y 3,81%). En nuestra muestra el 75% de rones (0,14) y mujeres (0,13), es significativa (test
los sujetos tienen ShdB y Shim inferiores a 0,39 Mann-Whitney, p<0,01) porque aparece de forma
dB y 4,54% respectivamente; y el 90% está por bastante sistemática a través de los individuos, si
debajo de 0,53 dB y 5,98%. El suavizado matemá- bien no tiene significación diagnóstica.
tico a través del promedio de 11 períodos conse- NHR incluye globalmente toda la energía inar-
cutivos, o de 55 períodos, arrojan valores medios mónica, o de ruido, que se produce en la fonación
de APQ=2,95% y sAPQ=5,02%, respectivamente. desde orígenes diversos: irregularidades en los
La variación de la amplitud a largo plazo en la fo- períodos vibratorios, subarmónicos, ruido por tur-
nación sostenida de la vocal se mide con el pará- bulencia, etc. El parámetro VTI-Voice Turbulence
metro vAm, como el cociente, en términos porcen- Index, o Índice de Turbulencia de Voz, pretende
tuales, entre la desviación típica y el promedio de medir selectivamente el ruido que se produce por
la variación de amplitud ciclo-a-ciclo. En este para- la turbulencias del aire cuando el cierre de las
métro, la diferencia entre vAm=12,38% para los cuerdas vocales es incompleto o laxo. Como la
varones y vAm=15,83 % para las mujeres es signi- mayor parte de los componentes de este ruido son
ficativa (test Mann-Whitney, p<0,001), presentando de alta frecuencia, el parámetro sólo considera la
esta última una mayor variación de la amplitud a lo energía de ruido en la región 2800-5800 Hz. Los
largo de la fonación sostenida. A efectos compara- datos obtenidos en nuestro estudio arrojan un pro-
tivos con sujetos españoles, conviene recordar medio de 0,05; el 75% de los sujetos obtiene pun-
que los sujetos controles de Preciado et al.15 dan tuaciones iguales o inferiores a 0,06; el 90% igual
un valor medio de APQ =5,01%; mientras que la o inferior a 0,07. Estos datos no se apartan del
umbral de normalidad del MDVP, que lo sitúa en presenta componentes subarmónicos. De los 148
0,06. sujetos de nuestra muestra, 130 no tienen ningún
El SPI- Soft Phonation Index, o Índice de Fona- subarmónico en su voz, mientras que 18 sujetos -
ción Blanda, es otro parámetro original de Kay 15 mujeres y 3 varones- presentan un número va-
Elemetrics, propuesto por primera vez en esta ver- riable de los mismos. Esto da lugar a los valores
sión de 1993 del programa MDVP. Da una medida promedios de NSH=0,57 y DSH=0,61%. Es evi-
del predominio de componentes armónicos de baja dente que en un parámetro de esta naturaleza el
frecuencia y se calcula dividiendo la energía armó- valor medio no es una adecuada aproximación
nica en el rango 70-1600 Hz entre la energía ar- desde el punto de vista clínico, pero se incluye en
mónica en el rango 1600-4500 Hz. No se trata, por la tabla general con el fin de estudiar su fiabilidad
tanto, de un parámetro de ruido, pero el MDVP lo test-retest.
agrupa con los anteriores por la semejanza de su
fórmula de cálculo y aquí mantenemos el mismo Interrupción de la periodicidad
enfoque clasificatorio. El umbral de normalidad,
14,12, proporcionado por el manual del MDVP a Las mismas consideraciones deben hacerse en
partir de tan sólo quince sujetos se sitúa ligera- relación con los índices NUV y DUV. Se refieren
mente por encima de nuestros datos. El promedio respectivamente al número y porcentaje de seg-
de los 148 sujetos es de 8,54; el 75% de los suje- mentos sordos en los que la señal deja de ser pe-
tos puntúa por debajo de 10,69; y el 90% por de- riódica y el algoritmo de cálculo no puede extraer
bajo de 13,53. Tanto en SPI como VTI no hay dife- la frecuencia fundamental. En voces normales, y al
rencias entre géneros. tratarse de la fonación sostenida de una vocal, no
deberían arrojar valores distintos de cero. En
Parámetros de temblor nuestra muestra, 10 sujetos presentan alguna inte-
rrupción accidental en su fonación lo que da lugar
Los parámetros de temblor, tanto frecuenciales a valores no nulos y, en consecuencia, los prome-
como de amplitud, (Fftr, Fatr, FTRI, ATRI) dan va- dios son también distintos de cero.
lores numéricos en sólo 129 del total de 148 suje-
tos; en los restantes el MDVP arroja valores au- Fiabilidad de las medidas
sentes al no poder extraer un patrón cíclico de
modulación de la voz. Salvo en ATRI, no hay dife-
rencias entre varones y mujeres. El MDVP ofrece Más allá de la obtención de valores normativos,
umbrales de normalidad en dos de ellos, el objetivo principal de este trabajo ha sido evaluar
FTRI=0,95% y ATRI= 4,37%, que no están lejos el grado de fiabilidad de las medidas obtenidas,
de los promedios obtenidos en nuestra muestra. estudiando la estabilidad de los parámetros en una
prueba test-retest mediante el análisis de dos
Subarmónicos muestras consecutivas de voz tomadas en cada
sujeto. En la Tabla 3 se ofrecen por cada paráme-
Otro rasgo de gran relevancia en el estudio clí- tro la correlación de Pearson obtenida entre am-
nico de la voz es la presencia de componentes su- bas medidas a través de todos los sujetos. Tam-
barmónicos de baja intensidad situados entre los bién, siguiendo la metodología de Kent, Vorperian
armónicos24, 25. Esta alteración acústica suele apa- y Duffy7, se han extraído las discrepancias, o dife-
recer en disfonías causadas por pólipos o edemas rencias en valores absolutos entre ambas medi-
de Reinke, en las que pueden producirse irregula- das, y en la tabla se ofrecen la media, desviación
ridades asimétricas en la oscilación de las cuerdas típica y el rango de la distribución de esas discre-
vocales y la aparición de dos o más patrones si- pacias a través de los sujetos.
multáneos de vibración que dan lugar a la bifona- Los parámetros de la frecuencia fundamental
ción o diplofonía. El MDVP proporciona dos pará- (F0, Fhi, Flo) muestran una gran consistencia a
metros, el NSH, o Número de componentes través de las dos muestras analizadas, con corre-
Subarmónicos, y el DSH o Grado de Subarmonici- laciones superiores a 0,90 y pequeñas discrepan-
dad, consistente en la relación porcentual entre los cias entre cada par de valores. Cuando se pide la
componentes subarmónicos y los componentes ar- fonación sostenida de una vocal a un tono e inten-
mónicos de Fo. En principio la voz normal debería sidad confortable, parece que cada sujeto tiene
tener valores nulos en ambos parámetros, pero una frecuencia fundamental de la voz característi-
existe un pequeño porcentaje de personas, princi- ca que varía poco de un ensayo a otro. Así el pro-
palmente mujeres, cuya voz, sin ser patológica, medio de discrepancia de Fo es sólo de 3,53 Hz,
Tabla 3: Fiabilidad test-retest de los Parámetros del MDVP (Multi-Dimensional Voice Program). Correlaciones
de Pearson y Diferencias absolutas entre los valores obtenidos por dos muestras de voz de cada sujeto
lo que supone un 2,12% del valor medio de Fo en grabación. La estabilidad, sin embargo, cae nota-
todos los sujetos (166 Hz). Por otra parte, la distri- blemente cuando se considera la desviación típica
bución de las discrepancias es muy asimétrica, (STD) de la frecuencia de cada muestra, o sus
siendo relativamente unos pocos los que ofrecen rangos fonatorios (PFR).
dos fonaciones con tonos muy dispares, al tiempo Entre los parámetros de Perturbación de Fre-
que la mayoría muestran una alta estabilidad to- cuencia, los valores de jitter (Jita, Jitt), RAP y PPQ
nal: de los 148 sujetos, 109 presentan una discre- muestran una estabilidad moderada con correla-
pancia inferior a 4Hz entre la primera y la segunda ciones comprendidas entre 0,62 y 0,70; siendo el
Cociente de Perturbación de Tono (PPQ) el pará- la prácticamente nula correlación entre los dos en-
metro más estable. Parece que la incoporación de sayos (r=0,124, no significativa), parece que dicho
un factor de suavizado de 5 períodos en PPQ, comportamiento de la frecuencia fundamental es
propuesto por Koike et al. 26, consigue dotar a la más bien de carácter episódico y dependiente de
medida de una mayor estabilidad, mostrando una cada fonación sostenida, antes que una caracterís-
consistencia entre ensayos algo superior a las me- tica estable de la fonación de un sujeto.
didas no suavizadas (Jitter absoluto y relativo) o Los Parámetros de Perturbación de Amplitud
suavizadas con 3 períodos (RAP). Un factor de exhiben, en términos generales, una consistencia
suavizado de 55 períodos, sin embargo, no tiene superior a la de los Parámetros de Perturbación
la consecuencia de más estabilidad; antes al con- de Frecuencia. Salvo en sAPQ y vAm, las correla-
trario, la correlación entre los dos medidas de ciones entre la primera y segunda muestra de voz
sPPQ cae a 0,492. son superiores a 0,70 y la oscilación entre ambas
Si se observan los promedios de las diferencias viene a estar por debajo de una quinta parte de la
absolutas entre los dos ensayos, podemos tener medida. Así, una discrepancia media de 0,06 dB
una idea de las consecuencias diagnósticas de la en ShdB representa el 17,6% del valor medio para
variación entre medidas. Una diferencia promedio todos los sujetos (0,34); la discrepancia de 0,70
de 17,33 ms entre dos jitters consecutivos es un para Shim es el 18,1% del total; la discrepancia de
30% de la media general (Jita=57,53 µs). En algu- 0,50 para APQ representa el 16,9% del total. De
nos sujetos con valores próximos al umbral de nuevo, al igual que observábamos en los paráme-
normalidad, puede suponer que una muestra de tros de perturbación frecuencial, podemos extraer
voz arroje un dato por debajo de ese umbral y en las siguientes conclusiones: a) un factor de suavi-
una segunda muestra, tomada en las mismas con- zado moderado confiere a la medida mayor estabi-
diciones, dicho umbral sea superado. En téminos lidad, por lo que APQ es el parámetro con más fia-
generales, esta diferencia de 17,33 µs no parece bilidad test-retest; b) un factor de suavizado
dramática, pero su distribución es altamente asi- grande (55 períodos para sAPQ) no otorga más
métrica. De los 148 sujetos, la mitad de ellos pre- estabilidad a la medida; c) la variación de amplitud
sentó diferencias inferiores a 10 µs entre los dos a largo plazo dentro de la fonación, o vAm, es el
medidas de Jita; pero en el otro extremo de la dis- parámetro menos fiable, como así sucede con su
tribución, 16 sujetos obtuvieron discrepancias por homólogo frecuencial.
encima de 40 µs, el cual es ciertamente un valor La fiabilidad de los parámetros de ruido nos
importante. Se constata también la tendencia, lógi- obliga a diferenciar entre NHR y VTI, por una par-
ca por otra parte, a que el jitter varíe más en los te, y SPI, por otra. Los dos primeros presentan co-
sujetos con valores más altos. En los otros para- rrelaciones inter-muestras moderadas, de 0,649 y
métros las diferencias son de un tenor semejante: 0,607, respectivamente, con unas discrepancias
0,27 de diferencia entre las dos medidas de Jitt re- medias relativamente inferiores en NHR (un 10%
presenta el 32,5% de la media general (0,83); 0,17 del total) que en VTI (un 20% del total). Las distri-
es el 34,7% de la media de RAP (0,49); 0,16 es el buciones de estas discrepancias son bastante asi-
32,7% de la media de PPQ (0,49); 0,17 es el métricas. Dada la importancia diagnóstica de NHR,
23,6% de la media de sPPQ (0,72). Es decir, po- conviene detenerse en la distribución de sus dis-
demos concluir que en líneas generales dos medi- crepancias entre ambas muestras de voz: de los
das consecutivas de la Perturbación de Frecuencia 148 sujetos, 127 obtienen discrepancias inferiores
van a presentar una oscilación en torno a la terce- a 0,02, lo cual tiene poca significación clínica si re-
ra parte de las mismas. Si además se tiene en cordamos que el promedio total de NHR es 0,13 y
cuenta que en ciertos sujetos esta variación va a el umbral de normalidad propuesto por el MDVP
ser bastante mayor, el corolario parece obvio: se- es 0,19. De los 21 sujetos restantes, 20 varían por
ría aconsejable que tanto en la evaluación diag- debajo de 0,06, y los dos con mayores discrepan-
nóstica de la voz como en los estudios del progre- cias alcanzan 0,07 y 0,08, respectivamente. Es de-
so post-tratamiento, se obtuvieran al menos dos cir, aunque la correlación entre muestras de NHR
medidas por cada paciente y se utilizará el prome- es moderada, en general la disparidad entre los
dio de ambas. valores es pequeña y tiene poca significación clíni-
Por otra parte, llama la atención la escasa con- ca. Consideraciones similares caben efectuar res-
sistencia de los datos de Variación de la Frecuen- pecto a VTI, o Índice de Turbulencia de Voz, pará-
cia Fundamental medida a través de vFo. Dicho metro nuevo propuesto por la casa Kay en un
parámetro refleja la variación de Fo a largo plazo intento de objetivizar el grado de soplado (breathi-
dentro de la muestra de voz analizada. A la luz de ness) de la voz producido por un cierre laxo e in-
completo de las cuerdas vocales. Por su novedad, mento, y el resto difieren en más de un segmento
no disponemos aún de valores normativos en la li- aperiódico.
teratura profesional.
Por su parte, el SPI, o Índice de Fonación Blan-
da, parece un parámetro interesante y prometedor CONCLUSIONES
si bien, al ser muy reciente, no cuenta hasta la fe-
cha con estudios sobre su potencialidad diagnósti- De acuerdo con los resultados obtenidos al
ca. Más allá del ámbito clínico, promete ser un indi- analizar dos muestras consecutivas de voz de 148
cador objetivo de cierta cualidad de timbre vocal: la sujetos normales con el MDVP o Multi-Dimensional
fonación "blanda", o voz con predominio de los Voice Program, pueden extraerse las siguientes
componentes armónicos graves. Pruebas percepti- conclusiones sobre la fiabilidad de las medidas.
vas informales revelan una estrecha corresponden- 1. Los Parametros de Frecuencia Fundamental
cia entre sus resultados numéricos y la impresión (Fo, Fhi, Flo) son muy consistentes a través de las
cualitativa de voz "blanda" o poco estridente, lo dos muestras de voz, con correlaciones test-retest
que es un acicate para futuros estudios sistemáti- muy altas. Según las características fonatorias de
cos. Este hecho tiene relevancia si tenemos en cada sujeto, éste tiene una frecuencia de vibración
cuenta la escasa relación directa que en general preferente que tiende a reproducir en distintas fo-
encontramos en la investigación sobre timbre vo- naciones sostenidas de la misma vocal, al menos
cal, entre medidas numéricas y la percepción cuali- cuando se producen a un tono e intensidad confor-
tativa e integrada de la cualidad vocal. En este table. Esta consistencia, sin embargo, cae drásti-
sentido, sorprende favorablemente su alta estabili- camente cuando se mide la variabilidad y el rango
dad entre muestras, con una correlación de 0,848 frecuencial dentro de cada fonación (STD y PFR).
entre ambas, que es la máxima después de las 2. Los Parámetros de Perturbación de Amplitud
medidas de frecuencia fundamental (Fo, Fhi y Flo). son más consistentes que los Parámetros de Per-
Los parámetros de Temblor presentan una es- turbación de Frecuencia, superándoles en algo
casísima consistencia entre ensayos. A excepción más de 0,10 puntos en la correlación test-restest.
de Fftr, cuya baja correlacion entre muestras 3. Dada la gran variabilidad de la voz humana,
(0,301), resulta estadísticamente significativa, los ambos tipos de parámetros presentan discrepan-
demás parámetros obtienen correlaciones práctica- cias entre las dos muestras de cada sujeto. En tér-
mente nulas y no significativas. Tal vez en voces minos generales, los Parámetros de Perturbación
patológicas en las que el rasgo de temblor sea un de Frecuencia varían en torno a una tercera parte
componente importante (temblor esencial, enfer- de su valor, y los Parámetros de Perturbación de
medad de Parkinson) puedan encontrarse niveles Amplitud varían en torno a una quinta parte de su
superiores de consistencia entre ensayos, pero en valor. En los casos limítrofes con la voz patológica
lo que se refiere a las voces normales los resulta- esta variación podría tener significación clínica, por
dos obtenidos en la primera muestra de voz son lo que sería recomendable en la práctica diagnós-
muy distintos de los que se obtienen en la tica registrar al menos dos medidas y obtener el
segunda. Esto quiere decir que los aspectos medi- promedio de ambas.
dos por los cuatro parámetros -frecuencia y ampli- 4. Un factor de suavizado moderado en el cá-
tud de modulación de la voz- tienen una naturale- culo de de ambos tipos de parámetros incrementa
za marcadamente episódica ligada a cada la consistencia de los mismos; siendo el PPQ
fonación particular, con una fiabilidad escasa en (Pitch Perturbation Quotient) o Cociente de Pertur-
cuanto a la caraterización de un rasgo estable de bación de Tono, con un factor de suavizado de 5
la voz de un individuo. Esto al menos en voces no períodos, el más consistente de los Parámetros de
patológicas. Perturbación Frecuencial, y su homólogo el APQ
Los parámetros que analizan los componentes, (Amplitude Perturbation Quotient) o Cociente de
DSH y NSH ofrecen correlaciones test-retst próxi- Perturbación de Amplitud, con un factor de suavi-
mas a 0,80. De los 148 sujetos, 122 no presentan zado de 11 períodos, el más consistente de los
subarmónicos en ninguna de las dos muestras re- Parámetros de Perturbación de Amplitud. Por el
gistradas, 10 difieren en un subarmónico entre las contrario, un factor fuerte de suavización hace ba-
dos muestras, y el resto difieren en más de un su- jar la consistencia, como es el caso de sPPQ
barmónico. La consistencia de los parámetros de (Smoothed Pitch Perturbation Quotient) o Cociente
aperiodicidad es ligeramente superior a 0,80. Aquí, Suavizado de Perturbación de Tono, y de sAPQ
136 sujetos no tienen segmentos aperiódicos, o (Smoothed Amplitude Perturbation Quotient) o Co-
sordos, en ninguna muestra, 6 difieren en un seg- ciente de Perturbación de Amplitud Suavizado,
ambos con un factor de suvizado de 55 períodos. frecuencia fundamental para todos los períodos
Ahora bien, estos dos parámetros miden aspectos extraídos de la onda acústica.
distintos al de los demás por lo que, pese a su in- Frecuencia Fundamental más Alta (Fhi-Highest
ferior consistencia, son útiles porque reflejan las Fundamental Frequency) /Hz/. La frecuencia fun-
perturbaciones a largo término de la fonación, tan- damental más alta alcanzada en todos los perío-
to en frecuencia como amplitud vocal. dos extraídos de la onda acústica.
5. Los parámetros de variación frecuencial Frecuencia Fundamental más Baja (Flo-Lowest
(vFo) y de Amplitud (vAm) a lo largo de la fona- Fundamental Frequency) /Hz/. La frecuencia fun-
ción sostenida presentan grandes discrepancias damental más baja alcanzada en todos los perío-
entre las dos muestras de voz, por lo que su con- dos extraídos de la onda acústica.
sistencia es baja para un mismo individuo. Desviación típica de la Frecuencia Fundamen-
6. Los Parámetros de Ruido, NHR (Noise to tal (STD-Standard Deviation of Fo) /Hz/. La desvia-
Harmonic Ratio) o Razón Ruido/Armónicos y VTI ción típica de Fo dentro del rango analizado.
(Voice Turbulence Index) o Índice de Turbulencia Rango Fonatorio en semitonos (PFR-Phonatory
de Voz, exhiben una consistencia moderada, con Fo-Range). Rango entre Fhi y Flo expresado en
correlaciones test-retest entre 0,60 y 0,70. Dada semitonos.
su importancia en la práctica clínica, especialmen- Parámetros de Perturbación de Frecuencia:
te del primero, sería aconsejable la obtención de Jitter Absoluto (Jita-Absolute Jitter) /us/: Da una
dos medidas promediadas, en la misma línea de lo evaluación in microsegundos (ms) de la variabili-
señalado anteriormente. dad período-a-período de la frecuencia fundamen-
7. El parámetro SPI, Soft Phonation Index, o tal dentro de la muestra analizada. Este parámetro
Índice de Fonación Blanda es un parámetro re- y sus derivados son ampliamente usados en la clí-
ciente que apenas cuenta con datos sobre su po- nica e investigación sobre la voz 27, siendo muy
tencialidad diagnóstica. Sin embargo plantea inte- sensible a las variaciones que ocurren entre perío-
resantes posibilidades tanto en la práctica clínica dos consecutivos.
como en la investigación sobre el timbre vocal, no Jitter Porcentual (Jitt-Jitter Percent) /%/: Varia-
sólo por su aparente relevancia perceptiva sino bilidad relativa período-a-período expresado en
por su gran consistencia entre muestras de voz de porcentaje.
un mismo sujeto. De hecho, se ha revelado como Perturbación Relativa Promedio (RAP-Relative
el parámetro más fiable después de los paráme- Average Perturbation) /%/: Introducida por Koike et
tros de frecuencia fundamental. al.26, este parámetros mide la variabilidad período-
8. Los parámetros de Temblor ofrecen una con- a-período con un factor de suavizado de 3 pe-
sistencia muy baja entre las dos muestras de un ríodos.
mismo sujeto con voz normal. Queda abierta la Cociente de Perturbación de Tono (PPQ-Pitch
posibilidad de una mayor consistencia en voces Perturbation Quotient) /%/: Introducido por Koike et
patológicas en los que el temblor constituya un al.26, da la variabilidad período-a-período con un
componente importante de la disfonía. factor de suavizado de 5 períodos.
9. Los parámetros de Subarmónicos y Aperiodi- Cociente Suavizado de Perturbación de Tono
cidad son estables en líneas generales, si bien un (sPPQ-Smoothed Pitch Perturbation Quotient) /%/:
pequeño porcentaje de sujetos arrojan discrepa- Da la variabilidad período-a-período con un factor
cias importantes entre sus dos muestras de voz. de suavizado de 55 períodos.
Variación de la Frecuencia Fundamental (vFo-
Fundamental Frequency Variation) /%/: La desvia-
AGRADECIMIENTOS ción típica relativa de la frecuencia fundamental.
Refleja la variación de Fo a largo plazo dentro de
Este trabajo han sido financiado por el Proyec- la muestra analizada.
to P1A99-01 de la Fundació Caixa-Castelló y la Parámetros de Perturbación de Amplitud:
Universidad Jaume I de Castellón. Shimmer Absoluto (ShdB-Shimmer) /dB/: Medi-
da en dB de la variabilidad entre períodos conse-
cutivos de la amplitud pico-a-pico de la onda de la
APÉNDICE muestra de voz analizada. Como en otros paráme-
tros, las áreas de ruptura de voz, sin naturaleza
Parámetros de Frecuencia Fundamental: periódica, son excluidas del cómputo. Este pará-
Frecuencia Fundamental Media (Fo-Average metro también ha sido y es ampliamente usado en
Fundamental Frequency) /Hz/. El promedio de la la práctica clínica27.
bre la Salud de los Españoles: 1998 del Ministerio población general, los datos de ese mismo año
de Sanidad y Consumo, la prevalencia del hábito para el grupo de edad 16-24 años son el 39,7% y
tabáquico en 1997 se situaba en el 35,7% de la para 25-44 años, 52,3%.
REFERENCIAS
1.- Baken R, Orlikoff, R. Clinical Reliability of the Multi-Dimensional cues in the vocal signal. J Speech 21.- Yanahigara, N. Significance of
measurement of speech and voi- Voice Program for the analysis of Hear Res 1994; 37: 738-45. harmonic changes and noise com-
ce. Second Edition. San Diego, voice samples of subjects with dy- ponents in hoarseness. J Speech
15.- Preciado JA, García R, Infante
CA: Singular Publishing Group, sarthria. Am J Speech-Lang Pathol Hear Res 1967; 10: 531-41.
JC. Análisis multidimensional de la
2000. 1999; 8: 129-36.
función vocal. Estudio de casos y 22.- Yumoto E, Gould W, Baer Th.
2.- Fernández R, Damborenea D, 8.- Kay Elemetrics Corp. Multi-Di- controles. Acta Otorrinolaring Esp Harmonic to noise ratio as an index
Rueda P, García E, Leache J, Cam- mensional Voice Program. MDVP 1998; 49(6): 467-74. of the degree of hoarseness. J
pos MA, Llorente E, Naya MJ. Aná- Model 4305B. New Jersey 1993. Acoust Soc Am 1982; 71: 1554-60.
16.- Preciado JA, Fernández S. El
lisis acústico de la voz normal en 9.- Deliyiski D. Acoustic model and análisis digital de la señal acústica 23.- Nieto A, Cobeta I, Gamboa FJ,
adultos no fumadores. Acta Otorri- evaluation of pathological voice pro- en el diagnóstico de la patología vo- Vegas A. La relación armónico/ruido
nolaringol Esp 1999; 50(2): 134-41. duction. Kay Elemetrics, 1993. cal. Sensibilidad y especificidad de y el análisis espectrográfico en la pa-
3.- Read Ch, Buder E, Kent R. Spe- 10.- Kay Elemetrics Corp. Compute- las medidas del shimmer y del jitter. tología de abuso vocal. Acta Otorri-
ech Analysis Systems: An evalua- rized Speech Laboratory. CSL Mo- Acta Otorrinolaringol Esp 1998; nolaringol Esp 1996; 47(5): 370-76.
tion. J Speech Hear Res 1992; 35: del 4300-B. New Jersey 1994. 49(6): 475-81.
314-32. 24.- Omori K, Kojima H, Kakani R,
11.- Hollien H, Michel J, Doherty E. 17.- Dwire A, McCauley R. Repea-
Slavit DH, Blaugrun SM. Acoustic
4.- Parsa V, Jamieson D. A compa- A method for analyzing vocal jitter ted measures of vocal fundamental
characteristics of rough voice: Sub-
rison of high precision Fo extraction in sustained phonation. J Phonetics frequency perturbations obtained
harmonics. J Voice 1997; 11: 40-47.
algorithms for sustained vowels. J 1973; 1: 85-91. using de Visi-Pitch. J Voice 1995; 9:
Speech Hear Res 1999; 42: 112-26. 156-62. 25.- Núñez F, Suárez C, Muñoz C,
12.- Orlikoff R. Heartbeat-related
5.- Buder E. Acoustic analisys of 18.- Takahashi H, Koike Y. Some per- Baragaño L, Álvarez MJ, Martínez
fundamental frequency and amplitu-
voice quality: A tabulation of algo- ceptual dimensions and acoustical A. Estudio espectro-gráfico de la
de variations in healthy young and
rithms 1902-1990. En R Kent y M correlates of pathologic voices. Acta disfonía: subarmónicos. Acta Otorri-
elderly male voices. J Voice 1990;
Ball. Voice Quality Measuremets. Otolaryngol Suppl 1975; 338: 1-24. nolaringol Esp 2000; 51(1): 52-56.
4: 322-28.
San Diego: Singular Publishing 26.- Koike Y, Takahashi H, Calcate-
13.- Damborenea J, Fernández R, 19.- Horii Y. Fundamental frequency
Group, 2000. ra, T. Acoustic measures for detec-
Llorente E, Naya MJ, Marín C, Rue- perturbation observed in sustained
6.- Corina J, Hilgers F, Verdonck I, da P, Ortiz A. Efecto del consumo phonation. J Speech Hear Res ting laryngeal pathology. Acta Oto-
Koopmans F. Acoustical analysis de tabaco en el análisis acústico de 1979; 22: 5-19. laryngol 1977; 84: 105-17.
and perceptual evaluation of trache- la voz. Acta Otorrinolaringol Esp
20.- Orlikoff R, Kahane J. Influence 27.- Iwata S, von Lenden H. Pitch
oesophageal prosthetic voice. J Voi- 1999; 50(6): 448-52.
of mean sound pressure level on jit- perturbations in normal and patholo-
ce 1998; 12: 239-48.
14.- Walton J, Orlikoff R. Speaker ter and shimmer measures. J Voice gical voices. Folia Phoniatr 1970;
7.- Kent R, Vorperian H, Duffy J. race identification from acoustic 1991; 5: 113-19. 22: 117-28.