Académique Documents
Professionnel Documents
Culture Documents
www.elsevier.es/otorrino
ARTCULO ORIGINAL
a
Servicio de Otorrinolaringologa, Hospital Universitario Central de Asturias, Oviedo, Espa
na
b
Grado de Logopedia, Facultad de Psicologa, Universidad de Oviedo, Oviedo, Espa na
0001-6519/$ see front matter 2013 Elsevier Espaa, S.L. Todos los derechos reservados.
http://dx.doi.org/10.1016/j.otorri.2013.12.004
Document downloaded from http://www.elsevier.es, day 22/05/2017. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
KEYWORDS Acoustic voice analysis using the Praat program: Comparative study with the Dr.
Sound spectrogram; Speech program
Acoustic analysis;
Praat; Abstract
Dr. Speech Introduction and objectives: The European Laryngological Society (ELS) basic protocol for
functional assessment of voice pathology includes 5 different approaches: perception, videos-
troboscopy, acoustics, aerodynamics and subjective rating by the patient. In this study we
focused on acoustic voice analysis.
The purpose of the present study was to correlate the results obtained by the commercial
software Dr. Speech and the free software Praat in 2 fields:
1. Narrow-band spectrogram (the presence of noise according to Yanagihara, and the presence
of subharmonics) (semi-quantitative).
2. Voice acoustic parameters (jitter, shimmer, harmonics-to-noise ratio, fundamental fre-
quency) (quantitative).
Material and methods: We studied a total of 99 voice samples from individuals with Reinkes
oedema diagnosed using videostroboscopy. One independent observer used Dr. Speech 3.0 and
a second one used the Praat program (Phonetic Sciences, University of Amsterdam).
The spectrographic analysis consisted of obtaining a narrow-band spectrogram from the pre-
vious digitalised voice samples by the 2 independent observers. They then determined the
presence of noise in the spectrogram, using the Yanagihara grades, as well as the presence of
subharmonics. As a final result, the acoustic parameters of jitter, shimmer, harmonics-to-noise
ratio and fundamental frequency were obtained from the 2 acoustic analysis programs.
Results: The results indicated that the sound spectrogram and the numerical values obtained
for shimmer and jitter were similar for both computer programs, even though types 1, 2 and 3
voice samples were analysed.
Conclusions: The Praat and Dr. Speech programs provide similar results in the acoustic analysis
of pathological voices.
2013 Elsevier Espana, S.L. All rights reserved.
172 F. N
nez Batalla et al
Media DS Media DS
Jitter (%) 0,722 1,0 0,595 0,786 0,005 0,856 (,2-,7)
Shimmer (%) 3,810 3,433 3,820 3,412 0,926 0,903 (,7-,9)
HNR 20,35 6,430 20,39 6,152 0,911 0,784 (,7-,8)
F0 (Hz) 175,15 48,10 169,95 49,26 0,092 0,740 (,6-,9)
CI: intervalo de confianza; DS: desviacin estndar; ICC: intervalo intraclases.
Los resultados obtenidos en el anlisis acstico de las resultado indica una correlacin casi completa entre ambas
voces pueden verse tanto en la tablas 1 y 2 como en las observaciones.
figuras 1 y 2. Adems, el anlisis de subarmnicos mostr coincidencia
en 93 casos (94%), con un ndice kappa de 0,873 (p = 0,05).
Anlisis espectrogrfico
Discusin
En la tabla 3 se exponen la estadstica descriptiva de los
hallazgos espectrogrficos de ambos programas. En este estudio se exponen las similitudes entre un programa
En la clasificacin de las voces en la escala de Yanagihara comercial (Dr. Speech de Tiger Electronics) y un programa
hubo concordancia entre ambos observadores en 94 de los gratuito de anlisis acstico de la voz (Praat) mediante el
99 casos (96%), con un ndice kappa de 0,940 (p = 0,03). Este anlisis de muestras vocales de 3 seg de duracin de una
5 20
4
Shimmer (P)
15
Jitter (P)
3
10
2
5
1
0 0
0 1 2 3 4 5 0 5 10 15 20
Jitter (DS) Shimmer (DS)
30
250
25
20
200
HNR (P)
F0 (P)
15
150
10
5 100
174 F. N
nez Batalla et al
Jitter Shimmer
2
4
1
2
Differences
Differences
0 0
2
1
4
2
0 1 2 3 4 5 0 5 10 15 20
Means Means
HNR F0
20
20
10
10
Differences
Differences
0 0
10
10
20
20
5 10 15 20 25 30 100 150 200 250
Means Means
Figura 2 Grficos de Bland-Altman para las variables acsticas, que muestran la concordancia entre los datos obtenidos mediante
ambos programas.
vocal sostenida /e/ obtenidas de 99 pacientes diagnostica- hecho hace necesario que se estudien series de personas
dos de edema de Reinke. sanas con el objeto de establecer los valores normativos para
Existen antecedentes de estudios que han analizado las el programa Praat, tarea que no ha sido hasta el momento
diferencias en los resultados de las medidas de perturbacin llevada a cabo15 .
entre programas de anlisis acstico12---14 . En este trabajo Tras estudiar las medidas de perturbacin este trabajo
se aborda adicionalmente la espectrografa, analizando los investig las similitudes y diferencias entre ambos progra-
resultados de la clasificacin del ruido y de la presencia de mas en la espectrografa. Los trazados espectrogrficos de
subarmnicos entre ambos programas. banda estrecha se analizaron de acuerdo a la clasificacin de
En nuestro trabajo se observa que el jitter presenta una Yanagihara y observando la presencia de subarmnicos. Se
menor correlacin entre ambos programas, hallazgo que se pone de manifiesto una elevada concordancia entre obser-
ha comprobado tambin en otros estudios, donde se observa vadores en el anlisis espectrogrfico con ambos programas,
que aunque se encuentran fuertes similitudes en los resul- tanto en la escala de Yanagihara, con una correlacin casi
tados de la frecuencia fundamental entre los programas, completa, como en los subarmnicos. Los resultados mos-
las medidas de perturbacin presentan unas correlaciones traron una coincidencia casi absoluta, con lo que se puede
menos significativas, especialmente en las de la frecuen- concluir que el anlisis espectrogrfico es absolutamente
cia. El hecho de que las perturbaciones de amplitud tengan comparable entre los distintos programas. Este hallazgo
mejores correlaciones que las de frecuencia se explica era esperado porque los programas producen una imagen o
porque el jitter es mucho ms dependiente del exacto espectrograma que para su interpretacin exige la califica-
emplazamiento de los lmites de las ondas que en el caso cin por parte del examinador, y no un algoritmo matemtico
del shimmer. Mientras que errores mnimos en la localiza- que resulte en un resultado numrico.
cin de los lmites de la onda a naden de forma intensa ruido El contar con esta ventaja en la espectrografa permite
a las medidas de la perturbacin de frecuencia, el efecto de comparaciones entre los resultados de distintos programas,
tales errores supone menos detrimento en las medidas de siempre que los criterios de calificacin de las grficas sean
perturbacin de amplitud, dado que generalmente no son comunes. Hay que tener en cuenta que el anlisis acstico
de tanta magnitud como para eliminar de forma completa de la voz debe contar necesariamente con esta tcnica para
el pico de un ciclo12,14 . De esta forma se explica que los estu- el estudio de las voces que excedan el 5% de perturbacin
dios que comparan los resultados entre distintos programas, en frecuencia o amplitud, voces que corresponderan al tipo
entre los que se incluye el presente, encuentren correlacio- ii de Titze. Segn este autor6 es til clasificar, en primer
nes dbiles o moderadas en la perturbacin de frecuencia y lugar, las voces en 3 tipos: las voces tipo 1 son prctica-
moderadas o fuertes en la perturbacin de amplitud. Este mente peridicas; las voces tipo 2 contienen aperiodicidad,
Document downloaded from http://www.elsevier.es, day 22/05/2017. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
subarmnicos o roturas de la voz; las voces tipo 3 son cati- con mnimos requisitos de equipamiento y fcilmente mane-
cas. Por tanto, recomienda comenzar la evaluacin de la voz jables contribuye a la mejora de la calidad de la asistencia
patolgica con la realizacin de un anlisis espectrogrfico al paciente.
con el fin de determinar los mtodos de estudio ms id- Derivado de este trabajo, y para poder emplear en el
neos para cada caso en particular, y tanto el espectrograma mbito clnico el programa Praat, es necesario que se estu-
hallado con el Dr. Speech como con el Praat sirven para este dien series de personas sanas con el objeto de establecer los
fin. valores normativos del mismo, tarea que no ha sido hasta el
Las medidas de perturbacin a corto plazo no son fiables momento llevada a cabo.
si las voces contienen intermitencias, fuertes subarmnicos
o modulaciones16 , por lo que las voces tipo 2 y tipo 3 solo
pueden ser estudiadas a travs de un mtodo de clasifica- Conclusiones
cin perceptual (GRBAS), y por un mtodo visual como el
espectrograma. Por muy patolgica que sea la voz siempre El espectrograma obtenido con el programa Praat es compa-
se dispondr de un grfico en el que veremos representado rable al hallado con el programa Dr. Speech.
el ruido, los armnicos, los subarmnicos y los segmentos de Se encuentran correlaciones dbiles o moderadas en la
vacos de se nal8 . perturbacin de frecuencia, y moderadas o fuertes en la
En cambio, las voces tipo 1 son las que s pueden anali- perturbacin de amplitud.
zarse por medio de los parmetros de perturbacin a corto
plazo (jitter, shimmer, HNR) de manera fiable16 .
Conflicto de intereses
Con este estudio de la correlacin de los resultados obte-
nidos por 2 programas de anlisis acstico, uno comercial
Los autores declaran no tener ningn conflicto de intereses.
(Dr. Speech) y otro gratuito (Praat), pretendemos apoyar
con evidencias el uso de este ltimo, lo que supondra dis-
frutar de algunas de las siguientes ventajas: el programa Bibliografa
Dr. Speech est dise nado para el sistema operativo Windows
95/NT/98/2000/XP y no se puede utilizar con otros sistemas 1. Eskenazi L, Childers DG, Hicks DM. Acoustic correlates of vocal
operativos. En cambio, el Praat se puede utilizar tanto para quality. J Speech Hear Res. 1990;33:298---306.
Windows como para Macintosh, el sistema operativo libre 2. Dejonckere PH, Remacle M, Fresnel-Elbaz E, Woisard V, Crevier-
Linux y otros sistemas como FreeBSD, SGI, Solaris, HPUX, Buchman L, Millet B. Differentiated perceptual evaluation
lo cual facilita su instalacin en cualquier equipo, sin tener of pathological voice quality: Reliability and correlations
que disponer de un sistema operativo concreto. El Programa with acoustic measurements. Rev Laryngol Otol Rhinol.
Praat es un software de cdigo abierto (en ingls open source 1996;117:219---24.
software u OSS), es decir, est licenciado de tal manera que 3. Hirano M. Clinical examination of voice. Vienna: Springer; 1981.
4. Kreiman J, Gerratt B. Measuring vocal quality. En: Kent RD, Ball
los autores exponen de forma abierta el cdigo fuente, los
MJ, editores. Voice quality measurement. San Diego: Singular
algoritmos utilizados en el programa para cada parmetro Publishing Group; 2000. p. 73---101.
son de dominio pblico, no tienen derechos de autor, y esto 5. Werth K, Voigt D, Dllinger M, Eysholdt U, Lohscheller J. Clinical
les permite a los usuarios utilizar, cambiar y mejorar el soft- value of acoustic voice measures: A retrospective study. Eur
ware. De este modo, gracias a la colaboracin entre autores Arch Otorhinolaryngol. 2010;267:1261---71.
y usuarios el programa se desarrolla ms rpidamente que 6. Titze IR. National Center for Voice and Speech. Denver: Works-
un programa comercial. El programa Praat es gratuito, por hop on acoustic voice analysis. Summary statement; 1994.
lo que se encuentra disponible para todos los profesionales 7. Yanagihara N. Significance of harmonic changes and noise
de la voz, ya se encuentren en instituciones o en gabinetes components in hoarseness. J Speech Hear Res. 1967;10:
particulares. 531---41.
8. Nnez Batalla N, Suarez Nieto C. Espectrografa clnica de
Segn el estudio de Rodrguez-Parra et al.17 el 62% de
la voz. Universidad de Oviedo. Servicio de Publicaciones;
los servicios de ORL espa noles no disponen de laboratorio 1999.
de voz, a pesar de que actualmente puede considerarse 9. Boersma P, Weenink D. Phonetic Sciences Holanda: Univer-
esencial en la evaluacin y tratamiento de pacientes con sity of Amsterdam [consultado 9 Dic 2013]. Disponible en:
alteraciones vocales y para la investigacin clnica de esos http://www.fon.hum.uva.nl/praat/
trastornos18 . 10. Titze IR, Liang H. Comparison of F0 extraction methods for high-
La funcin vocal es multidimensional3 y por tanto su eva- precision voice perturbation measurements. J Speech Hear Res.
luacin tambin tiene que ser multidimensional, incluyendo: 1993;36:1120---33.
percepcin, anlisis acstico, videoestroboscopia, aerodin- 11. Awan SN, Scarpino SE. Measures of vocal F0 from continuous
mica y autovaloracin del paciente19 . As pues, el hecho de speech samples: An interprogram comparison. J Speech Lang
Pathol Audiol. 2004;28:122---31.
disponer de programas gratuitos fiables debera favorecer su
12. Bielamowicz S, Kreiman J, Gerratt BR, Dauer MS, Berke GS.
extensin tanto en instituciones pblicas como en consultas Comparison of voice analysis systems for perturbation measu-
privadas con bajo presupuesto. rement. J Speech Hear Res. 1993;39:126---34.
Esto es importante sobre todo para los profesionales que 13. Karnell MP, Hall KD, Landahl KL. Comparison of fundamental fre-
trabajan de manera autnoma. El nmero de pacientes con quency and perturbation measurements among three analysis
trastornos de la voz que suele acudir a una consulta privada systems. J Voice. 1995;9:383---93.
de logopedia en relacin con otras afecciones, no suele jus- 14. Smits I, Ceuppens P, de Bodt MS. Comparative study of acoustic
tificar la inversin econmica en un programa comercial, voice measurements by means of Dr. Speech and computerized
pero la existencia de programas gratuitos vlidos, fiables, speech lab. J Voice. 2005;19:187---96.
Document downloaded from http://www.elsevier.es, day 22/05/2017. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
176 F. N
nez Batalla et al
15. Maryn Y, Corthals P, de Bodt M, Van Cauwenberge P, Deliyski manejo de los problemas de la voz. Acta Otorrinolaringol Esp.
D. Perturbation measures of voice: A comparative study bet- 2006;57:109---14.
ween multi-dimensional voice program and Praat. Folia Phoniatr 18. Dejonckere PH. Valoracin perceptual y de laboratorio de la
Logop. 2009;61:217---26. disfona. Otolaryngol Clin North Am. 2000;33:677---94.
16. Nnez Batalla F, Santos Corte P, Sequeiros Santiago G, Se naris 19. Dejonckere PH, Crevier-Buchman L, Marie JP, Moerman M,
Gonzlez B, Surez Nieto C. Evaluacin perceptual de la disfo- Remacle M, Woisard V. European Research Group on the Larynx.
na: correlacin con los parmetros acsticos y fiabilidad. Acta Implementation of the European Laringological Society (ELS)
Otorrinolaringol Esp. 2004;55:282---7. basic protocol for assessing voice treatment effect. Rev Laringol
17. Rodrguez-Parra MJ, Casado JC, Adrin JA, Buiza JJ. Estado Otol Rhinol (Bord). 2003;124:279---83.
actual de los servicios ORL espa noles. Heterogeneidad en el