ProceedingsAESLAC2011 PDF

ISSN 1688-8537
Memorias del Congreso Latinoamericano de

Ingeniera de Audio de la AES
Agosto 30-Setiembre 1, 2011
Montevideo, Uruguay
http://aesla2011!"ing!edu!uy
Tabla de contenidos
Foreword from the organization committee.........................................................................................4
Palavras do comit organizador............................................................................................................5
Palabras del comit organizador...........................................................................................................6
Sesin de artclos !"...........................................................................................................................#
$odelo de re%resentacin de informacin sonora & msical ......................................................."'
(aracterizacin sonora de los tambores de candombe .................................................................")
*n modelo algebraico %ara el %rocesamiento de adio ................................................................+4
Sesin de artclos !+.........................................................................................................................+,
$edicin de %ar-metros ac.sticos /el 0eatro 1acional (ervantes ..............................................+#
Par-metros ac.sticos en salas %ara m.sica & %rosa2 0eatro $nici%al 0res de Febrero de la
cidad de Paran- ...........................................................................................................................35
4valacin de las condiciones ac.sitcas de escelas %rimarias con fachadas e5%estas a niveles
sonoros s%eriores a )5 d67 en la (idad 7. de 6enos 7ires....................................................4+
$a%as ac.sticos2 $cho m-s 8e na cartografa coloreada .......................................................5'
Sesin de %osters................................................................................................................................5,
9ntegra:;o de Sistemas de <econhecimento= 0rad:;o e Sntese 7tom-tica de Fala %ara
Facilitar a (omnica:;o de 0ristas .............................................................................................5#
(aracterizacin de la sensibilidad & distorsin en %arlantes inicos ............................................63
*na neva iteracin de >7<$9 ....................................................................................................6)
*n generador de Paisa?es Sonoros ................................................................................................)"
7n-lisis & estimacin de la frecencia fndamental de la meloda %rinci%al en %iezas msicales
reales .............................................................................................................................................)5
Foreword from the organization committee
0he &ear of +'"" witnessed the challenging organization of the first 7dio 4ngineering (ongress in
*rga&= ta@ing advantage of the Aatin 7merican (onference held in $ontevideo.
0o great satisfaction of the organizers= the event was a sccess. 9t was ver& rewarding to have the
%artici%ation of the academic commnit& from several contries in the %a%ers sbmission and
review as well as the condction of lectres. 6t best of all was to see almost all the time
the rooms fll of %eo%le following one item after another of the %rogram with the same interest=
s&m%ath& and rece%tivit&. 0he %artici%ation of man& stdents showed how mch 7dio can
motivate their interest= and %oints to a %romising edcational %ath to be e5%lored.
0he average level of the %a%ers %resented was reall& good= and now the& are all available for
reference.
Be greatl& a%%reciate the %artici%ation of ever&one who contribted to allow the birth of an event
that we ho%e to re%rise.
0he organization.
Palavras do comit organizador
C ano de +'"" testemnho o desafio de se realizar %ela %rimeira vez m (ongresso de 4ngenharia
de Ddio no *rgai= a%roveitandoEse a realiza:;o da (onferncia Aatinoamericana em
$ontevid.
Para felicidade de todos os organizadores= o evento foi m scesso. Foi mito recom%ensador
contar com a %artici%a:;o da comnidade acadmica de diversos %ases= tanto na sbmiss;o e
revis;o de trabalhos 8anto na realiza:;o de %alestrasF mas o melhor de tdo foi ver 8ase todo o
tem%o as salas cheias e a assistncia acom%anhando de m item a otro do %rograma= com os
mesmos interesse= sim%atia e rece%tividade. 7 %artici%a:;o de nmerosos estdantes mostro
8anto interesse o Ddio %ode motivar= e a%onta %ara m %otencial es%a:o de edca:;o a ser
e5%lorado.
C nvel mdio dos artigos a%resentados foi realmente mito bom= e os trabalhos est;o= agora=
dis%onibilizados %ara conslta.
7gradecemos imensamente a %artici%a:;o de cada m 8e contribi %ara %ossibilitar o nascimento
de m evento 8e es%eramos %oder re%risar.
7 organiza:;o.
Palabras del comit organizador
4l aGo +'"" %resenci el reto de llevar a cabo %or %rimera vez n (ongreso de 9ngeniera de 7dio
en *rga&= a%rovechando la realizacin de la (onferencia Aatinoamericana en $ontevideo.
Para felicidad de todos los organizadores= el evento fe n 5ito. Fe m& gratificante contar con la
%artici%acin de la comnidad acadmica de diversos %ases= tanto en la %resentacin & revisin de
traba?os como en la realizacin de charlasF %ero lo me?or de todo fe ver casi todo el tiem%o las
salas llenas & la asistencia acom%aGando de n %nto a otro del %rograma con el mismo inters=
sim%ata & rece%tividad. Aa %artici%acin de los estdiantes mostr c-nto el 7dio %ede motivar
el inters= & a%nta a n es%acio %otencial de edcacin %ara ser e5%lorado.
4l nivel medio de los artclos %resentados fe m& beno= & los traba?os &a est-n dis%onibles %ara
s conslta.
7gradecemos enormemente la %artici%acin de todos los 8e contrib&eron a %ermitir el nacimiento
de n evento 8e es%eramos re%etir.
Aa organizacin.
Cairs
Aiz 6iscainho= *niversidade Federal do <io de Haneiro= 6rasil
Ais Hre= *niversidad de la <e%.blica= *rga&
7lvaro Pardo= *niversidad (atlica= *rga&
Comite de organi!aci"n
Pablo (ancela= *niversidad de la <e%.blica= *rga&
9gnacio 9rigara&= *niversidad de la <e%.blica= *rga&
4rnesto A%ez= *niversidad de la <e%.blica= *rga&
$artn <ocamora= *niversidad de la <e%.blica= *rga&
Ialdo S%ontn= *niversidad de la <e%.blica= *rga&
Aa organizacin del congreso centa con al a%o&o de2
6razilian (om%ter Societ&
4scela *niversitaria de $.sica = *niversidad de la <e%.blica
9nstitto de 9ngeniera 4lctrica = F91J= *niversidad de la <e%.blica
Facltad de 9ngeniera = *niversidad de la <e%.blica
Comit# de $rograma t#cnico%
7le5andre Aeizor Szcz%a@ = *niversidade Federal do <io de Haneiro= 6rasil
7lice 4lizabeth Jonzalez = *niversidad de la <e%.blica= *rga&
7lvaro Pardo = *niversidad (atlica= *rga&
(arlos >nogti = 9nstitto 1acional de 0elecomnica:Kes= 6rasil
4rnesto A%ez = Facltad de 9ngeniera= */4A7<= *rga&
Federico $i&ara = *niversidad 1acional de <osario= 7rgentina
Francisco Fraga = *niversidade Federal do 76( L*F76(M= 6rasil
Jstavo 6asso = *niversidad 1acional de Aa Plata= 7rgentina
9gnacio 9rigara& = *niversidad de la <e%.blica= *rga&
Han Pechiar = *nviersidad de la <e%.blica= *rga&
Aeonardo 1nes = *niversidade Federal do <io de Haneiro= 6rasil
Ais Hre = *niversidad de la <e%.blica= *rga&
Ais Beraga = Nhalifa *niversit& of Science= 47
Aiz 6iscainho = *niversidade Federal do <io de Haneiro= 6rasil
$arcelo Oeiroz = *niversit& of S;o Palo= 6rasil
$arcio 6randao = *niversidade de 6rasilia= 6rasil
$artn <ocamora = *niversidad de la <e%.blica= *rga&
$ichel Ia@as = *niversidad de la <e%.blica= *rga&
Cscar /i Aiscia = *niversidad 1acional de Oilmes= 7rgentina
Pablo (ancela = *niversidad de la <e%.blica= *rga&
Pablo (etta = 9nstitto *niversitario 1acional del 7rte= 7rgentina
Palo 7ntonio 4s8ef = 1ational Aaborator& for Scientific (om%ting= 6rasil
Palo <oberto da Silva = Crgania 4ngenharia $sical 0ecnologias 7diovisais=
6razil
Philli% 6rt = *niversidade de S;o Palo= 6rasil
<egis Faria = *niversit& of S;o Palo= 6rasil
Sebastian Fernandez = *niversidad de la <e%.blica= *rga&
0om-s Aarenzo = *niversidad de la <e%.blica= *rga&
Pictor Aazzarini = 1ational *niversit& of 9reland= 9rlanda
Balter Jonti?o = *niversidade Federal de Santa (atarina= 6rasil
Sesin de artculos #1
Martes 3& de Agosto - '%&& a 1&%3& rs - Sala (
Cair - Luis )ure
Modelo de Representacin de Informacin Sonora y Musical. Acas Samarga.
Caracterizacin Sonora de los Tambores de Candombe. $ateo Jargilo= /aniel 1avarro=
$arcos Salazar.
Un Modelo Algebraico para el Procesamiento de Audio. Jillermo Pozzati= $igel (alzn.
_________________________________
Sociedad de Ingeniera de Audio
Artculo de Congreso
Congreso Latioamericano de la AES 2011
30 de Agosto a 1 de Septiembre de 2011
Montevideo, Uruguay
Este artculo es una reproduccin del original final entregado por el autor, sin ediciones, correcciones o consideraciones
realizadas por el comit tcnico. La AES Latinoamrica no se responsabiliza por el contenido. Otros artculos pueden ser
adquiridos a travs de la Audio Engineering Society, 60 East 42
nd
Street, New York, New York 10165-2520, USA,
www.aes.org. Informacin sobre la seccin Latinoamericana puede obtenerse en www.americalatina.aes.org. Todos los
derechos son reservados. No se permite la reproduccin total o parcial de este artculo sin autorizacin expresa de la AES
Latinoamrica.
_________________________________
ModeIo de Representacin de Informacin Sonora y
MusicaI
Lucas Samaruga
1
1
CONICET, Universidad Nacional de Quilmes, Departamento de Ciencias Sociales
Bernal, Buenos Aires, B1876BXD, Argentina
lsamaruga@becarios.unq.edu.ar
RESUMEN
La propuesta de este trabajo consiste en un sistema de representacin basado en la concepcin unvoca de las
diferentes estructuras de datos empleadas para generar, manipular, almacenar y representar grficamente los
materiales sonoros y musicales. El objetivo es lograr un modelo de representacin que brinde una mayor
facilidad a la hora de organizar y trabajar sobre la composicin musical con medios electroacsticos en sus
distintas etapas de elaboracin, mediante el empleo de un conjunto acotado de estructuras de datos y principios
relacionales que posibiliten la organizacin de diversas tcnicas de composicin sonora.
El presente trabajo fue realizado en el marco de la beca de posgrado tipo I del CONICET y la Tesis Doctoral de su autor en el Programa de
Doctorado en Ciencias Sociales y Humanas de la UNQ, bajo la direccin del Dr. Oscar Pablo Di Liscia.
INTRODUCCIN
En la prctica, cualquier entorno informtico para
trabajar con sonido y msica emplea una concepcin e
implementa un modelo de representacin de los materiales
musicales. Es as que se produce un cierto grado de
diversidad en cuanto a las propiedades de las abstracciones
informticas que representan al material musical. Winsor y
DeLisa diferencian dos enfoques a la hora de abordar esta
problemtica: el modelado en base a la representacin
simblica/gramatical y el modelado en base a la
representacin procedimental/formativa. A grandes rasgos,
el primero se encarga de representar las estructuras
definidas por la retrica de un sistema musical predefinido
(cuyos componentes podran ser: notas, acordes, las
nociones de meloda y armona, etc.), mientras que el
segundo tiende a dejar de lado las estructuras simblicas
para enfocarse en las cualidades de la computadora como
herramienta de cmputo empleada por el compositor para
realizar sus tareas [1]. Adhiriendo al enfoque
procedimental/formativo, este trabajo considerara a la
computadora como un instrumento musical en s mismo
que provee recursos especficos. Es por esto que se le
otorga relevancia a las estructuras de datos como
materiales musicales y se entiende a la abstraccin
informtica como el objeto a manipular por parte del
compositor y como el resultado 'musical de dicha
manipulacin.
Considerar a la computadora como un instrumento
musical de recursos especficos simplifica notablemente la
diversidad de conceptos empleados comnmente para
definir entidades musicales como abstracciones
informticas y posibilita un mayor grado de generalidad.
Esto se debe a que la concepcin que se tenga sobre los
10
SAMARUGA MODELO DE REPRESENTACIN SONORA Y MUSICAL
CONGRESO LATINOAMERICANO DE LA AES 2011, , 30 DE AGOSTO A 1 DE SETIEMBRE 2011
materiales musicales o la naturaleza de la msica es, en
gran medida, independiente del instrumento musical
empleado y, por lo tanto, querer plasmar una concepcin
terica ajena al instrumento termina delimitando
drsticamente los recursos expresivos del mismo. Sin
embargo, delimitar las abstracciones informticas
empleadas para la manipulacin de los materiales sonoros
y su intencin musical, puede terminar generando un
sistema simblico/gramatical propio de un software en
particular. Teniendo en cuenta estos factores, este trabajo
propone una sistematizacin original de varios recursos
elementales provenientes de los entornos de programacin
actuales, con la intencin de lograr un modelo de
representacin adecuado a la mayor cantidad de recursos
posibles.
Trabajos ReIacionados
Existen varios proyectos y entornos de programacin
para sntesis de sonido y composicin asistida que abordan
el problema de la representacin musical de diversas
maneras. Los ms destacables en relacin al enfoque de
este trabajo son: 1) El entorno OpenMusic [2] en general y
el objeto maqueta en particular, en relacin a la
organizacin y los recursos visuales [3][4]. 2) El proyecto
Formes [5] y la tesis de Hanappe [6] en cuanto al empleo
de estructuras de datos jerrquicas para la representacin
de materiales musicales. 3) Diferentes propuestas de
organizacin de los recursos grficos para representar
sonido y msica, especialmente las propuestas de Hanappe
[6] y las data structures desarrolladas por Puckette que
definen una correlacin original entre los elementos
grficos y los datos de control de sntesis [7]. 4) Los
secuenciadotes de cdigo, especialmente el entorno Blue
de Steven Yi [8] que posibilita el agrupamiento y la
organizacin temporal de estructuras de datos y algoritmos.
5) Finalmente, ciertos aspectos de la arquitectura de
SuperCollider [9], especialmente la arquitectura del
servidor que emplea explcitamente una estructura de datos
jerrquica para la organizacin de los programas de
sntesis. Es necesario hacer notar que, en parte, la
implementacin que ser expuesta ms adelante, se origina
como una extensin de este entorno de sntesis de sonido a
las estructuras de datos necesarias para la organizacin de
los materiales musicales a distintos niveles de abstraccin
musical.
Si bien estos proyectos, y muchos otros no mencionados
por razones de extensin, no siguen una nica lnea de
investigacin respecto de la problemtica abordada, es
claro que tienen muchos puntos en comn en cuanto a las
estructuras subyacentes empleadas para la representacin
de los materiales musicales. Estas cualidades comunes son
las que prevalecen debido a su naturaleza intrnsecamente
computacional y son las que proporcionan el eje principal
del enfoque de este trabajo. A continuacin se
desarrollarn las nociones tericas y los recursos
informticos necesarios para la constitucin del modelo de
representacin.
MATERIAL LGICO Y MATERIAL CONCRETO
(CAMBIOS DE ESTADO)
Un mismo material musical puede ser representado de
diversas maneras mediante diferentes abstracciones. En
este trabajo se diferencian dos tipos de representacin
fundamentales definidos por sus cualidades como
abstracciones objetivables. Esta diferenciacin alude
fundamentalmente a dos estados por los que un mismo
material sonoro puede transitar en distintas etapas del
proceso compositivo. Al primer estado se lo denomina
material lgico (terminologa empleada comnmente para
referir a los programas utilizados para generar una obra
musical) y al segundo material concreto (terminologa
derivada de la msica concreta y la concepcin de los
materiales musicales de Pierre Schaeffer) [10].
El material lgico es el algoritmo generador y el material
concreto es el resultado generado. Ambas abstracciones
pueden ser entendidas como el mismo material en distintos
estados. Lo que se denomina cambio de estado posibilita
diferentes tipos de representacin y, lo que es ms
importante, diferentes tipos de manipulacin. Desde el
punto de vista de la informtica, no es ms que la
separacin entre los datos y las funciones u operaciones
sobre los datos, pero teniendo en cuenta que ambos actan
como medio de representacin de los materiales musicales
y que, en muchos casos, pueden ser representaciones
alternativas de una mismo objeto musical a diferentes
niveles de abstraccin.
Como objetos a ser manipulados, la diferencia que existe
entre el material lgico y el material concreto es la misma
que existe entre una funcin matemtica y una cantidad n
de valores generados con esa funcin. Se puede modificar
la funcin para obtener distintos resultados y tambin se
puede modificar el resultado, si embargo, los tipos de
modificaciones que son posibles de efectuar en uno u otro
son diferentes. En concreto, si se tiene un algoritmo que
genera una secuencia armnica aleatoria en base a un
repertorio de acordes, se pueden modificar los parmetros
del algoritmo, los cuales podran ser los coeficientes de
probabilidad y el repertorio de acordes. En cambio, si se
trabaja sobre el material concreto, generado por el
algoritmo y representado como una sucesin de eventos, ya
no es posible modificar los mismos parmetros de la
misma manera, la intervencin sobre el material generado
sera de tipo 'manual, modificando evento por evento o
mediante otro algoritmo que realice esta tarea de manera
automtica.
Como abstracciones que representan objetos temporales,
la diferencia fundamental entre estos dos estados consiste
en que el material concreto representa necesariamente algo
finito, mientras que los materiales lgicos pueden
representar entidades no delimitadas temporalmente. La
representacin de los materiales como entidades finitas
posibilita distintos tipos de manipulaciones compositivas
muy comunes de la tradicin musical, por ejemplo, la
variacin, la permutacin, la retrogradacin o, de manera
ms general, la reorganizacin temporal de materiales
preexistentes ad libitum. Este tipo de manipulacin del
material sonoro es de la misma naturaleza que los recursos
de edicin bsicos de los editores de audio, por ejemplo:
cortar, copiar y pegar. Por su parte, representar los
materiales musicales como algoritmos permite una
codificacin ms compacta y otro tipo de flexibilidad al
representar estructuras temporales.
Esta distincin entre dos tipos o estados de materiales es
fundamental para la definicin de las estructuras de datos y
la integracin de los procesos algortmicos, como se ver
ms adelante.
MATERIALES BSICOS
Los materiales musicales existen dentro de un rango
temporal y pueden ser agrupados o compuestos a distintas
escalas. En la prctica de la msica por computadora,
11
Figura 1 Caractersticas temporales (el eje de las abscisas representa la duracin). El contexto A contiene eventos con inicio y duracin, el
contexto B contiene elementos solo con inicio y el contexto C contiene elementos solo con duracin.
Figura 2 Tipos de relaciones temporales (el eje de las abscisas representa la duracin). Los elementos del contexto A estn en relacin
sucesiva, los elementos del contexto B estn en relacin simultnea y los elementos del contexto C estn en relacin mixta.
algunos autores consideran que este rango va desde la
escala de muestreo a la escala macro o supra temporal
[11]. Los materiales pueden volverse entidades ms
complejas a medida que se aumenta la escala temporal,
pero a medida que se acercan al lmite inferior estos se
vuelven inevitablemente ms simples hasta llegar al nivel
de la muestra de audio. Por lo tanto, no es posible definir
de manera concisa los materiales musicales a escala macro
temporal pero s es posible definir los elementos
combinables bsicos cercanos a la escala de muestreo.
Acotar los recursos combinables (los elementos
empleados para la composicin sonora, en este caso) es
una manera de abarcar el dominio del problema. Pero si lo
que se pretende es elaborar un meta-sistema, es necesario
acotar los elementos constitutivos de manera tal que
permita el mayor grado de generalidad posible en cuanto a
la capacidad de relacionar y generar nuevas estructuras.
Los elementos que componen el modelo propuesto por este
trabajo son analizados a continuacin en cuanto a sus
propiedades bsicas y su comportamiento como estructuras
agrupables.
Propiedades, Caractersticas y Tipos de
ReIaciones TemporaIes
Los materiales tienen como propiedades temporales
fundamentales los valores de inicio y duracin. Para poder
definir estas propiedades, los materiales deben estar
contenidos dentro de un contexto temporal [3]. Al agrupar
los tipos de datos bsicos en estructuras de datos ms
complejas se puede definir un conjunto finito y
complementario de estructuras segn las caractersticas y
tipos de relaciones temporales de los elementos que
contienen.
Las caractersticas temporales (Figura 1) de un
elemento estn definidas segn las posibles combinaciones
de presencia y ausencia de las propiedades temporales
fundamentales. Los materiales pueden tener inicio y/o
duracin, o ninguno de los dos. Si denominamos evento al
tipo de dato o material bsico, este puede pertenecer o no a
un contexto. Si no pertenece a ningn contexto es una
entidad no predecible temporalmente, pero si pertenece a
un contexto es una entidad temporal que puede ser
entendida de las siguientes maneras: Si define inicio y
duracin est representado un segmento temporal relativo
al contexto, si define solo inicio puede estar representado
una accin o valor puntual relativo al contexto, y si define
solo duracin tambin est representado un segmento
temporal pero dependiente de otros factores del contexto al
que pertenece (vase ms adelante). Si no define inicio ni
duracin es considerado como un evento aislado de
contexto.
Los tipos de relaciones temporales entre los materiales
agrupados en estructuras pueden ser catalogados de
distintas maneras segn los factores que se tengan en
consideracin [12][13][6][3]. En este trabajo se rescata la
concepcin descriptiva de las entidades temporales [12] y
se descartan, como pertenecientes a las estructuras de
datos, las relaciones de carcter lgico como, por ejemplo,
la causalidad [13] y otros factores relacionados con los
procesos generativos [6][3]. Esto se debe a la concepcin
de material concreto como entidad independiente de los
procesos generadores o modificadores (materiales lgicos).
Sin embargo no se sigue la clasificacin propuesta por
Allem [12] sino que se simplifica a tres tipos de relaciones
fundamentales definidas como propiedades de las
estructuras de datos bsicas.
Por lo tanto, la relacin temporal entre los materiales
agrupados puede ser: sucesiva, simultnea o mixta (ver
Figura 2). La relacin sucesiva es solo sucesiva, los
elementos relacionados solo definen su duracin, no se
superponen y comienzan al finalizar el evento anterior. La
relacin simultnea es solo simultnea, todos los elementos
relacionados comienzan al mismo tiempo, pudiendo
terminar o no al mismo tiempo. La relacin mixta es la que
representa cualquier combinacin posible de las dos
12
relaciones anteriores. Los elementos contenidos tienen
necesariamente inicio y pueden tener duracin.
Tipos de MateriaIes Bsicos
En base a la clasificacin previa, y teniendo en cuenta
consideraciones de carcter prctico, se pueden diferenciar
cuatro tipos bsicos de materiales concretos como
estructuras de datos: evento, lista, vector y conjunto. El
evento puede tener inicio y/o duracin o ninguno de los
dos. Puede ser entendido como una estructura de relacin
temporal simultnea si representa mltiples parmetros al
mismo tiempo. El evento sin duracin puede ser, por
ejemplo, una instruccin que representa una accin. La
lista contiene elementos que tienen duracin pero no inicio,
el cual est determinado de manera implcita por los
elementos precedentes, y su relacin temporal es sucesiva.
El vector (que es en la prctica del audio digital u buffer de
muestras de audio) contiene elementos que no tienen inicio
como propiedad y su duracin es constante, sus elementos
se definen temporalmente de manera sucesiva por su
posicin dentro de la estructura de datos. El vector es
equivalente a una lista de elementos de duracin igual,
pero en la prctica su implementacin como estructura de
datos y la del temporizador que lo controla son diferentes,
lo que influye en las formas de manipulacin posibles por
parte del compositor. Por ltimo, el conjunto contiene
elementos que tienen inicio y duracin, su relacin
temporal es mixta, y es el tipo de estructura que posibilita
las combinaciones de las estructuras sucesivas y
simultneas.
Con respecto a los materiales lgicos, estos se definen
como funciones generadoras que tienen las mismas
propiedades temporales que los eventos, pueden estar
aislados de contexto (fuera de cualquier estructura
temporal) o pueden definir su inicio y/o duracin dentro de
una estructura contenedora. El material concreto generado
por el material lgico puede ser de cualquier tipo.
MateriaIes Continuos y Discontinuos
Si se toman los valores representados por los materiales
concretos como parmetros temporales, las seales
generadas por los tipos bsicos pueden ser continuas o
discontinuas (Figura 3). Los objetos continuos son los que
no tienen 'huecos en la seal generada durante el
segmento temporal representado. Por ejemplo, si tomamos
los valores de estos objetos como la evolucin temporal de
un parmetro, estos generan una funcin continua a
frecuencia de audio o de control. Las estructuras bsicas
continuas son el evento (con duracin), el vector y la lista.
Los objetos discontinuos son los que no pueden generar
seales continuas como valores de salida porque pueden no
definir todos los valores de un segmento temporal. La
estructura bsica discontinua es el conjunto. El evento sin
duracin puede ser entendido como una estructura
discontinua y la funcin puede generar tanto materiales
continuos como discontinuos y estructuras jerrquicas
(vase ms adelante).
Figura 3 Seal generada por los materiales continuos y
discontinuos. Ntese adems que los materiales discontinuos
pueden expresar un mismo parmetro de manera ambigua (en la
resultante del material discontinuo se tom el valor ms alto como
valor de salida cuando los objetos se superponen).
Esta distincin entre estructuras continuas y discontinuas
es til para organizar la representacin y relacionar
parmetros musicales en estructuras jerrquicas como se
describe a continuacin.
ORGANIZACIN JERRQUICA
El principio de organizacin jerrquica est presente en
casi la totalidad de los sistemas de representacin y anlisis
musical, y en las tcnicas de programacin estructurada. Es
lo que da cohesin a los elementos del sistema y posibilita
distintos tipos de relaciones entre ellos. Las estructuras
descritas anteriormente se emplean para representar
parmetros sonoros y musicales y por lo tanto, pueden ser
agrupadas y relacionadas jerrquicamente para crear
entidades ms complejas.
Por lo tanto, debido a que el objeto que se considere
como unidad de sntesis o anlisis es relativo al nivel de
agrupamiento seleccionado, los materiales musicales
pueden ser definidos de manera general como entidades
delimitadas y diferenciadas arbitrariamente que generan
unidades de significado y que pueden ser descompuestas o
combinadas para formar nuevas entidades a otro nivel de
complejidad.
Para poder representar las estructuras musicales de
manera verstil, mediante estructuras de datos propias de la
computacin, se recurre a la propiedad de cierre y en
particular a las listas jerrquicas [14]. Por
Figura 4 Diagrama de especializacin de las estructuras de datos.
13
lo tanto se define a la estructura de datos nodo como el
elemento contenedor (contexto) y organizador de los
materiales bsicos. Los nodos definen las propiedades
temporales fundamentales de los materiales concretos y por
lo tanto sus caractersticas y tipos de relaciones temporales.
La jerarqua de clases empleada para organizar las
estructuras de datos bsicas como nodos se muestra en la
Figura 4.
Los datos concretos de los materiales musicales estn
contenidos en los distintos tipos de nodos hoja y los nodos
grupo tienen la funcin de organizar los materiales bsicos
proveyendo el contexto temporal y la lgica organizativa
de los datos como parmetros de sntesis y cmo
estructuras jerrquicas.
Comunicacin Entre Ios Nodos
Como medio de comunicacin y relacin de los
parmetros se emplean buses de la misma manera que se
emplean para realizar la sntesis de sonido en
SuperCollider [8], pero con propiedades adicionales que
derivan de los tipos de relacin de los materiales bsicos al
ser agrupados en nodos. Las estructuras de ms bajo nivel
empleadas para generar sonido y seales de control
(definiciones de instrumento, buses globales, nodos de
sntesis, patterns, etc), dependen de la arquitectura de
SuperCollider y no son expuestas en este trabajo.
Los nodos pueden ser emisores, receptores o ambos
segn como se organicen las relaciones de parmetros de
los materiales concretos al ser agrupados. Debido a que la
comunicacin se produce mediante buses, se vuelven
relevantes las propiedades de continuidad y discontinuidad,
y los tipos de relaciones temporales de los materiales
bsicos como parmetros. Los nodos emisores generan
seales de audio o control que son escritas en buses uno
por cada parmetro. Los nodos receptores son los que
reciben los parmetros de sus nodos hermanos y los
heredados de un nodo superior, representan las unidades de
sntesis (definiciones de instrumento, o sintetizadores) que
son representadas como funciones (material lgico),
pudiendo generar seales de audio o de control (vectores)
como parmetros de salida para ser reutilizados dentro de
la estructura jerrquica.
Figura 5 Agrupamiento de nodos emisores y receptores.
Por ejemplo, en la Figura 5 se puede apreciar la relacin
jerrquica entre nodos emisores y receptores. El grupo A
contiene la lista A y los grupos B y C. La lista A (elemento
emisor) representa la 'amplitud que es pasada como
parmetro a los grupos B y C (nodos hermanos). Cada uno
de estos grupos contienen una lista emisora que representa
el parmetro 'frecuencia que es pasado junto con el
parmetro 'amplitud a las funciones A y B que
representan distintas unidades de sntesis (el algoritmo
generador puede ser el mismo o no). Por ltimo, la salida
de las funciones A y B son tomadas como parmetros de
salida de las grupos B y C, y se propagan como salidas del
grupo A. Ntese adems que los nodos se anidan
grficamente y se representa el tiempo como espacio
horizontal para poder expresar la naturaleza temporal de la
estructura. En el siguiente apartado se analizan los
elementos grficos que complementan estas estructuras de
datos.
ELEMENTOS GRFICOS
CORRELACIONADOS
Partiendo de las caractersticas y los tipos de relaciones
temporales y la organizacin jerrquica de las estructuras
de datos que se han expuesto, es fcil trazar un paralelo
visual. Sin embargo, el problema es obtener la
representacin adecuada para cada etapa del proceso de
composicin sonora. Es evidente que para cierto tipo de
manipulacin de datos, el cdigo de programacin es el
recurso ms sinttico y prctico pero en muchos casos, y
sobre todo para la organizacin temporal, los recursos
visuales resultan mucho ms adecuados y facilitan la
edicin. Por estas razones, la organizacin grfica
propuesta se encarga de representar, y facilitar la edicin,
de los materiales generados y deja la representacin de los
materiales lgicos a lenguajes de programacin (salvo que
la abstraccin del material generador especifique
concretamente el espacio temporal que ocuparan como
material generado y sus parmetros temporales de entrada
y salida). Este enfoque permite una interaccin
bidireccional entre los materiales lgicos y los materiales
concretos al estar ambos integrados dentro de una misma
estructura de datos jerrquica.
Para correlacionar las estructuras de datos con los
elementos grficos en dos dimensiones, basta con adjudicar
significado (hacer un mapeo visual) horizontal y vertical a
los valores contenidos. A tal efecto se define como la
unidad grfica a un rectngulo de proporciones variables,
su largo corresponde a la duracin y su altura depende del
tipo de dato y su relacin con otros datos en el eje vertical.
Si bien parece trivial, este concepto es importante porque
todos los objetos grficos complejos se componen por
combinacin de unidades grficas, y porque a partir de
estas se puede definir un conjunto acotado de propiedades
visuales en relacin a la representacin de los datos y
estructuras involucradas.
Propiedades Grficas
Las propiedades grficas detalladas a continuacin son:
relacin vertical, rango vertical, resolucin vertical y
horizontal, y mapeo vertical y horizontal.
La relacin vertical puede ser de dos tipos diferentes,
arbitraria o escalar, debido a que es el parmetro visual
que generalmente se emplea tanto para la organizacin de
diferentes tipos de datos en diferentes estratos, como para
14
Figura 6 Tipos de relacin vertical. En el objeto de relacin escalar se puede apreciar el rango vertical (de 0 a 6) con una resolucin vertical de
1 y un mapeo lineal entre los valores de los objetos y la escala representada visualmente mediante una regla.
Figura 7 Resultante visual de varios agrupamientos.
representar la relacin entre datos del mismo tipo (Figura
6). El rango vertical es simplemente el conjunto de valores
posibles si el tipo de relacin vertical es escalar. La
resolucin vertical es el espacio en altura que ocupan los
objetos y depende del tipo de relacin y del rango vertical.
La resolucin horizontal es la medida visual equivalente al
mnimo perodo temporal representable (el cual puede ser
variable). El mapeo es la transposicin de los valores
representados por las estructuras de datos a los objetos
visuales, pudiendo ser lineal o una distorsin til para la
representacin grfica.
La estructura de datos nodo se representa grficamente
como un rectngulo (unidad grfica) cuya altura depende
de la resolucin vertical, y sus sub-nodos se representan de
la misma manera (propiedad de cierre) hasta llegar al
contenido de los nodos terminales. Si bien los nodos
terminales (e.g. listas y vectores) que representan seales
de audio o de control deben dibujar su contenido de
manera eficiente (no sera prctico dibujar cada uno de sus
elementos internos como nodos aislados), los recursos
grficos son tericamente los mismo que los empleados
para las estructuras (nodos) de ms alto nivel.
La adicin de las propiedades grficas a los distintos
tipos de estructuras de datos y sus relaciones jerrquicas,
aporta coherencia estructural a la representacin y
posibilita las representaciones visuales ms comunes de los
entornos de edicin de sonido. Por ejemplo, la
visualizacin de la forma de onda, el piano roll y el
espectrograma, y tambin las combinaciones grficas que
generalmente dependen del software empleado, por
ejemplo, piano roll y envolvente dinmica, espectrograma
y forma de onda, entre muchas otras.
Al agrupar las estructuras de datos, la resultante visual
puede resultar demasiado compleja si cada elemento
representa en detalle sus componentes, por lo tanto, es
posible determinar uno o varios parmetros como la
resultante visual del material agrupado, pudiendo cambiar
de representacin grfica segn el nivel de detalle que se
quiera trabajar en la edicin. Por ejemplo, en la Figura 7 se
pueden ver distintos materiales agrupados pero con
diferentes resultantes visuales. En el grupo A, la relacin
vertical es arbitraria y se utiliza para organizar los
materiales de los sub-grupos B, C, D y E por canales. El
grupo B no representa grficamente sus componentes
internos solo emplea una etiqueta ('ruido) para hacer
referencia a su contenido. Los grupos C y D representan la
envolvente dinmica como funcin simtrica y las alturas
como piano roll, pero no representa grficamente la
funcin de sntesis o instrumento empleado. Y el grupo E
representa los parmetros de altura y amplitud agrupados
por eventos. Este ltimo grupo es un caso especial porque
agrupa la representacin de dos parmetros en un solo
objeto grfico, la escala vertical es empleada para
determinar la posicin de los objetos en base a la
frecuencia y la resolucin vertical es empleada para dibujar
la envolvente dinmica mediante una funcin simtrica.
Esto recursos visuales son comunes en varios
secuenciadores como HighC, MetaSynth y LMMS entre
otros, pero el enfoque aportado aqu difiere en que no se
imponen restricciones en los elementos grficos como
15
interfaz pre-programada sino que estos se construyen a la
par de las estructuras de datos que representan.
Por ltimo, la edicin visual de los materiales concretos
est sujeta a las caractersticas y relaciones temporales
propias de las estructuras de datos (a diferencia de
Hanappe [6], quin propone layouts para los diferentes
tipos de edicin de los materiales). De la misma manera
que se descartan los procesos lgicos de los materiales
generados, tambin se hace con las propiedades visuales.
Por ejemplo, la edicin de materiales concretos sucesivos
altera sus elementos constitutivos pero no cambia sus
propiedades como sucesin. Sin embargo, aunque no ser
desarrollado en este escrito, cabe mencionar que es posible
convertir un tipo de material en otro para obtener distintos
recursos de manipulacin, aunque tal operacin puede
cambiar, de manera irreversible, el tipo de material
representado.
CONCLUSIONES, APLICACIONES Y
PERSPECTIVAS
Una sistematizacin verstil de estos recursos puede
resultar de gran utilidad para la composicin sonora y
musical y propiciar cierto grado generalidad al simplificar
la redundancia que existe en los diferentes tipos de
representaciones empleadas por distintos entornos
musicales. Pero la generalidad es pretendida como
facilitadora del intercambio de ideas sonoras y musicales y
no como restricciones provenientes de concepciones
especficas sobre cmo debe ser la msica. Esta es la razn
por la cual se propone emplear conjuntos de recursos lo
menos especfico posible y dejar librado a la libertad en la
organizacin la constitucin de las estructuras sonoras y
musicales de ms alto nivel. Sin embargo, las estructuras
de bajo nivel propuestas implican cierto tipo de
restricciones que derivan de las estructuras de datos
propias de la informtica y sus formas de relacionarse. La
hiptesis que lleva a aceptar estas restricciones es que los
recursos de representacin de bajo nivel propuestos por la
computadora como herramienta para manipular sonido no
se pueden cambiar y, por lo tanto, mientras ms cercano
sea el nivel de representacin de las estructuras musicales
bsicas a las estructuras informticas de bajo nivel, mayor
ser el grado de libertad expresiva a la hora de manipular y
concebir materiales sonoros y musicales.
Entre las posibles aplicaciones de este modelo de
representacin se encuentran: la estructuracin comn
(generalizable) de diferentes organizaciones compositivas
de los materiales sonoros, la visualizacin de datos
musicales y su aplicacin como recurso didctico. Tanto la
organizacin de los materiales musicales como la
visualizacin temporal de los mismos es un recurso
importante a la hora de componer y analizar el trabajo
realizado. Al simplificar las estructuras (y las interfaces)
necesarias para trabajar con el sonido es posible centrar el
trabajo en el proceso compositivo de manera ms directa.
Desde el punto de vista de la pedagoga, esto implica poder
enfocarse ms en la materia de estudio y no tanto en los
detalles de la implementacin instrumental.
En este escrito se han presentado las caractersticas
fundamentales del modelo de representacin propuesto, su
relacin con diversos sistemas informticos y la
concepcin de material u objeto musical empleada. Las
funciones de dibujo y agrupamiento grfico que son
expuestas sobre el final de este escrito no han sido
desarrolladas en profundidad. Tampoco han sido expuestos
los tipos de operaciones bsicas para la generacin y
edicin de los materiales, las cuales estn relacionadas con
la dinmica de interaccin entre los elementos grficos
(que representan materiales concretos) y los materiales
lgicos. Estos puntos quedan para etapas posteriores del
proyecto junto con su implementacin en SuperCollider
que est actualmente en desarrollo.
REFERENCIAS BIBLIOGRFICAS
Winsor, P. y Delisa, G. (1991) Computer Music in C,
University of North Texas Press, Denton, Texas.
Agon, C. (1998) OpenMusic: Un Langage Visuel pour
la Composition Assiste e par Ordinateur, PhD,
Universidad Paris VI, Francia.
Bresson, J. (2007) La synthse sonore en composition
musicale assiste par ordinateur, PhD, Universidad
Pars VI. Francia.
Bresson, J. y Agon C. (2008) Scores, Programs, and
Time Representation: The Sheet Object in OpenMusic,
Computer Music Journal, 32:4:31-47, Mit Press,
Massachussets.
Cointe, P. y Rodet, X. (1984) Formes: Composition
and scheduling of processes. Captulo del Libro: The
Music Machine, pages 405-423. MIT Press.
Hanappe, P., (1999) Design and Implementation of an
Integrated Environment for Music Composition and
Synthesis, PhD, Universidad Paris VI, Francia.
Puckette, M. (2002) Using Pd as a score language,
Actas de la ICMC, pp. 184-187.
Yi, S. Blue, a music composition environment for
Csound, en http://blue.kunstmusik.com, pgina web
accedida por ltima vez el 10 de agosto de 2011.
McCartney, J. (2002) Rethinking the Computer Music
Language: SuperCollider, Computer Music Journal,
26:4:61-68, Mit Press, Massachussets.
Schaeffer, P. (1988) Tratado de los objetos musicales,
Ed. Alianza, Madrid.
Roads, C. (2002) Microsound, MIT Press, Cambridge.
Allen, J. F. (1983), Maintaining knowledge about
temporal intervals, Communications of the ACM,
26:11.
Keramane, C. (1995) Structured Temporal
Composition of Multimedia Data, en Actas del
International Workshop on Multi-Media.
Abelson, H., Sussman, G. et al. (1996) Structure and
Interpretation of Computer Programs, MIT Press,
Massachussets.
16
_________________________________
Artculo de Congreso
Montevideo, Uruguay
CARACTERIZACIN SONORA DE LOS TAMBORES DE CANDOMBE
Mateo Gargiulo
1
, Daniel Navarro
1
y Marcos Salazar
2
1
Universidad Tecnolgica de Chile INACAP (2009)
RESUMEN
El presente trabajo de investigacin caracteriza acsticamente aspectos sonoros del Piano, Chico y
Repique, tambores que conforman el conjunto de percusin del Candombe. Para esto se muestran
comparaciones de sus comportamientos al utilizar parches de cuero y de plstico, a la vez que se analiza la
influencia del golpe de mano y palo en la ejecucin de patrones rtmicos. Se presentan estudios sobre sus
patrones de radiacin, comportamiento temporal, comportamiento dinmico y espectros acsticos, con
mediciones realizadas en cmara anecoica.
Los diferentes anlisis permiten concluir que los tambores del Candombe son instrumentos de corta
duracin, que poseen un rango dinmico promedio de 30 [dB] y valores mximos de presin sonora que pueden
superar los 100 [dB] a un metro de distancia. Su radiacin es en todas direcciones con importantes
cancelaciones en la banda de frecuencia que contiene a la fundamental, las cuales se encuentran entre 150 [Hz]
y 320 [Hz]. Los tambores presentan una componente de baja frecuencia producto de la resonancia del cuerpo
del instrumento y sobretonos sin relaciones armnicas con la frecuencia principal.
El actual incremento en la utilizacion del Candombe

por bandas de renombre internacional
1
, inspiradas en
precursores de la Iusion con este ritmo
2
, ha acercado el
candombe a un publico ajeno a la musica uruguaya. Esto
ha provocado un aumento en el numero de grabaciones
que contienen tambores de Candombe Uruguayo Iuera de
la industria local y por ende la necesidad de conocer mas
de estos instrumentos se hace aun mas notoria.
Este ritmo AIro-Uruguayo, que tiene sus inicios en la
segunda mitad del siglo XIX, resulta del ensamble de tres
tambores propios (Piano, Chico y Repique). Estos
instrumentos son membranoIonos de golpe directo, con
una caja resonante en Iorma de barril. Su ejecucion se
realiza mediante golpes de palo y mano generando un
patron ritmico diIerente para cada tambor|1| |2|.
Estos tambores poseen ciertas similitudes con las
tradicionales congas, aunque guardan sus distintivos
entre los cuales se destaca su conIeccion artesanal, la
Iorma de ejecucion y la utilizacion de parches de cuero
crudo, aunque en ocasiones se utilizan membranas
plasticas.
Hoy el candombe es parte importante de la cultura
uruguaya, lo que ha incentivado diIerentes tipos de
1
Bersuit Vergarabat, Bajo Fondo Tango Club, Jorge Drexler, Pedro Aznar, entre
otros.
2
Jaime Roos, Ruben Rada y Hugo Fattoruso.
estudios, de diversas disciplinas, tanto musicales |3| |4|,
sociologicas |5| |6|, incluso trabajos reIeridos a la
escucha y grabacion de los mismos, pero ninguno con un
enIoque acustico.
La acustica musical tiene por inters, entre otros
temas, el estudio de las caracteristicas de radiacion
sonora de los instrumentos, las cuales son unicas,
distintivas de cada uno. Estas particularidades se
determinan por medio de la altura, timbre, duracion,
intensidad y patron de radiacion |7|.
Es posible encontrar diversos estudios de este tipo
realizados a instrumentos de entonacion deIinida y casos
de instrumentos de percusion como el timbal |8|,
redoblante y bombo, que no lo son, pero han motivado a
los cientiIicos por su popularidad y relevancia en la
musica internacional. Tambin en este caso al igual que
otros tantos instrumentos muy especiIicos de regiones
con poca inIluencia internacional en el ambito musical,
los tambores de candombe no han sido considerados en
estos estudios.
Este trabajo busca iniciar una linea de estudio de los
tambores de candombe, mediante la medicion de su
rango dinamico, patron de radiacion y espectro. Analizar
la Irecuencia principal que es la que deIine la sonoridad
del instrumento y los sobre tonos generados por la
membrana circular. Tambin se realizan diIerentes
estudios comparando resultados obtenidos utilizando
parches de cuero y plastico (parche de Tom) y variando
el modo de excitacion, utilizando golpes de mano, palo y
17
GARGIULO ET AL CARACTERIZACION SONORA DE LOS
TAMBORES DEL CANDOMBE
ejecucion de un patron que es combinacion de ambos.
Todas las mediciones Iueron en camara anecoica
utilizando instrumentacion de medicion acustica y
estaciones de grabacion digital de seales
3
.
METODOLOGIA
Metodologa de las mediciones:
Las mediciones acusticas Iueron separadas en
grupos: medicion del espectro y respuesta temporal,
medicion del comportamiento dinamico y medicion de
patron de radiacion.
En todos los casos Iueron utilizados los tres
mismos instrumentos, un chico y un repique construidos
en Chile por Gabriel Blanco, ambos con un sistema de
aro y tensores, el piano es un 'Pocho con cuero clavado.
Dado que el sistema de aIinacion (o temple) no esta
normalizado, este estudio se baso en el criterio del
ejecutante, registrando por medio de un aIinador de
bateria la tension del parche en la primera intervencion,
de manera de poder reproducir el mismo temple en
mediciones subsiguientes. El proceso se realizo en una
Iorma mecanica ajustando los tensores en aquellos
instrumentos que esto era posible y un ajuste un poco
mas Iino con calor hasta lograr la tension adecuada.
Las mediciones del espectro acustico y del
comportamiento temporal se realizaron desde un mismo
registro, con el tamboril en Iorma horizontal. Fue
necesario eIectuar las mediciones con este procedimiento
ya que las dimensiones de la camara anecoica no
permitian medir simultaneamente la radiacion superior e
inIerior del tambor, lo cual era importante para llevar a
cabo comparaciones entre ambos datos. Se midio la
radiacion del parche (parte superior) y la culata (parte
inIerior) simultaneamente excitando la membrana con
golpes de mano, palo y patrones ritmicos basicos el cual
se denominara simplemente como 'patron al reIerirse a
datos obtenidos con este tipo de ejecucion. Se
seleccionaron tres posiciones (centro, borde y mitad) y
cuatro distancias (10 cm, 40 cm, 70 cm y 100 cm); para
la culata las posiciones Iueron dos (al centro de la culata
y 10 cm Iuera de esta) realizadas para las mismas cuatro
distancias. Se registro en Iormato digital para un
posterior proceso.
Las mediciones de patron de radiacion se
realizaron con un arreglo de microIonos previamente
calibrados, Iormando 1/8 de esIera de 1 metro de radio y
con separaciones de 10 grados. Se llevaron a cabo dos
metodologias distintas para la medicion de la parte
superior e inIerior, las cuales Iueron realizadas con el
tambor en Iorma vertical y horizontal respectivamente.
Estas dos Iormas de medir permitieron superar los
problemas de espacio y aseguraron una medicion optima
de la parte superior con el tamboril en posicion vertical.
La excitacion de la Iuente provino de la ejecucion por
parte de un experto, joven percusionista Uruguayo-
Chileno, uno de los principales tocadores de la comparsa
Catanga de la ciudad de Santiago. Se ejecuto el patron
basico para cada tambor durante 30 segundos.
Circunstancias logisticas y de alcance del presente
estudio no permitieron evaluar resultados obtenidos de
diIerentes ejecutantes.
El comportamiento dinamico Iue medido con dos
sonometros
4
simultaneamente, colocados a 10 cm y 100
3
Se utilizo para la medicion: microIonos Behringer ECM8000,
preampliIicador Presonus Digimax LT, una interIaz de audio M-Audio Iirewire 1814
y un computador MacBook Pro.
4
Svantek 943 B
cm del parche, para cada tambor. Se ejecuto 3 veces el
patron ritmico base durante un periodo de tiempo de 30
|s| a 40 |s|, con tres intensidades diIerentes (suave,
medio y Iuerte), en este caso el tambor Iue colocado de la
manera convencional colgado del ejecutante con el Tali.
Metodologa de anlisis:
Para los estudios de comportamiento temporal,
espectral y de radiacion, todos los archivos que contenian
los registros Iueron editados y procesados en Matlab de
Iorma automatizada, detectando los inicios y Iinales de
cada ejecucion utilizando condiciones de umbrales
reIeridas al ruido de Iondo de cada archivo. Para obtener
el espectro se aplicaron ventanas Hanning de 2
14
puntos
y FFT de 2
16
puntos. Mediante inspeccion visual se
determinaron las Irecuencias principales y los sobre
tonos correspondientes. Para el analisis se realizaron
graIicos con la Irecuencia principal y los sobre tonos que
no tuviesen mas de 20 db de diIerencia con la principal.
Se contrastaron los resultados obtenidos con diIerentes
tipos de parches o los diIerentes tipos de golpes. Otro
analisis realizado Iue la comparacion del espectro
obtenido de la medicion de la parte superior vs. inIerior
de los tambores.
Para el caso de la respuesta temporal,
simplemente se programo la localizacion del punto de
inicio en el archivo wav, mediante la deteccion del
cambio brusco de pendiente. El punto de maximo valor
se localizo con una Iuncion especiIica y el Iinal se
detecto cuando la seal igualaba el ruido de Iondo.
Conociendo estos tres puntos se calcularon valores de
ataque y decaimiento con sus respectivas pendientes. Se
calcularon valores de medias y varianza para determinar
valores unicos de ataque y decaimiento de cada tambor,
para cada golpe. Finalmente se realizaron analisis
estadisticos de comparacion de media y varianza para
relacionar los resultados equivalentes a los diIerentes
tambores.
El analisis del comportamiento dinamico se
llevo a cabo con los datos obtenidos de los sonometros,
ordenados y graIicados en Excel.
RESULTADOS
Comportamiento temporal:
La Tabla 1 muestra todos los valores ya
promediados de ataque, decaimiento y sus respectivas
pendientes.
Del analisis estadistico se determina que el
ataque para una ejecucion con palo en todos los casos es
mas rapido que al ejecutarse con mano. Por otra parte, al
comparar los ataques entre los diIerentes parches de un
mismo tambor se observo que para la ejecucion con
mano los tiempos de ataque no variaron, mientras que la
ejecucion con palo entrego tiempos mas cortos para el
parche de plastico.
Respecto al decaimiento, se determino que para
el Chico de cuero el tipo de ejecucion no genera
alteraciones, mientras que el Chico de plastico muestra
una mayor pendiente de decaimiento al ser ejecutado con
mano. El Repique con cualquiera de los dos parches
presenta mayores pendientes de decaimiento al ejecutarse
con mano. El Piano presenta una mayor pendiente de
decaimiento al ejecutarse con palo.
18
19
Figura 6. Comparacion entre Chicos.
Figura 7. Comparacion entre Repiques
Las Figuras 6 y 7 contienen graIicos
comparativos de las componentes de un mismo tambor,
ejecutando un patron ritmico basico, utilizando dos tipos
diIerentes de parches: plastico y cuero.
En primer lugar se puede decir que si se
consideran las diIerencias iniciales que existen entre las
Irecuencias principales, producto de la aIinacion, puede
aseverarse que mucho los sobre tonos coinciden o se
aproximan en Irecuencia. No sucede lo mismo con la
amplitud, la cual es superior en el parche de plastico en
todos los casos que existen similitudes en Irecuencia.
Tambin puede observarse que el parche de plastico
presenta un mayor numeros de sobre tonos en
Irecuencias superiores, lo que no quiere decir que el
parche genere mas sobre tonos, si no que estos tienen
mayor amplitud en relacion a la Irecuencia principal.
Este analisis permite relacionar las caracteristicas
acusticas del tambor con la sonoridad caracteristica de
cada parche. El mayor numero de sobre tonos
inarmonicos y de mayor energia que genera el parche de
plastico explica la sonoridad estridente, artiIicial,
metalica,
5
etc. que se le atribuye.
La Iigura 8 muestra de manera superpuesta los
espectros obtenidos de la parte superior del tambor (el
parche o boca) y la inIerior (culata). Observando la curva
es evidente que la componente de baja Irecuencia,
inIerior a la Irecuencia principal de la membrana, posee
un nivel mayor cuando la medicion se hace desde la
culata del tambor. Esto permite inIerir que no es una
Irecuencia que tenga relacion con la membrana sino con
el cuerpo del tambor. Para comprobarlo se realizo un
estudio teorico considerando el tambor un tubo abierto de
seccion constante (tabla N
o
3).
Puede observarse en la tabla N
o
3 que las
diIerencias existentes entre los datos reales y teoricos son
pequeas, lo que conIirma el supuesto de que esta
5
Sonido estridente, metlico, artificial, son calificativos utilizados por los expertos en
esta msica para referirse a la sonoridad del parche de plstico.
componente de baja Irecuencia recurrente en todas las
mediciones, es aportada por el cuerpo del tambor y no
por su membrana. Las menores diIerencias se
encontraron en el Chico y las mayores en el Piano,
producto de la aproximacion a un tubo recto, la cual es
mas exacta en el Chico ya que este es el que presenta
menor curvatura en la caja del instrumento.
Figura 8. Espectro obtenido de la boca y la culata del
tambor Chico con parche de cuero.
Tambor F teorica- F medida (Hz)
Piano 9
Chico-parche de cuero 2
Chico-parche de plastico 1
Repique-parche de cuero 3
Repique-parche de plastico 3
Tabla 3. DiIerencias entre Irecuencias teoricas y medidas
del cuerpo del tambor.
Espectro acstico en el tiempo:
Figura 9. Repique de cuero ejecutado con palo.
Estas dos Iiguras: 9 y 10, son los ejemplos mas claros
obtenidos de las mediciones, donde se observa que los
sobre tonos se agrupan en Iamilias. En la Figura 9 se
observa claramente dos picos ademas de la principal. El
primero se encuentra alrededor de los 450 |Hz|, con
menor amplitud en el ataque pero mayor duracion que el
segundo, cercano a los 650 |Hz|. Cada uno de estos picos
aglomera un conjunto de sobre tonos que no es posible
distinguir debido a la resolucion del espectrograma. En la
Figura 10 los picos no estan tan deIinidos como en la
20
ejecucion con palo. Se observa un pico que contiene
varios sobre tonos Iormando un unico lobulo con un
ancho de banda extenso, pero luego en el decaimiento se
pasa a distinguir Iacilmente dos grupos.
Figura 10. Repique de cuero ejecutado con mano.
Patrones de radiacin.
Las Iiguras 11-15 muestran el patron de radiacion
de los tres tambores estudiados con los diIerentes
parches. Los aspectos mas destacables son dos: en primer
lugar la cancelacion que se observa muy clara en tres de
los tambores para la banda de 250 Hz, que es la que
contiene a la Irecuencia principal que se encuentra entre
250 y 300 Hz en Chico y Repique. Si se considera la
dimension del tambor que es aproximadamente 80 cm,
que las longitudes de onda de las Irecuencias estudiadas
son cercanas al metro, el comportamiento de la
membrana como dipolo para el modo (01) |8| y que la
medicion se realizo a un metro del centro geomtrico del
instrumento, se hace evidente que debe existir una
superposicion destructiva y que esta debera estar un poco
desplazada del eje horizontal del tambor. El caso del
Piano es diIerente, ya que la longitud de onda de la
Irecuencia principal duplica las dimensiones del
instrumento, lo que diIiculta estudiar la interaccion a un
metro de distancia.
Figura 11 Chico de cuero
Patrn de radiacin para las bandas de 63, 125, 250 y 500 Hz
Figura 12 Chico de plstico Figura 13 Piano
Figura 14 Repique de cuero Figura 15 Repique de plstico
21
22
CONCLUSIONES
Los tambores del Candombe son instrumentos
de acotada duracion, tiempos de ataque muy cortos que
oscilan ente 1,5 y 5 ms para golpes con palo y entre 10 y
30 para golpe con mano. El decaimiento es largo
respecto de su duracion, se encuentra entre los 300 y 800
ms; si se toma en cuenta que no existe sostenimiento, es
practicamente el total de la duracion.
Las comparaciones entre tipos de parches y
Iormas de ejecucion entregan como conclusion principal
que el golpe de mano no genera diIerencias en el ataque
al utilizar un tipo de parche u otro.
Respecto al patron de radiacion de los
tambores se puede decir que son instrumentos que por lo
general muestran algunas cancelaciones importantes,
resultado de la interaccion de la radiacion superior e
inIerior del instrumento. Poseen mayor radiacion de
Irecuencias bajas hacia la parte inIerior del instrumento.
Estos datos permiten determinar que no son omni
direccionales.
Son instrumentos de altos niveles de presion
sonora, con rangos dinamicos de 30 |dB|. Es posible
superar los 120 dB cuando son ejecutados con gran
intensidad e incapaces de generar valores menores a las
60 dB, por lo menos sin perder las caracteristicas
sonoras.
Se comprobo que los tambores de Candombe
son instrumentos de percusion de entonacion indeIinida,
donde sus Irecuencias principales se encuentran en el
rango entre 150 |Hz| y 316 |Hz|, dependiendo del tipo y
la aIinacion.
Los tambores con parche de plastico respecto a
los de cuero poseen una mayor cantidad de sobre tonos,
con Irecuencias mas altas y diIerencias de niveles
inIeriores respecto al modo principal. Estas
observaciones permiten explicar de una manera cientiIica
las diIerencias notorias en la sonoridad de los diIerentes
parches.
Es importante resaltar el resultado obtenido
sobre la relacion existente entre el espectro de los
diIerentes golpes y el patron que los incluye. Se puede
concluir que para los patrones ritmicos basicos, el golpe
de mano resulto mas inIluyente o por lo menos presento
mayores coincidencias con el espectro del patron.
Este trabajo inicia un camino en el estudio de
estos instrumentos, logrando datos y respuestas
importantes. A su vez genera un antecedente para
utilizarse como Iuente de consulta en la proIundizacion
de Iuturos estudio de tambores de Candombe,
aprovechando sus metodologias y resultados. Se propone
puntualizar y mejorar el estudio de alguna caracteristica
especiIica de los instrumentos o investigar aspectos que
ni siquiera Iueron considerados en este trabajo. Algunos
ejemplos son: el estudio del tambor como un idioIonos,
su modelacion matematica mediante elementos Iinitos o
un estudio como sistema resonante para un estudio mas
acabado de la inIluencia del cuerpo del tambor, el estudio
del espectro de otros tipos de golpes y ejecutantes, entre
otras posibilidades.
REFERENCIAS
|1| Ferreira, Luis Los Tambores del Candombe
Primera Edicion Montevideo Ediciones Colihue
1997. Pags 80 a 99.
|2| Tomas Olivera Chirimini, Juan Antonio Varese-
Memorias del Tamboril- Ediciones de la Banda
Oriental. Pags 49 a 53.
|3| Luis Jure - 'Perico suba ahi- Ponencia en el VII
Argentina de musicologia 1992.
1997. Pags 100 a 192.
|5| Tomas Olivera Chirimini, Juan Antonio Varese-
Memorias del Tamboril- Ediciones de la Banda
Oriental. Pags 13 a 26.
1997. Pags 29 a 79.
|7| Olson, Harry F. Music, Physics and Engineering
Second Edition New York Dover Publications
Inc. 1967
|8| Thomas D. Rossing (Ed.)- Springer Handbook oI
Acoustics - Springer Science Business Media 2007.
Pags 533 a 567.
23
_________________________________
Artculo de Congreso
Montevideo, Uruguay
_________________________________
Un ModeIo AIgebraico para eI Procesamiento de Audio
Guillermo Pozzati
1
y Miguel Calzn
1,2

1
Instituto Universitario Nacional del Arte (IUNA), Departamento de Artes Musicales (DAMus),
Centro de Investigaciones y Desarrollos Computacionales en Msica (CIDCoM)
Buenos Aires, C1120AAG, Argentina
2
Universidad de Buenos Aires (UBA), Facultad de Ingeniera, Departamento de Matemtica,
Buenos Aires, C1063ACV, Argentina
{pozzati, macalzon}@retina.ar
RESUMEN
INTRODUCCIN
1 LA ESTRUCTURA DE GRUPO
1.1 Definicin de Grupo
24
POZZATI Y CALZON UN MODELO ALGEBRAICO
CONGRESO LATINOAMERICANO DE LA AES 2011, MONTEVIDEO, 30 DE AGOSTO A 1 DE SETIEMBRE 2011
1.2 EI Grupo de Ias Rotaciones deI Cubo
Figura 1 "Posicin de un cubo asociada a la permutacin
[12345678]
Tabla 1 "Permutaciones asociadas al Grupo de Rotaciones del
Cubo
APLICACIN AL PROCESAMIENTO DE AUDIO
2.1 AIgoritmo
Figura 2 "Fragmentacin del archivo correspondiente a N = 2
Figura 3 "Permutacin de los bloques internos de ancho
2.2 Factor de SoIapamiento
25
Figura 4 "Solapamiento parcial de bloques 5 y 7
EL EFECTO DE PANEO ALGEBRAICO
Figura 5 "Disociacin entre canales derecho (R) e izquierdo (L)
RESPUESTA A SINUSOIDES

Figura 6 "Relacin entre valores de entrada y las cantidades y
Tabla 2
26
Figura 7 "Espectros de Magnitud correspondientes a la Tabla 2
Tabla 3
Figura 8 "Espectros de Magnitud correspondientes a la Tabla 3
Figura 9 "Patrones regulares asociados a las permutaciones
CONCLUSIN Y TRABAJO FUTURO
27
28
_________________________________
Artculo de Congreso
Congreso Latinoamericano de la AES 2011
Montevideo, Uruguay
Este articulo es una reproauccion ael original final entregaao por el autor, sin eaiciones, correcciones o consiaeraciones
reali:aaas por el comite tecnico. La AES Latinoamerica no se responsabili:a por el conteniao. Otros articulos pueaen ser
aaquiriaos a traves ae la Auaio Engineering Society, 60 East 42
na
www.aes.org. Informacion sobre la seccion Latinoamericana pueae obtenerse en www.americalatina.aes.org. Toaos los
aerechos son reservaaos. No se permite la reproauccion total o parcial ae este articulo sin autori:acion expresa ae la AES
Latinoamerica.
_________________________________
sebastian.ausili@gmail.com, alejo.dirisio@gmail.com, germansaid@gmail.com, quimmansilla@gmail.com
El Teatro Nacional Cervantes es el unico teatro de la Republica Argentina que ostenta dicho titulo. Su uso
principal es para obras y por ende, palabra hablada con poca presencia de pasajes musicales o instrumentos en
vivo en el escenario. En el presente trabajo se detallan las mediciones de los parametros acusticos dentro del
mismo llevadas a cabo en Diciembre del 2010 acorde con la norma ISO 3382. Se realizaron dichas mediciones
con tres mtodos validos y se comparo el error entre dos de ellos. Se detalla el equipamiento y el procedimiento
llevado a cabo para la obtencion de los parametros con cada uno de estos mtodos. Se muestran los resultados y
se los cataloga segun los valores recomendados para dichos recintos en el uso del habla.
0 INTRODUCCIN
El Teatro Nacional Cervantes es el unico teatro que
ostenta el titulo de teatro nacional y tiene una actividad
constante, a lo largo de todo el ao, presentando tanto
obras de todo el pais como obras internacionales invitadas.
Inaugurado en 1921 y reinaugurado en 1968 tras un
incendio, el teatro siempre Iue pensado para un uso
cotidiano del habla y no de la musica. Esta localizado en el
centro de la ciudad de Buenos Aires sobre la avenida
Cordoba 1155. La sala principal "Maria Guerrero", sobre la
cual se realizaron las mediciones, cuenta con una Iosa para
orquesta, pero como complemento a obras teatrales. Hoy
en dia, el uso de la Iosa es casi inexistente. Su capacidad es
de ochocientas sesenta personas en la platea principal y
otras trescientas cuarenta y ocho en todos los diIerentes
palcos superiores, dando un total de capacidad de mas de
mil doscientas personas. El escenario esta sobre un espacio
paralelepipedo que domina todo el Iondo de escenario y
tiene una altura considerable. El resto de la sala tiene una
conIormacion de herradura, tipica de teatros con diseo
barroco. En la Figura 1, vemos un esquema tridimensional
de ella.
Figura 1 - Vista esquemtica del Teatro Nacional Cervantes
29
AUSILI Y DI RISIO MEDICIN DE PARMETROS ACSTICOS DEL TEATRO
NACIONAL CERVANTES
En caso de tener musicos, las obras incorporan a los
mismos sobre el escenario y son en general
complementados con el sistema electroacustico con el que
cuenta la sala. El mismo consiste en microIonos
inalambricos (conocidos vulgarmente como corbateros)
sobre los instrumentos o sobre los actores. Se les provee de
un reIuerzo sonoro mediante un sistema electroacustico,
que incluye una consola Yamaha DX-7, y un conIiguracion
de parlantes en Iormato array QSC de 4 cajas por lado
posicionado sobre los palcos avanc y dos gabinetes
trapezoidales, apoyados sobre el escenario en direccion
hacia la sala. Tambin se usan para reproducir musica
Iuncional o anuncios de las obras a su comienzo y Iinal.
1 EQUIPAMIENTO
Se detalla a continuacion el equipamiento usado para
realizar dichas mediciones. Todo el equipamiento Iue
provisto por la Universidad Tres de Febrero y debidamente
calibrado y puesto a punto antes de su uso en el Teatro.
El ruido de Iondo y las calibraciones Iueron realizadas
con un sonometro tipo 1 de la marca Svantek, modelo
959 que cumple con la norma IEC 61672:2002 |1|. A
modo de adquisicion de datos y para la obtencion de las
muestras digitales se usaron interIaces MOTU Traveler.
Estas muestras se registraron en sesiones del multipista
Logic en una MacBook Pro.
Los microIonos de medicion usados Iueron dos DPA
4007 y dos Earthworks M50 con respuesta en Irecuencia
y sensibilidad conocida. Fueron calibrados el dia de la
medicion junto a la etapa preampliIicadora de la MOTU de
modo de obtener la misma respuesta de entrada en la etapa
de grabacion en los cuatro microIonos para una seal de
potencia conocida. De esta manera se minimizo el error de
tener sensibilidad y respuesta distinta en los microIonos.
En simultaneo tambin se eIectuo la grabacion de todas las
mediciones con un microIono SOUNDFIELD, para
posterior analisis del vector campo sonoro del mismo. Los
resultados de este ultimo analisis no seran aqui
presentados.
La Iuente omnidireccional usada es de la marca
Outline. El dodecaedro y su potencia Iueron usados con
su correspondiente subwooIer, de cono unico, considerado
omnidireccional para el rango de Irecuencias al cual es
usado. El nivel de potencia en el cual se los uso Iue
siempre el mismo, de manera de evitar cualquier tipo de
calibracion necesaria para cada medicion distinta.
2 METODOLOGA DE LAS MEDICIONES
La metodologia de las mediciones que se llevo a cabo
responde a aquella descripta en la norma ISO
3382:1991|2|. Debido a que el equipamiento antes
descripto en todo momento cumple con las condiciones
necesarias para la medida, la unica otra condicion por
satisIacer Iue la distancia minima entre microIono y Iuente
requerida, que cumple con la siguiente ecuacion
De acuerdo con el volumen calculado, 3700m
3
, y
estimando un tiempo de reverberacion de 1,6 segundos, la
distancia minima, dio como resultado 5,19 metros. Esto Iue
considerado al momento de elegir las posiciones de
microIono. Por ultimo, se asume que todas las partes del
volumen del recinto se comunican de Iorma acusticamente
uniIorme. De esta manera se procede a elegir las
posiciones de microIono a lo largo de la sala, cubriendo
uniIormemente tanto la sala como los pisos superiores. Las
mediciones se realizaron a sala vacia y con la cortina
principal del escenario corrida. Ningun material
escenograIico se encontraba en el escenario en el momento
de las mediciones.
Figura 2 - Puntos de medicin en la platea
Se registraron dos posiciones de Iuentes sobre el
escenario. Una de ellas en el punto medio, y la otra sobre
uno de los lados, asi rompiendo la simetria de acuerdo con
lo expuesto en Ando, Sato |3|. Para cada una de estas
posiciones se deIinieron 8 posiciones de microIonos (dos
posiciones diIerentes para cada transductor). En cada una
de estas diecisis combinaciones se eIectuaron tres
repeticiones de cada medicion. Esto se diseo de modo de
poder disminuir la varianza de las mediciones y lograr un
resultado lo mas cercano posible del valor global del teatro.
En la Figura 2 se muestran las diIerentes posiciones
elegidas para los microIonos de platea y en la Figura 3 las
de los pisos. En cada una de ellas las posiciones 1-4 son
para la primer Iuente y las 5-8 para la segunda.
Figura 3 - Puntos de medicin en palcos y pisos
Se usaron tres mtodos distintos de modo de poder
comparar sus resultados, repetibilidad y precision en todas
las bandas de Irecuencia.Ellos Iueron los siguientes:
El mtodo del ruido interrumpido (cuyos
resultados aqui no se muestran),
El mtodo de respuesta impulsiva integrada con
excitacion de un barrido sinusoidal de Irecuencia
logaritmicamente creciente (Log Sine-Sweep)
El mtodo de respuesta impulsiva integrada con
excitacion de una Iuente impulsiva.
30
NACIONAL CERVANTES
El barrido empleado en las mediciones Iue generado con
el SoItware Aurora, para mas tarde poder usar este
mismo programa para deconvolucionar las respuestas al
impulso. A modo de respuesta impulsiva se usaron globos
debido a la imposibilidad de usar dentro del teatro material
explosivo debido a el riesgo de incendio. Se usaran a modo
de comparacion ya que como demostro Jambrosic |4| su
rendimiento en bajas Irecuencias es pobre y su
repetibilidad inexistente.
Sobre cada una de estas mediciones se extrajeron los
parametros acusticos usando el soItware EASERA.
Estos calculos se realizaron en paralelo para todas las
bandas de octava de 125Hz a 8KHz. Para ampliar el
analisis eIectuado, se considero incluir tambin las bandas
de 31Hz, 63 Hz y 16 kHz, para lo cual se utilizaria el
programa Aurora, ya que una comparacion entre los
resultados de ambos programas reIlejo variaciones en los
resultados menores a 0.05. Sin embargo, ya que el
analisis se centra en la inteligibilidad de la palabra, dichas
bandas no seran tenidas en cuenta. Esto se debe
principalmente a que ambos programas trabajan con
integracion invertida y cumplen la norma ISO 3382. Una
vez obtenidos los valores de todos los parametros para cada
una de las diecisis combinaciones de Iuente-receptor
disponibles, estas se promediaron aritmticamente y la
varianza Iue calculada. Los resultados se muestran en el
segmento siguiente.
Los parametros que se calcularon y promediaron para
todas las mediciones son los siguientes:
EDT, T10,T20,T30,
C50, C80, D50
RASTI, ALCONS
3 RESULTADOS
En la siguiente Iigura se incluye la medicion de ruido de
Iondo eIectuada con el sonometro y la reIerencia de ruido
de Iondo del teatro sobre la cual se eIectuaron las
mediciones. Dichas mediciones Iueron realizadas con el
sistema de ventilacion encendido, condicion en la cual
generalmente se usa la sala, para lo cual se adjunta en la
Figura 4 la curva NC correspondiente.
Figura 4 - Curva NC con sistema de ventilacin
Esto posiciona al teatro en una curva de Noise Criteria
de NC-45.
Durante el procesamiento de las mediciones impulsivas
que utilizaban globos, se noto que muchos de los valores
obtenidos eran deIectuosos. Al indagar en esto, se encontro
que el rango dinamico necesario para los calculos de
algunos de los parametros no estaba siendo alcanzado en
Irecuencias bajas y medias bajas. Se incluye a continuacion
en la Tabla 1 un detalle del rango dinamico para dichas.
Puede observarse que recin a partir de los 376 Hz se
alcanza un rango dinamico de 30 dB o mas.
Tabla 1 - Relacin seal-ruido de impulsos
Por lo arriba expuesto, se mostrara a continuacion la
serie de mediciones obtenidas mediante el Log- Sine
Sweep. En esta serie, el rango dinamico obtenido para cada
banda de Irecuencias es mucho mayor al obtenido con
globos. Esto no solo se debe a la naturaleza de la Iuente
usada, sino que al excitar cada banda por separado, se
obtiene un mayor rango dinamico sobre el mismo piso de
ruido.
Aunque es cierto que existen mtodos impulsivos que
logran un buen rango dinamico en todas las bandas de
Irecuencia (como lo pueden ser los que involucran
pirotecnia), su grado de repetibilidad no es para nada
comparable con el mtodo de Log Sine Sweep. Este
mtodo es principalmente deterministico, debido a que la
seal comparte dicha caracteristica intrinsecamente.
A continuacion, se muestran las tablas en bandas de
octava para el EDT, el T30, D50, C80 y ALCONS. Se
denotan todos los resultados de Iuentes y posiciones. Las
tablas responden a la media aritmtica entre las tres
repeticiones para cada medicion y combinacion Iuente-
receptor.
31
NACIONAL CERVANTES
En la Tabla 2 a continuacion, los resultados para C50, relacion entre la energia acustica inicial y la Iinal
Tabla 2 - C50 obtenido mediante barrido frecuencial
En la Tabla 3 los resultados para D50, relacion entre la energia acustica inicial y la total
Tabla 3 - D50 obtenido mediante barrido frecuencial
En la Tabla 4 se muestra el tiempo de caida inicial
Tabla 4 - EDT obtenido mediante barrido frecuencial
En la Tabla 5 se detalla el T30, tiempo de reverberacion estimado a partir de la caida de 30dB. Esto probo ser totalmente
imposible en los globos debido a la Ialta de rango dinamico en dichas mediciones.
Tabla 5 - T30 obtenido mediante barrido frecuencial
32
NACIONAL CERVANTES
En la Tabla 6, se encuentra el parametroALCONS, porcentaje de prdida de articulacion de consonantes
Tabla 6 - ALCONS obtenido mediante barrido frecuencial
Por otro lado, el analisis modal pertinente de la sala no
Iue eIectuado debido a que se siguio la siguiente Iormula
|5|
La cual nos devuelve la Irecuencia limite superior
(Frecuencia de Schroeder |5|) a partir de la cual los modos
de la sala tienen una inIluencia practicamente nula |5|. Ya
que el RTMID calculado de la sala es de 1,37 seg y siendo
V3700m3, esto posiciona a la Irecuencia limite superior
en los 36 Hz. Debido a que el teatro se usa principalmente
para el habla y ocasionalmente para musica, se considera
que Iuentes que emitan contenido energtico no
despreciables en ese rango de Irecuencia son inexistentes
bajo todo punto de vista. El Ienomeno anterior Iue
observado por KuttruII, quien declara que dichas
mediciones se deben llevar a cabo a partir de los 50Hz-
100Hz. |6|. Por esta razon, el analisis modal no sera
eIectuado.
4 CONCLUSIONES
Una vez obtenidos los resultados, se comprobo que el
mtodo del Sweep es el mas eIectivo y conIiable para
realizar dichas mediciones, debido a que es el mtodo que
prueba tener la mejor relacion seal ruido en todo el
espectro audible. El mtodo de obtencion de la respuesta
impulsiva mediante el uso de globos por otro lado, prueba
ser un mtodo con muy poca repetibilidad y que tiene un
contenido energtico insuIiciente en bajas Irecuencias. De
este modo, se tomaran en cuenta principalmente los
resultados de las mediciones eIectuadas con el Sweep. En
la Tabla 7 eIectuada por Antoni Carrion Isbert |7| se
incluyen, a modo de reIerencia, una tabla de valores de
parametros acusticos recomendados para teatros dedicados
al habla y la musica.
Tabla 7 - Valores recomendados segn CarrinIsbert
Se ve entonces que la Sala Maria Guerrero del Teatro
Nacional Cervantes, al ser comparada con los valores de
reIerencia de la tabla precedente muestra ser un poco mas
'viva o reverberante que lo recomendado para dichas
salas. Mientras el RTMID para salas de teatro recomendado
es entre 0,7 y 1,2 la sala presenta un RTMID de
aproximadamente 1,4. El C50, por otro lado tambin da un
poco por debajo de la norma ya que tendria que ser mayor
a 2dB y estamos viendo que un promedio global de 1,55.
Con el D50 por otro lado, el valor obtenido se encuentra
dentro de los parametros de valor recomendado, ya que
0,58 es un buen valor de deIinicion (han de ser mayores a
0,5). Para porcentaje ALCONS tambin se sobrepasa un
poco lo recomendado, pero se sigue manteniendo un muy
buen valor, ya que el porcentaje de perdidas es muy bajo.
Globalmente, vemos entonces que mientras que el teatro
se muestra a si mismo con los valores ligeramente por
arriba de los recomendados, denota unos valores muy
cercanos a ellos. Es crucial sin embargo tener en cuenta
que todos estos valores Iueron experimentalmente
obtenidos con la sala vacia. Es de esperar que en una
Iuncion cotidiana con sala llena, la absorcion adicional
aportada por los mas de mil doscientos espectadores sea no
solo suIiciente, sino ideal para corregir este exceso de
reverberacion en la sala. Al bajar asi el tiempo de
reverberacion, disminuira el caracter reIlejante y 'vivo
que denota la sala, alcanzando valores dentro del rango de
excelencia para los parametros. Es por esto que la Sala
Maria Guerrero goza de tan buena reputacion y es
reconocida en el ambito teatral como una sala muy
placentera para los actores y publico.
33
NACIONAL CERVANTES
La curva NC-45 del teatro prueba ser excesiva para este
sin embargo ya que Carrion Isbert recomienda una curva
de NC-15 (aunque admite tambin la de NC25). Las
principales Iuentes de ruido de Iondo eran el sistema de
reIrigeracion, es poco viable la reduccion de los mismos a
menos que se realicen reIormas estructurales muy
importantes.
ISO / IEC Stage 61672 International Stardarisation
Organisation "Electroacoustics-Sound Level Meters",
Gnoba, Suiza 2010.
ISO 3382 Acustica. Medicion del tiempo de
reverberacion de recintos con reIerencia a otros
parametros acusticos. 1997
Ando Y., Sato S., Nakajima T. y Sakurai M.
'Acoustic design oI a concert hall applying the theory
oI subjective preIrence and the acoustic measurement
aIter construction Acustica acta acustica Vol. 83 pp
635-643. 1997
Jambrosic, Kristian 'RT Measurements. Primer
Congreso de Acustica UNTREF 2008
Schoreder, M.R. Journal Acoustical Society oI
America, 36 (1964) 1718.
KuttruII , Heinrich 'Room Acoustics 254-257, 1991,
Tercera edicion
Carrion Isbert, Antoni 'Diseo Acustico de Espacios
Arquitectonicos. Barcelona 1998.
Ando Y. 'Auditory and Visual Sensations 1997
in Measurement. ISO, Genova, Primera Edicion 1993
34
_________________________________
Artculo de Congreso
Montevideo, Uruguay
Este articulo es una reproauccion ael original final entregaao por el autor, sin eaiciones, correcciones o consiaeraciones
reali:aaas por el comite tecnico. La AES Latinoamerica no se responsabili:a por el conteniao. Otros articulos pueaen ser
aaquiriaos a traves ae la Auaio Engineering Society, 60 East 42
na
www.aes.org. Informacion sobre la seccion Latinoamericana pueae obtenerse en www.americalatina.aes.org. Toaos los
aerechos son reservaaos. No se permite la reproauccion total o parcial ae este articulo sin autori:acion expresa ae la AES
Latinoamerica.
_________________________________
Parmetros acsticos en saIas para msica y prosa:
Teatro MunicipaI Tres de Febrero de Ia ciudad de Paran
Gustavo Jorge Basso
1
, Mara Andrea Farina
1
, Valeria Paola Cejas
1
y Luis Federico Jaureguiberry
1
1
Universidad Nacional de La Plata, Facultad de Bellas Artes, Ctedra de Acstica Musical
La Plata, 1900, Buenos Aires, Argentina
basso@isis.unlp.edu.ar
RESUMEN
El Teatro Municipal 'Tres de Febrero de la ciudad de Parana corresponde a la tipologia de teatro italiano con
planta en Iorma de herradura. El presente trabajo describe el estudio acustico del estado actual de la sala
realizado por investigadores de la Facultad de Bellas Artes de la Universidad Nacional de La Plata. El programa
de actividades incluyo la recopilacion de la documentacion existente, el relevamiento en obra, la conIeccion del
material graIico necesario para la investigacion y la medicion de niveles de ruido y de campo acustico segun
norma ISO 3382 realizada en septiembre de 2010.
0 INTRODUCCIN
Existen en la Republica Argentina mas de 80 auditorios
y teatros de tamao medio y grande, pero no se conocen
datos sobre la acustica de la mayoria de ellos. Para
solucionar esta Ialta de inIormacion, en la Universidad
Nacional de La Plata se esta desarrollando un proyecto de
investigacion que pretende relevar, medir en norma y
estudiar la acustica de al menos las salas mas importantes
desde el punto de vista de su uso por la comunidad. La
acustica de estas salas contribuyo a conIigurar el "sonido"
caracteristico de las orquestas sinIonicas y liricas en
nuestro pais, no menos que el de gneros populares entre
los que el tango Iigura en un lugar destacado. El estudio y
la comprension de la acustica de dichos espacios resulta
insoslayable a la hora de integrar el desarrollo historico de
la musica en nuestro pais durante los siglos XIX y XX.
Constituye una herramienta indispensable para rescatar el
valor patrimonial arquitectonico e historico desde la
perspectiva acustica, Iundamental a la hora de evaluar
cualitativamente su signiIicado para la comunidad.
La base de datos, que ya contiene 7 teatros analizados,
posee tres nitidos campos de aplicacion. En primer trmino
permitira investigar las posibles relaciones que vinculan las
caracteristicas estilisticas de la musica de cada localidad
con los espacios concretos en los que se representa. En
segundo lugar existe la intencion de elaborar un mapa
acustico de salas y teatros de la Argentina que permita
conIigurar las hojas de ruta de las agrupaciones artisticas
itinerantes -grupos instrumentales de camara, agrupaciones
corales, conjuntos sinIonicos, compaias teatrales, etc. En
tercer trmino, la conIeccion de una base de datos
acusticos normalizados permitira contar con un registro
historico que podra ser consultado por diIerentes motivos,
por ejemplo para encarar reIormas arquitectonicas o en
caso de siniestro. Ante esta ultima posibilidad es pertinente
citar el articulo de Angelo Farina y Regev Ayalon
'Recording concert hall acoustics Ior posterity |1|, en el
que los autores destacan la importancia de haber tenido
mediciones acusticas normalizadas para la reconstruccion
de La Fenice de Venecia luego del incendio de 1996.
35
BASSO ET AL. TEATRO MUNICIPAL TRES DE FEBRERO
En este articulo se presenta una descripcion general y
algunos de los resultados de la medicion en norma ISO
3382 del Teatro Municipal Tres de Febrero de la ciudad de
Parana en el marco del proyecto mencionado.
1 LA SALA
El Teatro se halla ubicado en la calle 25 de junio Nro.
60, en la ciudad de Parana, Provincia de Entre Rios. Su
construccion comenzo en diciembre de 1851 por encargo
del Gral. Justo Jos de Urquiza siendo el proyecto de Jos
Quirse. El 8 de Agosto de 1852 se inaugura la sala
convirtindose en el primer teatro del pais organizado. En
1875 el Teatro pasa a depender del Municipio y Iue usado
hasta para el alojamiento de tropas. El 18 de octubre de
1908 se inaugura el actual ediIicio sobre un proyecto del
arquitecto Lorenzo Siegerist construido en el predio que
ocupaba el antiguo Teatro.
Figura 1. Vista del Teatro Tres de Febrero desde el acceso
izquierdo a Platea (fotografa tomada en septiembre de 2010).
Su Iorma corresponde a la tipologia de teatro italiano
con planta en Iorma de herradura. Al Teatro se accede por
el Foyer y luego se ingresa a la sala de cuatro niveles:
planta baja (Platea y Palcos bajos), primer piso (Palcos
altos), segundo piso (Tertulia) y tercer piso (Paraiso). La
sala posee una capacidad total para 749 personas,
distribuidas de la siguiente manera: 381 asientos en planta
baja -Platea y Palcos bajos-, 68 asientos en Palcos altos,
200 asientos en Tertulia y 100 asientos en Paraiso.
Figura 2. Vista de la Platea del Teatro Tres de Febrero desde la
Tertulia (fotografa tomada en septiembre de 2010).
En la actualidad, en la sala se presentan conciertos
sinIonicos, musica de camara, recitales solistas,
espectaculos de danza, teatro de prosa, obras para el
publico inIantil y recitales musicales de diversos gneros.
Figura 3. Cielorraso del Teatro Tres de Febrero (fotografa
tomada en septiembre de 2010).
2 RELEVAMIENTO Y MEDICIN ACSTICA
Se recopilo toda la inIormacion historica, arquitectonica
y acustica posible, tarea que incluyo la busqueda del
material graIico -planos y otros documentos-, una
entrevista al Director del Teatro Municipal: ProI. RodolIo
Romero, el relevamiento completo de la obra y la medicion
de niveles de ruido y de campo acustico.
2.1 MetodoIoga de Ia medicin
El dia 22 de septiembre de 2010 se realizaron las
mediciones acusticas en el Teatro. Como Iuente impulsiva
se utilizaron globos perlados de 12 y se emplearon dos
equipos de registro -grabadores digitales-. La temperatura
en la sala durante la medicion Iue similar a la que se regula
en los espectaculos, de 21 C en Platea con una variacion
maxima menor que /-1 C.
La Iuente se ubico en dos puntos diIerentes sobre el
escenario y se realizaron dieciocho registros en diIerentes
ubicaciones. Para la realizacion de la medicion se dispuso
del teatro durante un tiempo limitado lo cual acoto la
cantidad de posiciones del instrumental. La sala estaba
vacia y en ningun momento se registraron mas de 8
personas en la misma |2|.
2.2 Esquema de posiciones de Ia fuente y
puntos de medicin
En la Iigura 4 se observan las dos posiciones de la Iuente
en el escenario y en la Iigura 5 se aprecian los puntos de
medicion en Platea - Palcos bajos y Palcos altos (1er piso).
En Tertulia y Paraiso (2do. y 3er. piso respectivamente)
se ubicaron dos puntos de medicion en sitios equivalentes a
los del nivel de Palcos altos.
Figura 4. Ubicaciones de la fuente en el escenario.
36
Figura 5. Puntos de medicin en Platea - Palcos bajos y Palcos altos (1er piso).
2.3 ResuItados de Ia medicin
Los parametros elegidos para evaluar la sala Iueron
tiempo de reverberacion (T
30
), tiempo de decaimiento
temprano (EDT) y Claridad (C
80
). Los registros
almacenados permiten el analisis Iuturo de otros
parametros deIinidos en la norma ISO 3382 |3, 4|. En
esta oportunidad no se midieron parametros espaciales.
2.3.1 T30
De acuerdo con la norma ISO 3382, el Tiempo de
Reverberacion T
30
se deIine como dos veces el tiempo,
expresado en segundos, que tarda el nivel de presion
sonora en disminuir desde -5 dB hasta -35 dB a partir de
su nivel inicial una vez que cesa la Iuente acustica.
En la Tabla 1 se muestran los valores de T
30
obtenidos
en todas las posiciones de adquisicion con la Iuente
ubicada en posicion lateral izquierda. Se descartaron los
valores que no alcanzaron una relacion s/r adecuada. En
general, estos casos ocurrieron en la region de baja
Irecuencia en la que los globos no generaron energia
suIiciente
Posicin 125 Hz 250 Hz 500 Hz 1000 Hz 2000 Hz 4000 Hz 8000 Hz
01 Platea 2,33 1,65 1,43 1,36 1,36 1,25 0,94
02 Platea 1,97 1,66 1,46 1,39 1,40 1,28 0,93
03 Platea 2,19 1,59 1,37 1,38 1,40 1,29 0,95
04 Platea 2,15 1,75 1,49 1,43 1,33 1,25 0,92
05 Platea 1,88 1,57 1,39 1,34 1,34 1,20 0,93
06 Platea 2,10 1,56 1,42 1,38 1,32 1,22 0,89
07 Platea 1,93 1,62 1,48 1,39 1,38 1,27 0,94
08 Platea 2,30 -- 1,45 1,36 1,33 1,26 0,88
09 Platea 1,52 1,57 1,45 1,33 1,34 1,20 0,92
10 Platea 1,65 1,58 1,42 1,38 1,32 1,22 0,92
11 Platea 2,00 1,74 1,42 1,38 1,36 1,27 0,89
12 Platea 1,70 1,43 1,31 1,37 1,33 1,18 0,85
01 1er nivel 1,73 1,62 1,46 1,41 1,34 1,24 0,93
02 1er nivel -- 1,62 1,49 1,37 1,34 1,23 0,93
01 2do nivel -- 1,65 1,42 1,32 1,32 1,25 0,96
02 2do nivel -- 1,68 1,48 1,37 1,33 1,26 0,95
01 3er nivel 1,96 1,67 1,45 1,39 1,42 1,18 0,95
02 3er nivel 1,80 1,57 1,37 1,42 1,38 1,13 0,91
TabIa 1. T30 [s] - Fuente lateral izquierdo escenario.
En la Tabla 2 se muestran los valores promedio de T
30
para dos posiciones de Iuente y un promedio global de la
sala. La sala es muy pareja espacialmente en relacion a este
parametro. La escasa diIerencia entre los valores obtenidos
con las Iuentes acusticas ubicadas en diIerentes posiciones
nos indica una gran homogeneidad espacial ante Iuentes
37
acusticas orquestales de gran tamao o ante Iuentes
puntuales en movimiento, por ejemplo actores durante una
representacion dramatica.
125 Hz 250 Hz 500 Hz 1000 Hz 2000 Hz 4000 Hz 8000 Hz
Promedio (FCE) 1,94 1,59 1,42 1,37 1,34 1,26 0,93
Promedio (FLIE) 1,95 1,62 1,43 1,38 1,35 1,23 0,92
Promedio (AF) 1,95 1,61 1,43 1,38 1,35 1,25 0,93
TabIa 2. T30 [s] - Promedio de todos los puntos de medicin - Fuente centro
escenario (FCE), Fuente lateral izquierdo escenario (FLIE) y Promedio
global que incluye las dos ubicaciones de la fuente (AF).
Figura 6. T30 [s] - Promedio de todos los puntos de medicin Fuente
centro escenario, Fuente lateral izquierdo escenario y Promedio respecto de
las dos ubicaciones de la fuente
2.3.2 EDT
De acuerdo con la norma ISO 3382, el Tiempo de
Decaimiento Temprano EDT (Early Decay Time) es seis
veces el tiempo, expresado en segundos, que tarda el nivel
de presion sonora de la respuesta al impulso en disminuir
los primeros 10 dB (entre 0 dB y -10 dB), a partir de su
nivel inicial una vez que cesa la Iuente acustica. En la tabla
3 se pueden ver los valores de EDT obtenidos en diIerentes
posiciones de la sala.
01 Platea 1,28 1,47 1,41 0,96 1,60 1,10 --
02 Platea 2,02 1,82 1,35 1,35 -- -- 0,46
03 Platea 1,94 1,65 1,73 1,53 -- -- 0,27
04 Platea 1,72 1,54 0,97 1,24 0,90 0,91 0,75
05 Platea 1,43 1,57 1,42 1,27 0,86 0,69 0,63
06 Platea 1,02 1,53 1,25 1,08 0,97 0,87 0,66
07 Platea 1,11 1,30 1,11 1,05 0,96 0,96 0,61
08 Platea 1,17 1,32 1,00 1,02 1,06 0,86 --
09 Platea 1,58 1,67 0,99 1,08 0,74 0,67 0,61
10 Platea 1,40 1,31 1,30 0,91 0,81 0,84 0,52
11 Platea 1,19 1,22 1,34 0,85 1,00 0,78 0,51
12 Platea 1,60 1,58 1,63 1,84 -- -- --
01 1er nivel 1,10 1,33 1,04 1,26 1,23 0,81 0,52
02 1er nivel 1,08 1,16 1,24 1,08 1,07 0,90 0,54
01 2do nivel 1,21 1,34 1,09 1,39 1,37 1,18 0,79
02 2do nivel 1,41 1,00 1,20 0,84 1,05 0,92 0,51
01 3er nivel 1,27 1,47 1,32 1,43 1,20 1,08 0,81
02 3er nivel 0,72 1,27 1,38 1,27 1,23 1,04 0,57
TabIa 3. EDT [s] - Fuente lateral izquierdo escenario
El EDT presenta una dispersion mucho mayor que el T
30
-el EDT es particularmente sensible a la ubicacion relativa
de los puntos de emision y recepcion-.
Es interesante observar la distribucion espacial del EDT,
en la Iigura 7 se pueden ver como varian en Iuncion de su
posicion los valores de EDT en platea. Esta disposicion
con valores inIeriores en el centro de la platea es
caracteristica de las salas con planta en Iorma de herradura
italiana.
38
Figura 7. EDT [s] - Distribucin espacial del EDT en platea. Fuente centro escenario.
Como en el caso del T
30
, se observa una escasa
diIerencia entre los valores de EDT obtenidos con las
Iuentes acusticas ubicadas en diIerentes posiciones, que
ratiIica la homogeneidad espacial del escenario.
125 Hz 250 Hz 500 Hz 1000 Hz 2000 Hz 4000 Hz 8000 Hz
Promedio (FCE) 1,50 1,40 1,26 1,12 0,99 0,94 0,66
Promedio (FLIE) 1,35 1,42 1,27 1,19 1,07 0,91 0,58
Promedio (AF) 1,43 1,41 1,27 1,16 1,03 0,93 0,62
TabIa 4. EDT [s] - Promedio de todos los puntos de medicin - Fuente
las dos ubicaciones de la fuente.
Figura 8. EDT [s] - Promedio de todos los puntos de medicin - Fuente
las dos ubicaciones de la fuente.
2.3.3 C80
De acuerdo con la norma ISO 3382, la Claridad a 80 ms
C
80
es una relacion energtica que compara la energia
recibida durante los primeros 80 milisegundos con la
recibida durante el resto del proceso de decaimiento del
campo sonoro.
39
Se deIine con la siguiente expresion: En la que h(t) es la presion sonora instantanea de la
respuesta impulso medida en el punto de medicion.
01 Platea 2,60 4,63 6,55 8,59 6,57 7,61 11,08
02 Platea 2,55 -0,44 5,29 7,35 9,51 10,52 11,87
03 Platea 1,67 -1,16 4,90 7,23 12,50 11,95 12,55
04 Platea 4,24 0,58 6,37 3,62 6,79 6,09 7,95
05 Platea 3,86 -0,74 3,96 5,22 6,41 8,63 8,81
06 Platea 5,36 2,26 4,97 4,88 6,20 6,34 8,35
07 Platea 5,57 1,45 6,17 6,03 5,98 6,31 8,01
08 Platea -0,03 2,50 6,10 5,33 3,90 7,64 12,53
09 Platea 0,81 1,11 4,26 6,12 5,91 6,83 8,03
10 Platea -0,27 2,76 4,88 5,96 5,23 5,64 8,94
11 Platea -1,39 3,27 4,24 5,97 4,84 6,74 11,67
12 Platea -0,36 -0,22 3,12 5,83 11,93 14,91 16,54
01 1er nivel 3,21 2,02 4,37 3,25 6,43 8,51 10,02
02 1er nivel 4,10 2,26 3,67 5,13 6,02 6,47 9,75
01 2do nivel 4,79 1,79 4,66 2,96 3,16 4,68 6,29
02 2do nivel 3,76 5,83 5,25 5,87 5,95 6,23 9,03
01 3er nivel 4,44 1,26 1,90 2,65 2,42 2,39 4,16
02 3er nivel 8,43 5,72 5,56 7,75 5,68 7,27 10,32
TabIa 5. C80 [dB] Fuente lateral izquierdo escenario
125 Hz 250 Hz 500 Hz 1000 Hz 2000 Hz 4000 Hz 8000 Hz
Promedio (FCE) 1,67 1,69 4,19 5,87 6,44 6,79 9,41
Promedio (FLIE) 2,96 1,94 4,79 5,54 6,41 7,49 9,77
TabIa 6. C80 [dB] - Promedio de todos los puntos de medicin - Fuente
centro escenario y Fuente lateral izquierdo escenario.
Figura 9. C80 [dB] - Promedio de todos los puntos de medicin - Fuente
centro escenario y Fuente lateral izquierdo escenario
40
Figura 10. C80 [dB] - Distribucin espacial de C80 en platea. Fuente centro escenario.
En la Iigura 10 se muestran, para cada una de las
ubicaciones, los promedios que corresponden a todas las
bandas de octava. La distribucion de los valores de C
80
en
la platea es relativamente homognea y en ningun caso esta
por debajo de 2 dB.
3 CONCLUSIONES
Los valores de los parametros medidos coinciden con los
descriptos en la literatura especializada para teatros con
planta en Iorma de herradura italiana |5, 6, 7, 8|. La sala
resulta espacialmente muy pareja tal como lo evidencian
los valores de T
30
, EDT y C
80
, y presenta una escasa
sensibilidad al cambio de posicion de las Iuentes en el
escenario. Tanto en la prospeccion auditiva como en los
registros realizados no se detectaron Iocalizaciones, ecos ni
coloraciones.
La inIormacion obtenida en el Teatro Municipal Tres ae
Febrero Iorma parte del conjunto de datos acusticos de
auditorios y teatros de la Republica Argentina y sera
comparada sistematicamente con el resto de las salas
consignadas en dicha base de datos |9, 10, 11, 12, 13, 14|.
4 REFERENCIAS BIBLIOGRFICAS
|1| Farina A., Ayalon R. (2003). 'Recording Concert Hall
acoustics Ior posterity. 24th AES International
Conference. Multichannel Auaio, The New Reality, BanII,
Alberta, Canada.
|2| Beranek, Leo (1988). 'Acoustical Measurements.
Acoustical Society oI America, Woodbury, NY.
|3| Bradley, John S. (2005). 'Using ISO 3382 measures,
and their extensions, to evaluate acoustical
conditions in concert halls. Acoustical Science ana
Technology, Vol. 26 No. 2 pp.170-178.
|4| Norma ISO 3382 1997.
|5| Arau, Higini (1999). 'ABC de la acustica
arquitectonica. CEAC, Barcelona.
|6| Beranek, Leo (1962). 'Music, Acoustics, and
Architecture. Wiley, Nueva York.
|7| Beranek, Leo (1996). 'Concert Halls and opera houses:
How they sound, Acoustical Society oI America, New
York.
|8| KuttruII, H. (1991). 'Room Acoustics. Elsevier
Applied Science, Londres.
|9| Basso et al. (2005). 'Diagnostico del comportamiento
acustico actual del Salon Auditorio 'Dr. Raul Scalabrini
Ortiz del Pasaje Dardo Rocha de la Municipalidad de La
Plata. Actas ael Primer Congreso Iberoamericano ae
Investigacion Artistica y Proyectual. La Plata, Argentina.
|10| Basso et al. (2008). 'Proyecto de remodelacion del
"Cine Teatro Colon" - Sala Cultural (Casa de
Espaa/ATE). Ciudad de Santa Fe. Dispositivos de control
del ruido por emision e inmision y conIiguracion del
campo acustico interior. Asociacion ae Acusticos
Argentinos, Feaeracion Iberoamericana ae Acustica.
Buenos Aires, Argentina.
|11| Basso et al. (2008). 'Estudio acustico del Auditorio
'Roberto Rolli de la Facultad de Bellas Artes de la
U.N.L.P. Asociacion ae Acusticos Argentinos, Feaeracion
Iberoamericana ae Acustica. Buenos Aires, Argentina.
|12| Basso et al. (2009). 'Estudio acustico del Teatro
Municipal Coliseo Podesta de la ciudad de La Plata..
Asociacion ae Profesores ae la Facultaa ae Ciencias
Exactas e Ingenieria ae la Universiaaa Nacional ae
Rosario. Rosario, Argentina.
|13| Basso et al. (2010). 'Estudio acustico del Teatro de
Camara de City Bell. Actas ae la 5ta. Jornaaa ae
Investigacion en aisciplinas Artisticas y Proyectuales La
Plata, Argentina.
|14| Farina et al. (2010). 'El Teatro Espaol de Magdalena
a travs de su acustica, en Actas del Segunao Congreso
Internacional ae Acustica UNTREF. Bs. As. Argentina.
41
42
43
44
45
46
47
48
49
_________________________________
Artculo de Congreso
Montevideo, Uruguay
nd
Latinoamrica.
_________________________________
Mapas acsticos:
Mucho ms que una cartografia coIoreada
Alice Elizabeth Gonzlez
1
1
Universidad de la Repblica, Facultad de Ingeniera, IMFIA - Departamento de Ingeniera Ambiental
Montevideo, Montevideo, CP 11300, Uruguay
aliceelizabethgonzalez@gmail.com
RESUMEN
Los mapas acsticos son instrumentos que se emplean desde hace varias dcadas para presentar informacin
vinculada al diagnstico de una situacin en materia de niveles sonoros. Su fcil comprensin los hace
sumamente idneos como herramienta de comunicacin, cualquiera sea el nivel de formacin del pblico
receptor.
Este artculo intenta mostrar las diversas aplicaciones de los mapas acsticos cuando se conciben y realizan para
satisfacer un objetivo diferente de un diagnstico. Pero no se debe perder de vista que, cualquiera sea objetivo,
todo mapa acstico debe estar respaldado por documentacin slida y exhaustiva.
1 INTRODUCCIN
Quizs los profesionales del audio sean alternativamente
vctimas y victimarios en lo referente a niveles sonoros
elevados dado que, en funcin de la tarea que estn
realizando, o bien los promueven o bien necesitan
definitivamente que stos no perjudiquen su trabajo. Es por
eso que estimo que este artculo, pese a estar ms
vinculado a la contaminacin sonora que a la ingeniera del
audio, no est fuera de los temas de actualidad que les
incumben.
Hace no mucho tiempo atend una consulta telefnica de
una empresa a la que haban solicitado, en el marco de un
cierto trmite, uno de esos planitos con colores, por lo del
ruido. Mi interlocutor no poda disimular su molestia por
la solicitud recibida, que no slo se manifestaba en lo
peyorativo de sus palabras sino, por sobre todo, en el tono
socarrn de su voz. Me resultaba tan claro que saba bien
lo que se le haba solicitado como que no lograba siquiera
sospechar que ese planito con colores pudiera servir para
algo, ms all de permitirle -ojal!- avanzar en su gestin
ante el ente pblico. No era la primera vez que dialogaba
con alguien que desconoca la utilidad de un mapa
acstico, pero quizs s el interlocutor que me transmita
ms enfticamente su descreimiento.
Ms de una vez dej ver que para l era slo una hojita
ms para su expediente, por lo que en algn momento le
hice saber que el plano coloreado, por excelente
presentacin que tuviera, no era ni con mucha imaginacin
lo ms importante ni lo ms til de un mapa acstico. El
acuse de recibo no se hizo esperar: tienen algo ms esos
mapas? qu ms tienen?
Pocos das despus, en un mbito calificado, escuch la
afirmacin absoluta acerca de que los mapas de ruido no
sirven ms que para un diagnstico. sa result ser la
causa ocasional para escribir este artculo pues, como lo
intento trasmitir desde el ttulo, tengo la conviccin de que
los mapas acsticos pueden tener mltiples aplicaciones
50
GONZLEZ MAPAS ACSTICOS
cuando al concebirlos y realizarlos se parte de la base de
que son mucho, mucho ms que un planito con colores.
2 QU ES UN MAPA ACSTICO?
2.1 Los mapas
De acuerdo con la definicin de la Real Academia
Espaola, un mapa es una representacin geogrfica de
una parte de la superficie terrestre, en la que se da
informacin relativa a una ciencia determinada [1].
El uso de mapas para registrar informacin, organizarla
y trasmitirla, es muy antiguo. Los mapas son anteriores aun
a la escritura: se conocen mapas realizados por los
babilonios que datan del 2300 a.C. [2]. Desde entonces, la
cartografa no ha dejado de tener mltiples y crecientes
aplicaciones, en consonancia con la evolucin de las
tecnologas para obtencin y representacin de la
informacin, pero tambin gracias a su propia evolucin.

2.2 Cartografa AmbientaI
Segn Garca-Abad [3], lo que inicialmente se design
como Cartografa Temtica se fue abriendo en diferentes
ramas, una de las cuales es la Cartografa Ambiental.
Dentro de sta a su vez se identifican tres grandes lneas:
los Mapas Ecolgicos, los Mapas Geoambientales y los
Mapas Ambientales Integrados. Este autor afirma que tanto
la Cartografa Ecolgica como la Geoambiental tienen por
objetivo lograr la mxima integracin posible para
representar la realidad ambiental plena. De inmediato,
siempre refirindose a la Cartografa Ambiental, agrega:
Al mismo tiempo, constituye una tcnica de expresin de
resultados de un conjunto de metodologas de investigacin
aplicada [3].
2.3 Comunicacin visuaI
Esta ltima aseveracin conduce inmediatamente a
reflexionar por qu diferentes tipos de informacin o
resultados -y no slo los asociados con niveles sonoros-
suelen expresarse sobre una base cartogrfica. Esto tiene
que ver con que, para trasmitir informacin, los medios
visuales son ms eficaces que los verbales, tanto orales
como escritos. Los medios visuales permiten, adems, que
la comprensin de las ideas resulte ms sencilla y ms
generalizada en los diferentes sectores de la sociedad, y
que el mensaje pueda recordarse durante ms tiempo [4].
Las piezas grficas que constituyen un mapa de ruido o
mapa acstico son instrumentos sumamente idneos para
comunicar o resultados o predicciones a la poblacin en
general [5]. Ms all de que las memorias deben aportar
informacin relevante para la comprensin y cuantificacin
de otros aspectos a nivel tcnico, el mapa con referencias
cromticas es de muy fcil comprensin para la inmensa
mayora del pblico. Si adems ste puede identificarse y
reconocer su realidad cotidiana en la informacin que
presenta el mapa acstico que se le presenta, seguramente
se activarn mecanismos emocionales que permitirn
captar mejor su atencin y retener ms y mejor la
informacin del mapa [4]. A partir de ese momento, es
muy probable que el pblico pueda convertirse en un
aliado de las medidas de gestin que se plantee tomar
para mejorar las condiciones de calidad acstica del
entorno [6].
2.4 Mapas de ruido
De acuerdo con la definicin de la Unin Europea [8]
que luego recoge en Espaa el Real Decreto 1513/2005 [9],
un mapa de ruido es la presentacin de datos sobre una
situacin acstica existente o pronosticada en funcin de
un indicador de ruido, en la que se indicar el rebasamiento
de cualquier valor lmite pertinente vigente, el nmero de
personas afectadas en una zona especfica o el nmero de
viviendas expuestas a determinados valores de un
indicador de ruido en una zona especfica.
Si bien es interesante notar que, tal como lo expresa
Vida Manzano [10], el Art. 4 del Real Decreto 1513/2005
[9] establece claramente que la informacin debe brindarse
a la poblacin en forma clara, inteligible y fcilmente
accesible, tambin establece, en concordancia con la
Directiva Comunitaria, que la informacin a brindar a las
autoridades debe ser mucho ms detallada y amplia. Debe
incluir otros elementos, como por ejemplo la informacin
de base empleada para construir los mapas, la forma de
obtencin de esa informacin, los mtodos de medicin o
clculo empleados, o la estimacin del nmero de personas
o viviendas expuestas a determinados valores de un
indicador elegido, ms all de que las piezas grficas o
mapas propiamente dichos, que son parte clave del mapa
[8].
Aunque el uso histrico principal que han tenido los
mapas de ruido ha sido para comunicar los resultados de un
diagnstico de calidad acstica, mostrando sobre una
cartografa la distribucin de los niveles sonoros en el rea
de estudio a travs de los valores de un indicador que se
considere significativo para el caso en cuestin, dado que
para la obtencin de esos valores representativos ha sido
necesario realizar un sinfn de tareas de gabinete y campo,
al proporcionar esa informacin el mapa se vuelve mucho
ms potente y admite entonces otra cantidad de
aplicaciones que hacen de l una verdadera herramienta de
gestin ambiental [5].
2.5 Tipos de mapas acsticos
Las representaciones cartogrficas de un mapa acstico
pueden ser de distintos tipos [5]:
Mapas de curvas de igual nivel sonoro.
Mapas de puntos o botones: por lo general, los
puntos son elegidos de acuerdo con el
conocimiento que se tiene acerca de la zona a
estudiar.
Mapas de cuadrculas: los puntos de muestreo se
ubican en los vrtices de una cuadrcula o en los
baricentros de las celdas que quedan limitadas al
trazar la misma.
Mapas de red viaria: como se considera que la
principal fuente de ruido es el trnsito, los puntos
de inters se sitan a lo largo de los ejes de las vas
de circulacin.
La elaboracin de cada tipo de mapa implica una
diferente metodologa de seleccin de puntos y criterios
para obtener la informacin de campo necesaria. Cuando se
aplican programas informticos de modelacin/simulacin,
tambin debe ajustarse el tipo de informacin y la cantidad
de puntos por unidad de rea donde sta debe ser
especificada [6].
Las decisiones asociadas con las caractersticas y
aplicaciones del mapa que se elaborar condicionan a su
51
vez el diseo del trabajo de campo, ya que en cada caso
ser necesario definir el alcance del trabajo de campo en
caso de que se emplee adems una herramienta informtica
de modelacin, la densidad de informacin de campo
necesaria, el mtodo de seleccin de los puntos de
medicin, el tiempo de medicin en cada punto, el nmero
de mediciones por punto y el horario / da de la semana /
poca del ao en que se deben realizar, la altura a la que se
colocar el micrfono, entre otras [7].
Priorizar la obtencin de mapas realizados por medicin
o por modelacin en computadora es una decisin que, por
lo general tiene que ver con los recursos disponibles
(humanos, econmicos, de equipamiento), con los plazos,
el alcance espacial y el objetivo del mapa propiamente
dicho. De todos modos, siempre resulta ineludible realizar
mediciones en campo, aunque sea en una cantidad mnima,
para asegurarse de la validez de los resultados que arrojar
el modelo informtico a aplicar [7].
2.6 Importancia de Ia documentacin
Los mapas acsticos han sido empleados largamente
como herramientas de diagnstico, cuyo objetivo consiste
en relevar y comunicar de un modo fcilmente
comprensible la situacin existente en materia de niveles
sonoros registrados en las reas de inters ([5] - [7]).
Originalmente los mapas se construan a partir de
mediciones de niveles sonoros para las que no se contaba
con especificaciones que las hicieran comparables [6],
dado que an no se contaba con metodologas de medicin
estandarizadas, y el desarrollo de normativas que previeran
la realizacin de mapas acsticos era an incipiente.
Con el correr del tiempo las tcnicas de medicin y de
representacin grfica fueron objeto de anlisis hasta llegar
a su estandarizacin en normas tcnicas de procedimiento
[3] y en legislacin y reglamentaciones con diferentes
niveles y alcances ([8] - [9], [11] - [14]). Esto permiti a
su vez aplicar resultados de la comparacin de mapas
realizados por diferentes tcnicos, en diferentes aos, en
diferentes pocas del ao, en diferentes ciudades, entre
otras posibles comparaciones de inters, en tanto las
tcnicas de obtencin de los datos hubiera sido fiable y
replicable ([6], [12], [14]).
Para ello, result necesario mostrar en detalle cmo se
realiz la totalidad de las tareas que condujeron a obtener
el mapa en cuestin y la rigurosidad con que stas se
realizaron. Por lo tanto, el nivel de desarrollo y detalle de
las memorias que acompaaran a las piezas grficas pas a
ser un aspecto clave [15]. Slo cuando fuera posible
garantizar que las metodologas aplicadas son tcnicamente
comparables, se podra obtener informacin significativa a
partir mapas diferentes.
3 LOS MAPAS ACSTICOS COMO
HERRAMIENTAS DE GESTIN
3.1 Aspectos generaIes
La versatilidad de los mapas acsticos es mucho mayor
que la que puede ofrecer buena parte de las herramientas
aplicables a la gestin de la calidad acstica ambiental. Sin
embargo, esto no siempre se visualiza fcilmente a la hora
de priorizar acciones o inversiones.
A modo de ejemplo, en el tercer anteproyecto normativo
que fue puesto a consideracin del Poder Legislativo de la
Provincia de Buenos Aires, Argentina, el que se haya
mantenido la obligatoriedad de contar con Planes
Acsticos en localidades de ms de 25.000 habitantes -
como estaba previsto en anteproyectos anteriores- pero se
haya levantado esa obligatoriedad para los mapas acsticos
[16], induce a pensar que quizs no fue posible lograr que
los legisladores visualizaran la aplicabilidad de estos
ltimos ms all del uso histrico en el diagnstico de
situaciones como forma de comunicar resultados.
Aunque slo se presente informacin acerca del
indicador de niveles sonoros seleccionado, un mapa
acstico es un insumo de gran utilidad, pues permite
conocer la distribucin espacial de los niveles sonoros y en
consecuencia identificar los puntos de mayor
vulnerabilidad. Pero a medida que se incorpora en la
cartografa informacin adicional acerca de la zona de
estudio, de la obtencin del mapa o de la interpretacin de
sus resultados, como por ejemplo las zonas en que ocurre o
se espera la superacin de un valor lmite o la ubicacin de
centros educativos y de atencin a la salud, la utilidad
prctica de los mapas se incrementa significativamente y se
convierten en instrumentos mucho ms potentes para la
gestin ambiental, especialmente en reas urbanas [6].
Las aplicaciones ms usuales de los mapas acsticos en
la actualidad se mencionan en las secciones que siguen.
3.2 Como herramienta de diagnstico
Es sin dudas el uso ms difundido de los mapas
acsticos. Permite visualizar fcilmente la distribucin
espacial de los niveles sonoros en las reas de inters,
identificar las principales fuentes sonoras contaminantes, la
existencia o no de singularidades en materia de eventos
sonoros, as como las caractersticas espaciotemporales de
los niveles de inmisin sonora registrados in situ.
Esto facilita tanto la interpretacin de la informacin
como la comunicacin de las elaboraciones resultantes de
tal interpretacin a otras personas (no necesariamente
especializadas en el tema).
3.3 En eI inventario de fuentes de emisin
sonora
Es una de las primeras aplicaciones complementarias
que se ha realizado de los mapas acsticos. La legislacin
valenciana, ya desde el anteproyecto de 1995, indica que
los mapas acsticos tienen por objeto analizar los niveles
de ruido existentes en el trmino municipal y proporcionar
informacin acerca de las fuentes sonoras causantes de la
contaminacin acstica (.).' [13].
Cuando se cartografa la informacin disponible sobre
niveles sonoros y la ubicacin de las fuentes conocidas, los
apartamientos entre los niveles sonoros obtenidos y los
esperables en funcin de las fuentes cartografiadas
proporcionan una buena orientacin para identificar
emisores que hayan sido omitidos en el inventario.
3.4 Como base para eI desarroIIo de
normativa sobre caIidad acstica
Contar con una normativa que no se puede cumplir, ya
sea por aspectos tcnicos como econmicos, es, por lo
general, peor que no tener normativa alguna, ya que se est
aceptando desde el primer momento que infringir la norma
no slo es aceptable sino necesario ([15]).
Cuando, a la hora de desarrollar normativa, se conocen
las condiciones actuales de los niveles sonoros
52
ambientales, el tipo predominante de fuentes acsticas y
sus caractersticas, los emisores crticos o por su ubicacin
o por su horario o por su emisin propiamente dicha, entre
otras informaciones que puede proporcionar un mapa
acstico, evita incurrir en esa falacia ([6]).
3.5 Como insumo para fijar niveIes objetivo
de inmisin sonora
Los objetivos de calidad ambiental, en forma genrica,
se refieren a metas de mejora que se fijan voluntariamente,
asocindoles planes de accin, recursos y plazos [6].
Cuando se aplican como instrumentos en un proceso de
planificacin, suelen ser etapas sucesivas en programas de
largo aliento.
Para fijar los niveles sonoros deseables o aceptables en
un cierto entorno (niveles objetivo), es necesario conocer
primero los niveles existentes y las causas o fuentes que
contribuyen a los mismos.
A partir de esta informacin, se puede plantear un mapa
de objetivos de calidad acstica a obtener en un cierto
plazo. Asociando prioridades, plazos y recursos a estos
objetivos, se puede generar un Programa de reduccin de la
contaminacin sonora.
A medida que se aplican las medidas concebidas para
alcanzar los objetivos de calidad acstica debe verificarse
cmo evoluciona la situacin, de modo de rever y ajustar
peridicamente tanto los objetivos de calidad acstica
fijados como los planes previstos para alcanzarlos y los
recursos que han sido asignados para ello.
3.6 Como insumo para Ia zonificacin urbana
Jimnez et al. [17] destacan que la planificacin
urbanstica es una herramienta de gran utilidad para
prevenir los problemas de ruido, pero generalmente es
difcil de aplicar en reas ya consolidadas o en territorios
que ya han sido intervenidos urbansticamente como es el
caso ms usual. Es que, si bien la temprana integracin de
la planificacin de la reduccin del ruido en el proceso
urbanstico permite mejorar la eficacia de la gestin en ese
sentido, lo usual es que el gestor urbano deba moverse en
el contexto de una realidad ya consolidada desde el punto
de vista edilicio.
Al servicio del planificador urbano, un mapa de ruido
permite discernir la distribucin espacial de los niveles
sonoros, caracterizndolos y cuantificando su intensidad.
Esto aporta informacin significativa a la hora de definir
las medidas de reordenamiento o de gestin que se
entiendan necesarias para mejorar la calidad acstica de un
rea [6].
En particular, puede ser necesario establecer zonas
acsticamente protegidas (zonas ZAP) que favorezcan la
creacin de "islas acsticas" en las reas en las que se
implantan centros de salud o instituciones educativas; o
declarar zonas acsticamente saturadas (zonas ZAS)
cuando la concentracin de fuentes en operacin impide la
instalacin de nuevas fuentes o an requiere
modificaciones funcionales o cese de algunos emisores
[13].
3.7 Como herramienta aI servicio deI
ordenamiento deI trfico
A nivel mundial, en la amplia mayora de las zonas
urbanas -si no en todas- el trnsito es el principal emisor
acstico.
Por lo general, la normativa establece lmites de emisin
sonora para cada vehculo individual ([5], [15]) pero, por
ms que se cumpla con ellos, la creciente cantidad de
vehculos en circulacin puede derivar en una calidad
acstica inadecuada en algunas zonas debido al efecto
acumulativo.
Los mapas de ruido permiten reconocer las zonas ms
afectadas por niveles sonoros elevados y sus fuentes
principales. Detectado y analizado el conflicto, a partir de
simulaciones se puede predecir la distribucin espacial de
los niveles sonoros que se obtendran en un escenario en
que se apliquen modificaciones a la circulacin, ya sea en
los sentidos de circulacin de ciertas vas, generacin de
vas preferenciales para transporte pesado, modificacin de
recorridos del transporte urbano, entre otras posibilidades.
y evaluar los niveles sonoros que resultaran de cada
posible intervencin en relacin con la situacin actual, de
modo de comprobar la eficacia de la medida a partir de los
niveles sonoros que se obtienen en cada escenario
considerado [6].
Segn Jimnez et al. [17], en un plan general de lucha
contra el ruido del trfico rodado, se debe generar planes
concretos de actuacin que contemplen integralmente la
problemtica de la movilidad urbana. En los planes de
movilidad multimodal es necesario incluir todos los medios
de transporte. Algunos temas a analizar en detalle y para
los que la base cartogrfica es de gran utilidad son la
gestin de estacionamientos, el transporte pblico, los
planes de descongestionamiento de zonas acsticamente
saturadas que contemplen la desviacin del trfico a vas
menos conflictivas, la asignacin de vas para los vehculos
pesados, la definicin de zonas y horarios de carga y
descarga de mercaderas, las restricciones a la circulacin,
los planes de mejora de la infraestructura vial disponible, la
necesidad de nueva infraestructura vial, entre otros.
3.8 Como insumo para eI ordenamiento deI
territorio
La informacin que proporcionan los mapas acsticos
acerca de una situacin existente es relevante para el
desarrollo de planes de ordenamiento territorial. Cuando,
como suele suceder, el ordenamiento del territorio no
antecede a la ocupacin del mismo, resulta necesario
admitir que las condiciones actuales constituyen no slo
una condicin inicial para los planes de ordenamiento sino
una condicin que, muchas veces y por diferentes razones,
pueda no ser fcilmente modificable [6].
En ese caso, es necesario tomar explcitamente en cuenta
los niveles sonoros existentes para asignar usos que sean
compatibles con la realidad, o eventualmente con
modificaciones de la misma que sean sensatamente
implementables.
3.9 Para anaIizar Ia capacidad de acogida deI
medio
El anlisis de la capacidad de acogida del medio es uno
de los principales objetivos de la gestin ambiental
preventiva [18].
53
Cuando se trabaja en planificacin o en evaluacin
ambiental de proyectos, ante la propuesta de implantacin
de una nueva fuente emisora se hace necesario realizar un
estudio de impacto acstico para verificar la admisibilidad
de los efectos que sta tendr sobre los niveles sonoros
preexistentes.
Para ello, sobre la confeccin primaria de un mapa de
lnea de base o diagnstico de la zona de la que se pretende
evaluar la capacidad de acogida -mapa ste que coincide
con la aplicacin ms clsica de los mapas acsticos-, se
superpone un escenario surgido como consecuencia de
simular el funcionamiento de las nuevas fuentes de emisin
sonora que se estudian y cartografiar los niveles sonoros en
la nueva condicin.
Del anlisis de la diferencia entre ambas situaciones
surgir lo adecuado o no de permitir su implantacin tal
como se ha concebido inicialmente el proyecto, o la
necesidad de introducir modificaciones de alguna ndole
(por ejemplo, niveles de emisin, das u horario de
funcionamiento, materiales de construccin u otras
caractersticas) para viabilizar desde el punto de vista
acstico su implantacin en ese sitio.
3.10 Como herramienta de pIanificacin
estratgica
Un mapa estratgico de ruido es una herramienta de
gestin cuyo objetivo es la mejora continua de la calidad
ambiental y especialmente de la calidad acstica ([8], [9],
[11], [14]). Recoge informacin resultante de un conjunto
de estudios, diagnsticos, mediciones, modelacin, anlisis
estadstico y comparacin de resultados, en base a los
cuales se formulan polticas de planificacin y acciones
tanto preventivas como correctivas.
Este tipo de mapa se construye a partir de un mapa
acstico de diagnstico, que se enriquece y complementa
con otro tipo de informacin, como datos estadsticos o de
trnsito informacin geogrfica, sitios en que ocurre o se
espera la superacin de un valor lmite, la estimacin del
nmero de personas expuestas a determinados valores del
indicador acstico elegido, el nmero de viviendas, centros
educativos y hospitales situados en las zonas en que
ocurren ciertos valores de dicho indicador, la ubicacin y
distribucin espacial de cierto tipo de fuentes emisoras de
ruido, la ubicacin y distribucin espacial de fuentes
emisoras de ruido cuyo nivel de emisin supera cierto
valor, entre otras posibilidades de utilidad prctica.
Dado que los mapas estratgicos de ruido son
obligatorios en los pases de la Unin Europea para todas
las localidades con 250.000 habitantes o ms [8], el
captulo 4 de este trabajo se destina a analizarlos con
mayor nivel de detalle.
3.11 Como insumo para Ia eIaboracin de
pIanes de descontaminacin acstica
([7], [8], [11])
A partir de un mapa estratgico de ruido que provea la
informacin de diagnstico en cuanto a niveles sonoros de
inmisin, mapas de nivel de molestia percibida por la
poblacin (que se pueden obtener a partir de los mapas
acstico de diagnstico, incorporando las correcciones
pertinentes debido a las caractersticas de los ruidos, como
presencia de componentes impulsivos o tonos puros, por
ejemplo), inventario de fuentes de emisin de ruido e
incidencia cuantitativa y geogrfica de cada tipo de fuente,
entre otra informacin, es posible formular un plan de
descontaminacin para atender la mejora objetiva y
cuantificable de la calidad acstica del entorno.
Para elaborar un plan de descontaminacin, se requiere
definir cules son las posibles medidas a considerar y su
complejidad tcnica, dificultad de implementacin y de
gestin; el costo y el beneficio de cada posible medida a
adoptar; la cantidad de beneficiarios de cada medida y la
sensibilidad de los mismos al ruido; los recursos tcnicos,
humanos y econmicos efectivamente disponibles; y la
disposicin de la poblacin a pagar por una mejor calidad
acstica [19].
En un plan de descontaminacin acstica se debe incluir
la definicin del mbito territorial de ejecucin, las
competencias, autoridades responsables, prioridades y
plazos; el anlisis de posibilidades y soluciones -tanto
directas como indirectas- que se pueden llevar a cabo; y el
costo econmico, las posibles dificultades de ejecucin y la
eficiencia desde el punto de vista acstico, cuantificada a
travs de indicadores tales como la disminucin de los
niveles de ruido o la reduccin de la poblacin expuesta.
3.12 Como apoyo para jerarquizar posibIes
intervenciones en un programa de
descontaminacin acstica
A partir de un mapa acstico es posible evaluar y mapear
el costo de la calidad acstica ambiental, de modo de
establecer las medidas econmicas, financieras y fiscales
adecuadas para el fomento de la prevencin de la
contaminacin acstica, as como para promover
programas, procedimientos y tecnologas de reduccin de
la contaminacin acstica, tanto en la fuente como en la
propagacin ([19], [20]).
Pare realizar esta evaluacin, es necesario asignar
valores monetarios a la salud de la poblacin, a la molestia,
a la prdida de rendimiento intelectual, al tiempo de trabajo
perdido o subaprovechado, al valor de la propiedad, entre
otras variables, e indagar a partir de encuestas acerca de la
disposicin a pagar por una mejora en la calidad acstica
del entorno que podra tener la poblacin [20].
De este modo, no slo se logra una cuantificacin
monetaria para evaluar el impacto de diferentes medidas
pasibles de ser aplicadas en un rea o, viceversa, del
impacto que una misma medida podra tener en diferentes
mbitos, sino que tambin permite asignar prioridades a las
intervenciones a realizar, ya que, a impactos similares en
materia de reduccin de niveles sonoros y de poblacin
beneficiada, la medida que puede ser ms rpidamente
amortizada por la disposicin a pagar por ella que tiene la
sociedad es la ms conveniente para iniciar un programa de
acciones de lucha contra el ruido.
4 MAPAS ACSTICOS ESTRATGICOS
OBLIGATORIOS
4.1 Qu es un mapa acstico estratgico?
Un mapa estratgico de ruido es un mapa diseado para
poder evaluar globalmente la exposicin al ruido de una
zona determinada, debido a la existencia de diferentes
fuentes de ruido, o para poder realizar predicciones
globales para dicha zona ([8], [9]).
Al igual que los mapas de ruido que se realizan con otras
finalidades, los mapas estratgicos tambin deben incluir
piezas grficas (cartografa) y memorias tcnicas
54
detalladas, para poder cumplir con el objetivo para el que
se desarrollan [12].
Gonzlez Garca destaca, entre otros mapas temticos
que pueden formar parte de un mapa acstico estratgico:
los mapas de nivel de los indicadores sonoros adoptados;
los mapas de zonas de afectacin, que representan las
zonas de territorio donde L
den
es superior a 55 dBA, 65
dBA y 75 dBA, a partir de las cuales se calculan las
superficies de afectacin, incorporando datos de superficies
y poblacin con L
den
superior a los anteriores valores como
tablas; los mapas de exposicin en fachada, que
representan los niveles de ruido de exposicin en fachadas
con poblacin, a 4 m de altura, y sirven de base para la
estimacin de la poblacin expuesta; los mapas de usos del
suelo y zonificacin acstica; los mapas de capacidad de
acogida; los mapas de sensibilidad acstica [21].
4.2 ObIigatoriedad de Ios mapas acsticos
estratgicos
Desde la promulgacin de la Directiva 2002/49/CE del
Parlamento Europeo y del Consejo de la Unin Europea en
el ao 2002, comienza a regir, para los pases que la
integran, la obligatoriedad de realizar mapas estratgicos
de ruido en todas las ciudades con 250.000 habitantes o
ms, de comunicar sus resultados al Consejo de la Unin
Europea, de implementar medidas concretas en
consecuencia para mejorar las condiciones acsticas
ambientales, y de revisar y renovar los mapas estratgicos
cada un plazo mximo dado [8].
Casi 10 aos despus, pese a que an hay dificultades
para su realizacin y para compatibilizar metodologas de
trabajo ([10], [22], [23]), la utilidad de los mapas
estratgicos de ruido no est en discusin. Es ms, son
muchas las normas o nacionales o provinciales que
establecen la obligatoriedad de contar con mapas
estratgicos de ruido en las localidades a partir de cierto
nmero de habitantes, que puede ser mucho menor que el
valor de 250.000 (por ejemplo, en Castilla y Len, Espaa,
comprende a todas las localidades con 20.000 habitantes o
ms, menos del 10 % del nmero mnimo de habitantes por
encima del cual la Directiva de la Unin Europea
establece la obligatoriedad de los mapas estratgicos [24]).
En materia de normativa, la realidad en Latinoamrica
es muy diferente. Colombia tiene en su normativa vigente
de alcance nacional (Resolucin 0627 de 2007, [11]) una
disposicin anloga, aunque modificando la escala urbana:
en este caso, los mapas acsticos son obligatorios para las
ciudades de 100.000 habitantes o ms. Ningn otro pas
latinoamericano tiene en la actualidad una normativa
vigente con una exigencia similar.
En Argentina, el grupo de investigacin que lleva
adelante los temas de acstica en el Laboratorio de
Acstica y Luminotecnia de la Comisin de
Investigaciones Cientficas de la Provincia de Buenos
Aires viene elaborando propuestas de normativa desde
2002 [16]. En la ltima versin, se plantea la
obligatoriedad de realizar un Plan Acstico para aquellas
reas urbanas con ms de 25.000 habitantes. En el
articulado se especifican los plazos y los contenidos
mnimos de ese Plan (zonificacin a escala local,
evaluacin de la situacin acstica existente y programas
de reduccin y control), pero en esta versin se ha retirado
la obligatoriedad de contar con mapas acsticos, que estaba
presente en versiones anteriores. Esto result necesario a
partir de una de las controversias generadas en la Cmara
de Senadores de la Nacin, donde hubo una gran
resistencia a obligar a los pequeos municipios a afrontar
la inversin que implica la realizacin de un mapa acstico
[16].
La realidad uruguaya est an ms lejos: actualmente se
carece de normativa acstica de nivel nacional, y en
ninguna de las ordenanzas departamentales vigentes se
hace mencin de aspecto alguno de los mapas acsticos
[15].
4.3 Revisin de Ios mapas acsticos
estratgicos
A partir del 2008, al iniciarse el segundo perodo de
aplicacin de la Directiva y comenzar la concrecin de
contratos para realizar las revisiones y actualizaciones de
los mapas estratgicos de ruido y de los planes de accin
originales [24], se ha iniciado tambin un proceso de
reflexin crtica a propsito de la realizacin de los mapas
estratgicos exigidos por la Unin Europea.
Entre las dificultades remarcadas en los seminarios que
se organizaron en Espaa por este motivo, se seala la falta
informacin, por ejemplo en lo que hace a cartografa 3D y
datos de trfico [25] y los problemas vinculados con la
modelacin, que hacen ineludible realizar un esfuerzo de
mediciones significativo en zonas en que los modelos no
son de aplicacin (por ejemplo, en zonas peatonales [25]) o
no presentan un buen ajuste (por ejemplo, Vida Manzano
[10] refiere una subestimacin de 3 dB en el L
night
obtenido
por modelacin.
Para evitar -o por lo menos minimizar- estas
discrepancias en el clculo, la Unin Europea est
bregando por alcanzar una metodologa para la realizacin
de mapas estratgicos de ruido (CNOSSOS - EU, [26]) que
sea de aplicacin en todos los pases que la integran, pero
aun antes de haberse logrado un producto aplicable ya hay
quienes advierten acerca de la urgencia en contar con un
mtodo simplificado de aplicacin que en particular tenga
incorporados valores por defecto, ms all de que declaran
de antemano que descartan la posibilidad de aplicar el
nuevo modelo de clculo [27].
Para cerrar este punto, a continuacin se presentan
algunas reflexiones del Dr. Alberto Bauelos [23] en
relacin a los mapas estratgicos de ruido, su elaboracin y
su aplicacin, que reflejan en forma sinttica los puntos de
vista de la autora:
No se trata de ofrecer slo imgenes ms o
menos vistosas (sic, [23]). Para que resulte
til, la informacin que se presenta en un mapa
estratgico de ruido debe ser realista y
representativa.
El mapa estratgico debe proporcionar el marco
para la gestin del ruido en el municipio. Para
que se pueda realizar luego un buen anlisis de
sus resultados e implementar mejoras en la
gestin, debe estar bien documentado. Se
puede requerir informacin adicional, pero no
comenzar de nuevo.
No se puede romper el rigor tcnico del mtodo
de clculo.
La mejora en la precisin de los resultados se
consigue con la mejora en la caracterizacin de
los focos y en la modelizacin.
55
Un mapa estratgico de ruido debe permitir
obtener evaluaciones reales de la exposicin al
ruido y no slo satisfacer un requerimiento
normativo (por ejemplo: la altura a la que se
piden los resultados es de 4 m sobre el suelo,
que no es una altura representativa de los
receptores).
El costo inicial elevado para la administracin
que debe realizar un mapa estratgico de ruido
no es el del mapa propiamente dicho, sino el
de las medidas de correccin que habr que
implementar por causa de l.
Un mapa estratgico de ruido, el plan de accin
que origina y la gestin posterior en torno a l,
son oportunidades para resolver problemas de
ruido. Para ello, requiere que desde el
comienzo se realice un trabajo especializado.
Un mapa estratgico de ruido no es lo mismo que
la gestin de ruido en el mbito municipal,
pero deben ir en la misma direccin.
5 A MODO DE REFLEXIN FINAL
En una etapa tecnolgica en que el procesamiento de
imgenes, los sistemas de informacin geogrfica y los
recursos informticos en general son uno de los sellos de la
trasmisin de informacin, la cartografa ambiental tiene
una aplicacin generalizada en muy diversos rdenes. Es
fcil encontrar entonces mucha cartografiada atractiva y
til para ordenar y presentar informacin, muy
especialmente en lo relativo a temas ambientales [3].
Los mapas acsticos, como ejemplo de Cartografa
Ambiental, son instrumentos de fcil comprensin que
cumplen con idoneidad las funciones de ordenamiento y
comunicacin de informacin.
Sin embargo, bajo la designacin genrica de mapa
acstico se puede englobar mapas de muy diversa ndole,
desde diagnsticos puntuales a mapas de poblacin
expuesta, de mapas de conflictos ambientales a mapas
acsticos estratgicos, por mencionar slo algunos. No
todas las variantes de los mapas acsticos se asocian con el
diagnstico de situaciones.
No debe perderse de vista que la cartografa
correspondiente a un mapa acstico no es ms que la
punta del iceberg. Por lo tanto, cualquiera sea su
aplicacin, aun detrs de la mejor cartografa debe existir
una documentacin tcnica slida y exhaustiva, que
respalde y confiera credibilidad a la informacin que se
presenta en el mapa.
[1] Diccionario de la Real Academia Espaola, 22
Edicin, consultado en www.buscon.rae.es
[2] Mundo de los mapas: Historia de los mapas,
consultado en www.orbemapa.com
[3] Garca-Abad Alonso, Juan Javier. Cartografa
Ambiental. Desarrollo y propuestas de sistematizacin
Observatorio Medioambiental Vol. 5 (2002): 47-78.
ISSN: 1139-1987.
[4] Daniela Ruiz, Miguel Villarreal, Josu Gonzlez,
Claudia Espinosa. Memoria Visual y Comprensin de
Lectura. Facultad de Psicologa, Universidad de
Nuevo Len, Mxico, 2008, consultado en
http://www.psicologia-online.com/articulos
[5] E. Gonzlez, Notas del curso de Elementos de
Ingeniera Ambiental, Departamento de Ingeniera,
IMFIA, Facultad de Ingeniera, 2009, Montevideo,
Uruguay.
[6] E. Gonzlez, Los mapas acsticos como herramientas
de gestin, Conferencia dictada en la Universidad de
Medelln, agosto 2010, Medelln, Colombia.
[7] Universidad de Medelln. Protocolo para la medicin
de emisin de ruido, ruido ambiental y realizacin de
mapas de ruido, Medelln, Colombia, 2009.
[8] Diario Oficial de las Comunidades Europeas.
Directiva 2002/49/CE del Parlamento Europeo y del
Consejo, de 25 de junio de 2002. 14 pp.
[9] Boletn Oficial del Estado Espaol, Real Decreto
1513/2005, BOE N301, pp. 41356-41363, consultado
en http://www.boe.es
[10] J. Vida Manzano (Coordinador). Grupo de Trabajo
GT-ACU Contaminacin Acstica, Documento Final,
148 pp., diciembre 2008. Presentado en 9 Congreso
Nacional de Medio Ambiente, Cumbre del Desarrollo
Sostenible.
[11] Ministerio de Ambiente, Vivienda y Desarrollo
Territorial. Resolucin 0627 del 7 de abril de 2006.
Bogot, 2006.
[12] International Organization for Standardization. ISO
1996-2, Second Edition 2007-03-15. Genve, 2007.
[13] Generalitat Valenciana. Conselleria de Medi Ambient.
Ley 7/2002, de 3 de diciembre, de la Generalitat
Valenciana, de Proteccin contra la Contaminacin
Acstica. DOGV N 4.394, Valencia, Espaa, 21 pp.
[14] Ruidos.org: El sitio de lucha contra el ruido,
consultado en www.ruidos.org
[15] A.E. Gonzlez, E. Indarte y M. Lisboa, Acstica
Urbana. Memorias de las Jornadas de Convergencia
en Normativa de Contaminacin Acstica, 2008, 124
pp. ISBN 978-9974-0-0541-9
[16] Ariel G. Velis, Ana M. Rizzo la Malfa, Horacio
Bontti, Nilda Vechiatti, Federico Iasi, Alejandro
Armas, Daniel Tomeo. Evolucin del Proyecto de Ley
de Proteccin Ambiental de la Calidad Acstica en la
Provincia de Buenos Aires. Primeras Jornadas
Regionales de Acstica de la AdAA 2009, Rosario,
Argentina.
[17] S. Jimnez, J. Romeu, J. Cardona, A. Snchez y A.
Alsina, Ruido de trfico, movilidad y planificacin
urbanstica, en Tecniacstica 2006, Ganda, Espaa.
[18] V. Conesa Fernndez-Vtora, Gua metodolgica para
la evaluacin del impacto ambiental, 3. Edicin,
Ediciones Mundi-Prensa, 1997, Madrid, Espaa.
[19] E. Puig i Sol y M. Maj i Torrent, Planes de accin
y planes especficos para la mejora y recuperacin de
la calidad acstica de los municipios, en Acstica
2008, Coimbra, Portugal.
[20] D. Azqueta Oyarzn, Valoracin econmica de la
calidad ambiental, McGraw-Hill/Interamericana de
Espaa, S.A., 1994, Madrid, Espaa.
[21] M.A. Gonzlez Garca, Qu es y cmo se hace un
mapa estratgico de ruido en carreteras?, en
Tecniacstica 2006, Ganda, Espaa.
[22] Sanz Sa, Jos Manuel. Experiencia de la 1 fase de los
MER y Perspectivas para la 2 fase. 2008.
[23] Bauelos Irusta, Alberto. Mapas de ruido en los
municipios. Jornada Tcnica: Segunda fase de los
mapas estratgicos de ruido de aglomeraciones, 2008.
56
[24] Elaboracin de 12 Mapas Ruido para los Municipios
de Castilla y Len, consultado en
http://www.articuloz.com/medio-ambiente-articulos
[25] Alsina Snchez, Antoni, Experiencias en la
elaboracin del mapa estratgico de Terrassa, Jornada
Tcnica de la Segunda fase de los mapas estratgicos
de ruido de aglomeraciones, 2010.
[26] European Comission, Draft JRC Reference Report on
Common NOise ASSessment MethOdS in EU
(CNOSSOS-EU) To be used by the EU Member
States for strategic noise mapping after adoption as
specified in the Directive 2002/49/EC. Version 2d, 28
May 2010.
[27] Segus Echazarreta, Fernando. Metodologa,
recomendaciones e instrucciones para la elaboracin
de los mapas estratgicos de ruido de la 2 fase.
CEDEX, 2 fase de los mapas estratgicos de ruido de
aglomeraciones, 2008.
57
58
_________________________________

Sociedade de Engenharia de udio
Artigo de Congresso
Apresentado no Congresso de Engenharia de udio
30 de Agosto a 1 de Setembro de 2011, Montevidu, Uruguai

Este artigo foi reproduzido do original final entregue pelo autor, sem edies, correes ou consideraes feitas pelo comit
tcnico. A AES Brasil no se responsabiliza pelo contedo. Outros artigos podem ser adquiridos atravs da Audio
Engineering Society, 60 East 42
nd
Street, New York, New York 10165-2520, USA, www.aes.org. Informaes sobre a seo
Brasileira podem ser obtidas em www.aesbrasil.org. Todos os direitos so reservados. No permitida a reproduo total
ou parcial deste artigo sem autorizao expressa da AES Brasil.
_________________________________

Integrao de Sistemas de Reconhecimento, Traduo e
Sntese Automtica de Fala para Facilitar a Comunicao
de Turistas

Anderson Avila
1
e Francisco J. Fraga
1

1
Universidade Federal do ABC (UFABC)
Santo Andr, SP, 09210-170, Brasil
{anderson.avila@gmail.com,francisco.fraga@ufabc.edu.br}

RESUMO

Neste artigo apresentado um software que servir como um dispositivo de auxlio na comunicao, em
ambientes como hotis, aeroportos, restaurantes, etc. Este aplicativo foi pensado tambm como uma
ferramenta til queles estabelecimentos brasileiros que, no tendo em seu quadro pessoas com
conhecimento suficiente da lngua inglesa, precisam atender uma clientela estrangeira. O sistema integra trs
ferramentas tecnolgicas reconhecimento de fala, traduo automtica de texto e sntese de fala. A lngua
falada pelo usurio e reconhecida automaticamente o portugus brasileiro e a lngua para a qual as frases
so automaticamente traduzidas e sintetizadas o ingls americano.

0 INTRODUO
Com o aquecimento da economia, os brasileiros esto
viajando cada vez mais. O principal destino destas pessoas
so os pases de lngua inglesa, onde muitos destes turistas
sofrem por no dominarem o ingls. Seja no momento de
realizar uma compra, solicitar uma informao, comunicar
o destino desejado, ou simplesmente fazer um pedido num
restaurante, estes turistas correm sempre o risco de serem
mal interpretados.
Com o crescimento econmico e a proximidade de
grandes eventos a serem sediados no Brasil, como a Copa
de 2014 e as Olimpadas de 2016, tem-se comentado muito
sobre a carncia de profissionais da indstria do turismo
com domnio do ingls para atender a demanda de turistas
estrangeiros que visitaro o pas nos prximos anos.
Este trabalho teve como motivao o desafio de
desenvolver um software de traduo automtica do
portugus brasileiro (PB) para o ingls americano que se
mostrasse, sobretudo, uma ferramenta til e prtica e que
pudesse impactar positivamente na indstria e economia do
turismo. Embora j existam sistemas de traduo de texto
razoavelmente bons e bastante difundidos, como por
exemplo o Google Translate [1], h uma carncia quase
absoluta de sistemas de traduo automtica e simultnea
baseados na fala, ou seja, capazes de reconhecer uma frase
falada em portugus, traduzi-la para o ingls e apresent-la
ao usurio com a pronncia correta neste idioma.
1 ARQUITETURA E FUNCIONALIDADE
Para dar incio implementao da primeira parte do
sistema, i.e., gerar um texto escrito a partir da fala, foi feito
um levantamento das principais ferramentas de
reconhecimento automtico de fala disponveis para
utilizao em pesquisa e desenvolvimento. Como resultado
dessa busca, optamos por utilizar como ponto de partida o
decodificador Julius [2], capaz de realizar, em princpio, o
reconhecimento de qualquer lngua falada, desde que seja
alimentado com os modelos acsticos apropriados, bem
como com os correspondentes modelos de linguagem e
dicionrios de pronncia.

59
AVILA ET AL

SOFTWARE DE TRADUO
SIMULTNEA AUTOMTICA

CONGRESSO DE ENGENHARIA DE UDIO, MONTEVIDU, URUGUAI
No reconhecimento, utilizamos como recurso para
facilitar o desenvolvimento o software Coruja 0.2, API
desenvolvida pelo grupo Fala Brasil [3][4][5], da
Universidade Federal do Par, que permite aos
programadores controlar as funcionalidades do Julius com
maior rapidez e agilidade.
O prximo passo foi escolher uma tecnologia que
servisse de base para a etapa de traduo automtica de
texto. Desenvolvemos, ento, uma aplicao em linguagem
JAVA que, utilizando-se dos recursos presentes na API
Google Translate [1], realiza a traduo textual do PB para
o ingls americano. Assim, foi criado com sucesso um
programa que recebe um texto em portugus como entrada
e apresenta como sada o respectivo texto em ingls.
Para o desenvolvimento da terceira etapa, de sntese de
voz, escolhemos a ferramenta FreeTTS [6], que
implementa a especificao Java Speech API 1.0 [7][8].
Nessa fase do projeto, desenvolvemos uma aplicao para
sintetizar em lngua inglesa o texto traduzido.
Atualmente o foco do trabalho consiste na integrao
destas tecnologias num nico sistema computacional de
traduo simultnea e automtica da fala. O diagrama
abaixo ilustra a arquitetura proposta para o sistema:

Figura 1: Diagrama da arquitetura proposta para o sistema

O objetivo da arquitetura proposta permitir aos
usurios utilizar o portugus para expressar seus desejos,
necessidades e escolhas (em um contexto de turismo) num
ambiente onde apenas o ingls falado e compreendido.
As figuras 2 e 3 ilustram informalmente parte da estrutura
gramatical utilizada, assim como exemplos de algumas
frases que sero automaticamente reconhecidas e
simultaneamente traduzidas e sintetizadas pelo sistema.

Figura 2: Exemplos de estruturas (gramtica simplificada)
de algumas frases solicitando preferncias e servios

Procuramos definir, atravs da elaborao de uma
gramtica livre de contexto, um conjunto de frases tpicas
de viagem e teis para aqueles turistas que precisam se
comunicar em ingls.
Para a definio da gramtica, procuramos organizar as
palavras dentro de categorias. Criamos, por exemplo, a
categoria de bebidas contendo tanto nomes masculinos
(ex.: caf, suco, refrigerante, vinho, leite, ch) como
femininos (gua, cerveja). Tambm criamos uma categoria
para cumprimentos, com oi, ol, bom dia, boa tarde e boa
noite.

Figura 3: Exemplos de estruturas (gramtica simplificada)
de algumas frases solicitando informaes
2 RECONHECIMENTO DE FALA
O Julius uma ferramenta open-source, utilizada no
desenvolvimento de sistemas de reconhecimento de fala
contnua (LVCSR - Large Vocabulary Continuous Speech
Recognition), que permite a converso de fala em texto. O
software, usando modelos de linguagem baseados em
gramticas N-gram e modelos ocultos de Markov (HMM -
Hidden Markov Models) na parte acstica, apresenta
excelente desempenho em boa parte dos PCs atuais [2].
Os modelos acsticos e de linguagem usados pelo Julius
podem ser definidos em qualquer lngua, o que oferece aos
pesquisadores e desenvolvedores que utilizam este
software a possibilidade de construir sistemas de
reconhecimento da fala adaptados para as suas
necessidades especficas. Como modelo acstico,
utilizamos os recursos para o PB presentes no site do
projeto FalaBrasil
1
. Em relao ao modelo de linguagem,
uma vez que queramos criar um sistema especfico para
turistas brasileiros, que contasse com um vocabulrio
reduzido, porm de alta performance, visando a traduo
de frases funcionais comumente utilizadas em um contexto
de turismo, criamos uma gramtica prpria, seguindo
recomendaes da documentao do Julius [9].
A montagem de uma gramtica escrita para o Julius
feita, em uma primeira etapa, atravs de dois arquivos:
]. O primeiro arquivo um
conjunto de regras que definem a relao entre diferentes
categorias de palavras. O segundo arquivo uma lista de
palavras de cada categoria (grafemas), assim como suas
representaes fonticas (sequncia de fonemas).
Para ilustrar, segue abaixo o exemplo de uma gramtica
livre de contexto escrita para o Julius, que reconhece frases
como onde o aeroporto? onde fica a farmcia?
onde est o museu?

1
http://www.laps.ufpa.br/falabrasil/
60
AVILA ET AL

SOFTWARE DE TRADUO
SIMULTNEA AUTOMTICA

expl.grammar expl.voca
S : NS_B HMM QUESTION NS_E

S : NS_B QUESTION NS_E

QUESTION : PRON_LOCAL
VERB_6 ARTICLE_DEF_F
PLACE_F

VERB_6 ARTICLE_DEF_M
PLACE_M

VERB_9 ARTICLE_DEF_F
PLACE_F

VERB_9 ARTICLE_DEF_M
PLACE_M
% NS_B
<s> sil
% NS_E
</s> sil
% HMM
FILLER sil
FILLER sil
% PRON_LOCAL
onde o~ dZ i
% VERB_6
fica f i k a
est e s tS
% VERB_9
E
% PLACE_M
aeroporto a j r o p o X t u
cinema s i~ n e~ m a
parque p a X k i
teatro t e a t r u
museu m u z e w
% PLACE_F
loja l o Z a
farmcia f a R m
% ARTICLE_DEF_M
o u
% ARTICLE_DEF_F
a a
Tabela 1 : Gramtica definida para o Julius

Em seguida, faz-se necessrio converter os arquivos
, que so os realmente utilizados pelo Julius.
Utilizamos o script mkdfa.pl, presente no pacote Julius-
4.1.5-win32bin [10] para realizar a converso da gramtica
criada no nosso projeto.
Por ser um decodificador da fala, capaz de processar
sentenas de qualquer idioma, a preciso e desempenho da
ferramenta Julius depende muito da qualidade dos modelos
utilizados. Neste projeto, utilizamos o modelo acstico
LaPSAM v1.5 [3], disponibilizado pelo grupo Fala Brasil.
No caso dos modelos acsticos para a lngua portuguesa,
um dos principais desafios superar a falta de base de
dados disponveis para treino [3]. O LaPSAM v1.5,
produzido pelo grupo de pesquisa Fala Brasil, se apresenta
como uma alternativa aos corpus no gratuitos para PB
encontrados no mercado atualmente. Este modelo,
construdo com a utilizao do software HTK [11], foi
construdo a partir de audiobooks (livros falados para o
portugus brasileiro), o que reduziu sensivelmente o
trabalho de produo de um corpus [3].
O Coruja 0.2
2
[12] uma API desenvolvida pelo grupo
Fala Brasil, com interface bem simplificada, que permite
aos programadores que desejam desenvolver aplicaes de
reconhecimento da fala exercer um controle mais prtico e
gil sobre a engine do Julius. Esta ferramenta esconde toda
a complexidade do decodificador, tornando mais rpido o
desenvolvimento de aplicaes de reconhecimento de fala
em plataforma .NET.
Para criar de uma gramtica livre de contexto para o
Julius necessrio definir uma correspondncia entre os
grafemas e fonemas das palavras utilizadas. Isso feito
atravs , conforme ilustrado na tabela 1.
Para obter o dicionrio de pronncia, i.e., os fonemas
correspondentes s palavras existentes nas categorias que
criamos, utilizamos a ferramenta Conversor Grafema-
Fone1.5 [13]. Este software mais um dos recursos
disponibilizados pelo grupo Fala Brasil e que foi utilizado
durante a criao do nosso modelo de linguagem.

2
Fonte: http://www.laps.ufpa.br/falabrasil/files/coruja-doc-pt.pdf
Posteriormente, foi preciso corrigir manualmente algumas
das sequncias fonmicas geradas automaticamente pelo
software, pois, embora esta ferramenta seja de grande
utilidade prtica e proporcione um grande ganho no tempo
de desenvolvimento, ela no perfeita e comete erros.
3 TRADUO DE TEXTO
A API Google Translate um recurso disponibilizado
pela Google que permite aos programadores integrar s
suas aplicaes as funcionalidades presentes na ferramenta
de traduo online Google Translate. Para que a API opere
corretamente preciso estar conectado internet. Porm,
como o trfego apenas de texto, no necessria uma
conexo de alta velocidade para que a traduo seja feita
de forma extremamente rpida. Sua principal funo
traduzir de maneira automtica um texto de uma lngua-
fonte para o respectivo texto na lngua-alvo. No presente
trabalho, utilizamos essa ferramenta para desenvolver uma
aplicao, em JAVA, que realiza a traduo de um texto
em portugus para um texto em ingls.
4 SNTESE DE FALA
Java Speech 1.0 uma interface que permite que
desenvolvedores Java incorporem duas tecnologias s suas
aplicaes: reconhecimento e sntese da fala [7]. Para
facilitar a utilizao desta API, utilizamos o software
FreeTTS. Embora o FreeTTS no implemente a JSAPI 1.0
em sua totalidade no h suporte reconhecimento da
fala por exemplo [8] ele foi de muita utilidade no que diz
respeito sntese da fala, sobretudo porque o sistema
disponibiliza trs opes de vozes masculinas (locutores
para ingls americano.
A ausncia de vozes femininas disponveis para sntese
em sua base pode ser considerado um inconveniente ao uso
do FreeTTS. Para contornar esse problema, a ferramenta
oferece suporte importao de outras vozes, e como
gostaramos de ter a opo de voz feminina em nosso
processo de sntese, foi realizada a importao de uma voz
feminina (mbrola_us1) do site do projeto Mbrola [14].
5 ARQUITETURA FINAL
Finalizadas as etapas de reconhecimento, traduo e
sntese de fala, iniciamos o desenvolvimento da arquitetura
final do projeto. O objetivo, ento, foi integrar em um
nico sistema as tecnologias anteriormente apresentadas.
Inicialmente, focamos no funcionamento do
reconhecimento da fala, que significou um trabalho de
criao de uma gramtica livre de contexto, integrao e
configurao das tecnologias Julius e Coruja 0.2 num
projeto Microsoft Visual Studio C#.NET.
Em seguida, foi desenvolvido um software que realiza a
traduo automtica do portugus para o ingls, tendo
como entrada o texto gerado pelo reconhecedor descrito
anteriormente. Para tanto, foi criado um executvel Java
para realizar a traduo a partir da Google Translate API.
Para desenvolver um sintetizador para o ingls
utilizamos a ferramenta FreeTTS e JSAPI 1.0. Essas
tecnologias foram integradas na IDE Eclipse [15] em um
projeto de traduo e sntese, gerando um nico executvel
para estas duas funcionalidades.
A arquitetura final resultou da integrao do executvel
Java ao projeto C#.NET. Assim, sempre que uma frase
reconhecida, um texto em portugus enviado para ser
61
AVILA ET AL

SOFTWARE DE TRADUO
SIMULTNEA AUTOMTICA

processado pelo executvel desenvolvido em Java. Este,
por sua vez, realiza a traduo e a sntese para o ingls.
6 RESULTADOS
Para verificarmos o desempenho e eficcia do sistema,
realizamos testes preliminares com trs locutores homens e
uma mulher. Todos leram, de forma natural e contnua,
uma seqncia de frases pr-definidas. Como sada, alm
da frase sintetizada, obtivemos um arquivo de log com a
taxa de confiana do reconhecimento automtico, a frase
reconhecida e a frase traduzida. A tabela 2 mostra alguns
resultados obtidos nos testes preliminares.
Frases Log
01. Boa tarde, eu preciso
de um taxi
02. Boa noite, onde fica a
loja
03. Eu preciso de uma
gua
04. Ol, onde fica o teatro
05. Oi, voc tem internet
06. Ol, preciso de um
caf
07. Eu gostaria de um suco
08. Eu preciso de um
supermercado
09. Eu quero uma
Passagem

I: 100% : eu preciso de um taxi : I need a
taxi.
I: 100% : boa noite onde fica a loja :
good night where is the shop.
I: 95% : eu preciso de uma gua : I need
a water.
I: 100% : ol onde fica o teatro : hello
where is the theater.
I: 100% : oi voc tem internet : hi you
have internet.
I: 91% : ol preciso de um caf : hello I
need a coffee.
I: 100% : eu gostaria de um quarto : I
like to quarter.
I: 99% : eu preciso de uma internet : I
need an Internet.
I: 100% : eu quero uma passagem : I
want a ticket.

Tabela 2: Exemplos das frases processadas pelo sistema
Estes testes nos permitiram ter uma idia prvia do
funcionamento do software e dos pontos que necessitam
aprimoramento. Observamos, por exemplo, que o
equipamento (microfone) utilizado para captar a fala era
consideravelmente sensvel aos sinais de rudos do
ambiente, captando a prpria respirao dos locutores,
quando posicionado muito prximo de suas faces.
Desta maneira, entendemos que para o sistema funcionar
satisfatoriamente, alguns requisitos se fazem necessrios,
tais como: treinamento bsico para os usurios; condies
de funcionamento que aumente o SNR, mesmo em
ambientes pblicos. Outra situao percebida foi que,
mesmo limitando a taxa de confiana de reconhecimento
para o mnimo de 90%, algumas frases continuaram a ser
reconhecidas com erros. Alm disso, quando reconhecidas
corretamente, algumas frases apresentaram problemas ao
serem traduzidas tanto na estrutura como no sentido da
frase.
Como prximos passos imediatos sero feitos diversos
testes formais a fim de realizar uma anlise detalhada do
desempenho do sistema, para vrios locutores de ambos os
sexos e de diferentes idades. Para esta anlise utilizaremos
a ferramenta HResults [11] do pacote HTK. Tal ferramenta
nos permitir realizar uma anlise mais acurada do
reconhecimento, que a parte mais difcil do sistema de
traduo simultnea da fala. Com o feedback da real taxa
de acertos obtida pelo sistema, sero feitos eventuais
ajustes e aprimoramentos, principalmente na gramtica
livre de contexto e no dicionrio de pronncia, at que o
sistema atinja uma eficincia de reconhecimento de pelo
menos 95% de acerto nas frases. Em seguida, iremos
ampliar significativamente o vocabulrio, permitindo uma
maior gama de frases reconhecveis pelo sistema.
Finalmente, teremos que buscar uma outra alternativa para
a traduo de texto realizada pela API do Google
Translate, pois ela ser descontinuada em breve [1].
7 CONCLUSES
Atualmente, existem poucas tecnologias que integram
reconhecimento da fala, traduo automtica e sntese da
fala, disponveis no mercado. Em particular, para o em PB
no existe nenhuma ferramenta deste tipo que esteja
disponvel para uso direto dos consumidores. Nesse
contexto, dada a complexidade dos sistemas envolvidos, o
desafio de criar um sistema de traduo simultnea
automtica que tenha utilidade prtica para o turista
brasileiro ou para estabelecimentos que atendem grande
nmero de clientes estrangeiros, se apresenta como uma
grande oportunidade de inovao tecnolgica dentro da
gama de aplicaes tecnolgicas voltadas para o turismo.
8 REFERNCIAS
[1] Google Translate API. URL:
<http://code.google.com/apis/language/translate/overv
iew.html>, acessado em: 22/06/2011.
[2] Lee, A. The Julius book. Nagoya Institute of
Technology, 2010.
[3] Silva, P., Neto, N., Klautau, A. Novos Recursos e
Utilizao de Adaptao de Locutor no
Desenvolvimento de um Sistema de Reconhecimento
de Voz para o Portugus Brasileiro. XXVII Simpsio
Brasileiro de Telecomunicaes, 2009.
[4] Silva, P., et al. Speech Recognition for Brazilian
Portuguese using the Spoltech and OGI-22 Corpora.
XXVI Simpsio Brasileiro de Telecomunicaes,
2008.
[5] Neto, N., Patrick, C., Klautau, A., Trancoso, I.. Free
tools and resources for Brazilian Portuguese speech
recognition. Journal of Brazilian Computer Society, v.
17, n. 1, p. 53-68, Nov.2010.
[6] FreeTTS 1.2 A speech synthesizer written entirely
in the Java programming language. URL:
<http://freetts.sourceforge.net/docs/index.php>,
acessado em: 21/06/2011.
[7] Java Speech API. URL:
<http://java.sun.com/products/java-media/speech/>,
acessado em: 21/06/2011
[8] JSAPI 1.0 Setup. URL:
<http://freetts.sourceforge.net/docs/jsapi_setup.html>,
[9] How to write a recognition Grammar for Julius. URL:
<http://julius.sourceforge.jp/en_index.php?q=en_gra
mmar.html>, acessado em: 21/06/2011.
[10] Get Julius for Windows API. URL:
<http://julius.sourceforge.jp/en_index.php?q=index-
en.html#sapi>, acessado em: 22/06/2011.
[11] HTK. URL: <http://htk.eng.cam.ac.uk>, acessado em:
22/06/2011.
[12] Neto, N., et al. Um Reconhecedor de Voz Livre para
Portugus Brasileiro com Interface de Programao.
URL: <http://www.laps.ufpa.br/falabrasil/files/coruja-
doc-pt.pdf>, acessado em: 23/06/2011.
[13] Reconhecimento de Voz Para o Portugus Brasileiro
Conversor Grafema-Fone v1.5. URL:
<http://www.laps.ufpa.br/falabrasil/downloads.php>,
[14] The Mbrola Project. URL:
<http://tcts.fpms.ac.be/synthesis/mbrola.html>,
[15] Eclipse IDE for Java EE Developers. URL:
<http://www.eclipse.org/downloads/>, acessado em:
23/06/2011.
62
_________________________________
Artculo de Congreso
Montevideo, Uruguay
nd
Latinoamrica.
_________________________________
Caracterizacin de la sensibilidad y distorsin en parlantes
inicos
Pablo Gmez
1
, Guillermo Santiago
2
y Daniel Sinnewald
1
1
Facultad de Ingeniera, Universidad de Buenos Aires, Laboratorio de Acstica
2
Facultad de Ingeniera, Universidad de Buenos Aires, Laboratorio Lser
pgomez@fi.uba.ar, gsantia@fi.uba.ar, dsinnewald@gmail.com
RESUMEN
Se presenta una caracterizacin de la respuesta elctrica y acstica de parlantes inicos basados en descarga
corona negativa de corriente continua. El emisor hace uso del arreglo electrodo aguzado-grilla. La medicin de
la corriente inica requiri de la implementacin de un sistema de cancelacin en tiempo real de la componente
capacitiva asociada con los electrodos, la que enmascara a la de la descarga. Esta medicin ms exacta de la
corriente permiti conocer la potencia elctrica superpuesta en el medio por la seal de audio y redefinir el
rendimiento, obteniendo un valor ms elevado que el reportado con anterioridad.
1 INTRODUCCIN
Si bien los parlantes inicos son conocidos desde hace
largo tiempo [1-3], no han llegado a ser de uso
generalizado como los de tipo electrodinmico. Diversos
aspectos tcnicos (uso de alta tensin, erosin de
electrodos, generacin de ozono, baja eficiencia, etc) han
desalentado su uso masivo. Sin embargo, los parlantes
inicos presentan atractivos como la eliminacin del
denominado cone break up y un diagrama de irradiacin
menos direccional [4]. La corriente de la descarga est
directamente relacionada con el caudal acstico, sin
elementos mecnicos intermedios, como en un parlante
convencional. Esto permite concebir una accin de control
directo sobre la masa de aire sin los mecanismos de
distorsin de los parlantes convencionales. Algunos
desarrollos realizados sugieren que algunos de los
problemas de los parlantes inicos pueden ser resueltos.
Esto ha llevado a estudiar ms detalladamente el
funcionamiento de estos parlantes y desarrollar nuevos
modelos. En este trabajo se presenta la caracterizacin
elctrica y acstica del sistema emisor simple, conformado
por un electrodo aguzado y una grilla que operan en el
rgimen de descarga de corona negativa. Este esquema ha
sido utilizado por otros autores, pero se han descubierto
aspectos no reportados.
2 ARREGLO EXPERIMENTAL
El parlante inico estudiado en este trabajo (figura 1-2),
consiste de una electrodo aguzado (ctodo) enfrentado
normalmente a una malla metlica o grilla (nodo). Una
fuente de alta tensin continua ajustable provee la corriente
de polarizacin de hasta unos 250 A (dependiendo de la
separacin entre electrodos y la humedad del aire) en tanto
que un transformador de audio de salida vlvular de
20.000/16:8:4 ohms alimentado por un generador
sinusoidal, modula la seal elctrica.
63
GOMEZ, SANTIAGO, SINNEWALD CARACTERIZACIN DE LA
SENSIBILIDAD Y DISTORSIN EN
PARLANTES INICOS
Figura 1. Arreglo experimental
Cerca del ctodo, donde el campo elctrico es intenso, se
generan electrones libres por ionizacin de molculas
(impacto electrnico). Los iones positivos viajan hacia el
ctodo y una fraccin de los electrones es capturada por
especies neutras formando iones negativos. La corriente
est esencialmente sostenida por el transporte de estos
iones negativos (salvo en la mencionada regin prxima al
ctodo). Los iones, en su marcha hacia el nodo, sufren
colisiones esencialmente inelsticas con especies neutras a
las que van transfiriendo parte de la cantidad de
movimiento adquirida al ser acelerados por el campo
elctrico. As se genera un transporte de iones y especies
neutras que constituye un caudal medio, usualmente
denominado viento elctrico.
Figura 2. Arreglo experimental
Dado que la generacin de electrones crece con la
tensin aplicada, es necesario introducir una resistencia
limitadora para evitar la transicin al arco. En este rgimen
la zona de descarga contiene una densidad de iones N
i
que
se desplazan a una velocidad media v
d
con una densidad de
corriente J
i
=e N
i
v
d
.
La figura 3 presenta dos caractersticas I-V. La curva
inferior corresponde a bajas corrientes en la descarga (I
dc
)
las que se pueden aproximar en funcin de la tensin en la
descarga V
dc
como [5]:
donde C es una constante que depende del gas, la distancia
interelectrdica y el radio de la punta y V
c
es la tensin
umbral a partir de la cual comienza la descarga.
La curva superior, asociada a mayores corrientes no
puede ser aproximada a la relacin anterior y se encontr
un ajuste de la forma:
0 5 10 15
0
50
100
150
200
V
desc
(kV)
Figura 3. Transferencia esttica . Curva superior: d= 9 mm. Curva
inferior: d= 12 mm. R= 4 M
La seal acstica es generada modulando la velocidad de
los iones alrededor del valor medio. Para conseguir esto se
recurre a un transformador que superpone la seal de audio
a la polarizacin. Para pequeas amplitudes de modulacin
la densidad de iones permanece constante y slo vara la
velocidad de los mismos. Sin embargo, esto no es
estrictamente cierto porque el campo elctrico variable
determina un cambio en la densidad de iones y es una
causa de distorsin.
Figura 4. Circuito equivalente del sistema de medicin.
Para caracterizar el comportamiento se registr: a) la
corriente continua con un microampermetro, b) la alta
tensin de audio con una punta Tektronix P6021, c) la
corriente alterna con un osciloscopio Tektronix TDS1001B
y su espectro a travs de una placa M-Audio Audiophile
2496, d) la tensin continua con una punta de alta tensin
conectada a un voltmetro e) la presin acstica con un
micrfono de condensador Bruel & Kjaer 4133 y un
preamplificador de bajo ruido.
La medicin de la corriente alterna mostr un
inconveniente: la componente capacitiva, debida a la
capacitancia entre ctodo y nodo y entre ctodo y todo
objeto metlico a tensiones prximas a cero volt. Esta
corriente result comparable a la asociada con la descarga
de corona. De tal manera, al incrementar la polarizacin de
continua se notaba un aumento de la seal sonora pero un
muy reducido incremento de la corriente. Ms an, el
defasaje entre tensin y corriente result prximo a 90.
Si bien otros autores han analizado este sistema, pocos
han tomado en cuenta esta capacitancia parsita a fin de
descontar sus efectos en tiempo real [6]. Dado que este
acoplamiento capacitivo es inevitable, ciertos valores de
64
PARLANTES INICOS
corriente reportados podran estar afectados por el mismo
problema. Para solucionar este problema se recurre al
esquema de cancelacin mostrado como un circuito
equivalente en la figura 4.
0 0.5 1 1.5 2 2.5
-0,2
-0,1
0
0,1
0,2
t (ms)
Figura 5. Medicin de corriente. Curva 1: sin compensacin. Curva
2: con compensacin.
La resistencia limitadora R est conectada a un paralelo
conformado por la capacitancia parsita interelectrdica C
p
y la resistencia dinmica R
d
de la descarga (en ausencia de
polarizacin R
d
tiende a infinito). Se agrega al electrdo
aguzado una capacitancia compensadora C
c
, conformada
por un alambre devanado sobre un cable coaxil. Luego, las
respectivas corrientes son muestreadas sobre sendas
resistencias R
m
de 10 k acoplando la informacin de
corriente a las entradas de un amplificador diferencial.
0 0.2 0.4 0.6 0.8 1
-3
-2
-1
0
1
2
3
t (ms)
Figura 6. Curva 1: tensin. Curva 2: corriente en la descarga.
Corriente de polarizacin 110 A.
Se estim la capacitancia interelectrdica con las
medidas de tensin y corriente para una situacin sin
polarizacin de continua. Con este valor, se calcul la
cantidad de vueltas de alambre que se deban devanar sobre
el cable coaxil (capacidad compensadora) y el ajuste fino
de stas se realiz buscando el mnimo posible de seal
remanente. La componente capacitiva se redujo a un 10%
del valor inicial.
La figura 5 presenta la corriente medida, en ausencia de
polarizacin con y sin la compensacin. Las seales son
promediadas 128 veces y, a pesar de esto, queda un ruido
remanente. Tratndose de un circuito de alta impedancia y
dado que el sistema careca de blindaje electrosttico, el
ruido probablemente se deba a seales espreas.
Habiendo sustrado la seal indeseada, se pudo medir la
parte asociada con el transporte de iones. Puede observarse
(figura 6) que dicha corriente se encuentra prcticamente
en fase con la tensin, mostrando un comportamiento
mayormente resistivo a las frecuencias relevadas en el
experimento.
La figura 7 muestra la relacin entre la componente de
corriente alterna de la descarga y la corriente de
polarizacin. Al aumentar la polarizacin crece la
componente alterna pero en forma alineal. Careciendo an
de un modelo terico que prediga dicha relacin alineal, se
busc un ajuste a travs de una funcin potencial (curva
roja) en la que el exponente es prximo a 0.5.
Figura 7. Corriente alterna versus corriente de polarizacin.
Este comportamiento puede comprenderse recordando
que la corriente de polarizacin es proporcional al producto
de la densidad de iones y la velocidad de arrastre de los
mismos, dada por el campo externo. La componente de
alterna se obtiene a partir de la misma densidad de iones
pero con una velocidad dada por el campo elctrico
asociado a la seal de audio.
0 2 4 6 8 10 12 14 16 18
0
5
10
15
20
25
I
ac
( A)
Figura 8. Presin acstica versus corriente
Las mediciones acsticas fueron efectuadas dentro en
un recinto de 2m x 0.4 m x 0.4 m, recubierta internamente
con material absorbente. As se busc evitar reflexiones
contra las superficies a fin de que la seal registrada por el
micrfono fuera la directa. El recinto contribuye tambin a
disminuir el piso de ruido acstico de la medida.
La figura 8 muestra la presin acstica en funcin de la
corriente alterna. La linealidad es excelente. Es interesante
notar que el caudal acstico, y por ende la presin acstica
estn directamente conectados con la corriente, a diferencia
de los parlantes electrodinmicos en los que media un
sistema mecnico.
La respuesta en frecuencia de la corriente alterna en la
descarga y la presin acstica (ambas en escala
logartmica) aparecen en la figura 9. Se puede observar que
a bajas frecuencias la presin acstica disminuye debido al
cortocircuito acstico.
La principal fuente de distorsin es la modulacin de
conductividad. En el semiciclo positivo crece el campo
elctrico, y con ello la generacin de iones, mientras que
en el negativo ocurre el proceso contrario. Por lo tanto, el
caudal acstico vara por la densidad de iones y por la
velocidad de los mismos. Reducir la seal de audio mejora
la distorsin al precio de una menor presin acstica.
0 50 100 150 200 250 300
0
5
10
15
I
dc
( A)
Iac ( A)
1
2
1
2
65
PARLANTES INICOS
0 5 10 15
-70
-65
-60
-55
-50
-45
-40
-35
-30
-25
-20
f (kHz)
Figura 9. Respuesta en frecuencia. Curva superior: corriente. Curva
inferior: presin acstica.
La figura 10 presenta el espectro de corriente y el de
presin acstica a 3 kHz. La segunda armnica de la
corriente se encuentra 35.7 dB por debajo de la
fundamental. En cuanto al espectro acstico, la misma se
encuentra 27.6 dB por debajo de la fundamental.
Aparentemente ha crecido unos 8 dB, respecto de la
corriente. Sin embargo, estos valores deben ser corregidos
a travs de la curva de respuesta en frecuencia de la figura
9, la que muestra que la respuesta a 6 kHz es de unos 4-5
dB superior a la de 3 kHz. El aumento real de la distorsin
es menor, mostrando que la presin acstica posee alta
correlacin con la corriente.
La figura 11 muestra la diferencia de amplitudes (
entre la fundamental y la segunda armnica en funcin de
la razn entre el valor eficaz de la tensin de audio y la de
polarizacin (modulacin porcentual). Las tensiones
eficaces aplicadas variaron desde 180 hasta 500 V y las de
polarizacin desde 3 hasta 12 kV. Se puede apreciar como
disminuye la distorsin a medida que el porcentaje de
modulacin se hace menor.
0 5 10 15 20
-200
-150
-100
-50
0
f (kHz)
Figura 10. Espectro de distorsin a 3 kHz. Curva superior: corriente.
Curva inferior: presin acstica. Corriente de polarizacin 110 A.
En cuanto al rendimiento, la potencia elctrica
depositada en la descarga se comput a travs de la
corriente alterna y una resistencia equivalente dada por la
pendiente de la curva I-V.
Con 230 A de corriente de polarizacin, se estima una
resistencia dinmica de 13 M calculada a partir de la
curva I -V esttica. Con una corriente alterna de 15 A, se
obtiene una potencia elctrica de 3 mW. Por otro lado, se
mide una presin acstica de 73 dB a 3.5 cm de distancia.
El rendimiento del parlante, la potencia elctrica We y el
nivel de presin sonora SPL, para una fuente puntual
isotrpica en espacio libre y ubicada a una distancia r del
micrfono, estn relacionados por la ecuacin 3:
0 2 4 6 8 10
-35
-30
-25
-20
-15
Modulacin porcentual
Figura 11. Distorsin de segunda armnica ( en funcin de la
modulacin. Asteriscos: f= 3 kHz. Puntos: f = 6 kHz.
De los valores anteriores se infiere 10
-4
. Es importante
destacar que este valor, aunque reducido, es muy superior a
lo reportado por otros autores [4]. Se cree que la diferencia
se debe a que dichos autores utilizaron en sus cmputos la
corriente total que circula, la cual, como hemos visto,
contiene una fuerte componente capacitiva. Esto lleva a
sobrestimar la potencia elctrica depositada en la descarga,
con el consecuente deterioro del rendimiento.
3 CONCLUSIONES
Un parlante inico basado en una descarga corona
negativa de corriente continua ha sido construido y
caracterizado. Para obtener los parmetros elctricos se ha
implementado un sistema de medicin que permite obtener
la componente de audio de la corriente de descarga
descontando, en tiempo real, los aportes de corrientes
capacitivas parsitas. Esto permite, a futuro, introducir
tcnicas de control que minimicen la distorsin. En base al
conocimiento ms exacto de la corriente circulante por la
descarga, se ha obtenido un rendimiento superior al
reportado por otros autores.
4 REFERENCIAS BIBLIOGRFICAS
[1] Shirley, Gerald (1957). The Corona Wind
Loudspeaker. Journal of the Audio Engineering
Society. Volume 5 Issue 1, January 1957, pp. 23-31.
[2] Lindenblad, Nils E (1928). Intertransposition of
sound and electrical energy. United States Patent
1685075. RCA CORP.
[3] Kiichiro Matsuzawa (1973). Sound sources with
corona discharges. Journal of the Acoustical Society
of America, Volume 54, Issue 2, pp. 494-498.
[4] Bquin, Ph.; Castor, K.; Herzog, Ph.; Montembault,
V. (2007). Modeling plasma loudspeakers. The
Journal of the Acoustical Society of America, vol.
121, issue 4, p. 1960.
[5] Cobine, James D. (1958). Gaseous Conductors;
Theory and Engineering Applications. Dover
reprint.
[6] Bquin, Ph.; Montembault, V.; Herzog, Ph. (2001).
Modelling of negative point-to-plane corona
loudspeaker. The European Physical Journal Applied
Physics. 15, 5767.
66
_________________________________

Artculo de Congreso
Montevideo, Uruguay

nd
Latinoamrica.
_________________________________

Una nueva iteracin de YARMI

Bruno Azzinnari, Pablo Bounous, Gastn Caldeiro, Toms Laurenzo
Laboratorio de Medios, InCo, Facultad de Ingeniera, Universidad de la Repblica
Montevideo, 1300, Uruguay
brazzinnari@gmail.com, pavlko@gmail.com, chugas488@gmail.com, tomas@laurenzo.net

RESUMEN
YARMI es un instrumento musical colaborativo, tangible, que funciona en red y opera en un espacio de realidad
aumentada compartido entre los msicos y el pblico. Presenta una interfaz de sobremesa donde se interacta
con varios secuenciadores musicales y mquinas de efecto en tiempo real.
En este artculo se presentan los cambios y mejoras introducidos en la nueva versin del instrumento, a partir del
diseo original realizado por Laurenzo, Castro y Rodrguez. En esta nueva instancia se hizo hincapi en los
aspectos grficos, de usabilidad y de interaccin, introducindose nuevas funcionalidades como un
secuenciador orientado a notas adems de uno de muestras y el soporte de loops de audio pregrabados ,
redisendose tambin la arquitectura del sistema, previo a su construccin.

1 INTRODUCCIN
YARMI
1
es un instrumento musical, descrito
originalmente en [1]. Aqu se presenta una nueva iteracin
en su diseo, junto con la implementacin del instrumento
por parte de los autores del artculo en el marco del
proyecto de Grado: YARMI, de la Facultad de Ingeniera,
UdelaR
2
, bajo la tutora de Toms Laurenzo.
YARMI surge de una amplia discusin dentro de los
laboratorios del grupo de investigacin CECAL
3
, acerca de
qu aspectos pueden hacer a un instrumento realmente
ejecutable por un msico, y no una interfaz musical ms a
la que sea difcil sacarle un provecho artstico. Qu
patrones de diseo pueden aplicarse para lograr la correcta
ejecucin del instrumento, la identificacin con l, y
ayudar a generar un genuino sentido musical. Tambin,

1
YARMI: YARMI is an Augmented Reality Musical Instrument.
2
Universidad de la Repblica Oriental del Uruguay.
3
Centro de Clculo, Instituto de Computacin, Facultad de
Ingeniera, UdelaR.
http://www.fing.edu.uy/inco/grupos/cecal
cmo el pblico puede entender los gestos del msico
sobre el instrumento si no hay previamente un
conocimiento social de los mismos, como s acontece con
los instrumentos musicales clsicos.
Esta discusin est enmarcada tambin dentro del trabajo
realizado por Toms Laurenzo durante el desarrollo de su
Maestra: New Media Art [2]. Siendo el diseo de este
instrumento uno de los tres ejemplos presentados como
trabajos orientados a la produccin artstica, buscando
utilizar las nuevas tecnologas como un medio y no
solamente como una herramienta.
Dentro de la produccin de instrumentos musicales con
computadoras es posible encontrar ejemplos simples, como
los clsicos step sequencers
4
o drum machines
5
, o
instrumentos de difcil o limitada ejecucin prctica.
Tambin sucede que suelen ser muy diferentes a los

4
Un step sequencer, es una clase de secuenciador musical con una

5
Una drum machine, es un instrumento musical electrnico
diseado para imitar el sonido de una batera y otros elementos de
percusin. Comnmente contienen un step sequencer.

67
AZZINNARI, BOUNOUS, CALDEIRO, LAURENZO YARMI

instrumentos musicales clsicos, y, por lo tanto, se descarta
un gran volumen de conocimiento social relacionado al
instrumento, como son las tcnicas particulares de
ejecucin y los gestos tpicos [3].
Para abordar estos temas planteados en la discusin, dos
patrones de diseo fueron utilizados: el de asociar sonidos
a objetos fsicos, y el de los secuenciadores musicales.
El primer patrn, una interfaz tangible
6
, cae dentro de un
estilo de interaccin llamado manipulacin directa. La idea
central en la manipulacin directa consiste en ofrecer al
usuario la sensacin de manipular directamente los objetos
de la interfaz. Los dos patrones de diseo son muy
importantes para los objetivos planteados en las
discusiones: los secuenciadores son herramientas
tradicionales para la construccin de msica digital [4], y
la manipulacin directa incentiva la identificacin con la
interfaz, la familiaridad y la expresividad en tiempo real.
Un aspecto importante es que ambos patrones de diseo
son fciles de aprender y pueden ser fcilmente entendidos
por el usuario [2], pudindose establecer rpidamente una
correspondencia entre los gestos realizados y la msica
producida. Esto es muy importante para lograr la
identificacin y el sentido musical en el instrumento, tanto
en el propio msico como dentro de los espectadores.
Los secuenciadores musicales son estndares que,
aunque no tienen una metfora de la realidad, ofrecen una
interfaz reconocible dentro del rea de la msica por
computadora.
La interaccin a travs de la manipulacin directa de
objetos fsicos, se enmarca tambin dentro de un
paradigma establecido en las interfaces tangibles (con
ejemplos relacionados exitosos como reacTable [5],
levelHead [6], ISS Cube [7], Audiopad [8] [9] y Block Jam
[10] [11], entre otros).
2 YARMI
El instrumento consta de una o varias estaciones. Una
estacin consiste en una superficie de trabajo, un conjunto
de fichas de madera, una cmara, una computadora y,
potencialmente, un proyector. Cada estacin es operada por
uno o varios msicos interactuando con ella por medio de
sus interfaces tangible y visual.
El instrumento musical es colaborativo tanto dentro de
una misma estacin debido a que las fichas pueden ser
manipuladas por ms de una persona como al formar la
red de estaciones: el instrumento puede mantenerse en
comunicacin con otras instancias cercanas para hacer
msica en conjunto, de una forma coherente.
2.1 La interfaz tangible y la salida visual
La interfaz tangible est formada por un conjunto de
fichas de madera (tokens
7
) con marcadores visuales
reconocibles por el sistema (fiducials
8
) pegados en una de
sus caras y smbolos identificables por un ser humano en la
otra. Estas fichas son manipuladas por el msico, y su
ubicacin y rotacin dentro del espacio de trabajo son
captadas por el sistema mediante una cmara.

6
Interfaz tangible, es una interfaz en la cual la interaccin con el
sistema es realizada mediante la manipulacin de objetos fsicos
particulares, y no las herramientas de uso general como teclados,
ratones, etc.
7
Token, es el objeto fsico de la interfaz tangible. En YARMI,
stos son fichas redondas de madera.
8
Fiducial, es la marca o el smbolo visual que se coloca en el
campo de visin de un sistema de tracking visual, con el fin de
determinar su ubicacin, rotacin u otra informacin relacionada.

Figura 1 Tokens y sus distintas caras.
La salida visual de la interfaz se construye en base a la
informacin recibida a travs de la interfaz tangible, y
puede proyectarse sobre una superficie grande, visible
tanto para el msico como para la audiencia.
En la superficie de trabajo se presentan distintos
secuenciadores musicales que llamamos pistas y
mquinas de efectos de sonido de tiempo real, que sern
operadas por los msicos para generar la salida de audio
esperada, en sincrona con la de los msicos de las dems
estaciones.
2.2 Pistas
YARMI cuenta con dos tipos de pistas, que se crean
utilizando dos tokens particulares: con la rotacin del
StartToken se selecciona el tipo de pista deseada y cuando
un EndToken aparece en el rea de trabajo, la nueva pista
se crea.
Las pistas representan un comps de cuatro pulsos (o
beats), que pueden subdividirse en hasta cuatro partes
modificando el parmetro de cuantizacin, mediante la
rotacin del EndToken transformndola en un
secuenciador de dieciseis pulsos.
Moviendo sus tokens de comienzo y fin, una pista puede
reposicionarse en el rea de trabajo. Tambin puede
colapsarse sobre un StartToken; esto es, llevarse a un
estado en el que el rea que ocupa es mucho menor y con
solo ocultar o volver a mostrar el token, la pista detiene o
reinicia su reproduccin, proveyendo de esta forma un
mtodo de secuenciacin manual.
La forma de componer sobre una pista depende de su
tipo. Una pista de muestras funciona colocando
SampleBankTokens esto es, tokens que representan
bancos de muestras en sus ranuras. Con la rotacin de
cada uno de estos tokens se modifica la altura tonal de la
muestra seleccionada, mientras que con ayuda del
SelectorToken que se mencionar ms adelante se elige
la muestra a reproducir.

Figura 2 Una pista de muestras con tres SampleBankTokens.
Una pista de sintetizador funciona con la ayuda de tres
tokens adicionales, que permiten al msico asignar una
nota particular a cada ranura, o eliminarla. El sonido
68

generado por esta pista es bsico: una onda de diente de
sierra con una envolvente de amplitud predeterminada. Sin
embargo, con ayuda del MIDIToken puede hacer que su
salida se redirija por un canal MIDI para poder ser
interpretada por un software externo.

Figura 3 Una pista de sintetizador con los tokens auxiliares de
composicin.
Finalmente, las pistas pueden ser eliminadas utilizando
el DropToken.
2.3 Loops
El instrumento soporta la secuenciacin continua y en
bucle de un tipo particular de muestras, llamadas loops.
stas son generalmente piezas rtmicas pregrabadas a una
velocidad (BPM) particular, que se extienden sobre una
cantidad determinada de compases.
Un LoopBankToken contiene un banco de loops
previamente configurado. Con solo colocarlo sobre la
mesa, la reproduccin del primer loop del banco comienza.
La seleccin del loop y de la altura tonal con el que este se
reproducir se realiza de la misma manera que para un
SampleBankToken.
Grficamente, un token de loop es muy similar al de una
pista colapsada, permitiendo que la secuenciacin de
ambos tipos de construcciones se pueda realizar
intuitivamente mediante el mismo mecanismo.
2.4 Control
No se ha mencionado hasta ahora una funcionalidad
importante del instrumento: la capacidad de detener o
reanudar la composicin completa de la estacin utilizando
un token algo particular un token con un fiducial de cada
lado que segn la cara que muestre a la cmara, ejecutar
uno u otro comando.
Otro token importante es el BPMToken, que controla la
velocidad de reproduccin de la composicin entera: tanto
pistas como loops ajustan en todo momento su velocidad
de reproduccin al valor que este token modifica.
Antes de introducir el prximo token, es necesario
introducir el concepto de acoplabilidad, la capacidad de un
token de asociarse a un objeto particular de la interfaz para
afectarlo de una u otra manera.
El VolumeToken controla con su rotacin en su modo
de funcionamiento normal el volumen general de la
estacin. Sin embargo, este token puede tambin acoplarse
a pistas, tokens de loops y tokens individuales dentro de
una pista de muestras para cambiar volmenes especficos.
Por ltimo, existe adems un token similar al anterior
que permite controlar el balance estreo de la salida de
audio general.
2.5 Efectos
Los EffectTokens son tokens que pueden ser acoplados
tanto a pistas como a tokens de loop para modificar la
salida de audio que estos objetos generan. Si el token no
est acoplado a ningn objeto, la salida de audio que se ve
afectada es la global de la estacin.
Actualmente estn soportados tres tipos de efectos:
reverb, tremolo y delay. Una vez que el token de efecto
est en el rea de trabajo, mediante su rotacin y con la
ayuda del SelectorToken pueden modificarse con
resultados en tiempo real sus parmetros.

Figura 4 - Un EffectToken de reverberacin acoplado a una pista colapsada
y un SelectorToken acoplado al primero, seleccionando su segunda
dimensin, el parmetro damping.
2.6 Herramientas
Si bien hasta ahora no se ha mencionado explcitamente,
varias de las funcionalidades descritas utilizan el concepto
de dimensin: un parmetro que ciertos tipos de tokens
los tokens dimensionables poseen y que toma un valor
dentro de un conjunto discreto de posibilidades (que vara
de token a token) y segn el cual modifican su
comportamiento de alguna u otra forma.
El SelectorToken permite, mediante el mecanismo de
acoplamiento combinado con su propia rotacin, modificar
la dimensin seleccionada en un token.
Los tokens dimensionables son: SampleBankToken,
LoopBankToken y EffectToken. A todos ellos puede
acoplarse el SelectorToken para modificar su dimensin
seleccionada que para los dos primeros es la muestra
seleccionada y para el ltimo, el parmetro del efecto que
la rotacin del token original modifica.
2.7 Caractersticas de red
Como se mencion anteriormente, el instrumento tiene
la capacidad de funcionar en conjunto con otras estaciones
YARMI en forma coherente.
En este escenario, la estacin lder la ltima estacin
que haya puesto el LeaderToken sobre su mesa tiene el
control sobre la produccin musical global, pudiendo
decidir cuando sta se detiene o reinicia, y especificando
parmetros como el volumen general, BPM y el balance
estreo.
3 IMPLEMENTACIN
Cada estacin est constituida de tres grandes mdulos:
un mdulo escrito en C++ que utiliza
openFrameworks
9
como framework de programacin,
un mdulo de audio desarrollado en Pure Data
10
,
y un sistema de reconocimiento de fiducials o
marcadores, reacTIVision
11
.

9
openFrameworks es una librera de cdigo abierto, escrita en
C++ y diseada para la codificacin creativa. Es desarrollada y
mantenida por Zachary Lieberman y Theo Watson [12].
10
Pure Data (o Pd) es un lenguaje de programacin grfico de
cdigo abierto desarrollado por Miller Puckette durante los aos
90 para la creacin de msica computarizada interactiva y obras
multimedia [13].
11
reacTIVision es un framework de visin por computadora de
cdigo abierto y multiplataforma para el reconocimiento veloz y
69

La Figura 5 indica cmo se transfiere el flujo de
informacin entre los diferentes mdulos que componen la
arquitectura de la aplicacin.

Figura 5 - Arquitectura de software de YARMI
Para el reconocimiento de patrones fiduciales e
implementacin de la interfaz tangible usamos
reacTIVision. Este software transmite informacin sobre la
posicin de los fiducials (capturada mediante una cmara
web) al mdulo principal (mediante el protocolo TUIO
12

basado en OSC
13
y enviado sobre UDP) quien maneja toda
la informacin de la estacin, se encarga del procesamiento
y generacin de la imagen en tiempo real. A su vez, el
mdulo principal transmite (mediante el protocolo propio
YARMISound basado en OSC y enviado sobre UDP)
informacin al mdulo de Pure Data, el cual se encarga de
generar el sonido tambin en tiempo real.
Las estaciones se comunican entre s mediante el
protocolo tambin propio YARMINet basado en OSC y
enviado sobre UDP. Cada vez que ocurre un cambio en
algunos de los parmetros de configuracin en la estacin
lder, se realiza un broadcast notificando los cambios a las
estaciones conectadas.
4 CONCLUSIONES Y TRABAJO FUTURO
En este artculo se presenta una nueva iteracin en el
diseo y construccin del instrumento multiusuario, basado
en realidad aumentada, YARMI.

Muchos de los cambios que el diseo del instrumento
sufri durante esta iteracin se dieron en forma paralela a
su construccin, siendo producto de pruebas de usabilidad
realizadas tanto por parte del propio equipo de desarrollo
como con usuarios externos. As se fueron estandarizando
mtodos de accin particulares, reglas de uso implcitas, y
algunos conceptos en principio abstractos, que luego
fueron tornndose ms concretos.
Entre los principales cambios respecto al diseo original
presentado en [1], se destacan: i) se eliminaron las zonas
dedicadas; ii) se introdujo las pista de sntesis; iii) se
redefini la arquitectura, as como varios mdulos,
optndose por Pd y reacTIVision; iv) se introdujeron varios
gestos y funcionalidades: acoplamiento de fichas,

robusto de marcadores fiduciales adjuntos a objetos fsicos, y para
el reconocimiento de dedos sobre una superficie multitctil [14].
12
TUIO es un framework de cdigo abierto que define un
protocolo y una API para la transmisin de eventos que ocurren
sobre superficies multitctiles [15].
13
OSC (Open Sound Control) es un protocolo de red que permite
comunicar instrumentos de msica, computadoras y otros
dispositivos multimedia en tiempo real [16].
multidimensionalidad (SelectorToken), y colapsado de
pistas, entre otros.
Si bien an resta efectuar evaluaciones formales de
usabilidad, las pruebas ms recientes con distintos tipos de
usuarios (msicos profesionales y amateurs, informticos y
pblico en general) indicaron que el lenguaje de
interaccin propuesto es efectivo, coherente, e intuitivo; y
que aparece como una base slida sobre la cual crear una
gran variedad de construcciones nuevas y diversas.
En vista al futuro hay varios aspectos que debern
trabajarse. Por ejemplo, actualmente el instrumento solo
trabaja con compases de 4/4, lo cual es una gran limitante.
Se pretende incorporar otras mtricas generales, o
particulares para diferentes pistas, o loops. Tambin se
podran crear pistas de diferente longitud (en cantidad de
compases), de acuerdo al diseo original.
Otra caracterstica deseable sera la posibilidad de
secuenciar diferentes pistas y loops, enlazndolos unos a
continuacin de otros.
Se pretende, tambin, implementar tcnicas adicionales
de visin por computadora que ofrezcan al usuario la
posibilidad de realizar gestos manuales durante la
interaccin (probablemente, utilizando cmaras 3D).
REFERENCIAS
[1] Laurenzo, T., Rodrguez, E. and Castro, J. F: YARMI: an
Augmented Reality Musical Instrument. NIME, 2009.
[2] Laurenzo, T.. Master Thesis: New Media Art.
http://www.fing.edu.uy/~laurenzo/master (Agosto, 2011)
[3] Jord, S. Digital Lutherie: Crafting musical computers for
dissertation, Dept. of Computer Engineering, Universitat
Pompeu Fabra, Barcelona, 2005.
[4] Duignan M., Biddle R. & Noble J. A Taxonomy of
Sequencer User-Interfaces. Barcelona: International
Computer Music Conference (ICMC), 2005.
[5] Kaltenbrunner, M. & Jord, S. & Geiger, G. & Alonso, M.
The reacTable*: A Collaborative Musical Instrument.
Manchester, U.K. : WETICE, 2006.
[6] Oliver, Julian. levelHead.
http://selectparks.net/~julian/levelhead (Agosto, 2011)
[7] Quarta, M. ISS Cube. Exhibited at Ars Electronica,
Cybersonica, Bafta Interactive Festival. 2003.
[8] Patten J., Recht B. & Ishii H. Audiopad: A Tag-based
Interface for Musical Performance. Dublin, Ireland:
Proceedings of the Conference on New Interfaces for
Musical Expression, 2002.
[9] Patten, J. & Recht, B. Audiopad.
http://www.jamespatten.com/audiopad (Agosto, 2011)
[10] Newton-Dunn H., Nakanon H. & Gibson J. Block Jam: A
Tangible Interface for Interactive Music. Montreal, Canada:
Proceedings of the Conference on New Interfaces for
Musical Expression, 2003.
[11] Newton-Dunn, Henry. Block Jam.
http://www.sonycsl.co.jp/IL/projects/blockjam (Agosto,
2011)
[12] Openframeworks. http://www.openframeworks.cc (Agosto,
2011)
[13] Pure Data. http://puredata.info (Agosto, 2011)
[14] ReacTIVision. http://reactivision.sourceforge.net (Agosto,
2011)
[15] TUIO. http://www.tuio.org/ (Agosto, 2011)
[16] OSC. http://www.opensoundcontrol.org/ (Agosto, 2011)
70
_________________________________________________________
Artculo de Congreso
Montevideo, Uruguay
_________________________________________________________

Marco Colasso Soca
Centro de Investigacin en Tecnologas de Audio
Pontificia Universidad Catlica de Chile
Santiago de Chile, 7550000, Chile

marco.colasso@gmail.com

RESUMEN
0 INTRODUCCIN

71
COLASSO
Un generador de paisajes sonoros.

construcciones abstractas, tales como composiciones
musicales y montajes en cinta, especialmente cuando se lo
[3].
La experimentacin con este tipo de material sonoro, nos
permite generar y manipular una amplia gama de sonidos,
que van de lo concreto a lo electrnico, de sonidos
naturales a sonidos artificiales. A pesar de que este
proyecto tiene por finalidad la creacin de paisajes para
instalaciones interactivas cmo lo hicieran Barton y
Priscila McLean en Rainforest Image [4], diferentes aplica-
ciones pueden beneficiarse esta disciplina como por
ejemplo la creacin de ambientes virtuales, videojuegos,
realidad aumentada, proyectos como Tapestrea [5] y
Soundscapes Modeling [6] son ejemplos relacionados.
1 CONTROLADOR
Al comenzar con este proyecto, se decidi optar por la
utilizacin de una mesa tangible como controlador, ya que
ste sistema basado en realidad aumentada, propone un
modo de interaccin directo e intuitivo entre el usuario y la
informacin digital que no estaba presente en los diseos
tradicionales basados en interfaces grficas de usuario
(GUI), ni en los controladores basados en faders y
potencimetros, donde perdemos demasiado tiempo
recordando a donde estn asignado y que es lo que hace
cada parmetro [7][8].
El controlador consiste en una mesa multitctil con la
capacidad de reconocer forma, orientacin y posicin de
objetos fsicos aumentados digitalmente denominados
objetos tangibles. Esta mesa (Figura 1) fue construida con
una tcnica llamada iluminacin trasera difusa.
Bsicamente consta de un hexaedro que contiene en su
interior leds infra-rojos capaces de iluminar la superficie
de la forma ms pareja posible. En este caso un material
difusor es puesto en el medio de la superficie compuesta
por dos vidrios, de modo que cuando un objeto toca la
superficie ste refleja ms luz que el difusor o los objetos
que estn en su fondo. sta luz es detectada por una
cmara adaptada para captar solamente luz infra roja y
finalmente la informacin es digitalizada para ser
analizada por un tracker (software encargado del anlisis
topolgico y deteccin de movimiento).

Figura 1 Modelado 3D del controlador construido que seala las
diferentes partes del sistema.
El tracker entrega datos de identificacin, posicin y
rotacin en el caso de los objetos tangibles con marcadores
fiduciales, que son comunicados a otra aplicacin
encargada de discriminar cual de los gestos realizados por
el usuario son vlidos, para la posterior generacin del
feedback visual y sonoro.
La construccin de esta interfaz fue posible gracias a los
foros de la comunidad NUI group y el libro Multi-Touch
Technologies [9].
2 SOFTWARE
Para esta primera versin del generador de paisajes
sonoros, decidimos utilizar dos entornos de programacin
diferentes pero que tienen ventajas en comn, son gratuitos
y de cdigo abierto, lo que ha contribuido a un valioso
desarrollo por parte de comunidades a nivel mundial.
El reconocimiento de gestos, lgica, y feedback visual,
utilizamos Processing [10], un lenguaje de programacin
de texto especialmente diseado para generar u modificar
imgenes. La aplicacin encargada del sonido se encuentra
programada en Pure Data [11], un lenguaje de
programacin visual para audio y procesos grficos a
tiempo real. La comunicacin entre programas se realiza
por medio de los protocolos de comunicacin TUIO y
OSC.
stas aplicaciones son capaces de correr bajo cualquier
sistema operativo, y cada da se encuentran ms cerca de
poder ser utilizados a travs de cualquier browser desde
Internet.
3 FAMILIAS DE OBJETOS TANGIBLES
Para lograr entender de forma general la eleccin de las
taxonomas, agrupaciones de sonidos y funciones en
familias de objetos tangibles, podemos pensar en una
analoga entre los elementos utilizados para la composicin
del paisaje sonoro, con los que componen una imagen o
paisaje visual. Los paisajes sonoros generados estn
compuestos por fondos (ambientes sonoros), figuras
(eventos/objetos sonoros), y efectos que transforman las
figuras (efectos sonoros).
3.1- Tangibles reproductores de ambientes sonoros.
Esta primera familia de objetos tangibles son los
encargados de reproducir ambientes sonoros previamente
grabados, stos pueden ser utilizados como el fondo del
paisaje generado por el usuario.
Los ambientes han sido seleccionados de una biblioteca
que hemos creado durante estos ltimos cuatro aos en
base a grabaciones de ambientes de diferentes partes de
Chile.
Las grabaciones de ambientes son clasificadas segn la
propuesta de R. Murray Schafer [12], quin presenta los
extremos cmo paisajes HI-FI, y paisajes LO-FI. Los
ambientes HI-FI son encontrados principalmente en zonas
rurales, o lugares donde tenemos una buena relacin seal-
ruido, sta nos permite distinguir los eventos sonoros con
claridad discriminando la figura del fondo, minimizando
las situaciones donde un sonido enmascara a otro. El LO-
FI es todo lo contrario, y suele encontrarse en zonas
urbanas con altos niveles de polucin sonora.
Existen 2 objetos tipo LO-FI, uno encargado de ejecutar
y controlar un reproductor de grabaciones estreo, y otro
para ejecutar grabaciones cuadrafnicas. Tambin existen
2 objetos reproductores de ambientes clasificados como
HI-FI con las mismas caractersticas.
Al momento de superponer las auras (circulo proyectado
alrededor de los objetos cuando se encuentran activos) de
un objeto LO-FI y un HI-FI, estos se dejan de escuchar
-
72
COLASSO
Figura 2 Podemos ver 3 de los 12 objetos tangibles de acrlico
pertenecientes a la familia de eventos sonoros que son clasificados
segn su masa.
Figura 3 Se observa la transformacin del evento en un objeto
sonoro ingresando el satlite en el aura del evento, y desplazando el
mismo en cualquier direccin.
4 MDULOS
73
COLASSO
Un generador de paisajes sonoros.

Cada 2048 samples se realiza un anlisis espectral de los
ambientes sonoros reproducidos, el resultado obtenido del
promedio de niveles para bajas frecuencias determina de
forma proporcional el valor del tempo en BPM, el
resultado promedio para frecuencias medias y altas
determinara el porcentaje de swing utilizado. De esta forma
cuando suena un ambiente LO-FI aumenta el tempo y
disminuye el swing ya que posee un mayor nivel en
frecuencias graves. En cambio cuando el ambiente es HI-FI
(mayor componente de medios y agudos), el tempo
disminuye y el porcentaje de swing es mayor. Con esta
lgica conseguimos un tempo rpido y determinado en
ambientes LO-FI (artificiales), ms lento e indeterminado
para paisajes HI-FI (naturales).
4.3 Motor lgico (Logic Engine).
Durante la programacin de este software, surge la
necesidad de realizar un pequeo motor lgico que se
encargue de tomar decisiones a tiempo real sobre las
caractersticas de los sonidos que se estn reproduciendo,
afectando y transformando el mapeo (forma en que los
controles del usuario se conectan a las variables del sonido
[16]) dependiendo de tres parmetros ingresados por el
usuario antes de comenzar la interaccin:
-Tiempo de duracin de la interaccin (lenght): Duracin
en minutos de la interaccin.
-Cantidad de partes (parts): Sirve para calcular una seal
de cambio , estos son los
momentos en que se realizan cambios de mapeo durante la
interaccin. Sobre el tiempo total ingresado, se divide en x
cantidad de partes iguales.
- Grfica de Equilibrio vs Tiempo (equilibrio/time).
La Figura 3 muestra una grfica determinada por el
usuario que controla el nivel de equilibrio de la interaccin
en el tiempo. Cuanto ms cercano al cero se encuentre el
valor de equilibrio, el ambiente generado tender a ser
equilibrado, segn Barry Truax [17] un ambiente
equilibrado (cercano a un HI-FI) es donde el receptor
puede emitir sonido tanto como las fuentes que estn
alrededor (Escucho, entiendo, devuelvo), y cuanto ms
cercano al uno (parte superior) el ambiente tender al
desbalance (cercano a un LO-FI), donde el receptor pierde
su propia presencia, por la existencia de fuentes que
enmascaran todo lo dems.

Figura 3 Grfica ingresada por el usuario antes de comenzar la
interaccin que determina el equilibrio del ambiente en funcin del
tiempo ingresado.
5 CONCLUSIONES Y TRABAJO FUTURO
Se explica y justifica el diseo de control para un
software que permite generar y manipular paisajes sonoros
a tiempo real.
La utilizacin de una perspectiva perceptiva y no tan
tcnica para el manejo de los sonidos, la implementacin
de un motor lgico que permita una ejecucin y toma de
decisiones conjunta por el usuario y el computador, y las
variadas tcnicas de mapeo incluidas en el proceso, son las
principales apuestas para conseguir un manejo holstico del
sistema.
En un futuro presentaremos la primera etapa de
evaluacin de resultados, pruebas con usuarios que nos
permitirn determinar la efectividad de las taxonomas
sonoras utilizadas e identificar aspectos susceptibles de
mejora.
[1] JORD Sergi, GEIGER Gnter, ALONSO Marcos,
KALTENBRUNNER Martin. The reacTable:
Exploring the Synergy between Live Music Perfor-
mance and Tabletop Tangible Interfaces. Music
Technology Group, Pompeu Fabra University,
Barcelona, Spain 2007. 8p.
[2] HUNT Andy, KIRK Ross, Mapping Strategies for
Musical Performance, University of York, U.K.,
2000.
[3] TRUAX Barry, Handbook for acoustic ecology [en
linea] Second Edition, Simon Fraser University, and
ARC Publications. 1999 Disponible en
http://www.sfu.ca/sonic-studio/handbook/
[4] CHADABE Joel, Electric Sound: The Past and
Promise of Electronic Music, Prentice Hall, New
Jersey, 1996. Pginas 330 y 331. 370 p.
[5] MISRA Ananya, COOK Perry, WANG Ge,
TAPESTREA : Techniques And Paradigms for
Expressive Synthesis, Transformation, and Rendering
of Environmental Audio. http://taps.cs.princeton.edu/
[6] Kersten Stefan, Roma Gerard, Schirosa Mattia, Janer
Jordi, Soundscape Modelling, Music Technology
Group. Pompeu Fabra University,
http://www.mtg.upf.edu/technologies/soundscapes
[7] BOVERMANN, Till. Tangible Auditory Interfaces,
Combining Auditory Displays and Tangible Interfaces
(Doctor en ciencias de la ingeniera)Universidad de
Bielefeld. Alemania, Diciembre 2009. 202p.
[8] PATTEN James, RETCH Ben, ISHII Hiroshi,
Audiopad, a tag based interface for musical
performance. Tangible Media Group, MIT media
Lab, Cambridge, Massachusetts, EEUU., 2002, 6p.
[9] NUI Group Authors, [Community Release]
[Electrnico] Multi-Touch Technologies. 1era
edicin, 2009, 87p. http://nuicode.com/projects/wiki-
book/files
[10] REAS Casey, FRY Ben, Processing: a programming
handbook for visual designers and artists, The MIT
Press Cambridge, Massachusetts London, England,
2007. 736p
[11] PURE DATA Portal. puredata.info/
[12] SCHAFER R. Murray. The Tunning of the World.
Random House Inc, 1st edition, June 1977, 301p.
[13] SCHAEFFER R. Pierre. Solfege de L'Object Sonore
Audio CD y Texto. 1998. 176p.
[14] CHION, Michel. El Sonido, msica cine y literatura.
Paids Ibrica, Ediciones: 1999. 413p.
[15] Santiago Atmosfrico, Pd Patch [En linea], 2006.
http://www.mcolasso.com/?p=11
[16] CHADABE Joel, The Limitations of Mapping as a
Structural Descriptive in Electronic Instruments.
NIME proceedings, Dublin, Irlanda. 2002.
[17] TRUAX Barry. Acoustic Communication. by Ablex
Publishing Corporation, Norwood, New Jersey. 1984.
244p.
74
Artculo de Congreso
Montevideo, Uruguay
An aIisis y Estimaci on de Ia Frecuencia FundamentaI
de la Meloda Principal en Piezas Musicales Reales
Haldo Spont on,
1
Gonzalo Gini
1
y Pablo Soubes
1
1
Facultad de Ingeniera, Instituto de Ingeniera El ectrica, UdelaR
Montevideo, Uruguay
haldos@ng.edu.uy, elgongogini@hotmail.com, pabloss12@gmail.com
RESUMEN
La detecci on de meloda principal es uno de los problemas cl asicos dentro del estudio de inIormaci on
musical. Con este objetivo, se dividi o el problema en cuatro etapas que se detallan en este documento. En
primer lugar, se realiza una estimaci on local de candidatos a Irecuencia Iundamental para cada Iragmento
o frame de audio. Luego, para estos candidatos calculados, se estudian y calculan algunas caractersticas
que permitan aportar m as inIormaci on sobre los mismos. En una tercera etapa, se realiza el seguimiento
temporal de posibles lneas mel odicas, utilizando como entrada los resultados de las primeras dos etapas,
y t ecnicas de ltrado adaptivo y programaci on din amica. Por ultimo, se utilizan t ecnicas b asicas de
sntesis sonora, de forma de mostrar los resultados obtenidos de una manera m as amigable.
Se presentar an los porcentajes de acierto y error, comparando contra una base de datos prueba o Grouna
Truth, tomada de MIREX (Music InIormation Retrieval eXchange).
INTRODUCCI

ON
La detecci on de meloda principal es uno de los
problemas cl asicos dentro del estudio de extracci on de
inIormaci on musical |1, 2|
1
. Consiste en obtener una
representaci on simb olica de la meloda principal de una
pieza musical de Iorma autom atica.
El inter es por un sistema capaz de estimar la
meloda principal de una pieza musical surge como una
1
MIR, Music InIormation Retrieval.
de las ideas b asicas dentro del estudio musicol ogico,
obteniendo una representaci on simb olica a partir de una
se` nal de audio, manteniendo los aspectos perceptual-
mente signicativos de dicha se nal.
Objetivo
Como resultado se pretende obtener una estimaci on
del valor frecuencial de la altura de la meloda princi-
pal para cada instante de tiempo de las se` nales de entra-
da. Adem as, se determina d onde la meloda principal
75
HALDO SPONT

ON MELOD
IA
no est a presente. Estos resultados se devuelven en Ior-
ma de vector, guardando la inIormaci on temporal co-
rrespondiente.
DESCRIPCI

ON DEL TRABAJO
Teniendo en cuenta los objetivos planteados, se di-
vidi o el problema en cuatro etapas:
Detecci on local de frecuencia fundamental:
Consiste en estimar para cada instante de tiempo
los posibles valores que toma la Irecuencia Iunda-
mental de la meloda principal. Esta estimaci on se
realiza de manera local, ignorando lo que sucede
en los instantes anteriores o posteriores.
Extracci on y evaluaci on de caractersticas: Una
vez nalizada la estimaci on local, se obtienen can-
didatos a Irecuencia Iundamental para cada ins-
tante de tiempo. Se proponen diIerentes carac-
tersticas de los candidatos que permiten comprar-
los. Dichas caractersticas ser an herramienta para
poder vincular candidatos en diIerentes instantes
de tiempo.
Seguimiento temporal: Se aplican t ecnicas de
seguimiento temporal para encontrar tramos de
meloda principal, utilizando el resultado de la es-
timaci on local de Irecuencia Iundamental y las ca-
ractersticas calculadas.
Aplicaci on (Sntesis Sonora): Por ultimo se cre-
an archivos de audio sintetizado para mostrar de
manera 'amigable al usuario los resultados de los
diIerentes algoritmos.
ESTIMACI

ON LOCAL DE CANDIDATOS
A F0
En |3| se proponen estimadores conceptualmente
simples de Irecuencia Iundamental 10 para se` nales
de m usica poliI onica, y se oIrece adem as una im-
plementaci on computacionalmente eciente para estos.
Dichos estimadores calculan la Iuerza de un candidato
a 10 como una suma ponderada de las amplitudes de
sus arm onicos parciales.
Se dene saliencia o Iuerza de un candidato a 10
en base a la siguiente ecuaci on:
:( ) =
1
n
q( )Y () ) (1)
donde ) es la Irecuencia del m- esimo parcial de un
candidato con Irecuencia Iundamental ) .
El valor representa el perodo para el cual se va
a calcular la saliencia, medido en n umero de mues-
tras. Por lo tanto, el perodo medido en segundos sera
sc
=
}
, donde )
s
es la Irecuencia de muestreo. En-
tonces, calcular la saliencia para un perodo en muestras
equivale a calcular la saliencia para una Irecuencia
) =

=
}
. Por ultimo, la Irecuencia del m- esimo
parcial de la Irecuencia ) es ) =
n}
.
La Iunci on q( ) dene el peso del m- esimo par-
cial en la suma. Y ()) es el espectro normalizado de
la se` nal de audio que entra al algoritmo. Esa normal-
izaci on es resultado de un proceso llamado 'blanquea-
do espectral. Utilizando una gran cantidad de mate-
rial de entrenamiento, se propone adem as una Iorma
param etrica para esta Iunci on q( ).
BIanqueado EspectraI
Con el objetivo de lograr que el sistema sea robusto
Irente a Iuentes de sonido diIerentes se trata de suprimir
la inIormaci on de 'timbre del sonido antes de estimar
10. Esto se logra a trav es del blanqueado espectral el
cual estima la distribuci on en frecuencia de la energa
de una se nal y la aplana o empareja mediante ltrado
inverso.
Se calcula la FFT A(/) de la entrada a[n[ en un
Irame de tiempo enventanado (con ventana Hanning).
Luego se simula un banco de 80 ltros pasa-banda
donde cada sub-banda tiene una respuesta triangular en
amplitud (gura 1).
0 1000 2000 3000 4000 5000 6000 7000 8000
0
0.2
0.4
0.6
0.8
1
Banco de Filtros
Frecuencia (Hz)
Figura 1: Banco de ltros simulado para el blanqueado
espectral.
Las desviaciones est andar
b
de cada sub-banda son
calculadas aplicando el ltro H
b
(/) a la se` nal, donde 1
es el largo de la transIormada de Fourier:
b
=
1
1
|
H
b
(/)A(/)
(2)
A partir de estos
b
se calculan los coecientes de
compresi on
b
=
u
b
donde es la cantidad de blan-
queado espectral aplicado. Estos coecientes
b
, que
representan una cierta inversa de la envolvente espectral
estimada con los
b
, son interpolados linealmente para
obtener coecientes de compresi on (/) para cada bin
de Irecuencia /. El espectro blanqueado se obtiene mul-
tiplicando el espectro de la se` nal de entrada por los co-
ecientes de compresi on, es decir Y (/) = (/)A(/).
En la gura 2 se puede ver un espectro de ejemplo antes
y despu es del proceso de blanqueado espectral.
C aIcuIo de SaIiencia
Se utiliza un algoritmo de bipartici on para estimar
el perodo de mayor saliencia en cierto intervalo de
inter es. Este algoritmo no calcula la saliencia en to-
do el intervalo, sino que mediante bipartici on estima
CONGRESO LATINOAMERICANO DE LA AES 2011, MONTEVIDEO, 30 DE AGOSTO A 1 DE SEPTIEMBRE DE 2011
76
HALDO SPONT

ON MELOD
IA
0 1000 2000 3000 4000 5000 6000
0
50
100
150
Frecuencia (Hz)
Espectro Original
0 1000 2000 3000 4000 5000 6000
0
50
100
150
Frecuencia (Hz)
Espectro Blanqueado
Figura 2: Ejemplo de espectro antes y despu es del pro-
ceso de blanqueado espectral.
en qu e mitad del intervalo se encuentra el de ma-
yor saliencia. Luego esta mitad se toma como un nuevo
intervalo entero y se estima en cu al de sus mitades se
encuentra el de mayor saliencia. Esto se repite hasta
alcanzar la precisi on deseada y con esto determinar el
de mayor saliencia promediando los extremos del ulti-
mo intervalo. Por tanto se obtiene como salida el can-
didato con mayor saliencia :( ).
En la gura 3 se puede apreciar un pseudo-c odigo
de este algoritmo, extrado de [3].
:(t)
Q 1 t
Iov
(1) t
nIn
t
up
(1) t
nax

losi
1
tup(losi) tIov(losi) tpvoc
Q Q 1
tIov(Q) (tIov(losi) tup(losi)),2
tup(Q) tup(losi)
t
up
(
losi
) t
Iov
(Q)
losi, Q
:
nax
()
q(t, :) =
}r(j)o
n}r(j)o
t = (t
Iov
() t
up
()),2
^t = tup() tIov()
losi
aig max
j|l,Q|
:
nax
()
t = (tIov(losi) tup(losi)),2
:( t) = :nax(losi)
Figura 3: Pseudo-c odigo del Algoritmo de C alculo de
Saliencia.
Se implement o adem as una estimaci on iterativa y
cancelaci on donde cada candidato detectado es elimi-
nado de la mezcla y :( ) es actualizado correspondien-
temente antes de estimar el siguiente 10.
EXTRACCI

ON DE CARACTER
ISTICAS
Se utiliza como caracterstica principal una variante
de la saliencia, eliminando la dependencia inversa con
el n umero de parcial :. Se vio que este cambio hace
que disminuyan sensiblemente algunos errores de de-
tecci on como errores de octavas. En resumen, la salien-
cia como caracterstica (y no como funci on de costo a
maximizar) se calcula como:
:()) =
1
n
)
)
Y (:)) (3)
donde se sustituy o q(), :) por
}
}
.
La saliencia es una Iunci on que depende del tiem-
po y de la Irecuencia en que se est e calculando. Es-
to hace que su resoluci on dependa de la resoluci on
de la representaci on en tiempo-Irecuencia del audio
disponible, la cual est a jada por el largo de la Trans-
Iormada de Fourier utilizada para calcular el espectro-
grama de cada pieza musical. Para obtener mayor res-
oluci on, se propone la 'saliencia interpolada.

Esta se
calcula usando como entrada un espectrograma inter-
polado en Irecuencia (se aumenta la cantidad de bins
del espectrograma mediante interpolaci on lineal). En la
gura 4 se ve un ejemplo de mapa de saliencia utilizan-
do un espectrograma interpolado.
Figura 4: Mapa de saliencia interpolada del archivo
joj1.no.
SEGUIMIENTO TEMPORAL (TRACKING)
Lo que se busca entonces con el seguimiento tempo-
ral es aprovechar esa estrecha relaci on entre la Irecuen-
cia fundamental de la meloda principal en un frame y la
de los siguientes o anteriores, as como la continuidad
temporal de la saliencia. Para esto se estudiaron dos
t ecnicas: Filtro de Kalman y Programaci on Din amica.
FiItro de KaIman
Se dise n o un ltro de orden 5, utilizando el Ground
Truth para entrenar los coecientes del mismo. Una vez
completa la estimaci on local de 10 y la extracci on de
caractersticas, se busca un punto de arranque para el
tracking en base a buscar un candidato que tenga ma-
yor saliencia como caracterstica. A partir de este punto
se aplica Kalman hacia atr as y hacia adelante, buscan-
do en cada paso candidatos en un entorno de la predic-
ci on. Se van uniendo as diferentes candidatos para for-
mar tramos de meloda. El algoritmo consta adem as
77
HALDO SPONT

ON MELOD
IA
con condiciones de parada de Iorma de intentar detec-
tar principios y nales de lneas mel odicas. Luego se
busca un nuevo punto de arranque, y se contin ua el pro-
ceso hasta que se cumpla alguna de las condiciones de
parada globales.
En la gura 5 se ve el resultado de la estimaci on de
frecuencia fundamental de la meloda principal luego
de aplicarse el ltro de Kalman discreto dise nado. Se
ve como se reducen notablemente los errores que se
mencionan anteriormente, logr andose un resultado que
vara suavemente, muy similar al Ground Truth.
1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2 2.1 2.2
160
180
200
220
240
260
280
300
320
Frecuencia de la meloda principal.
Tiempo (s)
Referencia (Mirex, etc.)
Resultado del algoritmo
1 1.2 1.4 1.6 1.8 2 2.2
235
240
245
250
255
260
265
270
Tiempo (s)
Figura 5: An alisis de desempe no del ltro de Kalman,
archivo joj1.no.
Programaci on Din amica
La programaci on din amica |4| reune un conjunto de
t ecnicas que permiten determinar de manera eciente
las decisiones que optimizan el comportamiento de un
sistema que evoluciona a lo largo de una serie de esta-
dos. En nuestro problema parece intuitivo reconocer a
los diIerentes instantes de tiempo como etapas y a los
candidatos a 10 en cada instante junto con su saliencia
asociada como los estados.
El algoritmo se compone de los siguientes m odulos:
Determinaci on de puntos seguros.
Elaboraci on de candidatos.
Seguimiento del mejor camino.
En sntesis dicho algoritmo debe seguir el mejor camino
entre puntos seguros de la meloda a partir de la
evaluaci on de ciertas caractersticas de los candidatos
obtenidos anteriormente.
En la elecci on de la Iunci on de costo a utilizar, se
busca que esta:
1. Penalice saltos en Irecuencia para Irames conse-
cutivos.
2. Mantenga continuidad en la saliencia.
3. Seleccione caminos de saliencia alta.
En la gura se aprecia un ejemplo del desempe no
de PD para el seguimiento de meloda principal.
S
INTESIS SONORA
La sntesis sonora se realiza de una manera simple,
cambiando la Iase de una Iunci on sinusoidal de manera
de que la derivada de dicha Iase sea igual a la Irecuencia
1.2 1.4 1.6 1.8 2 2.2 2.4
180
200
220
240
260
280
300
Tiempo (s)
1.2 1.4 1.6 1.8 2 2.2 2.4
240
245
250
255
260
265
270
275
280
Tiempo (s)
Figura 6: An alisis de desempe` no de PD, archivo
joj1.no.
instant anea estimada en el sistema. M as Iormalmente,
se crea una se` nal de audio j(t) tal que:
j(t) = t)) (4)
donde
d t)
dt
= 2 (t) (5)
siendo )(t) la Irecuencia instant anea estimada en el sis-
tema y un Iactor multiplicativo menor que 1 para evi-
tar la saturaci on de la se` nal de audio sintetizada.
RESULTADOS
Se muestran los porcentajes de acierto (banda de
8 /) de la estimaci on local de Irecuencia Iundamental
de la meloda principal, utilizando la base de datos de
prueba de MiReX:
Primer candidato Alg un candidato
STFT 60,91 78,82
CQT 55,97 76,23
Cualitativamente, tanto el Filtro de Kalman como
PD, ayudan a mejorar notoriamente el resultado pri-
mario de la estimaci on local de 10. Se logran resul-
tados muy positivos en varias piezas musicales popu-
lares. Se pueden apreciar que los resultados son buenos
utilizando el algoritmo de sntesis sonora.
REFERENCIAS
[1] Emilia G omez, Anssi Klapuri, and Benot Meudic,
'Melody description and extraction in the context
oI music content processing, Journal of New Mu-
sic Research, vol. 32, 2003.
|2| Haldo Spont on, Pablo Soubes, and Gonzalo Gini,
Meloda: An alisis y estimaci on de la meloda prin-
cipal en piezas musicales reales, Proyecto ae Fin
ae Carrera, IIE, Facultaa ae Ingenier'a., 2004.
|3| Anssi Klapuri, 'Multiple Iundamental Irequency
estimation by summing harmonic amplitudes, in
in ISMIR, 2006, pp. 216221.
|4| Martin L. Puterman, Markov Decision Processes.
Discrete Stochastic Dynamic Programming, Wiley-
Interscience, April 1994.
78

ProceedingsAESLAC2011 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

ProceedingsAESLAC2011 PDF

Transféré par

Droits d'auteur :

Formats disponibles

ISSN 1688-8537

Memorias del Congreso Latinoamericano de

El actual incremento en la utilizacion del Candombe

Vous aimerez peut-être aussi