Académique Documents
Professionnel Documents
Culture Documents
TESIS DE MSTER
AGRADECIMIENTOS
Agradezco a mi familia, que sin su apoyo no hubieran cumplido este objetivo. Doy
gracias a la Secretaria Nacional de Ciencia, Tecnologa e Innovacin (SENACYT) y al
Instituto para la Formacin y Aprovechamiento de Recursos Humanos (IFARHU), dos
importantes instituciones del Gobierno de la Panam, las cuales han credo en m y me
han apoyado econmicamente.
A mi tutora Marta Ruiz-Llata que me ha apoyado en todo, ha tenido mucha paciencia,
desde el primer momento ha credo en mis ideas y me ha enseado a investigar. Por
ltimo, agradezco el apoyo de todos mis amigos. No menciono el nombre de ninguno
porque no quiero dejar a nadie fuera.
RESUMEN
En este trabajo se realiza un estudio sobre tcnicas que enfrentan el problema de la
separacin ciega de mezclas acsticas. El estudio se centra en el enfoque dado por
Anlisis de Componentes Independientes o ICA (siglas en ingles, de Independent
Component Analysis) donde se asume que las fuentes que forman la mezcla son
mutuamente independientes.
Para comprender las bases fundamentales de ICA se realizar un estudio terico
enfocado en dos tipos de mezclas: instantneas y convolutivas. Aqu se describe el
funcionamiento de los algoritmos ms importantes utilizados en ICA: FASTICA e
INFOMAX tomando en cuenta sus virtudes y limitaciones.
Para analizar la operacin de los algoritmos FASTICA e INFOMAX se realizaran
pruebas utilizando mezclas sintticas, lo que nos permitir evaluar su rendimiento
utilizando varios ndices de evaluacin.
parmetros iniciales.
operativo de los algoritmos que nos servirn para enfrentar la separacin de seales
provenientes de mezclas reales.
Seguido a las evaluaciones presentadas, se realizaran pruebas con mezclas de audio
grabadas en un cuarto y mezclas de seales ultrasnicas emitidas por descargas
parciales con el objetivo de probar los algoritmos en entornos reales.
NOTACIN
A continuacin se muestran los smbolos ms utilizados:
A(z)
Matriz diagonal
D(. .)
Divergencia Lullback-Leibler
E[.]
g(.)
H(.)
Entropa
Matriz identidad
I(.)
Informacin mutua
J(.)
Negentropa
Nmero de fuentes
P(.)
Probabilidad
p(.)
s(t)
u(t)
Vector de pesos
Matriz de pesos
x(t)
y(t)
Vector
de
salidas
de
la
red
neuronal
(.)
Funcin de activacin
(u)
CONTENIDO
AGRADECIMIENTOS .................................................................................................... 2
RESUMEN ....................................................................................................................... 3
NOTACION ..................................................................................................................... 4
1.
1.2
MOTIVACION .................................................................................................. 9
1.3
OBJETIVOS .................................................................................................... 10
1.4
2.
2.1.1
2.1.2
2.2
2.2.1
FASTICA ................................................................................................. 16
2.2.2
INFOMAX ............................................................................................... 20
2.3
2.3.1
2.3.2
2.4
3.
3.1
3.2
3.2
3.2
3.3
3.3
3.4.1
3.4
4.
4.2
4.2.2
4.2.3
RESULTADOS ........................................................................................ 71
4.3
5
CONCLUSIONES ........................................................................................... 76
CONCLUSIONES ........................................................................................... 77
5.2
REFERENCIAS ............................................................................................................. 80
Figura 1.1. Tres personas conversando y siendo grabadas por tres micrfonos. Donde si son las fuentes y
mezclas.
xi
las
BSS no slo enfrenta el problema de mezclado voz, sino cualquier situacin donde
exista un mezclado se seales y se necesite extraer o separar las fuentes que han
formado la mezcla. En la bibliografa, se han identificado cuatro enfoques para BSS[2]:
-Uso de la estructura temporal de las fuentes.
-Separar a travs de caractersticas de las seales como: espacio, tiempo y frecuencia.
-No estacionalidad de las seales.
-Medicin de la independencia estadstica de las seales.
De estos cuatro enfoques el ms utilizado es el que explota la independencia estadsticas
de las seales. Su principal ventaja es que puede tratar con seales no gaussianas, y de
esta forma, afrontar el problema de BSS de manera mucho ms general.
Este enfoque fue propuesto por Pierre Common en 1994[3] y es llamado Anlisis de
componentes independientes o ICA (Siglas en ingles, Independent Component
Analysis).
1.2
MOTIVACION
1.3
OBJETIVOS
1.4
10
11
(2.1)
(2.2)
x(t) = As(t)
12
Donde
x (t ) = [ x1 (t ), x2 (t ),..., xN (t )]T ,
s(t ) = [ s1 (t ), s2 (t ),..., sM (t )]
a11 a1N
Y A =
a
M 1 aMN
(2.3)
El
u(t ) = Wx (t )
(2.4)
W =
.es una matriz de pesos
w
M 1 wMN
la amplitud de las fuentes, sin embargo puede proporcionar unas formas de onda las
cuales tienen la informacin que nos interesa. Para conseguir este objetivo, en ICA se
13
asume que las fuentes son independientes. De esta manera se adapta la matriz de pesos
W por medio de una regla de adaptacin que busca la independencia estadstica entre
Donde la funcin objetivo es alguna regla o funcin que mide la independencia y que se
busca maximizar o minimizar bajo algn tipo de restriccin.
El algoritmo de
14
p ( x, y ) = p ( x ) p ( y )
(2.5)
2.2
15
2.2.1 FASTICA
u(t)= Wx(t)
Donde x(t) son las mezclas, u(t) son las estimaciones y W la matriz de pesos.
FASTICA busca que Wx (t) sea lo menos gaussiano posible cambiando los pesos W .
Al hacerlo menos gaussiano logramos encontrar los componentes independientes, lo
cuales son las estimaciones de nuestras fuentes. Para ello se utiliza una funcin que
mide la no gaussianidad. Esta funcin es llamada Negentropa y se puede considerar
como una medida de distancia entre la densidad de probabilidad de una variable
gaussiana de referencia y la densidad de la variable a comprar. La Negentropa esta
definida como[9]:
(2.6)
Donde H (ugauss ) es la entropa de un vector gaussiano con igual varianza que el vector
16
distancia. Los pesos encontrados son los que conducen a los componentes
independientes y a nuestras estimaciones de las fuentes.
2.2.2.1 EL ALGORITMO FASTICA
Figura 2.1. Proceso llevado a cabo por FASTICA para la bsqueda de un componente independiente.
utilizamos este mismo proceso pero debemos asegurarnos que no coincidamos con el
peso previamente encontrado. Para lograr esto se hace un proceso llamado
ortogonalizacin. Este proceso asegura que el siguiente vector de pesos sea ortogonal al
encontrado previamente y de esta forma diferente e independiente. De esta manera el
proceso descrito en el esquema se repite hasta encontrar todos pesos.
En la Tabla 2.1 mostramos todos los pasos utilizados por el algoritmo FASTICA para
encontrar los pesos y los componentes independientes.
17
4
5
wp wp / wp
p 1
wp wp / wp
9
10
11
Previamente hemos dicho que hay un preprocesado que deben sufrir las mezclas. Este
preprocesado esta dividido en dos pasos: centrado y blanqueado. El centrado y el
blanqueado aseguran que se puedan encontrar los componentes utilizando la
Negentropa como medida.
El centrado consiste en extraer la media de las mezclas:
x = x E ( x)
18
Donde
(2.7)
la
matriz
1
2
V = ED E T
est
formada
por
la
matriz
diagonal
D = diag (d1 ,..., dn ) con los eigenvalores de matriz de covarianza de las mezclas y E es
una matriz ortogonal sus los eigenvectores, respectivamente.
El nuevo vector z es una copia escalada y rotada de las mezclas, as que no hay una
alteracin sobre las fuentes que la componen.
Despus del centrado y blanqueado se inicia la bsqueda de los componentes. Se
escogen un vector de pesos de manera aleatoria y despus se normaliza. Este peso se
guarda para comparacin despus de la actualizacin. El siguiente paso es la
actualizacin de los pesos por medio de una regla basada en la Negentropa. Hyvarinen
desarrollo la siguiente regla de actualizacin de pesos [10]
w E { zg ( w T z )} E { g '( w T z )} w
(2.8)
w p w p (w p T w j )w j
(2.9)
j =1
19
g'
G1
tanh( u)
(1 tanh(u))
G2
u exp(u2 / 2)
(1 u2 ) exp(u2 / 2)
G3
u3
u2
2.2.2 INFOMAX
Figura 2.2. Modelo neuronal INFOMAX para tratar tres mezclas con la transformacin no lineal de cada salida
En este modelo observamos que cada salida ui es transformada en una nueva variable
yi = g (ui ) . Esta transformacin permite maximizar la entropa conjunta de todas las
salidas yi con respecto a la matriz de pesos W . La entropa conjunta de las salidas de
la red neuronal es igual a:
h( y ) = p ( y ) log p ( y )dy
(2.10)
= E[ p ( y )]
Donde el vector y = [ y1 , y2 ,... yM ]T es el vector de salidas y E[.] la expectacin.
rg max h( y | W )
(2.11)
21
W I + (u) uT W
(2.12)
(ui ) =
1 2 yi
yi u 2i
ui
(2.13)
22
Figura 2.3. a) Funcin sigmoidal, la cual tiene forma de la funcin cumulativa de fuentes supergaussianas. b) La
derivada de la funcin sigmoidal que corresponde a la forma de la densidad de probabilidad de fuentes
supergaussianas.
( ui ) =
d log p (ui )
du
(2.14)
23
Figura 2.4. a) Funcin de distribucin laplaciana. Esta distribucin puede ser asumida para seales
supergaussianas como las de audio. b) Funcin de activacin derivada de la funcin de distribucin laplaciana.
Como se puede observar en una funcin signo
En la Figura 2.5 se muestran dos ejemplos de densidades para seales de voz y msica.
Comparando la funcin laplaciana con estas densidades podemos decir que son
similares y que gracias a esto podemos utilizar la funcin de activacin en este caso
para estimar una mezcla de este tipo de fuentes. En la Tabla 2.3 [16] mostramos varias
funciones de distribucin de probabilidad
respectivamente.
Figura 2.5. Izquierda: Distribucin de una seal de voz. Derecha: Distribucin de una seal de msica.
24
Tabla 2.3. Funciones de densidad de probabilidad y sus funciones de activacion, respectivamente. El simbolo
refiera a la varianza de la seal.
Nombre
Funcin de distribucin
Funcin de
de probabilidad p (u )
activacin (u )
Laplaciana
Cauchy
Coseno
Hiperblico
Sigmoidal
u
1
exp( )
2
Sign(u )
1
1 + (u / ) 2
2u
+ u2
1
cosh(u / 2 )
tanh(u / 2 )
2
1 + exp(u / )
2 tanh(u / )
1 tanh(u / )2
Hiperblico
generalizada
exp(u / )
(1 + exp(u / )) 2
Tangente
Gaussiana
u
1
exp( 2 )
2
2
Gaussiana
se
r
1 u
exp(
)
2(1/ r )
r
r 1
Sign(u)
(2.15)
u = Wx
25
(2.16)
2.3
u = Wx
26
xi = aijk s j (t k )
(2.17)
j =1 k = 0
Donde s j son las fuentes, xi son las mezclas recibidas por los N sensores, k es el
ndice de retardo, t es el ndice de tiempo discreto, M es el nmero de fuentes. Los
aijk son los correspondientes coeficientes de mezclado que indican la contribucin de la
Figura 2.6. Dos fuentes acsticas emitiendo sonido. Se muestras las trayectorias de los frentes de onda. Los sensores
captan copias distorsionadas de las emisiones debido al medio.
27
x(t ) = Ak s(t k )
(2.18)
k =0
(2.19)
28
S1(z)
A11(z)
X1(z)
X2(z)
A12(z)
A21(z)
S2(z)
A22(z)
Tanto en este esquema como en el siguiente anlisis, todas las variables estn
transformadas al dominio de z . En este caso cada elemento de la matriz A( z ) es un
polinomio de filtros FIR y puede ser escrito como:
X 1 ( z ) = A11 ( z ) S1 ( z ) + A12 ( z ) S 2 ( z )
(2.20)
X 2 ( z ) = A21 ( z ) S1 ( z ) + A22 ( z ) S 2 ( z )
(2.21)
U 2 ( z ) = W21 ( z ) X 2 ( z ) + W22 ( z )U 2 ( z )
Donde las U i ( z ) son las estimaciones de los componentes independientes y Wij los
pesos. A estos pesos se les llama tambin: coeficientes del filtro. Cada uno de estos
coeficientes es actualizado por una regla basada en INFOMAX, como veremos ms
adelante.
29
X1(z)
W11(z)
U1(z)
W21(z)
W12(z)
X2(z)
W22(z)
U2(z)
(2.22)
Sin embargo, para una aplicacin en lnea esta solucin tiene un problema. Cuando la
regla busca los pesos directos W11 ,W22 , no slo se estimar A11 ( z ) 1 , A22 ( z ) 1 sino que
tambin blanquear las fuentes, algo que hace que pierdan su forma de onda original.
La estimacin de los otros coeficientes depende de estas fuentes, as que debido a esta
distorsin, stos no podrn converger a la solucin.
coeficientes W11 , W22 son forzados a ser constantes, normalmente con valor de uno. De
esta manera la ecuacin (2.21) queda de la siguiente forma:
U1 ( z ) = X 1 ( z ) + W12 ( z )U 2 ( z )
(2.23)
U 2 ( z ) = X 2 ( z ) + W22 ( z )U 2 ( z )
Donde
(2.24)
Con esta solucin las estimaciones a las que converge el algoritmo sern una versin
filtrada de las fuentes, como sigue:
30
A11S1 = U1
(2.25)
A22 S 2 = U 2
(2.26)
ui (t ) = xi (t ) + w jik u j (t k )
(2.27)
j =1 k =1
(ui (t )) = 1
2
,
1 + exp( ui )
wijk (1
2
)u j (t k )
1 + exp(ui )
(2.28)
31
Figura 2.9. Este esquema muestra el algoritmo Torkkola para dos mezclas. En este esquema los filtros directos han
sido igualados a uno y se ha utilizado la funcin de activacin Sigmoidal.
2.4
RESUMEN Y CONCLUSIONES
acsticas provenientes del corazn. Aqu se logra diferenciar entre la sstole y la distole
discriminando sonidos provenientes del pulmn. En [23] se identifica el sonido del
corazn de un feto y se logra discriminar de manera automtica del ruido abdominal.
Tambin encontramos en [24] el diseo e implementacin de un estetoscopio embebido
en un DSP que puede diferenciar entre las dos fases del corazn (distole y sstole)
eliminando ruidos provenientes de otros rganos. Adems de aplicaciones biomdicas,
encontramos aplicaciones en audio [25], en el rea industrial [26] y en sistemas de
sonares [27].
32
midiendo son las emisiones reales de las fuentes del fenmenos en el cual estamos
interesados.
distorsionada de la emisin original. ICA provee una solucin muy general a esta
situacin, pues puede estimar una copia aproximada de nuestra fuente, eliminando la
interferencia de la otra seal. Como se ha descrito en los distintos apartados del
capitulo, ICA permite estimar las fuentes ciegamente sin ninguna referencia es lo que
hace a este mtodo tan poderoso y con un gran potencial de aplicacin en sistemas de
instrumentacin que trabajan con seales acsticas.
34
3. CAPITULO. METODOLOGIA
3.1
3.2
INDICES DE EVALUACION
Para evaluar los resultados de cada algoritmo se utilizaran los siguientes ndices de
evaluacin:
1. La kurtosis. La kurtosis nos indica el grado de agudeza del pico de una distribucin
de probabilidad. Si su valor aumenta, esto es indicativo de aumento en esta agudeza.
Este valor nos sirve como indicativo del grado de gaussianidad de una seal.
Cuando el valor de la kurtosis es cero, la seal es gaussiana; si el valor es positivo,
la seal es supergassiana; y si la Kurtosis es negativa, la seal es subgaussiana. La
35
kurtosis tiene valores desde -2 hasta el infinito positivo. En Figura 3.1 podemos ver
una comparacin grafica de las funciones de distribucin de probabilidad para las
seales gaussianas, supergaussianas y subgaussianas. Las seales acsticas son
normalmente supergaussianas; las seales como el ruido uniforme, sinodales puras o
triangulares son subgaussianas.
Figura 3.1. Modelos de densidad de para densidades Supergaussianas, gaussianas y subgaussianas. La funcin
supergaussiana tiene un pico muy agudo, mientras que la subgaussiana tiende hacer ms llano. La gaussiana es un
punto medio entre estas dos.
Para las pruebas calcularemos el valor de kurtosis de las seales fuentes, las
mezclas y las estimaciones. Si el algoritmo separa bien, la kurtosis de la estimacin
debe ser igual a la kurtosis de la seal original, ya que el nico cambio realizado
por el algoritmo, ser sobre la varianza y la media. Como la kurtosis utilizada esta
normalizada, es invariable ante ente el cambio de estas caractersticas.
2. ndice de separacin (IS). Otro parmetro para evaluar el desempeo de los
algoritmos es el ndice de calidad de separacin propuesto por Amari[41]:
pij
i =1
j =1
max k pik
IP = (
p ji
j =1
i =1
max k pkj
1) + (
1)
(3.1)
1 0.5
Si tenemos la matriz de mezclado A =
y la matriz de pesos estimados
0.6 0.5
0.57 0.95
0.00 0.19
W =
entonces, la matriz de permutacin ser P =
0.06 0.06
0.02 0.00
Y el ndice de separacin (IS) es = 0.0912. Tomaremos, como valores que indique
una separacin, los que tengan un IS menor a 0.1.
Este ndice solo se puede utilizar cuando tenemos la matriz de mezclado A . En los
casos de mezclas reales no es posible utilizar, ya que esta matriz es desconocida.
3. Coeficiente de correlacin de Pearson. Utilizaremos este coeficiente para
comparar las formas de onda de las seales fuentes y las seales estimadas. Este
coeficiente varia entre -1 y -1. Cuando es 1 las formas de onda son idnticas; cuando
es cero, las formas de onda no se parecen en nada y cuando es -1, la formas de ondas
son iguales, pero invertidas. Un valor mayor de 0.85 nos indica que las seales
evaluadas son bastantes similares. Este ser el nico ndice utilizado para las
pruebas en mezclas convolutivas.
3.2
usaremos en las pruebas, odas son seales de audio. Adems de las seales, colocamos
su distribucin y el valor de kurtosis. Las seales en las graficas a), b) corresponden a
dos sonidos de alarmas diferentes y sus distribuciones son supergausianas (kurtosis
positiva), c) es la seal de sonido del despegue de una nave espacial, es subgaussiana
con kurtosis negativa y d) es la msica de la serie de dibujos Looney Tunes, seal
supergaussianas con kurtosis positiva.
37
Figura 3.2. Seales utilizadas en las pruebas junto con sus densidades. Se muestran los valores de kurtosis de cada
seal. Las seales y las distribuciones van en el siguiente orden: a) con e), b) con f), c con g) y d) con h).
En esta seccin se realizaran pruebas para evaluar parmetros operativos del algoritmo
FASTICA. Los factores que se va a evaluar son la influencia del tipo de funcin de
aproximacin de Negentropa, el nmero de mezclas como entrada al algoritmo y la
influencia del ruido.
3.3.2.1 INFLUENCIA
DE
LA
FUNCION
DE
APROXIMACION
DE
LA
NEGENTROPIA
38
g'
tanh
log cosh u
tanh(u )
(1 tanh(u ))
gauss
exp(u 2 / 2)
u exp(u 2 / 2)
(1 u 2 ) exp(u 2 / 2)
kurt
u4
u3
u2
Para esta prueba se utilizaran dos seales de audio, en concreto las seales a) y b) dela
figura 3.2, constituidas por 50k muestras y que han sido muestreadas a 22kHz. Como
hemos mencionado antes, estas seales son supergaussianas.
mezcladas por una matriz de mezclado A para crear las mezclas. Estas mezclas son las
que utilizaremos como entrada a FASTICA.
La matriz de mezclado se crea a partir de la situacin descrita en la Figura 3.3 donde
podemos observar un esquema que describe la posicin de las fuentes y los sensores
(micrfonos). Para obtener los coeficientes de mezclado de la matriz A , consideramos
que la amplitud de cada seal generada por las fuentes disminuye inversamente
proporcional al cuadrado de la distancia. Se asume que no hay obstculos entre las
fuentes y los sensores, ni paredes cercanas. De esta forma, pueden despreciarse el
efecto de reflexiones y reverberaciones, por lo cual es posible considerar que el
mezclado es simultneo.
Figura 3.3. Esquema para dos fuentes. Todas las medidas estn en metros.
39
0.5
1
A2 =
0.308 0.444
X = AS
(3.2)
x1
Donde X = , x1 y x2 son las seales obtenidas en los sensores (mezclas) y
x2
s
S = 1 , s1 y s2 son las fuentes de audio.
s2
Estas mezclas son presentadas a FASTICA como un slo bloque de 50k muestras por
cada seal.
En la Tabla 3.2 se presentan los resultados para cada tipo de funcin de aproximacin
de Negentropa.
disminuyen con respecto a las fuentes. Los valores de kurtosis de las estimaciones son
iguales a las fuentes y el IS para cada funcin es muy similar y menor de 0.1, lo que
indica que se ha realizado la separacin. El valor IS de la funcin kurt es el mas bajo,
sin embargo es muy similar a los ofrecidos por las otras funciones. El nmero de
iteraciones utilizado para cada funcin es tambin, muy similar.
40
Tabla 3.2. Influencia de la funcin de Negentropa escogida. Cuando se indica el valor de la kurtosis, se sigue este
orden: S1, S2. Para el valor de kurtosis de las mezclas: X1 y X2. Para indicar el valor de kurtosis de las
estimaciones: estimacin 1 y estimacin 2. Se indica el valor del ndice de separacin (IS) para cada tipo de funcin
y el nmero de iteraciones utilizado.
FUNCION
Kurtosis
Kurtosis
Kurtosis
fuentes
Mezcla
Estimaciones
1.0082
tanh
3.0438
gauss
3.0448
2.323
1.0081
0.765
1.0082
3.0438
1.0082
kurt
3.0438
IS
# de
iteraciones
0.0361
10
0.0366
12
0.0346
10
En la Figura 3.4 se muestran las seales fuentes, las mezclas y las estimaciones por
FASTICA.
aproximacin. Las formas de ondas de las estimaciones son muy similares a las fuentes
originales, diferencindose en la escala. Las estimaciones son aproximadamente 60
veces menor que las fuentes originales y en el caso de la funcin kurt estn invertidas
con respecto a ellas.
En la Tabla 3.3 se muestran los valores de correlacin entra las seales fuentes y las
estimaciones, para cada tipo de funcin de Negentropa. Estos valores indica que las
formas de onda de las seales estimadas son casi idnticas a las formas de ondas de las
seales fuentes.
De todos estos resultados podemos concluir que la funcin utilizada para aproximar la
Negentropa no afecta en gran medida los resultados de FASTICA.
41
Figura 3.4. En las dos primeras filas se muestran las fuentes de audio y las respectivas mezclas. Las siguientes
graficas son las estimaciones por FASTICA. Como podemos observar el algoritmo las ha cambiado de lugar, sin
embargo son similares a las fuentes. Las estimaciones resultantes de utilizar la funcin kurt estn invertidas con
respecto a las fuentes.
Funcin
tanh
gauss
kurt
Seales a comparar
S1 vs Estimacin 2
S2 vs Estimacin 1
0.9999
S1 vs Estimacin 2
S2 vs Estimacin 1
0.9999
S1 vs Estimacin 2
-1
S2 vs Estimacin 1
-0.9999
Para mezclar las seales, es necesario cambiar la matriz dependiendo del nmero de
seales. Esta matriz es creada de manera similar que en la Prueba #1, de esta manera
para obtener las mezclas cuando haya tres y cuatro seales fuentes utilizaremos los
esquemas mostrados en la Figura 3.5 y Figura 3.6, respectivamente.
Figura 3.5. Esquema para tres fuentes. Todas las medidas estn en metros.
Figura 3.6. Esquema para cuatro fuentes. Todas las medidas estn en metros.
La matriz A2 para dos seales es la utilizada en la primera prueba y las matrices para
tres y cuatro seales son las siguientes, respectivamente:
43
0.5
0.2
1
0.5
0.2
0.1
1
A4 =
0.16 0.308 0.444 0.308
0.25
0.077 0.125 0.2
Numero
Kurtosis
Kurtosis
Kurtosis
de seales
fuentes
Mezcla
Estimaciones
3.0448
2.323
1.0082
1.0081
0.765
3.0438
3.0448
2.2259
3.0448
1.0081
0.451
1.0081
0.2347
0.2232
0.2347
3.0448
2.2627
3.0449
1.0081
0.4844
0.2381
-0.1798
0.0916
1.0024
0.2347
0.1111
-0.1798
IS
# de
iteraciones
0.0361
10
0.3021
14
0.4891
23
En la Figura 3.7 se muestran las seales fuentes, las mezclas y las estimaciones de
FASTICA para cuatro seales fuentes. En la graficas de las estimaciones es posible ver
una separacin, a pesar que el IS es superior a 0.1.
44
comprobado esto. Aqu se muestran los coeficientes de correlacin entre cada una de
las estimaciones y las fuentes.
aproximan a la unidad, indicando una forma de onda de las estimaciones muy similares
a las formas de ondas de las fuentes.
De estos resultados, podemos concluir que al aumentar la cantidad de seales como
entrada al algoritmo FASTICA, la calidad de la separacin desmejora.
Figura 3.7. a) Las cuatro seales fuentes.S1, S2 y S4 son seales supergaussianas y S3 es una seal subgaussiana. b)
Seales despus del mezclado. c) Resultados de FASTICA. Las tres primeras estimaciones estn invertidas con
respecto a las fuentes.
45
Numero de seales
Seales a comparar
S1 vs Estimacin 2
S2 vs Estimacin 1
0.9999
S1 vs Estimacin 1
S2 vs Estimacin 2
S3 vs Estimacin 3
-0.999
S1 vs Estimacin 1
-1
S1 vs Estimacin 3
-0.9977
S3 vs Estimacin 4
-0.9993
S4 vs Estimacin 2
0.9969
22kHz y compuestas de 50k muestras. Las dos seales de ruido utilizadas en esta
prueba son generadas utilizando un generador de ruido aleatorio.
Utilizaremos el esquema Figura 3.5 para colocar las seales fuentes espacialmente por
lo cual utilizamos la matriz de mezclado:
0.5
0.2
1
46
En este caso tenemos una seal de ruido gaussiano y dos seales de audio. La seal de
ruido tiene una amplitud que dobla a la amplitud de las seales de audio. En la Figura
3.8 podemos observar las seales fuentes, las mezclas y las seales de audio.
Figura 3.8. a) Fuentes: Ruido gaussiano y dos seales de audio. La seal de ruido tiene una media de cero, a
diferencias que las de audio, las cuales tienen un componente DC haciendo que su media no sea cero. b) Se muestran
las mezclas, en las cuales a penas se logra ver las seales de audio. c) Resultados de FASTICA. A pesar del ruido se
ha podido separar la mezcla en sus componentes originales, aunque con una amplitud diferente.
Se puede observar que FASTICA ha logrado separar las mezclas en sus componentes
originales con un IS menor a 0.1. Tambin se han recuperado los valores de kurtosis de
las seales de audio, no as el valor de la kurtosis de la seal gaussiana. Realmente
FASTICA no ha separado la seal gaussiana de las otras, sino que ha dejado esta seal
como un residuo de las otras seales. Como puede observarse en la Figura 3.8 la seal
gaussiana aparece como la estimacin 3, la ltima encontrada por el algoritmo. Debido
a que el generador de ruido gaussiano de Matlab no es perfecto, esta seal no es
exactamente gaussiana, por lo cual FASTICA todava, puede operar sobre ella. Si esta
seal fuera verdaderamente gaussiana, el preprocesado la hubiera descartado como
seal no gaussiana y FASTICA slo hubiera procesado las dos seales de audio. Esta
prueba se realiz varias veces para comprobar esto, y la seal de ruido gaussiano
siempre fue estimada como ltimo componente.
En la Tabla 3.7 se muestran los ndices de correlacin los cuales indican una similitud
en las formas de ondas de las fuentes y las estimaciones.
47
Tabla 3.6. ndices de evaluacin para la prueba de la influencia del ruido gaussiano. El IS indica una separacin de
las mezclas en sus componentes originales.
Seales
Kurtosis
fuente
Seales
Kurtosis
Mezcla
Seales
Kurtosis
estimaciones
S1
-0.0242
X1
0.0353
E1
1.0083
S2
3.044
X2
0.7162
E2
3.044
S3
1.008
X3
0.5097
E3
-0.0237
IS
Iteraciones
0.083
17
Seales a comparar
fuente y estimacin
S1 vs Estimacin 3
-1
S2 vs Estimacin 2
-0.9999
S3 vs Estimacin 1
Figura 3.9. a) Fuentes: Ruido uniforme y dos seales de audio. La seal de ruido tiene una media de cero, a
diferencias que las de audio, las cuales tienen un componente DC haciendo que su media no sea cero. b) Se muestran
las mezclas, en las cuales a penas se logra ver las seales de audio. c) Resultados de FASTICA. A pesar del ruido
se ha podido separar la mezcla en sus componentes originales, aunque con una amplitud diferente.
48
Tabla 3.8. ndices de evaluacin para la prueba de la influencia del ruido uniforme. El IS indica una separacin de
las mezclas en sus componentes originales.
Seales
Kurtosis
fuente
Seales
Kurtosis
Mezcla
Seales
Kurtosis
estimaciones
S1
-1.1953
X1
-1.0921
E1
-1.1953
S2
3.044
X2
-0.4294
E2
1.0088
S3
1.008
X3
-0.2337
E3
3.0441
IS
Iteraciones
0.0597
17
En la Figura 3.9 se muestran las seales fuentes, las mezclas y las seales de audio y en
la Tabla 3.9 los ndices de evaluacin. El IS es menor a 0.1 lo que indica una
separacin. Los valores de Kurtosis son iguales entre las estimaciones y las fuentes. En
este caso FASTICA coloca la seal de ruido uniforme en cualquier canal, a diferencia
que el ruido gaussiano. En la Figura 3.9 se muestra el resultado cuando aparece en el
primer canal, pero en otras simulaciones apareci en los otros. En la Tabla 3.9 se
muestran los valores de correlacin, que indican una forma de onda de las estimaciones
similar a la forma de onda de las fuentes.
49
Seales a comparar
fuente y estimacin
S1 vs Estimacin 1
S2 vs Estimacin 3
-0.9999
S3 vs Estimacin 2
-1
Utilizamos dos
(ui ) = 2 tanh(ui )
La cual asume que las distribucin de las seales fuentes a estimar son supergaussianas.
Para el mezclado se utiliza la matriz:
0.5
1
A2 =
0.308 0.444
50
En la Figura 3.10 se muestran las seales fuentes, las mezclas y los resultados para cada
tasa.
Figura 3.10. En las dos primeras filas se muestran las fuentes de audio y las respectivas mezclas. Las siguientes
graficas son las estimaciones de INFOMAX para cada tasa de aprendizaje. En todos los caso se puede observar una
separacin de las mezclas en sus componentes originales.
A medida que se utiliza una tasa ms pequea los IS aumentan, lo que supone que
empeora la estimacin de las fuentes. Tambin, hay un aumento de la cantidad de
iteraciones para converger al disminuir la tasa de aprendizaje. Una explicacin a esto,
es que al tener una tasa ms pequea, la bsqueda de los mximos locales de la entropa
en la mezcla demora ms. La tasa es como el tamao de los pasos sobre una superficie,
si los haces ms pequeos demoras ms para llegar a un punto especfico. Esto tambin
trae consigo, que la bsqueda caiga en puntos crticos espurios haciendo que la
direccin hacia los verdaderos puntos sea ms lenta. A pesar de esto, como lo indica la
Tabla 3.11 los ndices de correlacin muestran una similitud en las formas de onda de
las estimaciones y las fuentes.
51
Tabla 3.10. ndices de evaluacin para los resultados de INFOMAX con respecto al cambio de la tasa de
aprendizaje. A medida que la tasa disminuye, los valores IS aumentan al igual que las iteraciones necesarias para
converger. Los valores de kurtosis son similares entre las estimaciones y las fuentes.
Tasa
Kurtosis
Kurtosis
Kurtosis
fuentes
Mezcla
Estimaciones
3.0449
0.01
1.0081
0.001
3.0448
2.323
1.0081
0.765
1.008
3.0449
1.0079
0.0001
3.0449
# de
IS
iteraciones
0.0059
11
0.006
39
0.0088
210
Tabla 3.11. Valores de correlacin. Todos los valores son iguales a la unidad, indicando un parecido exacto entre la
forma de onda de las fuentes y las estimaciones.
Tasa
0.01
0.001
0.0001
Seales a comparar
S1 vs Estimacin 1
-1
S2 vs Estimacin 2
-1
S1 vs Estimacin 2
-1
S2 vs Estimacin 1
S1 vs Estimacin 2
-1
S2 vs Estimacin 1
52
Como funcin de
activacin se utilizar -2tanh. Para mezclar las seales, es necesario cambiar la matriz
dependiendo del nmero de seales. Se utilizan las mismas matrices de mezclado de la
seccin 3.3.2.2. En la Figura 3.11 se muestran las seales fuentes, las mezclas y los
resultados para el caso de cuatro seales de audio. Se puede observar una separacin de
las mezclas en sus componentes originales a pesar que el valor de IS es mayor a 0.1. En
la Tabla 3.12 se muestran los ndices de evaluacin para todos los casos. Cuando
aumenta el nmero de seales el IS aumenta, disminuyendo la calidad de la separacin.
Es importante notar, que cuando se aumenta de tres a cuatro seales, la cantidad de
iteraciones requeridas se mantiene igual. Es prueba fue repetida en varias ocasiones
dando siempre los mismos valores.
Figura 3.11. a) Las cuatro seales fuentes. b) Seales despus del mezclado. c) Resultados de INFOMAX.
53
Tabla 3.12. Influencia en el nmero de seales como entrada a INFOMAX. Cuando se indica el valor de la kurtosis,
se sigue este orden: S1, S2, Para el valor de kurtosis de las mezclas: X1, X2,.. Para indicar el valor de kurtosis de
las estimaciones: estimacin 1, estimacin 2,... Se indica el valor del ndice de separacin (IS) y el nmero de
iteraciones utilizado.
Numero
Kurtosis
Kurtosis
Kurtosis
de seales
fuentes
Mezcla
Estimaciones
3.0448
2.323
3.0449
1.0081
0.765
1.81
3.0448
2.2259
3.0449
1.0081
0.451
1.0084
0.2361
0.2232
0.2361
3.0448
2.2114
0.2362
1.0081
0.3966
1.0086
0.2361
0.194
2.9384
2.936
0.4047
3.0449
# de
IS
iteraciones
0.0059
11
0.0664
58
0.1376
58
En la Tabla 3.13 se muestras los ndices de correlacin. Para cuatro seales los ndices
tienen una disminucin del 0.09%, valor que indica desmejoramiento en la separacin.
Tabla 3.13. ndices de correlacin para los resultados de INFOMAX. Se compara cada fuente con la estimacin
respectiva.
Numero de seales
Seales a comparar
S1 vs Estimacin 1
-1
S2 vs Estimacin 2
-1
S1 vs Estimacin 1
S2 vs Estimacin 2
-1
S3 vs Estimacin 3
-0.9998
S1 vs Estimacin 4
-1
S2 vs Estimacin 2
S3 vs Estimacin 1
-0.9999
S4 vs Estimacin 3
0.9999
54
supergaussianas.
sus
correspondientes
funciones
de
activacin
para
seales
Figura 3.12. Funciones de densidad de probabilidad de las cuales se derivan las funciones de activacin utilizadas
por el algoritmo INFOMAX. Podemos observar que difieren en su forma. Sign es tiene un pico mas agudo que las
dems.
55
Figura 3.13. a) Seales fuentes para la prueba. b) Densidades de probabilidad de estas fuentes. Las primeras dos
tienen picos muy agudos y la ltima tiende a ser ms plana.
En la Tabla 3.14 son mostrados los resultados de INFOMAX. En todos los casos la
kurtosis de las estimaciones es similar a la kurtosis de las fuentes. El menor valor de IS
fue para la funcin Sign, al igual que el nmero de iteraciones utilizado. Observando la
forma de la funcin de probabilidad en la Figura 3.12 para Sign, esta parece acomodarse
ms a la forma de las densidades de las fuentes originales. Sin embargo, aunque las
funciones de probabilidad para Sigmoidal y Tanh no se parezcan tanto, aun as se
obtienen una separacin, aunque con una mayor cantidad de iteraciones. En la Tabla
3.15 se muestran los valores de correlacin, los cuales indican una similitud en la forma
de onda entre las estimaciones y las fuentes.
56
Tabla 3.14. Influencia en el nmero de seales como entrada a INFOMAX. Cuando se indica el valor de la kurtosis,
se sigue este orden: S1, S2, Para el valor de kurtosis de las mezclas: X1, X2,.. Para indicar el valor de kurtosis de
las estimaciones: estimacin 1, estimacin 2,... Se indica el valor del ndice de separacin (IS) y el nmero de
iteraciones utilizado.
Kurtosis
Kurtosis
Kurtosis de
de la
de la
las
fuente
mezcla
estimaciones
Funcin
IS
Iteraciones
0.0624
59
0.05
31
0.0464
12
3.0449
Sigmoidal
1.0084
0.236
Tanh
3.0448
2.2259
3.0448
1.0081
0.451
1.0083
0.2347
0.2232
0.2358
3.0448
Sign
0.2354
1.0081
Funcin
Sigmoidal
Tanh
Sign
Seales
Correlacin
S1 vs Estimacin 1
S2 vs Estimacin 2
-1
S3 vs Estimacin 3
-0.9999
S1 vs Estimacin 1
S2 vs Estimacin 2
-1
S3 vs Estimacin 3
-0.9999
S1 vs Estimacin 1
S2 vs Estimacin 2
-1
S3 vs Estimacin 3
57
3.3
MEZCLAS CONVOLUTIVAS
Se realizar una prueba utilizando el algoritmo propuesto por Torkkola para separar
mezclas convolutivas. Como se ha mencionado en la metodologa se ha realizado una
implementacin en Matlab de este algoritmo para separar dos mezclas. Se utilizan dos
seales acsticas de audio: la primera seal es la palabra Aleluya cantada por un coro,
y la segunda es la famosa frase: Goodmorning Vietnam. Estas seales estn
compuestas por 30k muestras y tiene una frecuencia de muestreo de 12kHz.
Para realizar la mezcla se utilizan los siguientes filtros, siguiendo el modelo de la
ecuacin (2.20):
X 1 ( z ) = A11 ( z ) S1 ( z ) + A12 ( z ) S 2 ( z )
X 2 ( z ) = A21 ( z ) S1 ( z ) + A22 ( z ) S 2 ( z )
Estos filtros son de mnima fase, por lo cual sus inversas son estables y pueden ser
estimadas por el algoritmo Torkkola.
Recordando de la seccin 3.4.1 las respuestas ideales de los filtros son las siguientes:
W11 ( z ) = 1, W12 ( z ) = A12 ( z ) A22 ( z )1
W22 ( z ) = 1, W11 ( z ) = A21 ( z ) A11 ( z ) 1
En la Figura 3.14 mostramos esta respuesta para una longitud del filtro de 50.
58
Figura 3.14. Respuesta ideal de la estructura propuesta por Torkkola. En este caso mostramos los coeficientes para
una longitud de filtro de 50.
Las fuentes, las mezclas y las estimaciones de las fuentes son mostradas en la Figura
3.15. Como se observa, la estimacin 1 se aproxima a la fuente 1 y la estimacin 2 a la
fuente 2, respectivamente. En este caso tienen una amplitud parecida y de mismo signo.
Tambin, se puede observar una disminucin notable de la interferencia entre las
seales.
Figura 3.15. Arriba: Las fuentes originales. Centro: Las mezclas. Abajo: Seales como resultado del algoritmo
Torkkola.
En la Figura 3.16 se muestran los pesos obtenidos desde el algoritmo comparando con
la respuesta ideal, en la figura 3.14 observamos que los primeros coeficientes de mayor
magnitud se corresponde con la respuesta dada por el filtro ideal. Como se explico en la
seccin 3.4.1, el algoritmo de Torkkola solo puede estimar una versin filtrada de las
fuentes. La estimacin de las fuentes tiene la forma filtrada desde la ecuacin (2.25):
A11S1 = U1
A22 S 2 = U 2
Por esta razn, siempre vamos a obtener una versin de la fuente con sus ecos y
reverberaciones.
Ecualizacin ciega (Blind ecualization). Es importante anotar, que las fuentes tienen
una cantidad de ruido, que reduce la eficacia del algoritmo. A pesar de esto, en las Tabla
3.16 y Tabla 3.17 vemos que la seal estimada esta muy correlacionada con las fuentes
originales.
Figura 3.16. Respuesta del algoritmo Torkkola, despus de realizar la simulacin. Se indican los coeficientes
que se corresponden con la respuesta ideal en la figura 3.14. Se puede observar que los primeros coeficientes
marcados tienen la mayor magnitud para cada respuesta.
En las tablas se resaltan los valores de correlacin entre seales de diferentes salidas del
algoritmo. Se observa como la correlacin tiende a disminuir al pasar el algoritmo,
claro indicativo de reduccin de redundancia entre las salidas.
Tabla 3.16. Comparacin entre las fuentes y las mezclas utilizando correlacin cruzada. Se compara cada
mezcla con cada fuente.
Tipo de comparacin
ndice de correlacin
Mezcla 1-Fuente 1
0.8010
Mezcla 2-Fuente 2
0.8551
Mezcla 1-Fuente 2
0.3545
Mezcla 2-Fuente 1
0.4309
Tabla 3.17. Comparacin entre las fuentes y las estimaciones realizadas por el algoritmo. Se compara cada
estimacin con cada fuente.
Tipo de comparacin
ndice de correlacin
Estimacin 1-Fuente 1
0.8698
Estimacin 2-Fuente 2
0.9184
Estimacin 1-Fuente 2
0.0573
Estimacin 2-Fuente 1
0.0498
60
3.4
CONCLUSIONES
61
pudo constatar que los coeficientes del filtro ideal aparecen con una magnitud
importante en los pesos estimados.
Con respecto a la convergencia, en el caso de FASTICA lo hace dos veces ms rpido
que INFOMAX y trabaja de forma ms general, pues puede tratar con diferentes tipos
de seales. No es necesario asumir un tipo de densidad de probabilidad, sin embargo
FASTICA no tiene una versin para trabajar con mezclas convolutivas. En el caso de
INFOMAX, es muy dependiente del tipo de fuentes que se desean estimar, pero
permite trabajar con mezclado convolutivo. Adems de esto, debido a su estructura
puede adaptarse a los cambios de varianza de manera automtica, lo que lo hace
altamente adaptativo para entornos no estacionarios.
62
4. CAPITULO.
APLICACIONES
DE
ICA
EN
ENTORNOS REALES
4.1
Las seales utilizadas en este experimento se obtuvieron de una basa de datos creada
por Te Won-Lee disponibles en la fecha de redaccin del presente documento en
siguiente direccin: http://cnl.salk.edu/~tewon/Blind/blind_audio.html. Esta base de
datos fue generada en una habitacin de dimensiones 3m x 4m, colocando dos emisores
(personas o bocinas) y dos micrfonos como se muestra en la Figura 4.1.
En este documento se describen los resultados obtenidos de las pruebas en dos registros
de seales que consisten en:
1) Una persona contando los nmeros y msica de fondo.
2) Una persona contando los nmeros en ingles y una persona contando los
numero en espaol.
Figura 4.1. Dimensiones del cuarto y distancias entre las fuentes y los micrfonos.
Las seales estn compuestas por 100k muestras con una frecuencia de muestreo de
16kHz, lo que corresponde a 6.25 segundos de grabacin. En la base de datos no se
especifica la altura del cuarto ni la posicin de cada fuente o micrfono con respecto a
las paredes. Para el experimento asumimos una altura de 3 metros. Para cubrir las
primeras reflexiones, las cuales son con el techo y el piso, decidimos utilizar una
63
longitud del filtro de 256. Con este valor podemos cubrir reflexiones hasta de 5.4
metros. La velocidad del sonido para estos clculos fue de 340 m/seg.
Para calcular los retardos en muestras utilizamos la siguiente ecuacin:
M=
d
f
v
(3.3)
64
Figura 4.2. Arriba: Las dos grabaciones tomadas en el cuarto. No se puede identificar las seales caractersticas de
la voz. Abajo: Estimaciones realizadas por el algoritmo Torkkola. Se pueden apreciar las seales de voz (estimacin
1) y de msica (estimacin 2).
Figura 4.3. Pesos obtenidos despus de pasar las seales por el algoritmo.
En la Figura 4.3 se muestran los pesos obtenidos por el algoritmo Torkkola. Los
coeficientes con mayor amplitud son los utilizados por el filtro para eliminar la seal
65
66
Figura 4.4. Arriba: Las dos grabaciones tomadas en el cuarto. Abajo: Estimaciones arrojadas por el algoritmo.
En las dos grabaciones se escucha claramente la interferencia que una de las voces
produce en la otra. El coeficiente de correlacin entre las formas de onda de las
grabaciones es de 0.773 lo cual indica cierto parecido entre ambas. En las graficas c y d
de la Figura 4.4 se muestran las estimaciones. En la estimacin 1 se escucha claramente
la cuenta en ingles, con muy poca interferencia de la cuenta en espaol. La misma
situacin ocurre en la estimacin 2. El coeficiente de correlacin de ambas estimaciones
es de 0.0448 lo que indica ningn parecido entre sus formas de onda.
En la Figura 4.5 se muestran los pesos obtenidos por el algoritmo. En este caso los
coeficientes de mayor valor estn en el 3 para W12 y en 5 para W21. Utilizando los
valores obtenidos en la prueba anterior podemos observar que tenemos un error para los
dos casos de 0.021m. Con estas seales obtenemos unos valores ms aproximados al
valor calculado que en la prueba anterior.
Adems de los coeficientes con mayor magnitud observamos un valor importante de
amplitud en el coeficiente 9. Adems de esto, el coeficiente tiene un valor opuestos a
los coeficientes analizados anteriormente. En distancia es equivalente a 0.2 m. Esto
valor nos permite establecer que es un rebote de la pared tras los micrfonos y que esta
a aproximadamente a 0.1m. De esta manera se llega a la conclusin que los micrfonos
estaban colocado a 0.1m de la pared, lo que concuerda con la forma de la respuesta de
cada peso, la cual parece atenuarse exponencialmente.
67
Figura 4.5. Pesos obtenidos despus de pasar las seales por el algoritmo.
4.2
SEPARACION
DE
SEALES
ULTRASONICAS
EN
UN
68
Figura 4.6. Esquema de montaje para generar, adquirir y procesar seales acsticas a partir de descargas
parciales simuladas.
69
Figura 4.7. Vista de planta del tanque. Se indican las posiciones de las fuentes y los sensores. Tanto las fuentes como
los sensores estn a una altura de 0.2 metros. Todas las medidas estn en metros.
Figura 4.8. Imgenes del montaje de experimento para obtener las seales.
70
Figura 4.9. En las graficas a y b. se muestran los patrones de 100kHz y 150kHz, respectivamente. . El patrn de
100kHz es 5.5dB menor que el patrn de 150kHz debido a la sensibilidad de los sensores a 150kHz. En las graficas c
y d se muestra los espectros para cada patrn. A pesar que se emite a 100kHz, en el patrn de 100kHz los mximos
de amplitud estn en el rango de 105 kHz a 122 kHz. En el caso del patrn de 150kHz tambin se observa amplitud
de la seal desde los 105 kHz, a pesar que solo se est emitiendo a 150 kHz. Este es causado por la respuesta de los
transductores, que son resonantes a 120kH.
4.2.3 RESULTADOS
equivalente a 1500 muestras. Durante este tiempo es donde se dan las interferencias
mas importantes entre las seales provenientes de las fuentes acsticas, por tal razn,
utilizamos una longitud de filtro de 1500 para eliminar esta distorsin. Como funcin
de activacin utilizamos la Sigmoidal, con una tasa de aprendizaje de 0.01.
71
En la Figura 4.10 mostramos las seales captadas por los sensores y las estimaciones
realizadas por el algoritmo. La seal de la grafica a), la cual esta mas cerca de la fuente
S1 de 100kHz, contiene al inicio una frecuencia, pero que a 230us, aumenta esta
frecuencia.
72
Figura 4.10. Las graficas a y b muestran las seales captadas por los sensores X1 y X2, respectivamente. En X1 se
observa como la seal emitida por la fuente de 150kHZ interfiere en esta a aproximadamente 250us. En X2, la
interferencia de la seal de la fuente de 100kHz apenas es observable despus de los 250us. En las graficas c y d se
muestran las seales estimadas por el algoritmo Torkkola. La estimacin 1 contiene una seal de frecuencia menor
que en la estimacin 2.
En las graficas (c) y (d) de la Figura 4.10 se muestran las estimaciones realizadas por el
algoritmo Torkkola.
73
la fuente de 100kHZ hay sido atenuada por los sensores. Este conclusin es respaldada
por los coeficientes de correlacin de la en la tabla 4.3.
Figura 4.11. Espectro de los patrones y las mezclas. La Mezcla 1 contiene dos maximos a 107kHz y a 155 kHz, que
se diferencian por 2dB. En la Mezcla 2, esta diferencia es de 10dB.
Lo que
COMPARACION
CORRELACION
Patrn 100kHz-Mezcla 1
0.585
Patrn 100kHz-Mezcla 2
0.473
Patrn 150kHz-Mezcla 1
0.747
Patrn 150kHz-Mezcla 2
0.884
74
Figura 4.12.Espectro de los patrones y las estimaciones. La estimacion 1 tiene mayor similitud con el patron de
100kHz. En el caso de la estimacion 2, mayor similitud con el patron de 150kHz.
COMPARACION
CORRELACION
Patrn 100kHz-Estimacion 1
0.824
0.451
0.474
0.920
75
4.3
CONCLUSIONES
76
5 CAPITULO.
CONCLUSIONES
TRABAJO
FUTURO
5.1
CONCLUSIONES
77
5.2
TRABAJO FUTURO
continuar en actividades de
FASTICA ofrece
generalidad con respecto a las seales que separa y sera muy til aprovechar
esta caracterstica cuando se trabaja con mezclas convolutivas. Por esta razn,
se propone estudiar ICA en el dominio de la frecuencia o con Wavelet.
INFOMAX, a contrario que ICA no ofrece la generalidad de trabajar con
seales de cualquier distribucin pero esta caracterstica se puede convertir en
ventaja mediante la ptima seleccin de su funcin de activacin. En el caso de
las emisiones acsticas de las descargas parciales, se propone estudiar las
funciones de distribucin de probabilidad de los diferentes tipos descargas y
adaptar la funcin de activacin para que las separe. Existe un estudio en [44,
45] funcin puede adaptarse al tipo de la seal en escenarios no estacionarios
algo muy til para trabajo en lnea.
Otro punto importante a extender es la localizacin espacial de fuentes
utilizando los coeficientes de pesos obtenidos. En las pruebas con seales reales
de audio, fue posible estimar el retardo en las seales y realizar suposiciones
sobre la posicin de las fuentes con respecto a las paredes. En el caso de
descargas parciales, estos coeficientes nos pueden dar informacin sobre la
localizacin de las fuentes de descargas parciales. Si esto es combinado con una
funcin de activacin adaptativa, podramos de manera simultnea localizar e
identificar varios tipos de descarga. Por ultimo, otra mejora que se propone
investigar es en la extraccin de fuentes.
78
79
REFERENCIAS
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[19]
[20]
[21]
[22]
[23]
80
[24]
[25]
[26]
[27]
[28]
[29]
[30]
[31]
[32]
[33]
[34]
[35]
[36]
[37]
[38]
[39]
[40]
[41]
[42]
[43]
[44]
[45]
81
[46]
[47]
[48]
82