Vous êtes sur la page 1sur 4

Revista Colombiana de Fsica, Vol. 43, No.1 de 2011.

Reconocimiento De Objetos En Escenas Confusas Por Medio De La Transformada Wavelet


Objects Recognizing In Confused Scenes Through The Wavelet Transform
L. Barba Jimnez * a, L. P. Vargas Quintero a, C. O. Torres Moreno a
a

Universidad Popular del Cesar, Colombia.

Recibido 06.03.10; Aceptado 15.12.10; Publicado en lnea 24.04.11.

Resumen
En el presente trabajo de investigacin la extraccin de caractersticas de imgenes utilizando ondeletas para deteccin de correlacin ptica es presentada. Se muestran simulaciones digitales con un correlador de transformacin conjunta (JTC), evidenciando que existe una promisoria aplicacin en el campo de la correlacin ptica, usando la representacin multiresolucin a travs de la transformada Wavelet. La energa de los picos de correlacin y la razn de discriminacin de varios blancos se mejora sustancialmente con esta tcnica. Para demostrar la potencialidad de extraccin de caractersticas utilizando la transformada wavelet, pequeos blancos en escenas confusas son detectados con xito. Palabras clave: Transformada Wavelet en dos Dimensiones; Filtrado multinivel; Correlacin de Imgenes.

Abstract
In this research work the images characteristic detection using wavelets for optical correlation is presented. Digital simulations with a Joint Transform Correlator are shown, demonstrating that there is a promising application on the optical correlation field, using multiresolution representation through the Wavelet transform. The energy of correlation peaks and discrimination level of several objects are improved with this technique. To demonstrate the potentiality in extracting characteristics using the Wavelet transform, small objects on confused scenes are detected successfully. Keywords: Two Dimensional Wavelet Transform; Multilevel Filtering; Images Correlation. PACS: 42.30.-d. 2010 Revista Colombiana de Fsica. Todos los derechos reservados.

1.

Introduccin

El reconocimiento de patrones de imgenes es una disciplina cuyo objetivo es la clasificacin de objetos en un nmero determinado de categoras o clases. Un ejemplo claro de esta rea de trabajo es la maquina de visin en la cual se capturan imgenes desde una cmara y se analizan para producir descripciones de lo que es la imagen. Muchas otras aplicaciones se derivan del reconocimiento de patrones de imgenes: diagnstico de enfermedades asistido por computador para colaborar con los especialistas a tomar decisiones sobre enfermedades, identificacin de huellas, autenticacin de firmas, reconocimiento de caracteres, rostros y gestos de mano, entre otras [1].

La correlacin digital de imgenes es un mtodo que permite comparar y determinar el grado de similitud entre dos seales bidimensionales (imgenes), lo que genera un gran aporte de esta tcnica al campo de reconocimiento de patrones en general. Se puede decir que los algoritmos de correlacin de imgenes se dividen en dos grupos de acuerdo al dominio en el que es realizado el anlisis [2]. Por tanto el procesamiento de imgenes en este contexto puede ser llevado a cabo en el dominio espacial o frecuencial. Muchos trabajos han sido propuestos en los cuales se utiliza la correlacin ptica de imgenes para identificar patrones en una gran cantidad de aplicaciones [3]-[4]. La Transformada Wavelet es una herramienta matemtica que permite descomponer una seal en versiones escala-

* barba.leiner@unicesar.edu.co

L. Barba Jimnez, L. P. Vargas Quintero, C. O. Torres Moreno: Reconocimiento De Objetos En Escenas Confusas Por Medio De La Transformada Wavelet

das y desplazadas de una seal madre [5]. En combinacin con esta tcnica se de han desarrollado algoritmos que efectan mejoramiento de imgenes y reconocimiento una vez que se tiene una representacin multiresolucin de la seal [6]-[7]. En este trabajo se propone un mtodo en el que se combinan las propiedades de descomposicin de seales de la Transformada Wavelet y las tcnicas de correlacin ptica para extraer caractersticas importantes de imgenes y mejorar el proceso de detectacin de objetos en escenas de imgenes confusas con un alto nivel de complejidad. 2. Algoritmos de Correlacin de Imgenes

Cuando se trabaja con imgenes de gran tamao es conveniente efectuar esta operacin en el dominio de frecuencias a travs de la transformada de Fourier discreta (DFT), utilizando como punto de partida el teorema de correlacin [10], en el cual se obtienen los coeficientes de salida por la multiplicacin de las transformadas de Fourier de cada una de las imgenes a comparar y luego se calcula la transformada inversa (IDFT) para retornar al dominio espacial:

c(u, v) = F 1{F ( f ( x, y )) F * ( g ( x, y ))}

(3)

La correlacin de dos imgenes (correlacin cruzada) es una aproximacin estndar para la deteccin de caractersticas [8]. Como se mencion anteriormente la correlacin de imgenes puede ser ejecutada en el dominio espacial o en el dominio frecuencial. 2.1. Correlacin en el Dominio Espacial En el dominio espacial la correlacin cruzada trata de identificar un patrn, el cual corresponde a una subimagen que mapea otra imagen de referencia para tratar de buscar la similitud entre ellas. Esta subimagen representa la imagen que contiene la informacin que se quiere encontrar sobre la imagen de prueba. Entre mayor sea la similitud entre la subimagen y la porcin de la imagen de referencia mapeada, mayor ser el coeficiente de correlacin resultante. Generalmente en los sistemas de reconocimiento de patrones se usan diferentes tcnicas de filtrado en conjunto con una correlacin cruzada normalizada definida por:

donde F denota la transformada de Fourier de la funcin y F-1 la transforma inversa. Este mtodo es conocido comnmente como Correlador de Transformada Conjunta (JTC) [10]. 3. Transformada Wavelet en Dos Dimensiones para Representacin Multiresolucin

El anlisis wavelet consiste en la descomposicin de una seal arbitraria en versiones escaladas y trasladadas de la wavelet original, por lo que cualquier funcin arbitraria puede ser representada como una superposicin de un conjunto de funciones bases llamadas wavelets madre [5]. En este proceso, la imagen de entrada es descompuesta en un conjunto jerrquico de aproximaciones y detalles. Dada la naturaleza discreta de las imgenes a procesar es necesario utilizar la transformada wavelet discreta (DWT) en dos dimensiones, la cual se define por la ecuacin:
Cw(a, b) = Cw( j, k ) = f ( x, y )h j , k ( x, y )
xZ yZ

(4)

f ( x, y).g ( x u, y v)
c (u , v ) =
x =1 y =1 2 J K J K 2

(1)

f
x =1 y =1

( x, y )

g
x =1 y =1

( x u , y v)

donde f es la imagen de referencia y g la subimagen de prueba posicionada en el punto (x,y) dentro de la imagen de referencia f. En general los coeficientes c(x, y) deben ser calculados para todas las traslaciones posibles de la subimagen de prueba sobre la imagen de referencia [9]. 2.2. Correlacin en el Dominio Frecuencial La correlacin en el dominio frecuencial se apoya en el teorema de convolucin y la transformada de de Fourier. Por tanto para llevar a cabo la correlacin es necesario inicialmente obtener la transformada de Fourier discreta (DFT) en dos dimensiones de la subimagen de muestra y la imagen de referencia. Teniendo en cuenta esto la correlacin se define a travs del teorema de convolucin en el dominio espacial para funciones discretas: J K (2) c (u , v ) = f ( x, y ).g * ( x u , y v )

con a = 2 j , b = k 2 j , j N , k Z donde f es la imagen original, g es la funcin wavelet para la descomposicin, a es el factor de escala de la funcin wavelet, b es el parmetro que define la posicin de la funcin wavelet y Cw(a,b) son los coeficientes obtenidos. El proceso inverso puede ser obtenido utilizando la siguiente expresin:

f ( x, y ) = Cw ( j , k ) j , k ( x, y )
jZ kZ

(5)

donde es la funcin wavelet usada para reconstruir la imagen. En la representacin multiresolucin llevada a cabo por la 2-D DWT se fragmenta el espectro de frecuencia de una imagen I en una imagen de subbanda pasa-bajo cAj y en un conjunto de imgenes de subbanda pasa-alto con orientacin horizontal cDHj, orientacin vertical cDVj, y orientacin diagonal cDDj, (ver figura 1), con j = 1,,L, donde L denota el nmero de niveles para una representacin [11]. En trminos generales, las representaciones multiresolucin son implementadas por una cascada de bancos de filtros de anlisis/sntesis (A/S). La transformada wavelet discreta usa dos wavelets madres diferentes: h(x) para la descomposicin multiresolucin (anlisis) y (x) para la reconstruccin (sntesis) de la imagen original desde su representacin multiresolucin. Un eficiente mtodo para

x =1 y =1

donde * denota el complejo conjugado de la funcin g.

167

Rev.Col.Fs., Vol. 43, No. 1 de 2011.

implementar la transformada Wavelet discreta usando filtros fue desarrollado por Mallat [11]. La figura 1 muestra la implementacin de la transformada wavelet discreta para un nivel de descomposicin (L = 1). Para continuar con el proceso de descomposicin a mas niveles, se parte de cAj y se repiten los pasos anterior.

mejorar en mayor grado las zonas de la imagen que son de ms bajo contraste. Este filtro es definido por:
FS
j H ,V , D j j DH ,V , D ( x, y ) (k 1)T , si D H ,V , D ( x, y ) < T (6) j j ( x, y ) = kDH ,V , D ( x, y ) , si DH ,V , D ( x, y ) T j j DH ,V , D ( x, y ) + (k 1)T , si DH ,V , D ( x, y ) > T

j donde DH es la funcin de detalle de orientacin hori,V , D

zontal, vertical o diagonal en el nivel de descomposicin j. Este operador de mejoramiento contiene dos parmetros a seleccionar, la ganancia K y el umbral T. Una vez realizado el filtrado a nivel de subbanda se calcula la transformada Wavelet discreta inversa para volver a cada imagen original con la informacin de alta frecuencia resaltada. En esta etapa es posible reconstruir la imagen solo con la informacin de alta frecuencia para mostrar los bordes de la imagen o solo con la informacin de baja frecuencia que corresponde al fondo de la misma. Posteriormente se ejecuta el proceso de correlacin digital utilizando cualquiera de los mtodos descritos anteriormente en la seccin 2. Como ultima etapa hay que seleccionar los picos de correlacin de finales a travs de un proceso de umbralizacin definido por la funcin escaln:
1 , si C ( x, y ) > max(C ( x, y )) l (7) P ( x, y ) = 0 , si C ( x, y ) < max(C ( x, y )) l donde C(x,y) son los coeficientes de correlacin obtenidos y l una constante que permite disminuir el umbral a un valor menor del pico mximo de la matriz de correlacin final. Los picos de correlacin obtenidos muestran las posiciones finales donde se ubica un patrn en la imagen de referencia que ilustra la similitud entre la subimagen de prueba y la porcin de la imagen de referencia cubierta por el tamao de la ventana de dicha subimagen.

Fig. 1: Algoritmo de DescomposicinWavelet.

4.

Descripcin del Sistema Desarrollado

Fig. 2: Diagrama de bloques del Sistema Desarrollado.

El sistema desarrollado consiste de varias etapas de procesamiento, tal como se muestra en la figura 2. Inicialmente se debe obtener la descomposicin en subbandas usando la transformada Wavelet discreta en dos dimensiones de las imgenes a comparar. Una vez calculada DWT se obtienen por separado las diferentes imgenes que representan la informacin de detalle o alta frecuencia y la informacin de aproximacin o de baja frecuencia de la imagen original. La idea de utilizar representacin mutiresolucin se debe a que es posible manipular el contenido de cada subbanda en distintos niveles de descomposicin, esto permite de cierta forma utilizar filtros que modifiquen la imagen original dependiendo del contraste de la imagen de entrada. Como se muestra en la figura 2 el siguiente paso corresponde a un proceso de filtrado sobre la informacin de detalles de cada una de las imgenes de entrada. Aqu se emplea un filtro no lineal definido por Andrew Laine [12] para mejorar la informacin de alta frecuencia en los distintos niveles de descomposicin de una imagen cuando se usa representacin multiresolucin a travs de la transformada wavelet. Este filtro tiene la caracterstica de ser local y de

5.

Resultados

Para evaluar los resultados se utilizaron diferentes imgenes de referencia y se escogieron patrones de prueba para buscar patrones semejantes dentro de ellas, comparando el mtodo propuesto con una correlacin simple de la dos imgenes sin ningn tipo de filtrado. La figura 3(a) muestra una imagen de referencia tomada (un parqueadero) para buscar el patrn de la figura 3(b) correspondiente a los sitios de parqueo desocupados. En la figura 4 se observa la posicin de los objetos detectados una vez se ha ejecutado todo el algoritmo, y la figura 5 muestra una grfica 3D con los picos de correlacin obtenidos despus de aplicar el correlador y los picos de correlacin finales. En total se detectaron 26 de los 29 objetos requeridos dentro de la imagen de referencia, y adems se obtuvieron 2 falsos positivos, para un porcentaje del 89% de desempeo.

168

L. Barba Jimnez, L. P. Vargas Quintero, C. O. Torres Moreno: Reconocimiento De Objetos En Escenas Confusas Por Medio De La Transformada Wavelet

construir un sistema automtico que seleccione todos los parmetros del algoritmo dependiendo del nivel de contraste de las imgenes de entrada. El gran nmero de parmetros es una ventaja porque se obtienen muchas posibilidades al momento de filtrar las imgenes, pero al mismo tiempo se convierte en desventaja al momento de implementar un sistema automtico. (a) (b) Referencias [1] Theodoridis S., koutroumbas K. Pattern Recognition, San Diego: USA, ELSEVIER 2003, 710 p. ISBN:0-12685875-6. [2] Yaofeng S., Yeow Meng T, Pang J., Fei S. Digital Image Correlation and its Applications in Electronics Packaging, Electronic Packaging Technology Conference, Volume: 1, On page(s): 6 pp.- ISBN: 0-78039578-6. [3] John H.L. Pang, X.Q Shi, X.R Zhang and Q.J Liu, "Application of Digital Speckle Correlation to Microdeformation Measurement of A Flip Chip Assembly," 53rd Electronic Components and Technology Conf., IEEE, New Orleans, LA, May. 2003, pp. 926-932. [4] Kirugulige, M. S., Tippur, H. V., Denney, T. S., Measurement of Transient Deformations Using Digital Image Correlation Method and High Speed Photography, Applied Optics, 2007, Vol. 46, pp. 5083-5096. [5] Amara Graps, An introduction to wavelets, IEEE Computational Science and Engineering, vol. 2, Issue 2, Summer 1995 Page(s):50 61. [6] G.Y. Chen, G. Dudek, Auto-correlation wavelet support vector machine, Image and Vision Computing, ELSEVIER 27 (2009) pp. 10401046. [7] Surez D. A., Salazar . Comparative study of pattern correlation using Mexican hat and Coiflet waveletbased filtering, Optics Communications, ELSEVIER, 282 (2009) 42034209. [8] R. O. Duda and P. E. Hart, Pattern Classification and Scene Analysis, New York: Wiley, 1973. [9] Pratt K. William. Correlation Techniques of Image Registration. IEEE Transactions on Aerospace and Electronic Systems vol. aes-10, no. 3 may 1974. [10] Goodman, J.W., Introduction to Fourier optics, McGraw- Hill, New York, 1968. [11] S. G. Mallat, Multifrequency channel decomposition of images and wavelet models, IEEE Trans. Acoust., Speech, Signal Processing, vol. 37, pp. 20912110, Dec. 1989. [12] A. Laine, S. Schuler, J. Fan, and W. Huda. Mammographic feature enhancement by multiscale analysis. IEEE Transactions on Medical Imaging, 13(4):725 740, December 1994.

Fig. 3: (a) Imagen de referencia, (b) Patrn a buscar

Fig. 4: Objetos detetados en la imagen de referencia

En esta prueba se tomaron los siguientes valores de parmetros: Nivel de Descomposicin Wavelet L= 3, Familia Wavelet = Symlet de orden 4 (sym4), Ganancia del filtro de subbanda k = 0.8, Umbral del filtro de subbanda T = 18, constante l = 0.3. Se us el correlador en el dominio espacial y frecuencial y se obtuvieron los mismos resultados para este caso particular. Anlogamente, se obtuvo la correlacin usando las imgenes originales sin ningn tipo de filtrado y se detectaron 18 de 29 objetos para un porcentaje de 62% con 4 falsos positivos. Asimismo se alcanz un nivel promedio de desempeo del correlador con transformada Wavelet del 93% con otras escenas de prueba.

(a)

(b)

Fig. 5. (a) Picos de correlacin inciales, (b) Picos finales

6.

Conclusiones

Se present un sistema en el cual se utiliz la transformada wavelet discreta y la correlacin digital para mejorar la capacidad de reconocimiento de patrones de objetos en escenas confusas. El mtodo aumenta en gran medida el desempeo del correlador. Como trabajo futuro se planea

169

Vous aimerez peut-être aussi