Vous êtes sur la page 1sur 27

APLICACIONES DE LA VISIN ARTIFICIAL

1 INTRODUCCIN
Es preciso reconocer que hoy por hoy la visin por computador a veces no es la mejor solucin a un problema. Existen muchas ocasiones en las que el problema es tan complejo que la solucin humana es lo mejor. Por ejemplo imaginemos una conduccin de un vehculo en una carretera con trfico intenso. Pero a veces, las soluciones humanas tienden a ser inexactas o subjetivas y en ocasiones lentas y presentan una ausencia de rigor as como una pobre percepcin (Marshall y Martin 1993, Hamey y col. 1993). No obstante, la solucin humana es menos estructurada que la solucin artificial y muchos problemas de visin por computador requieren un nivel de inteligencia mucho mayor que el que la mquina pueda ofrecer. El sistema de visin humana puede describir automticamente una textura en detalle, un borde, un color, una representacin bidimensional de una tridimensional, ya que puede diferenciar entre imgenes de diferentes personas, firmas, colores, etc., puede vigilar ciertas zonas, diagnosticar enfermedades a partir de radiografas, etc. Sin embargo, aunque algunas de estas tareas pueden llevarse a cabo mediante visin artificial, el software o el hardware necesario no consigue los resultados que seran deseables. Aun a pesar de las limitaciones expuestas, cada da es mayor el nmero de aplicaciones de la visin artificial. Por ello slo es posible dar una pequea pincelada sobre las mltiples aplicaciones en las que la visin artificial se ha aplicado hasta el momento. Aqu solamente proporcionamos algunas ideas para generar aplicaciones en la mente del lector. Obviamente los ejemplos que se presentan son aplicables a cualquier

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

otro proceso diferente y en otro campo industrial o cientfico tambin diferentes. En Newman y Jain (1995) o Davies (1997) se puede encontrar una amplia revisin sobre la inspeccin visual y aplicaciones de la visin a diferentes campos de la vida real, que nos dan idea del amplio abanico de posibilidades. Existen herramientas y paquetes software cuya finalidad principal son las aplicaciones industriales, tal es el caso de IMAQ Vision de National Instruments (IMAQ), y por supuesto paquetes de propsito general con ciertas funciones de aplicacin como es el caso de las Matrox Imaging Libraries (Mil) o el Toolbox Image de MATLAB (Matlab). A partir de ahora la aparicin en el texto de los anacronismos entre parntesis expresar la capacidad de la herramienta correspondiente para llevar a cabo la tarea que se describe. Cabe no obstante diferenciar entre las aplicaciones donde la visin artificial constituye una herramienta por s sola y aquellas otras en las que es parte de un sistema multisensorial. El primer caso engloba todas aquellas aplicaciones en las que el nico sensor presente es el de visin. En el segundo caso nos estamos refiriendo a la navegacin en robtica donde la visin constituye una capacidad sensorial ms para la percepcin del entorno que rodea al robot. En muchas aplicaciones las imgenes se presentan al sistema bajo diferentes formatos, cuyos detalles estn lejos del alcance de este libro. A modo de ejemplo citamos los siguientes: TIFF, BMP, GIF, JPG, PNG, DICOM, RAW.

2 NAVEGACIN EN ROBTICA
En este caso, la visin es un elemento de un sistema multisensorial. La informacin procedente de la visin es validada, comparada y finalmente integrada con el resto de la informacin proporcionada por otro tipo de sensores. El resultado es la reconstruccin de la escena 3-D, que permite la navegacin autnoma del sistema (Schneider 1996, Lpez-Orozco 1999). Para la navegacin en robtica se recurre generalmente a tcnicas de visin estereoscpica con el fin de poder reconstruir la escena 3-D. Si a esto se le aade algn mdulo de reconocimiento 3-D con el fin de identificar la presencia de determinados objetos, hacia los que debe dirigirse o evitar, tanto mejor. La utilizacin del movimiento basado en la visin constituye un magnfico recurso puesto que el propio sistema est ya de hecho en movimiento. Naturalmente, cualquier otra informacin que pueda extraerse con ayuda de la visin puede proporcionar una gran ayuda para conseguir el movimiento del robot. No es exclusivo su uso en robtica, sino que podra utilizarse en otras aplicaciones tales como guiado automtico de mquinas, tal y como proponen Amat y

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 3

Casal (1989) para mquinas agrcolas. Tambin para la deteccin y estimacin del movimiento de vehculos (Pei y Liou 1998, Tan y col. 1998).

3 BIOLOGA, GEOLOGA Y METEOROLOGA


En el campo de la biologa podramos distinguir entre aplicaciones microscpicas y macroscpicas. En una imagen microscpica nos podemos encontrar con abundantes organismos, que mediante tcnicas de segmentacin orientadas a regiones, por ejemplo utilizando una binarizacin, podran ser aislados para su identificacin mediante las correspondientes propiedades (tamao, excentricidad, color, etc.) o para contar el nmero de microorganismos o clulas presentes en una imagen, IMAQ, Mil, Matlab. En las imgenes macroscpicas pueden utilizarse las regiones para la identificacin de determinados tipos de texturas en vegetales o caractersticas de diferentes reas naturales por su color o el crecimiento de ciertas especies por diferencia de imgenes. En geologa se puede tambin detectar movimientos de terrenos captando dos imgenes en diferentes momentos de tiempo para observar la variacin mediante una diferencia de imgenes (bajo similares condiciones de iluminacin). En esta rea tambin es posible la reconstruccin de reas 3-D mediante visin esteroescpica o la obtencin de la forma a partir de la iluminacin. Puede resultar de inters el hecho de identificar el grado de floracin de un determinado cultivo, por ejemplo, de un campo de girasoles. Para ello se extrae de la imagen la componente de color amarillo, al igual que se hizo en el apartado 7.5 donde se obtuvieron las regiones por el color, tras lo cual se binariza la imagen y se obtiene el nmero de pxeles blancos o negros, que nos permite obtener el porcentaje de floracin. En Glasbey y Horgan (1995) se estudia el procesamiento de forma especfica en imgenes biolgicas con las tcnicas descritas a lo largo de este libro. La transformada de Fourier puede resultar til por ejemplo para determinar la naturaleza de una determinada formacin geolgica o de una especie biolgica. En efecto, la figura S.21(b) muestra una formacin rugosa de un tronco de rbol con una orientacin media de las arrugas en sentido vertical, tal y como se deduce del espectro de frecuencias de la figura 1(a). Anlogamente, en la figura S.32(a) se muestra una imagen de una formacin geolgica con estratos inclinados formando un ngulo de 45 aproximadamente. El espectro de frecuencias en este caso, muestra una tendencia inclinada de unos 45, que caracteriza dicha estratificacin, tal y como se muestra en la figura 1 (b) (IMAQ, Matlab). En Meteorologa podramos utilizar las tcnicas de deteccin y prediccin del movimiento estudiadas en el Captulo 12 para observar, por ejemplo, la evolucin de ciertas masas nubosas, u otros fenmenos meteorolgicos, a travs de imgenes

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

recibidas va satlite. En Sonka y col. (1995) se muestra precisamente un ejemplo sobre la evolucin y prediccin de una masa de nubes a partir de una secuencia de imgenes.

(a)

(b)

Figura 1 Espectros de frecuencia (a) de una estructura biolgica correspondiente a la corteza de rbol de la figura S.21(b) y (b) de una formacin geolgica cuya imagen se muestra en S.32 (a) Tambin puede resultar de inters determinar el grado de cobertura de una nevada en funcin de la superficie cubierta. En la imagen de la figura S.32(b) se muestra un campo cubierto por una intensa nevada. En la imagen de la figura 2(a) aparece la misma imagen en tonos de grises de la que mediante binarizacin se determina la superficie no cubierta por la nieve.

(a)

(b)

Figura 2 (a) Imagen de grises obtenida a partir de la imagen de la figura S.32(b); (b) imagen binaria, obtenida a partir de (a) donde se muestra en negro la superficie no cubierta En Vesecky (1988) se propone un estudio para observar la dinmica de placas de hielo en el mar mediante el anlisis de imgenes de radar.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 5

4 MEDICINA
La comunidad mdica tiene muchas aplicaciones en las que aparece el procesamiento de imgenes, a menudo orientadas hacia el diagnstico de dolencias o enfermedades, entre las que se incluyen radiografas, resonancias magnticas, tomografas etc. ste es un campo extraordinariamente amplio donde la mejor fuente de ejemplos y aplicaciones la constituye la revista IEEE Trans. Medical Imaging. A veces, en algunas otras revistas de medicina se incluyen diversas aplicaciones basadas en imgenes mdicas. Lester y Arridge (1999) presentan una revisin de mtodos relativos a lo que en ingls se denomina Image Registration y que en definitiva se trata de definir una estrategia para encontrar la correspondencia entre un modelo y un objeto, siendo necesario definir las caractersticas o estructuras, el espacio de bsqueda y la mtrica para determinar el grado de semejanza. El propio trabajo contiene abundantes referencias bibliogrficas en las que se incluyen algunos ejemplos de inters en el campo de las imgenes mdicas. Adems Duncan y Ayache (2000) hacen una revisin sobre el progreso en los ltimos 20 aos del anlisis de imgenes mdicas as como los cambios en el futuro. Desarrollan un exhaustivo trabajo al respecto, que incluye 139 referencias de inters. En IPMI99 (1999) se encuentran en exclusiva abundantes trabajos aplicados al campo de la medicina. Veamos algunos ejemplos de aplicaciones de procesamiento bsico. Consideremos la imagen dada en la figura 3(a) que corresponde a una radiografa con una imagen de muy baja calidad, se pretende extraer informacin sobre las manchas blancas que aparecen en la misma. En (b) se muestra su histograma de frecuencias. Se modifica el histograma mediante aumento del contraste y gamma con lo que se obtiene la imagen dada en (c) y su histograma correspondiente en (d), aqu las manchas aparecen explcitamente, sin embargo todava se puede extraer ms informacin. Utilizando una tcnica de binarizacin mediante seleccin de umbral se obtiene (e) que posteriormente se dilata mediante la correspondiente operacin morfolgica para rellenar huecos y hacer ms explcitas las manchas, obteniendo (f). Posteriormente, de esta imagen se extraen las manchas (objetos) subyacentes, que son etiquetados. Segn el nmero de etiqueta as es su color en S.33(a), con esta informacin podemos obtener el rea de las diferentes regiones etiquetadas (coloreadas). En la figura S.33(b) se muestra una ecografa con una grfica en su parte inferior. La segmentacin de dicha grfica por extraccin de la componente de color verde mediante las tcnicas de extraccin de regiones por el color descrita en el Captulo 7, permite su tratamiento (medida de los picos, anchura entre picos, etc.). En la parte inferior de dicha figura aparece la grfica binarizada.

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

En la figura S.34 (a) se proporciona una imagen original, en (b) y (c) las componentes dominante de color rojo y verde respectivamente para su anlisis. As, resulta fcil determinar la superficie de rojo o verde y dnde se localizan. La tcnica del pseudocolor puede utilizarse tambin para clarificar o visualizar mejor una imagen. En la figura 4, aparece una imagen original y la misma imagen coloreada en S.6(a) y (c) con sus respectivos mapas de colores en (b) y (d) utilizando la tcnica del pseudocolor expuesta en el Captulo 5.

(a)

(b)

(c)

(d)

(e)

(f)

Figura 3 (a) Radiografa original; (b) histograma de la imagen original; (c) nueva imagen mediante modificacin de histograma (aumento de contraste y gamma); (d) histograma correspondiente a (c); (e) imagen binarizada a partir de (c); (f) imagen dilatada a partir de (e)

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 7

Figura 4 Imagen de grises, cuyo coloreado se muestra en S.6 as como sus respectivos mapas de colores. Hemos considerado algunos ejemplos elementales para el tratamiento de imgenes mdicas, si bien, resulta abundante la literatura en este campo, entre mltiples y diversas aplicaciones podemos mencionar las siguientes: El zoom permite ampliar detalles de la imagen que en una primera vista aparecen confusos Mediante sustraccin de imgenes se puede detectar el movimiento de un objeto, o la variacin de volumen por ejemplo en los movimientos de sstole y distole del corazn. Mediante reduccin de la escala de grises o binarizacin se puede eliminar de la imagen los niveles de gris que no interesen y dejar slo aquellas partes de inters, por ejemplo el resaltado de dientes en una radiografa (Umbaugh 1998). Mediante sustraccin se puede determinar la evolucin de un tinte que se inyecta en las venas tomando como referencia la imagen antes de la inyeccin (Gonzlez y Woods 1993) Coloreado de regiones de inters en una radiografa mediante tcnicas de pseudocolor (Umbaugh 1998). Obtencin del entramado de vasos capilares, o nervios en un determinado tejido mediante la extraccin de bordes (Gonzlez y Woods 1993). Deteccin de lesiones vasculares a partir de angiogramas renales (extensible a otros rganos) (Jaulent y col. 1997 y Jendrysik 1997). Diferenciar tejidos sanos de tejidos cancergenos o infectados por el color (Umbaugh 1998). Deteccin de cnceres de piel mediante tcnicas de color y extraccin de bordes (Xu y col. 1999).

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

Medida del grosor de venas y arterias (Wick y col. 1993, Chen y col. 1987, SchmidChoenbein y col. 1977). Deteccin de puntos de inters en una radiografa como precursores de la presencia de un tumor (Low 1991) o como puntos de referencia en ciertos rganos como el cerebro en Rohr (1999). Identificacin de un ndulo sospechoso en una mamografa por diferencia de contraste y textura en Trucco y Verri (1998). En neurologa para determinar el estado de enfermedad y el grado de deformacin de la materia gris del cerebro en enfermos epilpticos mediante el uso de contornos deformables (Schnabel y Arridge 1999, Gee 1999). Deteccin de costillas en radiografas mediante la transformada de Hough (Wechsler 1977). Deteccin de microcalcificaciones en mamografas mediante redes neuronales (Tsujii y col. 1999). Reconstruccin de arterias coronarias utilizando imgenes de angiogramas (Windyga y col. 1998). La diferencia de imgenes ha sido utilizada en la substraccin de angiogramas para estimar el movimiento de una vena o vaso capilar (Rong y col. 89, Abdel-Malek y col. 90). Movimiento de las paredes cardacas a partir de imgenes de Resonancia Magntica de las que se extraen puntos de inters sobre los que se establecen las correspondencias, mediante correlacin, entre las distintas imgenes de una secuencia de imgenes. Se determina el flujo ptico a travs de dichas correspondencias (Fisher y col. 1991). Otro mtodo de anlisis de movimiento para imgenes del corazn obtenidas mediante resonancia magntica se basa en la deteccin de bordes y la correspondencia de mscaras en las direcciones esperadas (Guttmann y Prince 1990). Los modelos deformables se han aplicado tambin al anlisis del movimiento 3D en imgenes de resonancia magntica del corazn (Young y Axel 1992). En Kambhamettu y Goldgof (1992) la estima de correspondencia de puntos en una superficie no rgida (rganos biolgicos) se basa en cambios de la curvatura Gaussiana. En Fernndez-Rodrguez y col. (1993) se presenta un sistema de redes neuronales para el diagnstico de carcinomas y neumonas en los pulmones mediante imgenes de radiografas del trax.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 9

Xin y col. (1996) presentan un mtodo para establecer correspondencias de contornos extrados de imgenes del corazn (ventrculos) y del cerebro, basado en el anlisis de curvas deformables. Las curvas deformables son tambin utilizadas en Knoll y col. (1999) para detectar contornos de la prstata y poder medir volmenes de la misma. Chen y col. (1999) detectan anomalas en el cerebro comparando las estructuras subyacentes con un cerebro de referencia contenido en una base de datos. Procesamiento de imgenes de Resonancia Magntica del cerebro humano (Pien y col. 1997). En Theodoridis y Koutroumbas (1999) se utilizan tcnicas de reconocimiento de patrones para detectar cirrosis e infiltraciones de grasa en el hgado.

IDENTIFICACIN DE CONSTRUCCIONES, INFRAESTRUCTURAS Y OBJETOS EN ESCENAS DE EXTERIOR

Mediante imgenes areas o de satlite se puede determinar la presencia de ciertas regiones a travs de la segmentacin de las mismas as como detectar la presencia de ciertas construcciones (edificios) o infraestructuras (carreteras, canales, puentes) a travs de tcnicas de extraccin de bordes o contornos combinadas con la segmentacin de regiones. Un ejemplo puede ser la reconstruccin de tejados de casas urbanas (por su estructura geomtrica mejor definida que los rurales) propuesto por Moons y col. (1998) por medio de relaciones topolgicas y geomtricas teniendo una base de datos de modelos a partir de los cuales se reconstruye el tejado que est siendo inspeccionado. Sobre la identificacin y extraccin de estructuras urbanas existen algunos trabajos en la literatura como por ejemplo Collins (1995), Fischer y col. (1998), Grn y col. (1995, 1997), Kim y Muller (1999), McGlone y Shuffelt (1994), Nevatia y col. (1997), Roux y Matre (1997). Otro ejemplo lo podemos encontrar en Kass y col. (1987) donde se describe la deteccin de carreteras mediante el procedimiento de contornos deformables. Tambin en Fischler y col. (1987) se presenta un mtodo de deteccin de carreteras. A modo de ejemplo, la transformada de Hough puede resultar de inters en determinadas aplicaciones en las que aparecen estructuras detectables por la misma, tal es el caso de la imagen de la figura S.35(a) en la que aparece una carretera con sus lneas blancas. En la figura 5(a) se ha obtenido una imagen de bordes mediante el

10

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

siguiente proceso: 1) conversin de la imagen a grises segn la tcnica descrita en el Captulo 5; 2) obtencin de una imagen binaria mediante umbral segn el Captulo 7 y 3) extraccin de las lneas mediante la aplicacin de las operaciones morfolgicas de apertura y cierre y un posterior XOR. Finalmente, las ecuaciones de las lneas rectas se obtienen por la transformada de Hough, descrita en el Captulo 8. Obsrvese la transformacin de perspectiva, que ayuda a identificar la estructura como una carretera en los procesos de reconocimiento posteriores. Por otro lado, en la figura S.35(b) se muestra un panel indicativo del punto kilomtrico y en la figura 5(b) la binarizacin de la imagen para la lectura de los caracteres de dicho punto, sealado por la flecha, mediante tcnicas de reconocimiento de caracteres. Mediante mtodos similares al ejemplo anterior o tcnicas de extraccin de las componentes de color, de acuerdo a lo visto en el Captulo 5, se puede deducir la presencia de diferentes parcelas sobre una determinada extensin de terreno. En este tipo de estructuras seran aplicables los operadores de texturas.

(a)

(b)

Figura 5 (a) Imagen de bordes obtenidos a partir de la imagen de la figura S.35(a) para la extraccin de las lneas mediante la transformada de Hough; (b) Imagen binaria obtenida a partir de la imagen de la figura S.35(b) para la identificacin del punto kilomtrico marcado por la flecha mediante tcnicas de reconocimiento de caracteres Los trabajos de Lotufo y col. (1990), Guiducci (1999) y Paetzold y Franke (2000) se enmarcan tambin dentro de la lnea de deteccin de carreteras y su reconstruccin 3D. En Vailaya y col. (1998) se presenta un mtodo para discernir entre imgenes urbanas y paisajes naturales, lo cual puede ser til por ejemplo para extraer imgenes de bases de datos grandes o para los buscadores de Internet. Utilizan para ello histogramas de color, la Transformada Discreta del Coseno, histogramas que contienen direcciones de los bordes. El color, por cierto, es un extraordinario atributo para la discriminacin en construcciones 3D (Henricsson 1998).

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 11

Batlle y col. (2000) presentan una revisin de mtodos y estrategias para extraer y reconocer objetos en escenas naturales mediante el color. Dichas estrategias comprenden diferentes enfoques: arriba-abajo, abajo-arriba e hbridos. Las 61 referencias citadas constituyen a su vez una buena fuente de documentacin. El color junto con la textura y los contornos deformables se ha utilizado para localizar objetos en Zhong y Jain (2000).

6 RECONOCIMIENTO Y CLASIFICACIN
Una posible aplicacin puede ser la clasificacin de objetos por su tamao y en su caso el recuento de los mismos, ver figura 6. Por ejemplo, para contar monedas en funcin del rea de la moneda, permetro o nmero de Euler tras el correspondiente proceso de binarizacin (Mil). En Cspedes y col. (1998) se muestra una tcnica para el reconocimiento de caras de personas mediante visin artificial utilizando perfiles de intensidad tal y como se describe ms adelante. En Intrator y col. (1996) se utilizan redes neuronales con el mismo fin, y en Kwon y Lobo (1999) se clasifican las edades a partir de imgenes de caras. Feng y Yuen (1998) reconocen ojos en caras humanas. Purnell y col. (1998) reconocen caras de entre un grupo de personas.

(a)

(b)

Figura 6 (a) Imagen original; (b) reas de las monedas originales En JIVA (1991) se propone un procedimiento de lectura automtica de datos del Documento Nacional de Identidad, as como reconocimiento de objetos basados en el color. El reconocimiento de huellas dactilares tambin es posible mediante visin, as en Capelli y col. (1999) se utiliza un conjunto de mscaras para obtener un vector numrico representando cada huella digital como un vector de atributos multidimensional, luego mediante optimizacin se realiza la clasificacin. Los trabajos de Caru y Jain (1996) y Kawagoe y Tojo (1984) tambin presentan mtodos de reconocimiento de huellas dactilares. IMAQ posee una aplicacin para leer displays LCDs reconociendo obviamente los caracteres que aparecen a pesar de la variacin de intensidad de la luz. Este mismo

12

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

paquete incluye la posibilidad de chequear la validez o no de una determinada etiqueta, en concreto en los disquetes de ordenador de alta densidad analiza la correcta grabacin de los caracteres HD incluso aunque el disquete se muestre ligeramente girado con relacin al modelo. IMAQ tambin posee un mdulo especfico de reconocimiento ptico de caracteres as como otro mdulo para leer la posicin de la aguja en un multmetro analgico. Quizs una de las reas de aplicacin ms importantes sea el Reconocimiento ptico de Caracteres (en ingls OCR). En Maravall (1993), JIVA (1991) o Lisa y col. (1993) se proporcionan los correspondientes ejemplos para la identificacin de matrculas de vehculos, que en el caso de Lisa y col. (1993) incluyen tcnicas de redes neuronales. En aplicaciones OCR es abundante la bibliografa existente al respecto, a continuacin citaremos una serie de trabajos, que pueden resultar de inters en este campo: Li y Xu (1992) que utilizan un clasificador basado en tcnicas de correlacin y utilizan los 7 momentos invariantes de Hu (1962) como caractersticas, al igual que Flusser y Suk (1993) o Wong y col. (1995). Chim y col. (1999) utilizan los momentos de Hu (1962), los momentos invariantes afines de Flusser y Suk (1993, 1994) y los momentos de Tsirikolias y Mertzios (1993). Mahmoud (1994) que usa descriptores de Fourier y cdigos del contorno de caracteres. En Lu y Shridhar (1996) se presenta una revisin de tcnicas para el reconocimiento de caracteres manuscritos. Las tcnicas de Learning Vector Quantization y Self-Organizing maps han sido utilizadas tambin en reconocimiento de caracteres manuscritos por Lee y Song (1994) y Chi y col. respectivamente. Waard (1995) propone un criterio de mnima distancia para el reconocimiento de caracteres manuscritos. Los trazos en los caracteres manuscritos son utilizados por Han y col. (1995) o Zou y Yan (1999) para su reconocimiento. Liang y col. (1994), mediante una nueva funcin de discriminacin, reconocen caracteres de documentos impresos. Kovacs (1995) propone un mtodo de reconocimiento estadstico para caracteres manuscritos. Rocha y Pavlidis (1994, 1995) y Nishida (1995) desarrollan un mtodo de descripciones estructurales de caracteres. Kanai y col. (1995) obtienen primero los prrafos o secciones de textos (por ejemplo de los peridicos) antes de proceder al reconocimiento. Cai y Liu (1999) integran informacin estadstica y estructural para el reconocimiento de nmeros manuscritos. Hussein y col. (1999) tambin reconocen caracteres manuscritos mediante tcnicas estructurales y Kato y col. (1999) mediante la distancia de Mahalanobis. Kim y col. (1996) utilizan sendas redes neuronales de Hopfield (discreta y continua) para el reconocimiento de objetos parcialmente ocludos mediante sus bordes, de utilidad en la inspeccin de equipajes en aeropuertos o aplicaciones militares.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 13

Del Bimbo y col. (1998) proporcionan un mtodo para mejorar la bsqueda en bases de datos en imgenes basndose en las caractersticas cromticas de las mismas, lo cual es til para el manejo de bases de datos grandes. Cantoni y col. (1997) o Reiss (1993) presentan diversas tcnicas para reconocimiento de objetos.

7 INSPECCIN Y CONTROL DE CALIDAD


La inspeccin de un objeto manufacturado puede tomar muchas formas, que podra involucrar las siguientes tareas: a) verificar la presencia de cada caracterstica esperada b) verificar las dimensiones de esas caractersticas (por ejemplo radio y longitud de un cilindro) c) verificar las interrelaciones entre caractersticas (por ejemplo distancias entre centros de gravedad y ngulos entre planos). La inspeccin en el sentido ms amplio se refiere a la verificacin de si un objeto cumple con determinados criterios. Esto implica comparar el objeto con algn objeto modelo que describe las caractersticas relevantes del objeto. Para muchos tipos de datos existen tolerancias definidas dentro de las cuales las medidas realizadas pueden considerarse como aceptables. Abordaremos en primer lugar el problema de la inspeccin geomtrica para posteriormente tratar otros tipos de inspeccin. Un tratamiento ms exhaustivo de todos estos aspectos se pueden encontrar en Marshall y Martin (1992), Davies (1997), Demant y col. (1999) o Soloman (2000). Marshall y Martin (1992) constituye una buena referencia para procesos de inspeccin visual automatizada con abundantes detalles en cuanto a mtodos y procedimientos, que en realidad son los expuestos a lo largo de este libro, si bien, desde una perspectiva detallada de anlisis de errores y mtodos muy especficos para aplicaciones muy concretas. Una de las finalidades de los controles de calidad consiste en detener la produccin de algn producto si el sistema de produccin comienza a generar productos que no cumplen con las normas estndares generales. Imaginemos que para la fabricacin de galletas se exige que las mismas tengan un tamao con unos mrgenes de confianza, mediante la segmentacin de la misma se determina el rea, pero si adems es preciso que la forma sea circular, la transformada de Hough nos facilita el cumplimiento de dicho requisito.

14

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

7.1 La inspeccin geomtrica


Ciertos procesos industriales de produccin requieren que los productos manufacturados sean inspeccionados para asegurar que algunas medidas de calidad y fiabilidad se cumplen. El proceso de inspeccin, dependiendo de lo que se quiera inspeccionar puede ser complejo, por lo que en ocasiones ser necesario reducir costos de tiempo y dinero (Batchelor y col. 1985). Existen las denominadas mquinas de medidas de coordenadas, basadas en sensores tctiles que requieren una reprogramacin para cada objeto, ambos problemas a veces hacen que estas mquinas no se puedan usar en la realidad (Reinshaw, 1991). En la actualidad existen sistemas de inspeccin basados en visin industrial para inspeccin en dos dimensiones tales como inspeccin de circuitos impresos por ejemplo Batchelor y col. (1985). Sin embargo, son pocos los que abordan la inspeccin de objetos tridimensionales. En cualquier caso las ventajas de un sistema de inspeccin visual son las siguientes: Flexibilidad, cualquier tipo de objetos puede ser inspeccionado al tratarse de un sistema pasivo y no interactuar con los objetos a inspeccionar; Velocidad, determinada por el procesamiento interno, sin necesidad de tener que colocar y tocar el objeto; Registro automtico de los datos, etc. No obstante, algunas desventajas seran que las partes no visibles no se pueden inspeccionar y la resolucin del sistema en cuanto al nmero de pxeles y calibracin efectuada, que a veces puede impedir la inspeccin de determinadas anomalas o elementos de dimensin reducida. Los requisitos que se le exigen a cualquier sistema de inspeccin basado en visin son los siguientes: flexibilidad, para poder inspeccionar cualquier tipo de objetos; resolucin, debe ser capaz de proporcionar medidas que sean suficientemente precisas para poder establecer si los objetos inspeccionados estn dentro de tolerancia; resolucin espacial, para decidir si las caractersticas inspeccionadas estn posicionadas y orientadas con la precisin adecuada con respecto a algn sistema de referencia; fcil de usar, para facilitar su versatilidad y fcil manipulacin. A partir del estudio previo realizado en los captulos anteriores es evidente que muchas de las tcnicas desarrolladas en ellos no satisfacen los anteriores requisitos. Por ejemplo, los mtodos basados en la forma a partir de la tonalidad no son apropiados para inspeccin por las siguientes razones: a) son demasiado sensibles a los pequeos cambios de iluminacin y a la reflectancia de las superficies b) slo trabajan bien en superficies con textura uniforme c) es difcil deducir las profundidades absolutas de los puntos, y solamente la orientacin de la superficie o curvatura se puede deducir.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 15

d) la resolucin de profundidad o tercera dimensin obtenida resulta generalmente insuficiente. Las tcnicas pasivas de visin estereoscpica requieren la determinacin de la correspondencia de caractersticas bidimensionales en cada una de las dos imgenes. Esto necesita la extraccin fiable de esas caractersticas a partir de dos imgenes bidimensionales separadas y luego establecer la correspondencia de las caractersticas entre imgenes, para finalmente deducir la tercera dimensin. Cuando las caractersticas son bordes o regiones el mapa 3D obtenido no es suficientemente denso. Marshall y Martin (1992) proponen un sistema de visin estereoscpica activa como se ilustra en la figura 7. El sistema consta de un par de cmaras y un lser montadas sobre un banco para reducir las vibraciones junto con un espejo. Las cmaras estn montadas en un sistema giratorio de rotacin independiente. El espejo se mueve para que genere un barrido vertical del objeto y se proyecte su imagen en ambas cmaras adems de barrer el objeto. El sistema completo es controlado por un computador que adems tiene acceso a la base de datos donde se encuentran los modelos geomtricos. El procedimiento establece las correspondencias de forma muy precisa y con ellas reconstruye el objeto 3D deseado para ser comparado con los modelos. Al obtener los valores de profundidad se cometen ciertos errores que es preciso evaluar (Marshall y Martin 1992).

Espejo Objeto

Direccin del lser Cmara en plataforma giratoria

Plataforma giratoria

Figura 7 Diagrama esquemtico del sistema de visin para inspeccin En primer lugar, es necesario considerar los efectos de la cuantizacin espacial. La posicin (x,y) de un punto tiene inexactitudes, que surgen del sistema ptico. Un valor de z en el mapa de profundidad que supuestamente corresponde a una posicin (x,y) puede realmente corresponderse con una posicin que realmente difiere en unas pocas dcimas de pxeles de la posicin correcta, por ejemplo 0.2 como se indica en Marshall y Martin (1992). A este resultado llegan a travs de las diferencias observadas en los mapas de profundidad a partir de configuraciones del sistema idnticas. Este error depende de muchas cosas, incluyendo las propiedades de reflectancia de los objetos, las

16

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

propiedades pticas de las lentes y cmaras y la resolucin del CCD. Tambin depende de la distancia del sistema de visin al objeto como se explicar seguidamente. Aparece un rea de incertidumbre en la localizacin precisa de los puntos, como se ilustra en la figura 8.

E je p tic o 1 z

E je p tic o 2

d C m a ra 1 A re a d e In c e rtid u m b re C m a ra 2

Figura 8 Error en la medida de la profundidad de un punto utilizando visin estereoscpica Tanto la resolucin de profundidad y angular pueden evaluarse fcilmente considerando los siguientes parmetros:

: campo de vista de las cmaras en radianes


n : nmero de puntos evaluables a travs del campo de vista d : separacin de las cmaras en metros

: ngulo entre el eje ptico y los puntos de la imagen en radianes


z : profundidad en metros

: resolucin angular de la cmara z : resolucin de profundidad


La resolucin angular puede expresarse como (Marshall y Martin 1992),

tan = 0.5tan 1 n
mientras la resolucin en profundidad se puede demostrar que es (Hutber 1987)

z =

2 z 2 tan 2 d tan + tan + 1 d z

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 17

por tanto, la incertidumbre en la medida de profundidad z es proporcional al valor de z al cuadrado, e inversamente proporcional a la separacin de las cmaras. A modo orientativo, con valores tpicos el sistema de Marshall y Martin (1992) obtiene los siguientes resultados,

: 0.08 radianes
n : 512 x 5 = 2560 d : 0.3 m

: 0.0 radianes
z : 0.7 m

: 4.9 x 10-5 radianes z : 0.052mm

7.2 Tolerancias en la inspeccin


En inspeccin visual geomtrica resulta del mximo inters considerar el hecho de que los objetos geomtricos a inspeccionar van a admitir una serie de valores de tolerancia en las correspondientes medidas de los elementos geomtricos que los componen. Un estudio detallado con abundantes fuentes de referencia lo constituye el libro de Marshall y Martin (1992). En JIVA (1991) se present un sistema de control dimensional de elementos alargados. En IMAQ se muestra un ejemplo de inspeccin de acabado de conectores de fuentes de alimentacin, donde debe aparecer un contorno de borde dentro de los lmites de una circunferencia previamente especificada con la protuberancia del conector tambin dentro de los lmites establecidos. En la figura 9 a) y (c) se muestran dos imgenes de un conector de fibra ptica en diferentes posiciones giradas. El objetivo consiste en detectar la presencia de los cinco orificios de conexin y que se siten entre s a las distancias especificadas. En la figura 9(b) y (d) se muestran las correspondientes imgenes binarizadas por el mtodo del umbral descrito en el Captulo 7, de dichas regiones se extraen las siguientes propiedades: rea, compacidad y nmero de Euler para determinar la calidad de los orificios, as como la posicin del centro de gravedad para establecer las medidas de distancias entre ellos. Con ello se pretende identificar y verificar la correcta fabricacin de estos conectores independientemente de su posicin, obviamente manteniendo la misma perspectiva y escalado, es decir la misma posicin relativa de la cmara respecto del conector.

18

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

7.3 Acabado de superficies y deteccin de imperfecciones


En muchos casos resulta ms fcil inspeccionar objetos utilizando un perfil o una serie de perfiles de las diferentes vistas del objeto. En este caso, los problemas de adquisicin tridimensional son eliminados y las medidas se hacen con referencia a los datos bidimensionales. Por ello hay que tener especial cuidado en que la posicin de la cmara y las condiciones de iluminacin sean idnticas con el fin de que las vistas del objeto inspeccionado sean las mismas en cada imagen. En cuanto a la posicin de la cmara habr que especificar por ejemplo que la lnea de vista sea perpendicular al rea de inters, o paralela o perpendicular a algn eje de simetra del objeto. La eleccin de las condiciones de iluminacin es tambin determinante, ya que en caso contrario pueden aparecer efectos no deseados tales como sombras y reflejos. El libro de Batchelor y col. (1985) trata en profundidad estas cuestiones.

(a)

(b)

(c)

(d)

Figura 9 (a) y (c) El mismo conector de fibra ptica en dos posiciones diferentes; (b) y (d) orificios de insercin de los hilos del cable extrados mediante binarizacin En cualquier caso, la inspeccin requiere comparar un modelo ideal con el que est siendo inspeccionado.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 19

El acabado de una superficie puede determinarse mediante descripciones tales como: spera, ondulada, granulada o rayada por ejemplo. Para llevar a cabo esta tarea es necesario conocer la fuente de luz que se utiliza para iluminar la superficie de forma que la cmara reciba la luz reflejada de la superficie. Muchas tcnicas se han aplicado para la inspeccin del acabado de superficies usando mtodos similares a los discutidos para la obtencin de la forma, por ejemplo Mundy (1982). Muchas propiedades del acabado de superficies estn relacionadas con la textura de las superficies, que se estudi en el Captulo 9. Weszka y Rosendfeld (1976) han identificado un cierto nmero de propiedades de texturas relacionadas con el acabado de las superficies. Don y col. (1984) clasifican las superficies de los metales en seis categoras diferentes utilizando textura. No obstante, es difcil medir el acabado de superficies visualmente debido a las pequeas dimensiones de las caractersticas de las superficies que afectan a su acabado. Generalmente, esta tarea requiere la ayuda de instrumentos de alta precisin tales como aquellos que obtienen el perfil mediante un sistema de agujas recorriendo las superficies en lneas (a veces presionan a la superficie y pueden alterar sus propiedades). Una alternativa consiste en usar un microscopio de seccin de luz. En lugar de tratar de medir el acabado de las superficies, resulta ms comn en sistemas de inspeccin visual detectar defectos de las superficies. Esta tarea es mucho ms fcil y est basada en la deteccin de algn cambio significativo en las caractersticas de la superficie. Para desarrollar esta tarea se han propuesto muchos sistemas (Batchelor y col. 1985, Brook, 1971, Jain y Jain 1990, Mundy, 1982). Estos sistemas a menudo obtienen ciertas medidas a partir de una secuencia de pxeles a lo largo de la superficie y determinan un cambio o desviacin en la secuencia. A modo de ejemplo durante el precintado de las botellas de vino se producen ciertas anomalas en el precinto, si se dispone de un modelo como es el caso de la figura 10(a), podemos comparar el correcto precintado con cualquier anomala presentada en esta fase, ver figura 10(b). El procedimiento consiste en comparar sendos perfiles de intensidad horizontal del modelo y de la imagen con la superficie supuestamente deteriorada. Previamente para facilitar el proceso se puede convertir la imagen de color a imagen de grises. En (c) se muestra el perfil de intensidad correspondiente a la misma lnea que aparece en (b) pero relativa a la imagen (a). En (d) aparece el perfil de la imagen con la superficie deteriorada. Ambos perfiles son diferentes debido a la anomala.

20

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

(a)

(b)

(c)

(d)

Figura 10 (a) Imagen original modelo; (b) imagen deteriorada; (c) perfil de intensidad de (a) a lo largo de la lnea horizontal a la misma altura que en (b); (d) perfil de intensidad a lo largo de la lnea horizontal marcada en (b). Obsrvese la diferencia del perfil en la zona deteriorada de (b) con respecto al modelo

7.4 Inspeccin en tarjetas de circuitos impresos


Existen muchos aspectos diferentes en el proceso de fabricacin de circuitos impresos que requieren inspeccin. Por ejemplo, es necesario: a) verificar que los componentes han sido colocados en sus lugares correctos b) chequear las pistas para verificar cualquier ruptura c) componentes inclinados sobre la tarjeta d) chequear soldaduras incorrectas Las tcnicas expuestas en la seccin anterior para la deteccin de anomalas en superficies son aplicables para resolver los dos primeros problemas. En cualquier caso, tanto la verificacin de componentes como la deteccin de elementos inclinados supone una comparacin entre un modelo y la tarjeta inspeccionada. Ms detalles de las tareas implicadas en estos procesos se pueden encontrar en Chin y Harlow (1982), Kaufmann y col. (1984), Capson y Eng (1988), Batchelor y col. (1985) o Bretschi (1981).

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 21

En la figura 11(a) y (b) se muestran sendas imgenes de dos circuitos impresos diferentes mientras que en (c) y (d) aparecen los perfiles de intensidad correspondientes a sendas lneas verticales. Obsrvese la diferencia en los perfiles obtenidos, lo que nos permite deducir claramente que las dos tarjetas son diferentes (en lo que se refiere a dicho perfil). Una exploracin ms exhaustiva nos llevara a la misma conclusin para diferentes lneas de exploracin. Para deducir su semejanza deberamos obtener perfiles de intensidad similares. Esta tcnica tambin nos proporciona la posibilidad de determinar si todos los componentes han sido instalados, sin ms que conocer el perfil o perfiles correspondientes a una instalacin apropiada. Como tcnica adicional, se puede obtener la diferencia entre ambas imgenes, de forma que si ambas tarjetas son iguales la imagen de diferencias sera nula (imagen negra) cosa que no ocurre en el ejemplo, como se puede apreciar en la figura 11(e). Es absolutamente imprescindible que las condiciones de iluminacin y posicionamiento sean idnticas en la captura de las imgenes. Tambin puede, en ocasiones, ser necesario tomar algn punto de referencia fcilmente reconocible a partir del cual obtener el perfil correspondiente. El chequeo para la deteccin de rupturas en circuitos impresos se realiza antes de la insercin de los componentes, pero los chequeos para la deteccin de cortocircuitos o circuitos abiertos debidos a soldaduras incorrectas debe chequearse despus de colocar y soldar los componentes. No obstante, los procesos bsicos para detectar dichos defectos son similares. De nuevo, las tcnicas estn basadas en la sustraccin de una imagen ideal y la imagen bajo inspeccin. Claramente, las imgenes deben ser previamente alineadas y las condiciones de iluminacin y posicin de la cmara consideradas, como ya se ha mencionado anteriormente. Esto puede lograrse estableciendo la correspondencia entre caractersticas de ambas imgenes, mediante las tcnicas de correlacin estudiadas en el Captulo 17. Alternativamente, la tarjeta se puede colocar en cualquier dispositivo que permita su alineamiento. Algunos mtodos que emplean estas tcnicas pueden encontrarse en Chin y Harlow (1982) o Bretschi (1981). La inspeccin de soldaduras en circuitos impresos presenta un conjunto de problemas no relacionados con los descritos anteriormente. Muchos investigadores han tratado este problema (Besl y col., 1985, Chin y Harlow, 1982, McIntosh 1984, Nakagawa 1982, Seah y Lea 1985, Kim y col. 1999). A veces, debido a la invisibilidad, es necesario recurrir a rayos-X para hacer visible la soldadura, tal es el caso de Seah y Lea (1985).

22

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

(a)

(b)

(c)

(d)

(e) Figura 11 (a) y (b) Imgenes originales; (c) y (d) perfiles correspondientes a las lneas verticales marcadas; (e) diferencia entre las dos imgenes originales Nakagawa (1982) utiliza luz estructurada proyectando un haz de luz sobre la soldadura y midiendo su perfil. No obstante, la luz reflejada de ciertos tipos de soldadura puede originar problemas en la obtencin de imgenes claras. McIntosh (1984) sugiri el uso de luz coloreada aunque a veces la percepcin de los colores para diferentes imgenes puede ser diferente. Capson y Eng (1988) utilizaron luz coloreada por capas, en realidad dos anillos de luz fluorescente de forma que sus centros caen en el mismo eje, uno que emite luz roja y el otro azul.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 23

Es posible tener como referencia un determinado modelo para luego detectar mediante correlacin la presencia del mismo en un conjunto ms amplio, por ejemplo en relacin con la imagen de la figura 11(a) podemos tener almacenado el patrn dado en 12, que nos permitir detectar si dicho componente se ha instalado o no en la tarjeta (Mil, IMAQ).

Figura 12 Modelo de componente electrnico Cootes y col. (1995) proponen un modelo deformable para analizar la presencia de resistores en tarjetas electrnicas, aunque los contornos de los mismos tras su extraccin se presenten deformados.

7.5 Inspeccin en las industrias de alimentacin y agricultura


Son dos reas en las que se pueden aplicar tcnicas de inspeccin visual, pero la naturaleza no determinista de sus productos hace que esta tcnica sea difcil. El manejo de ciertos productos comestibles exige que los mismos necesiten un proceso de inspeccin ya que pueden daarse o contaminarse. Se pueden mencionar algunas aplicaciones en este campo, como por ejemplo: calidad del algodn, calidad de las frutas, inspeccin de rboles, crecimiento de plantas, etc. Como puede observarse, el rango de productos es inmenso, no obstante la fuente de problemas puede dividirse en dos categoras: a) defectos de produccin y b) impurezas no deseadas Los defectos de produccin pueden provenir de muchas fuentes, incluyendo los equipos no fiables o defectuosos, mezcla errnea de ingredientes en los productos preparados, proceso de manufactura incorrecto tales como tiempo y temperatura de preparacin incorrectos, empaquetado defectuoso. Los defectos de este tipo pueden deteriorar los productos finales, por ejemplo: a) una estructura deformada o dimensin incorrecta b) textura externa incorrecta

24

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

c) textura interna incorrecta (tales como burbujas) d) color inapropiado Un problema adicional consiste en cuantificar lo que realmente constituye un defecto particular. Por tanto habr que proceder previamente a determinar lo que se puede considerar un defecto. Por ejemplo considerar una barra de pan, se pueden determinar dos criterios para pasar la inspeccin: es satisfactoria la forma ha sido cocida correctamente Los dos criterios son subjetivos y depender de las preferencias del panadero. Las medidas de forma de la barra pueden determinarse por tcnicas bi o tridimensionales. Se puede determinar el grado de coccin examinando el color de la corteza bajo condiciones de luz controladas. Otro ejemplo puede ser la deteccin de fisuras o grietas en ciertos productos terminados, cuya deteccin se puede llevar a cabo como en el mtodo expuesto en la figura 10. La apariencia de los productos es tambin importante, en cuyo caso los mtodos de textura pueden ser interesantes para su deteccin (Chan y col. 1990). Otro ejemplo podra ser el control del nivel de tostado de galletas en hornos industriales, cuando las galletas salen del horno son segmentadas en regiones mediante un proceso de binarizacin y tras una serie de operaciones morfolgicas se afinan los contornos de las regiones. Una vez extradas las regiones se procede a analizar el nivel promedio de gris de las regiones, que es indicativo del tostado final (Fuente y col. 1998). En IMAQ se muestra un ejemplo de deteccin del nivel de llenado de una botella de lquido teniendo como referencia un determinado nivel de referencia. La deteccin de cuerpos extraos en los alimentos constituye otro de los campos de aplicacin, ya que contribuyen a la credibilidad y buena imagen del producto. Batchelor y col. (1985) han presentado algunas tcnicas de aplicacin en este aspecto. Algunas manifestaciones de esto son: la presencia de huesos en filetes que deberan estar deshuesados, o espinas en el pescado que debera manifestarse limpio, insectos en las verduras, pelos del operario, etc. Algunas impurezas necesitan ser detectadas mediante Rayos-X (Chan y col. 1990). Las tcnicas a utilizar son diversas y varan dependiendo de la naturaleza de la inspeccin, por ejemplo, tcnicas de color, de nivel de gris, texturas, etc.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 25

La calidad del producto final tambin puede cuantificarse mediante tcnicas de inspeccin visual. Por ejemplo, el contenido y distribucin de grasa intramuscular es un factor determinante de la calidad del jamn ibrico. Las medidas qumicas clsicas determinan el contenido pero no la distribucin, mediante visin se puede encontrar una relacin entre ambas (Plaza y col. 1998, Durn y col. 1998). Esta tarea se lleva a cabo mediante tcnicas de binarizacin, operaciones morfolgicas y crecimiento de regiones. En JIVA (1991) se proporciona una tcnica de tratamiento de imgenes en color en la manipulacin de carne. Jimnez y col. (1999) presentan un sistema automtico para el reconocimiento de frutas incluso en situaciones complicadas, tales como con la presencia de sombras, reas brillantes, oclusiones, solapamientos. Se presenta adems una revisin de tcnicas en esta misma lnea. En Keller y col. (1990) encontramos un sistema para identificar filetes de vaca mediante tcnicas de color y razonamiento aproximado.

7.6 Inspeccin en el envasado de productos


En IMAQ se muestra un ejemplo para detectar si un determinado envase de cpsulas de farmacia ha sido correctamente rellenado con las cpsulas correctas identificadas por su color, tamao y forma y adems que todos los compartimentos poseen una cpsula. Por ejemplo, en S.36(a) se muestra un envase en el que falta una grajea en la parte inferior izquierda, lo cual se detectara por la ausencia del color rojo y amarillo, que aparecen en las celdas correctas. Incluso podra detectarse la correcta colocacin suponiendo que el rojo se situara siempre a la derecha del amarillo, si se asume esto, el envasado en este caso sera incorrecto. En la imagen de la figura S.36(b) todas las grageas estn correctas, lo cual se puede determinar tanto por su color rojo como por su forma circular, lo que impedira que se introdujeran grageas o cuerpos ajenos y extraos en los correspondientes compartimentos. Si fuera necesario, se podra detectar fcilmente el tamao de las grageas mediante la extraccin de regiones coloreadas. La lectura e interpretacin del cdigo de barras de los productos manufacturados. Aunque esto es una tcnica muy utilizada en la industria mediante lectores pticos, en IMAQ se muestra un mdulo de lectura de cdigo de barras mediante visin artificial.

7.7 Inspeccin en la industria textil


Bahlmann y col. (1999) presentan un mtodo para determinar la calidad de las costuras en las prendas utilizando un extractor de bordes y la transformada de Hough

26

VISIN POR COMPUTADOR: IMGENES DIGITALES Y APLICACIONES

RA-MA

mediante el uso de una red neuronal basada en el Self-Organizing Feature Map. El trabajo de Dorrity (1995) es precursor en esta lnea. Latif-Amet y col. (2000) utilizan texturas, en concreto las matrices de coocurrencia del nivel de gris para detectar defectos en tejidos.

7.8 Inspeccin bajo el agua


En Elnagar y Basu (1998) se propone un trabajo para la inspeccin de objetos bajo el agua, es el caso de cascos de buques, plataformas petrolferas, etc. El mtodo consiste en tomar una secuencia de imgenes para con ellas realizar una reconstruccin 3D a partir de la cual obtener la superficie del objeto para despus ser analizada convenientemente.

7.9 Inspeccin de formas geomtricas bsicas


Mediante la transformada de Fourier es posible la deteccin de figuras elementales bsicas: tringulos, rectngulos, etc. tal y como se describe en el Captulo 2, ver figura 2.10, al margen obviamente de las tcnicas basadas en la transformada de Hough. Igualmente es posible inspeccionar formas circulares mediante el uso de histogramas radiales. Este concepto fue introducido por Davies (1997) y obtiene un histograma de intensidad como una funcin de la distancia radial del centro del objeto que est siendo inspeccionado.

8 CARTOGRAFA
Mediante el uso de imgenes estereoscpicas areas o de satlite es posible obtener las elevaciones del terreno con los procedimientos descritos en el Captulo 17, fundamentalmente a travs de tcnicas de correspondencia basadas en el rea. Por otro lado, de cara a la elaboracin de los catastros, particularmente en las zonas rurales, la utilizacin de imgenes areas permiten una fcil identificacin de las diferentes parcelas y sus delimitaciones tras el correspondiente tratamiento de las imgenes mediante tcnicas de extraccin de bordes y regiones, as como sus descripciones tal y como se ha visto a lo largo de los captulos 6 a 9. Si los sensores que captan las imgenes estn perfectamente calibrados se puede llegar a determinar la superficie real de las parcelas basndose en el rea de las imgenes medida en pxeles, simplemente aplicando la correspondiente funcin de transformacin.

RA-MA

APLICACIONES DE LA VISIN ARTIFICIAL 27

9 FOTOINTERPRETACIN
La fotointerpretacin es la ciencia que trata del anlisis de las imgenes por parte de un experto para extraer de ellas la informacin de inters o relevante, por ejemplo, ver las construcciones existentes en una determinada imagen de satlite o una imagen area. Cuanto mejor sea la calidad de la imagen mejor ser el resultado del anlisis. Por ello las imgenes pueden ser tratadas con todas las tcnicas encaminadas a mejorar la calidad de la imagen y que se han expuesto a lo largo de este libro, por ejemplo realzado en el Captulo 4 y restauracin de imgenes (Captulos 21 y 22). Adems, puede ocurrir que se desee obtener una imagen en color por combinacin de las bandas roja, verde y azul procedentes de un sensor multiespectral de satlite, en este caso se puede recurrir a las tcnicas expuestas en el Captulo 5. El uso de las wavelets descritas en el Captulo 2 resultan de inters para la fusin de imgenes de diferente resolucin, en efecto, en Garguet-Duport y col. (1996) se describe un procedimiento de fusin que consiste en partir de dos imgenes, una de doble resolucin espacial que la otra, y la de doble resolucin se descompone en las cuatro subimgenes descritas en el Captulo 2 mediante la TDW; a continuacin se obtiene una nueva imagen mediante la transformada inversa de wavelets, pero sustituyendo la subimagen resultante del filtrado Paso Bajo/Paso Bajo por la original de menor resolucin. Para la fusin de imgenes en fotointerpretacin se puede utilizar el procedimiento de componentes principales descrito en el Captulo 2. Adems suele ser til la deteccin de cambios en una zona en diferentes instantes de tiempo. Esta aplicacin resulta de gran utilidad para la deteccin de zonas deforestadas, incendios, inundaciones, variacin de la edificacin, etc. Para ello se pueden utilizar por ejemplo imgenes areas o de satlite captadas en diferentes instantes de tiempo sobre las que se pueden aplicar diversas tcnicas, entre las que citamos las siguientes (Jensen 1982): a) una simple diferencia de imgenes como se explic en el Captulo 12; b) clculo del cociente entre los valores de los pxeles de dos imgenes de diferentes fechas; c) comparacin de las clasificaciones obtenidas en las diferentes imgenes con las tcnicas descritas en los captulos 13, 14 y 15; d) comparacin de texturas mediante las tcnicas descritas en el Captulo 9; e) mediante tcnicas de anlisis de componentes principales como se describe en el Captulo 2 para determinar mediante el uso de autovalores y autovectores la diferencia entre imgenes de diferentes instantes de tiempo; f) anlisis de cambio vectorial, se pueden medir dos variables (vector bidimensional) en los diferentes instantes de tiempo para detectar el ngulo y magnitud del cambio cuando esas variables se representan en un sistema de ejes cartesianos.

Vous aimerez peut-être aussi