CAPITULO 1 Daniado

CAPITULO 1 INTRODUCCION 1.2.
REPRESENTACION DIGITAL DE IMAGENES El termino imagen monocroma o simplemente imagen se refiere a uan funcion bidimensional de intensidad de luz f(x,y), donde x e y representa las coordenadas espaciales y el valor de f en un punto cualquiera (x,y) es proporcinal al brillo (o nivel de gris) de la imagen en ese punto. Una imagen digital es una imagen f(x,y) que se ha discretizadotanto en coordenadas espaciales como en el brillo. Una imagen digital puede considerarse como una matriz cuyos indices de fila y columna identifican un punto de la imagen y el valor del correspondiente elemento de la matriz indica el nivel de gris en ese punto. Los elemntos de una distribucin digital de este tipo se denominan lementos de la imagen, o mas comnmente pixels o pels, abreviaturas de su denominacin inglesa picture elements. 1.3. ETAPAS FUNDAMENTALES DEL PROCESAMIENTO DE IMGENES. Adquisicin de imagen. Es decir adquisicin de una imagen digital para ello se necesita un sensor de imagen y la posibilidad de digitalizar la seak producida por el sensor. Puede ser una camara de TV, fotogrfica, monocroma o color. Procesamiento. Su funcion es la de mejorar la imagen de forma que se aumenta las posibilidades de xito en los procesos posteriores. Segmentacin. Conssite en partir una imagen de entrada en sus partes constituyentes u objetos. En general la segmentacin autonoma es una de las labores mas difciles del tratamiento digital de imgenes. La descripcion. Tambien denominada seleccin de rasgos, consiste en extraer rasgos con alguna informacin cuantitativa de interes o que sean fundamentales para diferenciar una clase de objetos de otra. Reconocimiento e interpretacin. El reconocimiento es el preceso que asigna una etiqueta a un objeto basandose en la informacin proporcionada por sus descriptores. Interpretacin implica asignar significado a un conjunto de objetos reconocidos. Etapas fundamentales del procesamiento digital de imgenes.
1.4. ELEMENTOS DE LOS SISTEMAS DE PROCESAMIENTO DIGITAL DE IMGENES. 1.4.1. adquisiciond e imgenes. Para la adquisiciond e imgenes se necesita de dos elemntos, el primero es un dispositivo fisico sensible a una determinada banda de espectros de energa electromagnetica (como las bandas de rayos X, ultravioleta, visible o infrarojo) y que produzca una seal electrica de salida proporcional al nivel de energa detectado. El segundo el denominado digitalizador, es un dispositivo para convertir la seal de salida del sistema sensible a forma digital. 1.4.2. Almacenamiento El almacenamiento digital para palicaciones de procesamiento de imgenes cae de lleno en tres categoras basicas: 1) almacenamiento a corto plazo, para ser empleado durante el procesamiento. 2) Almacenamiento en linea, para una reutilizacion relativamente rpida. 3) Almacenamiento en archivo. Caracterizado por un acceso poco frecuente. El tamao de informacin almacenada se mide en bytes (8 bits), Kbytes (kilobytes, o miles de bytes), Mbytes (megabytes, o millones de bytes), Gbytes (gigabytes, o miles de millones de bytes), y Tbytes (terabytes, o billones de bytes). 1.4.3. Procesamiento. El tratamiento de imgenes digitales emplica procedimientos que normalmente se expresan en forma de algoritmos. As, con la excepcin de la adquisicin de las imgenes y su representacin, la mayor parte de las funciones de tratamiento de imgenes pueden ser implementadas en sofware. la unica razon de ser del hardware especialmente en el procesamiento de imgenes es la necesidad de mayor velocidad en algunas aplicaciones para evitar algunas limitaciones fundamentalmente de las computadoras. 1.4.4. comunicacin. La comunicacin en el tratamiento digital implica principalmente, comunicaciones locales entre sistemas dde procesamiento de imgenes y comunicaciones remotas entre dos puntos habitualmente para la transmisin de los datos de las imgenes. El hardware y el sofware para comunicacin local que existe en la actualidad es de fcil acceso para la mayora de las computadoras. 1.4.5 Presentacion. Los monitores de televicion monocromo y de color son los principales dispositivos de presentacion utilizados en los sistemas modernos de procesamiento de imgenes.los monitores estan gobernados por la salida de una placa de hardware de visualizacion de imgenes; otros medios de visualizacion incluyen los tubos de rayos catodicos de acceso aleatorio (CRT)y los dispsitivos de impresin.
CAPITULO 2 FUNDAMENTOS DE LA IMAGEN DIGITAL 2.1. ELEMENTOS DE LA PERCEPCIN VISUAL. 2.1.1 el ojo humano. Es casi esferico con un dimetro de 2mm rodeado por: Tres membranas a) La cornea: es transparente cubre la parte anterior del ojo; y la esclerotica: que la continua es opaca y cubre la parte posterior q resta del ojo. b) La coroides: esta debajo de la esclerotica, esta constituida por venas que nutren al ojo con proteinas. c) Retina: es la membrana que cubre la parte posterior total del ojo, y contiens a los conos 6 a 7 millones por ojo ubicados en la foveay 75 a 150 millones de bastones que estan en la retina. El cristalino Iris o diafragma. Cuerpo ciliar Pupila (color de ojos) 2.1.2 Formacion de la imagen: El cristalino es una lente flexible que puede cambiar su dimetro segn la tencion de los cuerpos filiares, si se aprecia un objeto distantes la fibras se tensan haciendo q el cristalino redusca su dimetro. Lo contrario para ver objetos cercanos. La percepcin visual tiene lugar por la exitacion relativa de las celular fotosensibles (conos y bastones)que transforman la energa radiante en impulsos elctricos que luego seran decodificados por el cerebro.
2.1.3 Adaptacin a la iluminacin y discriminacin: El rango de niveles de luz a los q es capas de adaptarse el sistema visual humano es enorme del orden de 1010 desde el umbral escotopico hasta el limite de deslumbramiento muchas evidencias experimentales indican que la iluminacin subjetiva (iluminacin persivida por el sistema humano) es una funcion logaritminca de la intensidad de la luz incidente sobre el ojo. La capacidad de ojo de discriminar entre cambios de iluminacin para cada nivel especifico de adaptacin tambien es de considerable interes. un experimento clasico utilizado para determinar la capacidad del sistema visual humano de discriminar la iluminacin consiste en en colocar un objeto observando un area palana, uniformemente iluminada, lo suficientemente grande para q ocupe todo el campo visula. El area es habitualmente simple difusor d, tal como un vidrio esmerilado, que se ilumina desde atrs con una fuente de luz cuya intensidad I, puede variarse. A este campo se aade un incremento de iluminacin, I, en forma de destello de corta duracion que aparece como un circulo. si I no es suficientemente brillante, el sujeto debe decir no indicando q no persive el cambio. Conferme aumenta, el sujeto puede dar respuesta positiva si indicando q ha persivido el cambio. Esto determinara una discriminacin de la iluminacin. 2.2 UN MODELO DE IMAGEN SIMPLE. El termino imagen se refiere a una funcion bidimensionalmente de la luz y la intensidad, a la que indicamos f(x,y) donde el valor o amplitud de f en las coordenadas espaciales (x,y) de la intensidad (iluminacin) de la imagen en este punto. Puesto que la luz es una forma de energa, f(x,y) de be de ser estrictamente mayor que cero y finita, es decir. 0<f(x,y)< Las imgenes que se se perciben en las actividades visuales cotidianas provienen normalmente de la luz reflejada por los objetos. La naturaleza basica de f(x,y) puede estar caracterizada por 2 componentes: 1) la cantidad de luz incidente procedente de la fuente sobre la escena contemplada y 2)la cantidad de luz reflejada por los objetos en la escena. De forma apropiada, recibe el nombre de componentes de iluminacin y reflectancia, de i se indican por i(x,y) y r(x,y) respectivamente. Las funciones i(x,y) y r(x,y) se conbinan, como producto, para dar f(x,y): f(x,y)=i(x,y) r(x,y) donde: 0<i(x,y)< y 0<r(x,y)< 2.3. MUESTREO Y CUANTIFICACIN. 2.3.2. Muestreo uniforme y cuantificacion.
Para ser utilizable el procesamiento por medio de computadora. Uan funcion de imagen f(x,y) debe ser digitalizada tanto especialmente como en su amplitu . la digitalizacin de coordenadas espaciales (x,y) muestreo de la imageny la digitalizacin en amplitud se conoce como cuantificacion de nivel de gris. Se supone que una imagen continua f(x,y) se descrive de forma aproxiamada por una serie de muestras igualmente espaciadas organizadas en forma de una matriz NxM donde el elemento de la amtriz es una cantidad discreta:
f(0,0) ~ f(1,0) f(x, y) = f(N - 1,0) f(0,1) f(1,1) f(N - 1,1) . f(0, M - 1) f(1, M - 1) f(N - 1, M - 1)
El terminod e la derecha de la ecuacin anterio representa comnmente se denomina imagen digital a cada elemento de la matriz de se le puede denominar elemento de la imagen y pxel o pel. Este proceso de digitalizacin necesita dimensiones sobre valores para N y M y el numero de niveles de griz permitido para cada pxel. En el proceso digital de imgenes es una practica comn que estas cantidades potencias enteras de 2; es decir: N = 2n , M = 4k , G = 2m. Donde G indica el numero de niveles de gris, consideraremos que los niveles discretos estan igualmente espaciados entre = y L en la escala de grises. Empleando las ecuanciones anteriores obtenemos el numero b, de bits necesarios para almacenar una imagen digitalizada: B = N x M x m. Si M = N, b = N2 x m. 2.3.2. Muestreo no uniforme y cuantificacion. Para un valor fijo de la resolucion espacial, la apariencia de una imagen puede mejorarse en muchos casos empleados un esquema adaptativo en el que el proceso de muestreo dependa de las caracteristicas de la imagen. En general, se necesita un muestreo fino en las aproximidades de las transiciones bruscas en los niveles de gris. Mientras que se puede aplicar un muestreo tosco en las regiones relativamente suaves. La necesidad de identificar los contornos aunque solamente sea de forma aproximada, es uno de los inconvenientes definidos del muestreo no uniforme. Este metodo tampoco para el paso de imgenes que contengan regiones uniforme relativamente pequeas; por ejemplo el muestreo no uniforme seria difcil de aplicar en la imagen de una multitud de personas densa. Este metodo esta sujeto a las observaciones precenetes sobre la deteccion de contornos y contenido en detalles. Una tecnica alternativa que resulta particularmente atractiva para distribuir los niveles de gris consiste en calcular la frecuencia de aparicion de todos los niveles permitidos. 2.4. ALGUNAS RELACIONES BASICAS ENTRE PIXELES . Consideraremos algunas relaciones basicas peor importante entre los pixeles de una imagen digital. Como se menciona anteriormente una imagen se indica por f(x,y). cuando se haga referencia a un pxel en particular, se emplearan letras minusculas, por ejemplo p y q. un conjunto de pixeles de f(x,y) se indica mediante S. Traslacin: Supongase que s etrata de trasladar un punto de coordenadas (X,Y,Z) a un nuevo emplazamiento, empleando unos desplazamientos (Xo,Yo,Zo). la traslacin se realiza fcilmente empleando las ecuaciones: X* = X + Xo Y* = Y + Yo Z* = Z + Zo Donde (X* ,Y* ,Z*) sona las coordenadas del nuevo punto. Lo anterior se puede expresar como:
X * 1 0 0 * Y = 0 1 0 Z * 0 0 1 X X 0 Y Y0 Z Z0 1
A menudo resulta provechoso concatenar varias transformaciones para producir un resultado compuesto, como una traslacin, seguida de un cambio de escala y finalmente de una rotacin. El empleo de matrices cuadradas simplifica considerablemente la notacion necesaria para representar este proceso, la ecuacion anterior se puede reprentar como:
* X 1 * Y * = 0 Z 0 1 0 0 1 0 0 X 0 X 0 Y 0 Y0 1 Z0 Z 0 1 1
La representacin matricial sera v* = Av. Cambio de escala: El cambio de escala empleando factores Sx, Sy y Sz a lo largo de los ejes, X, Y y Z viene dado por la amtriz de transformacin:
Rotacion: La forma mas simple de estas transformaciones es la rotacion de un punto sobre un eje de coordenadas. Para girar un punto alrededor de otro punto arbitrario del espacio se requiere tres transformaciones: la primera traslada ese punto hasta el origen, la segunda relaiza la rotacion y la tercera traslada este punto de nuevo a la posicin original. Concatenacion y transformaciones inversas. La aplicacin de varias transformaciones puede representarse por una unica matriz de treasformacion 4x4. por ejemplo , la trasalcion, el cambio de scala y rotacion sobre el eje Z de un punto v vienen dadas por: V* =R0(S(TV)) =Av donde A es la amtriz 4 x 4, A=R0ST. Estas matrices generalmente no son conmutativas, porque el orden de aplicacin es importante. 2.5.2. transformaciones de perspectiva. Una transformacin de perpectiva (tambin denominada transformacin de imagen) proyecta puntos del espacio tridimensional sobre un plano. Las transformaciones de perspectiva desempean un papel central en el procesamiento de imgenes porque proporcionan una aproximacin al modo en que se forma una imagen viendo el mundo tridimensional. Estas transformaciones son fundamentalmente diferentes de las presentadas anteriormente porque son no lineales en els entido que implican la divisin por los valores de las coordenadas. 2.5.3. Modelo de camara. Este modelo esta basado en la hiptesis de que el sistema de coordenadas global y el de la camara coinciden.
S X 0 s= 0 0
0 Sy 0 0
0 0 SZ 0
X0 0 0 1
La figura muestra un sistema de coordenadas global (X,Y,Z) empleado para localizar tanto los puntos de la camara como los 3-D (indicados por w). tambien muestra el sistema de coordenadas camara (x,y,z) y los puntos imagen (indicados por c) se supone que la camara esta montado sobre un pivote que le permite girar en el plano horizontal (pan) un angulo e inclinarse (tilt) un angulo el primero de ellos (pan) corresponde al angulo entre los ejes x y X, mientras que el segundo (tilt) correponde a el angulo entre los ejes z y Z. la separacion del centro del trpode de origen del sistema de coordenadas global viene indicada por wo, y la separacion del centro del plano imagen con respecto al centro del pivote se representa por el vector r, de componentes (r1,r2,r3). 2.5.4. Calibracin d e la camara. Con respecto a la ecuacin ch = PCRGwh, Sea A = PCRG, los elementos de A contienen todos los parmetros de la camara y, de la ecuacin ch = PCRGwh, ch = Awh. haciendo k=1 en la representacin homognea se tiene:
ch1 a11 a12 ch 2 = a21 a22 ch 3 a31 a32 ch 4 a41 a42 a13 a23 a33 a43 X a14 Y a24 a34 Z a44 1
Las coordenadas de la camara en formas cartesiana son: x = ch1/ch4 y = ch2/ch4 Sustituyendo ch1 = ch4 y ch2 = ch4 en la anterior y desarrollando producto matricial se tiene: xch4 = a11X + a12y + a13Z + a14 ych4 = a21X + a22y + a23Z + a24 ch4 = a41X + a42y + a43Z + a44 donde se ha omitido el desarrollo de ch3 debidoa que la relacion con z. la sustitucin de ch4 en las dos primeras ecuaciones anteriores da dos ecuaciones con 12 incognitas: a11X + a12y + a13Z - a41xX - a42xX - a43xZ - a44x + a14 = 0 a21X + a22y + a23Z - a41yX - a42yY - a43yZ - a44y + a24 = 0 el procedimiento de calibracin, por tanto, consiste en : 1) obtener m 6 puntos del espacio (puesto que hay dos ecuaciones) de coordenadas conocidas (Xi,Yi,Zi) i = 1,2,3,m. 2) calcular las imgenes de estos puntos cuando la camara este en la posicin determinada para obtener los puntos correspondientes en la imagens (xi,yi), i = 1,2,3m. 3) emplear estos resultados en las 2 ultimas ecuaciones para hallar los coeficientes desconocidos. 2.5.5. Imagen estetoscopica.
Como se muestra en la figura, la imagen estetoscopica implica la obtencin de dos imgenes separadas del mismo objeto (un unico punto w del espacio tridimensional en esta posicion). La distancia entre los centros de las dos lentes se denomina linea base. El objetivo consiste en hallar coordenadas (X,Y,Z) del punto w que tiene las coordenadas (x1,y1) y (x2,y2) en las dos imgenes.
2.6. LA PELCULA FOTOGRFICA la pelcula fotografica es un elemento importante de los sistemas de procesamiento de imgenes. a menudo se emplea como medio de registro de las imgenes de entrada, y es como el medio mas popular de registrar los productos de salida. 2.6.1. la estructura de la pelcula. esta formada por las capas y componentes siguientes: 1) una capa superior de gelatina empleada como proteccion contra araazos y abraciones. 2) una capa de emulsion con diminutos cristalitos de haluro de plata. 3) una capa de sustrato para proporcionar la adhesin de la emulsion a base de la pelcula. 4) la base o soporte de la pelcula, formada por triacetato de celulosa u otro polimero similar. 5) un estrato de refuerzo para evitar que se ondule.
Cuando se expone la pelicula a la luz, los granos de haluro de plata absorben las frecuencias opticas y sufren un complejo cambio fisico. los granos que han absorbido una cantidad suficiente de energa contienen pequeas manchas de plata metalica, denominada centros de desarrollo. al rebelar la pelcula, la existencia de un unico centro de desarrollo en un grano de haluro de plata puede precipitar el cambio del grano entero de plata metalica. los granos que no contienen centros de desarrollo no experimentan este cambio. despus de revelado la pelcula se fija mediante la extraccin quimica de los restantes granos de haluro de plata. cuanta mas luz alcanza a una zona de la pelcula. mas haluro de plata se convierte en revelable y mas denso es el deposito de plata que alli se forma. como los granos de plata metalica son muy opacos para las frecuencias opticas, se obtiene una imagen de tonos grises en la que los niveles de brillo estan invertidos, produciendo asi el familiar negativo fotografico. 2.6.2. caracteristicas de la pelcula. Contraste: las pelculas de alto contraste reproducen las diferencias tonales del sujeto como grandes diferencias de densidad en la fotografia; las pelculas de bajocontraste convierten las diferencias de tono en pequeas diferencias de densidad. La exposicin E, a la que ha sido sometida una pelcula se define como energa por unidad de area en cada puntote la region fotosensible. La exposicin depende de la intensidad incidente, I y de la la duracion de la exposicin, T. estas cantidades estan relacionadas por la expresin: E = IT Velocidad. La velociada de una pelcula determina cuanta luz es necesaria para producir una cierta cantidad de plata en el revelado. Cuanto menor es la velocidad, mayor debe ser la exposicin para determinar una determinada imagen ele estndar de velocidad mas ampliamente empleado es la escala ASA. Esta escala es aritmetica, siendo el valor asignadoa al velociada directamente proporcional a la sensibilidad de la pelcula. Un film de 200 ASA es el doble de rapido d (para un sujeto dado se requieren la mitad de exposicion) que una pelcula de 100 ASA. Otras escalas de velocidades, como el sistema DIM empleado en Europa, son logaritmicas, cada incremento de tres unidades en el numero DIM de la velocidad duplica la velocidad. Una pelcula de 50 ASA es equivalente aun DIN 18, un 100 ASA a un DIM21, y asi sucesivamente. Las pelculas para exteriores, y algunas de interiores, tienen velocidades comprendidas entre 80 y 160 ASA. Granulosidad. La imagen extraida de los cristales de haluro de plata tienen estructura discontinua, lo que le da la apariencia de granulosidades ampliaciones . el efecto es mas pronunciado en las pelculas rapidas, que tienen comparativamente cristales mayores; las emulciones mas lentas, de grano mas fino mas fino, son por lo tanto preferibles en ampliaciones en las que se necesiten un detalle fino, o en las que sea necesaria una gran ampliacin de los negativos. Poder de resolucion.
La presicion del detalle que puede resolver una pelcula depende no solo de su granulosidad sino tambien de la propiedades de dispersin de luz de la emulsion y del contraste con el que la pelcula reproduce los detalles finos. Los mayores poderes de resolucion se alcanza con pelculas de grano fino y emulsiones delgadas. 2.6.3. Ajustes de diafragma y del obturador. Ajuste en el difragama de la lente. una serie de mecanismos aumentan o disminuyen el tamao de la apertura para controlar la cantidad de luz que atraviesa la lente de la pelcula. El anillo de control del difragma esta calibrado en una escala de los denominados nmeros f o nmeros de diafragma que forman series tales como 1,4; 2; 2,8; 4; 5,6; 8; 11; 16; 22, y 32. los nmeros del diafragma son inversamente proporcional a la cantidad de luz admitida. Las escalas de las velocidades del obturador, en las camaras actuales, tambien siguen estas secuencias estandar doblemitad. Las velocidades tipicas son 1.1/2, 1/8, 1/15, 1/30, 1/60, 1/125, 1/500 y 1/1000 de segundo cuanto mayor es la velocidad del obturador, menor es el tiempo de exposicin obtenido. El conjunto del diafragma y obturador controlan la cantidad de luz que alcanza a la pelcula al ajustar la intensidad de la luz y el tiempo durante el cual actua. .4.1. Vecinos de un pxel. Un pxel p de coordenadas (x,y) tiene cuarto vecinos horizontales y verticales cuyas coordenadas son: (x+1,y). (x-1,y), (x,y+1).(x,y-1) Este conjunto de pixeles, denominados 4 vecinos de p,. se representan por N4(p). cada pxel esta a una unidad de distancia de (x,y), y algunos de los vecinos p caen fuera de la imagen digital si (x,y) esta en el borde de la imagen. Los cuatro vecinos en diagonal del p tienen coordenadas: (x+1+1,y). (x-1,y-1), (x-1,y+1).(x-1,y-1) Y se representan por Np(p) estos puntos, junto con los 4 vecinos se denominan 8- vecinos de p y se representan por N8(p). 2.4.2. Conectividad. La conectividad entre pixeles es un concepto importante para establecer los limites de los objetos y los componentes en areas de una imagen. Para determinar si dos pixeles estan conectados debe determinarse si son adyacentesen algun sentido (como ser 4- vecinos) y sus niveles de gris cumplen un criterio especificado de similitud (como ser iguales); por ejemplo, en una imagen binaria de valores 0 y 1, dos pixeles pueden ser 4- vecinos pero no estan conectados a menos que tengan el mismo valor. 2.4.3 Etiquetado de componentes conexas. Imagnese el barrido de una imagen pxel a pxel, de izq. A der. Y de abajo hacia arriba, y supngase que, por el momento estamos interesados en componentes 4-conexas. Sea p el pxel en cada paso del proceso de barrido y sean r y t los vecinos superior e izquierdote p, respectivamente. La naturaleza de secuencia de barrido asegura que cuando se llega a p, los puntos r y t ya han sido encontrados (y etiquetados si fuesen 1). 2.4.4. Relaciones, equivalencia y clausura transitiva. Una relacion binaria R en un conjunto A es un conjunto de pares de electos de A. si el par de (a,b) pertenece a R, diremos que a esta relacionado con b y normalmente se representara como aRb. Tomese por ejemplo el conjunto de puntos A = {p 1,p2,p3,p4} ordenados de la forma:
p1 p3 p2 p4
Y definamos la relacion 4-conexin. En este caso R es el conjunto de pares de puntos de A que estan 4-conectados; es decir, R = {(p1,p2),(p2,p2), (p1,p3),(p3,p1) }. Asi p1 esta relacionado con p2, con p3 y viceversa pero p4 no esta relacionado con ninguno. Se dice que una relacion R sobre un conjunto A es: a) reflexiva si para cada a de A. aRa: b) simetrica si para cada a y b de A. aRb implica bRa; y c) transitiva si para cada a,b y c de A. aRb y bRc implica aRc. Una relacion que satisfaga estas tres propiedades se denominan relacion de equivalencia. 2.4.5. Medidas de distancia. Para los pixeles p, q y z, de coordenadas (x,y), (s,t), (u,v) respectivamente, D es una funcion de distancia o una metrica si: a) D(p,q) 0(D(p,q)) = 0 si y solo si p=q. b) D(p,q) = (D(q,p), y c) D(p,z) D(p,q) + D(q,z). - La distancia euclidiana entre p y q esta definida por:
D e (q, p) = ( x - s ) + ( y t )
2
2 1/ 2
Para esta medida de distancia, los pixeles que estan a una distancia menor o igual a algun valor de r de (x,y) son los puntos contenidos en un circulo de radio r con centro (x,y). La distancia D4 (denominada tambien la distancia city - block) estre dos puntos p y q se define:
D 4 (q, p) = x s + y t
En este caso los pixels que este a uan distancia, de (x,y), D4 menor o igual que un determinado valor de r forman un rombo centrado en (x,y). por ejemplo los pixels con una distancia D4 2 desde (x,y) (el punto central) formaran los siguientes contornos de distancia constante:
2 2 1 2 2 1 0 1 2 2 1 2 2
Los pixels con distancia D4 = 1 son los 4-vecinos de (x,y). La distancia D8 (tambien llamada distancia tablero de ajedrez) entre p y q se define:
D 8 (q, p) = max( x s , y t )
En este caso los pixels a una distancia D 8 de (x,y) menor o igual que un cierto valor de r forman uncuadro centrado en (x,y). por ejemplo, los pixels a una distancia D8 2 de (x,y) el (punto central) forman los siguientes contornos de distancia constante:
2 2 2 2 2 1 1 1 2 1 0 1 2 1 1 1 2 2 2 2
2 2 2 2 2
Los pixels con una distancia D8 = 1 son los 8 vecinos de (x,y). 2.4.6. Operaciones aritmtico lgicas. Las operaciones aritmetico logicas entre pixels se emplean profusion en mayor parte de las ramas de procesamiento de imgenes. Las operaciones aritmeticas entre pixels p y q son: a) Adicion: p+q b) sustraccin: p-q c) multiplicacin: p * q (o tambien pq y p x q) d) divisin: p/q las operaciones aritmeticas sobre imgenes: completas se realizan pxel a pxel. El principal empleo de la adicion de imgenes es la reduccion del ruido mediante el promedio de imgenes. La sustraccin de imgenes es una herramienta basica en el procesamiento de imgenes medicas, donde se emplea para eliminar informacin estatica de fondo. Uno de los principales empleos de la multiplicacin (o divicion) de imgenes consiste corregir las variaciones de los niveles de gris que se deben a una iluminacin no uniforme o a la respuesta desigual del sensor empleado para captar imgenes. Las principales operaciones logicas: empleadas en el procesamiento de imgenes son Y logico (AND), el O logico (OR) y el COMPLEMENTO logico COMPLEMENT, representado por: Y:p AND q (o tambien, p.q) O:p OR q (o tambien, p+q) COMPLEMENTO: NOT q (o tambien,
q)
Estas operaciones son funcionalmente completas en el sentido que pueden ser combinadas para formar cualquier operacin logica, y se utilizan solamente en imgenes binarias, mientras que las operaciones aritmeticas solo en pixels con varios valores. 2.5. GENERACION DE UNA IMAGEN. 2.5.1. Algunas transformaciones bsicas. Todas las transformaciones estan expresadas en el sistema de coordenadas cartesiano tridimensional (3-D), en el que las coordenadas de punto generico se representan por (X,Y,Z). en los casos que implique imgenes bidimensionales (2-D), se mantiene la convencin anterior de representacin en minsculas (x,y) para indicar las coordenadas de un pxel. Hacer referencia a (X,Y,Z) como coordenadas globales de un punto es la terminologa comn. pitulo 3 Transformada de Fourier Introduccion a la transformada de Fourier.- Sea f(x) una funcin continua de la variable real x. La transformada de Fourier de f(x), indicada por F{f(x)}, se define por la ecuacin: ; donde j= . Dada una F(u), podemos volver a hallar f(x)
empleando la transformada inversa de Fourier: . La transformada de Fouerier de una funcin real es en general compleja, es decir: F(u) = R(u) + jI(u). Su forma exponencial es: La transformada de Fourier se puede expresar fcilmente a una expresin de dos variables, f(x,y). Si esta es continua e integrable y F(u, v) es integrable entonces existe el siguiente par de transformadas de Fourier:
El espectro de Fourier, la fase y el espectro de frecuencia son respectivamente:
2. La transformada de Fourier Discreta. Supongamos q una funcin continua f(x) se ha discretizado en la sucesin: Tomando N muestras separadas x. Para facilitar los comentarios posteriores es conveniente emplear x indistintamente como una variable discreta o continua, dependiendo del contexto de la discusin. Para hacerlo se necesita definir: f(x)= f(x0+xx); donde x toma ahora los valores discretos, 0, 1, 2, , N-1. Teniendo en cuenta la notacin anterior, el par de transformadas discretas de Fourier q se aplica pa las funciones muestreadas esta dado por:
Los trminos u y x estn relacionados por: u= 1/Nx En el caso de dos variables el par de transformada discreta de Fourier es:
Para x= 0,1,2,, M-1 e y= 0,1,2,, N-1, y Cuando las imgenes se muestrean con una distribucin cuadrada, M=N y
Para x, y= 0,1,2,, N-1. 3. Algunas propiedades de la transformada de Fourier bidimensional.- El rango dinamico del espectro de Fourier es habitualmente mucho mayor de lo q los sistemas de visualizacin ordinarios son capaces de reproducir fielmente, en cuyo caso solo las partes mas brillantes de la imagen son visibles en la pantalla. Una tcnica muy utilizada q compensa esta dificultad consiste en representar la funcin: D(u, v) = clog[1+|F(u,v)|]; en lugar de |F(u,v)|, donde c es una constante de escala y la funcin log realiza la compresin necesaria. a. Separabilidad.- El par de transformadas discretas de Fourier pueden expresarse en forma separada como:
b. Traslacion.- Las propiedades de traslacin del par de Fourier son:
Donde la doble flecha indica la correspondencia entre una funcin y su transformada de Fourier (y viceversa). c. Periodicidad y simetra conjugada.- La transformada discreta de Fourier y su inversa son funciones periodicas de periodo N, es decir: Solo es necesario un periodo de la transformada para especificar F(u,v) completamente en el dominio de frecuencias. c. Rotacion.- Si introducimos las coordenadas polares: x = rcos, y=rsen, u=cos v=sen ; entonces f(x,y) y F(u,v) se convierten en f(r, ) y en F(, ), respectivamente. La sustitucin discreta en el par de transformadas de Fourier, tanto en el caso continuo como en el discreto, proporciona: f(r, + 0) F (, +0) d. Distributividad y cambio de escala.- De la definicin del par de transformadas de Fourier continuas o discretas, y en general
en otras palabras la transf de Fourier y su inversa son distributivas respecto a la suma pero no respecto a la multiplicacin.
e. Valor medio.- Una definicin muy utilizada del valor medio de una funcin discreta bidimensional es la expresin:
f. Laplaciano.- se define como:
De la definicin de la transformada de Fourier bidimensional: g. Convolucion y correlacion. Convolucion.- La conv de dos funciones f(x) y g(x), indicada por f(x)*g(x), se define mediante la integral:
Donde es una variable ficticia pa la integracin. La convolucin bidimensional de fe(x,y) y ge(x,y) esta definida por la relacin: Correlacion.- La correlacion de dos funciones continuas f(x) y g(x), representada por f(x)g(x), se define por la relacin:
donde * es el conjugado del complejo. Su equivalente discreto vendra a ser:
En el caso bidimensional se define como: Para el caso discreto:
h. Muestreo.- Este problema consiste en establecer las condiciones de muestreo bajo las cuales una imagen continua puede ser completamente recuperada a partir de un conj de valores muestreados. * Funciones unidimensionales.- Considere una funcin q se extiende desde - hasta , y se supoen tb q la transformada de Fourier de f(x) se anula para valores de u fuera del intervalo [-W, W]. Una funcin q tiene esta propiedad para cualquier valor finito de W se denomina funcin de banda limitada. Para obtener una versin muestreada de f(x) basta multiplicar esta funcin por una funcin de muestreo s(x), q consiste en un tren de impulsos separados x * Funciones bidimensionales.- Se encuentra definida por:
Para una funcin f(x,y), donde x e y son continuas, se obtiene una funcin muestreada al formar el producto s(x,y)f(x,y). La operacin equivalente en el dominio de frecuencias es la convolucion de S(u,v) y F(u,v). La transformada rpida de Fourier.a. Algoritmo de la FFT.- esta basado en el mtodo denominado de doblados sucesivos. Por conveniencia se expresa la ecuacin de la forma: donde WN= exp[-j2/N] u N se supone de la forma N=2n donde n es un entero positivo. Entonces N se expresa como: N = 2M donde M tb es un entero positivo. b. Numero de operaciones.- Por induccin el numero de multiplicaciones complejas y de sumas necesarias para resolver el algoritmo de la FFT es: m(n) = (1/2)2nlog22n entonces es igual a (1/2)N log2N y esto es igual a (1/2)Nn n 1 y a(n) = 2nlog22n dndonos por resultado Nn n 1. c. FFT inversa.-
Otras transformadas de la imagen separables.- La transformada de Fourier unidimensional forma parte de una clase de importantes transformadas q pueden expresarse en trminos de la relacion general: donde T(u) es la transformada de f(x), g(x,u) es el nucleo de la transformacin directa, y u toma los valores en el rango 0,1,, N-1. La transformada inversa es la relacin:
a.
La transformada de Walsh.- Cuando N=2n, la transformada de Walsh de una funcin f(x), representada por W(u), se obtiene sustituyendo el nucleo:
tenemos
Su transformada inversa es:
b. La transformada de Hadamard.- Una de las diversas formulaciones del nucleo de la transformada directa de Hadamard unidmensional es la relacin:
La transformada de Hadamard unidimensional es:
La transformada inversa de Hadamard es:
Los nucleos bidimensionales son:
Transformadas de Hadamar bidimensional:
c.La transformada del coseno discreta(DCT) .- Se define como:
De forma similar la DCT inversa es:
El correspondiente par DCT bidimensional es:
CAPITULO 4 MEJORA DE IMAGEN 4.1 Fundamentos: El principal objetivo de las tecnicas de mejora es procesar una imagen de forma que resulte mas adecuada que la original para una aplicacin especifica. Los mtodos de mejora de la imagen presentados en este capitulo estn basados en tcnicas bien en el dominio espacial o bien en el dominio de la frecuencia. 4.1.1 metodos en el dominio espacial se refieren a los procedimientos que operan directamente sobre sobre el dominio espacial q lo conforman los pixeles 4.1.2 metodos en el dominio de la frecuencia se basan en el teorema de convolucion 4.2 Mejora por procesamiento de punto mtodos de procesamiento que se basan slo en la intensidad de pixels individuales. Los procesos punto a punto se encuentran entre las tcnicas mas simples de mejora de la imagen. 4.2.1 Algunas transformaicones de intensidad simples Negativo de imgenes La idea es invertir el orden de blanco a negro, de forma que la intensidad de la imagen de salida disminuya conforme a la intensidad de la imagen de entrada aumente. Aumento del contraste Se trata de dar mas variedad de niveles de gris a una imagen que tiene pocos niveles de gris. Haciendo visible detalles q antes no eran visibles. Comprension del rango dinamico Cuando el rango dinamico excede ampliamente la capacidad del dispositivo de presentacin, en la q solo se vern las partes mas brillantes. En este caso es preciso comprimir usando la transformacion logartmica o la transformacin de ley de potencias. Fraccionamiento del nivel de gris a) Adjudica un valor alto a todos aquellos niveles de gris del rango de inters y un valor bajo a los restantes. Esta transformacin produce una imagen binaria. b) Otra es intensificar el rango de niveles de gris deseado, pero al mismo tiempo preservar el fondo y las tonalidades de gris de la imagen. Fraccionamiento de los planos de bit Cuando se desea destacar la contribucin q realizan a la imagen determinados bits, el nivel de gris quedara determinado por 8 bits, al cual hara correspondencia a una imagen con 8 planos. 4.2.2 Procesamiento de histogramas Ecualizacion de un histograma El objetivo es obtener un histograma lo mas uniforme posible, lo cual implica un incremento del rango dinamico de los pixeles, usando la funcin de distribucin acumulada de niveles de gris, de la imagen de entrada. Especificacion del histograma Este es usado cuando se desea tener la posibilidad de especificar determinados perfiles de histogramas capaces de destacar determinados rangos de grises de la imagen Mejora local Consiste en planerar funciones de transformacin basadas en la distribucin de niveles de gris u otras propiedades en la vecindad de cada pixel de la imagen 4.2.3 Sustraccion de imgenes Se obtiene calculando la direncia entre todos los parede de pixels correspondientes. La resta al igual q la suma de imgenes requiere q ambas imgenes sean de igual tamao. 4.2.4 Promediado de la imagen El objetivo es reducir los efectos del ruido a base de sumar un conjunto de imgenes. A mayor sea el numero de imgenes a procesar, el ruidos ser reducido, y la imagen resultante ser mejor. 4.3 Filtrado espacial 4.3.1 Fundamentos Se emplea mascaras espaciales , estos se denominan filtros espaciales. Los filtros pasa bajo atenan las componentes de alta frecuencia en el dominio de Fourier, estas componentes de alta frecuencia caracterizan los bordes y los restantes detalles muy marcados en la imagen, por ello el efecto de introducir un filtrado de pasa bajo es el de hacer mas borrosa la imagen. Los filtros pasa alto atenan las componentes de baja frecuencia, estas componentes son responsables de las caractersticas lentamente variables, contraste global y la intensidad media, el resultado de este filtrado es la reduccin de estas caractersticas y en correspondencia una aparente agudizacin de los bordes y de los restantes detalles finos. 4.3.2 Filtros suavizantes Se emplean para hacer q la imagen aparezca algo borrosa y tambin para reducir el ruido. Filtrado espacial pasa bajo (filtro lineal) Este filtro ha de tener todos sus coeficientes positivos y divididos en el numero de componentes Filtrado por la mediana (filtro no lineal)Se usa cuanco el objetivo es mas la reduccin del ruido q el difuminado. En este caso el nivel de gris de cada pixel se reemplaza por la mediana de los niveles de gris en un entorno de este pixel. Primero se extrae los valores del pixel y de su entorno, se extrae la mediana, este valor por la mediana se le asignara al pixel. 4.3.3 Filtros realzantes El obejtivo principal es el de destacar los detalles fino de una imagen o intensificar detalles q han sido difuminados. Filtrado espacial de paso alto bsico Este filtro ha de tener coeficiente positivo en su centro y negativos en la periferia, la suma de estos coeficientes ha de ser cero. Ek resultado de esestara dado por una mejora en los bordes sobre un fondo relativamente oscuro. Filtrado high-boost Es el resultado de sumar una parte de la imagen original y la imagen q ha pasado por un filtro pasa alto. Como resultado la imagen de salida se parece ms a la original con un grado relativo de mejora de los bordes que depende del valor de A. High-boost=(A-1)(original) + paso alto Filtros diferenciales Esta diferenciacin aumenta la nitidez de la imagen. El mtodo mas comn de la diferenciacin en aplicaciones de procesado de la imagen es la gradiente. 4.4 Mejora en el dominio de la frecuencia Se trata de calcular la transformada de Fourier de la imagen a intensificar, multiplicar el resultado por la funcin de transferencia de un filtro y, finalmente, tomar la transformada de Fourier inversa para llegar a una imagen mejorada.
4.4.1 Filtrado de pasa bajo el difuminado o suavizado se consigue a base de atenuar un rango especfico de componentes de alta frecuencia en la transformada de una imagen dada. 4.4.2 Filtrado de paso alto Debido a que los cambios bruscos y bordes de la imagen estn relacionados con las componentes de alta frecuencia, puede lograrse el realce de la imagen en el dominio de la frecuencia mediante un procedimiento de filtrado pasa alto, que atena las componentes de baja frecuencia. 4.4.3 Filtrado homomorfico Este mtodo esta basado en un caso particular de una clse de sitemas. Conocido como sistemas homomorficos. La clave del mtodo consiste en la separacin entre las componentes de iluminacin y reflectancia. La funcin de este filtro homomorfico puede operar separadamente sobre estas componentes. 4.6 Procesamiento de imgenes en color Primero, en el anlisis automtico de imgenes, el color representa un potente descriptor que a menudo simplifica la identificacin de un objeto y su extraccin de una escena. Segundo, en el anlisis de imgenes realizado por seres humanos, el inters por el color reside en que nuestro ojo es capaz de discernir miles de matices e intensidades de color, en comparacin con solo dos docenas de niveles de gris. 4.6.1 Fundamentos del color Bsicamente, los colores que los seres humanos percibimos en un objeto estn determinados por la naturaleza de la luz reflejada por un objeto. La luz visible est formada por una banda de frecuencias relativamente estrecha del espectro electromagntico. Existe dos distensiones entre colores primarios de luz y colores primarios de pigmentos o colorantes, el primero es aditivo mientras el segundo es sustractivo 4.6.2 Modelos de color Es la especificacin de un sistema de coordenadas tridimensional y de un subespacio de este sistema en el que cada color quede representado por un nico punto Modelo de color RGB Se basa en la combinacin de tres seales de luminancia cromtica distinta: rojo, verde, azul Modelo de color CMY Utiliza El cin, magenta y amarillo q son los colores secundarios de luz, o bien los colores primarios de los pigmentos Modelo de color YIQ es una recodificacin del RGB utilizada por su eficacia el transmisin y para mantener la compatibilidad con los estndares de TV blanco y negro Modelo de color HSI define su nombre a partir de los tres parmetros que considera; el color (hue), la luminancia (cantidad de negro en el color) y la saturacin o croma, (cantidad de blanco). 4.6.3 Procesamiento de imgenes en falso color Nos basamos en algunas propiedades de su contenido de nivel gris Division de la intensidad se asigna un color diferente a cada lado de un plano q corta las intensidades de nivel de gris, cualquier pxel cuyo nivel de gris est por encima del plano se codificara con un color, cualquier pxel inferior al plano se codificar con el otro. A los niveles qu estn sobre el propio plano se les puede asignar arbitrariamente uno de los dos colores. El resultado es una imagen bicoloreada. Transformaciones de color del nivel de gris consiste en llevar a cabo tres transformaciones independientemente del nivel de gris de cualquier pxel de entrada. A continuacin los tres resultados alimentar separadamente los caones rojo, verde y azul de
un monitor de TV en color. Este mtodo produce una imagen compuesta cuyo contenido de color est modulado por la naturaleza de las funciones de transformaciones . Esta transformaciones son de nivel de gris de una imagen y no de la posicin de las funciones. 4.6.4 Procesamiento de imgenes en color real En particular estamos interesados en el modelo HSI por las razones. La intensidad e informacin del color de este modelo estn desacopladas. El tono y la saturacin estn ntimamente relacionados con la forma en que los seres humanos describen la percepcin del color.

CAPITULO 1 Daniado

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

CAPITULO 1 Daniado

Transféré par

Droits d'auteur :

Formats disponibles

CAPITULO 1 INTRODUCCION 1.2.

El espectro de Fourier, la fase y el espectro de frecuencia son respectivamente:

b. Traslacion.- Las propiedades de traslacin del par de Fourier son:

f. Laplaciano.- se define como:

donde * es el conjugado del complejo. Su equivalente discreto vendra a ser:

En el caso bidimensional se define como: Para el caso discreto:

Su transformada inversa es:

La transformada de Hadamard unidimensional es:

La transformada inversa de Hadamard es:

Los nucleos bidimensionales son:

Transformadas de Hadamar bidimensional:

c.La transformada del coseno discreta(DCT) .- Se define como:

De forma similar la DCT inversa es:

El correspondiente par DCT bidimensional es:

Vous aimerez peut-être aussi