Académique Documents
Professionnel Documents
Culture Documents
Facultad de Ingeniería
Escuela de Ingeniería Eléctrica
Por:
Por:
KEVIN A. SOLÍS SALAZAR
_________________________________ ________________________________
Ing. Andrew Sheehy Protti Ing. Luis Diego Rojas Muñoz
Profesor lector Profesor lector
ii
DEDICATORIA
maravillosa familia, a mis amigos. Por contribuir con lo que soy hoy día, por todo el apoyo
brindado, porque siempre me alientan a seguir adelante, a corregir mis errores, porque
siempre están presentes cuando los necesito, y por ser mi motivo de superación, muchas
iii
RECONOCIMIENTOS
iv
ÍNDICE GENERAL
v
2.3 Histograma y densidad de probabilidad ......................................... 22
verosimilitud 31
vi
3.1.2 Pasos posteriores a la umbralización global de la varianza local ................ 53
de intensidad 69
vii
5.1 Segmentación manual para medir la precisión de los algoritmos .. 71
BIBLIOGRAFÍA ........................................................................................ 99
viii
ÍNDICE DE FIGURAS
Figura 2.5. Arreglo de sensores CCD para cámara digital a color ...................................... 12
Figura 2.8 Representación matricial de una imagen digital a color en el espacio RGB ..... 16
Figura 2.9 Comparación entre una imagen de intensidad y una imagen segmentada ......... 19
Figura 2.11. Imagen binaria segmentada con distintos umbrales de la imagen 2.10 .......... 21
Figura 2.16. Imágenes de media resultantes de la imagen 2.15. A con W=1, B con W=3, C
Figura 2.17. Imágenes de varianza resultantes de la imagen 2.15. A con W=1, B con W=3,
ix
Figura 2.18. Imagen segmentada binaria a partir de una umbralización manual de la
Figura 2.19 Ventana 3x3 (W=1) para ejemplificar filtro de mediana ................................. 30
Figura 2.20 Ejemplo de valores ordenados para ejemplificar filtro de mediana ................. 30
formada por la suma de dos densidades gaussianas p(I|C1) y p(I|C2), con medias m1 y m2 y
Figura 2.28 Algoritmo RANSAC. (a) Conjunto de datos. (b) Recta definida por los datos A
y B. (c) Distancia de referencia o umbral para la recta de la imagen mostrada en (b), líneas
punteadas. (d) Recta definidita por los datos C y D, donde C es un dato atípico................ 42
x
Figura 2.29 Fotografía del microscopio in-situ [4].............................................................. 45
Figura 3.2 (a) Imagen de intensidad capturada por el microscopio in-situ. (b) Imagen de
Figura 3.3 Resultado de aplicar una umbralización global por máxima verosimilitud a la
Figura 3.4 Imagen binaria resultado del algoritmo de umbralización de la varianza local
[4]......................................................................................................................................... 55
3.1(a) .................................................................................................................................... 59
Figura 3.7: Resultado final del algoritmo de umbralización local de la intensidad descrito
Figura 3.8: Resultado del algoritmo de umbralización local de la intensidad descrito en [5]
xi
Figura 4.1. Comparación entre densidad de probabilidad unimodal y bimodal .................. 64
Figura 4.2. Histograma de los bordes de una región específica, que se obtiene de la imagen
Figura 4.3 Resultado de aplicar una umbralización local a la imagen de la figura 3.1 (b). 66
Figura 4.4. Imagen mejorada con filtro de mediana, luego de la umbralización ................ 67
Figura 4.5 Imagen binaria resultante del algoritmo de umbralización local de la imagen de
intensidad ............................................................................................................................. 68
Figura 4.6. Comparación entre una imagen resultante del algoritmo de Espinoza, y una del
Figura 5.1. Imagen segmentada manualmente utilizada para evaluar la precisión de los
algoritmos. ........................................................................................................................... 72
Figura 5.2 Método para medir la distancia mínima al cuadrado entre píxeles de borde
xii
Figura 6.8. Comparación imagen 557 ................................................................................. 85
Figura 6.12. Histograma de los bordes de una región específica, muestra intensidades altas,
del algoritmo descrito en [4], el verde del [5] y el rojo del algoritmo propuesto ................ 92
xiii
ÍNDICE DE TABLAS
Tabla 6.1. Resultados de la Serie 550 para los 3 algoritmos de umbralización .................. 89
Tabla 6.2. Tabla comparativa de umbrales entre algoritmo de Espinoza y Propuesto ........ 94
xiv
NOMENCLATURA
Imágenes y Visión por Computador, en inglés: “Image Processing and Computer Vision
Research Laboratory”
los colores como una combinación lineal de los colores siguientes: R-rojo, G-verde y B-
azul.
los colores como una combinación lineal de los siguientes parámetros: Y- Luminancia, I’ y
Q- Crominancia.
I(x, y) Valor de intensidad en la posición dada por las coordenadas “x” y “y” en
xv
M Número de filas de una imagen.
m(x,y) Valor medio de los valores de intensidad de los píxeles en una vecindad
alrededor del píxel ubicado por las coordenadas “x” y “y” (media local).
alrededor del píxel ubicado por las coordenadas “x” y “y” (varianza local).
xvii
RANSAC Siglas para «Random Sample Consensus», que corresponde al
experimentales.
A Cantidad mínima de datos para iniciar los parámetros libres del modelo
seleccionado.
ésima repetición.
xviii
Probabilidad de que un valor atípico sea compatible con un modelo
incorrecto.
[5]
Device”.
aglomeración celular hasta el píxel más cercano marcado manualmente como frontera de
cuadrado desde cada píxel perteneciente al borde de una aglomeración celular segmentada
hasta el píxel más cercano marcado manualmente como borde de una aglomeración
celular.
xix
RESUMEN
(segmentar) las regiones de las aglomeraciones celulares dentro de una imagen estática
capturada por un microscopio in-situ, el cual podría ser utilizado como parte de un
región, con un modelo de población mixta, el cual consiste en la suma de dos densidades
de ese modelo, incluyendo el valor medio de los valores de intensidad de los píxeles del
acuerdo a [8].
distancia entre las fronteras de las aglomeraciones celulares segmentadas con el algoritmo
obtenidos mostraron que el nuevo algoritmo es más preciso que los algoritmos descritos
xx
por Martínez y Espinoza (en [4] y [5], respectivamente). El MSE del nuevo algoritmo en
las once imágenes de la secuencia “Serie550” fue en promedio 56% y 29% más preciso
xxi
1. Capítulo 1: Introducción
obtenido analizando una muestra del cultivo celular fuera del reactor biológico,
hace necesario que un operador extraiga y analice del reactor biológico una muestra del
cultivo celular; incrementándose así el riesgo de contaminación del cultivo celular y los
de video incorporada a su estructura, cuya zona de muestreo fue diseñada para ser
intensidad del cultivo celular, sin riesgo de contaminación ni intervención del operador.
1
Asumiendo que el volumen de la escena es conocido, la densidad celular dentro
del reactor biológico en un instante de tiempo arbitrario se puede estimar a partir del
análisis una imagen de intensidad capturada por el microscopio in-situ en ese mismo
instante de tiempo [3,4]. Para ello, el primer paso consiste en determinar (segmentar) las
define como un grupo de una o más células, donde la distancia entre células es
este tipo de umbral se le suele denominar umbral global, porque se utiliza para clasificar
varianza, por medio de un modelo mixto de población con distintas medias y varianzas
[10,11].
2
Desafortunadamente, durante el proceso de umbralización global se pueden
reclasifican todos los píxeles de cada “región segmentada por umbralización global”
cada región. El valor del umbral local de una “región segmentada por umbralización
global” es estimado como el valor medio de los valores de intensidad de los píxeles del
umbralización global” con un valor de intensidad mayor que el umbral local son
reclasificados como pertenecientes al fondo. Para estimar el valor medio de los valores
intensidad como una función de densidad de probabilidad Gaussiana, descrita por dos
Los parámetros óptimos de ese modelo son estimados maximizado una función de
verosimilitud. Para mejorar la precisión en la estimación del valor medio, los píxeles
En este trabajo se propone un nuevo algoritmo para la estimación del valor del
umbral local usado en [5] para reclasificar los píxeles de las regiones segmentadas
obtenidas mediante una umbralización global. De la misma forma que en [5], el valor
del umbral local de una “región segmentada por umbralización global” será definido
3
como el valor medio de los valores de intensidad de los píxeles del fondo alrededor de
probabilidad de los valores de intensidad alrededor de la región como una sola función
modelo, incluyendo el valor medio de los valores de intensidad de los píxeles del fondo,
[10].
C, bajo el sistema operativo Windows XP. Para evaluar el impacto del nuevo algoritmo,
local propuesto en [5], de tal modo que sea el algoritmo propuesto el que se use para
estimar el umbral local por cada región segmentada después de la umbralización global.
compararán sus resultados con aquellos obtenidos con una segmentación basada
4
obtenidos con una segmentación basada en una umbralización global y local original
regiones segmentadas con los algoritmos descritos en [4] y [5], y el contorno de las
error cuadrático medio obtenido con el nuevo algoritmo respecto a aquel obtenido con
1.2 Objetivos
capturada por un microscopio in-situ, el cual se basará en una estimación por máxima
5
probabilidad de los valores de intensidad de los píxeles que rodean cada región
6
1.3 METODOLOGIA
umbralización global. De la misma forma que en [5], el valor del umbral local de una
“región segmentada por umbralización global” será definido como el valor medio de los
probabilidad de los valores de intensidad alrededor de la región como una sola función
modelo, incluyendo el valor medio de los valores de intensidad de los píxeles del fondo,
[10].
C, bajo el sistema operativo Windows XP. Para evaluar el impacto del nuevo algoritmo,
local propuesto en [5], de tal modo que sea el algoritmo propuesto el que se use para
estimar el umbral local por cada región segmentada después de la umbralización global.
7
Posteriormente, se probará con imágenes reales de cultivos celulares capturadas por un
compararán sus resultados, con aquellos obtenidos con una segmentación basada
obtenidos con una segmentación basada en una umbralización global y local original
regiones segmentadas con los algoritmos descritos en [4] y [5], y el contorno de las
error cuadrático medio obtenido con el nuevo algoritmo respecto a aquel obtenido con
8
2. Capítulo 2: Desarrollo teórico
En este capítulo se presentan las bases teóricas para el desarrollo del proyecto.
color emplean un arreglo de prismas para separar los componentes rojos (R), verdes (G)
y azules (B) del haz de luz (Ver figura 2.1). Una vez separados los componentes RGB se
logra describir una imagen a color tal como se describe en la sección 2.1.3.
9
Actualmente, existen dos tecnologías de sensores usadas para convertir la luz
capturada por las cámaras digitales en una imagen digital, la más utilizada está basada
en forma de matriz.
convertir la luz recibida en una señal eléctrica, este efecto consiste en que la cantidad de
Todos los sensores CCD y CMOS realizan las mismas funciones básicas:
generar y almacenar carga eléctrica en cada celda (también llamada píxel), medirla y
convertirla en tensión o corriente, y dar una señal de salida. La diferencia está en las
puede transferir su carga eléctrica a uno o varios de los condensadores que estén a su
10
El sensor CMOS está formado por numerosos fotodiodos (uno para cada pixel),
que producen una corriente eléctrica la cual varía en función de la intensidad de luz
recibida.
realiza internamente en unos transistores que lleva cada celda, por lo que todo el trabajo
se lleva a cabo dentro del sensor, mientras que el CCD necesita enviar la señal eléctrica
Uno de los factores que complican la captura electrónica de las imágenes es que
los sensores son monocromáticos, es decir el silicio no distingue si el fotón que recibe
11
es un fotón rojo o es azul sin utilizar filtros de color, debido a que los electrones
generados son los mismos para todas las longitudes de onda de la luz. Por lo tanto, para
capturar colores se deben utilizar estrategias como usar un conjunto de filtros de color
en un único sensor, o dividir la luz con un prisma y utilizar un sensor para cada uno de
Una vez que se transforma la imagen óptica en una señal eléctrica se obtiene una
imagen digital. La cual, es una señal bidimensional discreta que tiene amplitudes
obtienen también el nombre de píxel. Así, otra posible manera de definir una imagen
asigna para cada par ordenado (x, y) un valor binario (uno o cero), el cuál puede ser
almacenado en un bit. Así, en las imágenes binarias hay solamente dos niveles de
12
cuantización: blanco, en las posiciones en que se asignó un uno, y negro en las que se
imagen de intensidad, la cual requieren una cuantización de 256 niveles a partir del
arreglo.
variable continua en un número finito de valores, que suelen ser potencias de dos. En el
caso del sensor CCD la variable continua es la carga en las células fotoeléctricas. Se
asigna a cada pixel un valor de carga que es codificado con una palabra de código
binario de longitud constante e igual a un número fijo de bits. Al utilizar ξ bits para la
codificación, se tiene una cantidad L de posibles valores que el píxel puede tomar, en el
(2.1-1)
con palabras de bits (un byte), hay posibles valores que puede
los niveles. En este caso se encuentran los colores: negro (se asignó un cero), blanco (se
asignó un 255), y distintos tonos de grises (se asignan valores intermedios entre 0 y
255).
13
Figura 2.6. a) Imagen original. b) Valores de Cuantización. c) Imagen
Cuantizada
Por ejemplo si se utilizan palabras de 6 bits, entonces sólo hay 64 posibles valores para
asignar.
Una imagen de intensidad I(x, y), donde x = 0, 1,…, N-1 y y = 0, 1,…, M-1 (N es
14
( ) ( ) ( )
( ) ( ) ( ) ( )
[ ] (2.1-2)
( ) ( ) ( )
de pixeles para el alto (HH) y ancho (HW) de la imagen. En la figura 2.7 se puede
observar una imagen digital con un acercamiento que muestra como la imagen continua
se aproxima por una cuadrícula, donde cada elemento posee un valor discreto y
representa un pixel.
matriciales con la forma de la ecuación 2.1-2; donde cada matriz representa los tonos R,
G y B, cuantizados y codificados con palabras de código 8 bits por pixel, por lo tanto
cada componente de color se encuentra dentro del rango [0, 255]. En este sistema, los
15
colores se definen mediante vectores de la forma (R, G, B), entonces cualquier color C,
se define como:
( ) (2.1-3)
Por ejemplo el color negro corresponde al vector (0, 0, 0), el blanco a (255, 255,
255), el rojo a (255, 0, 0), el verde a (0, 255, 0), el azul a (0, 0, 255).
espacio RGB
Cuando se almacenan 24 bits por píxel se habla de color verdadero, debido a que
la policromía se acerca a lo que el ojo humano puede encontrar en el mundo real y que
humano se torna incapaz de notar la diferencia entre estos. Se usa un byte para
representar la intensidad de cada uno de los tres tonos primarios: rojo (R, red), verde (G,
green) y azul (B, blue); y por lo tanto cada píxel puede tomar
colores distintos.
16
Los colores también se pueden representar en otros modelos de color, como el
otros países.
(2.1-4)
del ojo a los colores RGB. La intensidad se conoce también como “escala de grises”
Las dos señales de color necesarias para obtener una imagen de color completa
son las llamadas diferencias de color: R-Y y B-Y. Si se transmite la señal “Y” y los dos
colores combinados R-Y y B-Y, es fácil extraer el color verde mediante restas sencillas
( ) ( ) (2.1-5)
( ) ( ) (2.1-6)
1
Tanto la letra Y como I hacen referencia a la intensidad, y para la componente de Crominancia
se distingue así I’.
17
La relación entre los espacios RGB y YI’Q se muestra en forma matricial en la
ecuación 2.1-7. Donde se puede demostrar que si los componentes R, G y B son iguales,
[ ] [ ] [ ] (2.1-7)
(segmentación) de uno o varios objetos de interés del resto de la imagen. Estos objetos
tales como: color, bordes, textura, movimiento, entre otros. La segmentación terminará
contornos definidos.
Conectividad: Los píxeles pertenecientes al mismo objeto tienen que ser contiguos,
18
De acuerdo con el problema de segmentación por resolver, éste se puede abordar
contextuales.
segmentada
Las técnicas contextuales tienen en cuenta las relaciones que existen entre los
objetos de la imagen, consideran tanto las características del píxel como su vecindad
con otros. Los algoritmos contextuales están basados en los conceptos de:
detectando cambios abruptos en los niveles de gris de la misma; mientras que las
técnicas orientadas a similitud intentan crear regiones uniformes agrupando píxeles que
que aparecen en la imagen. Los píxeles se agrupan de acuerdo a algún atributo común
binarización.
2.2.1 Umbralización
industria. Se trata de definir un umbral, de forma que separe los objetos de interés
respecto del fondo. Para su aplicación se exige una clara diferencia entre los objetos y el
histograma h(I) de una imagen de intensidad I(x, y). Cuando éste presenta dos picos y en
entre ambos hay un valle, el umbral quedará fijado por la posición del valle (Ver
binaria), la clasificación se puede realizar con un solo umbral , entonces para convertir
una imagen de intensidad I(x, y) en una imagen binaria B(x, y), se clasifican aquellos
píxeles en la imagen I(x, y) con un nivel de gris menor o igual al umbral en la clase
c0, el resto pasarán a ser la clase c1, según la ecuación 2.2-1, donde c0 y c1 contienen los
valores negros (píxeles del fondo) y blancos (píxeles de los objetos) respectivamente,
( )
( ) { (2.2-1)
( )
20
Por ejemplo, en la figura 2.10 se encuentra la imagen de intensidad a umbralizar
imagen 2.10
21
Como se muestra en la figura 2.11, el umbral puede tomar diferentes valores,
entonces su cálculo se puede hacer de manera manual o automática, maximizando una
función de verosimilitud (Ver sección 2.6).
intensidad igual a cero hasta el nivel de intensidad igual a 25, para este caso el umbral
es 12.
12
h(I)
10
Histograma
8
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 I
valores, por otro lado, cuenta con la desventaja de que no da información alguno sobre
la ubicación espacial de los píxeles, por lo que distintas imágenes puede tener el mismo
histograma.
píxeles en una imagen; cuando una imagen posee valores de N y M bastante grandes,
h( I )
p( I ) (2.3-1)
N M
23
Para la ventana cuadrada de ancho 2W+1 mostrada, el píxel del centro
corresponde a la posición (x, y). Sea I(x, y) el valor de intensidad del píxel en la posición
(x,y) de una imagen arbitraria, y (2W+1)2 pel2, donde W = 1, 2, 3, …., el área en número
de píxeles de la vecindad o máscara usada, se tiene que media local m(x,y) y la varianza
2 ( x, y) son:
Media:
W W
1
m( x, y )
(2W 1) 2
I ( x m, y n)
m W n W
(2.4-1)
Como ejemplo del cálculo de la imagen de media (Figura 2.14), se muestran tres
gradualmente.
24
25
Figura 2.14. Cálculo de la media
26
Figura 2.15. Imagen de Intensidad de prueba
Varianza:
27
Como ejemplo, al realizar un cálculo similar a la figura 2.14 pero considerando
2.15. Dichas figuras se muestran en la figura 2.17. Se observa que la varianza tiende a
aumento de W), pues más puntos en la vecindad del píxel actual son considerados para
el cálculo.
La imagen creada, a partir de hacer el cálculo anterior para todos los píxeles de
detalles dentro de la imagen en análisis. Por otro lado, la imagen de varianza local se
28
También se muestra como ejemplo, que si se umbraliza la imagen de la figura
eliminar puntos aislados, mientras que, en imágenes a escalas de grises, elimina ruido y
La mediana, consiste en el primer valor que deja por debajo de sí al 50% de los
mediana es el valor central, en uno par, se calcula como el promedio de los dos valores
centrales.
29
Para implementar el filtro de mediana, primero se selecciona una ventana
Luego, los valores de intensidad I(x+n, y+m) pertenecientes a todos los píxeles
original. Como ejemplo, los valores ordenados de forma ascendente para la ventana
mediana
en la posición de p5.
a algoritmos de umbralización.
verosimilitud
aleatorias pertenecen a dos o más clases diferentes y que se puede distinguir a que clase
pertenece una muestra, comparando su valor con uno o más valores de referencia o
umbrales.
31
Para describir los algoritmos de umbralización por máxima verosimilitud,
considérese una imagen de intensidad cuyos píxeles I(x, y), toman valores discretos de
la imagen se puede mostrar en la forma de un histograma h(I), con I = 1,.., 255, el cual
imagen N.
( )
( ) (2.6-1)
( )
[0,…, k] y C2 denota píxeles con valores de intensidad [k+1,…, 255]. Entonces sea p(I)
gaussianas sopesadas, con medias m1 y m2, varianzas σ12 y σ22 y pesos c1 y c2, donde se
p( I ) c1 p1 I C1 c2 p2 I C2 (2.6-2)
32
I m
j 2
2 cj 2 2j
p( I ) e (2.6-3)
j 1 2 2
j
k
c1 (k ) p( I ) (2.6-4)
I 0
255
c2 (k )
I k 1
p( I ) (2.6-5)
1 k
m1 (k ) I p( I )
c1 I 0
(2.6-6)
255
1
m2 (k )
c2
I p( I )
I k 1
(2.6-7)
1 k
12 (k ) I m1 p( I )
2
(2.6-8)
c1 I 0
255
1
22 (k ) I m p( I )
2
2 (2.6-9)
c2 I k 1
33
Figura 2.22. Densidad de probabilidad p(I) de la componente de intensidad
y un solo uno, donde la posición del 1 indica a cual clase pertenece el píxel I(x, y).
2
p( I ( x, y) ( x, y)) j ( x, y) p I ( x, y ) C j (2.6-10)
j 1
2 j ( x, y )
p( I ( x, y ) ( x, y )) p I ( x, y ) C j (2.6-11)
j 1
34
2
p ( x, y ) c j j
( x, y )
(2.6-12)
j 1
j ( x, y )
2
p I ( x, y ), ( x, y ) p ( x, y ) p I ( x, y ) ( x, y ) c j p I ( x, y ) C j (2.6-13)
j 1
densidad de probabilidad conjunta de los valores de I dados por los valores de θ están
dados por:
H w 1 H h 1 2
j ( x, y )
p I (0,0),..., I ( H w 1, H h 1) (0,0),..., ( H w 1, H h 1) p I ( x, y) C j (2.6-14)
x 0 y 0 j 1
H w 1 H h 1 2
j ( x, y )
p I (0,0),..., I ( H w 1, H h 1), (0,0),..., ( H w 1, H h 1) c j p I ( x, y) C j (2.6-15)
x 0 y 0 j 1
w2 (k ) c1 (k ) 12 (k ) c2 (k ) 22 (k ) (2.6-16)
N M N M N M
L1 (k ) log(2 ) log w2 (k ) (2.6-17)
2 2 2
35
L2 (k ) N M c j (k ) log c j (k ) L1 (k )
2
(2.6-18)
j 1
maximizar la función L1(k) (2.6-17). Por ello, el proceso de obtener un umbral con esta
maximizar la función L2(k) (2.6-18). Por ello, el proceso de obtener un umbral con esta
ecuación y usarlo para umbralizar una imagen de intensidad se suele llamar algoritmo
2.6-15.
N M N M 2 N M
L3 (k ) N M c j (k ) log c j (k )
2
log(2 ) c j (k ) log( 2j (k )) (2.6-19)
j 1 2 2 j 1 2
algoritmos anteriores:
36
Figura 2.23. Ejemplo 1: A: Imagen Original. B: Imagen Umbralizada
mediante Kittler.
mediante Kittler.
37
En la figura 2.23, se observa que al umbralizar mediante el algoritmo de Kurita
dio mejor resultado, que los otros 2; sin embargo en la figura 2.24, se observa que los 3
algoritmos dan resultados muy similares, pero al aplicar el algoritmo de error descrito
da mejor resultado.
38
2.7 Etiquetado Recursivo
imagen binaria, una etiqueta diferente, para ello se utiliza un método recursivo (se llama
a sí mismo varias veces) que analiza por cada píxel de una imagen binaria sus vecinos, y
le asigna una etiqueta a los vecinos que tengan la misma intensidad, luego se observa al
Este método tiene la ventaja de que permite contabilizar las regiones con píxeles
contiguos, además, de que se muestran en forma distintiva, lo cual es muy útil, ya que
39
Figura 2.27. Ejemplo de Imagen Etiquetada
muestras aleatorias en español, fue descrito por Fischler y Bolles en 1981 [15]. Este
partir de un conjunto de datos observados. Se asume que dentro del conjunto hay datos
típicos (datos que tienen coherencia con el modelo seleccionado) y datos atípicos (datos
que contienen errores significativos con el modelo). Este algoritmo tiene la habilidad de
estimar en forma robusta los parámetros del modelo matemático, es decir, estima con un
alto grado de exactitud los parámetros del modelo aunque existan datos atípicos en el
conjunto de datos.
40
2.8.1 Descripción del algoritmo
muestras aleatorias, utilizan la mayor cantidad de datos posibles para encontrar una
solución inicial, y luego, se intenta eliminar datos atípicos a partir de esa solución
inicial. Pero, se tiene el problema los parámetros del modelo inicial se afectan
manera iterativa y aleatoria, un modelo inicial para los datos, utilizando un conjunto
subconjunto del conjunto original de datos. Luego, se evalúa que tan bien se ajustan
todos los otros datos del conjunto de datos original al modelo recién estimado. En caso
modelo estimado, se dice que este último es suficientemente bueno para representar al
conjunto original de datos. Entonces los parámetros del modelo final son estimados
utilizando todos los datos que se ajustaron adecuadamente al modelo inicial. Por otro
lado, en caso de no haber suficientes datos del conjunto original que se ajustan
conjunto de datos inicial para encontrar un nuevo modelo inicial. En [15] se establece
“Dado un modelo que requiere un mínimo de b datos para iniciar sus parámetros
una tolerancia de error con respecto al modelo M1. El conjunto S1* se denomina
de una estimación de la cantidad de datos atípicos en P, use S1* para computar un nuevo
modelo de M1.
iguales que el umbral t, utilice el conjunto de consenso más grande para encontrar los
figura 2.28.
Figura 2.28 Algoritmo RANSAC. (a) Conjunto de datos. (b) Recta definida
por los datos A y B. (c) Distancia de referencia o umbral para la recta de la imagen
mostrada en (b), líneas punteadas. (d) Recta definidita por los datos C y D, donde
C es un dato atípico.
42
Para aplicar el algoritmo RANSAC se debe primero establecer tres valores
típico o atípico; puede ser estimado con base en los requerimientos específicos de la
respecto a un modelo es una función del error asociado al dato en particular y del error
asociado al modelo. Así, en algunos casos es posible establecer de forma analítica los
de los datos con el modelo. Sin embargo, encontrar analíticamente esta tolerancia no
siempre es viable y se debe recurrir entonces a otras formas más prácticas para
ser tan grande que se hace muchas veces improcedente o innecesario repetir el
algoritmo para cada subconjunto. En ese contexto es donde toma importancia el valor
que se escoge como número máximo de veces que se repetirá el algoritmo para
intentos debe establecerse suficientemente grande de modo que se asegure, con una
probabilidad ρ, que al menos uno de los intentos, los A elementos de datos escogidos
43
Sea:
un dato atípicos.
(1-αA)η: probabilidad de que todos los η grupos (de A elementos cada uno)
1 A 1
(2.8-1)
log 1 A log 1
(2.8-2)
log 1
log 1 A
(2.8-4)
caso de que el número máximo de intentos no sea un número entero, η debe redondease
44
El porcentaje aceptable de conjunto consenso es un valor importante para
ahorrar tiempo de procesamiento; indica que tan grande debe ser un conjunto de
este valor.
Se considera que el porcentaje aceptable del tamaño del conjunto consenso con
respecto a la cantidad de datos total es similar al porcentaje de datos típicos que se cree
necesidad de que haya que interferir con él extrayendo muestras del reactor biológico.
estimar a partir de las imágenes obtenidas la densidad celular y viabilidad de las células
dentro del reactor, dos de las variables más importantes en el control de un proceso de
fermentación.
45
El tubo de inmersión es parte del microscopio. Un orificio en las paredes del
tubo de inmersión permite el flujo del cultivo celular a través de la zona de muestreo, de
la manera mostrada en la figura 2.30 [14]. Este aparato también se compone de un tubo
interno, localizado dentro del tubo de inmersión y en el mismo eje que el tubo de
inmersión. Un extremo del tubo interno está orientado hacia la zona de muestreo, el otro
extremo del tubo interno del microscopio está conectado a una cámara CCD, para
biológico a través de un puerto lateral estándar de 25mm, así es posible tomar imágenes
del cultivo celular directamente dentro del medio en que se desarrolla el cultivo. (Ver
figura 2.31).
46
Figura 2.31. Microscopio In-Situ montado en un reactor biológico.
Para capturar las imágenes se utiliza una cámara digital tipo CCD con escaneo
aumento de 4-veces y apertura numérica de 0.1. La iluminación dentro del reactor está a
observa el fondo. En la figura 2.32 se muestra un ejemplo de una imagen capturada por
el microscopio in-situ. Una vez obtenidas las secuencias de imágenes, es posible estimar
47
Figura 2.32 Imagen de intensidad obtenida con el microscopio in-situ.
48
3. Capítulo 3: Algoritmo de Segmentación basado en
Espinoza en [5], con la implementación del algoritmo de RANSAC; pero que, primero
obtendrán con el algoritmo propuesto en este trabajo serán comparados con los
principales de dicho algoritmo, así como algunas de las ventajas y desventajas que
presenta.
49
3.1.1 Descripción
intensidad (ver figura 2.32), la imagen de varianza local, esto se debe a que, primero se
que es de bajo contraste, lo que no permite una buena y confiable segmentación, ya que
en la figura 3.1.
fondo es muy constante u homogéneo, es decir, posee una varianza local baja, mientras
homogéneo, por lo tanto tiene varianza local alta; por ende, se utiliza una nueva regla de
clasificación que evalúa la varianza local de cada píxel. Para ello, se utiliza una ventana
cuadrada de tres píxeles de alto por tres píxeles de lado (W = 1) (ver sección 2.4).
50
En la figura 3.2 se muestra la imagen de varianza local que se obtiene a partir de
efectivamente la varianza es mayor en las regiones que son parte de las aglomeraciones
esta imagen con un solo umbral, es decir, se seleccionan como píxeles pertenecientes a
las aglomeraciones celulares todos los píxeles cuyo valor de varianza local sea mayor
pertenecientes al fondo todos los píxeles que tengan una varianza local menor que dicho
umbral.
51
En este caso, el umbral óptimo se estima mediante el algoritmo de estimación
por máxima verosimilitud propuesto por Kittler [8] y descrito en la sección 2.6 de este
figura 3.3. Se genera una imagen binaria, porque se define que para píxeles con valores
de varianza local mayor o igual del umbral, tengan un valor de intensidad de 255
52
3.1.2 Pasos posteriores a la umbralización global de la varianza local
y también existen puntos aislados (para la figura mostrada son puntos blancos). Por
resultado. Así, el siguiente paso del algoritmo consiste en aplicar un filtro de mediana
con una ventana cuadrada de cinco píxeles de alto por cinco píxeles de lado (ver sección
2.5) para eliminar puntos aislados de la imagen binaria que resulta de la umbralización y
también suavizar los bordes de las regiones encontradas (ver figura 2.21). Sin embargo,
después de aplicar el filtro de mediana permanecen aún algunas regiones que por su
pequeño tamaño es poco probable que sean aglomeraciones celulares. Para eliminar
aglomeraciones celulares (ver sección 2.7), se calcula el área en píxeles de cada región y
se eliminan todas aquellas con un área menor al 0.05% del área total de la imagen.
como aglomeraciones celulares, los cuales deben ser también eliminados. El resultado
final del algoritmo después de aplicar estos pasos a la imagen mostrada en la figura 3.4
se presenta a continuación.
53
Figura 3.4 Imagen binaria resultado del algoritmo de umbralización de la
varianza
muy pocos pasos, por lo que requiere de poco tiempo de procesamiento. Una de las
principales desventajas del algoritmo es que aunque corrige el problema de los errores
que las aglomeraciones reales en la imagen (ver figura 3.5), lo que también conlleva a
que dos o más regiones celulares cercanas se consideren como una sólo región, es decir,
no se separan. Lo anterior ocurre dado que la varianza local en los píxeles del fondo
54
cercanos a las aglomeraciones celulares es también alta, y por consiguiente al realizar el
de las aglomeraciones celulares. Este problema se puede medir por medio del error
de los píxeles dentro de cada región, para ello se utiliza una regla de clasificación
encontradas estén más cerca de los límites reales de las aglomeraciones celulares en la
55
imagen, es decir reducir o eliminar el error de precisión (problema de la
sobresegmentación).
posible encontrar un umbral local a partir del valor medio de dichos valores.
como una función de densidad de probabilidad Gaussiana, descrita por dos parámetros:
el valor medio y la varianza de los valores de intensidad de esos píxeles. Los parámetros
esos píxeles no cumplen con este modelo por diversas razones, como por ejemplo
debido a que se encuentran sobre otra aglomeración celular vecina. Entonces, para
encontrar el umbral local thr,l, donde r es la región, y l significa local; que umbraliza los
56
alrededor de la región r), alrededor de la región correspondiente, que sí cumplen con el
modelo.
le llama ‘Er,i’ o también llamados datos típicos. Y se define también ‘Er,o’ o datos
supuesto de intensidad similar y por ello deben ser detectados y excluidos del cálculo
∑ (3.2-1)
este trabajo. Para aplicar este algoritmo, se describe cada píxel del conjunto Er, que
ahora describir estos datos mediante un modelo matemático, en este caso mediante una
recta.
píxeles distintos e iniciar el modelo trazando la línea L definida por los correspondientes
pares ordenados para dichos píxeles (esta recta es lo que se describe en la sección 2.8.1
como el modelo inicial M1). Todos los píxeles cuyos pares ordenados estén a una
distancia de la línea L menor que un umbral δ son definidos como posibles datos típicos,
es decir son definidos como parte del conjunto de consenso para el modelo M1. El
57
umbral δ se define como la desviación estándar de la intensidad de todos los píxeles
porcentaje de píxeles que forman parte del conjunto de consenso mediante la siguiente
expresión:
Q
Pr ,i (3.2-2)
G
similar para esa región es el conjunto consenso encontrado. En caso contrario se repiten
los pasos anteriores hasta superar dicho umbral o hasta superar un número máximo de
uno de los intentos los dos píxeles iniciales escogidos al azar eran buenos candidatos se
intensidad similar para todas las regiones tal como se describió anteriormente, se calcula
58
Finalmente se procede a realizar la umbralización local, este proceso se repite
para cada una de la R aglomeraciones celulares de la imagen (ver figura 3.6). En este
caso, los píxeles con intensidad menor que el umbral son seleccionados como píxeles
pertenecientes a las aglomeraciones celulares y los píxeles con intensidad mayor que el
aisladas, y vacíos en las regiones. Por ello, se aplican en este caso los mismos pasos
59
posteriores que se aplican en el algoritmo de umbralización global de la varianza. Estos
pasos consisten en aplicar un filtro de mediana con una ventana cuadrada de cinco
píxeles de alto por cinco píxeles de lado (ver sección 2.5) para eliminar puntos aislados
celulares, se calcula el área en píxeles de cada región y se eliminan todas aquellas con
tamaño. El resultado final del algoritmo después de aplicar estos pasos a la imagen
60
3.2.3 Ventajas y desventajas del algoritmo de umbralización local de la
intensidad
aglomeraciones celulares son más cercanas a las reales que al utilizar el algoritmo
anterior, pero aún presentan en menor medida errores de precisión (ver figura 3.8).
aglomeraciones celulares contienen en su periferia áreas que son más claras que el
61
Figura 3.9. Problemas del algoritmo de Espinoza
62
4. CAPÍTULO 4: Algoritmo propuesto de segmentación de
algoritmo de Espinoza, descrito en [5], es decir, lograr que los límites de las regiones
encontradas estén más cerca de los límites reales de las aglomeraciones celulares en la
reclasificación de los píxeles dentro de cada región, así que también se utiliza una regla
descrito en [4], la manera en que se selecciona el umbral local, los pasos posteriores a
umbralización global” será definido como el valor medio de los valores de intensidad de
probabilidad de los valores de intensidad alrededor de la región como una sola función
bimodal
intensidad atípicos. Los parámetros óptimos de este nuevo modelo, incluyendo el valor
64
medio de los valores de intensidad de los píxeles del fondo, son estimados mediante la
Entonces, para estimar el umbral local thr,l, el cual se utiliza para umbralizar los
píxeles de cada región r, con r=1,…, R; se ubican los bordes de cada región, y se calcula
2.6-7, para estimar la media de la población del fondo, aplicada con el kóptimo
encontrado. Luego, se umbraliza esa región r con la media que se estimó anteriormente.
65
Finalmente, se repiten los pasos anteriores para el total de regiones R de la
imagen. Por ejemplo, para la región que se muestra en el histograma de la figura 4.2 se
la figura 4.3.
66
Por consiguiente, al igual que en [4], se propone realizar una técnica de filtrado
para conseguir un mejor resultado. Así, el siguiente paso del algoritmo consiste en
aplicar un filtro de mediana con una ventana cuadrada de cinco píxeles de alto por cinco
píxeles de lado (ver sección 2.5) para eliminar puntos aislados de la imagen binaria que
umbralización
aglomeraciones celulares (ver sección 2.7), se calcula el área en píxeles de cada región y
se eliminan todas aquellas con un área menor al 0.05% del área total de la imagen.
67
Finalmente existen algunos pequeños huecos o vacíos en las regiones
seleccionadas como aglomeraciones celulares, los cuales deben ser también eliminados.
de la imagen de intensidad
68
4.1.3 Ventajas y desventajas del algoritmo de umbralización local de la
imagen de intensidad
se obtiene un mejor resultado, es decir, reduce el error de precisión, porque las fronteras
de las regiones clasificadas como aglomeraciones celulares son más cercanas a las
fronteras reales.
erróneamente como fondo, píxeles que pertenecen a una región o aglomeración celular,
considera pero el de Espinoza no; esto se debe porque al eliminar pequeñas regiones,
Espinoza elimina las que contienen un área menor al 5% del área de la región de mayor
69
tamaño, y no las que poseen un área menor al 0,05% del área total de la imagen, tal y
70
5. CAPÍTULO 5: Algoritmo de Error Cuadrático Medio
seleccionan regiones de mayor tamaño que las regiones reales surge un problema
segmentación obtenidos mediante el algoritmo con una segmentación manual. Para tal
obtenidos.
resulta bastante sencillo para el ser humano, dado que es fácil decidir cuáles partes de la
imagen contienen aglomeraciones celulares y cuáles no; aunque la posición posible del
borde puede tener varios píxeles de grosor, esto en el sentido de que la célula tiene
regiones oscuras, y regiones claras similares al fondo, por lo resulta un tanto subjetivo
blanco.
72
5.2 Cálculo del error cuadrático medio
para esto se obtiene la distancia al cuadrado que existe entre un píxel del borde de una
73
d i2 d x2 d y2 (5.2-1)
como parte del borde de una aglomeración celular mediante el algoritmo, y los valores
píxel hasta el píxel más cercano seleccionado como borde en la segmentación manual.
Una vez obtenidos estos valores es posible calcular el error cuadrático medio
(MSE por sus siglas en inglés) de la segmentación obtenida mediante el algoritmo con
la siguiente expresión:
1 2
MSE di
i 1
(5.2-2)
algoritmo.
5.2.1 Penalización
74
borde del algoritmo está demasiado afuera o adentro de la región con respecto a la
segmentación manual.
( ) ( ) ( ) ( ) (5.2-3)
regiones que se encuentra cerca de la región que se está analizando. Por consiguiente, se
utiliza una ventana de 11 por 11 píxeles; hay que tener precaución de que la ventana no
75
6. CAPÍTULO 6: Resultados Experimentales
aglomeraciones celulares. Los datos son imágenes reales de intensidad (512x510 pixel2)
de 20 veces (20X).
hicieron las pruebas de precisión, en donde se escogió como parámetro para medir la
76
6.1 Resultados del MSE para la secuencia “Serie 550”
Las mediciones del error cuadrático medio se realizaron para las once imágenes
[4]).
77
Figura 6.1. Comparación Imagen 550
78
Figura 6.2. Comparación Imagen 551
79
Figura 6.3. Comparación Imagen 552
80
Figura 6.4. Comparación imagen 553
81
Figura 6.5. Comparación imagen 554
82
Figura 6.6. Comparación imagen 555
83
Figura 6.7. Comparación imagen 556
84
Figura 6.8. Comparación imagen 557
85
Figura 6.9. Comparación imagen 558
86
Figura 6.10. Comparación imagen 559
87
Figura 6.11. Comparación imagen 560
88
En las imágenes anteriores, se observa que visualmente el algoritmo propuesto
umbralización
MSE / pixel2
Imagen
Algoritmo de Martínez [4] Algoritmo de Espinoza [5] Algoritmo propuesto
89
En esta tabla es evidente que existe una mejora al utilizar el algoritmo nuevo con
respecto a los otros dos algoritmos anteriores basados en umbralización. Para esta
en promedio un 56.59% menor que el error cuadrático medio obtenido con el algoritmo
en [5].
algoritmo de umbralización local es más preciso que uno de umbralización global, como
Espinoza, elimina datos atípicos a partir de una distancia de referencia (definida como la
desviación estándar de los píxeles del borde de la aglomeración); al eliminar estos datos,
importantes en la estimación.
90
considera los píxeles de intensidades mayores. Esta consideración se relaciona
gráfico:
91
Figura 6.13. Resultados graficados de la Serie 550
obtienen con cada algoritmo sobre una sección de una de las imágenes de intensidad
manual, el azul es del algoritmo descrito en [4], el verde del [5] y el rojo del
algoritmo propuesto
92
De la figura anterior se observa que los bordes obtenidos mediante el algoritmo
de umbralización global descrito en [4] (azules) son bastante lejanos a las fronteras
obtenidas con el algoritmo de umbralización local descrito en [5] (verdes) son más
cercanas, pero también presentan sobresegmentación. Los píxeles con color verde agua
se obtienen cuando los bordes del algoritmo descrito en [4] coinciden con los del
descrito en [5].
Finalmente, las fronteras obtenidas con el algoritmo propuesto son las más
similares a las fronteras marcadas manualmente, lo cual justifica que se haya encontrado
con anterioridad, es más preciso en todas las imágenes de la serie 550, y en general es
mejor en un 29%, lo cual se confirma visualmente cuando los bordes segmentados con
el algoritmo propuesto, se encuentran más cerca del borde manual, que los del algoritmo
descrito en [5].
umbrales que se obtienen con los algoritmos de Espinoza, y el propuesto; esto para 31
93
Tabla 6.2. Tabla comparativa de umbrales entre algoritmo de Espinoza y
Propuesto
Umbral Algoritmo
94
De la tabla anterior se observa que en su mayoría para las regiones con
desviaciones estándar menores a 3 (por ejemplo la región 10, 27, 30) el umbral del
algoritmo propuesto es mayor que el umbral del algoritmo de Espinoza, y por lo tanto
los datos atípicos que se eliminan son distintos (un umbral mayor implica que más
del Algoritmo de Espinoza); mientras que las regiones con desviaciones estándar
mayores o iguales a 3, los umbrales son muy parecidos, lo que implica que los datos
95
Al realizar un acercamiento se observa que el algoritmo propuesto considera
más píxeles del borde, es decir más alejados de la aglomeración, para la estimación del
umbral, mientras que el algoritmo de Espinoza sólo elimina algunos puntos al momento
de realizar la estimación.
Con las figuras 6.15 y 6.16 se muestra que la forma de eliminar los datos
atípicos que se encuentran el borde de cada región, varía según se modele la densidad de
probabilidad de esos valores de intensidad, ya sea como una sola función de densidad de
varianzas.
Esta diferencia influye en la estimación del umbral, por lo tanto, aunque hay
regiones con umbrales muy similares, las que poseen umbrales distintos hacen la
96
7. CAPÍTULO 7: Conclusiones y recomendaciones
7.1 Conclusiones
de segmentación que pertenecen a este grupo, los descritos en [4,5]. Sin embargo, estos
resultados.
filtro de mediana regiones, y del rellenar los “vacíos”). A partir de esta imagen
97
Para comprobar el correcto funcionamiento del algoritmo de segmentación
propuesto, así como para comparar la precisión del nuevo algoritmo, se realizaron
pruebas con imágenes reales de cultivos celulares capturadas por un microscopio in-situ
de la posición de los bordes obtenidos con los algoritmos con respecto a la posición de
7.2 Recomendaciones
con la mejora de utilizar como estimador del umbral no sólo la media, sino que también,
la desviación estándar de cada región de la población del fondo, ya que esta se puede
utilizar para aumentar o disminuir el umbral obtenido, y con esto mejorar aún más la
98
BIBLIOGRAFÍA
T. Scheper, “Optical Inline Measurement Procedures for Counting and Sizing Cells in
Cell Counting for In-Situ Microscopy", IAPR 19th International Conference on Pattern
Recognition 2008 (IAPR ICPR-2008), Tampa, Florida, USA, December 8-11, 2008.
density estimation from a Still Image for in-situ microscopy”, In Proceedings of IEEE
imagen del fondo, Tesis de Licenciatura, Universidad de Costa Rica, Enero 2009.
Proceedings of IEEE Transactions Systems, Man and Cybernetics, vol. SMC-9, no.1,
pp.62-66, 1979.
based on population mixture models”, Pattern Recognition, vol.25, no. 10, pp. 1231-
1240, 1992.
100
[11] G. Martínez, “Criterion for automatic selection of the most suitable
Dimensional Shape Estimation of BHK Cell Clusters from a Still Image Based on
[13] Siles, F., “Estimación de la forma y textura celular para microscopía in-
[14] I. Cseke, “A fase segmentation scheme for white blood cells images”, In
[15] M.A. Fischler and R.C. Bolles, “Random sample consensus: A paradigm
for model fitting with applications to image análisis and automated cartography”,
Comunications of the ACM, vol. 24, no. 6, pp.381-395, 1981.
101