Vous êtes sur la page 1sur 5

OBTENCIN AUTOMTICA DEL CARIOTIPO BOVINO MEDIANTE

PROCESAMIENTO DIGITAL DE IMGENES Y RECONOCIMIENTO DE


PATRONES
Leandro E. Agudelo

Diana M. Moreno

Camilo A. Riveros

Juana Moncaleano

Angel
Cruz-Roa

Universidad de los
Llanos
leandroagudelo@gmail.c
om

Universidad de los Llanos

Universidad de los
Llanos
camiand@gmail.com

Universidad de los
Llanos
juanamoncaleano@g
mail.com

Universidad de los
Llanos
aacruz@unillanos.ed
u.co

dianam.morenoh@gmail.
com

Resumen
Este artculo propone un mtodo de diseo e implementacin de un
sistema para la clasificacin automtica de cromosomas bovinos.
Este sistema es una herramienta que permite la generacin
automtica del cariotipo. En la primera etapa, se realiz una
segmentacin de los cromosomas la cual es una combinacin de
tcnicas de umbralizacin local y morfologa matemtica. Se estudi
e implement varios descriptores geomtricos y morfolgicos
representados por un vector de caractersticas para la representacin
de los cromosomas. Unas
redes neuronales artificiales tipo
perceptron multicapa fueron utilizadas como clasificadores en la
etapa de aprendizaje. Los vectores de caractersticas y clasificadores
se evaluaron para cuatro tareas distintas; reconocimiento de
cromosoma vs objetos, identificacin del cromosoma X,
identificacin del cromosoma Y e identificacin de los pares
homlogos de cromosomas. Los resultados muestran el mejor
desempeo de esta metodologa, la cual puede ser empleada para la
extraccin automtica del cariotipo en los laboratorios de gentica
Palabras Claves: Cariotipo, clustering, cromosomas, procesamiento
digital de imgenes, Redes Neuronales Artificiales.

Abstract
This paper show a proposal method to design and implement a
system for automatic bovines chromosomes classification. This
system is a tool that allows automatic generation of karyotype. The
first step is the chromosomes segmentation, which occurs as a result
of the study and implementation of different techniques of local
threshold estimation combined with mathematical morphology. We
studied and implemented various geometrical and morphological
descriptors are represented by a feature vector and some Artificial
Neural Networks are used like classifiers. Feature vectors and
classifiers were evaluated in different categories, Chromosome Objects, Chromosome X, Chromosome Y, homologous pairs. The
final results show the best performance of this methodology and can
be used for automatic extraction of karyotype in genetics labs.
KeywordsKaryotype, clustering, Chromosome, digital image
processing, artificial neural networks.

I. INTRODUCCIN

En este artculo se hace una exposicin de algunos temas


relevantes del desarrollo del presente trabajo entre los cuales
tenemos definiciones de que es un cariotipo, los materiales y
mtodos empleados, clasificadores implementados y los

resultados de los mismos, los antecedentes, conclusiones y


trabajos futuros.
El cariotipo es un instrumento de vital importancia en el
estudio de la citogentica [2], a partir de este se pueden
encontrar y evaluar cambios numerales y estructurales de los
cromosomas de una determinada especie (principal causa de
retraso mental, malformaciones mltiples, prdidas
reproductivas y defectos congnitos, cncer, infertilidad y
abortos espontneos, entre otros), as como las consecuencias
genticas, citolgicas y evolutivas de stas.
Los cromosomas son organelos constantes en nmero, forma y
caractersticas. Pero los cromosomas de una clula pueden ser
diferentes unos de otros. Esta diferencia est, sobre todo, en la
posicin del centrmero, que es variable, lo que permite
clasificar a los cromosomas metafsicos en metacntricos,
submetacntricos, acrocntricos y telocntricos, segn tengan
el centrmero en medio, desplazado hacia uno de los brazos,
casi en el extremo o en el extremo, respectivamente [1].
El proceso manual de cariotipado de los cromosomas bovinos
es tedioso. Ya que la elaboracin del cariotipo consiste en
recortar los cromosomas de fotografas de metafases y obtener
medidas o datos de cada uno para determinar de esta forma
los pares y elaborar el cariotipo, proceso en el cual se invierte
demasiado tiempo y trabajo.
Como antecedente en la Universidad Industrial de Santander
se realiz un trabajo para la obtencin de cariotipos humanos.
La tcnica desarrollada comprende tanto la obtencin de las
caractersticas de la imagen (cromosomas) humanos, como su
posterior organizacin en un cariotipo. Toda la interfaz fue
realizada mediante el software Matlab 5.1, en esta se realiza
de forma manual la separacin de cromosomas unidos o
traslapados, eliminacin de impurezas y correccin de
cromosomas recortados. [10]

En el presente trabajo se muestra el desarrollo de un prototipo


de sistema de clasificacin automtica de cromosomas
bovinos para la obtencin del cariotipo mediante tcnicas de
procesamiento digital de imgenes y reconocimiento de
patrones, el cual fue puesto a prueba en el Laboratorio de
Citogentica y Reproduccin Animal de la Universidad de los
Llanos para el estudio citogentico de bovinos, con un valor

agregado que permite la clasificacin manual de otras


especies.
El presente articulo esta organizado como sigue. En la Seccin
II, se describe el cariotipo, su importancia y composicin. La
Seccin III, contiene los materiales y mtodos utilizados para
la adquisicin de las imgenes, la tcnica de segmentacin y
procesamiento, y finalmente la extraccin de caractersticas.
La Seccin IV, describe los clasificadores utilizados. La
Seccin V presenta los resultados de cada etapa de la
metodologa propuesta. Finalmente, la Seccin VI muestra las
conclusiones y trabajo futuro.

B. Segmentacin automtica.
Se evaluaron distintos mtodos de segmentacin, entre los
cuales se destacan mtodo Otsu, Pun1, Pin2, Kapur, Sahoo y
Wong, Johannsen y Bille, umbralizacin local adaptativa,
donde finalmente, los mejores resultados, segn el porcentaje
de sensibilidad se obtuvieron con el mtodo de umbralizacin
local adaptativa, con un nico inconveniente, todas las
imgenes presentaron demasiado ruido. Para solucionar este
problema se realiz la operacin morfolgica binaria AND
con la imagen resultante de la segmentacin mediante el
mtodo Otsu [4] y la imagen segmentada del mtodo local
adaptativo, donde los resultados se observan en la Figura 1.

II. CARIOTIPO

Segn Battaglia [8], El Cariotipo es el complemento o


conjunto cromosmico tpico del individuo o de la especie en
el que se describe el nmero, forma y tamao de los mismos.
El cariotipo se perpeta normalmente en la progenie. Por
ello, el cariotipo y los cromosomas que lo conforman son los
elementos de estudio fundamentales en gentica por ser la
base fsica de los genes de procesos tales como la herencia, la
variacin, la mutacin y, en consecuencia, la evolucin de los
organismos.
El nmero de cromosomas es constante para todos los
animales normales en una especie dada (ver Tabla 1). Cuando
los cromosomas son fotografiados, recortados y ordenados en
pares, el cariotipo que resulta es idntico para todos los
miembros de la misma especie. Normalmente, los
cromosomas son pares homlogos (autosomas) a excepcin
de los cromosomas sexuales, los cuales son emparejados en
hembras pero no en machos [7].

Figura 1. a) Imagen original, b) Imagen con umbralizacin local, c)


Imagen con umbralizacin Otsu, d) Imagen resultado.

C. Filtro morfolgico.
Especie

# cromosomas

Humanos

46

Chimpanc

48

Perro

78

Bovinos

60

Pollos

78

Rana

26

Mosca

12

Tabla 1. Nmero de cromosomas de diferentes especies animales [9]

III MATERIALES Y MTODOS


A. Adquisicin de las imgenes.
Las imgenes de las metafases celulares de los bovinos se
adquirieron en un microscopio Nikon Eclipse E400 a una
magnificacin de 100X en formato JPG con una resolucin de
1280x960 bajo el estndar de color RGB (Fig. 1a).

Despus de eliminar la mayora del ruido se aplic un filtro


morfolgico (Filtro de rea). Esta clase de filtros morfolgicos
presenta la ventaja de filtrar los objetos deseados sin alterar la
forma original, lo que produce menor distorsin en la imagen.
Para obtener un buen resultado con el filtro se realiz un
anlisis estadstico de las caractersticas (descriptores
morfolgicos) de los cromosomas para determinar los rangos
de los valores de cada descriptor para los cromosomas.
D. Extraccin de Caractersticas.
Las condiciones que se tuvieron en cuenta para determinar
si un descriptor es aceptable o no para conformar el vector de
caractersticas
fueron:
discriminacin,
fiabilidad,
independencia y cantidad (pocos descriptores) [5]. Por esto, se
evaluarn distintos descriptores geomtricos y morfolgicos
entre los cuales se encontraban rea, permetro, momentos de
Hu, momentos AMI, descriptores de Fourier. Despus de
implementar y evaluar mediante anlisis estadstico de
distribucin normal, los diferentes descriptores geomtricos y
morfolgicos se evidenci la dificultad de encontrar un nico
vector de caractersticas que permitiera la clasificacin de los
cromosomas y la obtencin del cariotipo, para las categoras

de objetos definidas (cromosomas-objeto, cromosoma-X,


cromosoma-Y y pares homlogos). Por lo tanto, se decidi
dividir la clasificacin en grupos cuyas caractersticas fuesen
similares entre los miembros de la misma categora y
diferentes a las de las dems, obteniendo de esta manera dos
grupos principales, el de cromosomas y el de objetos (restos
citoplasmticos). El grupo de cromosomas se dividi en
cromosoma X, cromosoma Y y pares homlogos. De esta
manera se analizaron, implementaron y obtuvieron cuatro
vectores de caractersticas que permitieron la solucin del
problema y la obtencin del cariotipo [4] [5].
a) Vector de caractersticas para la clasificacin entre
Cromosomas y Objetos
Luego de realizar el anlisis estadstico de los descriptores
entre los cromosomas y otros objetos, se logr seleccionar el
vector caracterstico con mayor varianza intraclase y menor
varianza interclase, que finalmente estaba conformado por los
descriptores: elongacin, Hu1, Hu2, Hu3 y MeanG. Donde
Hu1, Hu2 y Hu3 son los tres primeros momentos invariantes
de Hu [6] y MeanG es el valor de la media de la componente
verde de color del objeto o cromosoma a evaluar [4].
b) Vector de caractersticas para el reconocimiento de pares
homlogos
Para la determinacin del vector de caractersticas de los
pares homlogos es importante tener en cuenta que los
mejores descriptores son los de tamao, ya que en el proceso
de obtencin de las metafases los cromosomas pueden sufrir
alteraciones de forma, ms no de tamao dificultando la
clasificacin por descriptores de forma. Por lo cual, utilizando
el mismo anlisis estadstico de la subseccin anterior, se
escogieron los descriptores de rea, permetro, eje mayor, eje
menor y rea convexa.

Figura 2: Imagen 70x50 dividida en matrices de 10x10 del


cromosoma X.

IV. CLASIFICACIN DE CROMOSOMAS


Luego de todo un proceso de seleccin e implementacin
de descriptores en las diferentes categoras en que se dividi el
problema, se logro maximizar los resultados mediante la
implementacin de los siguientes clasificadores:
A. Redes Neuronales Artificiales (RNA)
Este clasificador se implemento para la extraccin de los
cromosomas de los restos citoplasmticos y la diferenciacin
de los cromosomas X y Y de los pares homlogos
B. Arquitectura implementada en la clasificacin de los
Cromosomas y restos citoplasmticos (Objetos)
La RNA esta conformada por 3 capas: la primera capa
contiene 5 Neuronas y funcin Tangencial, la segunda capa 15
con funcin Tangencial y la tercera capa con una neurona y
funcin sigmoide como se muestra en la Figura 3. Para el
algoritmo de entrenamiento se utiliz Backpropagation,
usando el tipo trainscg del Neural Network Toolbox de
Matlab, este tipo de entrenamiento rpido es basado en el
algoritmo de gradiente conjugado escalado. [3].

c) Vector de caractersticas para el reconocimiento del


Cromosoma X
En la determinacin del vector de caractersticas para la
identificacin del cromosoma X se realizaron diferentes
pruebas con los descriptores; excentricidad, eje mayor,
circularidad, regularidad y eje menor. Donde los resultados
obtenidos no superaban las expectativas, por lo que se opt
por emplear una matriz de descriptores empleada en el
reconocimiento de caracteres.
Para la obtencin del vector de caractersticas mediante este
algoritmo se normalizaron todas las imgenes de los primeros
seis cromosomas de mayor rea, segmentados de la base de
conocimiento a un tamao de 70 x 50 pxeles, orientndolas
con respecto al eje mayor a 90. Teniendo la imagen a este
tamao se dividi en matrices de 10x10 y se realizo la
sumatoria de cada matriz generando el vector caracterstico, el
cual tiene un tamao de 35 datos que es normalizado al valor
mximo posible 100, como se muestra en la Figura 2.

Figura 3 Arquitectura Red Neuronal Cromosoma restos


citoplasmtico (objeto)

C. Arquitectura implementada para el reconocimiento del


Cromosoma X y Y
La red neuronal implementada es feedforward, est
compuesta por 2 capas: La primera capa contiene 10 neuronas
y funcin sigmoide, la segunda capa contiene 1 neurona con
funcin sigmoide, tal como se muestra en la Figura 4. Se
utiliz el algoritmo de entrenamiento backpropagation
traingdx, este entrenamiento es basado en el algoritmo de
retropropagacin de gradiente descendente con momento y

tasa de aprendizaje
convergencia rpida.

adaptativa, es

un

algoritmo de

segmentar los cromosomas con un 91.7% de sensibilidad este


resultado es de vital importancia ya que la umbralizacin es la
base de todo el sistema.
Partiendo de los resultados obtenidos en la umbralizacion se
lograron los siguientes datos de eficacia en los diferentes
grupos de estudio:
A. Eficacia del clasificador de los Cromosomas y restos
citoplasmticos (Objetos)
Desempeo general del sistema de clasificacin

Fig. 4 Arquitectura de la Red Neuronal para el reconocimiento de los


Cromosomas X y Y

Cromosoma

Nmero correctamente
clasificados
Entren.
Prueba

Exactitud (%)
Entren.

Prueba

Cromosoma

720

360

720

357

100

99,16

Objeto

67

19

67

18

100

94,73

TOTAL

787

379

787

375

100

96.94

D. Kernel de Distancia mnima

Tabla 2. Desempeo Red Neuronal Objetos

Este clasificador se emple para la agrupacin de los pares


homlogos de los cromosomas y se basa en la informacin a
priori como lo es:
Numero de objetos:
Numero de objetos por clster:
Numero de grupos:

Nmero de
Elementos
Entren.
Prueba

58 cromosomas.
2
29 pares.

Sensibilidad =

18
= 0,8571
18 + 3

Especificidad =

357
= 0,9972
357 + 1

Objeto Cromosomas TN FN TP

Este mtodo es denominado a priori ya que se supone el


conocimiento de toda la informacin necesaria y suficiente
para la clasificacin.
Se implement este mtodo mediante el clculo de la distancia
mnima euclidiana debido a que los descriptores como tal no
permitan diferenciar un par de otro mediante redes neuronales
o clustering, adems en cada metafase cambia la forma y el
tamao de los cromosomas lo que haca imposible crear un
estndar de tamaos y formas para cada grupo de par.
Este clasificador consiste en que a cada uno de los objetos con
sus respectivos descriptores (vector de caractersticas para
pares homlogos) se le determina su distancia euclidiana con
respecto a todos los objetos (cromosomas) y estas se tabulan
en una matriz de tamao (58X58) determinada por el nmero
de cromosomas descontando el par sexual segn la Tabla 1. A
partir de la matriz, se determinan los valores mnimos de las
columnas. Se halla la transpuesta de la matriz (que en este
caso equivale a hallar los valores mnimos de las filas).
Para la determinacin de los pares se realiza una AND
(operacin lgica) entre la matriz original, la matriz
transpuesta y la matriz triangular inferior de unos, para fijar
los puntos donde se encuentre un uno, la fila y columna que
contengan el 1 determinan un par homologo.
Se toman los pares encontrados y se reemplazan por valores
constantes para seguir en la bsqueda de nuevos pares, hasta
encontrar los 29.
V. RESULTADOS
La combinacin de dos mtodos de segmentacin con la
umbralizacin local adaptativa y el mtodo Otsu permiti

19

360

357

18

FP
1

99.16% 94.73%

Tabla 3. Medida de la especificidad y sensibilidad de la RNA


cromosoma resto citoplasmtico.

En los resultados de la Tabla 3 se observa que es ms fcil


identificar un cromosoma que un objeto debido a que las
caractersticas de los cromosomas son regulares mientras que
las de los objetos no.
B. Eficacia del clasificador para el reconocimiento del
Cromosoma X y Y
La RNA que identifica el cromosoma X del conjunto de
cromosomas obtuvo una sensibilidad de 91.6% y una
especificidad del 98.3%.
La RNA que identifica el cromosoma Y del conjunto de
cromosomas obtuvo una sensibilidad del 40% y una
especificidad del 98.57%. La baja sensibilidad es debido a la
variabilidad del cromosoma Y por las razas no-puras.
C. Eficacia del clasificador para el agrupamiento de los
pares homlogos
El sistema de clasificacin de los pares homlogos por el
kernel de distancia mnima obtuvo una precisin del 96.55%
con una sensibilidad el 100%.
En la Figura 5 se presenta un ejemplo del resultado final del
sistema desarrollado obteniendo un cariotipo con el
agrupamiento de los 29 pares y el par sexual de los
cromosomas X y Y.

No se logr disear un nico clasificador por redes neuronales


o clustering debido a que ninguno de los 37 descriptores
analizados cumpla con las caractersticas de discriminacin y
fiabilidad lo que ocasionaba que la red nunca lograra finalizar
su entrenamiento

Figura 5. Cariotipo obtenido de forma automtica por la


metodologa propuesta a partir de las imgenes de metafases
celulares.
VI CONCLUSIONES Y TRABAJO FUTURO
Los bovinos son una especie cuyo cariotipo se torna
complejo por el nmero de cromosomas y la morfologa de los
mismos, ya que poseen 60 cromosomas que deben ser
organizados en 30 pares de los cuales 29 pares son homlogos
acrocntricos y poseen una morfologa muy parecida, su
nica diferencia es el rea. En este trabajo hallar
caractersticas que mediante el procesamiento de imgenes
permitieran una completa diferenciacin, es difcil, para est
se realizaron anlisis y pruebas con 37 descriptores distintos.
La implementacin de las redes neuronales brinda robustez en
la clasificacin de los conjuntos cromosoma objetos X y Y,
gracias al vector caracterstico que se determino mediante una
matriz de descriptores empleada en el reconocimiento de
caracteres.
El proceso de segmentacin es la base del sistema, su
resultado influye en las dems etapas. Por tal motivo se realiz
una investigacin exhaustiva a diferentes tcnicas hasta lograr
una eficiencia superior al 75%, sta consisti en un hibrido
entre la umbralizacin adaptativa y el mtodo Otsu, que
optimiz la separacin de los cromosomas en un 91.7%.
En la obtencin del cariotipo se hizo necesario dividir en
diferentes conjuntos la clasificacin ya que los cromosomas
poseen una morfologa similar que dificultaba la obtencin de
pares homlogos, por ello se opt en dejar grupos de
cromosomas, objetos y pares sexuales para facilitar su
clasificacin y determinacin del cariotipo, obteniendo buenos
resultados.
En el anlisis de los descriptores y determinacin del vector
caracterstico del conjunto cromosoma objeto, se concluy
que los descriptores de forma (elongacin Hu1 Hu2 Hu3 y
MeanG) son los que presentaron mayor grado de eficiencia en
el clasificador ya que los cromosomas son muy similares en su
morfologa y por el contrario los objetos son amorfos con alta
variabilidad.

Para el clasificador de pares homlogos se determin que la


forma viable de clasificarlos era encontrar las mnimas
distancias del cromosoma evaluado con respecto a los dems,
basndose en conocimiento previo del conjunto de datos a
evaluar donde solo deben existir dos cromosomas con
caractersticas similares en tamao y forma. Convirtindose
as, en informacin a priori como el nmero de clsters,
objetos y cantidad de objetos por clster, donde cada cluster es
de dos (par homologo).
Es importante destacar que esta herramienta no solo clasifica
automticamente la especie bovina sino que puede clasificar
cualquier especie de forma manual para ello se crearon la
opciones de umbralizacin manual mejora del contraste,
retoque de la imagen, localizacin de cromosomas
segmentados y la creacin de reportes permitiendo guardar
esta informacin para futuros anlisis y estudios, superando
las expectativas del proyecto, brindando una herramienta til y
en produccin en el laboratorio de Citogentica de la
Universidad de los Llanos.
AGRADECIMIENTOS
Agradecimientos al Dr. Agustn Gngora, Ph.D., director
Laboratorio de gentica y reproduccin de la Universidad de
los Llanos, al Dr. Pablo Emilio Cruz, Ph.D. y el laboratorio de
Crioconservacion de Gametos por su colaboracin en la
adquicisin de fotografas de las metafases celulares.
REFERENCIAS
[1]

Arqueros E, Ponencia: Nuevas Salidas Profesionales: GenticaCitogentica-Gentica Molecular, XIII Congreso Nacional
Farmacutico Granada, 15-18 de octubre de 2002.
[2] Crdova J, Lamas G. Citogentica, Filogenia, Clasificaciones
Naturales Y Evolucin De Las Especies. Editorial Alma Mater.
pp 95 112. 1997.
[3] Demuth H, Beale M, Hagan M, Neural Network Toolbox 5
Users Guide.
[4] Escalera A. Visin por Computador, fundamentos y mtodos,
ed. Pearson Educacin. Madrid, pp. 251. 2001.
[5] Gonzlez R. Wintz P. Digital Image Processing, 2nd. ed.,
Addison-Wesley, Reading, MA, 1987.
[6] Hu M., Visual pattern recognition by moments invariant, IRE
transaction on
[7]
McFeely R. Advances in Veterinary Science and Comparative
Medicine Domestic Animal Cytogenetics. Vol 34, pp. 1-20.
[8] PBattaglia, E. 1953 Filogenesi del cariotipo nel genere
Scilla. II. Cariotipo diploide di Scilla autumnalis L. Atti
Soc. Toscana Sci. Nat.6
[9] Sanchez J. La informacin celular. Disponible en:
http://web.educastur.princast.es/proyectos/biogeo%5Fov/
[10] Sotaquira G Miguel, Sanchez N Jorge, Gualdron G. Oscar,
Vargas C. Clara, Obtencin de cariotipos (aplicaciones al rea
de
la
citogentica)
Colombia, Energa Y Computacin ISSN: 0121-5299, 2004
vol:XI
fasc:
2
pgs:
22
26