Académique Documents
Professionnel Documents
Culture Documents
Autores:
L.I. Roberto Oswaldo Cruz Leija
Profesor:
Dr. Raúl Santiago Montero
1
Índice general
Introducción 3
Antecedentes 4
0.1. Tipos de Clasicación 4
0.2. Clasicador MaxMin 4
0.3. Medición de Distancia 5
Desarrollo propuesto 7
Pruebas experimentales 8
0.4. Resultados de Clasicación 8
Conclusiones 10
Referencias 11
2
Introducción
En toda el área de Reconocimiento de Patrones es importante denir como objeti-
vo principal el de reconocer un conjunto de características, poder determinar con esa
información a qué clase de objetos pertenece. Estamos convencidos que la selección de
características es muy importante, si una buena selección será muy difícil tener clases
separadas que mejoren el criterio de clasicación. Existen diferentes técnicas o algorit-
mos de clasicación, algunos más robustos que otros pero todos gozan de un diferente
grado de conabilidad para determinadas situaciones. complejidad y porcentaje de clasi-
cación correcta. El objetivo de la Implementación es conocer a detalle el funcionamien-
to de diferentes clasicadores, conocer el comportamiento, identicar sus debilidades y
fortalezas.
Dentro del aprendizaje automático, encontremos técnicas de clasicación que nos
permiten agrupar muestras de acuerdo a criterios o métodos, estas técnicas son la clasi-
cación supervisada y la no supervisada.
El objetivo de la clasicación dentro del aprendizaje automático consiste en la asig-
nación de un objeto o un fenómeno físico a una de las diversas categorías o clases
especicadas (se hace referencia a clase como una agrupación de objetos que tiene car-
acterísticas comunes, o mejor dicho como un sinónimo de categoría). La clasicación es
una técnica muy útil, usada en diversos campos como el de reconocimiento de patrones.
3
Antecedentes
0.1. Tipos de Clasicación
0.1.1. Supervisada. Este tipo de clasicación cuenta con un conocimiento a pri-
ori, es decir para la tarea de clasicar un objeto dentro de una categoría o clase conta-
mos con modelos ya clasicados (objetos agrupados que tienen características comunes).
Podemos diferenciar dos fases dentro de este tipo de clasicación:
4
los elementos restantes del conjunto original en el grupo para el cual el elemento tenga
la mnima distancia al centroide del grupo. El algoritmo es el siguiente:
n
Dado un conjunto de ejemplos en < , cuya distribucion sugiere la existencia de al
menos dos grupos, este algoritmo determina la pertenecia de cada ejemplo a una clase
particular, emplenado un clasicador de mnima distancia.
Entrada:
Salida:
Paso 1. Asignar y1 = x1 , y2 = xj0 ,l11 = 1, l12 = j0 donde kxj0 −y1 k = max2≤i≤m kxi −yj k
Asignar k = 2, a = kyi − yj k(media), donde 1 ≤ i, j ≤ k ,i 6= j y X = X − {y1 , y2 }
'
0
Paso 2. Encontrar j0 , 1 ≤ j0 ≤ k y xi0 ∈ X tales que d = kxi0 − yj0 k =
maxxi ∈X 0 (min1≤j≤k kxi − yj k)
Si d < ta (no se requieren mas grupos) ir al paso 4. De otra forma, ir al paso 3.
0 0
Paso 3. Asignar k = k + 1,yk+1 = xi0 ,lk1 = i0 , X = X − {yk+1 }e ir al paso 2.
Paso 4. Asignar mj = 1,1 ≤ j ≤ k
0
Paso 5. Para cada xi ∈ X . Encontrarj : 1 ≤ j ≤ k para los cuales kxi − y1 k =
min1≤j≤k kxi − yj k y
asignar mj = mj + 1 y lmi j = i
Paso 6. Para 1 ≤ j ≤ k reemplazar yj por (x11j + x12j + · · · + x1mjj /mj ).
mj
Paso 7. Para 1 ≤ j ≤ k enviar a la salida yj ,mj ,{lij }i=1
1
g (x) = mT x − kmk2
2
Desarrollo propuesto
El objetivo de esta práctica es implementar el algoritmo No Supervisado Max-Min,
para poner aprueba el clasicador se utilizaron 2 bases de datos conocidas: Iris Plant
y Wine, dichas bases de datos presentan una variada distribución de los datos. Es im-
portante utilizar bases de datos como estas para tener una idea más amplia de cómo
funciona Max-Min. El en el siguiente esquema se muestra en general la forma de trabajar
del Clasicador Max-Min.
7
Pruebas experimentales
Para dar inicio a las pruebas experimentales es importante ver cómo están distribui-
dos los datos, en la siguiente graca se muestran los diferentes vectores de las diferentes
clases de la BD Iris Plant. Podemos ver claramente que una de las clases esta lineal-
mente separable a las demás, las otras 2 presentan un ligero cruce, dicho cruce provocará
confusión a la hora de clasicación.
8
Los vectores representativos de los cluster nales son los siguientes
Conclusiones
Cuando las clases están linealmente separables se espera el 100 % de clasicación
correcta
Entre mayor es el valor del umbral es ma dicil que aumenten los números de
clusters.
No es tan trivial determinar el rendimiento general del clasicador por el hecho
de ser un clasicador no-supervisado.
Puede ser que el algoritmo sea costoso computacionalmente si se utiliza la orde-
nación para obtener el valor máximo de mínimos.
10
Referencias
[Duda,2000] Duda R.O., Hart P.E., Stork D.G. Pattern classication.
www.cs.princeton.edu/courses/archive/fall08/cos436/Duda/PR_simp/lin_disc.htm
www.advancedtech.wordpress.com/2008/04/14/clasicaci on-supervisada-y-no-supervisada/
11