01 Clustering

Transféré par

Raul Erasto Espejel Jasso

0% ont trouvé ce document utile (0 vote)

18 vues3 pages

algoritmo Clustering

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

algoritmo Clustering

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

18 vues3 pages

01 Clustering

Transféré par

Raul Erasto Espejel Jasso

algoritmo Clustering

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 3

Rechercher à l'intérieur du document

Project

1 - Clustering
Fecha de publicación: 5 de abril de, 2017
Fecha de entrega: 27 de abril de 2017

1. Introducción

El proyecto tiene como objetivo exponer al alumno al estudio de un algoritmo y
su implementación. En particular, se estudia el problema conocido como
clustering (agrupamiento en español) y sus soluciones más simples, aunque no
las mas eficientes.

El problema de agrupamiento toma como entrada de datos un conjunto de
objetos y los debe separar en grupos, de manera que se maximicen los criterios
de:
• Similaridad. Los objetos de un mismo grupo deben ser similares entre sí.
• Diferencia. Los objetos en grupos diferentes deben ser disimilares.

El algoritmo de clustering debe encontrar similaridades de acuerdo a las
características de los objetos y agruparlos en clusters. Este tipo de algoritmos
se conocen como de aprendizaje no supervizado, pues el algoritmo puede
producir un agrupamiento sin que nadie le indique, mediante ejemplos, como
agrupar.

Calidad del clustering.

Un buen algoritmo de agrupamiento debe producir clusters con alta similaridad
intra-clase (corta distancia) y baja similaridad inter-clase (mayor distancia).

Para este ejemplo, cada objeto estará representado por un vector d-dimensional
y la medida de de distancia a utilizar será la Distancia Euclidiana. El conjunto de
n objetos se le denominará D y el número de grupos a producir se le denomina k.
Estos datos son los argumentos del algoritmo de agrupamiento.

El algoritmo de agrupamiento particionará el conjunto D en k clusters, tal que la
suma del cuadrado de las distancias d(di, cj), para todo di que pertenece al cluster
Cj, con centroide cj.

Métodos heurísticos:
• K-medias
• K-medoids o PAM (Partition around medoids) (Kaufman &
Rousseeuw’87)

2. K-Means

El algoritmo de k-means se puede describir por el pseudocódigo siguiente:

k-means(D, k)
1. Particionar el conjunto D en k subconjuntos no vacíos
2. Calcular los centroides (i.e., puntos medios) de cada clase
3. Asignar cada objeto al cluster con el centroide más cercano
4. Si los centroides cambian, regresar a 2.

Ejemplo

3. Descripción del proyecto

1. Diseñar las estructuras de datos necesarias para implementar k-means.
2. Programar k-means en su lenguaje favorito.
3. Probar su implementación con el conjunto de datos europe.txt y 10 clusters.
Probar con
a. 100 datos
b. 1,000 datos
c. con el conjunto completo
4. Investigar una medida de calidad del cluster e implementarla
5. Elaborar un reporte del proyecto (de preferencia usando LaTeX), el cual debe
incluir:
a. Descripción del método utilizado
b. Descripción de las estructuras de datos utilizadas
c. Resultados de las pruebas mencionadas en 3
d. Probar la calidad de los agrupamientos producidos por su
implementación
e. Conclusiones del trabajo
6. Puntos extra. Implementar PAM (solo son unos pocos cambios).
7. Puntos extra. Realizar un análisis de complejidad del algoritmo k-means.

Equipos. Pueden trabajar solos o en equipos de dos personas.

Entregables. Empacar programas y reportes en archivo zip. Asegúrense de que
los archivos se descompriman a un directorio, no a archivos sueltos. Incluir los
nombres de todos los integrantes del equipo en todos los archivos.

Entrega. Enviar un reporte por equipo a mi correo electrónico
(juanf@umich.mx) antes de la media noche de la fecha de entrega.

Excepciones. Si necesitan hacer cambios a las especificaciones, equipos, o fecha
de entrega, contáctenme antes de la fecha de entrega.

Vous aimerez peut-être aussi

Oración para Romper Maldiciones Generacionales
Document11 pages
Oración para Romper Maldiciones Generacionales
Gabriel
100% (1)
Sociedades de Jovenes Creativas
Document6 pages
Sociedades de Jovenes Creativas
Waleska Maldonado
Pas encore d'évaluation
OFICIAL - Responsabilidades y Deberes Del Creyente Bautizado
Document9 pages
OFICIAL - Responsabilidades y Deberes Del Creyente Bautizado
TitoHurtado
Pas encore d'évaluation
Analizador Léxico
Document12 pages
Analizador Léxico
Jose
Pas encore d'évaluation
Anatomia de Ovinos
Document33 pages
Anatomia de Ovinos
Roxana Coca
0% (1)
1990 Lisp
Document98 pages
1990 Lisp
Christel Quilodrán Muñoz
Pas encore d'évaluation
Atencion Preconcepcional
Document10 pages
Atencion Preconcepcional
Pilar Acosta Salazar
0% (1)
Introduccion (1) Compiladores
Document47 pages
Introduccion (1) Compiladores
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Examen 2 Ecuaciones Diferenciales
Document1 page
Examen 2 Ecuaciones Diferenciales
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Mps 05 Teorema de Muestreo PDF
Document75 pages
Mps 05 Teorema de Muestreo PDF
ger
Pas encore d'évaluation
Descripción Básica Del Direccionamiento IPv4
Document2 pages
Descripción Básica Del Direccionamiento IPv4
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Java
Document178 pages
Notas Java
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Roc
Document3 pages
Roc
Hector Lpz
Pas encore d'évaluation
Examen de Ecuaciones
Document1 page
Examen de Ecuaciones
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Capitulo 3
Document10 pages
Notas Control Digital Capitulo 3
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Cap 4 Clase2
Document19 pages
Notas Control Digital Cap 4 Clase2
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Cap 4 Clase3
Document24 pages
Notas Control Digital Cap 4 Clase3
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas - Control - Digital - Cap - 4 Completo
Document36 pages
Notas - Control - Digital - Cap - 4 Completo
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Capitulo 3 Clase4
Document30 pages
Notas Control Digital Capitulo 3 Clase4
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Cap 4 Clase1
Document9 pages
Notas Control Digital Cap 4 Clase1
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Cap 4 Clase2
Document19 pages
Notas Control Digital Cap 4 Clase2
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Cap 4 Clase3
Document24 pages
Notas Control Digital Cap 4 Clase3
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Docsity Metodo Simplex Por Los Algoritmos Simplex Algebraico
Document22 pages
Docsity Metodo Simplex Por Los Algoritmos Simplex Algebraico
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Compiladores Introduccion
Document76 pages
Compiladores Introduccion
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Configuracionrouteryswitch
Document1 page
Configuracionrouteryswitch
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Notas Control Digital Cap 4 Clase1
Document9 pages
Notas Control Digital Cap 4 Clase1
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Cableado Estructurado
Document46 pages
Cableado Estructurado
Raul Erasto Espejel Jasso
Pas encore d'évaluation
8.2.5.3 Packet Tracer - Configuring IPv6 Addressing Instructions
Document4 pages
8.2.5.3 Packet Tracer - Configuring IPv6 Addressing Instructions
paolo2791
100% (1)
Descripción Básica Del Direccionamiento IPv4
Document2 pages
Descripción Básica Del Direccionamiento IPv4
Raul Erasto Espejel Jasso
Pas encore d'évaluation
HTTPS Instalacion
Document11 pages
HTTPS Instalacion
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Newton
Document3 pages
Newton
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Expo Admin
Document26 pages
Expo Admin
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Cableado Estructurado
Document37 pages
Cableado Estructurado
Raul Erasto Espejel Jasso
Pas encore d'évaluation
2bis Introflex PDF
Document20 pages
2bis Introflex PDF
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Configuracion de Sevicio
Document5 pages
Configuracion de Sevicio
Raul Erasto Espejel Jasso
Pas encore d'évaluation
Construir La Escritura
Document3 pages
Construir La Escritura
Carlos Gómez
100% (2)
Tratamiento Natural para La Calvicie
Document10 pages
Tratamiento Natural para La Calvicie
slatsolutionn
Pas encore d'évaluation
Manual Peluqueria Municipalidad
Document23 pages
Manual Peluqueria Municipalidad
Alicia Palma
Pas encore d'évaluation
Intoxicacion Por Beta Bloqueadores
Document13 pages
Intoxicacion Por Beta Bloqueadores
Rolando Enrique Obando Ortiz
Pas encore d'évaluation
Ficha Sifilis Congenita
Document3 pages
Ficha Sifilis Congenita
HSBCalidad
100% (1)
Semana 17 Combinado
Document25 pages
Semana 17 Combinado
Luis Efrain Avila
Pas encore d'évaluation
Taller Identificacion de Riesgos y Peligros. Grupo A
Document17 pages
Taller Identificacion de Riesgos y Peligros. Grupo A
paula viviana rincon cortes
Pas encore d'évaluation
Proceso de Proletarización Del Campo
Document3 pages
Proceso de Proletarización Del Campo
Manuel Garfias
Pas encore d'évaluation
Descripción de La Carrera Ciencias Sociales
Document5 pages
Descripción de La Carrera Ciencias Sociales
JenrryGonzalez
100% (1)
Taller 5 Mecanica
Document5 pages
Taller 5 Mecanica
Yubian Andres Bedoya Henao
Pas encore d'évaluation
Pozzo ClaseEle
Document19 pages
Pozzo ClaseEle
Ly F
Pas encore d'évaluation
Examen 1er Periodo Equidad e Igualdad de Genero
Document2 pages
Examen 1er Periodo Equidad e Igualdad de Genero
Yair Aviles Dominguez
Pas encore d'évaluation
Plan Operativo Area Clínica
Document8 pages
Plan Operativo Area Clínica
licetttt
Pas encore d'évaluation
Guia para La Implementacion Del Mecec
Document58 pages
Guia para La Implementacion Del Mecec
Xinia Soto Porras
100% (1)
Los Celtas
Document15 pages
Los Celtas
Rose Mejia
Pas encore d'évaluation
Tarea Biografias Pintores
Document3 pages
Tarea Biografias Pintores
Alejandro JaNo Perez Romero
Pas encore d'évaluation
Tarea 3 Desarrollo Social Infancia
Document3 pages
Tarea 3 Desarrollo Social Infancia
ariminielperez
Pas encore d'évaluation
La Teoria de La Causalidad
Document3 pages
La Teoria de La Causalidad
Yamileth Valdes
Pas encore d'évaluation
Agentes Internos
Document4 pages
Agentes Internos
MELFIL VALDEZ
Pas encore d'évaluation
Prueba Final de Matemática
Document9 pages
Prueba Final de Matemática
Katherine Ramos Peña
Pas encore d'évaluation
Uno de Los Usos Más Comunes de Los Diodos Rectificadores en Electrónica Es Convertir La Corriente Alterna de Un Hogar en Corriente Continua Que Se Puede Utilizar Como Una Alternativa A Las Baterías
Document5 pages
Uno de Los Usos Más Comunes de Los Diodos Rectificadores en Electrónica Es Convertir La Corriente Alterna de Un Hogar en Corriente Continua Que Se Puede Utilizar Como Una Alternativa A Las Baterías
GusSaravia
Pas encore d'évaluation
Informe Técnico III
Document3 pages
Informe Técnico III
Karen Lorena Quiñones Quiñones
Pas encore d'évaluation
Cap2 Funciones Lineales
Document7 pages
Cap2 Funciones Lineales
demiv47436
100% (1)
TOPOGRAFÍA
Document20 pages
TOPOGRAFÍA
Anderson Meneses
Pas encore d'évaluation
1-Ayuda Ajuste de Tasas
Document10 pages
1-Ayuda Ajuste de Tasas
Alvaro Flores
Pas encore d'évaluation