Vous êtes sur la page 1sur 9

ANLISIS

CLSTER

ANLISIS CLSTER
Anlisis de Conglomerados, Taxonoma Numrica o
Reconocimiento de Patrones.
Es una tcnica estadstica multivariantecuya finalidad es
dividir un conjunto de objetos en grupos, de forma que
se presenta:

CONDICIONES PARA EL ANLISIS CLSTER


Si las variables estn en escalas muy diferentes ser
necesario estandarizar las variables.
Es necesario observar que no existan valores atpicos (por que
deforman las distancias), y que no halla valores perdidos (por
que no hay solucin).
No debe existir variables correlacionadas, de ah la
importancia del anlisis previo de multicolinealidad.
El anlisis clster no tiene por que ser nica, pero no deben
encontrarse soluciones contradictorias por distintos mtodos.
Los grupos finales sern tan distintos como permitan los
datos.

PLANTEAMIENTO GENERAL
El anlisis clster es un
anlisis de conglomerados
jerrquicos aglomerativos.

En el anlisis clster los


objetos de agrupacin
pueden ser los casos o a
las variables.

MTODOS DE CONGLOMERACIN
Es el mtodo en el cual se van formando los conglomerados,
de acuerdo a los objetos, entre los grupos.

MEDIDAS DE DISTANCIA Y SIMILARIDADES


Miden el grado de semejanza entre dos objetos, con
indicadores basados en la distancia, y existen dos tipos de
distancias que es la similaridad (miden el grado de
proximidad) o disimilaridad (miden el grado de lejana).
Depende del tipo de variables, entre ellos tenemos:

INTERVAL
O

Variables Cuantitativas.

RECUENT
OS

Variables Cualitativas.

Medidas en escala de razn o de


intervalo.
Medidas en escala ordinal o nominal.
Variables Binarias (1,0).

BINARIA

Medidas con ausencia o presencia del


criterio.

La decisin de las distancias es subjetivo, no existe un criterio


nico.
Sin embargo se considera utilizar la distancia eucldea al
cuadrado para las variables de intervalo y binaria, y para las
variables de recuentos se considera utilizar la medida de phicuadrado, por que no depende del tamao de la muestra.

GRFICOS

EJEMPLO
En el lugar turstico de Varadero, un grupo de analistas de la
Delegacin del MINTUR, est realizando un estudio que incluye
diez instalaciones hoteleras. Basndose en los datos
recopilados de ocho variables que han sido medidas en cada
uno de los diez hoteles, el objetivo de los miembros del grupo,
consiste en agrupar dichas entidades segn su similitud o
semejanza. Los datos se muestran a continuacin:
Variables:
% de ocupacin

nivel de ingresos
cantidad de
trabajadores
nivel de utilidades

nivel de gastos
cantidad de puntos de consumo
de A+B
cantidad de habitaciones
gasto energtico

Vous aimerez peut-être aussi