Tarea Dia 3

Transféré par

idiazm

0% ont trouvé ce document utile (0 vote)

32 vues2 pages

data

Titre original

tareaDia3

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

data

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

32 vues2 pages

Tarea Dia 3

Transféré par

idiazm

data

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Evaluación 1, Pregunta 3

Curso: “Técnicas de segmentación y clasificación de datos”

Profesor: Sebastián Moreno
Fecha Publicación: 8 de Febrero de 2018
Fecha Entrega: 01 de Marzo de 2018, 23:55 hrs (vía webcursos)

Sugerencia: suba una versión inicial durante el día de la entrega y suba su versión final
después. De esta manera, si tuvo cualquier tipo de problema (no tienen wifi, corte de luz, u
otros motivos), tendrá una versión que será evaluada.

Objetivo:
El objetivo de esta tarea es entender los conceptos básicos de la técnica aglomerativa
jerárquica de clustering para un problema sencillo utilizando el lenguaje R.

Descripción:
El departamento de Recursos Humanos de una empresa determinada ha recolectado
varios datos de sus trabajadores, que incluye características del trabajo propiamente tales,
como también variables demográficas. Así, la empresa dispone de una base de datos de 1470
registros de empleados, caracterizados por 35 variables.
En base a lo anterior, se le ha encargado que diseñe uno o más programas en R (script), que
puedan responder a varias preguntas. Para facilitar el análisis posterior, todos los datos de los
empleados los deberá almacenar en una matriz:
A. ¿Qué variables presentan valores categóricos y qué variables numéricas permanecen
constantes para todos los empleados? Una vez que se identifique esto, Ud. debe:
a. Generar una NUEVA matriz de empleados que omita las variables identificadas
para sus futuros análisis. Atención una variable con número no es necesariamente
numérica, también puede ser categórica.
b. Estandarizar los datos.

B. Analice los datos seleccionados para verificar si existe la presencia de clusters.

Para ello calcule el coeficiente de Hopkins y discuta el valor obtenido.

C. Aplique y concluya sobre los resultados obtenidos al aplicar el algoritmo jerárquico
aglomerativo single linkage.

Para ello, aplique el algoritmo correspondiente y grafique el dendrograma generado por

esta técnica. Finalmente, concluya sobre el dendrograma obtenido, y determine si
corresponde utilizar esta técnica para segmentar estos datos.

D. Aplique los algoritmos jerárquicos aglomerativos complete y average linkage, y elija una
de ellos en base a los dendrogramas generados. Justifque su selección.

E. En base al algoritmo seleccionado en la pregunta D, seleccione un número de clusters y

grafique los clusters generados. Además, verifique si la matriz de disimilaridad presenta
un patrón de bloques.

F. En base al modelo y número de clusters seleccionado en el punto E. Describa los clusters

generados en base a las características únicas de cada uno de ellos.

Para esto, después de haber seleccionado uno de los tres modelos con el número de
clusters correspondientes, usted deberá analizar cada una de las variables originales y ver
si la distribución de la variable cambia en forma significativa para alguno de los clusters,
indicando la variación en el cluster correspondiente.

Para poder realizar esta tarea y responder las preguntas anteriores, Ud. deberá trabajar con
los datos que se pueden obtener cargando el siguiente script R:
url="http://dyzz9obi78pm5.cloudfront.net/app/image/id/56
0d29b532131ca16af2b9e4/n/WA_Fn-UseC_-HR-Employee-
Attrition.csv"
employee=read.csv(url, header = TRUE, sep = ",")
donde la base de datos employee almacena datos de 1470 empleados (filas) y 35
características/variables (columnas) para cada uno (auto-explicativas).

Aspectos Administrativos:
En esta tarea Ud. deberá entregar todos los scripts necesarios en R que respondan las
preguntas. Si alguna pregunta contempla la entrega de gráficos y/o justificaciones escritas,
entonces debe entregar además estos en un archivo de texto.
La tarea se puede realizar en grupos de hasta 3 integrantes.

Vous aimerez peut-être aussi

Dia3 B
Document47 pages
Dia3 B
idiazm
Pas encore d'évaluation
Im 1 3 694200997 In1 121 152
Document32 pages
Im 1 3 694200997 In1 121 152
Joaquín Enrique Menanteau
Pas encore d'évaluation
Taller XAMPP
Document21 pages
Taller XAMPP
dianacbermudez
Pas encore d'évaluation
Citacion Eviccion PDF
Document3 pages
Citacion Eviccion PDF
idiazm
Pas encore d'évaluation
Crackear Wpa Wpa2 PSK
Document8 pages
Crackear Wpa Wpa2 PSK
p3p17o
Pas encore d'évaluation
Diseno y Evaluacion de Un Modelo de Control de Operaciones
Document139 pages
Diseno y Evaluacion de Un Modelo de Control de Operaciones
idiazm
Pas encore d'évaluation
Codigo Penal
Document351 pages
Codigo Penal
Danny Quezada
Pas encore d'évaluation
Ley Ricarte PDF
Document20 pages
Ley Ricarte PDF
idiazm
Pas encore d'évaluation
Unidad 1 - Chartismo, Análisis Técnico - V1 (UNAB-IEDE)
Document24 pages
Unidad 1 - Chartismo, Análisis Técnico - V1 (UNAB-IEDE)
idiazm
Pas encore d'évaluation
Bases anatómicas del lenguaje
Document170 pages
Bases anatómicas del lenguaje
idiazm
Pas encore d'évaluation
Antropología Socio - Cultural
Document154 pages
Antropología Socio - Cultural
idiazm
100% (1)
Tema 6-1
Document15 pages
Tema 6-1
idiazm
Pas encore d'évaluation
Calidad en Recursos Humanos
Document30 pages
Calidad en Recursos Humanos
Carmen Rangel Rodriguez
Pas encore d'évaluation
Análisis Técnico Bolsa Valores
Document3 pages
Análisis Técnico Bolsa Valores
idiazm
Pas encore d'évaluation
Gerencia de Personal
Document18 pages
Gerencia de Personal
Vania Vannessa Barrientos Salas
Pas encore d'évaluation
Analisis Tecnico y Fundamental
Document44 pages
Analisis Tecnico y Fundamental
Moana Atan
100% (1)
Examen Chartismo - Mayo 2017
Document3 pages
Examen Chartismo - Mayo 2017
idiazm
100% (1)
Examen Chartismo - Mayo 2017
Document3 pages
Examen Chartismo - Mayo 2017
idiazm
100% (1)
Catalogo de Cuentas Auditoria Gubernamental
Document175 pages
Catalogo de Cuentas Auditoria Gubernamental
Sebastian Milan
Pas encore d'évaluation
Normativa Nicsp PDF
Document254 pages
Normativa Nicsp PDF
lgba2000
Pas encore d'évaluation
Modulo 3 Apuntes Del Curso Implementación de Las NICSP 2017
Document20 pages
Modulo 3 Apuntes Del Curso Implementación de Las NICSP 2017
idiazm
Pas encore d'évaluation
Unidad 1 - Chartismo, Análisis Técnico - V1 (UNAB-IEDE)
Document24 pages
Unidad 1 - Chartismo, Análisis Técnico - V1 (UNAB-IEDE)
idiazm
Pas encore d'évaluation
Análisis Técnico Bolsa Valores
Document3 pages
Análisis Técnico Bolsa Valores
idiazm
Pas encore d'évaluation
Fundamentos de la Contabilidad Pública
Document85 pages
Fundamentos de la Contabilidad Pública
idiazm
Pas encore d'évaluation
Unidad 2 - Chartismo, Análisis Técnico - V1 (UNAB-IEDE)
Document23 pages
Unidad 2 - Chartismo, Análisis Técnico - V1 (UNAB-IEDE)
idiazm
Pas encore d'évaluation
Programacion Basica VB
Document157 pages
Programacion Basica VB
Arturo Acoltzi Cuatecontzi
Pas encore d'évaluation
Auditoria Practica
Document495 pages
Auditoria Practica
paperalt
Pas encore d'évaluation
Clasificador Presupuestario
Document49 pages
Clasificador Presupuestario
idiazm
Pas encore d'évaluation
Monografia Diabetes
Document11 pages
Monografia Diabetes
DIANA ESTRELLA ORELLANA REYES
Pas encore d'évaluation
Conducta de Enfermedad
Document16 pages
Conducta de Enfermedad
Hilda Susana Madueño Cardenas
Pas encore d'évaluation
Qué Se Necesita Saber para Tener Éxito en Los Hechizos para Enamorar
Document2 pages
Qué Se Necesita Saber para Tener Éxito en Los Hechizos para Enamorar
hechizos
Pas encore d'évaluation
Probabilidad Apuntes Completos Def
Document77 pages
Probabilidad Apuntes Completos Def
Leslie Trejo
Pas encore d'évaluation
Rescision Del Contrato Por Lesion
Document3 pages
Rescision Del Contrato Por Lesion
Cristian Quisbert
50% (2)
NOTAS - Juan Carlos Henao Final 23-09-19
Document25 pages
NOTAS - Juan Carlos Henao Final 23-09-19
Javhy Montoya
Pas encore d'évaluation
Cuestionario Sobrealimentacion
Document4 pages
Cuestionario Sobrealimentacion
Fabián Alberto
Pas encore d'évaluation
Informe de Laboratorio Fisica 2
Document8 pages
Informe de Laboratorio Fisica 2
Valentina Ruiz
Pas encore d'évaluation
Tomar el último lugar
Document4 pages
Tomar el último lugar
Gabriel Alonso Vazquez
Pas encore d'évaluation
VERTEBROMEDULAR
Document2 pages
VERTEBROMEDULAR
ls0894012021
Pas encore d'évaluation
Partículas japonesas
Document13 pages
Partículas japonesas
Guillermo Ordaz Aguilar
Pas encore d'évaluation
La Celula
Document6 pages
La Celula
Crearte Panamà
Pas encore d'évaluation
Concussion y La Encefalopatia Traumatica Cronica
Document2 pages
Concussion y La Encefalopatia Traumatica Cronica
Hillary V Guillermo Angeles
Pas encore d'évaluation
Actitudes Positivas
Document19 pages
Actitudes Positivas
vanessa zavaleta
Pas encore d'évaluation
Blay, Antonio - Caminos de Autorrealización (Yoga Superior) - Tomo II - La Integración Trascendente
Document150 pages
Blay, Antonio - Caminos de Autorrealización (Yoga Superior) - Tomo II - La Integración Trascendente
Yesid Cortes
Pas encore d'évaluation
La Andragogía en El Posgrado - Caso Oaxaca - Pedagogia 2013 PDF
Document10 pages
La Andragogía en El Posgrado - Caso Oaxaca - Pedagogia 2013 PDF
Flavio Castillo Silva
Pas encore d'évaluation
La Anamorfosis en La Obra de Severo Sarduy
Document9 pages
La Anamorfosis en La Obra de Severo Sarduy
Jorge Alberto Rodriguez
Pas encore d'évaluation
Visión Retrospectiva
Document4 pages
Visión Retrospectiva
francesca
Pas encore d'évaluation
Eduardo Milán
Document4 pages
Eduardo Milán
havanito
Pas encore d'évaluation
Reino Unido: Historia Prehistórica
Document7 pages
Reino Unido: Historia Prehistórica
sebastiandrade
Pas encore d'évaluation
Retiro de Niños-2014
Document5 pages
Retiro de Niños-2014
GUSTAVO LEON
Pas encore d'évaluation
Es La Televisión Hispana Racista
Document8 pages
Es La Televisión Hispana Racista
Jesús González
Pas encore d'évaluation
Garantías de Seguridad Jurídica
Document25 pages
Garantías de Seguridad Jurídica
alejandra
Pas encore d'évaluation
6 Cirrosis Fisiopatología 2019
Document72 pages
6 Cirrosis Fisiopatología 2019
Raquel Franco
Pas encore d'évaluation
Heidegger y Aristoteles Revisitado Eleme PDF
Document47 pages
Heidegger y Aristoteles Revisitado Eleme PDF
Uriel Ulises Bernal
Pas encore d'évaluation
DBC Medicamentos
Document69 pages
DBC Medicamentos
Miguel Angel
Pas encore d'évaluation
Manejo de Nefermedades
Document99 pages
Manejo de Nefermedades
Soledad Tapia
Pas encore d'évaluation
CIMBRA
Document14 pages
CIMBRA
Angeliro Rosas
Pas encore d'évaluation
Epispadias
Document25 pages
Epispadias
Lexoso Spirit
0% (1)
Catálogo de Investigación Por Líneas
Document98 pages
Catálogo de Investigación Por Líneas
Manuel Alejandro Aguilar
Pas encore d'évaluation