Vous êtes sur la page 1sur 4

Churn es un trmino utilizado para indicar que un cliente deja el servicio de

una empresa A favor de otra empresa. El objetivo de este ejercicio es


desarrollar modelos que Predecir si es probable que un cliente produzca
cambios, es decir, que al Saber cmo caracterizar a los clientes que pueden
pronto churn. Debe analizar los modelos obtenidos y compararlos. Adems,
Basado en el conocimiento adquirido de analizar los datos y los modelos
construidos, Usted est obligado a proponer una serie de medidas prcticas
que la empresa Puede poner en accin para tratar de retener a los clientes que
puedan churn.
El conjunto de datos contiene 20 atributos, ms la indicacin de si el cliente
Churned, y alrededor de 3333 clientes. Una descripcin del significado de cada
Atributo se da en el apndice.
Los puntos que se describen a continuacin deben ser abordados
explcitamente en su informe.
Observe que tambin puede construir otros modelos y probar otras estrategias
que pueda encontrar adecuado. Use su imaginacin.
El software de minera de datos sugerido para el ejercicio descrito es WEKA.
Estafa-
Tambin utilizar grficos e imgenes en su informe ya que pueden mejorar la
Claridad y la fuerza de sus conclusiones. Refiera y motive en su informe
El uso de cualquier pre-procesamiento de datos antes de la aplicacin de
cualquier minera de datos
tcnica.

Exploratory Data Analysis

El primer paso para abordar un problema de minera de datos es profundizar en


los datos,
Identificar cualquier relacin interesante entre los atributos, y formular algunas
Hiptesis inicial, es decir, posibles asociaciones entre los atributos y la clase.
Las herramientas grficas pueden ayudarle en esta fase.
1. Encontrar posibles variables correlacionadas. Por ejemplo, encontrar si los
datos
Muestra que el nmero de minutos y la cantidad cobrada tienden a aumentar
A medida que aumenta el nmero de llamadas.
2. Hay alguna variable que pueda ser eliminada? Justifique su respuesta y
Motivar a los posibles beneficiarios de hacerlo (si los hay).

3. Investigar la proporcin de churners y non churners entre los clientes


Que han (no) seleccionado un plan internacional (Plan Inter). Qu puede
Concluyes
4. Investigar posibles relaciones entre
El nmero de llamadas de servicio al cliente y Churn. Qu puede usted con-
Incluir
5. Investigue las posibles relaciones entre el Total Day Min y Churn.
Qu puedes concluir?
6. Investigar las posibles relaciones entre el Total Evening Min y
Batir. Qu puedes concluir?
7. Investigar posibles relaciones entre las variables restantes y
Batir.
8. Resuma en una tabla sus hallazgos hasta ahora, en cuanto al valor
predictivo
De cada atributo con respecto al churn
9. Compare sus conclusiones con los resultados obtenidos usando un atributo
Filtro de seleccin en Weka. No olvide indicar el filtro que tiene
Y dar una breve descripcin.
Exploracin de relaciones multivariantes

A continuacin, se le pide que investigue posibles asociaciones multivariadas


de
Atributos con churn.

(1) Estudiar el diagrama de dispersin de No de llamadas de servicio al cliente


versus
Total de minutos de da. Identifique posibles reas de alto churn (si las hay).
(2) Estudiar el diagrama de dispersin de Total Min de da versus Total Min de
noche. Iden-
(Si existe) y tratar de cuantificar la tasa de churn
En estas reas con respecto a todo el conjunto de datos.

Construyendo un clasificador: rboles de decisin


Construir un rbol de decisin con el algoritmo J48 disponible en WEKA. Este
algoritmo es un
Implementacin de una versin ligeramente mejorada de C4.5. Incluir en su
informe
Una figura con el rbol de decisin que ha obtenido.
(1) Describa brevemente J48 e indique los parmetros que ha utilizado para
ejecutar
eso.
(2) Qu puede usted concluir del modelo que usted ha obtenido? Compare su
Conclusiones con las que ha obtenido anteriormente (seccin 1.1).

(3) Seleccionar algunas medidas de desempeo y evaluar el modelo con


valores cruzados.
Cin. Justificar la eleccin de las medidas de rendimiento.
(4) Comparar el rendimiento de este clasificador con un clasificador que
siempre
Predice la clase mayoritaria.

(1) Describa brevemente JRip e indique los parmetros que ha utilizado para
ejecutar
eso.
(2) Qu puede usted concluir del modelo que usted ha obtenido? Compare su
Conclusiones con las que ha obtenido anteriormente (seccin 1.1 y
Seccin 1.2).
(3) Utilizando las medidas de desempeo que ha seleccionado para la
evaluacin de
El modelo generado por J48, evaluar el modelo actual y comparar su
Rendimiento con el anterior (obtenido en la seccin 1.2).
(4) Comparar el rendimiento de este clasificador con un clasificador que
siempre
Predice la clase mayoritaria.
1.4 Aprendizaje sensible al costo
Considere que el costo para una empresa de perder un cliente es mayor que el
Costo de ofrecer algunos incentivos a un cliente, incluso cuando no es probable
que
Churn de todos modos.
(1) Sus datos plantean algn problema en esta perspectiva? Si as se describe
el
problema.
(2) Describir cmo se puede abordar el problema. Utilice las herramientas
disponibles en
WEKA para construir otro modelo de acuerdo con las ideas que ha descrito.
(3) Qu puede usted concluir del modelo que usted ha obtenido? Compare su
Conclusiones con las que ha obtenido anteriormente (secciones 1.1, 1.2,
Y 1,3).
(4) Comparar el rendimiento del modelo obtenido con los anteriores. Investigue
si las diferencias son estadsticamente significativas.

Vous aimerez peut-être aussi