Académique Documents
Professionnel Documents
Culture Documents
1
Année Universitaire 2016 - 2017
Annexe 1
Instances: 150
Attributes: 4 (sepallength, sepalwidth, petallength, petalwidth)
Number of iterations: 6
Cluster centroids:
Cluster#
Attribute Full Data 0 1 2
(150) (61) (50) (39)
=========================================================
sepallength 5.8433 5.8885 5.006 6.8462
sepalwidth 3.054 2.7377 3.418 3.0821
petallength 3.7587 4.3967 1.464 5.7026
petalwidth 1.1987 1.418 0.244 2.0795
Clustered Instances
0 61 ( 41%)
1 50 ( 33%)
2 39 ( 26%)
2
Année Universitaire 2016 - 2017
Dans cette étude, nous utiliserons un ensemble de données d’un opérateur de télécommunications,
churn.txt. Le fichier contient des renseignements de 1477 clients de la compagnie qui ont acheté à
quelque temps un téléphone mobile. Les clients sont classés en trois groupes : les clients actuels,
départs involontaire et départs volontaire.
Sources de données
Fichier source churn.txt
Définition des attributs
ID: Code d’identification
LONGDIST: Temps des appels long distance
INTERNATIONAL: Temps des appels Internationaux
LOCAL: Temps des appels locaux
CHURNED: Profil
Pour identifier trois classes de client homogène selon les trois types d’appel : LONGDIST, LOCAL et
INTERNATIONAL, nous avons appliqué l’algorithme de K-Means aux données du fichier churn.txt.
Les résultats obtenus sont reportés dans l’annexe 2.
1. Donner la description de chaque classe.
2. Décrire le profil de chaque classe d’après les temps des appels.
L’opérateur télécom proposera prochainement à ses clients, une offre pour les appels locaux et une autre
pour les appels internationaux.
3. Quelle classe de consommateurs cet opérateur peut cibler pour la première offre et celle
pour la deuxième offre. Justifier dans chaque cas votre choix.
Cet Opérateur télécom souhaite identifier les causes des départs volontaires de ses clients affins des
faires des plans d’action (des promotions, des compagnes de fidélisation etc…). Pour atteindre cette
objectif ; on a calculé, pour chaque classe identifié, la proportion de chaque modalité de la variable
CHURNED. Le résultat obtenu est reporté dans le diagramme de l’annexe 2.
4. Quelles informations on peut tirer de ce digramme ?
5. Expliquer pourquoi, les clients résiliés par l’opérateur (les départs InVol) sont tous dans la
classe 1 ?
6. En analysant soigneusement le diagramme proportion, identifier une ou plusieurs causes des
départs volontaires des clients de cet opérateur télécom.
3
Année Universitaire 2016 - 2017
Statistique de base
Moyenne (INTERNATIONAL) = 4,841
Moyenne (LOCAL) = 51,364
Moyenne (LONGDIST) = 15,341
4
Année Universitaire 2016 - 2017
Les résultats de l’application de l’algorithme Apriori aux données du fichier Shopping.txt sont reportés
dans l’annexe 2.
Nous avons appliqué l’algorithme Apriori avec les paramètres suivants : un support de 75% et une
confiance de 10%, pour identifier les articles qui sont vendus ensemble et ceux qui ne le sont pas.
Analyser les résultats obtenus en spécifiant :
1. Quelques règles
2. Leurs paramètres de pertinences
5
Année Universitaire 2016 - 2017
Annexe 3:
Figure 2 : Règles générés pour les produits non achetés ensemble (les trous de panier)