Vous êtes sur la page 1sur 23

Analyse statistique des

comportements d'achat

Encadré par : Réalisé par :


Mme.H.Chamlal ZINEB HZAINE
CHAIMAA SOUHIR

Année universitaire 2022/2023 Page | 1


On ne peut pas laisser passer l'occasion de la présentation de
ce rapport sans exprimer nos remerciements à notre
professeur Mme H.CHAMLAL pour son engagement et son
dévouement tout au long de ce module. Sa passion pour
l’analyse de données et sa capacité à transmettre ses
connaissances ont été une source d'inspiration pour nous.
Nous tenons à remercier toutes les personnes qui ont
contribué, de près ou de loin, à la réalisation de ce projet,
ainsi qu’au bon déroulement du projet.

Année universitaire 2022/2023 Page | 2


Sommaire
Introduction................................................................................................................................5
Problème ...................................................................................................................................6
Objectif…..................................................................................................................................6
Choix de méthode .....................................................................................................................7
Les données manipulées ….......................................................................................................8
L’analyse des Correspondances Multiples dans R ..................................................................10
1. Lecture de fichier de données............................................................................................10
2. Application de l’ACM avec FactoMineR..........................................................................10
3. Valeurs propres ..................................................................................................................11
3.1. Visualisation de l’inertie expliquée par chaque axe.................................................11
3.2. Affichage des graphiques des individus et des variables.........................................13
3.2.1. Affichage du graphique des individus.......................................................14
3.2.2. Affichage du graphique des variables........................................................15
4. Tableau disjonctif complet.................................................................................................16
5. Coordonnées des individus ...............................................................................................17
5.1.Projection des modalités......................................................................................18

5.2. Evaluation des modalités..................................................................................19

5.3.Contribution absolue des modalités...................................................................20

5.4.Contribution relative des variables....................................................................21

Conclusion...............................................................................................................................23

Année universitaire 2022/2023 Page | 3


Liste de figures
Figure 1:Tableau de données.....................................................................................................9
Figure 2:DataSet.......................................................................................................................10
Figure 3 :Tableau des valeurs propres ....................................................................................11
Figure 4:Graphique des valeurs propres.................................................................................. 12

Figure 5:Graphique des individus variables.............................................................................13


Figure 6 : Graphique des individus .........................................................................................14
Figure 7:Graphique des variables............................................................................................ 15
Figure 8:Tableau disjonctif complet....................................................................................... .17

Figure 9 : Tableau de coordonnées des individus ...................................................................17


Figure 10 : Graphique des modalités.......................................................................................18

Année universitaire 2022/2023 Page | 4


INTRODUCTION

L'Analyse des Correspondances Multiples (ACM) est une technique d'analyse de données
multivariées utilisée pour explorer et analyser des tableaux de données catégorielles, fournir
une représentation visuelle des relations entre les individus et les variables d'un tableau de
données catégorielles, détecter des structures et des associations, et d'aider à l'interprétation
des résultats pour une meilleure compréhension des données.L'objectif principal de l'ACM est
de mettre en évidence les relations et les associations entre les individus et les variables d'un
tableau de données catégorielles.

Ce rapport présente notre travail sur l'Analyse des Correspondances Multiples (ACM) dans le
cadre de l'étude et d’analyse des tableaux de données catégorielles. Nous avons utilisé le
logiciel R et l'environnement de développement RStudio pour effectuer notre analyse.
L'objectif de notre travail était d'explorer les données avant d'appliquer l'ACM afin d'extraire
l'information pertinente qu'elles contiennent et de détecter de structures et de similarités. Nous
avons utilisé différentes techniques d'ACM pour représenter fidèlement les individus d'une
population ainsi que les variables, et extraire le maximum d'information possible.

Année universitaire 2022/2023 Page | 5


Problème
On cherche à segmenter des clients en fonction de leurs préférences et
comportements d'achat.On vise à regrouper les clients ayant des caractéristiques
similaires afin de mieux comprendre leurs besoins et de développer des stratégies de
marketing ciblées.

Sur un échantillon de 3076 clients. Nous sommes intéressées à l'étude des trois
variables suivantes :

⬥ Les catégories de produits achetés(Vêtements pour femmes, Vêtements pour

hommes, Accessoires).

⬥ Le canal d'achat (Magasin physique, Site web)

⬥La fréquence d'achat (Élevée, Moyenne, Faible).

Objectif
L'objectif principal de cette problématique est de segmenter les clients en groupes
homogènes, également appelés segments, en fonction de leurs préférences et
comportements d'achat. Cela permet de mieux comprendre les différents profils de
clients et d'adapter les actions marketing en conséquence.
Pour réaliser la segmentation des clients, on peut utiliser l'Analyse des
Correspondances Multiples (ACM) sur le tableau de données. L'ACM permet de
visualiser les relations entre les clients et les variables dans un espace de
dimensions réduites. Il permet également d'identifier les variables et les modalités
qui contribuent le plus à la variation observée parmi les clients.
Et ainsi, une fois les segments de clients identifiés, les entreprises peuvent
développer des stratégies de marketing ciblées pour chaque segment. Par exemple,
elles peuvent personnaliser les offres promotionnelles, les messages publicitaires ou
les canaux de communication en fonction des préférences et des comportements

Année universitaire 2022/2023 Page | 6


d'achat de chaque segment. Cela permet d'optimiser l'efficacité des actions
marketing et d'améliorer la satisfaction des clients.

Choix de méthode
L'Analyse des Correspondances Multiples (ACM) est une technique d'analyse de
données multivariées utilisée pour explorer et analyser des tableaux de données
catégorielles, fournir une représentation visuelle des relations entre les individus et
les variables d'un tableau de données catégorielles, de détecter des structures et des
associations, et d'aider à l'interprétation des résultats pour une meilleure
compréhension des données.L'objectif principal de l'ACM est de mettre en évidence
les relations et les associations entre les individus et les variables d'un tableau de
données catégorielles.

Plus précisément, l'ACM vise à accomplir les objectifs suivants :

1. Visualisation des données : L'ACM permet de représenter graphiquement les


individus et les variables dans un espace de dimensions réduites
(généralement deux ou trois axes). Cela facilite la compréhension et
l'interprétation des relations entre les catégories des variables et les individus.
2. Détection de structures et de similarités : L'ACM permet de mettre en
évidence des structures, des regroupements ou des similarités entre les
individus et les variables. Les individus similaires sont regroupés ensemble
dans l'espace réduit, tandis que les variables qui sont associées sont proches
les unes des autres.
3. Identification des variables discriminantes : L'ACM permet de déterminer
quelles variables sont les plus discriminantes pour distinguer les différents
groupes d'individus. Les variables qui contribuent le plus à la séparation des
groupes sont identifiées et peuvent être utilisées pour comprendre les
caractéristiques distinctives des groupes.

Année universitaire 2022/2023 Page | 7


Les données manipulées
Ce tableau de données est pour la problématique de segmentation des clients en
fonction de leurs préférences et comportements d'achat :

Vêtements pour Vêtements pour Fréquence

Client femmes hommes Accessoires Canal d'achat d'achat

Magasin
Client 1 Oui Oui Non Élevée
physique

Client 2 Non Oui Oui Site web Faible

Magasin
Client 3 Oui Non Oui Moyenne
physique

Client 4 Oui Oui Oui Site web Élevée

Client 5 Non Non Oui Site web Faible

Année universitaire 2022/2023 Page | 8


Magasin
Client 6 Non Oui Non Faible
physique

Client 7 Oui Non Non Site web Moyenne

Magasin
Client 8 Non Oui Oui Élevée
physique

Figure 1:Tableau de données

Année universitaire 2022/2023 Page | 9


L’Analyse des Correspondances
Multiples sous R
Afin d'étudier la liaison existante entre les variables, on souhaite faire une représentation
graphique qui illustre les correspondances entre les modalités de ces deux variables.

1. Lecture de fichier de données


🙗 Commande :

Résultat:

Figure 2:DataSet

2.Application de l’ACM avec FactoMineR


🙗 Commande :
>resmca <- MCA(canimes,graph = F)

Explication:
● La fonction “ MCA() ” de FactoMineR est utilisée pour appliquer l’analyse des
Correspondances Multiples (ACM) sur le tableau de données .

Année universitaire 2022/2023 Page | 10


● L'argument: “graph = FALSE” indique de ne pas afficher les graphiques de l'ACM
pour le moment.
3.Valeurs propres
3.1. Visualisation de l’inertie expliquée par chaque axe

🙗 Commande :

> resmca$eig

🙗 Résultat :

Figure 3:Tableau des valeurs propres

Explication:
● La fonction “ fviz_eig() “ de factoextra est utilisée pour visualiser l'inertie expliquée
par chaque axe.
● L'argument addlabels = TRUE permet d'ajouter les labels des axes sur le graphique.

Année universitaire 2022/2023 Page | 11


🙗 Commande :
> fviz_eig(resmca, addlabels = T)

🙗 Résultat :

Figure 4:Graphique des valeurs propres

Explication:
Ce graphique affiche les valeurs propres des axes de l'ACM. Chaque barre du graphique
représente la contribution de l'axe correspondant à l'inertie totale des variables. Les axes
sont ordonnés de gauche à droite en fonction de leur importance, avec l'axe le plus
important à gauche.

Année universitaire 2022/2023 Page | 12


3.2. Affichage des graphiques des individus et des variables

🙗 Commande :
> fviz_mca(resmca, repel =T)

🙗 Résultat :

Figure 5:Graphique des individus variables

Explication:
Ce graphique représente les individus et les variables dans l'espace factoriel de l'ACM. Les
individus sont représentés par des points et les variables par des flèches. La position des
points et des flèches dans le graphique dépend de leurs contributions respectives aux
différents axes de l'ACM.

Année universitaire 2022/2023 Page | 13


● fviz_mca() : C'est une fonction de la bibliothèque factoextra qui permet de visualiser les
individus et les variables dans l'ACM.
● resmca : C'est l'objet résultant de l'ACM précédemment effectuée.
● repel = T : C'est un paramètre optionnel qui permet d'éviter le chevauchement des
étiquettes des individus sur le graphique.

3.2.1. Affichage du graphique des individus

🙗 Commande :
> fviz_mca_ind(resmca,repel=T)

🙗 Résultat :

Figure 6:Graphique des individus

Explication:
Ce graphique permet d'identifier les individus qui sont proches les uns des autres dans
l'espace factoriel, ce qui indique qu'ils ont des profils similaires en termes de comportements
d'achat. Il permet également d'observer la contribution de chaque individu à la formation

Année universitaire 2022/2023 Page | 14


des différents axes de l'ACM, ce qui aide à comprendre quels sont les individus les plus
influents dans la structure des données.

On peut distinguer 3 groupes d’individus:


● Le 1er groupe est constitué du : client 2, client 5 et client 6.
● Le 2eme groupe est constitué du : client 1, client 4 et client 8.
● Le 3eme groupe est constitué du : client 3 et client 7.

3.2.2. Affichage du graphique des variables

🙗 Commande :
> fviz_mca_var(resmca,repel=T)

🙗 Résultat :

Figure 7:Graphique des variables

Année universitaire 2022/2023 Page | 15


Explication:
Ce graphique représente les variables dans l'espace factoriel de l'ACM. Chaque variable est
représentée par un segment de ligne dans le graphique. La longueur et l'orientation du
segment indiquent la contribution de chaque variable à chaque axe de l'ACM.
Il permet d'analyser la contribution des variables à la formation des différents axes de l'ACM.
On peut observer quelles variables ont une forte influence sur chaque axe et quelles
variables ont une faible influence. Cela aide à comprendre quelles sont les dimensions
sous-jacentes qui expliquent le mieux les comportements d'achat des clients.
On note que :
● Les variables : vêtements.pour.femmes_Non , Accessoires_Oui, Site.web et
Faible contribuent à la construction du 1er goupe .
● Les variables : vêtements.pour.hommes_Oui , Accessoires_Non,
Magasin.physique et Élevée contribuent à la construction du 2 ème goupe.
● Les variables: variables.pour.femmes_Oui , vêtements.pour.hommes_Non et
Moyenne contribuent à la construction du 3 ème goupe.

4. Tableau disjonctif complet


On associe à chaque modalité une variable appelée variable indicatrice ne prenant que les
valeurs 1 et 0 selon que la modalité est vérifiée ou non.
Xj: variable indicatrice de la modalité j
(de j=1 à m1 pour la première modalité, de j=m1+1 à m1+m2 pour la deuxième...)
Xj(k): valeur (0 ou 1) de la variable indicatrice Xj pour l’individu k

🙗 Commande :
> binaries.actives <- acm.disjonctif(subset(canimes,select=1:5))
>colnames(binaries.actives)<-unlist(sapply(canimes[1:3],function(
x){levels(x)}))
> binaries.actives

Année universitaire 2022/2023 Page | 16


🙗 Résultat :

Figure 8:Tableau disjonctif complet

5. Coordonnées des individus


🙗 Commande :
> coord <- acm.canimes$co
> coord

🙗 Résultat :

Figure 9:Tableau de cordonnées des individus

Année universitaire 2022/2023 Page | 17


5.1.Projection des modalités

🙗 Commande :
> plot(coord[,1],coord[,2] ,main="Modalités",xlab="Axe1",ylab="Axe2")
> abline(h=0,v=0)

🙗 Résultat :

Figure 10:Graphique des modalités

Année universitaire 2022/2023 Page | 18


5.2. Evaluation des modalités (l'inertie de chaque axe et la
contribution de chaque modalité dans les 2 axes)
L'inertie mesure la quantité d'information contenue dans chaque axe de l'ACM. Plus l'inertie
est élevée, plus cet axe représente une part importante de la variation des données. En
évaluant l'inertie de chaque axe, on peut déterminer leur importance relative dans la
représentation des comportements d'achat des clients.

🙗 Commande :
> eval.acm <- inertia.dudi(acm.canimes,col.inertia = T)
> eval.acm

🙗 Résultat :

Année universitaire 2022/2023 Page | 19


5.3.Contribution absolue des modalités
C’est la contribution absolue de chaque variable catégorielle dans la segmentation des
clients en fonction de leurs préférences et comportements d'achat.
On identifie les variables qui ont le plus d'influence sur la variation des comportements
d'achat des clients. La contribution absolue est une mesure de l'importance de chaque
variable dans la représentation des différences entre les clients.

🙗 Commande :
> contrib <- eval.acm$col.abs/100
> rownames(contrib) <- colnames(binaries.actives)
> contrib

Année universitaire 2022/2023 Page | 20


🙗 Résultat :

Explication:
Sur le premier axe principal, les modalités qui contribuent le plus à l'inertie expliqués sont :
● Vêtements.pour.femmes_Oui
● Vêtements.pour.hommes_Oui
● Fréquence.d.achat_Moyenne
Sur le 2ème axe principal, les modalités qui contribuent le plus à l'inertie expliqués sont :
● Fréquence.d.achat_Elevée
● Fréquence.d.achat_Faible
● Magasin physique

5.4.Contribution relative des variables


La contribution relative (le carré des cos) , mesure l'importance de chaque variable dans la
représentation des axes principaux de l'ACM.

🙗 Commande :

Année universitaire 2022/2023 Page | 21


🙗 Résultat :

Explication:
Les modalités les biens représentés (qualité ~ 1) sont :
● Fréquence.d.achat_Moyenne
● Vêtements.pour.femmes_Non
● Vêtements.pour.hommes_Oui

Année universitaire 2022/2023 Page | 22


CONCLUSION
Notre objectif était de se concentrer sur l’analyse des correspondances Multiples (ACM) et de
présenter un travail réalisé par nous-même, loin des solutions prêtes sur internet, qui peuvent
présenter plusieurs fonctionnalités de plus, mais qui restent des solutions standards. Notre
solution a été étudiée soigneusement, avec beaucoup de recherche dans le but de présenter un
travail à la hauteur de vos attentes.
Avec ce travail, nous avons apporté un certain nombre d’éléments de lecture, d’analyse et
d’interprétation ,nous a permis d’appliquer nos connaissances et nos compétences acquis
durant ce module et plus précisément ce que nous avons appris en l’analyse de données.
Le fait de travailler en binôme, nous a appris de se collaborer et de respecter l’avis de l’autre
ainsi que leur façon de travailler.
Finalement, Nous gardons ce mini projet un excellent souvenir, qui constitue une expérience
valorisante et encourageante pour notre avenir.

Année universitaire 2022/2023 Page | 23

Vous aimerez peut-être aussi