Vous êtes sur la page 1sur 19

Chapitre:AFCM

Pr. Zoglat

1/4/2022

Pr. Zoglat Chapitre:AFCM 1/4/2022 1 / 19


Objectifs

On cherche à analyser un tableau de données où les individus (en lignes)


sont décrits par des variables qualitatives (en colonnes). L’AFCM est un
outil pour étudier les similarités entre les individus et établir leurs profils à
partir des variables qui les décrivent.

Étapes de l’étude
1- Lire les données
2- Choisir les individus et les variables actives.
3- Choisir le nombre de facteurs.
4- Analyser les résultats.
5- Décrire les dimensions de variabilité.

Pr. Zoglat Chapitre:AFCM 1/4/2022 2 / 19


Exemple

On va illustrer cela en analysant les données du fichier credit.csv.


Il s’agit de 66 clients d’une compagnie de crédit. Les 11 variables ob-
servées sont décrites ci-après.

Pr. Zoglat Chapitre:AFCM 1/4/2022 3 / 19


description des variables

Variable Modalités Description


Prêt Renovation, voiture, Scooter, But du prêt
Moto, Mobilier/Ammeub.,Sidecar
Apport Apport, Pas d’apport Dépos de Garantie
Impayé Imp 0,Imp 1 ou 2,Imp 3 et plus Prêts antérieurs impayés
Endettement End 1, End 2,...,End 4 Dette /Revenu
Assurance Sans Ass., AID (Ass. Ival. Décès.) Type d’assurance prise
AID+ Chômage, Senior (> 60) par le client
Famille Union Libre, Marrié, Veuf, État
Célibataire, Divorcé Matrimonial
Enfants Enf 0, Enf 1, ..., Enf 4 Nb d’enfants à charge
Logement Propriétaire, Accedant à la proprieté,
Locatire, Logé par la famille,
Logé par l’employeur.
Profession Ouvrier non qualifié, Ouvrier qualifié,
Cadre moyen, Cadre sup., Retraité.
Intitulé M. Mme. Mlle.
Age 20 (18-29 ans),30 (30-39),40 (40-49),
50 (50-59), ≥ 60

Pr. Zoglat Chapitre:AFCM 1/4/2022 4 / 19


Lecture des données

summary(credit)

Profession Intitule Age


Cadre moyen :17 MLLE: 5 Min. :20.00
Cadre sup. : 8 MME : 8 1st Qu.:30.00
Ouvrier non qualifie:11 MR :53 Median :40.00
Ouvrier qualifie :18 Mean :39.39
Retraite :12 3rd Qu.:50.00
Max. :60.00
On remarque que la variable “Age’ ’ est plutôt considérée comme une
variable quantitative. Pour la convertir en variable qualitative,
credit[,"Age"] = factor(credit[,"Age"])

Pr. Zoglat Chapitre:AFCM 1/4/2022 5 / 19


Lecture des données

credit[,"Age"] = factor(credit[,"Age"])

summary(credit) # pour vérifier que c'est fait.

Profession Intitule Age


Cadre moyen :17 MLLE: 5 20:10
Cadre sup. : 8 MME : 8 30:21
Ouvrier non qualifie:11 MR :53 40:10
Ouvrier qualifie :18 50:13
Retraite :12 60:12

Pr. Zoglat Chapitre:AFCM 1/4/2022 6 / 19


Examiner les fréquences

En AFM il est important qu’il n’y ait pas de modalité avec un trop faible
effectif. Une telle modalité aurait un poids trop important et influencerait
le choix des facteurs.
En présence de variables qui prennent des modalités rares (faibles effectifs),
il est conseillé de recourir à l’une des solutions suivantes:
Regrouper les modalités rares. Cette solution est recommandée pour
les variables ordinales.
Répartir les individus associés à une modalité rare entre les autres
modalités (de la même variable). Certains programmes offrent des
répartitions de ce genre.
Éliminer les individus associés aux modalités rares.

Pr. Zoglat Chapitre:AFCM 1/4/2022 7 / 19


Chercher les modalités a faibles effectifs

Pour détecter les modalités à faible effectif, on peut:


utiliser les représentations graphiques:
for (i in 1:ncol(credit)){
par(ask=FALSE) # plot graphs one-by-one
plot(credit[,i])
}

ou examiner les effectifs:


summary(credit)

Pr. Zoglat Chapitre:AFCM 1/4/2022 8 / 19


Regrouper des modalités

Dans notre cas, on procède aux regroupement ci-dessous:


levels(credit[,"Pret"])[4] <- "Side-car"
levels(credit[,"Enfants"])[4] <- "Enf_4"
levels(credit[,"Logement"])[3] <- "Loge par la famille"
summary(credit)

Pr. Zoglat Chapitre:AFCM 1/4/2022 9 / 19


Choisir les variables actives

Supposons que l’on s’intéresse à l’historique bancaire d’un client. Nous allons
donc déclarer actives les variables contenant de l’information à ce sujet. Il
s’agit des cinq premières variables.
Rappelons que les variables actives sont les seuls qui contribuent à la consti-
tution des facteurs.
Nous déclarons comme variable supplémentaires,les autres variables (infor-
mations d’ordre général sur les clients).

Pr. Zoglat Chapitre:AFCM 1/4/2022 10 / 19


Le code R pour l’AFCM

crd.res.mca<- MCA(credit, quali.sup=6:11,


level.ventil=0,graph = FALSE)

L’argument level.ventil est 0 par défaut, cela implique q’aucune ventilation


n’est effectuée. Si cette valeur avait-été égale à 0.05, cela impliquerait que
les catégories dont l’effectif est inférieur ou égal à 5% de l’effectif total
seront automatiquement ventilées avant d’entamer l’AFC.
Par défaut aussi, les résultats sont donnés pour les cinq premiers facteurs.
Pour avoir n facteurs, ajouter l’argument ncp = n.

Pr. Zoglat Chapitre:AFCM 1/4/2022 11 / 19


Choisir le nombre de facteurs

barplot(crd.res.mca$eig[,2],names=
paste("Dim",1:nrow(crd.res.mca$eig)))

Les pourcentages des variances décroit de manière régulière. Cela rend


difficile le choix du nombre de facteurs. Notons toutefois que cette situation
est très fréquente en AFC.

Pr. Zoglat Chapitre:AFCM 1/4/2022 12 / 19


Choisir le nombre de facteurs

Le code suivant founit les pourcentages de variation.


To obtain the numerical results, we use the following instruction:
round(crd.res.mca$eig[1:5,],2)

Percentage cumulative percentage


eigenvalue of variance of variance
dim 1 0.39 15.07 15.07
dim 2 0.32 12.34 27.41
dim 3 0.29 11.31 38.73
dim 4 0.27 10.52 49.24
dim 5 0.24 9.33 58.58

Pr. Zoglat Chapitre:AFCM 1/4/2022 13 / 19


Analyse des Résultats

fviz_mca_var(crd.res.mca, axes =1:2,invisible="quali.sup", rep

Pr. Zoglat Chapitre:AFCM 1/4/2022 14 / 19


Analyse des Résultats

Le premier axe oppose les clients dont le poids de la dette est End 4 à ceux
dont le poids de la dette est End 2.
Le deuxième axe oppose les clients ayant 1 ou deux prêts impayés Imp 1 2 à
ceux ayant au moins 3 prêts impayés Imp 3 et plus.
Et pour d’avantage de caractérisations des axes, on rajoute d’autres variables
sur le plan.
fviz_mca_var(crd.res.mca, axes = c(1,2), repel = TRUE)

Pr. Zoglat Chapitre:AFCM 1/4/2022 15 / 19


Plus de variables

Pr. Zoglat Chapitre:AFCM 1/4/2022 16 / 19


Caractérisation des axes

Le premier axe oppose les Jeunes aux Séniors. Ainsi on trouve à gauche les
personnes agées qui sont propriétaires et demandent un prêt pour faire des
rénovations, alors qu’à droite on trouve des jeunes qui demandent un prêt
pour acheter un scooter. Les jeunes ont tendance à avoir un poids de la
dette relativement lourd.
Le deuxième axe oppose les personnes avec de grandes difficultés financières
(en bas) aux autres (en haut). On peut identifier les personnes ayant des
difficultés à rembourser leurs prêts, ceux au chaumage et ceux qui ont des
assurances AID. Ce facteur caractérise la difficulté financière.

Pr. Zoglat Chapitre:AFCM 1/4/2022 17 / 19


Représentations des variables

Le code ci-dessous permet de visualiser les corrélations entre les facteurs et


les variables afin de pouvoir caractériser les facteurs:
fviz_mca_var(crd.res.mca, choix="var",repel = TRUE)

Pr. Zoglat Chapitre:AFCM 1/4/2022 18 / 19


Représentations des variables

C’est la variable Pret qui contribue le plus au premier facteur, alors que la
variable Impaye a la plus grande contribution au deuxième facteur.
Ces informations résument l’influences des modalités des variables sur les
axes.
De cette manière, les modalités de la variables Pret contribuent fortement à
la création du premier facteur alors que les le deuxième facteur se sont les
modalités de la variables Impaye qui ont la plus forte contribution.

Pr. Zoglat Chapitre:AFCM 1/4/2022 19 / 19

Vous aimerez peut-être aussi