Vous êtes sur la page 1sur 7

Las9 pour valider

ACP(les variables quantitatives)

Pour appliquer l’ACP il faut suivre les étapes suivantes :


1-est ce que l’ACP est réalisable ou pas

Donc il faut vérifier :

-la majorité des coeff à l’intérieur de la matrice de corr >0.5

-KMO>0.5

-test significatif proche de 0

Extraction>0.5 sinon on élimine les variables qui sont inferieurs a 0.5

2-combien d’axes avec lesquels on va travailler ?

Il faut dépasser 80% de l’information pour être fidèle

!!Si par exemple déjà le premier axe dépasse 80% on doit nécessairement choisir 2 axes
3-Matrice des composantes explique comment il est représenté chq variable sur chq axe

(les nombres en Valeur absolue)

Graphe des composantes

Si la variable se trouve à l’extrémité de l’axe donc elle est proche de 1 c-a-d bien représenté par cette axe

4-interpretation

Pour interpréter les variables on pense tout d’abord à l’objectif de l’entreprise ( cette video explique la
procédure : https://www.youtube.com/watch?v=R0oM6BinEE4 )

Conclusion :
-L’ACP réduit les dimensions et on peut utiliser les axes retenus pour faire une classification.
-puisque ACP est consacrée aux variables quantitatives donc il faut toujours standardisés les
données car les échelles de mesures de variables doivent être compatibles.
AFC(les variables qualitatives)

Les relations qui peuvent exister entre 2 variables qualitatives en


cherchant le lien entre les modalités

!!!!!! on ne standardise jamais dans le cas des variables qualitatives faites


attention !!!!!!

On va travailler avec ces 2 variabes (l’exemple du cours)


ancienneté de chômage(la durée)

niveau d’enseignement

Pour cette méthode il faut juste savoir interpréter les tableaux suivants :

-tableau des correspondances :il permet de constater quelles sont les catégories les plus représentées

-Tableau ‘Profils-lignes’ : il se lit ligne par ligne dans notre TP par exemple pour chaque niveau
d’enseignement quelle part représente chaque durée d’ancienneté

-Tableau Profils-colonnes : il se lit colonne par colonne pr chq dure d’ancienneté de chômage quelle part
représente chq niveau d’enseignement

-Tableau ‘Récapitulatif :il permet de déterminer le nombre d’axes pertinents

Le nombre d’axes possibles égale au min de ( (nbr de modalités de colonne)-1)VS( (nbr de modalités de
ligne)-1)

NB :l’inertie=le carré de la valeur propre

 l’inertie totale =la somme des carrées des distances

La valeur propre coeff de corrélation

-Tableau ‘Caractéristiques des points-lignes :il permet de placer les modalités sur les axes

 Pour score dans la dimension :


le premier axe oppose 2 choses ca dépend des coords positives ou négatives
 Pour les contributions

Du point vers l'inertie de la dimension :ils permettent de savoir comment les variables expliquent les axes c-
a-d les var qui représentent plus l’axe (le premier axe est représenté par les modalités A et B et C avec les
pourcentages).seuil>=1/(nbr de modalités)
De la dimension vers l'inertie du point : il donne la façon dont les modalités sont expliquées par les axes(une
telle modalité par exemple est mal représentée par le premier axe ms elle définit bien le 2eme axe etc).
seuil>=50%

-Tableau ‘Caractéristiques des points colonnes :

 Pour score dans la dimension :

le premier axe oppose 2 chose selon le signe de coords(négatives/positives).

 Pour les contributions

Du point vers l'inertie de la dimension :ils permettent de savoir comment les variables expliquent les axes c-
a-d les var qui représentent plus l’axe (le premier axe est représenté par les modalités A et B et C avec les
pourcentages). Seuil>=1/(nbr de modalités)

De la dimension vers l'inertie du point : il donne la façon dont les modalités sont expliquées par les axes(une
telle modalité par exemple est mal représentée par le premier axe ms elle définit bien le 2eme axe
etc).seuil>=50%

C’est presque la même chose dans ces 2 derniers tableaux


-Diagrammes : on peut conclure les résultats obtenus et interpréter

On interprète le graphe de chaque variable pour faciliter la tache.

!!!!Pratique sous SPSS : base de données intitulé « Emploi »

Les bases de données se trouvent dans le DRIVE ci-après (statistiqueanalyse de


donnéesEmploi

https://drive.google.com/drive/folders/1_J4OJzs18yUDHXzpfV7eAGEwcsy7H-
Be?usp=sharing

ACM (n individus avec p variables qualitatives chacun avec des


modalités)
Exemple : si les variables sont par exemple lunette, barbe, moustache les modalités seront
respectivement : absent/présent et absent/courte/longue et absent/court...

L’objectif de l’ACM est établir les ressemblances entre les individus et les associations entre les
modalités

En général on dit que 2 individus se rassemblent lrsq ils présentent les mêmes modalités.

Si deux modalités de même variable sont proches dans l’espace de projection, ceci traduit une
ressemblance entre les groupes d’individus qui les ont choisies.
NB : ACM peut également traiter les variables quantitatives sous condition qu’elles soient
rendues qualitatives.

-Pour l‘ACP il faut savoir comment démontrer les relations du cours à savoir Inertie d’une
variable, Inertie d’une modalité, Inertie total et Distance khi2.

!!!!Pratique sous SPSS : base de données intitulé « Exemple_ACM »

La base de données se trouve


dans le DRIVE ci-après (2emepartieanalyse_de
s_donnéesTPPDF+Word Exemple_ACM

https://drive.google.com/drive/folders/160tLbWSjJhBdWMEti-
9n0x6rCHDuqVEn?usp=sharing

Les questions classiques :


1. Est-ce que on peut utiliser des variables quantitatives
dans l’ACM ?
2. Est-ce que on peut utiliser des variables qualitatives
dans l’ACP ?
3. Doit-on standardiser les données lors d’une AFC ?
D’une ACP ?
4. Lors d’une AFC, quand est ce que peut-on considérer 2
modalités sont équivalentes ? Comment doit-on
procéder dans ce cas ?
5. Peut-on classer les individus après une AFC ?une ACP ?
6. Quelles sont les fonctions de distances utilisées dans le
cas de variables quantitatives(ACP) ?qualitatives(AFC)
7. Quelle est le lien entre l’AFC et l’ACM ?
8. Lors d’une ACP comment doit-on procéder si les
variables ne sont pas bien représentées sur les axes
retenus ?
9. Lors d’une ACP comment doit-on procéder si la plupart
des variables sont représentées sur un seul axe ou bien
plusieurs axes à la fois ?
10. Lors de la classification, est ce que le choix de la
stratégie d’agrégation dépend-t-il de celui de la
métrique utilisé ?
11. Lors de la discrétisation des vars quantitatifs (ACM),
pourquoi il est déconseillé de construire des modalités
à faible effectif ?
12. Pourquoi il est nécessaire d’équilibrer le nombre de
modalité des variables discrétisées ?
NB
-il faut distinguer entre les 2 questions 8 et 9
-Il faut faire un petit résumé pour ACP, AFC, ACM c-à-d
comment doit-on procéder pour chaque méthode+ un
résumé pour la classification (avantages+ inconvénients
la différence entre la classification hiérarchique et non
hiérarchique) ces questions ont été déjà posées lors de
l’examen.

Bn courage 
#kaghima
Scanned with CamScanner
Scanned with CamScanner

Vous aimerez peut-être aussi