Académique Documents
Professionnel Documents
Culture Documents
Elle permet de construire des variables artificielles (car non mesurés mais calculés à partir des Moyenne : la valeur qui a la moyenne la plus élevée est celle qui donne le plus de
données) qui expliquent l’ensemble des variables statistiques prises en compte dans l’ACP satisfaction à l’utilisateur et vice versa.
5- Qu’est ce qu’on obtient ? Ecart-type : on analyse tous les écart-type plus E moins il y a de dispersion
On obtient ainsi un ensemble de nouvelles variables, en plus petits nombre que les variables initiales.
Chacune de ces variables initiales est liée à l’ensemble des variables artificielles retenus autour de la moyenne chose qui implique une certaine homogénéisation quant au
degré de satisfaction des individus.
6- Quelles sont les propriétés de l’ACP ?
- Les composantes principales sont centrées et non corrélées entre elles
- L’inertie expliquée par chaque axe principal = la variance de la composante associé
- Les composantes sont classées par ordre décroissant des variances
2. MATRICE DE CORRELATION : 3. INDICE KMO ET TEST DE BARTLETT :
Indice KMO : il sert à détecter les variables dont la corrélation n’est pas
significative et dont il faut se séparer pour passer Analyse en composantes
principales. Un KMO assez élevé (> 0,6) est indispensable pour obtenir une
ACP intéressante.
KMO | Recommandation
>0,9 | très excellent
Elle permet de déceler les variables à forte corrélation pouvant être 0,8+ | Excellent
0,7+ | Moyen
regroupées (si les variables présentes des valeurs élevées de corrélation 0,6 | Médiocre
entre elles alors il faut procéder à une analyse en composantes 0,5 | Misérable
principales) <0,50 | Inacceptable
Plus la corrélation approche de 1 ou -1 plus il y a de corrélation entre les 2
variables. !!!Si le KMO est inférieur à 0.5 alors la suppression des variables initiales n’est
Plus les variables présentent de fortes corrélation plus elles peuvent être pas nécessaire. Il faut calculer le KMO pour chaque variable afin de retrancher
regroupés en dimensions homogènes. Sinon elles sont hétérogènes. (Quel celles qui ne présentent pas une corrélation significative grâce à la matrice anti-
est le problème qui se pose quand les variables sont hétérogènes ? Grand images.
nombre de variables et visualisations)
(,694 | ,774 | …) ces valeurs correspondent aux mesures KMO calculés pour
chaque variable afin de mesurer sa corrélation avec les autres.
5. GRAPHIQUE DES VALEURS PROPRES :
On ne retient que les composantes qui expliquent plus d’une « 1 » valeurs propre.
On léve au carré les coéfficients de chaque variables et on calcule leurs somme : o Les groupes d’individu ayant donc un comportement identique
o Les individus isolés
o Ex : la variable « vitesse » :0,815²+0,043²+0,199²= 0,70 o La position relative des individus par rapport aux axes
8. DIAGRAMME DES COMPOSANTES :
Si la somme <1 alors la vraibles est bien représenté graphiquement et donc elle
est proche du cercle de correlation .
7. DIAGRAMME :
Plus les variables sont proches par rapport au axes qui les représentes moin une
rotation est nécessaire.
Pourquoi la rotation ?
Obtenir une structure plus sensée. Les axes initiaux sont tournés autour de l’origine
jusqu’à ce qu’une autre position soit atteinte.
Autres :
on peut constater que 70% de la variance de la variable vitesse est expliquée par
les 3 composantes extraites et qu’ elle a une très bonne qualité de représenation.
Ex : On peut agréger « Tenue de route » avec « sécurité », aussi
ANALYSE TYPOLOGIQUE
« l’esthétique » avec « la vitesse » et même « l’espace » avec « le confort ».
b) les groupes soient les plus différents possible les uns des autres.
1) MATRICE DE PROXIMITE :
Historique des regroupements. les deux classes les plus proches sont
regroupées . La distance entre les deux classes regroupées est affichée dans
la colonne coefficients, selon un ordre croissant.
Dans l’étape de l’apparition de la classe figure la dernière phase où sont
apparus les groupes pour la dernière fois.
4) ANOVA
Une classe sous ou sur représentée (à tord) peut amener à faire une
nouvelle analyse avec un nombre différent de classes.
dans ce cas on elimine la classe 4.
coordonnées des centres de chaque classe finale. Ces centres (et donc les
classes associées) sont interprétés par leurs coordonnées sur les
différentes variables.
Une coordonnée importante (positive) sur une variable signifiera que le
groupe correspondant est caractérisé par des valeurs fortes (au dessus de
la moyenne) pour cette variable.
ANALYSE FACTORIELLE DES CORRESPONDANCES 1. TABLEAU DES CORRESPONDANCES
Quels sont les objectifs de l’AFC ?
o Evaluer les ressemblances entre modalités d’une même variable
o Evaluer les proximités entre les modalités des deux variables
Quel est l’intérêt de l’AFC ?
o Expliquer graphiquement une variable à partir d’une autre
variable
o Aspect non inférentiel de la méthode
Il faut aussi tenir compte dans l’interprétation que l’AFC n’étudie que la
liaison entre les deux variables (et non les variables elles-mêmes).
Méthode :