Vous êtes sur la page 1sur 23

Synthèse de l’ACP et de son principe (cas fictif

de 8 variables)

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 25


Matrice des poids associés aux individus

Les données peuvent être pondérées : Le poids attribué à chaque


individu exprime l’importance que l’on désire lui accorder dans
l’étude (représentativité de l’échantillon étudié dans la population):

0 𝑝 1 ,𝑖 1⋯𝑛

𝑝 1

Généralement

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 26


Centre de gravité

Le centre de gravité du nuage de points individus G


caractérise la position globale de nuage (individu) dans le
repère défini par les variables. C’est le point autour duquel «
gravitent » les individus du nuage.

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 27


Inertie
On peut définir une distance ou éloignement entre individus :

Eloignement d’un point du nuage par rapport au centre de


gravité :

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 28


Inertie

Inertie du nuage de points par rapport à son centre de gravité =


somme pondérée des éloignements au centre de gravité
𝐼 𝑝 𝑑 𝑀 ,𝐺 𝑉𝑎𝑟 𝑋

I caractérise la dispersion ou la forme du nuage par rapport à son


centre. : au plus I est élevée, au plus le nuage est dispersé autour de
son centre de gravité.
Une inertie nulle signifie que tous les individus sont identiques.
Lorsque les variables sont centrées et réduites I=p
L’inertie mesure la quantité d’information contenue dans X
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 29
Tableau centré-réduit associé à X
Réduction = ramener toutes les variables à une même origine
0 et un même écart-type 1.
̅
Centrage + réduction =

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 30


Matrice de variance-covariance associée à X

V=

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 31


Matrice de corrélation associée à X
Le coefficient de corrélation linéaire entre deux variables
quantitatives permet de mesurer le lien linéaire entre ces deux
variables:
,

1 𝜌 𝑋𝑋 …𝜌 𝑋 𝑋 ⋯ 𝜌 𝑋𝑋
𝜌 𝑋 𝑋 1 ⋯𝜌 𝑋 𝑋 ⋯ 𝜌 𝑋 𝑋
⋮ ⋯ ⋯ ⋯ ⋮
𝑅
𝜌 𝑋𝑋 𝜌 𝑋𝑋 1 𝜌 𝑋𝑋
⋮ ⋯ ⋯ ⋯ ⋯ ⋮ 𝑅 𝑋 𝑃𝑋 𝐷 𝑉𝐷
𝜌 𝑋 𝑋 𝜌 𝑋 𝑋 𝜌 𝑋 𝑋 1

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 32


2. La représentation des variables
• Etudions maintenant le nuage composé de p
points-variables dans l’espace de dimension N
associé aux individus
• Les variables étant centrées réduits, tous les
points sont à la même distance unité de
l’origine (situé sur une hypersphère)
• dans l'espace, deux variables corrélées
positivement forment un angle aigu. Si les
variables sont corrélées négativement, alors
l'angle est obtus. Si elles ne sont pas corrélées,
l'angle est droit.
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 33
Aux nouveaux axes factoriels sont associées des nouvelles
variables, appelées composantes principales et notées Cj.
Les composantes principales sont des variables synthétiques,
non corrélées linéairement deux à deux.
la coordonnée d'un point-variable X sur l'axe de rang k est
égale au coefficient de corrélation linéaire entre la variable
d'origine X et la composante principale Ck associée à l'axe k.
Un cercle de corrélation est un plan de projection du nuage
des points-variables, défini par deux axes factoriels.
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 34
Projection d'une variable illustration d'un effet taille où toutes les
sur le cercle de corrélation variables sont fortement corrélées
positivement entre elles

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 35


IV. Choisir et interpréter les axes factoriels

1. Choix du nombre d'axes


Pour sélectionner les axes à interpréter, il nous faut évaluer leur capacité
à représenter le nuage de points. Autrement dit, l'axe k sur lequel se
projette le nuage mérite d'étre retenu s'il permet de rstituer une part
suffisante de la représentation initiale du nuage et de sa dispersion. On
mesure la dispersion globale du nuage de points par l'inertie totale du
nuage, égale à : ∑ 𝑂𝑀 . Elle est aussi égale au nombre de variables
p dans le cas de l’ACP normée.
On mesure la dispersion dans la direction de l’axe factoriel k par l’inertie
𝟏
projetée du nuage de point sur cet axe, ∑𝑵 𝒊 𝟏 𝑶𝑷 𝟐
𝒊 , égale à 𝝀𝒌 associée à
𝑵
cet axe
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 36
La qualité de représentation d'un nuage par un axe se mesure avec
le pourcentage d'inertie (ou de variance) expliquée par l'axe, égale
à:
∑𝑵
𝒊 𝟏 𝑶𝑷 𝟐
𝒊
∑𝑵
𝒊 𝟏 𝑶𝑴 𝟐
𝒊
𝝀𝒌 𝝀𝒌
Aussi égale :
𝑰𝒏𝒆𝒓𝒕𝒊𝒆 𝒕𝒐𝒕𝒂𝒍𝒆 𝒑
𝝀 𝟏 𝝀𝟐
l'inertie expliquée par le premier plan factoriel est égale
𝒑

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 37


2. Interprétation des axes
• Relever les fortes corrélations entre les variables actives et les
composantes principales associées aux axes.
• On peut fixer une valeur minimale à retenir (par exemple au moins
0,70 en valeur absolue)
• Il est souvent pratique de construire des tableaux d'aide à
l'interprétation : un tableau par axe (Gauche : , Droite : )
• L'étude des corrélations avec les composantes principales permet de
proposer une interprétation globale des axes factoriels.

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 38


3. Synthèse: les cercles de corrélation
• Les cercles de corrélation présentent une synthèse graphique, dans un
plan donné, des corrélations linéaires entre les variables d'origine actives
ou illustratives et les composantes principales créées par l’ACP.
• Les variables s'inscrivent dans un cercle de rayon 1.
• Une variable est bien projetée sur le cercle de corrélation si l'extrémité du
vecteur qui la représente proche du cercle.
• On retient uniquement pour l'interprétation les variables bien projetées.
• Combien de cercles de corrélation examiner? Si l'on retient trois axes
factoriels, on lit généralement le cercle de corrélation du premier plan
factoriel (1,2), et celui du plan factoriel (1,3).
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 39
Aide à l’interprétation
•Aucune interprétation •Non corrélation

•Corrélation négative

•Corrélation positive

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 40


V. Etudier la position des individus
1. Contribution d'un individu à un axe
• On a construit les axes factoriels en maximisant ∑𝑵𝒊 𝟏 𝑶𝑷𝟐𝒊

• Un point-individu très éloigné de l'origine participe beaucoup à la


formation de l'axe et risque de l'attirer dans sa direction

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 41


2. Qualité de la représentation d'un individu sur un axe
• Il est indispensable d'évaluer la qualité de la projection pour chacun des
points-individus. Pour un individu Mi, on la mesure par :
• Ce rapport est la cosinus carré de l’angle formé par OMi et OPi.
• On peu ainsi juger de la qualité de représentation
d’un individu Mi soit par l’angle θ (proche de à ou 180,
la qualité de représentation est bonne; proche de 90° ou
270°, elle est mauvaise) soit par le rapport (si proche de 1, pas de
déformation, si proche de 0, mauvaise qualité de projection)
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 42
3. Analyse de la position des individus sur les plans
factoriels
A partir des coordonnées des individus, on peut interpréter leur
position au regard des deux axes du plan factoriel et de leur
interprétation
Le croisement des axes factoriels permet de donner une interprétation
aux quadrants des plans factoriels. Selon le quadrant dans lequel se
situent les individus, on en déduit leurs particularités.

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 43


L'ACP en quelques points

Analyse en composantes principales (ACP)


– Méthode descriptive d'analyse multivariée visant à résumer l'information
principale contenue dans p variables quantitatives continues pour N
individus
– Variables et individus actifs versus illustratifs: contribuent versus ne
contribuent pas à l'analyse
Construction de p axes factoriels
– Axe de différentiation globale des individus
– Indépendants les uns des autres
– Ordonnés selon la part d'inertie (part d'information) restituée par chacun
– Associés à p nouvelles variables, combinaisons linéaires des p variables
– Sinterprètent à partir des corrélations avec les variables d'origine
Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 44
Représentation graphique du nuage de points
– Plans factoriels représentation plane du nuage des factoriels points-individus
croisant deux axes
– Cercle de corrélation: représentation des variables initiales sur deux axes
factoriels
Interprétation des individus
– Qualité de représentation d'un individu par un axe factoriel: le cosinus carré
– Influence sur la création d'un axe factoriel: la contribution relative

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 45


VI. LES CONDITIONS ET OPTIONS DE L’ANALYSE
FACTORIELLE
• La taille de l’échantillon nécessaire
• Le choix de la matrice des données
• Matrice de corrélation
• Matrice de covariance
• L’adéquation des données
• Le test de Sphéricité de Bartlett
• La « Measure of Sampling Adequacy » (MSA) ou Kaiser-
Meyer-Olkin (KMO)

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 46


• L’extraction des facteurs
• l’« eigenvalue », ou règle des valeurs propres > 1 ou règle de Kaiser-Guttman
• le « Scree Test », ou test du coude ou de l’éboulis
• le critère du pourcentage de variance
• La rotation des facteurs :il existe plusieurs méthodes de rotation :
• Varimax
• Oblimin direct
• Quartimax
• Equamax

Analyse quantitative et qualitative, 3e AA, ISAE-Gafsa, S1-2021 47

Vous aimerez peut-être aussi