Vous êtes sur la page 1sur 51

Analyse de données

Abdallah Abarda
FSJES Settat,
Année universitaire 2019-2020.

AFC

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

L’analyse factorielle des


correspondances

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

Caractéristiques de l’AFC
Son objectif est d’analyser la liaison existant entre deux
variables qualitatives (si on dispose de plus de deux
variables qualitatives, on aura recours à l’Analyse des
Correspondances Multiples).
Avant de mettre en oeuvre une A.F.C., il faut s’assurer que
cette liaison existe bien. Pour cela, il existe des graphiques
(diagrammes en barres de profils) et des caractéristiques
numériques permettant de mettre en évidence une telle
liaison lorsqu’elle existe.
Dans ce cas, Le test du khi-deux d’indépendance, basée sur
l’indice khi-deux, permet de tester s’il existe ou non une
liaison significative entre deux variables qualitatives.

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

Caractéristiques de l’AFC
Son objectif est d’analyser la liaison existant entre deux
variables qualitatives (si on dispose de plus de deux
variables qualitatives, on aura recours à l’Analyse des
Correspondances Multiples).
Avant de mettre en oeuvre une A.F.C., il faut s’assurer que
cette liaison existe bien. Pour cela, il existe des graphiques
(diagrammes en barres de profils) et des caractéristiques
numériques permettant de mettre en évidence une telle
liaison lorsqu’elle existe.
Dans ce cas, Le test du khi-deux d’indépendance, basée sur
l’indice khi-deux, permet de tester s’il existe ou non une
liaison significative entre deux variables qualitatives.

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

Caractéristiques de l’AFC
Son objectif est d’analyser la liaison existant entre deux
variables qualitatives (si on dispose de plus de deux
variables qualitatives, on aura recours à l’Analyse des
Correspondances Multiples).
Avant de mettre en oeuvre une A.F.C., il faut s’assurer que
cette liaison existe bien. Pour cela, il existe des graphiques
(diagrammes en barres de profils) et des caractéristiques
numériques permettant de mettre en évidence une telle
liaison lorsqu’elle existe.
Dans ce cas, Le test du khi-deux d’indépendance, basée sur
l’indice khi-deux, permet de tester s’il existe ou non une
liaison significative entre deux variables qualitatives.

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

Caractéristiques de l’AFC
L’A.F.C. est, en fait, une Analyse en Composantes
Principales (A.C.P. ; voir le chapitre 1) particulière, réalisée
sur les profils associés à la table de contingence croisant les
deux variables considérées.
l’A.F.C. consiste à réaliser une A.C.P. sur les profils-lignes
et une autre sur les profils-colonnes.
Les résultats graphiques de ces deux analyses sont ensuite
superposés pour produire un graphique (éventuellement
plusieurs) de type nuage de points, dans lequel sont
réunies les modalités des deux variables considérées, ce
qui permet d’étudier les correspondances entre ces
modalités, autrement dit la liaison entre les deux variables.

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

Caractéristiques de l’AFC
L’A.F.C. est, en fait, une Analyse en Composantes
Principales (A.C.P. ; voir le chapitre 1) particulière, réalisée
sur les profils associés à la table de contingence croisant les
deux variables considérées.
l’A.F.C. consiste à réaliser une A.C.P. sur les profils-lignes
et une autre sur les profils-colonnes.
Les résultats graphiques de ces deux analyses sont ensuite
superposés pour produire un graphique (éventuellement
plusieurs) de type nuage de points, dans lequel sont
réunies les modalités des deux variables considérées, ce
qui permet d’étudier les correspondances entre ces
modalités, autrement dit la liaison entre les deux variables.

Abdallah Abarda Module: Analyse de données


Analyse factorielle des correspondances

Caractéristiques de l’AFC
L’A.F.C. est, en fait, une Analyse en Composantes
Principales (A.C.P. ; voir le chapitre 1) particulière, réalisée
sur les profils associés à la table de contingence croisant les
deux variables considérées.
l’A.F.C. consiste à réaliser une A.C.P. sur les profils-lignes
et une autre sur les profils-colonnes.
Les résultats graphiques de ces deux analyses sont ensuite
superposés pour produire un graphique (éventuellement
plusieurs) de type nuage de points, dans lequel sont
réunies les modalités des deux variables considérées, ce
qui permet d’étudier les correspondances entre ces
modalités, autrement dit la liaison entre les deux variables.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Données
On considère deux variables qualitatives X et Y :
X à r modalités notées x1 , ..., xl , ..., xr ;
Y à c modalités y1 , ..., yh , ..., yc ;
On les observe simultanément sur n individus (ayant ici
obligatoirement tous le même poids n1 )

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Données
Ces données peuvent être présentées sous la forme d’une table
de contingence, ou tableau à double entrée :

F IGURE – Tableau de contingence

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Données
Ces données peuvent être présentées sous la forme d’une table
de contingence, ou tableau à double entrée :

F IGURE – Tableau de contingence

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Le principe AFC
On suppose qu’il existe une liaison entre X et Y , et on
cherche à décrire, à expliciter, cette liaison.
On se base sur l’étude des profils-lignes et des
profils-colonnes. Rappelons la définition du lime
profil-ligne :
n n n
( l1 , ..., lh , ..., lc )
nl+ nl+ nl+
celle du hime profil-colonne :
n1h n n
( , ..., lh , ..., rh )
n+h n+h n+h

Abdallah Abarda Module: Analyse de données


Principe de l’AFC
Le principe AFC
On réalise l’A.C.P. du tableau des profils-lignes (les
individus de cette A.C.P. sont les lignes de la table de
contingence, c’est-à-dire les modalités de X) et l’on fait la
représentation graphique des individus, donc des
modalités de X.
On réalise d’autre part l’A.C.P. du tableau des
profils-colonnes (les individus de cette A.C.P. sont
maintenant les colonnes de la table de contingence,
c’est-à-dire les modalités de Y ) et l’on fait la représentation
graphique des individus, donc des modalités de Y.
On montre que ces deux A.C.P. se correspondent et qu’il
est donc légitime de superposer les deux représentations
graphiques.
on s’attache à étudier les correspondances entre les
modalités de X et celles de Y , d’où le nom de la méthode.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Le principe AFC
On réalise l’A.C.P. du tableau des profils-lignes (les
individus de cette A.C.P. sont les lignes de la table de
contingence, c’est-à-dire les modalités de X) et l’on fait la
représentation graphique des individus, donc des
modalités de X.
On réalise d’autre part l’A.C.P. du tableau des
profils-colonnes (les individus de cette A.C.P. sont
maintenant les colonnes de la table de contingence,
c’est-à-dire les modalités de Y ) et l’on fait la représentation
graphique des individus, donc des modalités de Y.
On montre que ces deux A.C.P. se correspondent et qu’il
est donc légitime de superposer les deux représentations
graphiques.
on s’attache à étudier les correspondances entre les
modalités de X et celles de Y , d’où le nom de la méthode.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Le principe AFC
On réalise l’A.C.P. du tableau des profils-lignes (les
individus de cette A.C.P. sont les lignes de la table de
contingence, c’est-à-dire les modalités de X) et l’on fait la
représentation graphique des individus, donc des
modalités de X.
On réalise d’autre part l’A.C.P. du tableau des
profils-colonnes (les individus de cette A.C.P. sont
maintenant les colonnes de la table de contingence,
c’est-à-dire les modalités de Y ) et l’on fait la représentation
graphique des individus, donc des modalités de Y.
On montre que ces deux A.C.P. se correspondent et qu’il
est donc légitime de superposer les deux représentations
graphiques.
on s’attache à étudier les correspondances entre les
modalités de X et celles de Y , d’où le nom de la méthode.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Le principe AFC
On réalise l’A.C.P. du tableau des profils-lignes (les
individus de cette A.C.P. sont les lignes de la table de
contingence, c’est-à-dire les modalités de X) et l’on fait la
représentation graphique des individus, donc des
modalités de X.
On réalise d’autre part l’A.C.P. du tableau des
profils-colonnes (les individus de cette A.C.P. sont
maintenant les colonnes de la table de contingence,
c’est-à-dire les modalités de Y ) et l’on fait la représentation
graphique des individus, donc des modalités de Y.
On montre que ces deux A.C.P. se correspondent et qu’il
est donc légitime de superposer les deux représentations
graphiques.
on s’attache à étudier les correspondances entre les
modalités de X et celles de Y , d’où le nom de la méthode.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC

Remarque
Signalons que la distance entre profils (lignes ou colonnes),
utilisée pour réaliser chaque A.C.P., est un peu
particulière : ce n’est pas la distance usuelle, mais la
distance dite du khi-deux.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Exemple illustratif
Exploitations agricoles de la région Midi-Pyrénées. Les
données proviennent des "Tableaux économiques de
Midi-Pyrénées", publiés par la Direction Régionale de
Toulouse de l’INSEE, en 1996 (données relatives à l’année
1993 ; chiffres arrondis à la dizaine près).

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Le tableau initial
Le premier résultat fourni est la table initiale, avec ses
marges.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Le second résultat est la valeur de l’indice khi-deux
(5375.49) qu’on obtient en faisant la somme, sur l’ensemble
des cellules (des cases) de la table de contingence, des
quantités :
n +n
(nlh − l+ n +h )2
nl+ +n+h
n

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


le tableau des contributions au khi-deux fournit les
quantités ci-dessus dans chaque cellule,
ce qui permet de déceler facilement les cellules (autrement
dit les croisements d’un département et d’une surface)
contribuant le plus au khi-deux, donc à la définition de la
liaison.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


le tableau des contributions au khi-deux fournit les
quantités ci-dessus dans chaque cellule,
ce qui permet de déceler facilement les cellules (autrement
dit les croisements d’un département et d’une surface)
contribuant le plus au khi-deux, donc à la définition de la
liaison.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Considérons par exemple la cellule (1,1) :

Cette valeur est relativement faible (par rapport aux autres


valeurs du tableau), ce qui signifie que les très petites
exploitations (moins de 5 hectares) n’ont rien de très
particulier en Ariège.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Considérons maintenant la cellule (2,1),

Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Considérons maintenant la cellule (2,1),

Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Considérons maintenant la cellule (2,1),

Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Considérons maintenant la cellule (2,1),

Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions au khi-deux


Considérons maintenant la cellule (2,1),

Cette valeur est la plus grande du tableau des contributions, ce qui signifie qu’en Aveyron, les très petites
exploitations présentent une particularité très marquée :elles sont soit très nombreuses, soit très peu
nombreuses (le carré intervenant dans l’expression du khi-deux supprime le signe et ne permet pas de dire
quelle est celle des deux situations qui se présente).
C’est le tableau des profils-lignes, ci-après, qui va permettre de lever cette ambiguïté :
ce type d’exploitations représente entre 14 % et 29 % de l’ensemble des exploitations dans les autres
départements,
elles ne sont que 6,3 % en Aveyron, autrement dit très peu nombreuses.
Ce phénomène est un élément constitutif très important de la liaison existant entre les départements et les
surfaces.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC
Les tableaux de profils
Considérons par exemple la cellule (1,1) :

On a déjà signalé plus haut l’intérêt des profils dans


l’analyse de la table de contingence.
Il est clair que ce sont les variations de profils, d’une ligne
à l’autre ou d’une colonne à l’autre, qui définissent la
liaison entre les deux variables considérées.
Elles doivent donc nécessairement être prises en compte
dans l’analyse de cette liaison.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Les tableaux de profils
Considérons par exemple la cellule (1,1) :

On a déjà signalé plus haut l’intérêt des profils dans


l’analyse de la table de contingence.
Il est clair que ce sont les variations de profils, d’une ligne
à l’autre ou d’une colonne à l’autre, qui définissent la
liaison entre les deux variables considérées.
Elles doivent donc nécessairement être prises en compte
dans l’analyse de cette liaison.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Les tableaux de profils
Considérons par exemple la cellule (1,1) :

On a déjà signalé plus haut l’intérêt des profils dans


l’analyse de la table de contingence.
Il est clair que ce sont les variations de profils, d’une ligne
à l’autre ou d’une colonne à l’autre, qui définissent la
liaison entre les deux variables considérées.
Elles doivent donc nécessairement être prises en compte
dans l’analyse de cette liaison.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Les tableaux de profils
Considérons par exemple la cellule (1,1) :

On a déjà signalé plus haut l’intérêt des profils dans


l’analyse de la table de contingence.
Il est clair que ce sont les variations de profils, d’une ligne
à l’autre ou d’une colonne à l’autre, qui définissent la
liaison entre les deux variables considérées.
Elles doivent donc nécessairement être prises en compte
dans l’analyse de cette liaison.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC

Les tableaux de profils


Considérons par exemple la cellule (1,1) :

Abdallah Abarda Module: Analyse de données


Principe de l’AFC
Les pourcentages d’inertie des différentes dimensions
Comme en A.C.P., le tableau donnant la part d’inertie restituée
par chaque dimension (chaque axe) permet de connaître la
qualité globale des résultats.

Les inerties totales des deux nuages (celui des


profils-lignes et celui des profils-colonnes) sont identiques
et se décomposent de la même manière selon les différents
axes factoriels (ou axes principaux, ou axes principaux
d’inertie) obtenus dans l’analyse.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Les pourcentages d’inertie des différentes dimensions
Comme en A.C.P., le tableau donnant la part d’inertie restituée
par chaque dimension (chaque axe) permet de connaître la
qualité globale des résultats.

Les inerties totales des deux nuages (celui des


profils-lignes et celui des profils-colonnes) sont identiques
et se décomposent de la même manière selon les différents
axes factoriels (ou axes principaux, ou axes principaux
d’inertie) obtenus dans l’analyse.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC
Les pourcentages d’inertie des différentes dimensions
Comme en A.C.P., le tableau donnant la part d’inertie restituée
par chaque dimension (chaque axe) permet de connaître la
qualité globale des résultats.

Les inerties totales des deux nuages (celui des


profils-lignes et celui des profils-colonnes) sont identiques
et se décomposent de la même manière selon les différents
axes factoriels (ou axes principaux, ou axes principaux
d’inertie) obtenus dans l’analyse.
Abdallah Abarda Module: Analyse de données
Principe de l’AFC

Les pourcentages d’inertie des différentes dimensions


Il n’y a donc qu’un seul tableau de résultats qui, dans la colonne "Principal Inertias" (inerties principales,
c’est-à-dire selon les axes principaux), donne les valeurs de l’inertie restituée par chaque axe (c’est l’inertie
du nuage, celui des profils-lignes ou celui des profils-colonnes, projeté sur cet axe). La somme de ces
inerties est égale au phi-deux (ici 0.07364).
Comme en A.C.P., le premier axe est celui qui restitue la plus grande quantité d’inertie ; le second est celui
qui, tout en étant orthogonal au premier (au sens de la métrique du khi-deux), en restitue aussi le
maximum ; et ainsi de suite.
Les valeurs singulières ("Singular Values"), racines carrées positives des inerties principales, n’ont pas
d’intérêt pratique et ne sont pas utilisées.
Les quantités figurant dans la colonne "Chi-Squares" (khi-deux) sont égales aux inerties principales
multipliées par l’effectif de la table de contingence.
C’est la raison pour laquelle leur somme est égale au khi-deux (on rappelle que χ2 = Φ2 ).
On peut encore considérer que chaque axe de l’analyse restitue une part du khi-deux, donc de la liaison
entre les deux variables initiales, la plus importante pour l’axe 1 et ainsi de suite.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les pourcentages d’inertie des différentes dimensions


Il n’y a donc qu’un seul tableau de résultats qui, dans la colonne "Principal Inertias" (inerties principales,
c’est-à-dire selon les axes principaux), donne les valeurs de l’inertie restituée par chaque axe (c’est l’inertie
du nuage, celui des profils-lignes ou celui des profils-colonnes, projeté sur cet axe). La somme de ces
inerties est égale au phi-deux (ici 0.07364).
Comme en A.C.P., le premier axe est celui qui restitue la plus grande quantité d’inertie ; le second est celui
qui, tout en étant orthogonal au premier (au sens de la métrique du khi-deux), en restitue aussi le
maximum ; et ainsi de suite.
Les valeurs singulières ("Singular Values"), racines carrées positives des inerties principales, n’ont pas
d’intérêt pratique et ne sont pas utilisées.
Les quantités figurant dans la colonne "Chi-Squares" (khi-deux) sont égales aux inerties principales
multipliées par l’effectif de la table de contingence.
C’est la raison pour laquelle leur somme est égale au khi-deux (on rappelle que χ2 = Φ2 ).
On peut encore considérer que chaque axe de l’analyse restitue une part du khi-deux, donc de la liaison
entre les deux variables initiales, la plus importante pour l’axe 1 et ainsi de suite.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les pourcentages d’inertie des différentes dimensions


Il n’y a donc qu’un seul tableau de résultats qui, dans la colonne "Principal Inertias" (inerties principales,
c’est-à-dire selon les axes principaux), donne les valeurs de l’inertie restituée par chaque axe (c’est l’inertie
du nuage, celui des profils-lignes ou celui des profils-colonnes, projeté sur cet axe). La somme de ces
inerties est égale au phi-deux (ici 0.07364).
Comme en A.C.P., le premier axe est celui qui restitue la plus grande quantité d’inertie ; le second est celui
qui, tout en étant orthogonal au premier (au sens de la métrique du khi-deux), en restitue aussi le
maximum ; et ainsi de suite.
Les valeurs singulières ("Singular Values"), racines carrées positives des inerties principales, n’ont pas
d’intérêt pratique et ne sont pas utilisées.
Les quantités figurant dans la colonne "Chi-Squares" (khi-deux) sont égales aux inerties principales
multipliées par l’effectif de la table de contingence.
C’est la raison pour laquelle leur somme est égale au khi-deux (on rappelle que χ2 = Φ2 ).
On peut encore considérer que chaque axe de l’analyse restitue une part du khi-deux, donc de la liaison
entre les deux variables initiales, la plus importante pour l’axe 1 et ainsi de suite.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les pourcentages d’inertie des différentes dimensions


Il n’y a donc qu’un seul tableau de résultats qui, dans la colonne "Principal Inertias" (inerties principales,
c’est-à-dire selon les axes principaux), donne les valeurs de l’inertie restituée par chaque axe (c’est l’inertie
du nuage, celui des profils-lignes ou celui des profils-colonnes, projeté sur cet axe). La somme de ces
inerties est égale au phi-deux (ici 0.07364).
Comme en A.C.P., le premier axe est celui qui restitue la plus grande quantité d’inertie ; le second est celui
qui, tout en étant orthogonal au premier (au sens de la métrique du khi-deux), en restitue aussi le
maximum ; et ainsi de suite.
Les valeurs singulières ("Singular Values"), racines carrées positives des inerties principales, n’ont pas
d’intérêt pratique et ne sont pas utilisées.
Les quantités figurant dans la colonne "Chi-Squares" (khi-deux) sont égales aux inerties principales
multipliées par l’effectif de la table de contingence.
C’est la raison pour laquelle leur somme est égale au khi-deux (on rappelle que χ2 = Φ2 ).
On peut encore considérer que chaque axe de l’analyse restitue une part du khi-deux, donc de la liaison
entre les deux variables initiales, la plus importante pour l’axe 1 et ainsi de suite.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les pourcentages d’inertie des différentes dimensions


Il n’y a donc qu’un seul tableau de résultats qui, dans la colonne "Principal Inertias" (inerties principales,
c’est-à-dire selon les axes principaux), donne les valeurs de l’inertie restituée par chaque axe (c’est l’inertie
du nuage, celui des profils-lignes ou celui des profils-colonnes, projeté sur cet axe). La somme de ces
inerties est égale au phi-deux (ici 0.07364).
Comme en A.C.P., le premier axe est celui qui restitue la plus grande quantité d’inertie ; le second est celui
qui, tout en étant orthogonal au premier (au sens de la métrique du khi-deux), en restitue aussi le
maximum ; et ainsi de suite.
Les valeurs singulières ("Singular Values"), racines carrées positives des inerties principales, n’ont pas
d’intérêt pratique et ne sont pas utilisées.
Les quantités figurant dans la colonne "Chi-Squares" (khi-deux) sont égales aux inerties principales
multipliées par l’effectif de la table de contingence.
C’est la raison pour laquelle leur somme est égale au khi-deux (on rappelle que χ2 = Φ2 ).
On peut encore considérer que chaque axe de l’analyse restitue une part du khi-deux, donc de la liaison
entre les deux variables initiales, la plus importante pour l’axe 1 et ainsi de suite.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les pourcentages d’inertie des différentes dimensions


Il n’y a donc qu’un seul tableau de résultats qui, dans la colonne "Principal Inertias" (inerties principales,
c’est-à-dire selon les axes principaux), donne les valeurs de l’inertie restituée par chaque axe (c’est l’inertie
du nuage, celui des profils-lignes ou celui des profils-colonnes, projeté sur cet axe). La somme de ces
inerties est égale au phi-deux (ici 0.07364).
Comme en A.C.P., le premier axe est celui qui restitue la plus grande quantité d’inertie ; le second est celui
qui, tout en étant orthogonal au premier (au sens de la métrique du khi-deux), en restitue aussi le
maximum ; et ainsi de suite.
Les valeurs singulières ("Singular Values"), racines carrées positives des inerties principales, n’ont pas
d’intérêt pratique et ne sont pas utilisées.
Les quantités figurant dans la colonne "Chi-Squares" (khi-deux) sont égales aux inerties principales
multipliées par l’effectif de la table de contingence.
C’est la raison pour laquelle leur somme est égale au khi-deux (on rappelle que χ2 = Φ2 ).
On peut encore considérer que chaque axe de l’analyse restitue une part du khi-deux, donc de la liaison
entre les deux variables initiales, la plus importante pour l’axe 1 et ainsi de suite.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les coordonnées des lignes et des colonnes


Ce sont ces coordonnées qui permettent de réaliser le
graphique représentant simultanément, selon les dimensions 1
et 2, les départements et les S.A.U.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les coordonnées des lignes et des colonnes


Ce sont ces coordonnées qui permettent de réaliser le
graphique représentant simultanément, selon les dimensions 1
et 2, les départements et les S.A.U.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les coordonnées des lignes et des colonnes

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les contributions à l’inertie selon chaque axe

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Comment calculer les contributions à l’inertie selon chaque axe


Si on désigne par ckl la coordonnée du département numéro l
(l = 1, ..., 8) sur l’axe k (k = 1, 2), l’inertie selon l’axe k vaut :
r
X nl+
Ik = (ckl )2
n
l=1

La part du département l vaut donc :


nl+ k 2
(c )
n l

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Exemple
Prenons l’exemple de l’Aveyron (l = 2) sur l’axe 1 (k = 1), Le
tableau d’inerties fournit : I1 = 0.05501, Celui des coordonnées
donne : c12 = −0.236684. Le tableau de contingence initiale
n 13
permet d’écrire : 2+n = 73 .
Calculer la contribution de l’Aveyron à l’inertie du nuage
des départements selon l’axe 1.

Solution
n2+ 1 2 13 2
n (c2 ) 73 (0.236684)
= = 0.1813
I1 0.05501

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les cosinus carrés


Ces quantités indiquent, comme en A.C.P., la qualité de la
représentation sur chaque axe (autrement dit sur chaque
dimension) de chaque modalité (ligne ou colonne).

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Les cosinus carrés


Le cosinus carré de l’angle entre le vecteur représentant
l’Aveyron et le plan du graphique vaut :
0.5637 + 0.4273 = 0.9910 ; l’angle correspondant est de 5.4
degrés, autrement dit, très petit.
L’Aveyron est donc très bien représenté dans le plan. Ce
n’est pas le cas de l’Ariège dont le cosinus carré avec le
même plan vaut 0.0463 + 0.4042 = 0.4505, ce qui
correspond à un angle de 47.8 degrés (plus de la moitié
d’un angle droit).
On pourra donc interpréter sans réserve la proximité, dans
le plan, de l’Aveyron avec tout autre département ou toute
autre surface bien représentée. Il faudra par contre être très
prudent en ce qui concerne l’Ariège.

Abdallah Abarda Module: Analyse de données


Principe de l’AFC

Interprétation des résultats


Analogue à ACP ...

Abdallah Abarda Module: Analyse de données

Vous aimerez peut-être aussi