Académique Documents
Professionnel Documents
Culture Documents
AFC)
Driss BARI
1/182
Analyse de données multidimensionnelles (ACP + AFC)
Outline
1 Références bibliographiques
2 Généralités de l'analyse des données multidimensionnelles
Caractéristiques et Finalités
Familles des méthodes
3 Analyse en Composantes Principales (ACP)
But de l'ACP
Tableau de données
Problématique et Objectifs de l'ACP
Composantes principales (CP) : Détermination et Propriétés
Etude du comportement des individus
Etude du comportement des variables
Aides à l'interprétation des CP
Problème de mise en oeuvre de l'ACP
Quelques exemples d'application de l'ACP
2/182
Analyse de données multidimensionnelles (ACP + AFC)
Outline
3/182
Analyse de données multidimensionnelles (ACP + AFC)
Références bibliographiques
Rèférences bibliographiques
GILBERT, Saporta
Probabilités, analyse des données et statistique .
Editions Technip, Paris, 2006.
JOLLIFFE, Ian.
Principal component analysis .
In : International encyclopedia of statistical science. Springer, Berlin,
Heidelberg, 2011. p. 1094-1096..
HUSSON, François, LÊ, Sébastien, et PAGÈS, Jérome.
Analyse de données avec R.
Dunod. 1995
EL KHATRI, Said.
Analyse descriptive des données multidimensionnelle (ACP + AFC) .
Manuel de cours. EHTP. 2016. 4/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Outline
1 Références bibliographiques
5/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Caractéristiques
Hypothèses,
Tests statistiques,
Courbes,
Projections planes,
6/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Caractéristiques
7/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Caractéristiques
8/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Caractéristiques
9/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Caractéristiques
10/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Caractéristiques
11/182
Analyse de données multidimensionnelles (ACP + AFC)
Caractéristiques et Finalités
Finalité
Avec l'analyse multidimensionnelle, on accepte
une légère perte en information an d'obtenir
un grand gain en signication
12/182
Analyse de données multidimensionnelles (ACP + AFC)
Outline
1 Références bibliographiques
13/182
Analyse de données multidimensionnelles (ACP + AFC)
Analyse descriptive
14/182
Analyse de données multidimensionnelles (ACP + AFC)
Rôle :
Etendre les propriétés constatées sur un échantillon à
toute la population et vérier, éventuellement,
l'adéquation des hypothèses
Méthodes décisionnelles classiques multidimensionnelles :
La Régression Multiple : Une variable quantitative
à expliquer par p autres variables quantitatives
L'Analyse Discriminante : Une variable qualitative
à expliquer à l'aide de p variables quantitatives.
15/182
Analyse de données multidimensionnelles (ACP + AFC)
Notions de base
Deux types de variables :
Population (limitée ou de grande taille) : ensemble des individus à
étudier.
Echantillon : partie de la population (n individus) sur laquelle est
eectuée l'étude.
Individus : appartenant à la population
Variable (caractère) : caractéristique des individus, dénie sur la
population.
17/182
Analyse de données multidimensionnelles (ACP + AFC)
Notions de base
Variable quantitative : valeurs réelles
discrète (exemple : âge, nombre d'enfants)
continue (exemple : taille, température)
Variable qualitative :
nominale (exemple: couleur [jaune, vert, ..], type de brouillard
[radiatif, evaporation, mélange, ...])
ordinale (exemple: taille de voiture [petite, moyenne, grande]).
18/182
Analyse de données multidimensionnelles (ACP + AFC)
19/182
Analyse de données multidimensionnelles (ACP + AFC)
20/182
Analyse de données multidimensionnelles (ACP + AFC)
Corrélation : sxy
r (x, y ) =
sx sy
−1 ≤ r (x, y ) ≤ 1
L'équation de régression linéaire liant deux variables x et y s'écrit sous la
forme s y
y= r (x, y ).x + b
sx
Le carré du coecient de corrélation r (x, y )exprime le pourcentage de
2
variance expliquée
21/182
Analyse de données multidimensionnelles (ACP + AFC)
22/182
Analyse de données multidimensionnelles (ACP + AFC)
But de l'ACP
Outline
1 Références bibliographiques
But de l'ACP
But de l'ACP
But de l'ACP
descriptive qui permet de
L'ACP est une méthode
résumer,
synthétiser
ou condenser
fois).
24/182
Analyse de données multidimensionnelles (ACP + AFC)
But de l'ACP
Exemple élémentaire
On considère l'échantillon constitué par :
16 pays (ou individus) sur lesquels on a relevé les valeurs de deux
variables: l'espérance de vie (EVI), et le taux d'analphabétisme (ANA)
en 1970
25/182
Analyse de données multidimensionnelles (ACP + AFC)
But de l'ACP
Exemple élémentaire
On considère l'échantillon constitué par :
16 pays (ou individus) sur lesquels on a relevé les valeurs de deux
variables: l'espérance de vie (EVI), et le taux d'analphabétisme (ANA)
en 1970
25/182
Analyse de données multidimensionnelles (ACP + AFC)
But de l'ACP
Exemple élémentaire
On considère l'échantillon constitué par :
16 pays (ou individus) sur lesquels on a relevé les valeurs de deux
variables: l'espérance de vie (EVI), et le taux d'analphabétisme (ANA)
en 1970
26/182
Analyse de données multidimensionnelles (ACP + AFC)
But de l'ACP
Exemple élémentaire
Transformation linéaire et orthogonale
Repère initial = (ANA,EVI) =⇒ Nouveau repère = (progrès, déphasage
entre ANA et EVI)
27/182
Analyse de données multidimensionnelles (ACP + AFC)
Tableau de données
Outline
1 Références bibliographiques
Tableau de données
Tableau de données
L'ACP s'intéresse à des tableaux de données rectangulaires avec des
individus en lignes et des variables quantitatives en colonnes.
p variables
x11 . . . x1 p
. . . . .
.
X = . xij . . n Individus
. . . . .
xn 1 . . . xnp
29/182
Analyse de données multidimensionnelles (ACP + AFC)
Tableau de données
30/182
Analyse de données multidimensionnelles (ACP + AFC)
Tableau de données
On dispose ainsi de :
24 individus (lignes) : modèles de voitutres
6 variables (colonnes) : Cylindrée, Puissance, Vitesse (km/h),
Poids (kg), Longueur (cm) et Largeur (cm)
Question
Analyser les caracteristiques de cet ensemble de 24 modèles de voitures
selon les 6 critères ?
31/182
Analyse de données multidimensionnelles (ACP + AFC)
Tableau de données
32/182
Analyse de données multidimensionnelles (ACP + AFC)
Tableau de données
Question
Pourquoi faut il éviter cette méthode ?
32/182
Analyse de données multidimensionnelles (ACP + AFC)
Tableau de données
Question
Pourquoi faut il éviter cette méthode ?
si p et/ou n est grand, la méthode devient complexe et lourde
si des couples de variables sont corrélés ou anti-corrélés, l'analyse
sera redondante
32/182
Analyse de données multidimensionnelles (ACP + AFC)
Outline
1 Références bibliographiques
35/182
Analyse de données multidimensionnelles (ACP + AFC)
36/182
Analyse de données multidimensionnelles (ACP + AFC)
37/182
Analyse de données multidimensionnelles (ACP + AFC)
38/182
Analyse de données multidimensionnelles (ACP + AFC)
Qualité de l'image :
Restitue dèlement la forme générale du nuage
Meilleure représentation de la diversité et de la variabilité
Ne perturbe pas les distances entre individus
39/182
Analyse de données multidimensionnelles (ACP + AFC)
40/182
Analyse de données multidimensionnelles (ACP + AFC)
Réponse
41/182
Analyse de données multidimensionnelles (ACP + AFC)
42/182
Analyse de données multidimensionnelles (ACP + AFC)
43/182
Analyse de données multidimensionnelles (ACP + AFC)
44/182
Analyse de données multidimensionnelles (ACP + AFC)
Notion d'inertie
très lisible lorsqu'on projette cet objet sur les axes (ou plans) de plus
grand allongement,
et très peu importante en projection sur les axes de très faible
allongement.
45/182
Analyse de données multidimensionnelles (ACP + AFC)
Notion d'inertie
L'objet décrit dans l'exemple d'analogie est, dans notre cas, un nuage de
n points dans l'espace de dimension inférieur à p
46/182
Analyse de données multidimensionnelles (ACP + AFC)
maximisant i (OHi ) . 2
47/182
Analyse de données multidimensionnelles (ACP + AFC)
Outline
1 Références bibliographiques
Principe de l'ACP
49/182
Analyse de données multidimensionnelles (ACP + AFC)
50/182
Analyse de données multidimensionnelles (ACP + AFC)
51/182
Analyse de données multidimensionnelles (ACP + AFC)
u~1 ⊥ u~2
le nuage de point a le plus grand allongement sur u~
2
Etape k:
Recherche de l'axe u~k (unitaire) tel que :
u~k ⊥ u~l ∀l ≤ k − 1
le nuage de point a le plus grand allongement sur u~k
52/182
Analyse de données multidimensionnelles (ACP + AFC)
Les vecteurs directeurs des axes recherchés sont les vecteurs propres
de la matrice de variance covariance (i.e. matrice d'inertie).
P
Ces vecteurs unitaires sont rangés dans l'ordre décroissant des valeurs
propres associées :
u~1 , u~2 , ..., et u~p avec λ1 > λ2 > ... > λp
Rappel
Le calcul des valeurs propres et des vecteurs propres peut s'eectuer en
résolvant les sytèmes suivants :
Valeurs propres λ : det( − λI) = 0
P
Vecteurs propres U ; U = λU
P
53/182
Analyse de données multidimensionnelles (ACP + AFC)
55/182
Analyse de données multidimensionnelles (ACP + AFC)
56/182
Analyse de données multidimensionnelles (ACP + AFC)
Variance totale
58/182
Analyse de données multidimensionnelles (ACP + AFC)
59/182
Analyse de données multidimensionnelles (ACP + AFC)
60/182
Analyse de données multidimensionnelles (ACP + AFC)
Variance résiduelle
61/182
Analyse de données multidimensionnelles (ACP + AFC)
62/182
Analyse de données multidimensionnelles (ACP + AFC)
p=6 ←→ 1
p = 16.6%
λ1 = 4.656 ←→ λ1
tr (D) = 77.6%
λ2 = 0.915 ←→ λ2
tr (D) = 15.254%
Une seule composante à retenir !!!
63/182
Analyse de données multidimensionnelles (ACP + AFC)
64/182
Analyse de données multidimensionnelles (ACP + AFC)
3. Critère de KAISER :
Lorsque les données sont centrées réduites, on retient les
composantes principales tel que λk > 1 pour k ≤ q
65/182
Analyse de données multidimensionnelles (ACP + AFC)
66/182