Académique Documents
Professionnel Documents
Culture Documents
données
2019 - 2020
M. DEROUICH
Table des matières
2 Analyse bivariée 19
2.1 Dénitions : . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2 Tableaux de calcul . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1 Données non groupées : . . . . . . . . . . . . . . . . . 21
2.2.2 Données groupées : . . . . . . . . . . . . . . . . . . . . 22
2.2.3 Propriétés : . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.4 Distribution conditionnelle, indépendance . . . . . . . 23
2.3 Ajustement linéaire et corrélation . . . . . . . . . . . . . . . . 24
2.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.2 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.3 Exemple (Ajustement exponentiel) : . . . . . . . . . . . 29
2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
1
3.5.1 Correspondance entre statistique et géométrie . . . . . 37
3.5.2 Matrice de variance-covariances . . . . . . . . . . . . . 38
3.6 Moments d'inertie . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.6.1 Inertie totale du nuage des individus . . . . . . . . . . 39
3.6.2 Inertie du nuage des individus par rapport à un axe
passant par G . . . . . . . . . . . . . . . . . . . . . . . 40
3.6.3 Inertie du nuage des individus par rapport à un sous-
espace vectoriel V passant par G . . . . . . . . . . . . 40
3.6.4 Décomposition de l'inertie totale . . . . . . . . . . . . 41
3.7 Dérivation matricielle (Rappel) . . . . . . . . . . . . . . . . . 42
3.7.1 Dérivation de formes linéaires . . . . . . . . . . . . . . 42
3.7.2 Dérivation d'une forme quadratique . . . . . . . . . . 43
3.8 Recherche des axes principaux . . . . . . . . . . . . . . . . . . 44
3.8.1 Recherche du premier axe principal ∆1 passant par G
d'inertie minimum . . . . . . . . . . . . . . . . . . . . 44
3.8.2 Recherche du deuxième axe principal ∆2 passant par
G, orthogonal à ∆1 et d'inertie minimum . . . . . . . . 46
3.8.3 Recherche des axes principaux suivants . . . . . . . . 46
3.9 Contributions des axes à l'inertie totale . . . . . . . . . . . . . 47
3.10 Composantes principales . . . . . . . . . . . . . . . . . . . . . 47
3.10.1 Expression des composantes principales . . . . . . . . . 47
3.10.2 Propriétés des composantes principales . . . . . . . . . 49
3.11 Représentation des individus . . . . . . . . . . . . . . . . . . . 50
3.11.1 Coordonnées des individus . . . . . . . . . . . . . . . 50
3.11.2 Qualité de la représentation des individus et l'étude
de la proximité entre les individus . . . . . . . . . . . . 50
3.11.3 Interprétation des axes principaux en fonction des in-
dividus . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.12 Représentation des variables . . . . . . . . . . . . . . . . . . . 51
3.12.1 Coordonnées des variables . . . . . . . . . . . . . . . . 51
3.12.2 Qualité de la représentation des variables . . . . . . . 52
3.12.3 Interprétation des axes principaux en fonction des an-
ciennes variables . . . . . . . . . . . . . . . . . . . . . 52
3.12.4 Etude des liaisons entre les variables . . . . . . . . . . 52
3.13 Interprétation . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.14 ACP normée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.15 Récapitulatif : démarche d'une ACP . . . . . . . . . . . . . . 54
2
Chapitre 1
données
1.1 Introduction :
La statistique est une méthode scientique qui consiste à réunir des don-
nées chirées sur des ensembles nombreux, puis à analyser, à commenter et
à critiquer ces données.
Classiquement les méthodes statistiques sont employées soit pour explorer
les données (nommée statistique exploratoire) soit pour prédire un comporte-
ment (nommée statistique prédictive ou décisionnelle). La statistique explo-
ratoire s'appuie sur des techniques descriptives et graphiques. Elle est géné-
ralement décrite par la statistique descriptive qui regroupe des méthodes ex-
ploratoires simples, uni- ou bidimensionnelle (moyenne, moments, quantiles,
variance, corrélation, ...) et la statistique exploratoire multidimensionnelle.
La statistique classique étudie les variables les unes après les autres, et
elle construit autant de graphes (histogrammes) que de variables, mais les
techniques dites d'analyse des données permettent de donner une vision glo-
bale de l'ensemble des variables.
3
1. analyses factorielles, qui relèvent de la géométrie euclidienne et
conduisent à l'extraction de valeurs et de vecteurs propres. Les mé-
thodes les plus employées de cette technique sont :
1.2 Dénitions
Dénition 1.1 On appelle toute application X dénie sur P , avec
variable
P un ensemble ni appelé ou
population ; tout élément ω de P
univers
s'appelle un .
individu
4
Dénition 1.3 :
On appelle toute valeur : x ∈ X(P ) telle que : X(P ) = {x , x , x , · · · x }
modalité
avec p nombre de modalités diérentes de X
i 1 2 3 p
Dénition 1.4 :
1/ On appelle eectif de la modalité x , le nombre n des individus ω tel
que X(ω) = x (Cas discret)
i i
2/
tel que X(ω) ∈ [x , x [ (Cas continu)
i−1 i i
i−1 i
: On a X n = N. l'eectif total.
p
Remarque 1.2 i
i=1
Dénition 1.6 :
On appelle fréquence de la modalité x ou de la classe [x , x [ , le nombre
f tel que f =
i i−1 i
n i
i i
N
Dénition 1.7 :
1. On appelle eectif cumulé en x , le nombre
i
X
i nj .
j=1
Remarque 1.3 :
On peut noter que X n , taille de l'échantillon en eet
p p
X
j = N fj = 1
j=1 j=1
p p p
X X ni 1 X 1
fj = = ni = ×N =1
j=1 j=1
N N j=1 N
5
Valeurs x1 x2 ··· ··· xp
Eectifs n1 n2 ··· ··· np
Fréquences f1 f2 ··· ··· fp
Nombre d'enfants xi 0 1 2 3 4 5
6
Exemple 1.2 (caractère continu)
Soit un echantillon de 80 personnes d'une collectivité portant sur la taille.
On adopte un intervalle de classe de 0,05 m. (tableau 3.1)
classe Eectif Eectif cumulé ↑ Eectif cumulé ↓
[1.55;1.60[ 3 3 80
[1.60;1.65[ 12 15 77
[1.65;1.70[ 18 33 65
[1.70;1.75[ 25 58 47
[1.75;1.80[ 15 73 22
[1.80;1.85[ 5 78 7
[1.85;190[ 2 80 2
1.4 Les représentations graphiques :
Les représentations graphiques ont l'avantage d'orir une meilleure vue
d'ensemble de la série statistique que les tableaux. Elles permettent par
simple lecture, de voir les caractéristiques essentielles de la série, et aussi
de comparer des séries diérentes.
Dans ce cas, les ectifs gurants sur l'axe des ordonnnées sont remplacés
par les fréquences. le schéma ainsi obtenu est appelé Diagramme en bâtons
des fréquances
7
c/ Diagramme des eectifs cumulées, Diagramme des fréquences
cumulées
0.9
0.7
0.6
Fréquences
0.5
0.4
0.3
0.2
0.1
0
0 1 2 3 4 5
Modalités
8
70
60
50 croissantes
Effectifs cumulées
40 décroissantes
30
20
10
0
0 1 2 3 4 5
Nombre d’enfants
Exemple 1.5 A l'aide des données de l'exemple 1.2 on peut construire les
polygones des eectifs cumulée suivants :
9
Figure 1.4 Histogramme et polygone des eectifs
80
70
60
croissants
efectifs cumulés
50
40 décroissants
30
20
10
0
1.55 1.6 1.65 1.7 1.75 1.8 1.85 1.9
Taille
10
1.5 Paramètres statistiques
1.5.1 Paramètres de position
a/ Dominante ou mode
Dénition 1.8 :
Lorsque la variable est discrète, ou
une dominante est une valeur
mode
du caractère qui correspond à un eectif maximum, la série est unimodale,
bimodale · · · lorsque le nombre de modes est 1, 2 · · · .
Lorsque la variable est continue, une classe modale correspondra à un eectif
maximum.
Exemples.
1) Considérons la série statistique de l'exemple 1.1 : le mode est 1 enfant
puisqu'il est associé à l'eectif maximum 18.
2) Considérons la série statistique de l'exemple 1.2 : la classe modale est
[1.70 − 1.75[ puisqu'il est qui corespond à l'eectif maximum 25.
b/ Moyenne arithmétique
Dénition 1.9 :
Lorsque la variable est discrète la moyenne arithmétique X de la série sta-
tistique est la moyennePpondérée
p
ni xi n 1 x1 + n 2 x2 + · · · + n p xp
X = Pi=1
p =
i=1 ni N
Lorsque la variable est continue la moyenne est :
P p
n i ci
X = Pi=1
p
i=1 ni
où les c = x
i
i−1
2
+ xi
sont les centres des classes.
Théorème 1.1 :
• X +b=X +b
• aX + b = aX + b
Exemples
1)Le nombre moyen d'enfants par famille de la série statistique de l'exemple
1.1 est :
1
X = (16 × 0 + 1 × 18 + 2 × 14 + 3 × 11 + 4 × 3 + 5 × 2)
64
101
=
64
11
2)Pour la série statistique de l'exemple 1.2, la taille moyenne d'une personne
est
c/ Médiane
Dénition 1.10 :
La médiane, Me, est la valeur du caractère pour laquelle la fréquence cumulée
est égale à 0,5 ou 50%. Elle correspond donc au centre de la série statistique
classée par ordre croissant, ou à la valeur pour laquelle 50% des valeurs
observées sont supérieures et 50% sont inférieures.
Remarque 1.5 :
I Dans le cas où les valeurs prises par le caractère étudié ne sont pas
regroupées en classe,
• si n est impair, alors n = 2m + 1 et la médiane est la valeur du
milieu M e = x .
• si n est pair, alors n = 2m et une médiane est une valeur quelconque
m+1
I Dans le cas où les valeurs prises par le caractère étudié sont groupées en
classe, on cherche la classe contenant le n2 individu de l'échantillon.
e
m+1
donc
m
m
− Nm
2
N
− Nm
Me = xm + (xm+1 − xm ) 2
Nm+1 − Nm
12
Remarque 1.6 Dans le cas d'une série groupée en classes, la médiane est
représentée aussi par la valeur de la variable correspondant à l'intersection du
polygône des eectifs cumulés avec l'horizontale représentant l'eectif moitié
Exemples. 1) Les données suivantes représentent le capital social en 103
de 17 sociétés marocaines créées entre le 20 et 24-10-1995 (les valeurs du
caractère étudié sont classé par ordre croissant) :
médian
z }| { ↓
10; 10; 20; 20; 30; 50; 50; 50; 90 ; 100; 100; 100 ; 100 ; 200 ; 200 ; 200 ; 300.
| {z }
Le nombre de valeurs observées est 17 (impaire). Dans ce cas, le capital
médian est le neuvième ( c.à.d 90 ) car il divise le nombre de sociétés en 2
ensembles égaux : 8 sociétés sont créées avec un capital inférieur à 90 000
DH et 8 autres sont créées avec un capital supérieur à 90 000 DH.
Donc Me=90 000
13
Figure 1.6 Polygones des eectifs cumulées
Dénition 1.11 :
Écart moyen arithmétique est la moyenne arithmétique des écarts par rapport
à la moyenne arithmétique X des valeurs du caractère
p
1 X
E(X) = ni |xi − X|
N i=1
où les c = x
i
i−1
2
+ xi
sont les centres des classes.
b/ Variance
Dénition 1.12 :
La variance d une série de valeurs du caractère est la moyenne arithmétique
des carres des écarts de ces valeurs par rapport à leur moyenne arithmétique.
p
1 X
V (X) = ni (xi − X)2
N i=1
14
Lorsque la variable est continue la variance est :
p
1 X
V (X) = ni (ci − X)2
N i=1
où les c = x
i
i−1
2
+ xi
sont les centres des classes.
Théorème 1.2
p
:
1 X 2
• V (X) = ni x2i − X
N i=1
• V (X + b) = V (X)
• V (aX + b) = a2 V (X)
c/ Ecart-type
Dénition 1.13 :
L' écart-type
√ (ou écart quadratique moyen) est la racine carrée de la variance
σ= V
Dénition 1.14 :
L'étendue d'une série est la dierence entre la plus grande et la plus petite
valeur du caractère.
d/ D'autres dénitions
Soit (xi , ni )i∈[1,p] ou (xi , fi )i∈[1,p] une série statistique discrète . Soit N son
eectif total et supposons que pour tout indice i , xi est strictement positif.
On appelle
15
- Si x0 = 0 et q = 1, le moment n'est rien d'autre que la moyenne.
- Si x0 = x et q = 2, le moment n'est rien d'autre que la variance.
16
UNIVERSITE MOHAMMED PREMIER
ECOLE NATIONALE DES SCIENCES APPLIQUEES
OUJDA-MAROC
2. Soient (xx )−eta(y ) deux séries statistiques liées par la relation suivante :
i=1
i i
∀i y =i
b
i
avec b 6= 0 a, b ∈ R Montrer les propriétés suivantes :
x−a V (x) σ(x)
i) y = ii)V (y) = iii)σ(y) =
b b2 |b|
Exercice 1.6.2 :
On a relevé les nombres d'allumettes contenues respectivement dans 20 boîtes,
lors d'un contrôle dans une usine de fabrication. Les résultats sont les sui-
vants : 40, 42, 32, 38, 40, 48, 30, 38, 36, 40, 34, 40, 34, 40, 38, 40, 42, 44,
36, 42.
1. Ranger ces résultats en classes d'intervalles de 4 allumettes, borne
supérieure exclue.
2. Tracer l'histogramme de cette distribution.
3. Calculer la moyenne et l'écart type de cette série.
4. Calculer les moments d'ordre l, d'ordre 2 et d'ordre 3 par rapport à la
valeur moyenne .
Exercice 1.6.3 :
Les résultats d'un certain processus aléatoire sont des nombres entiers que
l'on classe suivant l'histogramme ci-dessous.
1. Calculer la valeur moyenne. Quel est le mode? quelle est la médiane?
2. Tracer le polygône des fréquences et le polygône des eectifs cumulés.
3. Retrouver la valeur de la médiane.
17
Exercice 1.6.4 :
On reprend les données de l'exemple 1.1 du cours : eectuant le changement
de variable z = 0.05
x − 1.71
18
Chapitre 2
Analyse bivariée
2.1 Dénitions :
On se donne une population de taille n et sur chaque élément de cette po-
pulation on eectue deux observations portant sur deux caractères diérents
X et Y . Le problème de la corrélation consiste à chercher s'il existe une
relation entre Y et Y .
Pour chaque élément de l'échantillon, on peut associer un couple de va-
leurs (x , y ) où x est la valeur du caractére X et y est la valeur du caractére
Y.
i i i i
Les résultats de ces observations peuvent être présentés sous deux formes
Données non groupées :
Individu 1 2 ··· n
Valeur X x1 x2 ··· xn
Valeur Y y1 y2 ··· yn
19
Données groupées :
Les valeurs prises par X et Y étant respectivement x , x , · · · , x et y , y , · · · , y .
n est l'eectif des individus dont les valeurs de x et y sont respectivement
l 2 r l 2 s
x et y .
ij
i i
XY y y
1 ... y 2 ... y Totaux
j s
x1 n11 n12 ... n1j ... n1s n1.
..
x2
..
n21
..
n22
..
...
..
n2j
..
...
..
n2s
..
n2.
x
.. i n
..
i1 n
..
i2
..
... n
..
ij
..
... n
..
is n
..
i.
s
X
ni. = ni1 + · · · + nis = nij .
j=1
20
La somme des eectifs partiels contenus dans la colonne de y est égale à
l'eectif des élements dont la valeur du caractère Y est y . Elle est notée n .
j
j .j
r
X
n. j = n1j + · · · + nrj = nij .
i=1
r
X s
X r X
X s
n= ni. = n. j = nij .
i=1 j=1 i=1 j=1
- Fréquences marginales
fi. =
ni.
n
fréquence marginale de x . i
f. j =
n. j
n
fréquence marginale de y . j
On a p
X q
X p
X q
X
fi. = f. j = fij = 1.
i=1 j=1 i=1 j=1
tiques marginales.
i i. 1≤i≤p j 1≤j≤q
Variances
et V (Y ) = σ
n
! n
!
2 1X 2 2 2 1X 2 2
V (X) = σX = x −X = y −Y .
n i=1 i Y
n i=1 i
tableau suivant :
1 q
Pq Pq
XY y1 ··· yq ni. ni. xi ni. x2i j=1 nij yj xi j=1 nij yj
..
x1
..
n11
..
···
..
n1q
..
n1. n1. x1 n1. x21
Calculs
et
p q
i) Moyennes : X=
1X
n i=1
ni. xi Y =
1X
n j=1
n.j yj
ii) Variances :
et V (Y ) = σ =
p q
! !
1X 2 1X 2
2
V (X) = σX = ni. x2i − X 2
Y n.j yj2 − Y .
n i=1 n j=1
iii) Ecart-type : σX = V (X)
p
et σ = pV (Y ) Y
iv) Covariances :
On appelle covariance du couple
(X, Y ) et on le note cov(X, Y ) ou σ la
moyenne de X − X Y − Y
XY
22
p q
1 XX
cov(X, Y ) = nij xi − X yi − Y .
n i=1 j=1
On montre que :
p q
!
1 XX
σXY = cov(X, Y ) = nij xi yj − XY .
n i=1 j=1
±ρ(X, Y )
cov(aX + b, a Y + b ) = aa .cov(X, Y ).
0 0 0
nij fij
fi/j = =
n· j f· j
23
On a f j/i =
nij
=
fij
.
Ainsi f ij
ni· fi·
= fi· × fj/i = f· j × fi/j .
Dénition 2.1 Deux variables statistiques X et Y sont dites statistique-
ment indépendantes si et seulement si, pour chacune des deux variables,
les distributions conditionnelles sont identiques à la distribution marginale :
f =f ou f = f ∀ (i, j)
i/j i· j/i ·j
nl3 = 4 signie qu'il ya 4 enfants dont l'âge de la mère est 20 ans et dont le
poids est 3500g. Il y a 6 mères dont l'âge est 30 ans. Il Y a 14 enfants dont
le poids est 3500g.
2.3 Ajustement linéaire et corrélation
2.3.1 Introduction
On considère une population de taille (eectif total) n sur laquelle on dénit
une statistique double X et Y. (On éectue sur Ω deux observations portant
sur 2 caractères diérents).
Le problème qui se pose est celui qui consiste à rechercher s'il existe une
relation entre X et Y.
A chaque élement ω de l'échantillon, on associe un couple de valeurs (x , y )
qu'on représente graphiquement par un point M (x , y ) du plan. Et on obtient
i i i
i i i
24
ainsi un nuage de n points qui constitue ce qu'on appelle un diagralmme de
disperssion.
Ajuster un ensemble de points consiste à déterminer une courne (C) simple
aussi proche que possible des points M . L'ajustement linéaire est le cas où
(C) est une droite.
i
2.3.2 Dénition
On dit qu'il y a correlation entre deux caractères observés sur une même
population lorsque les variations des deux caractères se produisent dans le
même sens ou lorsque les variations sont de sens contraires.
Nuage de points : Diagramme de disperssion
L'existence d'une correlation peut-être décelée (détectée) graphiquement. La
forme du nuage de points formé par les points M (x , y ) nous permettent de
constater si les caractères X et Y sont en correlation ou non.
i i i
a- Coecient de correlation
25
( représente le nombre de couple d'observations (x , y ))
n
est compris entre −1 et 1.
i i
ρ
* Si les caractères X et Y sont indépendants alors ρ = 0. Cependant la
réciproque n'est pas necessairement vraie. Si ρ = 0, on dit qu'il y a correlation
nulle entre X et Y ; la liaison entre X et Y peut être de forme outre que
linéaire.
* Si 0 < ρ < 1, la correlation est positive (X et Y varient dans le même
sens) La valeur ρ = +1 indique une relation linéaire parfaite Y = aX + b
avec a > 0. C'est un cas extrème très peu rencontré en pratique.
* Si −1 < ρ < 0, la correlation est négative (X et Y varient dans le sens
contraire) La valeur ρ = −1 indique une relation linéaire parfaite Y = aX +b
avec a < 0. C'est un cas extrème très peu rencontré en pratique.
Formule pratique de ρ pour le calcul
Pn Pn
Pn i=1 x i i=1 yi
i=1 xi yi −
ρ = v" n
#" #.
u Pn 2 Pn 2
u Pn ( i=1 xi ) ( i=1 yi )
2
( ni=1 yi2 ) −
P
i=1 xi ) −
t (
n n
26
Le problème admet une solution unique solution du système linéaire
issue de l'annulation des dérivées partielles premières de la fonction δ(a, b).
Il s'agit de résoudre
n
∂δ X
∂a = −2 xi (yi − axi − b) = 0
i=1
n
∂δ X
= −2 (yi − axi − b) = 0
∂b
i=1
27
ii) Les droites D et D passent par le point G(x, y).
y/x x/y
a=
cov(X, Y )
V (X)
et b = y − ax. (2.1)
où a = cov(x,
0
V (y)
y)
et b = x − a y 0 0
d .
i,j j i
2
P
Ces droites de régression sont aussi appelées droites des moindres carrés.
i,j ij
c- Ajustement et corrélation
elles passent toutes les deux par le point G(X, Y ) appelé point moyen
de la statistique.
les pentes des deux droites sont de même signe celui de la covariance
et sont respectivement a et a 1
0
aa = cov(x,
2
0 y) 2
= (ρ(x, y))
(4) et (4 ) sont confondues si elles ont la même pente (car elles
v(x)v(y)
0
alors alignés.
0 ij
28
2.3.3 Exemple (Ajustement exponentiel) :
Exemple 2.1 La statistique suivante indique l'évolution de la consommation
d'énergie éléctrique dans un pays exprimée en TWh
Année Consommation
1949 30
1953 41
1957 56
1961 73
1965 97
1969 123
1973 165
1977 207
La relation qui lie la consommation au temps (année) est de type exponentiel.
Déterminons la droite dexrégression de Y = log y en x On eectue le chan-
gement de variable X = 4 , on a
− 1961
Xk Yk = log yk
-3 1.417
-2 1.613
-1 1.748
0 1.863
1 1.987
2 2.019
3 2.217
4 2.316
On en déduit X = 21 , Y = 15.18
8
' 1.8975
2
σX = 5.25 σY2 ' 0.0794
et σ ' 0.64.
La droite Y = AX + B est dénie par
XY
σXY 0.64
A = 2
' ' 0.12
σX 5.25
B = Y − AX ' 1.836.
Remarquons que l'on a :
0.64
ρXY ' √ ' 0.99
5.25 × 0.0794
ce qui justie la recherche d'un ajustement exponentiel.
29
2.4 Conclusion
L'étude des séries statistiques à deux variables permet de mettre en rap-
port deux caractères an de pouvoir déterminer une valeur manquante ou de
prévoir une tendance. Néanmoins, deux caractères peuvent avoir un très fort
coecient de corrélation sans pour autant être réellement liés.
30
UNIVERSITE MOHAMMED PREMIER
ECOLE NATIONALE DES SCIENCES APPLIQUEES
OUJDA-MAROC
Filière : Génie Civil 1ère année Année universitaire : 2019-2020
Elément de module : Analyse des données Enseignant : M. Derouich
Fiche TD N : 2
◦
Exercice 2.4.1 :
1. Montrer que :|ρ(X, Y )| ≤ 1.
2. On considère deux séries statistiques (x ) et (y ) de taille n
Soient α et β deux séries statistiques liées aux séries statistiques (x )
i i
∀i α =
i
i
d
avec d 6= 0 c, d ∈ R
avec d 6= 0 c , d ∈ R
0
y −c
i 0 0 0
∀i β =
Montrer les propriétés suivantes :
i 0
d
32
Chapitre 3
(ACP)
3.1 Préambule
L'ACP propose, à partir d'un tableau de données relatives à p variables
quantitatives portant sur n unités (individus), des représentations géomé-
triques de ces unités et de ces variables.
Pour les unités , on cherche si l'on peut distinguer des groupes en regar-
dant quelles sont les unités qui se ressemblent, celles qui se distinguent des
autres...
Pour les variables , on cherche quelles sont celles qui sont trés corrélées
entre elles, celles qui, au contraire ne sont pas corrélées aux autres...
3.2 Tableau de données
On dispose d'un tableau de données relatives à p variables quantitatives
x , . . . , x portant sur n unités (individus).
Le tableau des données X a la forme suivante :
1 p
.. .. ..
x11 x12 . . . x1p
X = xi1
.. x
.. ...
..
x .
i2 ip
xn1 xn2 . . . xnp
xij est la valeur de la variable x pour l'unité i.
On peut représenter chaque unité par le vecteur de ses mesures sur les p
j
33
variables :
xi1
..
xi2
ui = ∈ Rp .
xip
L'ensemble des points qui représentent les unités est appelénuage des in-
dividus , qui est l'ensemble {u , . . . , u }.
Aussi, on peut représenter chaque variable par un vecteur de R dont les
1 n
n
..
x2j
xj = ∈ Rn .
xnj
L'ensemble des points qui représentent les variables est appelé nuage des
variables, qui est l'ensemble {x , . . . , x }.
1 p
34
mathématiques physique français anglais
Jean 6.0 6.0 5.0 5.5
Aline 8.0 8.0 8.0 8.0
Annie 6.0 7.0 11.0 9.5
Monique 14.5 14.5 15.5 15.0
Didier 14.0 14.0 12.0 12.5
André 11.0 10.0 5.5 7.0
Pierre 5.5 7.0 14.0 11.5
Brigitte 13.0 12.5 8.5 9.5
Evelyne 9.0 9.5 12.5 12.0
3.3 Choix d'une distance
Pour faire une représentation géométrique, on doit choisir une distance
entre deux points de l'espace.
La distance utilisée par l'ACP dans l'espace R où sont représentées les
p
Avec cette distance, toutes les variables jouent le même rôle et les axes dénis
par les variables constituent une base orthogonale.
Exemple 3.2 (Le centre de gravité) Considérons les données de l'exemple
(1)
On a 9
1 X
xi1
9 i=1
9
1X
xi2
9.67
9 i=1
9.83
G=
9
= .
1X
10.22
xi3
9
10.06
i=1
9
1
X
xi4
9 i=1
9.67
Donc le centre de gravité est donné par le vecteur : 9.83
G=
10.22 .
10.06
35
3.4 Choix de l'origine
Le point O correspondant au vecteur de coordonnées toutes nulles n'est
pas une origine satisfaisante, car si les coordonnées des points du nuage des
individus sont grandes, le nuage est éloigné de cette origine.
On choisit comme
origine le point
n
1X
xi1
..
n i=1
..
x̄1
X n
1
..
G=
x ij = x̄j .
..
n i=1
n
x̄p
1X
xip
n i=1
..
X c = xi1 − x̄1 . . . xip
..
− x̄ .
p
xn1 − x̄1 . . . xnp − x̄p
Le vecteur des coordonnées centrées de l'unité u et le vecteur des coordonnées
centrées de la variable x sont respectivement :
i
j
xi1 − x̄1 x1j − x̄j
.. ..
xi2 − x̄2 x2j − x̄j
uci = ∈ Rp , xcj = ∈ Rn .
xip − x̄p xnj − x̄j
36
6.0 − 9.67 6.0 − 9.83 5.0 − 10.22 5.5 − 10.06
8.0 − 9.67 8.0 − 9.83 8.0 − 10.22 8.0 − 10.06
6.0 − 9.67 7.0 − 9.83 11.0 − 10.22 9.5 − 10.06
14.5 − 9.67 14.5 − 9.83 15.5 − 10.22 15.0 − 10.06
c
X =
14.0 − 9.67 14.0 − 9.83 12.0 − 10.22 12.5 − 10.06
11.0 − 9.67 10.0 − 9.83 5.5 − 10.22 7.0 − 10.06
5.5 − 9.67 7.0 − 9.83 14.0 − 10.22 11.5 − 10.06
13.0 − 9.67 12.5 − 9.83 8.5 − 10.22 9.5 − 10.06
9.0 − 9.67 9.5 − 9.83 12.5 − 10.22 12.0 − 10.06
la première ligne de X est : X (−3.67
c c
1 − 3.83 − 5.22 − 4.56)
n
1X 1 −−→ −−→
cov(xk , xl ) = (xik − xk )(xil − xl ) = < Oxk , Oxl >
n i=1 n
37
−3, 666 −3, 833
−1, 666
−1, 833
−3, 666
−2, 833
4, 833 4, 666
et
−−→ −−→
GX1 =
4, 333
GX2 =
4, 166 .
1, 333
0, 166
−4, 166
−2, 833
3, 333 2, 666
−0, 666 −0, 333
1 −−→
⇒ kGX1 k2 = 11, 388 = V ar(X1 )
9
1 −−→ 2
kGX2 k = 8, 944 = V ar(X2 )
9
1 −−→ −−→
hGX1 , GX2 i = 9, 916 = Cov(X1 , X2 )
9
.. .. ..
cov(x2 , x1 ) V ar(x2 ) . . . cov(x2 , xn )
Σ= .
cov(xn , x1 ) cov(xn , x2 ) . . . V ar(xn )
38
xk et x : plus il est proche de 1, plus les variables sont corrélées positivement,
plus il est proche de -1, plus elles sont corrélées négativement. Un coecient
l
z =
ij
x −x
ij
σ xj
. La matrice Z s'exprime en fonction de X par Z = D X
j c
1/σ
c
Le terme réduit signie que les variances des variables z sont égales à 1.
x1 xp
cients de corrélation linéaire entre les p variables prises deux à deux, elle
1/σ 1/σ
résume la structure des dépendances linéaires entre les p variables. Elle est
symétrique et sa diagonale est composée de 1.
3.6 Moments d'inertie
3.6.1 Inertie totale du nuage des individus
Dénition 3.2 : Le moment d'inertie du nuage des individus par rapport
au centre de gravité G est :
n n p
1X 2 1 XX
IG = d (G, ui ) = (xij − x̄j )2
n i=1 n i=1 j=1
C'est une mesure de la dispersion du nuage des individus par rapport à son
centre de gravité.
Si ce moment d'inertie est grand, cela signie que le nuage est très dispersé;
s'il est petit, alors le nuage est très concentré autour de son centre de gravité.
Remarque 3.1 I peut aussi s'écrire sous la forme suivante :
G
p p
" n #
X 1X 2
X
IG = (xij − x̄j ) = var(xj ),
j=1
n i=1 j=1
trace(Σ))
G
39
3.6.2 Inertie du nuage des individus par rapport à un
axe passant par G
Dénition 3.3 : L'inertie du nuage des individus par rapport à un axe ∆
passant par G est égale à :
n
1X 2
I∆ = d (hi , ui )
n i=1
40
V∗
hi∗ ui
hi
G
gonale de u sur V .
i i i
∗
On en déduit que :
I =I +I , G V V∗
∆ ), alors
1 2
p
IG = I∆∗1 + I∆∗2 + . . . + I∆∗p .
41
3.7 Dérivation matricielle (Rappel)
Dénition 3.5 :
x1
42
Remarque 3.2 :
k
X
ai xi =< x, a >=< a, x >= at x = xt a
i=1
Proposition 3.1 :
∀a, x ∈ Rk on a ∂at x
∂x
=
∂xt a
∂x
=a
en eet On a ∀1 ≤ i ≤ k ∂f
∂xi
= ai donc ∂f
∂x
=a
Remarque 3.3 :
xt Ax =< x, Ax >=< Ax, x >
Proposition 3.2 :
∂xt Ax
∀x ∈ Rk , A = (aij ) ∈ Mk,k (R) = (A + At )x
∂x
Remarque 3.4 :
Si A est symétrique, i.e : si A = A, on a : ∂x∂xAx = 2Ax.
t
t
43
3.8 Recherche des axes principaux
3.8.1 Recherche du premier axe principal ∆1 passant
par G d'inertie minimum
On cherche un axe ∆ passant par G d'inertie I minimum car c'est
l'axe le plus proche de l'ensemble des points du nuage des individus.
1 ∆1
rechercher ∆ tel que I est minimum, est équivalent à chercher ∆ tel que
I est maximum.
1 ∆1 1
∆∗1
1 1
Problème :
Trouver −Ga−→ tel que I est maximum sous la−−→contrainte que ||−Ga−→|| = 1.
1 ∆∗1 1
2
Proposition 3.3
et ||−Ga−→|| = a a .
I∆∗1 = at1 Σa1 1
2 t
1 1
Preuve : On a
−−→ −−→ −−→ −−→ −−→
< Gui , Ga1 >= kGa1 kkGhi k = 1 × kGhi k = d(G, hi ) = d(ui , h∗i )
hi∗
hi
44
−−→ −−→
=⇒ d2 (ui , h∗i ) = d2 (G, hi ) =< Gui , Ga1 >2 = at1 uci (uci )t a1 ,
par symétrie du produit sclaire.
Ainsi n
" n
#
X 1 1X c c t
I∆∗1 = at1 uci (uci )t a1 = at1 u (u ) a1
n n i=1 i i
Par suite
i=1
et ||−Ga−→|| = a a .
1
2 t
1 1
Recherche du maximum
Le problème à résoudre : trouver a tel que a Σa soit maximum avec la t
contrainte a a = 1.
1 1 1
t
1 1
t t
g(a ) = g(a , a , ..., a ) = a Σa − λ (a a − 1).
1 11 12 1p 1 1 1 1 1
obtient : t
1
t
a Σa − λ a a = 0
1 1 1 1 1
45
Proposition 3.4 :
L'axe ∆ pour lequel le nuage des individus a l'inertie minimum a comme
vecteur directeur unitaire le premier vecteur propre associé à la plus grande
1
par G par son vecteur directeur unitaire a . L'inertie du nuage des individus
2
∆1 ⊥ ∆2 ⊥ . . . ⊥ ∆p
a1 ⊥ a2 ⊥ . . . ⊥ ap
λ1 ≥ λ2 ≥ . . . ≥ λp
I∆1 ≥ I∆∗2 ≥ . . . ≥ I∆∗p
∗
ca(∆k /IG ) = λk .
Sa contribution relative est égale à :
λk
cr(∆k /IG ) =
λ1 + . . . + λp
On emploie souvent l'expression "pourcentage d'inertie expliquée par ∆ ". k
On peut étendre ces dénitions à tous les sous-espaces engendrés par les
nouveaux axes. Ainsi, le pourcentage d'inertie expliqué par le plan engendré
par les deux premiers axes ∆ et ∆ est égal à :
1 2
λ1 + λ2
cr(∆1 ⊕ ∆2 /IG ) =
λ1 + . . . + λp
Ces pourcentages d'inertie sont des indicateurs qui rendent compte de la part
de variabilité du nuage des individus expliquée par ces sous-espaces. Si les
dernières valeurs propres ont des valeurs faibles, on pourra négliger la varia-
bilité qu'expliquent les axes correspondants.
Exemple 3.7 (Contributions des axes à l'inertie totale) Considérons
les données de l'exemple (1)
On a I = tr(V ) = 40.30.
Les deux plus grandes valeurs propres de la matrice V des variances-covariances
G
G
∆2 /IG
2
40.30
G
= 0.3
cr(I /I ) = 0.7 + 0.3 = 1 = 100%
donc le nuage est pratiquement dan un espace de dimension 2
∆1 ⊕∆2 G
C k = X c ak ∈ R n
48
Preuve :en eet
p
X
xc1j akj
j=1
c1k xc11 xc12 . . . xc1p ak1
p
X
xc2j akj
.. .. .. .. .. ..
c2 x c x c . . . x c ak
k 21 22 2p 2
..
Ck = = . = j=1
cnk xcn1 xcn2 . . . xcnp akp
p
X
xcnj akj
j=1
1 t 1 1
V ar(Ck ) = Ck Ck = (X c .ak )t (X c .ak ) = atk (X c )t X c .ak = λk
n n n
=⇒ Ck ⊥Cl
49
3.11 Représentation des individus
3.11.1 Coordonnées des individus
Dans la nouvelle base (a , . . . , a ), les coordonnées de l'individu i sont
1 p
ci1
..
ci
2
∈ Rp .
i
cp
−−→−−→
2 < Gui Gak >2 atk uci (uci )t ak
cos (αik ) = −−→ = .
||Gui ||2 (uci )t uci
50
Cette propriété se généralise à l'angle d'un vecteur avec un sous-espace
de dimension quelconque (≥ 2).
Interprétation de la Représentation
Si le carré du cosinus de l'angle entre −Gu −→
et l'axe (ou le plan, ou le
sous- espace) est proche de 1, alors l'individu i est bien représenté par sa
i
p akj
cor(Ck , xcj ) = λk p ,
var(xj )
de R j j j
n
51
Donc
1 1
Cov(Ck , xcj ) = < Ck , xcj >= Ckt .xcj
n n
1 t c t c
= a (X ) X ej = atk Σej
n k
= λk atk ej = λk akj
Cov(Ck , xcj ) λk akj p akj
=⇒ ρ(Ck , xcj ) = p p =√ p = λk p
var(Ck ) var(xj ) λk var(xj ) var(xj )
53
3.14 ACP normée
Jusqu'à présent, on a étudié l'ACP simple , pour laquelle, tous les indivi-
dus ont le même poids et toutes les variables sont traitées de façon symétrique
(elles jouent le même rôle) et les axes principaux sont issus de la matrice de
covariance des variables. Cela pose parfois certains problèmes :
le premier problème : les anciennes variables sont hétérogènes, comme
par exemple des poids, des tailles et des âges;
le deuxième problème : si on change d'unités sur ces variables, on peut
changer complètement les résultats de l'ACP;
le dernier problème : une variable contribue d'autant plus à la confec-
tion des premiers axes que sa variance est forte.
Pour échapper à tous ces problèmes, on travaile sur des variables centrées et
réduites.
Cela revient à faire la même analyse que pour l'ACP simple, mais à choi-
sir une autre distance euclidienne entre les individus que la distance eucli-
dienne classique. La distance choisie est :
p
2
X 1
d (ui , ui0 ) = 2
(xij − xi0 j )2
σ
j=1 j
Si on reprend tous les calculs de l'ACP simple, mais en remplaçant les va-
riables de départ par les variables centrées réduites, on voit que ce n'est plus
la matrice de covariance, mais la matrice de corrélation R qui intervient pour
la recherche des nouveaux axes.
Puisque la matrice de corrélation R n'a que des 1 sur sa diagonale princi-
pale, sa trace est égale à p. Par suite, l'inertie totale du nuage des individus
dans R est égale à p.
p
Etude du nuage des variables : Coordonnées des variables sur les axes
1 p
55
UNIVERSITE MOHAMMED PREMIER
ECOLE NATIONALE DES SCIENCES APPLIQUEES
OUJDA-MAROC
Filière : Génie Civil 1ère année Année universitaire : 2019-2020
Elément de module : Analyse des données Enseignant : M. Derouich
Fiche TD N : 4 ◦
Exercice 3.15.1 :
1 −1 0 0
Soit V le tableau suivant : V = 41 −10 10 01 −10 .
0 0 −1 1
1. Calculer le trace de V
2. Déterminer les diérentes valeurs propres de V
3. Trouver un vecteur propre associé à la valeur propre λ = 0
4. Déterminer des vecteurs propres orthonormés de V associés aux va-
leurs propres de V diérentes de 0
Exercice 3.15.2 :
1 0 −1
0 1 −1
Soit X le tableau suivant :
−1 1 0
X= .
0 −1 1
−1 0 1
1 −1 0
On considère les six vecteurs de (muni de la métrique
x1 , x2 , · · · , x6 R3
euclidien usuelle) dont les composantes sont données par les lignes de X .
On pose m = 1/6 pours i = 1; 2; · · · , 6
1. Montrer que le nuage N de six vecteurs est centré à l'origine de R .
i
3
Calculer V = 1/6 X x x
6
0
i i
56
Exercice 3.15.3 :
On considère Le tableau Y de notes sur 20 obtenues par 9 élèves en mathé-
matiques, physique , français, et anglais.(n=9 individus , p=4 variables) :
mathématiques physique français anglais
Jean 6.0 6.0 5.0 5.5
Aline 8.0 8.0 8.0 8.0
Annie 6.0 7.0 11.0 9.5
Monique 14.5 14.5 15.5 15.0
Didier 14.0 14.0 12.0 12.5
André 11.0 10.0 5.5 7.0
Pierre 5.5 7.0 14.0 11.5
Brigitte 13.0 12.5 8.5 9.5
Evelyne 9.0 9.5 12.5 12.0
1. montrer que
le centre de gravité est donné par le vecteur : G =
9.67
9.83
10.22 .
10.06
2. On désire soumettre le tableau Y à un ACP. Pour cela on est conduit à
rechercher les vecteur propre de la matrice V = 1/9X X des variances-
0
c-
covariances sont λ = 28.253, λ = 12.075 . Quels sont les taux
d'inertie expliquée par chacun des deux axes factoriels correspon-
1 2
57
ci-dessous : 1 2
Maths 0.515 -0.567
Physique 0.507 -0.372
Français 0.492 0.650
Anglais 0.485 0.323
Calculer les coordonnées de " Jean " sur les deux axes factoriels.
3. Calculer les coecients de corrélation linéaire entre le premier facteur
et les 5 variables
4. Les corrélations entre les variables et les autres facteurs sont données
ci-dessous 1 2 3 4
math 0.81 -0.584 0.01 -0.02
phys 0.90 -0.432 -0.03 0.02
fran 0.75 0.651 -0.02 -0.01
ang 0.92 0.399 0.04 0.02
Donner brièvement un interprétation possible pour les 2 facteurs.
5. En utilisant les résultats obtenus à la première et à −la−→troisième ques-
tion, calculer le carré du cosinus de l'angle α entre Gu et un axe ∆
de vecteur directeur unitaire a (l'indice ponctuel de la représentation
1 1
de " Jean " sur le premier axe factoriel). Puis sur le plan des deux
1
58