Académique Documents
Professionnel Documents
Culture Documents
Dr A. Belhadj
1
CHAPITRE 1
Chacune des deux variables peut être qualitative ou quantitative. L’objectif est
de décrire la relation entre ces deux variables.
Dans le cas où les deux variables sont quantitative, On présente les couples
des valeurs numériques (xi , yi ) par des points M (xi , yi ) sur le plan.
2
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
n n
1X 1X
X= xi et Y = yi
n i=1 n i=1
n n
1X 2 2 1X 2 2
V (X) = xi − X et V (Y ) = yi − Y ,
n i=1 n i=1
p p
Les écart-types marginaux sont données par σX = V (X) et σY = V (Y ).
3 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
nij
fij =
n
4 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
5 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
formules suivantes :
p p
1X X
– X= ni• xi = fi• xi
n i=1 i=1
p p
1X 2 X 2
– V (X) = ni• x2i − X = fi• x2i − X
n i=1 i=1
p
– σX = V (X)
q q
1X 2 X 2
– V (Y ) = n•j yj2 − Y = f•j yj2 − Y
n j=1 j=1
p
– σY = V (Y )
Remparque : Si les observations de X (resp. Y ) sont regroupées dans des
classes [ei−1, , ei [ (resp. [ej−1, , ej [), on remplace xi par les centres de classes ci
(resp. yj par cj ).
p
nij X
fi/j = , avec fi/j = 1
n•j i=1
6 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
p p
1 X X
X(j) = nij xi = fi/j xi
n•j i=1 i=1
p p
1 X 2 2 X 2
V(j) (X) = nij xi − X(j) = fi/j x2i − X(j)
n•j i=1 i=1
q
nij X
fj/i = , avec fj/i = 1
ni• j=1
7 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
1.6 Indépendance
ni• × n•j
fij = fi• × f•j ou bien nij = .
n
8 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
1.7 Covariance
La covariance est une mesure qui indique le sens de la relation entre les
variables X et Y . La covariance notée Cov(X, Y ) est égale à la moyenne des
écarts des couples (xi , yi ) de X et Y par rapport au point (X, Y ).
n n
1X 1X
Cov(X, Y ) = (xi − X)(yi − Y ) = xi y i − X Y (1.1)
n i=1 n i=1
p q p q
1 XX 1 XX
Cov(X, Y ) = nij (xi − X)(yj − Y ) = nij xi yj − X Y (1.2)
n i=1 j=1 n i=1 j=1
– Si cov(X, Y ) > 0, alors on peut dire que la relation entre les deux variables
est positive. Dans ce cas, ces deux variables varient dans le même sens.
– Si cov(X, Y ) < 0 ; alors on peut dire que la relation entre les deux variables
est négative. Dans ce cas, ces deux variables varient en sens inverse.
– Si cov(X, Y ) = 0, alors on peut dire qu’il n’y a pas de relation entre les
deux variables. Dans ce cas, les variations de l’une n’entraînent pas la
variation de l’autre.
Remarques :
9 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
• Cov(X, X) = V (X).
cov(X, Y )
r(X, Y ) = .
σX × σY
• Si r = +1 alors les points se trouvent tous sur une même droite croissante,
la corrélation linéaire positive parfaite.
• Si r = 1 alors les points se trouvent tous sur une même droite décroissante,
la corrélation linéaire négative parfaite.
10 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
Y = aX + b
tel que :
Cov(X, Y )
a=
V (X)
11 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
et
b = y − ax
Démonstration :
Pour chaque observation (xi , yi ), On pourrai calculer la valeur de yi en utilisant
la droite de régression comme suit :
yi = axi + b + ei
tel que le résidu ei est l’erreur entre la valeur observée yi et la valeur calculée
yi∗ . Les résidus ei peuvent être positifs ou négatifs.
n
X n
X
M (a, b) = e2i = (yi − axi − b)2
i=1 i=1
12 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
n
∂M X
= −2(yi − axi − b) = 0
∂b i=1
n
∂M 1X
= xi (yi − axi − b) = 0
∂a n i=1
n
∂M 1X
= (yi − axi − b) = 0
∂b n i=1
n n
1X 1X
yi − a xi = b
n i=1 n i=1
d’où b = y − ax
En rempaçant b par y − ax dans la première équation, on trouve
Cov(X, Y )
a= .
V (X)
1.10.1 Exercice 01
Le but de cette exercice est l’étude de la relation entre le poids et la taille.
On mesure le poids X et la taille Y de 10 individus :
Poids X 60 64 67 69 70 72 75 78 85 96
Taille Y 155 157 164 169 178 180 173 179 180 189
13 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
2.Calcul de X, Y ,V (X), V (Y ), σX et σY
xi 60 64 67 69 70 72 75 78 85 96
yi 155 157 164 169 178 180 173 179 180 189
x2i 3600 4096 4489 4761 4900 5184 5625 6084 7225 9216
yi2 24025 24649 26896 28561 31561 32400 29929 32041 32400 35721
xi y i 9300 10 048 10988 11661 12460 12960 12975 13962 15300 18144
n
1X 60 + 64 + 67 + 69 + 70 + 72 + 75 + 78 + 85 + 96
X= xi = = 73.6 Kg
n i=1 10
n
1X 155 + 157 + 164 + 169 + 178 + 180 + 173 + 179 + 180 + 189 1724
Y = yi = = = 172.4cm
n i=1 10 10
14 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
3600 + 4096 + 4489 + 4761 + 4900 + 5184 + 5625 + 6084 + 7225 + 9216
= − (5416.96)
10
n
1X 2 2
V (Y ) = y −Y
n i=1 i
24025 + 24649 + 26896 + 28561 + 31561 + 32400 + 29929 + 32041 + 32400 + 35721
= − (172.4)2
10
√
• σX = 101.04 = 10.05 Kg.
√
• σY = 96.54 = 9.83 cm.
La covariance :
n
1X
Cov(X, Y ) = xi yi − X Y
n i=1
9300 + 10048 + 10988 + 11661 + 12460 + 12960 + 12975 + 13962 + 15300 + 18144
=
10
− (73.6)(172.4)
15 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
Coefficient de corrélation :
Cov(X, Y ) 91.16
r(X, Y ) = = = 0.92
σX σY 10.05 × 9.83
(D) : y = ax + b
tel que
Cov(X, Y ) 91.16
a= = = 0.9
V (X) 101.04
et
b = Y − aX = 172.4 − (0.9)73.6 = 106.16
16 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
1.10.2 Exercice 02
Le tableau suivant présente la répartition de la situation matrimoniale (X)
en fonction de l’âge (Y).
hhh
hh hhh
hh Age (Y)
hhhh
hhh [20 - 30[ [30 - 40[ [40 - 50[ Total
Situation matrimoniale (X) hh hhh
Célibataire 75 50 35 160
Marié 38 90 132 260
Divorcé 15 35 30 80
Total 198 175 197 n=500
On a
nij nij
fij = =
n 500
17 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
hhhh
hhhh
hhhh Age (Y)
h hhhh [20 - 30[ [30 - 40[ [40 - 50[ Total
Situation matrimoniale (X) hhh
hh
Célibataire 0.15 0.1 0.07 0.32
Marié 0.076 0.18 0.264 0.52
Divorcé 0.03 0.07 0.06 0.16
Total 0.256 0.35 0.394 1
Indépendance
Distributions marginales :
18 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
19 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
20 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
3 3
1 X X
Y(1) = n1j yj = fj/i=1 yj
n1• j=1 j=1
5200
= = 32.5
160
On dit que l’âge moyen des personnes célébataire est 32.5 ans.
3 3
1 X 2 2 X 2
V(1) (Y ) = n1j yj − Y(1) = fj/i=1 yj2 − Y(1)
n1• j=1 j=1
179000
= − (32.5)2 = 62.5
160
3 3
1 X X
Y(2) = n2j yj = fj/i=2 yj
n2• j=1 j=1
8240
= = 31, 69
260
21 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
3 3
1 X 2 2 X 2
V(1) (Y ) = n2j yj − Y(2) = fj/i=2 yj2 − Y(2)
n2• j=1 j=1
401300
= − (31.69)2 = 539.06
260
3 3
1 X X
Y(3) = n3j yj = fj/i=3 yj
n3• j=1 j=1
2950
= = 36, 875
80
3 3
1 X 2 2 X 2
V(3) (Y ) = n3j yj − Y(3) = fj/i=3 yj2 − Y(3)
n3• j=1 j=1
113000
= − (36.875)2 = 52.73
80
1.10.3 Exercice 03
Une expérience a été réalisée sur 135 personnes pour étudier la relation qui
existe entre l’âge X et le temps de sommeil Y . Le tableau suivant a été obtenu :
22 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
hhhh
hhhh Temps de sommeil Y
hhhh
hhh [5 - 8[ [8 - 11[ [11 - 14[ Total
Age X hhhh
hh
[4 - 10[ 0 0 25 25
[10 - 20[ 2 35 16 53
[20 - 30[ 0 22 3 25
[30 - 60[ 22 10 0 32
Total 24 67 44 n=135
•
4 4
1X X
X= ni• ci = fi• ci
n i=1 i=1
3035
= = 22.48
135
•
4 4
1X 2 X 2
V (X) = ni• c2i − X = fi• c2i − X
n i=1 i=1
93535
= − (22.48)2 = 187.728
135
√
• σX = 187.728 = 13.7
23 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
•
3 3
1X X
Y = n•j cj = f•j cj
n j=1 j=1
1342.5
= = 9.94
135
•
3 3
1X 2 X 2
V (Y ) = n•j c2j − Y = f•j c2j − Y
n j=1 j=1
13935.75
= − (9.94)2 = 4.38
135
√
• σY = 4.38 = 2.09
Covariance Cov(X, Y )
On a :
4 3
1 XX
Cov(X, Y ) = nij ci cj − X Y
n i=1 j=1
24 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
Donc :
0 + 0 + 2197.5 + 195 + 4987.5 + 3000 + 0 + 5225 + 937.5 + 6435 + 4275 + 0
Cov(X, Y ) =
135
− (22.48)(9.94)
= −21.65
Indépendance
Coefficient de corrélation
Cov(X, Y ) −21.65
r(X, Y ) = = = −0.75.
σX σY (13.7)(2.09)
(D) : y = ax + b
tel que
25 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES
Cov(X,Y ) −21.65
• a= V (X)
= 187.728
= −0.11
D’où
(D) : y = −0.11 x + 12.41.
26 Dr. A. Belhadj