Vous êtes sur la page 1sur 27

Probabilités & Statistique

Statistique descriptive à deux variables

1ère Année TC ING ST/GM/GC


Université Mouloud Mammeri de Tizi-Ouzou

Dr A. Belhadj

Année universitaire: 2023/2024


TABLE DES MATIÈRES

1 Statistique descriptive à deux variables 2


1.1 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Paramètres marginaux . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Tableau de contingence . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Distributions marginales . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Effectif marginal . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4.2 Fréquence marginale . . . . . . . . . . . . . . . . . . . . . . 5
1.4.3 Moyenne marginale, écart-type marginal . . . . . . . . . . . 5
1.5 Distribution conditionnelle . . . . . . . . . . . . . . . . . . . . . . . 6
1.6 Indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.7 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.8 Coefficient de corrélation . . . . . . . . . . . . . . . . . . . . . . . . 10
1.9 Droite de régression . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.10 Exercices corrigées . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.10.1Exercice 01 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.10.2Exercice 02 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.10.3Exercice 03 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1
CHAPITRE 1

STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

La statistique descriptive à deux variables , parfois appelée statistique double


ou bidimensionnelle, concerne l’analyse de deux variables X et Y simultanément.
Ces variables sont mesurées sur les n unités d’observations. Pour chaque
unité on obtient deux mesures. La série statistique est alors une suite de n
couples des valeurs prises par les deux variables sur chaque individu.

(x1 , y1 ), (x2 , y2 ), ............(xi , yi ), .........., (xn , yn ).

Chacune des deux variables peut être qualitative ou quantitative. L’objectif est
de décrire la relation entre ces deux variables.

1.1 Représentation graphique

Dans le cas où les deux variables sont quantitative, On présente les couples
des valeurs numériques (xi , yi ) par des points M (xi , yi ) sur le plan.

2
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Figure 1.1 – Le nuage de points

1.2 Paramètres marginaux

Les variables X et Y peuvent être analysées séparément, les moyennes mar-


ginales sont données par :

n n
1X 1X
X= xi et Y = yi
n i=1 n i=1

Les variances marginales V (X) et V (Y ) sont données par

n n
1X 2 2 1X 2 2
V (X) = xi − X et V (Y ) = yi − Y ,
n i=1 n i=1

p p
Les écart-types marginaux sont données par σX = V (X) et σY = V (Y ).

Remarque : Le point G(X, Y ) est appelé point moyen ou centre de gravité du


nuage.

1.3 Tableau de contingence

Le tableau de contingence est un moyen particulier de représenter simulta-


nément deux caractères observés sur une mìme population, s’ils sont discrets
ou bien continus et regroupés en classes. Les deux caractères sont X et Y ,

3 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

la taille de l’échantillon est n. Les modalités ou classes de X seront notées


x1 , x2 , ..., xp , celles de Y sont notées y1 , y2 , ..., yq . On note :
– nij : l’effectif conjoint de xi et yj : c’est le nombre d’individus pour lesquels
X prend la valeur xi et Y la valeur yj ,
– ni• = qj=1 nij : l’effectif marginal de xi : c’est le nombre d’individus pour
P

lesquels X prend la valeur xi ,


– n•j = pi=1 nij : l’effectif marginal de yj : c’est le nombre d’individus pour
P

lesquels Y prend la valeur yj .


On représente ces valeurs dans un tableau à double entrée, dit tableau de
contingence.

Figure 1.2 – Tableau de contingence

La fréquence conjointe notée fij , c’est la proportion d’individus ayant pris


simultanément la modalité xi de X et la modalité yj de Y .

nij
fij =
n

4 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

1.4 Distributions marginales

Définition 1.4.1. On appelle distribution marginale de la variable X, les don-


nées du couple (xi , ni• ) ou (xi , fi• ), i = 1, p

Définition 1.4.2. On appelle distribution marginale de la variable Y , les don-


nées du couple (yj , n•j ) ou (yj , f•j ), j = 1, q

1.4.1 Effectif marginal


Pp
– ni• = i=1 nij : l’effectif marginal de xi : c’est le nombre d’individus pour
lesquels X prend la valeur xi ,
– n•j = pi=1 nij : l’effectif marginal de yj : c’est le nombre d’individus pour
P

lesquels Y prend la valeur yj .


p q
X X
– On note que ni• = n•j = n.
i=1 j=1

1.4.2 Fréquence marginale


Pq
– fi• = j=1 fij : la fréquence marginale de xi : c’est la proportion d’individus

pour lesquels X prend la valeur xi ,


– f•j = pi=1 fij : la fréquence marginale de yj : c’est la proportion d’individus
P

pour lesquels Y prend la valeur yj .


p q
X X
– On note que fi• = f•j = 1.
i=1 j=1

1.4.3 Moyenne marginale, écart-type marginal

Si la variable statistique X est quantitative, alors la moyenne marginale X,


la variance marginale V (X) et l’écart type marginal σX sont calculés par les

5 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

formules suivantes :
p p
1X X
– X= ni• xi = fi• xi
n i=1 i=1

p p
1X 2 X 2
– V (X) = ni• x2i − X = fi• x2i − X
n i=1 i=1
p
– σX = V (X)

Si la variable statistique Y est quantitative, alors la moyenne marginale Y ,


la variance marginale V (Y ) et l’écart type marginal σY sont calculés par les
formules suivantes :
q q
1X X
– Y = n•j yj = f•j yj
n j=1 j=1

q q
1X 2 X 2
– V (Y ) = n•j yj2 − Y = f•j yj2 − Y
n j=1 j=1
p
– σY = V (Y )
Remparque : Si les observations de X (resp. Y ) sont regroupées dans des
classes [ei−1, , ei [ (resp. [ej−1, , ej [), on remplace xi par les centres de classes ci
(resp. yj par cj ).

1.5 Distribution conditionnelle


Définition 1.5.1. La distribution conditionnelle de X/Y = yj est la distribution
de X sur une partie de la population ayant pris la modalité yj de Y .
– L’effectif de la population ayant pris la modalité yj de Y est n•j
– La fréquence conditionnelle de X/Y = yj est définie par

p
nij X
fi/j = , avec fi/j = 1
n•j i=1

6 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

X/Y = yj effectif nij fréquence fi/j


x1 n1j f1/j
x2 n2j f2/j
. . .
. . .
xi nij fi/j
. . .
. . .
xp npj fp/j
Total n•j 1

Table 1.1 – Distribution conditionnelle de X/Y = yj

Dans le cas où la variable X est quantitative, on a :

• La moyenne conditionnelle de X/Y = yj est donnée par :

p p
1 X X
X(j) = nij xi = fi/j xi
n•j i=1 i=1

• La variance conditionnelle de X/Y = yj est donnée par

p p
1 X 2 2 X 2
V(j) (X) = nij xi − X(j) = fi/j x2i − X(j)
n•j i=1 i=1

Définition 1.5.2. La distribution conditionnelle de Y /x = xi est la distribution


de Y sur une partie de la population ayant pris la modalité xi de X.
– L’effectif de la population ayant pris la modalité xi de X est ni•
– La fréquence conditionnelle de Y /X = xi est définie par

q
nij X
fj/i = , avec fj/i = 1
ni• j=1

7 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Y /X = xi effectif nij fréquence fj/i


y1 ni1 f1/i
y2 ni2 f2/i
. . .
. . .
yj nij fj/i
. . .
. . .
yq niq fq/i
Total ni• 1

Table 1.2 – Distribution conditionnelle de Y /X = xi

Dans le cas où la variable statistique Y est quantitative, on a :

• La moyenne conditionnelle de Y /X = xi est donnée par :


q q
1 X X
Y(i) = nij yj = fj/i yj
ni• j=1 j=1

• La variance conditionnelle de Y /X = xi est donnée par


q q
1 X 2 2 X 2
V(i) (Y ) = nij yj − Y(i) = fj/i yj2 − Y(i)
ni• j=1 j=1

1.6 Indépendance

On dit que deux variables X et Y sont indépendantes si les variations de


l’une ne dépendent pas des variations de l’autre. Ou bien que les fréquences
conditionnelles fi/j ne dépendent pas de j et fj/i ne dépendent pas de i.

Théorème 1.6.1. On dit que deux variables X et Y sont indépendantes si et


seulement si pour tout i = 1, p et j = 1, q :

ni• × n•j
fij = fi• × f•j ou bien nij = .
n

8 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

1.7 Covariance
La covariance est une mesure qui indique le sens de la relation entre les
variables X et Y . La covariance notée Cov(X, Y ) est égale à la moyenne des
écarts des couples (xi , yi ) de X et Y par rapport au point (X, Y ).

n n
1X 1X
Cov(X, Y ) = (xi − X)(yi − Y ) = xi y i − X Y (1.1)
n i=1 n i=1

Dans le cas de données groupées dans un tableau de contingence, la cova-


riance est donnée par :

p q p q
1 XX 1 XX
Cov(X, Y ) = nij (xi − X)(yj − Y ) = nij xi yj − X Y (1.2)
n i=1 j=1 n i=1 j=1

– Si cov(X, Y ) > 0, alors on peut dire que la relation entre les deux variables
est positive. Dans ce cas, ces deux variables varient dans le même sens.
– Si cov(X, Y ) < 0 ; alors on peut dire que la relation entre les deux variables
est négative. Dans ce cas, ces deux variables varient en sens inverse.
– Si cov(X, Y ) = 0, alors on peut dire qu’il n’y a pas de relation entre les
deux variables. Dans ce cas, les variations de l’une n’entraînent pas la
variation de l’autre.

Remarques :

9 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

• Cov(X, Y ) = Cov(Y, X).

• Cov(X, X) = V (X).

• Si Cov(X, Y ) 6= 0 alors les variables X et Y ne sont pas indépendantes.

1.8 Coefficient de corrélation


Pour mesurer l’intensité de la liaison linéaire entre X et Y , on calcule le
coefficient de corrélation linéaire.

Définition 1.8.1. On appelle coefficient de corrélation linéaire ou coefficient de


Bravais-Pearson entre deux variables statistiques X et Y noté r(X, Y ), le rapport
de leur covariance par le produit de leurs écarts-type :

cov(X, Y )
r(X, Y ) = .
σX × σY

tel que −1 ≤ r(X, Y ) ≤ 1.


Propriètés :

• Le coefficient de corrélation est toujours compris entre -1 et +1.

• Si r = +1 alors les points se trouvent tous sur une même droite croissante,
la corrélation linéaire positive parfaite.

• Si r = 1 alors les points se trouvent tous sur une même droite décroissante,
la corrélation linéaire négative parfaite.

• Si r = 0 alors il n’y a pas une relation linéaire entre les variables X et Y . On


peut cependant avoir une dépendance non-linéaire avec un coefficient de
corrélation nul.

10 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

1.9 Droite de régression

La droite de régression est la droite qui ajuste au mieux un nuage de points


au sens des moindres carrés.

On considère que la variable X est explicative et que la variable Y est dé-


pendante. L’équation de la droite de régression linéaire de Y en X est :

Y = aX + b

tel que :
Cov(X, Y )
a=
V (X)

11 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

et
b = y − ax

Démonstration :
Pour chaque observation (xi , yi ), On pourrai calculer la valeur de yi en utilisant
la droite de régression comme suit :

yi = axi + b + ei

tel que le résidu ei est l’erreur entre la valeur observée yi et la valeur calculée
yi∗ . Les résidus ei peuvent être positifs ou négatifs.

Pour déterminer la valeur des coefficients a et b on utilise le principe des


moindres carrés qui consiste à chercher la droite qui minimise la somme des
carrés des résidus :

n
X n
X
M (a, b) = e2i = (yi − axi − b)2
i=1 i=1

Le minimum M (a, b) en (a, b) s’obtient en annulant les dérivées partielles par


rapport à a et b.
n
∂M X
= −2xi (yi − axi − b) = 0
∂a i=1

12 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

n
∂M X
= −2(yi − axi − b) = 0
∂b i=1

En divisant les deux équations par -2n, on obtient :

n
∂M 1X
= xi (yi − axi − b) = 0
∂a n i=1

n
∂M 1X
= (yi − axi − b) = 0
∂b n i=1

D’après la deuxième équation,

n n
1X 1X
yi − a xi = b
n i=1 n i=1

d’où b = y − ax
En rempaçant b par y − ax dans la première équation, on trouve

Cov(X, Y )
a= .
V (X)

1.10 Exercices corrigées

1.10.1 Exercice 01
Le but de cette exercice est l’étude de la relation entre le poids et la taille.
On mesure le poids X et la taille Y de 10 individus :

Poids X 60 64 67 69 70 72 75 78 85 96
Taille Y 155 157 164 169 178 180 173 179 180 189

1.Représentation graphique des données

Les données sont representés sous la forme du nuage de point suivant :

13 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Figure 1.3 – Le nuage de point

2.Calcul de X, Y ,V (X), V (Y ), σX et σY

xi 60 64 67 69 70 72 75 78 85 96
yi 155 157 164 169 178 180 173 179 180 189
x2i 3600 4096 4489 4761 4900 5184 5625 6084 7225 9216
yi2 24025 24649 26896 28561 31561 32400 29929 32041 32400 35721
xi y i 9300 10 048 10988 11661 12460 12960 12975 13962 15300 18144

Les moyennes marginales :

n
1X 60 + 64 + 67 + 69 + 70 + 72 + 75 + 78 + 85 + 96
X= xi = = 73.6 Kg
n i=1 10

n
1X 155 + 157 + 164 + 169 + 178 + 180 + 173 + 179 + 180 + 189 1724
Y = yi = = = 172.4cm
n i=1 10 10

14 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Les variances marginales :


n
1X 2 2
V (X) = xi − X
n i=1

3600 + 4096 + 4489 + 4761 + 4900 + 5184 + 5625 + 6084 + 7225 + 9216
= − (5416.96)
10

= 5518 − 5416.96 = 101.04

n
1X 2 2
V (Y ) = y −Y
n i=1 i

24025 + 24649 + 26896 + 28561 + 31561 + 32400 + 29929 + 32041 + 32400 + 35721
= − (172.4)2
10

= 29818.3 − 29721.76 = 96.54

Les écart-types marginaux :


• σX = 101.04 = 10.05 Kg.

• σY = 96.54 = 9.83 cm.

La covariance :

n
1X
Cov(X, Y ) = xi yi − X Y
n i=1

9300 + 10048 + 10988 + 11661 + 12460 + 12960 + 12975 + 13962 + 15300 + 18144
=
10

− (73.6)(172.4)

= 12779.8 − 12688.64 = 91.16


(1.3)

15 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

– Les variables X et Y ne sont pas indépendantes car Cov(X, Y ) 6= 0.


– Il existe une relation positive entre X et Y car Cov(X, Y ) > 0.

Coefficient de corrélation :

Cov(X, Y ) 91.16
r(X, Y ) = = = 0.92
σX σY 10.05 × 9.83

Il existe une forte relation linéaire positive entre X et Y .

Droite de régression linéaire

(D) : y = ax + b

tel que
Cov(X, Y ) 91.16
a= = = 0.9
V (X) 101.04

et
b = Y − aX = 172.4 − (0.9)73.6 = 106.16

Donc la droite de régression (D) est donnée par l’équation

y = 0.9 x + 106, 16.

16 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

1.10.2 Exercice 02
Le tableau suivant présente la répartition de la situation matrimoniale (X)
en fonction de l’âge (Y).

hhh
hh hhh
hh Age (Y)
hhhh
hhh [20 - 30[ [30 - 40[ [40 - 50[ Total
Situation matrimoniale (X) hh hhh
Célibataire 75 50 35 160
Marié 38 90 132 260
Divorcé 15 35 30 80
Total 198 175 197 n=500

Le tableau de contingence des fréquences

On a
nij nij
fij = =
n 500

17 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

hhhh
hhhh
hhhh Age (Y)
h hhhh [20 - 30[ [30 - 40[ [40 - 50[ Total
Situation matrimoniale (X) hhh
hh
Célibataire 0.15 0.1 0.07 0.32
Marié 0.076 0.18 0.264 0.52
Divorcé 0.03 0.07 0.06 0.16
Total 0.256 0.35 0.394 1

Indépendance

X et Y sont indépendantes ⇔ fij = fi• × f•j , ∀i = 1, 3, j = 1, 3.


pour i = 1 et j = 3, on a f13 = 0.07 et f1• × f•3 = 0.32 × 0.394 = 0.126.
D’où la situation matrimoniale X et l’âge Y ne sont pas indépendants.

Distributions marginales :

La distribution marginale de X est donnée par :

Situation matrimoniale xi ni. fi.


Célibataire 160 0.32
Marié 260 0.52
Divorcé 80 0.16
Total 500 1

La distribution marginale de Y est donnée par :

Age (yj ) n.j f.j


[20 - 30[ 128 0.256
[30 - 40[ 175 0.35
[40 - 50[ 197 0.394
Total 500 1

18 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Distribution conditionnelle de la situation matrimoniale X/Y

On note que y1 : [20, 30[ , y2 : [30, 40[, y3 : [40, 50[.

La distribution conditionnelle de la situation matrimoniale X/y = y1 est


donnée par :

Situation matrimoniale xi ni1 fi/j=1


Célibataire 75 0.59
Marié 38 0.3
Divorcé 15 0.11
Total 128 1

La distribution conditionnelle de la situation matrimoniale X/Y = y2 est donnée


par :

Situation matrimoniale xi ni2 fi/j=2


Célibataire 50 0.29
Marié 90 0.51
Divorcé 35 0.2
Total 175 1

La distribution conditionnelle de la situation matrimoniale X/y = y3 est donnée


par :

Situation matrimoniale xi ni3 fi/j=3


Célibataire 35 0.18
Marié 132 0.67
Divorcé 30 0.15
Total 197 1

Distribution conditionnelle de la l’âge Y /X

On note que x1 : célébataire, x2 : marié, x3 : divorsé.

19 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

La distribution conditionnelle de Y /x = x1 est donnée par :

Age (yj ) n1j fj/i=1


[20 - 30[ 75 0.46875
[30 - 40[ 50 0.3125
[40 - 50[ 35 0.21875
Total 160 1

La distribution conditionnelle de Y /x = x2 est donnée par :

Age (yj ) n2j fj/i=2


[20 - 30[ 38 0.15
[30 - 40[ 90 0.35
[40 - 50[ 132 0.5
Total 260 1

La distribution conditionnelle de Y /x = x3 est donnée par :

Age (yj ) n3j fj/i=3


[20 - 30[ 15 0.1875
[30 - 40[ 35 0.4375
[40 - 50[ 30 0.375
Total 80 1

Moyennes et variances conditionnelles de Y

Moyenne et variances conditionnelles d Y /X = x1 :

Age (yj ) cj n1j cj n1j c2j n1j


[20 - 30[ 25 75 1875 46875
[30 - 40[ 35 50 1750 61250
[40 - 50[ 45 35 1575 70875
Total 160 5200 179000

20 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

• La moyenne conditionnelle de Y /X = x1 est donnée par :

3 3
1 X X
Y(1) = n1j yj = fj/i=1 yj
n1• j=1 j=1

5200
= = 32.5
160

On dit que l’âge moyen des personnes célébataire est 32.5 ans.

• La variance conditionnelle de Y /X = x1 est donnée par

3 3
1 X 2 2 X 2
V(1) (Y ) = n1j yj − Y(1) = fj/i=1 yj2 − Y(1)
n1• j=1 j=1

179000
= − (32.5)2 = 62.5
160

Moyenne et variances conditionnelles d Y /X = x2 :

Age (yj ) cj n2j cj n2j c2j n2j


[20 - 30[ 25 38 950 23750
[30 - 40[ 35 90 1350 110250
[40 - 50[ 45 132 5940 267300
Total 260 8240 401300

• La moyenne conditionnelle de Y /X = x2 est donnée par :

3 3
1 X X
Y(2) = n2j yj = fj/i=2 yj
n2• j=1 j=1

8240
= = 31, 69
260

21 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

• La variance conditionnelle de Y /X = x1 est donnée par :

3 3
1 X 2 2 X 2
V(1) (Y ) = n2j yj − Y(2) = fj/i=2 yj2 − Y(2)
n2• j=1 j=1

401300
= − (31.69)2 = 539.06
260

Age (yj ) cj n3j cj n3j c2j n3j


[20 - 30[ 25 15 375 9375
[30 - 40[ 35 35 1225 42875
[40 - 50[ 45 30 1350 60750
Total 80 2950 113000

• La moyenne conditionnelle de Y /X = x3 est donnée par :

3 3
1 X X
Y(3) = n3j yj = fj/i=3 yj
n3• j=1 j=1

2950
= = 36, 875
80

• La variance conditionnelle de Y /X = x3 est donnée par :

3 3
1 X 2 2 X 2
V(3) (Y ) = n3j yj − Y(3) = fj/i=3 yj2 − Y(3)
n3• j=1 j=1

113000
= − (36.875)2 = 52.73
80

1.10.3 Exercice 03
Une expérience a été réalisée sur 135 personnes pour étudier la relation qui
existe entre l’âge X et le temps de sommeil Y . Le tableau suivant a été obtenu :

22 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

hhhh
hhhh Temps de sommeil Y
hhhh
hhh [5 - 8[ [8 - 11[ [11 - 14[ Total
Age X hhhh
hh
[4 - 10[ 0 0 25 25
[10 - 20[ 2 35 16 53
[20 - 30[ 0 22 3 25
[30 - 60[ 22 10 0 32
Total 24 67 44 n=135

Moyenne marginale X et écart-type marginal σX

xi ci ni• ni• ci ni• c2i


[4 - 10[ 7 25 175 1225
[10 - 20[ 15 53 795 11925
[20 - 30[ 25 25 625 15625
[30 - 60[ 45 32 1440 64800
Total n=135 3035 93575


4 4
1X X
X= ni• ci = fi• ci
n i=1 i=1

3035
= = 22.48
135


4 4
1X 2 X 2
V (X) = ni• c2i − X = fi• c2i − X
n i=1 i=1

93535
= − (22.48)2 = 187.728
135


• σX = 187.728 = 13.7

23 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Moyenne marginale Y et écart-type marginal σY

yj cj n•j n•j cj n•j c2j


[5 - 8[ 6.5 24 156 1014
[8 - 11[ 9.5 67 636.5 6046.75
[11 - 14[ 12.5 44 550 6875
Total n=135 1342.5 13935.75


3 3
1X X
Y = n•j cj = f•j cj
n j=1 j=1

1342.5
= = 9.94
135


3 3
1X 2 X 2
V (Y ) = n•j c2j − Y = f•j c2j − Y
n j=1 j=1

13935.75
= − (9.94)2 = 4.38
135


• σY = 4.38 = 2.09

Covariance Cov(X, Y )

On a :
4 3
1 XX
Cov(X, Y ) = nij ci cj − X Y
n i=1 j=1

On Calcule les termes nij ci cj pour i = 1, 4 et j = 1, 3 à l’aide du tableau suivant :

24 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

cj 6.5 9.5 12.5


HH
HH y j
ci [5 - 8[ [8 - 11[ [11 - 14[
xi H
HH
7 [4 - 10[ 0 × 7 × 6.5 =0 0 × 7 × 9.5 =0 25 × 7 × 12.5=2187.5
15 [10 - 20[ 2× 15× 6.5=195 35× 15 × 9.5=4987.5 16× 15× 12.5=3000
25 [20 - 30[ 0 × 25× 6.5=0 22× 25 × 9.5=5225 3× 25× 12.5=937.5
45 [30 - 60[ 22× 45× 6.5=6435 10× 45× 9.5 =4275 0× 45× 12.5=0

Donc :
0 + 0 + 2197.5 + 195 + 4987.5 + 3000 + 0 + 5225 + 937.5 + 6435 + 4275 + 0
Cov(X, Y ) =
135

− (22.48)(9.94)

= −21.65

Indépendance

Cov(X, Y ) 6= 0 alors l’âge X et le temps de sommeil Y ne sont pas indépen-


dants, il existe une relaion négative entre X et Y (car Cov(X, Y ) < 0).

Coefficient de corrélation

Cov(X, Y ) −21.65
r(X, Y ) = = = −0.75.
σX σY (13.7)(2.09)

Conclusion : Il existe une forte relation linéaire négative entre X et Y .

Droite d’ajustement linéaire

L’équation de la droite (D) d’ajustement linéaire de Y en X est

(D) : y = ax + b

tel que

25 Dr. A. Belhadj
CHAPITRE 1. STATISTIQUE DESCRIPTIVE À DEUX VARIABLES

Cov(X,Y ) −21.65
• a= V (X)
= 187.728
= −0.11

• b = Y − aX = 9.94 − (−0.11)(22.48) = 12.41

D’où
(D) : y = −0.11 x + 12.41.

Estimation du temps de sommeil Y d’une personne de 66 ans :

pour x = 66 ans, on a y = −0.11(66) + 12.41 = 5.15 ' 5 h


Le temps de sommeil estimé pour une personne de 66 ans est 5 heures.

26 Dr. A. Belhadj

Vous aimerez peut-être aussi