Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 23

STATISTIQUE DESCRIPTIVE 2017-2018

TD 7

STATISTIQUE DESCRIPTIVE BIVARIEE

Exercice 1 :
On considère le tableau suivant, relatif à une population de 100 ménages, où X désigne le nombre
d’enfants du ménage et Y est le nombre de pièces du logement.
X\Y 3 4 5

2 15 10 5

3 30 5 10

4 10 5 0

5 10 0 0

1) Donner le tableau de contingence des effectifs et des fréquences.


2) Donner les distributions marginales des effectifs et des fréquences.
3) Donner la distribution conditionnelle (en effectifs et en fréquences) de X sachant Y=y2=4.
4) Donner la distribution conditionnelle (en effectifs et en fréquences) de Y sachant X=x2=3.
5) Les variables X et Y sont-elles indépendantes ?
6) Calculer la cov(X, Y) et cor(X,Y) avec interprétation.

Exercice 2 :
Un site internet reçoit 113 457 visiteurs durant un mois. On désigne par X le navigateur internet
utilisé et Y le système d’exploitation utilisé.
Window
X\Y Mac Linux
s

Chrome 14103 1186 427

Fire fox 30853 4392 3234

Internet explorer 47389 23 0

Safari 668 6416 0

Autres 2974 40 1752

1) Identifier la population, sa taille ainsi que les variables étudiées en précisant leur type.
2) Quelle est la proportion de visiteurs sous Windows ?
3) Quelle proportion de visiteurs utilisent le navigateur Safari ?
4) Parmi les utilisateurs de Mac, quelle proportion utilise Chrome ?
5) Parmi les utilisateurs de Safari, quelle proportion est sous Windows ?
6) Représenter graphiquement la distribution des proportions par Navigateur pour chaque
système d’exploitation. Les variables X et Y sont-elles indépendantes ?

Exercice 3 :
Pour un échantillon de 100 individus, on a observé leur taille X (en cm) et leur poids Y (masse
corporelle en kg).
[40, [50,
X/Y [45, 50[ [55, 60[
45[ 55[
[150, 155[ 20 9 1 0
[155, 160[ 2 18 4 1
[160, 165[ 0 5 12 6
[165, 170[ 0 1 7 14

1. Donnez les distributions marginales.


2. Donnez la distribution conditionnelle de X sachant que Y ∈ [50, 55[.
3. Calculer les moyennes et les variances marginales.
4. Calculer les moyennes et les variances conditionnelles.

Exercice 4 :
Le tableau suivant donne la répartition (en pourcentage) d'un groupe de personnes en fonction de
leur groupe sanguin (Y) et de leur facteur Rhésus (X).

X/Y O A B AB
Rh
35,7 38,25 9,35 1,7
+
Rh- 6,3 6,75 1,65 0,3

- Les deux caractères X et Y sont-ils indépendants ?

Exercice 5 :
On donne la répartition de 1500 ouvriers selon le nombre de pièces habitées (X) et le nombre
d'enfants à charge (Y).
X/
0 1 2 3
Y
1 90 n12 90 45
2 150 375 n23 75
3 60 150 60 30

1. Déterminez les valeurs de n₁₂ et n₂₃ si chaque ouvrier a, en moyenne, (1,2) enfants.
2. Retrouvez les valeurs de n₁₂ et n₂₃ en supposant l'indépendance statistique entre X et Y.
3. Calculez le nombre moyen de pièces habitées.
4. Calculez le nombre moyen d'enfants pour les ouvriers habitant 1 pièce, 2 pièces. Que
remarquez-vous ?
5. On s’intéresse aux ouvriers ayant des enfants.
(a) Calculez le nombre moyen d'enfants.
(b) Calculez le nombre moyen de pièces habitées. Que remarquez-vous ?

Exercice 6 :
Le tableau ci-après donne la répartition (en pourcentage) d'une population de salariés
selon le revenu annuel X (en 1000dhs) et l‘ âge Y (en années).

[30,
X/Y [20, 30[ [40, 50[ [50, 65[
40[
[10, 15[ 1 3 4 3
[15, 20[ 3 4 9 3
[20, 25[ 2 9 12 4
[25, 30[ 2 8 10 6
[30, 40[ 2 6 7 2

1. Donner les distributions marginales des effectifs et des fréquences.


2. Donner la distribution conditionnelle (en effectifs et en fréquences) de X sachant Y=y3.
3. Donner la distribution conditionnelle (en effectifs et en fréquences) de Y sachant X=x5.
4. Les variables X et Y sont-elles indépendantes ?
5. Calculer la cov(X, Y) et cor(X,Y) avec interprétation

Exercice 7 :
On donne la répartition (en fréquences relatives) des employés selon leur salaire mensuel
(X) exprimé en centaines de dirhams et leur ancienneté (Y) exprimée en années.

X/Y [0, 5[ [5, 17[ [17, 33[ [33, 40[


[15, 25[ f11 0,15 0 0
[25, 65[ f21 0,05 0,02 0,05
[65, 95[ 0,05 0,04 0,09 0,1
[95, 205[ 0 0 0,07 0,1

1. Définissez la population étudiée, l'unité statistique, les caractères étudiés et leur nature.
2. Déterminez f₁₁ et f₂₁ si la moitié des employés touche moins de 5500 dirhams.
3. Quel pourcentage d'employés gagnent moins de 6500 dirhams parmi les employés ayant
moins de 17 ans d’ancienneté ?
4. Calculez la moyenne et l‘écart-type du salaire des employés.
5. Calculez la moyenne conditionnelle de Y sachant X = x3 ainsi que l‘écart-type
correspondant.
6. L'entreprise s'intéresse aux employés dont l'ancienneté dépasse 36 ans et demi, pour la
retraite. Déterminez le pourcentage des retraités.
7. L'entreprise remplace ces retraités par une jeune équipe.
(a) Déterminez l‘étendue.
(b) Calculez l'ancienneté moyenne.
STATISTIQUE DESCRIPTIVE 2017-2018

Corrigé TD 7

STATISTIQUE DESCRIPTIVE BIVARIEE

Exercice 1 :
Population de 100 ménages, où X désigne le nombre d’enfants du ménage et Y est le nombre de
pièces du logement.
1) Tableau de contingence des effectifs :
ni . =∑ n ij ; n. j=∑ nij
j i
X\Y 3 4 5 ni.
2 15 10 5 30
3 30 5 10 45
4 10 5 0 15
5 10 0 0 10
n.j 65 20 15 100

Tableau de contingence des fréquences :


n ij ni . n. j
f ij = ; f i .= =∑ f ij ; f . j= =∑ f ij
n.. n.. j n.. i
X\Y 3 4 5 fi.
2 0,15 0,1 0,05 0,3
3 0,3 0,05 0,1 0,45
4 0,1 0,05 0 0,15
5 0,1 0 0 0,1
f.j 0,65 0,2 0,15 1

2) Distribution marginale des effectifs et des fréquences de X :


X Effectifs Fréquences
2 30 0,3
3 45 0,45
4 15 0,15
5 10 0,1
Total 100 1

Distribution marginale des effectifs et des fréquences de Y :


Y Effectifs Fréquences
3 65 0,65
4 20 0,20
5 15 0,15
Total 100 1
3) Distribution conditionnelle (en effectifs et en fréquences) de X sachant Y=y2=4 :
n12 10 n22 5
f i=1/ j=2= = =0 ,5 ; f i=2/ j=2= = =0 ,25 ;
n.2 20 n.2 20
n32 5
f i=3/ j=2= = =0 ,25 ;
n.2 20
n42 0
f i=4 / j=2= = =0 .
n.2 20

X/Y= y2=4 Effectifs Fréquences


2 10 0,5
3 5 0,25
4 5 0,25
5 0 0
Total 20 1

4) Donner la distribution conditionnelle (en effectifs et en fréquences) de Y sachant X= x 2= 3 :


n21 30 n22 5
f j=1 /i=2= = =0 , 67 ; f j=2 /i=2= = =0 , 11;
n2. 45 n2. 45
n23 10
f j=3 /i=2= = =0 , 22.
n 2. 45

Y/X= x2=3 Effectifs Fréquences


3 30 0,67
4 5 0,11
5 10 0,22
Total 45 1

5) On a indépendance entre X et Y si :
ni . × n. j
f ij =f i . × f . j ou encore nij = ∀ ( i, j )
n..

Ici, on a n11 = 15, n1. = 30, n.1 = 65, n.. = 100,

n1. n.1 30 X 65
= =19 , 5 , alors que n11 = 15. Donc X et Y ne sont pas indépendantes.
n.. 100
6) Calcul de la cov (X, Y) :
X\Y 3 4 5 ni .
2
ni . x i ni . x i ∑ nij y j ∑ nij y j x i
2 15 10 5 30 60 120 110 220
3 30 5 10 45 135 405 160 480
4 10 5 0 15 60 240 50 200
5 10 0 0 10 50 250 30 150
n. j 65 20 15 100 305 1015 350 1050
n. j y j 195 80 75 350
2
n. j y j
585 320 375 1280
∑ nij x i 210 55 40 305
63
∑ nij x i y j 0 220 200 1050

1
cov ( x , y ) = ∑ nij x i y j- x y = 1050 −3 , 05× 3 ,5=−0,175
n .. i , j 100
Les deux variables sont dépendantes et varient dans le sens inverse.

Calcul de cor (X,Y) :


cov ( x , y ) −0,175
cor ( x , y )= = =−0 , 26
σx σy 0 , 92 ×0 , 74
Car :

V ( x )=
∑ 2
ni . x i 2
−x =
1050 2
−( 3 , 05 ) =0,8475
n.. 100

V ( y )=
∑ n. j y j − y 2= 1280 − ( 3 ,5 )2 =0 ,55
2

n.. 100
Donc la corrélation linéaire est faible.

Exercice 2 :
Linu
X\Y Windows Mac ni .
x
Chrome 14 103 1 186 427 15 716
Fire fox 30 853 4 392 3 234 38 479
Internet
47 389 23 0 47 412
explorer
Safari 668 6 416 0 7 084
Autres 2 974 40 1 752 4 766
n. j 95 987 12 057 5 413 113 457

1) Population : visiteurs d’un site internet.


Taille : 113 457 visiteurs.
Variables étudiées : X le navigateur internet utilisé et Y le système d’exploitation utilisé.
X et Y sont deux variables qualitatives.
2) Proportion de visiteurs sous Windows :
n.1 =∑ ni 1=n11 +n21 +n31 +n41 +n51=95 987
i
n.1 95 987
f .1= = ≈ 0,846
n.. 113 457
La proportion des visiteurs de Windows, indépendamment du navigateur internet utilisé est de
près de 84,6%.
3) Proportion de visiteurs utilisent le navigateur Safari :
n 4.=∑ n4 j=n41 +n 42+n 43=7 084
j
n 4. 7 084
f 4.= = ≈ 0,062
n.. 113 457
La proportion des utilisateurs de Safari, indépendamment du système d’exploitation utilisé est de
près de 6,2%.
4) Proportion qui utilise Chrome parmi les utilisateurs de Mac :
n12 1 186
= ≈ 0,098
n.2 12 057
La proportion des utilisateurs du navigateur Chrome parmi les utilisateurs du système
d’exploitation Mac est de près de 9,8%.
5) Proportion sous Windows parmi les utilisateurs de Safari :
n41 668
= ≈ 0,094
n4. 7 084
La proportion des utilisateurs du système d’exploitation Windows parmi les utilisateurs du
navigateur Safari est de près de 9,4%.
6) On a indépendance entre X et Y si :

Linu
X\Y Windows Mac f i.
x
Chrome 0,124 0,011 0,004 0,139
Fire fox 0,272 0,039 0,028 0,339
Internet
0,418 0,000 0,000 0,418
explorer
Safari 0,006 0,056 0,000 0,062
Autres 0,026 0,000 0,016 0,042
f.j 0,846 0,106 0,048 1,000

Ici, on a :
f 1. × f .1=0,139 × 0,846=0,118

f 11=0,124
Ou encore :

f 3. × f .3 ≠ 0
f 33=0

Donc X et Y ne sont pas indépendantes.


Exercice 3 :
On a un échantillon de 100 individus, on a observé leur taille X (en cm) et leur poids Y (masse
corporelle en kg).
[45,
X/Y [40, 45[ [50, 55[ [55, 60[ ni .
50[
[150, 155[ 20 9 1 0 30
[155, 160[ 2 18 4 1 25
[160,
0 5 12 6 23
165[
[165, 170[ 0 1 7 14 22
n. j 22 33 24 21 100

1. Distributions marginales :
X Effectif Fréquence
[150, 155[ 30 0,3
[155, 160[ 25 0,25
[160, 165[ 23 0,23
[165, 170[ 22 0,22
Total 100 1,00

Y Effectif Fréquence
[40, 45[ 22 0,22
[45, 50[ 33 0,33
[50, 55[ 24 0,24
[55, 60[ 21 0,21
Total 100 1,00

2. Distribution conditionnelle de X sachant que Y ∈ [50, 55[ :


X/Y Effectif Fréquences
[150, 155[ 1 0,04
[155, 160[ 4 0,17
[160,
12 0,50
165[
[165, 170[ 7 0,29
Total 24 1,00

3. Calcul des moyennes et des variances marginales :


On sait que :
k k
1
x= ∑ ni . xi =∑ f i. x i
n i=1 i=1
l l
1
y= ∑ n y =∑ f y
n j =1 . j j j=1 . j j
k
V ( x )=∑ f i . x2i −x2
i=1
l
V ( y )=∑ f . j y 2j − y 2
j=1
Le tableau suivant permet de calculer les moyennes et les variances marginales de X :

X x i ni . f i. f i . xi f i . xi
2

[150, 155[ 152,5 30 0,3 45,75 6976,875


0,25 39,37
[155, 160[ 25
157,5 5 6201,5625
162, 0,23
[160, 165[ 23
5 37,375 6073,4375
167, 0,22
[165, 170[ 22
5 36,85 6172,375
Total 100 1,00 159,35 25424,25

Alors :
x=159 , 35
V ( x )=25425 , 25−25392,4225=31,8275
La taille moyenne des individus constituant cet échantillon, indépendamment de leur poids, est
de près 159,4 cm. La variance est 31,8 et l’écart type s’élève à 5,6 cm. Le coefficient de variation qui
est égale à 0,03 indique une faible dispersion.
Par analogie, le tableau suivant permet de calculer les moyennes et les variances marginales de X :

Y yj n. j f.j f.jyj f.jyj


2

42,
[40, 45[ 22
5 0,22 9,35 397,375
47,
[45, 50[ 33
5 0,33 15,675 744,5625
[50, 55[ 52,5 24 0,24 12,6 661,5
12,07
Alors : [55, 60[ 21
57,5 0,21 5 694,3125
y=49 , 7
Total 100 1,00 49,7 2497,75
V ( y )=2497 , 75−2470 , 09=27 , 66
Le poids moyen des individus constituant cet échantillon, indépendamment de leur taille, est de
près 49,7 kg. La variance est 27,7 et l’écart type s’élève à 5,3 kg. Le coefficient de variation qui est
égale à 0,11 indique une faible dispersion.

4. Calcul des moyennes et des variances conditionnelles.


On sait que :
k k l l
1 1
X j= ∑ n x =∑ f x
n. j i=1 ij i i=1 i/ j i
Y i= ∑ n y =∑ f y
ni . j=1 ij j j=1 j/ i j

k k
1
V j ( X )= ∑
n. j i=1
nij (x i−X j )2=∑ f i / j (x i−X j )2
i=1
k k
1
V j ( X )= ∑ n x 2− X 2j =∑ f i/ j x i2−X 2j
n. j i=1 ij i i=1

l l
1
V i ( Y )= ∑ nij ( y j −Y i)2=∑ f j/ i ( y j −Y i)2
ni . j=1 j=1
k k
1
V j ( X )= ∑ n y 2− y 2i =∑ f i / j y j2− y 2i
n. j i=1 ij j i=1

Le tableau suivant permet de calculer la moyenne et la variance conditionnelle de X/Y=y 1, soit


X 1 et V 1 ( X ):
X xi ni 1 f i/ j=1 f i/ j=1 × x i f i/ j=1 × x i
2

[150, 155[ 152,5 20 0,91 138,64 21142,05


[155, 160[ 157,5 2 0,09 14,32 2255,11
[160,
0 0,00 0,00 0,00
165[ 162,5
[165, 170[ 167,5 0 0,00 0,00 0,00
Total 22 1 152,95 23397,16
Alors :
X 1 =152, 95
V 1 ( X )=23397 ,16−23395 , 09=2 , 07
La taille moyenne des individus constituant cet échantillon et qui ont un poids compris entre 40
et 45 kg, est de près 153 cm. La variance est 2,1 et l’écart type s’élève à 1,4 cm. Le coefficient de
variation qui est égale à 0,009 indique une très faible dispersion.
On fait de même pour j variant de 2 à 4, et on résume les résultats dans le tableau suivant :

j Xj V j( X )
1 152,95 2,07
2 157,20 13,54
3 162,71 15,58
4 165,60 8,28

Le tableau suivant permet de calculer la moyenne et la variance conditionnelle de Y/X=x 1, soit


Y 1 et V 1 ( Y ):
Y y j n1 j f j /i=1 f j /i=1 × y j 2
f j /i=1 × y j
[40,
20 0,67 28,33 1204,17
45[ 42,5
[45, 50[ 47,5 9 0,30 14,25 676,88
[50, 55[ 52,5 1 0,03 1,75 91,88
[55, 60[ 57,5 0 0,00 0,00 0,00
Total 30 1,00 44,33 1972,92
Alors :
Y 1=44 , 33
V 1 ( Y )=1972 , 92−1965 , 44=7 , 47
La taille moyenne des individus constituant cet échantillon et qui ont un poids compris entre 40
et 45 kg, est de près 153 cm. La variance est 2,1 et l’écart type s’élève à 1,4 cm. Le coefficient de
variation qui est égale à 0,009 indique une très faible dispersion.
On fait de même pour i variant de 2 à 4, et on résume les résultats dans le tableau suivant :

i Yi V i (Y )
1 44,33 7,47
2 48,30 9,36
3 52,72 11,91
4 55,45 8,32

On vérifie la formule de décomposition de la variance de X :


1 1 2144,9254 1040 , 16
V ( x )= ∑ n (x −x)2 + n ∑ n. j V j ( x )= 100 + 100 =21 , 4 +10 , 4=31 , 8
n.. j . j j .. j

n. j xj 2
n. j (x j−x) V j ( x ) n. j ×V j ( x )
22 152,95 901,12 2,07 45,54
33 157,20 152,5425 13,54 446,82
24 162,71 270,9504 15,58 373,92
21 165,60 820,3125 8,28 173,88
100 2144,9254 1040,16

On vérifie la formule de décomposition de la variance de Y :


1 1 1851,2512 915 , 07
V ( y )= ∑
n.. i
n i. ( y i− y ) + ∑ ni . V i ( y )=
2
n.. j 100
+
100
=18 , 5+9 , 2=27 ,7

ni . y i ni . ( y i− y )2 V i ( y ) ni . × V i ( y )
30 44,33 865,107 7,47 224,1
25 48,30 49 9,36 234
23 52,72 209,7692 11,91 273,93
22 55,45 727,375 8,32 183,04
100 1851,2512 915,07
Exercice 4 :
X/Y O AB AB f i.
0,093
Rh+ 0,357 0,3825 0,017 0,85
5
0,06
Rh- 0,0675 0,0165 0,003 0,15
3
f . j 0,42 0,45 0,11 0,02 1,00

∀ i, j f ij =f i . × f . j . Donc le groupe sanguin (Y) et le facteur Rhésus (X) chez ce groupe de personnes
sont indépendants.
Exercice 5 :
Répartition de 1500 ouvriers selon le nombre de pièces habitées (X) et le nombre d'enfants à
charge (Y).
X/Y 0 1 2 3 ni .
1 90 n12 90 45 225+ n12
2 150 375 n23 75 600+ n23
3 60 150 60 30 300
n. j 300 525+ n12 150+ n23 150 1500

1. Détermination des valeurs de n₁₂ et n₂₃ si chaque ouvrier a, en moyenne, (1,2) enfants :

Y=
∑ n . j y j =1 , 2
n ..
0 ×300+ 1× 525+1× n12+ 300+2 n23+ 450
Y= =1 , 2
1500
1275+n 12+2 n23
Y= =1 ,2
1500
1275+n 12+2 n23=1800
n12 +2 n23=1800−1275
n12 +2 n23=525(1)

Or, on sait que :

ni . =225+n 12+600+ n23+ 300=1500

n12 +n23 +1125=1500

n12 +n23=375 (2)

On déduit des équations (1) et (2) :

n12=225
n23=150

Donc :

X/Y 0 1 2 3 ni .
1 90 225 90 45 450
2 150 375 150 75 750
3 60 150 60 30 300
n. j 300 750 300 150 1500

2. Recalcul des valeurs de n₁₂ et n₂₃ en supposant l'indépendance statistique entre X et Y.

Recalcul de n23 :

f 24=f 2. × f .4

n24 n2. n .4
= ×
n .. n.. n..

n2. × n.4
n24 =
n..

En remplaçant n2. par son expression (600+ n23) et n.4 par sa valeur (150) et n24 par sa valeur (75)
dans le tableau de contingence, on obtient une équation de premier degré à résoudre dont
l’inconnue est n23 .

( 600+n23 ) ×150
=75
1500

Après résolution de cette équation, on retrouve que n23=¿150

Recalcul de n12 :

f 11=f 1. × f .1

n11 n1. n.1 n1. ×n.1


= × n11 =
n.. n.. n.. n..

En remplaçant n1. par son expression (225+ n12) et n.1 par sa valeur (300) et n11par sa valeur (90)
dans le tableau de contingence, on obtient une équation de premier degré à résoudre dont
l’inconnue est n12.
( 225+n12 ) ×300
=90
1500

Après résolution de cette équation, on retrouve que n12=¿ 225

3. Calcul du nombre moyen de pièces habitées.

Pour se faire, on présente d’abord la distribution marginale de X= nombre de pièces habitées.

X ni . f i. xi × f i .
1 450 0,3 0,3
2 750 0,5 1,0
3 0, 0,6
300
2
Tota 1 1,9
1500
l
Le nombre moyen de pièces habitées serait alors :

X =∑ x i f i .=¿ 1,9
i

4. Calcul du nombre moyen d'enfants pour les ouvriers habitant 1 pièce, 2 pièces.

Il s’agit des distributions conditionnelles de Y/X=x1=1 pièce et de Y/X=x2=2 pièces.

Pour cela, om prend n12=225 et n23=150

Y/X=x1=1 n j/ i=1 f j /i=1 y j × f j/ i=1


0 90 0,2 0
1 225 0,5 0,5
2 90 0,2 0,4
3 45 0,1 0,3
Total 450 1 1,2

Y/X=x2=2 n j/ i=2 f j /i=2 y j × f j/ i=2


0 150 0,2 0
1 375 0,5 0,5
2 150 0,2 0,4
3 75 0,1 0,3
Total 750 1 1,2
Les moyennes conditionnelles sont donc données par les formules suivantes :
l l
1
Y i= ∑ n y =∑ f y
ni . j=1 ij j j=1 j/ i j
Soit :
l l
1
Y 1= ∑ n y =∑ f y =¿ 1,2
n1. j =1 1 j j j=1 j /i=1 j

l l
1
Y 2= ∑ n y =∑ f y =¿ 1,2
n2. j=1 2 j j j=1 j /i=2 j

De même, on calcule Y 3:
l l
1
Y 3= ∑ n y =∑ f y =¿ 1,2
n3. j=1 3 j j j=1 j /i=3 j

On a donc à partir des questions 1 et 5, que Y =Y 1=Y 2=Y 3=¿ 1,2.

5. On s’intéresse aux ouvriers ayant des enfants. On aura le tableau de contingence


suivant :

X/Y 1 2 3 ni .
1 225 90 45 360
2 375 150 75 600
3 150 60 30 240
n. j 750 300 150 1200

(a) Calcul du nombre moyen d'enfants :

Y=
∑ n . j y j = 1 ×750+2 ×300+3 × 150 = 1800 =1 , 5
n .. 1200 1200

(b) Calcul du nombre moyen de pièces habitées.

X=
∑ ni . y j = 1× 360+2 ×600+3 × 240 = 2280 =1 , 9
n.. 1200 1200

En s’intéressant aux ouvriers ayant des enfants uniquement, le nombre moyen de pièces habitées
reste toujours le même.

Exercice 6 :
Le tableau ci-après donne la répartition (en pourcentage) d'une population de salariés selon le
revenu annuel X (en 1000dhs) et l’âge Y (en années).
Tableau de contingence des effectifs :
ni . =∑ n ij ; n. j=∑ nij
j i
X\Y [20, 30[ [30, 40[ [40, 50[ [50, 65[ ni.
[10, 15[ 1 3 4 3 11
[15, 20[ 3 4 9 3 19
[20, 25[ 2 9 12 4 27
[25, 30[ 2 8 10 6 26
[30, 40[ 2 6 7 2 17
n.j 10 30 42 18 100

Tableau de contingence des fréquences :


n ij ni . n. j
f ij = ; f i .= =∑ f ij ; f . j= =∑ f ij
n.. n.. j n.. i

X\Y [20, 30[ [30, 40[ [40, 50[ [50, 65[ fi.
[10, 15[ 0,01 0,03 0,04 0,03 0,11
[15, 20[ 0,03 0,04 0,09 0,03 0,19
[20, 25[ 0,02 0,09 0,12 0,04 0,27
[25, 30[ 0,02 0,08 0,1 0,06 0,26
[30, 40[ 0,02 0,06 0,07 0,02 0,17
f.j 0,1 0,3 0,42 0,18 1

1) Distribution marginale des effectifs et des fréquences de X :


X Effectifs Fréquences
[10, 15[ 11 0,11
[15, 20[ 19 0,19
[20, 25[ 27 0,27
[25, 30[ 26 0,26
[30, 40[ 17 0,17
Total 100 1

Distribution marginale des effectifs et des fréquences de Y :


Y Effectifs Fréquences
[20, 30[ 10 0,1
[30, 40[ 30 0,3
[40, 50[ 42 0,42
[50, 65[ 18 0,18
Total 100 1
2) Distribution conditionnelle (en effectifs et en fréquences) de X sachant Y=y3 ie Y ∈ [40, 50[ :
n13 4
f i=1/ j=3= = =0 , 09 ;
n.3 42
n23 9
f i=2/ j=3= = =0 , 21;
n.3 42
n33 12
f i=3/ j=3= = =0 , 29 ;
n.3 42
n43 10
f i=4 / j=3= = =0 , 24;
n.3 42
n53 7
f i=5/ j=3= = =0 , 17.
n.3 42

X/Y= y3 Effectifs Fréquences


[10, 15[ 4 0,09
[15, 20[ 9 0,21
[20, 25[ 12 0,29
[25, 30[ 10 0,24
[30, 40[ 7 0,17
Total 42 1

3) Distribution conditionnelle (en effectifs et en fréquences) de Y sachant X=x5 ie Y ∈ [30, 40[ :


n51 2 n52 6
f j=1 /i=5= = =0 ,12 ; f j=2 /i=5= = =0 ,35 ;
n5. 17 n5. 17
n53 7
f j=3 /i=5= = =0 , 41.
n 5. 17
n54 2
f j=3 /i=5= = =0 , 12.
n5. 17

Y/X= x5 Effectifs Fréquences


[20, 30[ 2 0,12
[30, 40[ 6 0,35
[40, 50[ 7 0,41
[50, 65[ 2 0,12
Total 17 1

4) On a indépendance entre X et Y si :

Ici, on a n32 = 9, n3. = 27, n.2 = 30, n.. = 100,


n3. n.2 27 X 30
= =8 , 1 , alors que n32 = 9. Donc X et Y ne sont pas indépendantes.
n.. 100

5) Calcul de la cov (X, Y) :


X\Y 25 35 45 57,5 ni . ni . x i
2
ni . x i ∑ nij y j ∑ nij y j x i
12,5 1 3 4 3 11 137,5 1718,75 482,5 6031,25
17,5 3 4 9 3 19 332,5 5818,75 792,5 13868,75
22,5 2 9 12 4 27 607,5 13668,75 1135 25537,5
27,5 2 8 10 6 26 715 19662,5 1125 30937,5
35 2 6 7 2 17 595 20825 690 24150
n. j 10 30 42 18 100 2387,5 61693,75 4225 100525
n. j y j 250 1050 1890 1035 4225
2
n. j y j 6250 36750 85050 59512,5 187562,5

∑ nij x i 235 740 997,5 415 2387,5


44887,
∑ nij x i y j5875 25900
5
23862,5 100525

1
cov ( x , y ) = ∑ nij x i y j- x y = 100525 −23,875 ×42 , 25=−3 , 47
n .. i , j 100
Les deux variables sont dépendantes et varient dans le sens inverse.

Calcul de cor(X,Y) :
cov ( x , y ) −3 , 47
cor ( x , y )= = =−0,053
σx σy 6 , 85 × 9 ,52
Car :

V ( x )=
∑ 2
ni . x i 2
−x =
61693 , 75 2
−( 23,875 ) =46 , 9
n.. 100

V ( y )=
∑ n. j y j − y 2= 187562 , 5 −( 42 , 25 )2=90 ,6
2

n.. 100
Donc la corrélation linéaire est faible.

Exercice 7 :
On donne la répartition (en fréquences relatives) des employés selon leur salaire mensuel (X)
exprimé en centaines de dirhams et leur ancienneté (Y) exprimée en années.

[17, fi.
X/Y [0, 5[ [5, 17[ [33, 40[
33[
[15, 25[ f11 0,15 0 0 f11+0,15
[25, 65[ f21 0,05 0,02 0,05 f21+0,12
[65, 95[ 0,05 0,04 0,09 0,1 0,28
[95, 205[ 0 0 0,07 0,1 0,17
f.j f11+ f21+0,05 0,24 0,18 0,25 1

1. La population étudiée correspond aux employés, l'unité statistique étant l’employé, les
caractères étudiés sont respectivement le salaire mensuel et l’ancienneté. Ils sont tous les
deux quantitatifs continus.
2. Détermination de f₁₁ et f₂₁ si la moitié des employés touche moins de 5500 dirhams.
On considère la distribution marginale de X :

X Fréq Fréq cum


[15, 25[ f11+0,15 f11+0,15
[25, 65[ f21+0,12 f11+ f21+0,27
[65, 95[ 0,28 f11+ f21+0,55
[95, 205[ 0,17 1
Total 1
On sait que :

[ 0 , 5−f a ]
M e =x a +(x b −x a)
[ f b−f a ]
Comme la médiane est égale à 5500, xa=2500 et xb=6500
De plus fa= f11+0,15 et fb= f11+ f21+0,27
En remplaçant dans la formule, on obtient :

[ 0 , 5−f 11−0 ,15 ]


5500=2500+(6500−2500)
[ f 11+ f 21+0 , 27−f 11−0 ,15 ]
Après résolution de l’équation, on trouve que :
4f11 + 3f21 = 1,04

De plus, on a selon la distribution marginale de X :


f11 + f21 = 0,28
La résolution de ce système d’équation donne :
f11 = 0,20 et f21 = 0,08
Le tableau de contingence est donc :

[17, fi.
X/Y [0, 5[ [5, 17[ [33, 40[
33[
[15, 25[ 0,20 0,15 0 0 0,35
[25, 65[ 0,08 0,05 0,02 0,05 0,20
[65, 95[ 0,05 0,04 0,09 0,1 0,28
[95, 0,17
0 0 0,07 0,1
205[
f.j 0,33 0,24 0,18 0,25 1
3. Calcul du pourcentage d'employés qui gagnent moins de 6500 dirhams parmi les
employés ayant moins de 17 ans d’ancienneté :
Il s’agit de la distribution conditionnelle de X/Y∈ [0, 17[

X/Y∈ [0, 17[ Fréq


[15, 25[ 0,35
[25, 65[ 0,13
[65, 95[ 0,09
[95, 205[ 0
Total 0,57

Les fréquences montrent que 48% d'employés gagnent moins de 6500 dirhams parmi
l’ensemble des employés et que 84% gagnent moins de 6500 dirhams parmi les employés
ayant moins de 17 ans d’ancienneté.
4. Calcul de la moyenne et de l‘écart-type du salaire des employés.
On considère la distribution marginale de X. On sait que :
k
x=∑ f i . x i
i=1

k
V ( x )=∑ f i . x2i −x2
i=1
Le tableau suivant permet de calculer les moyennes et les variances marginales de X :

X xi f i. f i . xi f i . x2i
[15, 25[ 20 0,35 7 140
[25, 65[ 45 0,20 9 405
[65, 95[ 80 0,28 22,4 1792
[95, 150 0,17
25,5 3825
205[
Total 1,00 63,9 6162

Alors :
X =63 , 9
V ( X )=6162−4083 ,21=2078 ,79
σ x =45 ,6
Le salaire moyen des employés, indépendamment de leur ancienneté est de 6390 dirhams. L’écart
type étant de 45,6 dirhams. Le coefficient de variation qui est égale à 0,71 indique une
hétérogénéité dans la distribution des salaires des employés.
5. Calcul de la moyenne conditionnelle de Y sachant X = x3 ie Y/X ∈ [65, 95[ ainsi que
l’écart-type correspondant.

Y/X∈ [65, yj f j /i=3 f j /i=3 y j f j /i=3 y 2j


95[
[0, 5[ 2,5 0,18 0,45 1,12
[5, 17[ 11 0,14 1,57 17,29
[17, 33[ 25 0,32 8,04 200,89
[33, 40[ 36,5 0,36 13,04 475,80
Total 1,00 23,10 695,10

Avec :
f3j
f j /i=3=
f 3.
Alors :
Y 3=23 ,1
V 3 ( Y )=695 , 1−¿ 533,6
¿ 161 ,5

σ 3 (X )=12 ,7

L’ancienneté moyenne chez les employés qui touchent un salaire compris entre 6500 et 9500
dirhams est de près de 23 ans. L’écart type étant de 12,7 dirhams. Le coefficient de variation qui est
égale à 0,55 indique l’existence d’une dispersion dans la distribution de l’ancienneté des employés.

6. En s'intéressant aux employés dont l'ancienneté dépasse 36 ans et demi, le pourcentage


des retraités est donné par (1-p) dans la méthode d’interpolation linéaire :

Y f.j F.j
[0, 5[ 0,33 0,33
[5, 17[ 0,24 0,57
[17, 33[ 0,18 0,75
[33, 1
0,25
40[
36 ,5−33 p−0 , 75 Total 1
=
40−33 1−0 , 75

Après résolution de l’équation, on trouve que p=0,875. Donc, le pourcentage des retraités est de
12,5%.

Toutefois, ce pourcentage peut être retrouvé directement en remarquant que 36 ans et demi
(36,5) est le centre de la dernière classe. Il suffit simplement d’enlever la moitié de la proportion
correspondante à la dernière classe [33, 40[ : 0,25, soit 0,125 (12,5%).
7. En remplaçant ces retraités par une jeune équipe, la distribution marginale de Y est
donnée par la tableau suivant :

Fréquence après
Y
rajeunissement
[0, 5[ 0,33+0,125=0,455
[5, 17[ 0,240
[17, 33[ 0,180
[33, 36,5[ 0,25-0,125=0,125
Total 1,000

(a) L‘étendue est donc 36,5.

(b) L’ancienneté moyenne


Y yj f.j f.jyj
[0, 5[ 2,5 0,455 1,14
[5, 17[ 11 0,240 2,64
[17, 33[ 25 0,180 4,50
[33, 34,75 0,125
4,34
36,5[
Total 1,000 12,62

Alors :
Y =12 , 6 ans

Vous aimerez peut-être aussi