Vous êtes sur la page 1sur 13

USTHB/Faculté des Mathématiques 2022/2023

2ème Année GP
Série d’exercice 2 : Statistique double
Exercice 1 :
Le tableau suivant indique la répartition de 100 logements d’une cité, en fonction de l
nombre Y de pièces principales et leur surface X exprimée en m2.
1 2 3 4 5 .
X
40 8
50 6 2
60 4 8 5
70 4 6 2
80 12 4 6
90 5 10
100 10 8
.

1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure


à 70 m2 .
2. Quel est le pourcentage de logements de superficie ≤ 80 m2 ?
3. Etablir la distribution des marginales X et Y.
4. Calculer la surface moyenne de l’ensemble des logements.

et
5. Calculer et donner les significations des fréquences: conditionnelles
/ /
6. Calculer la surface moyenne des logements de 5 pièces.
Sol 1 :
1 2 3 4 5 . .
X
40 0 8 0 0 0 8 0,08
50 0 6 2 0 0 8 0,08
60 0 4 8 5 0 17 0,17
70 0 0 4 6 2 12 0,12
80 0 0 12 4 6 22 0,22
90 0 0 0 5 10 15 0,15
100 0 0 0 10 8 18 0,18
. 0 18 26 30 26 100
. 0 0,18 0,26 0,30 0,26 1

1
1. Déterminer le nombre de logements de 4 pièces dont la surface est supérieure
à 70 m2 .
+
+ = logements
Le nombre de logements de 4 pièces dont la surface est supérieure à 70 m2 est :

2. Quel est le pourcentage de logements de superficie ≤ 80 m2 ?


+ + + +
%= × %= %

3. Etablir la distribution des marginales X et Y :

40 50 60 70 80 90 100 Tot
. 8 8 17 12 22 15 18 50
. 0,08 0,08 0,17 0,12 0,22 0,15 0,18 1

1 2 3 4 5 Tot
. 0 18 26 30 26 50
. 0 0,18 0,26 0,30 0,26 1

4. Calculer la surface moyenne de l’ensemble des logements :


" "

= ! =! = !

= #$ × %+$ × %+$ × %+$ × %+$ × %+$ × %


+$ × %& = , (

et
5. Calculer et donner les significations des fréquences: conditionnelles
/ /

= = = = ,
)
/ )
.

/ = = = = ,
.

6. Calculer la surface moyenne des logements de 5 pièces.

/* = ! + = #$ × %+$ × %+$ × %+$ × %&


.
= , )(

2
Exercice 2 :
Un statisticien fait une enquête sur 100 cadres d’une entreprise et cherche à établir
le lien pouvant exister entre l’âge des cadres et le salaire mensuel perçu. Il présente
ses résultats dans un tableau de contingence, la variable statistique X représente
l’âge tandis que la variable Y représente le salaire en milliers de dinars.
Y
[22-26[ [26-30[ [30-34[ [34-38[ [38-42[ ni .
X
[30-36[ 3 4 10 1 0
[36-42[ 0 2 0 9 0
[42-48[ 6 4 2 2 2
[48-54[ 6 8 10 0 4
[54-60[ 0 8 10 4 5
n. j

1. Que représentent la colonne . et la ligne . ?


2. Donner le pourcentage des cadres dont le salaire est supérieur à 26000 DA.
3. Parmi les cadres ayant plus de 42 ans, donner le pourcentage de ceux qui
perçoivent moins de 30000 DA.

, , , et
4. Calculer et donner les significations de :
. .) / ) )/
5. Donner la distribution conditionnelle de X sachant que Y  [26-30[ et
calculer sa moyenne.
6. Donner la distribution conditionnelle de Y sachant que X 48 ,54  .
7. X et Y sont-elles indépendantes ?

Sol 2 :

[22-26[ [26-30[ [30-34[ [34-38[ [38-42[ . .


Ci X
33 [30-36[ 3 4 10 1 0 18 0,18
39 [36-42[ 0 2 0 9 0 11 0,11
45 [42-48[ 6 4 2 2 2 16 0,16
51 [48-54[ 6 8 10 0 4 28 0,28
57 [54-60[ 0 8 10 4 5 27 0,27
. 15 26 32 16 11 100
. 0,15 0,26 0,32 0,16 0,11 1

1. Que représentent la colonne . et la ligne . ?


La colonne . représente l’âge tandis des cadres d’une entreprise
La ligne . représente le salaire des cadres en milliers de dinars
2. Donner le pourcentage des cadres dont le salaire est supérieur à 26000 DA.
%=$ , + ,) + , + , %× = %
ou %=$ + , %× = %

3
3. Parmi les cadres ayant plus de 42 ans, donner le pourcentage de ceux qui
perçoivent moins de 30000 DA

+ + + +
%= × %=) %

, , , et
4. Calculer et donner les significations de :
. .) / ) )/

= = = ,
.
.
,
) % des cadres ont l'âge entre 48 et 54

= = = ,
,
% des cadres ont l'âge entre 36 et 42 et salaire entre 34000 et 38000 DA
)
= = = ,)
.)
.)
,
) % des cadres ont le salaire entre 30000 et 34000 DA

= = = ,
)
/ )
).
Parmi les cadres l'âge entre 42 et 48, il ya % ont le salaire entre 30000 et
34000 DA

= = = ,
)
)/
.
% des cadres ont l'âge entre 42 et 48 sachant que leur salaire est compris
entre 26000 et 30000 DA
5. Donner la distribution conditionnelle de X sachant que Y  [26-30[ et
calculer sa moyenne:

/* * [30-36[ [36-42[ [42-48[ [48-54[ [54-60[ Tot


4 2 4 8 8 26

= , = , 0,15 0,3 0,3 1

/* * = ∑ . = #$ × ))% + $ × ) % + $ × %+$ × %+$ × %& =


.
, ) / 0 (. sont les centres de classes)

L'âge moyen des cadres sachant que leur salaire entre 26000 et 30000
DA est 48 ans

6. Donner la distribution conditionnelle de Y sachant que X 48 ,54 

/+ + [22-26[ [26-30[ [30-34[ [34-38[ [38-42[ Tot


6 8 10 0 4 28

4
= , = , 0,35 0 0,14 1

/+ + = ! . .′ = #$ × %+$ × %+$ ×) %+$ × %&


.
=) , 23443567 85 839:67

Le salaire moyen des cadres sachant que leurs âge entre 48 et 54 ans est 30 en
milliers de dinars

7. X et Y sont-elles indépendantes ?

= = . = = , . = = ,

. × . = , × , = , ≠

Alors X et Y ne sont pas indépendants.

Exercice 3 :
A la fin de l’année universitaire, on a noté la moyenne générale X obtenue et le
nombre de module acquis sur les 9 modules de l’année Y de 20 étudiants non
admis. on a obtenu les résultats suivants

Valeurs de X 1 4 6 5 8.5 4.5 8 8.5 5.5 3 8.5 6 8.5 7 9 5.5 9 8 9 6


Valeurs de Y 0 1 3 2 4 1 3 4 2 0 1 2 3 2 4 1 3 2 4 3

1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y.
2- Répartir le caractère X en classes de même amplitude.
3- Compléter le tableau de contingence suivant:
Y ni .
X
[ , [
[ , [
[ , [
[ , [
n. j

4- Les caractères X et Y sont-ils indépendants?


5- Calculer la covariance entre X et Y.
6- Calculer le coefficient de corrélation linéaire. Que peut- on conclure ?
7- Donner l’équation des deux droites de régression. Tracer les deux droites dans
un repère orthonormé. Que peut-conclure ?

5
8- Comment peut- on prévoir la moyenne générale d’un étudiant qui a 5 modules
acquis?

Sol 3:
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y :

2- Répartir le caractère X en classes de même amplitude :

− − − − −
<(= = = = = = = =
(/+ ( (/+ ( (/+ (
? √, √, √ √

3- Compléter le tableau de contingence suivant

0 1 2 3 4
Ci X
2 [1-3[ 1 0 0 0 0 1 0,05
4 [3-5[ 1 2 0 0 0 3 0,15
6 [5-7[ 0 1 3 2 0 6 0,30
8 [7-9[ 0 1 2 3 4 10 0,50
2 4 5 5 4 20
0,1 0,2 0,25 0,25 0,2 1
4- Les caractères X et Y sont-ils indépendants?

= = = = = , = = = ,
, ,

$ × = , × , = , %≠$ = %

X et Y ne sont pas indépendants.

6
5- Calculer la covariance entre X et Y.

" ?

ABC = D ! ! E * F−

(les E sont les centres des classes du caractère X)


Première formule pour la covariance

= ! .E = #$ × % + $) × % + $ × % + $ × %& = ,

= ! . * = #$ × % + $ × % + $ × % + $ × )% + $ × %& = ,

AGH = I #$ × × %+$ × × % + $) × × %+$ × × )% + $ × × %+$ × × % + $) ×

+$ × × %&J − , × ,

=I #) &J − , × , = ,) − , = ,

ABC = EKL$ , % = ,

6- Calculer le coefficient de corrélation linéaire. Que peut- on conclure ?

EKL$ , %
M =
N N

O/P$ % = ! .E −

= #$ × % + $) × %+$ × %+$ × %& − ,

= # &− , = ),

N = QO/P$ % = Q), = ,

O/P$ % = ! . * −

= #$ × %+$ × %+$ × %+$ ×) %+$ × %& − ,

= # &− , = , − , = ,
N = QO/P$ % = Q , = ,
EKL$ , % ,
M = = = 0,73
N N , × ,

7
La corrélatoinM est forte $|P| V 0.7% , les deux droites de régression sont très
proches et le nuage peut etre approximé par une droite ( ajustement linéaire ).

7- Donner l’équation des deux droites de régression. Tracer les deux droites dans
un repère orthonormé. Que peut-conclure ?

 La droite d'équation W = X Y + Z est appelée droite de régression de Y en


X , obtenue par la méthode des moindre carrés :

EKL $ , % EKL $ , %
$[ % *= + + $* − +%
/
N + N +

EKL $ , % EKL $ , %
$[ % += * + $+ − *%
/
N * N *

EKL $ , % EKL $ , % , ,
$[ % *= + + \* − +] = ++^ , − , _
/
O/P$ % O/P$ % ), ),
= , +− ,

$[ / % *= , +− ,

EKL $ , % EKL $ , % , ,
$[ % += * + \+ − *] = *+^ , − , _
/
O/P$ % O/P$ % , ,
= , )*+ ,
$[ / % += , )*+ ,

Le point d'intersection est le centre de gravité du nuage

8- Comment peut- on prévoir la moyenne générale d’un étudiant qui a 5 modules


acquis?

8
Pour prévoir la moyenne générale , il suffit de remplacer y=5 dans

$[ / % + = , ) * + , = , )$ %+ , = ,)
l'équation de la droite X en Y

Exercice 4 :
Une entreprise qui organise des stages de formation de secrétaires portant sur le
traitement de texte, cherche à évaluer l’efficacité de ce stage. Ce stage est de durée
de 15 jours.
Une enquête statistique incluant plusieurs promotions de stagiaires, a permis
d’obtenir le tableau suivant :
Numéro du jour du stage X 5 6 8 10 11 12 13 15
Nombre d’erreurs de saisie 42 44 30 35 28 27 22 20
par page Y
8 8 8 8 8
2
On donne :  x i  80 ,  yi  248 ,  xi2  884 ,
i 1 i 1 i 1
 yi  8222 ,  x i yi  2282
i 1 i 1

1- Calculer le coefficient de corrélation linéaire, commenter.


2- Déterminer la droite de régression de Y et X.
3- Si la durée du stage est prolongée de deux jours, quel serait le nombre
d’erreurs de saisie par page au 17ème jour.

Exercice 5:

Un constructeur d’automobiles veut étudier le lien qui peut exister entre la


consommation d’une voiture (Y) en fonction de sa vitesse (X). Les 14 mesures sont
données dans le tableau suivant :
X(km/h) 50 60 70 80 85 90 95 100 105 110 115 120 130 140
Y(L/100 km) 4 4,5 5 4 4,5 5 5,5 6 6 8 9 10 10 12
1. Représenter graphiquement la série (X,Y). Que peut-on dire de la liaison entr
X et Y.
2. On pose Z  ln Y ( ln désigne le logarithme Népérien).
On donne :
14 14 14 14
2
14
 x i  1350 ,  zi  25.65 ,  xi2  139000 ,  zi  48.81  x i zi  2590.03
i 1 i 1 i 1 i 1 i 1

Déterminer le coefficient de corrélation linéaire entre Z et X. interprétez.


3. Déterminer la droite de régression de Z en X.
4. Peut-on estimer la consommation du véhicule, s’il roule à 150 km/h ?
5. En choisissant 3 classes pour X et 2 classes pour Y de même amplitude pour les
2 variables:
a. Donner le tableau de contingence correspondant aux données initiales.
b. Les variables X et Y sont elles dépendantes ?
c. Calculer les moyennes et les variances marginales X , Y , V  X  et V Y .

9
d. Calculer la covariance entre X et Y, déduire le coefficient de corrélation
linéaire. commentez.
e. Estimer la consommation d’un véhicule qui roule à 150 km/h ?
6. Quelle est la meilleure prédiction entre les deux estimations calculées.

Sol 5 :
1- Représenter graphiquement la série (X,Y). Que peut-on dire sur la liaison entre
X et Y :
Y(L/100 km)

14

12

10
Y
8
Linear (Y)
6

0 X(km/h)
0 50 100 150

X et Y n'ont pas une liaison linéaire.

EKL$ , `%
2- Déterminer le coefficient de corrélation linéaire entre Z et X :
M`=
N N`

ABC = a ! + b c − $ `%
Deuxième formule pour la covariance

= !+ = # ) &= ,
,

`= !b = # , & = ,)
,

O/P$ % = !+ − = # ) &− , = # &− , = ) ,

N = QO/P$ % = Q ) , = , )

O/P$b% = !b − ` = # , &− ,) = , )

Nb = QO/P$b% = Q , ) = , )

10
ABd = a ! + b c − $ è % = ×$ , )% − , × ,) = ,
=
EKL$ , `% ,
M = = = ,
`
N N` , ) × ,)

 La corrélatoin est très forte $ , ≤ P V 1% , l’ajustement linéaire est


accepter
3- Déterminer la droite de régression de Z en X ?

 La droite d'équation h = X Y + Z est appelée droite de régression de Z en


X , obtenue par la méthode des moindre carrés :

EKL $ , % EKL $ , %
$[` / % b= + + $` − %
N N

EKL $ , `% EKL $ , `%
$[b / % b= + + \` − +]
O/P$ % O/P$ %
, ,
= ++^ , )− × , _= , ++ ,
) , ) ,

$[` / % b= , ++ ,

= i` = i , +j , (Ecrire Y en fonction de Z et remplacer dans


l’équatioin pour obtenir l’estimation)
l(
"KkP + = ⟹ =i , × j ,
= ), o/ ?(
m
Partie 2 :

− − −
<(=+ = = = =)
(/+ ( (/+ (
? √, )
(/+ − (/+ − −
<(=* = = = =
( (
? √,

a) Compléter le tableau de contingence suivant


c’j 6 10

[4-8[ [8-12[
ci X
2 [1-3[ 3 0 3 0,21
4 [3-5[ 6 0 6 0,43
6 [5-7[ 0 5 5 0,36

11
9 5 N=14
0,64 0,36 1

b) Les caractères X et Y sont-ils indépendants?

)
= = = = = , = = = ,)
, ,

$ × = , × ,) = , ) %≠$ = %

X et Y ne sont pas indépendants.

c) Calculer les moyennes et les variances marginales.

= ! .E = #$ × %+$ × %+$ × %& = ,

= ! . E′ = ,

) )

O/P $ % = ! . $+ − +% = p ! .E q− = ) ), − , = ,

N = ,

O/P $*% = ! . $* − *% = p ! r . E′ sq − = ),

N = ,
d)
)

N = EKL$ , % = t !! E E′ u − ee
= =

=I #$) × × %+$ × × %+$ × × %&J − , × , =) ,

EKL$ , % ) ,
M = = = , ≥ ,
`
N N , × ,

On a une forte corrélatoin alors l'ajustement linéaire est accepté.


e)

12
EKL $ , % EKL $ , %
$[ % = ++\ − +]
/
O/P$ % O/P$ %
) , ) ,
= ++^ , − × , _= , ++ ,
, ,
$[ / % = , ++ ,

l(
"KkP + = ⟹ = , . + , = , o/ ?(
m
La meilleure estimation est = ), o/ ?( car elle est calculée dans le cas
discret.

13

Vous aimerez peut-être aussi