Vous êtes sur la page 1sur 85

S

t
a
STATISTIQUE DESCRIPTIVE

A
i
m
é

D
I
U
M
I
yyyy

AVANT PROPOS
Wissen Corporation
C’est un groupe formé essentiellement de meilleurs étudiants de nos
groupes d’étude et d’encadrement qui se sont fixés plusieurs objectifs dont le
premier est celui du partage de la connaissance en Informatique et en
mathématiques. Ainsi, pour atteindre notre premier objectif, nous
organisons des formations essentiellement gratuites pour partager le peu
que nous connaissons avec les autres. Car la connaissance, c’est comme un
chandelier, sa lumière ne diminue pas s‘il allume un autre chandelier.
Pour faire partie de Wissen, l’étudiant doit démontrer son savoir-faire
et son amour pour la connaissance pendant les cours d’encadrement etc…
Pour les externes désirant intégrer Wissen, ils doivent passer pas un test,
car ne suivant pas régulièrement les cours avec nous, c’est le seul moyen
d’apprécier leur savoir-faire et leur amour pour la connaissance.
Le cerveau est bien une richesse que nous avons tous en commun,
mais c’est son utilisation qui distingue les hommes …Parfois, il n’existe pas
de gens plus intelligents que les autres, mais c’est le travail qui nous
différencie. Pour bâtir haut, il faut creuser profond et tu seras fort dans ce
que tu te donnes.
Il y a une naissance en toute connaissance, Thucydide a dit : « Avoir
des connaissances sans les partager, c’est se mettre au niveau de celui qui
n’a pas d’idées ». Wissen Corporation est là pour assurer votre formation,
votre encadrement suivant vos désirs.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 1


INTRODUCTION
Ce livre vous présente plus de 60 exercices dont plus de 40
résolus. Les questions sont essentiellement des interrogations,
examens et tps des années antérieures.
L’objectif poursuivi n’est pas de rendre l’étudiant faible ou
paresseux mais plutôt de mettre à sa disposition un outil d’aide
pour la préparation des évaluations et la bonne compréhension
du cours. C’est pourquoi à la fin de chaque chapitre, nous
proposons une série d’exercices d’auto-évaluation. La meilleure
méthode serait de faire un effort de comprendre la logique utilisée
pour la résolution de chaque problème et cela peut vous aider
devant des cas similaires et il est conseillé de ne pas bloquer les
résolutions ou utiliser ce recueil pendant les évaluations.
Il y a une naissance en toute connaissance, Thucydide a dit
: « Avoir des connaissances sans les partager, c’est se mettre au
niveau de celui qui n’a pas d’idées ». L’objectif que je poursuis
n’est pas de se prévaloir supérieur à vous qui me lisez, mais de
partager le peu que je connais à ceux qui veulent. Si vous lisez ce
livre pour chercher de failles, vous les trouverez certainement
mais si vous le lisez pour apprendre, vous apprendrez surement :
Vous trouverez ce que vous cherchez. Je ne suis en compétition
avec personne.
L’œuvre humaine n’est jamais parfaite et celle-ci ne fait pas
exception, ainsi vos remarques et suggestions seront les
bienvenues et m’aideront à améliorer les éditions futures.
Bonne lecture

L’auteur

+243 81 083 46 16

Statistique descriptive, exercices résolus Wissen corporation 2


CHAPITRE 1 FONDEMENTS DE LA STATISTIQUE
EXERCICE 1
Un étudiant fait une étude sur l’utilisation et la pratique de l’Internet en
milieu estudiantin à Kinshasa, ainsi, il désire consister un échantillon
représentatif constitué de 100 étudiants. Le tableau suivant donne l’effectif
d’étudiants par universités et instituts.
Université/Institut supérieur Effectif
Unikin 20000
Isc 9600
Ista 7000
Upn 6200
Facultés protestantes 3500
Autres 8900

Comment va-t-il constituer son échantillon représentatif ?


Résolution
Il doit utiliser la méthode de Stratification car la population est hétérogène
Commençons par calculer le nombre d’étudiants à tirer dans chaque
université (Strate).
𝑁𝑖
𝑛𝑖 = ×𝑛
𝑁

𝑛 = 100
𝑁 = 20000 + 9600 + 7000 + 6200 + 3500 + 8900 = 55200
Pour l’Unikin Pour l’Upn
20000 6200
𝑛1 = 55200 × 100 = 36,23 ≅ 36 𝑛4 = 55200 × 100 = 11,23 ≅ 11

Pour Isc Pour Facultés protestantes


9600 3500
𝑛2 = × 100 = 17,39 ≅ 17 𝑛5 = × 100 = 6,34 ≅ 6
55200 55200

Pour l’Ista Pour les autres


7000 8900
𝑛3 = 55200 × 100 = 12,68 ≅ 13 𝑛6 = 55200 × 100 = 16,12 ≅ 16

Il faut que 𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 + 𝑛6 = 𝑛
36+17+13+11+6+16=99≠ 100
Comme il manque une unité, on doit ajouter cela dans une Strate au choix,
j’ajoute ça dans Isc, donc dans l’Isc on va tirer 18 étudiants.
Comme nous savons le nombre d’étudiants à tirer dans chaque Strate, on
peut utiliser la méthode Systématique pour le tirage.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 3


Tirage pour l’UNIKIN
𝑁
𝑟= 𝑛
20000
= 36

𝑟 = 555,56 ≅ 556
Choix de base : 1 ≤ 𝑏 ≤ 𝑟 ⇔ 1 ≤ 𝑏 ≤ 556. On est libre de choisir un nombre
compris entre 1 et 556 comme base.
Nous choisissons 𝑏 = 10. Donc les étudiants sélectionnés à l’Unikin sont
ceux ayant les numéros suivants :
10, 566, 1122, 1678, 2234, 2790, 3346, 3902, 4458, 5014, 5570, 6126,
6682, 7238, 7794, 8350, 8906, 9462, 10018, 10574, 11130, 11686, 12242,
12798, 13354, 13910,14466, 15022, 15578, 16134, 16690, 17246, 17802,
18358, 18914, 19470.
Tirage pour l’Isc
𝑁
𝑟= 𝑛
9600
= 18

𝑟 = 533,33 ≅ 533
Choix de base : 1 ≤ 𝑏 ≤ 𝑟 ⇔ 1 ≤ 𝑏 ≤ 533.
Nous choisissons 𝑏 = 500. Donc les étudiants sélectionnés à l’Isc sont ceux
ayant les numéros suivants :
500, 1033, 1566, 2099, 2632, 3165, 3698, 4231, 4764, 5297, 5830, 6363,
6896, 7429, 7962, 8495, 9028, 9561.
Tirage pour l’Ista
𝑁
𝑟= 𝑛
7000
= 13

𝑟 = 538, 46 ≅ 538
Choix de base : 1 ≤ 𝑏 ≤ 𝑟 ⇔ 1 ≤ 𝑏 ≤ 538.
Nous choisissons 𝑏 = 100. Donc les étudiants sélectionnés à l’Isc sont ceux
ayant les numéros suivants :
100, 638, 1176, 1714, 2252, 2790, 3328, 3866, 4404, 4942, 5480, 6018,
6556.
La suite est réservée au lecteur.

Statistique descriptive, exercices résolus Wissen corporation 4


EXERCICE 2

L’administration publique d’un pays africain veut informatiser ses services,


un lot de 1.000 ordinateurs de mêmes performances est commandé aux
usines IBM. Afin de tester le bon fonctionnement des ordinateurs, l’agent
gouvernemental envoyé aux usines IBM propose de tirer un échantillon
représentatif constitué de 30 ordinateurs. Comment va-t-il procéder ?
(TP 2019-2020)
Résolution
La population est homogène, nous allons utiliser la méthode systématique.
𝑁 = 1000; 𝑛 = 30
𝑁 1000
𝑟= = = 33,33 ≅ 33
𝑛 30

Choix de la base
1 ≤ 𝑏𝑎𝑠𝑒 ≤ 𝑟 ⇔ 1 ≤ 𝑏𝑎𝑠𝑒 ≤ 33
On choisit la base=5
Donc les ordinateurs qui feront partie de l’échantillon sont ceux ayant les
numéros suivant :
5, 38, 71, 104, 137, 170, 203, 236, 269, 302, 335, 368, 401, 434, 467, 500,
533, 566, 599, 632, 665, 698, 731, 764, 797, 830, 863, 896, 929 et 962.

EXERCICE 3
Considérer une population hétérogène de N=2500 individus et décomposable
en 5 States 𝐶1 , 𝐶2, , … , 𝐶5 respectivement de 𝑁1 = 600, 𝑁2 = 450, 𝑁3 = 900, 𝑁4 =
170 et 𝑁5 = 380 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠. On souhaite en extraire un échantillon
représentatif de taille n=250 individus. Comment procéder ?
Résolution
Nous allons utiliser la méthode de stratification.
Calculons d’abord le nombre d’individus à tirer dans chaque strate.
𝑁𝑖
𝑛𝑖 = ×𝑛
𝑁

N=2500
n=250
600
𝑛1 = 2500 × 250 = 60 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠
450
𝑛2 = × 250 = 45 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠
2500

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 5


900
𝑛3 = 2500 × 250 = 90 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠
170
𝑛4 = 2500 × 250 = 17𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠
380
𝑛5 = 2500 × 250 = 38 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠

𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 = 250
Maintenant, on peut procéder au tirage dans chaque Strate
Tirage au C1
On attribue des numéros aux individus
Ensuite, on calcule la raison
600
𝑟= = 10
60

Choix de la base 𝑏 ∈ [1; 𝑟]


𝑏 ∈ [1, 10]
On choisit la base= 2
Les individus de C1 qui feront partie de l’échantillon sont ceux ayant les
numéros suivants :
2, 12, 22, 32, 42, 52, 62, 72, 82, 92, 102, 112, 122, 132, 142, 152, 162,
172, 182, 192, 202, 212, 222, 232, 242, 252, 262, 272, 282, 292, 302, 312,
322, 332, 342, 352, 362, 372, 382, 392,402, 412, 422, 432, 442, 452, 462,
472, 482, 492, 502, 512, 522, 532, 542, 552, 562, 572, 582 et 592.
Tirage pour C2
On attribue des numéros aux individus de C2
Ensuite, on calcule la raison
450
𝑟= = 10
45

Choix de la base 𝑏 ∈ [1; 𝑟]


𝑏 ∈ [1, 10]
On choisit la base= 5
Les individus de C1 qui feront partie de l’échantillon sont ceux ayant les
numéros suivants :
5, 15, 25, 35, 45, 55, 65, 75, 85, 95, 105, 115, 125, 135, 145, 155, 165,
175, 185, 195, 205, 215, 225, 235, 245, 255, 265, 275, 285, 295, 305, 315,
325, 335, 345, 355, 365, 375, 385, 395,405, 415, 425, 435 et 445
Même logique pour les autres strates.

Statistique descriptive, exercices résolus Wissen corporation 6


EXERCICE 4
Un étudiant fait une étude sur l’utilisation et la pratique de l’Internet en
milieu estudiantin à Kinshasa, ainsi, il désire constituer un échantillon
représentatif constitué de 80 étudiants. Le tableau suivant donne les effectifs
des étudiants par universités et instituts.
Universités/Instituts Effectif
supérieurs
UNIKIN 19700
ISC 9350
ISTA 7180
UPC 2925
Autres 8673
Comment va-t-il constituer un échantillon représentatif s’il recourt à la
méthode de Stratification ?
(TP 2019-2020)
Résolution
D’abord, il faut calculer le nombre à tirer dans chaque Strate
𝑁𝑖
𝑛𝑖 = ×𝑛
𝑁

𝑁 = 19700 + 9350 + 7180 + 2925 + 8673 = 47828


Pour l’UNIKIN Pour l’UPC
19700 2925
𝑛1 = 47828 × 80 = 32,95 𝑛4 = 47828 × 80 = 4,89
𝑛1 ≅ 33 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠 𝑛4 ≅ 5 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠

Pour l’ISC
9350
𝑛2 = 47828 × 80 = 15,64 Pour les autres
8673
𝑛2 ≅ 16 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠 𝑛5 = 47828 × 80 = 14,51
𝑛5 ≅ 14 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
Pour l’ISTA
7180
𝑛3 = 47828 × 80 = 12,01
𝑛3 ≅ 12 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠

𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 = 33 + 16 + 12 + 5 + 14 = 80
Ensuite, on procède au tirage dans chaque Strate (université ou institut
supérieur)
Tirage pour l’UNIKIN
Premièrement, il faut attribuer un numéro à chaque étudiant, puis calculer
la raison

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 7


19700
𝑟= = 596,97 ≅ 597
33

Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 597
⇔ 𝑏 ∈ [1; 597]
On choisit b=5
Les étudiants de l’UNIKIN qui feront partie de l’échantillon sont ceux ayant
les numéros suivants :
5, 602, 1199, 1796, 2393, 2990, 3587, 4184, 4781, 5378, 5975, 6572, 7169,
7766, 8363, 8960, 9557, 10154, 10751, 11348, 11945, 12542, 13139,
13736, 14333, 14930, 15527, 16124, 16721, 17318, 17915, 18512 et
19109.
Tirage pour l’ISC
9350
𝑟= = 584,37 ≅ 584
16

Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 584
⇔ 𝑏 ∈ [1; 584]
On choisit b=10
Les étudiants qui feront partie de l’échantillon pour l’ISC sont ceux qui ont
les numéros suivants :
10, 594, 1178, 1762, 2346, 2930, 3514, 4098, 4682, 5266, 5850, 6434,
7018, 7602, 8186 et 8770.
Tirage pour l’ISTA
7180
𝑟= = 598,33 ≅ 598
12

Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 598
⇔ 𝑏 ∈ [1; 598]
On choisit b=500
Les étudiants qui feront partie de l’échantillon pour l’ISTA sont ceux qui ont
les numéros suivants :
500, 1098, 1696, 2294, 2892, 3490, 4088, 4686, 5284, 5882, 6480 et 7078.

Statistique descriptive, exercices résolus Wissen corporation 8


Tirage pour l’UPC
2925
𝑟= = 585
5

Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 585
⇔ 𝑏 ∈ [1; 585]
On choisit b=100
Les étudiants qui feront partie de l’échantillon pour l’UPC sont ceux qui ont
les numéros suivants :
100, 685, 1270, 1855 et 2440
Pour les autres universités et instituts
8673
𝑟= = 619,5 ≅ 620
14

Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 620
⇔ 𝑏 ∈ [1; 620]
On choisit b=200
Les étudiants qui feront partie de l’échantillon pour l’UPC sont ceux qui ont
les numéros suivants :
200, 820, 1440, 2060, 2680, 3300, 3920, 4540, 5160, 5780, 6400, 7020,
7640 et 8260.

EXERCICE 5
Indiquer en justifiant de quels types sont les variables présentées ci-
dessous : qualitatives ordinales ou nominales, quantitatives discrètes ou
quantitatives continues :
- La race des populations dans le monde
- Le nombre de cours dans une université
- La température d’un processeur
- La durée de vie d’un ordinateur
- La définition d’un écran : Haute définition(HD), Full HD, Ultra
HD(UHD).

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 9


Résolution
- La race des populations dans le monde : qualitative nominale car elle
n’est pas numérique et ses modalités ne peuvent pas être ordonnées.
- Le nombre de cours dans une université : quantitative discrète car
elle est numérique et l’ensemble des valeurs possibles est
dénombrable.
- La température d’un processeur : quantitative continue car elle est
numérique et elle peut prendre toutes les valeurs dans un intervalle.
- La durée de vie d’un ordinateur : quantitative discrète car elle est
numérique et l’ensemble des valeurs possibles est dénombrable.
- La définition d’un écran : Haute définition(HD), Full HD, Ultra
HD(UHD) : qualitative ordinale car elle n’est pas numérique et ses
modalités peuvent être ordonnées.

EXERCICE 6
Un quartier de la commune de N’djili comprend 5 avenues. La répartition des
parcelles est donnée dans le tableau suivant :
N° avenue Nombre de parcelles Disposition des parcelles
A gauche A droite
1 30 15 15
2 25 12 13
3 35 20 15
4 20 10 10
5 15 10 5
Un étudiant de G1 Informatique désire mener une enquête sur le nombre de
téléphone en fonctionnement dans 50 parcelles.
1°. A quelle méthode va-t-il recourir en vue de constituer un échantillon
représentatif ?
2°. Donner le plan expérimental de sa collecte des données.
(Interro 2009-2010)
Résolution
1) Il va recourir à la méthode de Stratification car la population est
hétérogène

Statistique descriptive, exercices résolus Wissen corporation 10


EXERCICE 7
a) Expliquez la méthode de stratification
b) Quel document concernant la population faut-il posséder pour procéder
par échantillonnage aléatoire simple ? Quel peut être le défaut de ce
document ,
c) « On peut toujours généraliser des résultats échantillonnaux à l’ensemble
de la population » Commenter cette affirmation.
d) Quelle qualité recherche-t-on dans un échantillon ?
(Interro)

EXERCICE 8
a) Quelle qualité recherche-t-on dans un échantillon ?
b) Qu’entend-on par un échantillon représentatif tiré de la population
mère Ω
Résolution
a) La qualité recherchée est la représentativité, un échantillon doit être
représentatif
b) Un échantillon représentatif est un échantillon qui possède toutes les
caractéristiques de la population mère

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 11


CHAPITRE 2 ET 3 PRESENTATION DES DONNEES
STATISTIQUES ET STATISTIQUE DESCRIPTIVE
UNIVARIEE

EXERCICE 9
Une entreprise de dépannage veut réduire les frais d’essence de ses
véhicules en remplaçant le quart des véhicules qui circulent le plus par des
véhicules diesel et le quart des véhicules qui circulent le moins par des
véhicules plus légers ; pour cela, le comptable a relevé le kilométrage de
chaque véhicule pendant une semaine. On a obtenu les nombres suivants en
kilomètres
438 685 690 690 511 949 642 332 410 612
770 525 810 853 260 505 280 694 628 484
226 374 587 421 586 383 750 553 731 580
479 591 213 352 675 420 573 490 390 545
1°) Ranger ces données dans des classes d’amplitude 100 km
2°) Représenter graphiquement la série statistique précédente
3°) a. Calculer la médiane et les quartiles. Arrondir au km près
b. Utiliser ces résultats pour réduire le frais de l’entreprise.

Résolution
1° Etant donné que l’amplitude est déjà connue, on va grouper directement,
la valeur minimale est : 213 et la valeur maximale est 943.
classes 𝑛𝑖 𝑥𝑖
[213; 313[ 4 263
[313; 413[ 6 363
[413; 513[ 8 463
[513; 613[ 9 563
[613; 713[ 7 663
[713; 813[ 4 763
[813; 913[ 1 863
[913; 1013[ 1 963
∑ 40

Statistique descriptive, exercices résolus Wissen corporation 12


3° Médiane et quartiles
classes 𝑛𝑖 𝑁𝑖 Marquage ou rang
[213; 313[ 4 4 1er – 4e
[313; 413[ 6 10 5e – 10e
[413; 513[ 8 18 11e -18e
[513; 613[ 9 27 19e -27e
[613; 713[ 7 34 28e -34e
[713; 813[ 4 38 35e -38e
[813; 913[ 1 39 39e
[913; 1013[ 1 40 40e

Médiane
𝑛 40
Pour trouver la classe médiane, on fait = = 20
2 2

Classe médiane : [513; 613[


𝑛
−𝑁𝑖−1
𝑀𝑒 𝑜𝑢 𝑋1⁄ = 𝑙𝑖 + ℎ ( 2 )
2 𝑛𝑖

𝑙𝑖 = 513 ℎ = 100 𝑛 = 40 𝑁𝑖−1 = 18 𝑛𝑖 = 9

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 13


40
−18
𝑀𝑒 = 513 + 100 ( 2 )
9

20−18
= 513 + 100 ( )
9

2
= 513 + 100 (9)

= 513 + 100 × 0,22222222222222


= 513 + 22,2222222222
= 535,2222222
𝑀𝑒 = 535 𝑘𝑚
Les quartiles
𝑖𝑛
Pour trouver la classe quartile, on utilise la formule 4
𝑖.𝑛
−𝑁𝑖−1
4
𝑄𝑖 = 𝑙𝑖 + ℎ ( )
𝑛𝑖

1er quartile
𝑖𝑛 1×40
= = 10
4 4

Classe Q1=[313; 413[


1.𝑛
−𝑁𝑖−1
4
𝑄1 = 𝑙𝑖 + ℎ ( )
𝑛𝑖

𝑙𝑖 = 313 ℎ = 100 𝑛 = 40 𝑁𝑖−1 = 4 𝑛𝑖 = 6


1×40
−4
4
𝑄1 = 313 + 100 ( )
6

10−4
= 313 + 100 ( )
6

6
= 313 + 100 (6)

= 313 + 100 × 1
𝑸𝟏 = 𝟒𝟏𝟑 𝒌𝒎𝒔
𝑄2 = 𝑀𝑒 = 535 𝑘𝑚𝑠
3e quartile
𝑖𝑛 3×40
= = 30
4 4

Classe Q3=[613; 713[

Statistique descriptive, exercices résolus Wissen corporation 14


3.𝑛
−𝑁𝑖−1
𝑄3 = 𝑙𝑖 + ℎ ( 4 )
𝑛𝑖

𝑙𝑖 = 613 ℎ = 100 𝑛 = 40 𝑁𝑖−1 = 27 𝑛𝑖 = 7


3×40
−27
4
𝑄3 = 613 + 100 ( )
7

30−27
= 613 + 100 ( )
7

3
= 313 + 100 (7)

= 313 + 100 × 0,428571428


= 355,8571429
𝑸𝟑 = 𝟑𝟓𝟔 𝒌𝒎𝒔

EXERCICE 10
Le tableau ci-dessous indique le quotient intellectuel (QI), âge mental/âge
exact exprimé en pourcentage, de 480 enfants d’une école maternelle.
centre 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126
de
classe
Effectifs 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2
Trouver par la méthode de changement d’origine et d’unité :
a) Le QI moyen pour cette école
b) L’écart-type de la distribution

Résolution
𝑥𝑖 −𝑎
La nouvelle unité est donnée par la formule 𝜇𝑖 =

Avec a : le centre vers le milieu de classe, dans notre cas a=98.
70−98 102−98
𝜇1 = = −7 𝜇9 = =1
4 4
74−98 106−98
𝜇2 = = −6 𝜇10 = =2
4 4
78−98 110−98
𝜇3 = = −5 𝜇11 = =3
4 4
82−98 114−98
𝜇4 = = −4 𝜇12 = =4
4 4
86−98
𝜇5 = = −3
4 118−98
90−98 𝜇13 = =5
𝜇6 = = −2 4
4
122−98
94−98 𝜇14 = =6
𝜇7 = = −1 4
4
126−98
98−98 𝜇15 = =7
𝜇8 = =0 4
4

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 15


𝑥𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 × 𝜇𝑖 𝑛𝑖 (𝜇𝑖 − 𝜇̅ )2
70 4 -7 -28 168,57
74 9 -6 -54 271,43
78 16 -5 -80 322,80
82 28 -4 -112 341,37
86 45 -3 -135 279,38
90 66 -2 -132 146,85
94 85 -1 -85 20,55
98 72 0 0 18,61
102 54 1 54 122,85
106 38 2 76 239,09
110 27 3 81 332,33
114 18 4 72 365,85
118 11 5 55 333,76
122 5 6 30 211,79
126 2 7 14 112,75
-244 3287,98
∑ 480

𝑥̅ = 𝑎 + ℎ 𝜇̅
Commençons par calculer 𝜇̅
∑𝑛
𝑖=1 𝑛𝑖 × 𝜇𝑖 −244
𝜇̅ = = = −0,508333333
𝑛 480

𝑥̅ = 98 + 4 × (−0,508333333)
= 98 − 2,033333333
𝑥̅ = 95,96666667
𝑥̅ = 95, 97%
Ecart type

𝑆 = √𝑆 2 𝑜𝑟 𝑆 2 = ℎ2 × 𝑆𝜇 2

Donc 𝑆 = √ℎ2 × 𝑆𝜇 2

Trouvons d’abord 𝑆𝜇 2
̅ )2
𝑛𝑖 (𝜇𝑖 −𝜇 3287,98
𝑆𝜇 2 = = = 6,849958333
𝑛 480

𝑆 = √42 × 6,849958333 = √109,59933333 = 10,46897002


𝑆 = 10, 47 %

Statistique descriptive, exercices résolus Wissen corporation 16


EXERCICE 11
En 2004, la répartition en pourcentages de 50 ménages d’un quartier de
Kinshasa suivant le critère de leur revenu annuel s’établissait comme suit :
Revenu annuel (en 0-300 300-600 600-900 900-1200 1200-1500
$)
Fréquences 10 30 60 90 100
cumulées (%)

a) Déterminer le nombre des ménages dont le revenu annuel maximal est


<1200$
b) Cette série peut-elle être ajustée par une distribution normale ?
Justifier votre réponse en utilisant les approches numérique et
graphique.
(Interro générale 2013-2014)
Explication et Résolution
Dans ce cas, la distribution est déjà groupée. Les classes sont facilement
reconnaissables. Le problème, c’est pour déterminer les fréquences.
Nous avons quatre types de fréquences : fréquence absolue (𝑛𝑖 ), fréquence
absolue cumulée (𝑁𝑖 ), fréquence relative (𝑓𝑖 ) et fréquence relative cumulée (𝐹𝑖 )
La détermination de la fréquence donnée dans l’exercice se fait en deux
étapes :

 D’abord chercher à savoir s’il s’agit des fréquences absolues ou relatives.


S’il s’agit des fréquences relatives, on aura au moins un des éléments
suivants :
- La présence du mot relatif
- Les valeurs sont exprimées en pourcentage
- Les valeurs sont des nombres décimaux.
L’absence de ces trois éléments nous conduit au cas des fréquences
absolues.
Dans notre cas, on constate que nous sommes en présence des fréquences
relatives car les données sont en pourcentage.
 Après cela, on cherche à savoir si c’est cumulé ou simple.
Dans le cas des fréquences absolues, pour déterminer que c’est cumulé, on
aura au moins un de éléments suivants :
- La présence du terme cumulé

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 17


- Dans la dernière classe, on retrouve la taille de l’échantillon.
L’absence de ces deux éléments, prouve qu’il s’agit des fréquences absolues
simples.
Et dans le cas des fréquences relatives, pour déterminer qu’il s’agit des
fréquences relatives cumulées, on aura au moins un des éléments suivants :
- La présence du terme cumulé
- Dans la dernière classe, on retrouve 1 (si les données ne sont pas en
pourcentage) ou 100 au cas contraire.
Dans notre cas, il s’agit des fréquences relatives cumulées.
𝑁𝑖 𝐹𝑖 ×𝑛
𝐹𝑖 = × 100 ⇒ 𝑁𝑖 =
𝑛 100

Revenu 𝑥𝑖 𝐹𝑖 𝑁𝑖 𝑛𝑖
annuel
[0; 300[ 150 10 5 5
[300; 600[ 450 30 15 10
[600; 900[ 750 60 30 15
[900; 1200[ 1050 90 45 15
[1200; 1500[ 1350 100 50 5

1. 45 ménages
2. Approche numérique
Calculons le coefficient de SKEWNESS.
Revenu 𝑥𝑖 𝑛𝑖 𝑛𝑖 . 𝑥𝑖 𝑛𝑖 . (𝑥𝑖 − 𝑥̅ )2 .
annuel
[0; 300[ 150 5 750 1984500
[300; 600[ 450 10 4500 1089000
[600; 900[ 750 15 11250 13500
[900; 1200[ 1050 15 15750 1093500
[1200; 1500[ 1350 5 6750 1624500
TOTAL 50 39000 5805000

𝑥̅ −𝑀𝑜
𝑆𝐾 = 𝑆
∑ 𝑛𝑖 .𝑥𝑖 39000
𝑥̅ = = = 780 $
𝑛 50

𝑛𝑖 .(𝑥𝑖 −𝑥̅ )2 5805000


𝑆=√ =√ = 340, 73 $
𝑛 50

Statistique descriptive, exercices résolus Wissen corporation 18


Mode
Classe modale 1
Classe modale 1 [900; 1200[
[600; 900[ ∆1
𝑀𝑜 = 𝑙𝑖 + ℎ ∆ +∆
∆1 1 2
𝑀𝑜 = 𝑙𝑖 + ℎ ∆ +∆ 𝑙𝑖 = 900 ℎ = 300
1 2
𝑙𝑖 = 600 ℎ = 300 ∆1 = 15 − 15 = 0
∆1 = 15 − 10 = 5 ∆2 = 15 − 5 = 10
0
∆2 = 15 − 15 = 0 𝑀𝑜1 = 900 + 300. 0+10 = 900
5
𝑀𝑜1 = 600 + 300. 5+0 = 900

780−900
𝑆𝐾 = = −0,35
340,73

Non, cette série ne peut pas être ajustée par une distribution normale car
𝑆𝐾 ≠ 0.
Approche graphique

La série ne peut pas être ajustée par une distribution normale car les
rectangles adjacents par rapport à celui du milieu n’ont pas la même
longueur.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 19


EXERCICE 12

En 2004, la répartition en pourcentage de 40 ménages d’un quartier de


Kinshasa suivant le critère de leur revenu annuel s’établissait comme suit :
Revenu 0-300 300-600 600-900 900-1200 1200-1500
annuel ($)
Fréquences 20 45 60 90 100
cumulées (%)

a) Déterminer les nombre de ménages dont le revenu annuel maximal est


<900$
b) Calculer la moyenne et l’écart type par la méthode de changement
d’origine et d’unité 𝑥 ′ = (𝑥 − 𝑎)/ℎ (Suggestion : prendre a=1050 et
h=300).
c) – Déterminer les quartiles 𝑄1 , 𝑄2 (𝑚é𝑑𝑖𝑎𝑛𝑒) 𝑒𝑡 𝑄3 par la méthode
numérique et graphique (Représenter sur une même
courbe 𝑄1 , 𝑄2 𝑒𝑡 𝑄3) ;
- Que vaut l’écart interquartile ? Commenter le résultat
Résolution
Les fréquences cumulées données représentent les 𝐹𝑖
𝑁𝑖
On sait que 𝐹𝑖 (𝑒𝑛 %) = × 100
𝑛

En tirant, la valeur de 𝑁𝑖 , on trouve


𝐹𝑖 ×𝑛
𝑁𝑖 = 100
20×40 90×40
𝑁1 = =8 𝑁4 = = 36
100 100

45×40 100×40
𝑁2 = = 18 𝑁5 = = 40
100 100

60×40
𝑁3 = = 24
100

Revenu 𝐹𝑖 (%) 𝑁𝑖 𝑛𝑖 𝑥 𝑥′ 𝑛𝑖 × 𝑥 ′ 𝑛𝑖 (𝑥 ′ − 𝑥̅′ )2 Marquage


annuel ($) ou rang
0-300 20 8 8 150 -3 -24 27,38 1er – 8e
300-600 45 18 10 450 -2 -20 7,225 9e – 18e
600-900 60 24 6 750 -1 -6 0,135 19e – 24e
900-1200 90 36 12 1050 0 0 15,87 25e -36e
1200-1500 100 40 4 1350 1 4 18,49 37e – 40e
∑ 40 -46 69,1

Statistique descriptive, exercices résolus Wissen corporation 20


a) 24 ménages
𝑥−𝑎
b) 𝑥 ′ = ℎ

a=1050, h=300
Pour la première classe Pour la 4e classe
150−1050 1050−1050
𝑥 ′ = 300 = −3 𝑥′ = =0
300

Pour la 2e classe Pour la 5e classe


450−1050 1350−1050
𝑥 ′ = 300 = −2 𝑥′ = =1
300

Pour la 3e classe
750−1050
𝑥 ′ = 300 = −1

𝑥̅ = 𝑎 + ℎ 𝑥̅′
∑ 𝑛 ′
𝑛 ×𝑥 −46
𝑥̅′ = 𝑖=1 𝑛 𝑖 = 40 = −1,15

𝑥̅ = 1050 + 300 × (−1,15)


= 1050 − 345
𝑥̅ = 705$
Ecart type

𝑆 = √𝑆 2 or 𝑆 2 = ℎ2 . 𝑆𝑥 ′ 2

Donc 𝑆 = √ℎ2 . 𝑆𝑥 ′ 2

∑𝑛 ′ ̅̅̅′ 2
2 𝑖=1 𝑛𝑖 (𝑥 −𝑥 ) 69,1
𝑆𝑥 ′ = = = 1,7275
𝑛 40

𝑆 = √3002 × 1,7275 = √155475 = 394,3031828


𝑆 = 394,30 $
c) Les quartiles
𝑖𝑛
Pour trouver la classe quartile, on utilise la formule 4

1er quartile
𝑖𝑛 1×40
= = 10
4 4

Classe Q1 : [300, 600[

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 21


1𝑛
−𝑁𝑖−1
𝑄1 = 𝑙𝑖 + ℎ ( 4 )
𝑛𝑖

𝑙𝑖 = 300; ℎ = 300 𝑁𝑖−1 = 8 𝑛𝑖 = 10


1×40
−8
4
𝑄1 = 300 + 300 ( )
10

10−8
= 300 + 300 ( )
10

2
= 300 + 300 (10)

= 300 + 300 × 0,2


= 300 + 60
𝑄1 = 360 $
2e quartile
𝑖𝑛 2×40
= = 20
4 4

Classe Q2 : [600; 900[


𝑙𝑖 = 600; ℎ = 300 𝑁𝑖−1 = 18 𝑛𝑖 = 6
2×40
−18
4
𝑄2 = 600 + 300 ( )
6

20−18
= 600 + 300 ( )
6

2
= 600 + 300 (6)

= 600 + 300 × 0,3333333333333


= 600 + 100
𝑄2 = 𝑀𝑒 = 700 $
3e quartile
𝑖𝑛 3×40
= = 30
4 4

Classe Q3 : [900; 1200[


𝑙𝑖 = 900; ℎ = 300 𝑁𝑖−1 = 24 𝑛𝑖 = 12
3×40
−24
4
𝑄3 = 900 + 300 ( )
12

30−24
= 900 + 300 ( )
12

Statistique descriptive, exercices résolus Wissen corporation 22


6
= 900 + 300 (12)

= 900 + 300 × 0,
= 900 + 150
𝑄3 = 1050 $
Graphiquement

L’écart interquartile = 𝑄3 − 𝑄3
= 1050 − 360
L’écart interquartile = 690

EXERCICE 13
Le tableau ci-dessous indique le quotient intellectuel (QI), âge mental/âge
exact exprimé en pourcentage d’un échantillon d’enfants du paradis scolaire
Q.I. [70; 74[ [74; 78[ [78; 82[ [82; 86[ [86; 90[ [90; 94[ [94; 98[
effectifs 4 9 16 28 45 66 85

Trouver :
a) Le QI moyen, modal et médian pour ce paradis scolaire
b) L’écart-type de la distribution statistique
c) La courbe cumulative des fréquences relatives (Fonction de répartition)

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 23


Résolution
Q.I. 𝑛𝑖 𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 (𝑥𝑖 𝑁𝑖 Marquage ou 𝐹𝑖 (𝑒𝑛 %)
− 𝑥̅ ) 2 rang
[70; 74[ 4 72 288 1310,44 4 1er – 4e 1,58
[74; 78[ 9 76 684 1789,29 13 5e – 13e 5,14
[78; 82[ 16 80 1280 1632,16 29 14e – 29e 11,46
[82; 86[ 28 84 2352 1041,88 57 30e – 57e 22,27
[86; 90[ 45 88 3960 198,45 102 58e – 102e 40,32
[90; 94[ 66 92 6072 238,26 168 103e – 168e 66,40
[94; 98[ 85 96 8160 2958,85 253 169e – 253e 100
∑ 253 22796
9169,33

a) Moyenne, mode et médiane


Le QI médian
Le QI moyen Pour trouver la classe médiane, on
𝑛 𝑛 253
1 22796 fait = = 126,5
̅
𝑋 = ∑ 𝑛𝑖 𝑥𝑖 = = 90,1027668 2 2
𝑛 253 Classe médiane [90; 94[
𝑖=1 𝑛
−𝑁𝑖−1
̅ = 𝟗𝟎, 𝟏%
𝒙 𝑀𝑒 𝑜𝑢 𝑋1⁄ = 𝑙𝑖 + ℎ ( 2 )
2 𝑛𝑖

Le QI modal 𝑙𝑖 = 90 ℎ=4 𝑁𝑖−1 = 102 𝑛𝑖 =


Classe modale : [94; 98[ 66
253
∆1 −102
𝑀𝑜 = 𝑙𝑖 + ℎ ∆ +∆ 𝑀𝑒 = 90 + 4 ( 2
)
1 2 66
𝑙𝑖 = 94 ℎ=4 126,5−102
∆1 = 85 − 66 = 19 = 90 + 4 ( 66
)
24,5
∆2 = 85 − 0 = 85 = 90 + 4 ( 66 )
19
𝑀𝑜 = 94 + 4 19+85 = 90 + 4(0,371212121)
= 90 + 1,484848485
19 = 91,48484848
𝑀𝑜 = 94 + 4 104
𝑴𝒆 = 𝟗𝟏, 𝟒𝟖%
𝑀𝑜 = 94 + 4 × 0,182692307
𝑀𝑜 = 94,73076923
𝑴𝒐 = 𝟗𝟒, 𝟕𝟑 %

b) Ecart type

𝑆 = √𝑆 2
∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥̅ )
2 𝟗𝟏𝟔𝟗,𝟑𝟑
𝑆2 = = = 36, 24241107
𝑛 253

𝑆 = √36, 24241107
𝑆 = 6,02016703
𝑆 = 6, 02 %

Statistique descriptive, exercices résolus Wissen corporation 24


c) Courbe cumulative des fréquences relatives

EXERCICE 14
Le tableau suivant donne la taille (en m) d’un échantillon de 30 étudiants d’une
école supérieure.
1,35 1,6 2,05 1,10 1,80 1,01 1,58 2,01 1,31 1,77
1,13 1,20 1,82 1,31 2,01 1,40 1,85 1,31 1,20 0,76
2,80 2,00 1,85 1,42 1,80 1,05 1,95 1,65 2,02 2,01
1) Regrouper ces données en tranches d’amplitude constante
2) Trouver le huitième quartile par l’approche graphique
3) En utilisant la méthode de changement d’origine et d’unité, déterminer la
taille moyenne et l’écart type de cette série statistique.
(Interro générale 2014-2015)
Résolution
1) k=1+3,3 log n
=1+3,3log 30
=5,87
k≅ 6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
E=𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑖𝑛
= 2,80 – 1, 01
E= 1, 79

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 25


𝐸 1,79
h= = = 0,298 ≅ 0,3
𝑘 6

Classes 𝑥𝑖 𝑛𝑖
[1,01; 1,31[ 1,16 6
[1,31; 1,61[ 1,46 8
[1,61; 1,91[ 1,76 8
[1,91 ; 2,21[ 2,06 7
[2,21; 2,51[ 2,36 0
[2,51; 2,81[ 2,66 1
TOTAL 30

2) Le huitième quartile n’existe pas

3) Avec cette méthode, il faut d’abord trouver 𝜇𝑖 donnée par la formule


𝑥𝑖 −𝑎
𝑢𝑖 = Avec a le centre vers le milieu de classe.

Dans notre cas, on a 6 centres de classe.

il y a deux centres qui sont au milieu, on a le


choix entre 1,76 et 2,06. Dans notre cas, on choisit a=1,76.
Après le choix de a, il faut calculer 𝑢𝑖 pour chaque classe :
1,16−1,76 1,46−1,76
𝜇1 = =-2 ; 𝜇2 = = −1 etc.
0,3 0,3

Ou soit, on peut utiliser cette astuce pour trouver rapidement les 𝑢𝑖 .


Mettre 𝜇𝑖 = 0 et compléter -1, -2, -3 … pour les classes au-dessus de la classe
de a et 1,2,3,…pour les classes en dessous.

Statistique descriptive, exercices résolus Wissen corporation 26


Classes 𝑥𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 × 𝜇𝑖 𝑛𝑖 . (𝜇𝑖 − 𝜇̅ )2
[1,01; 1,31[ 1,16 6 -2 -12 16,67
[1,31; 1,61[ 1,46 8 -1 -8 3,56
[1,61; 1,91[ 1,76 8 0 0 0,89
[1,91 ; 2,21[ 2,06 7 1 7 12,44
[2,21; 2,51[ 2,36 0 2 0 0
[2,51; 2,81[ 2,66 1 3 3 11,11
TOTAL 30 -10 44,67

𝑋̅ = 𝑎 + ℎ𝜇̅
∑ 𝑛𝑖 .𝜇𝑖
Trouvons d’abord 𝜇̅ ; 𝜇̅ =
𝑛
−10
𝜇̅ = = −0,3333333333 ….
30

𝑥̅ = 1,76 + 0,3 × (−0,333333333 … )


= 1,76 − 0,1
𝑥̅ = 1,66 𝑚
Ecart type

𝑆 = √𝑉𝑎𝑟 = √ℎ2 × 𝑆𝜇 2

̅ )2
∑ 𝑛𝑖 .(𝜇𝑖 −𝜇
𝑆𝜇 2 =
𝑛
44,67
=
30

𝑆𝜇 2 = 1,489

𝑆 = √(0,3)2 × 1,489
𝑆 = 0,37 𝑚

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 27


EXERCICE 15
Une enquête sanitaire dans la ville de Kinshasa a permis d’obtenir des
données sur l’âge (ans) d’un échantillon de 40 personnes vivant avec le VIH.
Voici les résultats obtenus :
25 22 32 17 25 30 21 27 37 34
16 30 28 25 54 21 32 40 25 47
34 40 43 60 18 24 36 40 42 34
25 24 32 31 21 64 55 50 40 18

1) Regrouper ces données en tranches d’âge d’amplitude constante


2) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
3) Déterminer les quartiles Q1 et Q3 par la méthode graphique
4) En utilisant la méthode de changement d’origine et d’unité, déterminer
l’âge moyen et l’écart-type de cette série statistique.
(Interro générale 2013-2014)
Résolution
1. k=1+3,3 log n
=1+3,3log 40
=6, 2897
k≅ 6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
E=𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑖𝑛
= 64 – 16
E= 48
𝐸 48
h=𝑘 = =8
6

classes 𝑛𝑖 𝑥𝑖 𝑁𝑖
[16; 24[ 8 20 8
[24; 32[ 12 28 20
[32; 40[ 8 36 28
[40; 48[ 7 44 35
[48; 56[ 3 52 38
[56; 64] 2 60 2

Statistique descriptive, exercices résolus Wissen corporation 28


2.

3.
𝑖𝑛 1×𝑛 40
𝑄1 = = = 10
4 4 4
3×𝑛 120
𝑄3 = = = 30
4 4

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 29


4.
Classes 𝑥𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 × 𝜇𝑖 𝑛𝑖 . (𝜇𝑖 − 𝜇̅ )2
[16; 24[ 20 8 -2 -16 25,21
[24; 32[ 28 12 -1 -12 7,21
[32; 40[ 36 8 0 0 0,41
[40; 48[ 44 7 1 7 10,50
[48; 56[ 52 3 2 6 14,85
[56; 64] 60 2 3 6 20,80
TOTAL 40 -9 78, 98
Prenons a=36
𝑋̅ = 𝑎 + ℎ𝜇̅
∑ 𝑛𝑖 .𝜇𝑖
Trouvons d’abord 𝜇̅ ; 𝜇̅ = 𝑛
−9
𝜇̅ = = −0,225
40

𝑥̅ = 36 + 8 × (−0,225)
= 36 − 1,8
𝑥̅ = 34,2 𝑎𝑛𝑠
Ecart type

𝑆 = √𝑉𝑎𝑟 = √ℎ2 × 𝑆𝜇 2

̅ )2
∑ 𝑛𝑖 .(𝜇𝑖 −𝜇
𝑆𝜇 2 = 𝑛
78,98
= 40

𝑆𝜇 2 = 1,9745

𝑆 = √(8)2 × 1,9745

𝑆 = 11,24 𝑎𝑛𝑠

Statistique descriptive, exercices résolus Wissen corporation 30


EXERCICE 16

Dans une maternité de Kinshasa, un échantillon de 30 femmes ayant


accouché par césarienne a été prélevé, on a observé les résultats suivants en
nombre de jours de séjour à l’hôpital :
5,5 7,5 11,3 7 8,3 10 9,5 6,5 10,5 7
6,5 9,1 6,0 8,5 7,5 9,1 9,2 8,5 11 7,5
12 8 9.5 6 9 10 11 5,8 9 11

1) Regrouper ces données en tranches d’amplitude constante.


2) Déterminer le 50ième centile par la méthode graphique
3) En utilisant la méthode de changement d’origine et d’unité, déterminer
le séjour moyen et l’écart type de cette série statistique.
(Interro générale 2014-2015)
Résolution
1) k=1+3,3 log n
=1+3,3log 30
=5,87
k≅ 6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
E=𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑖𝑛
= 12 – 5,5
E= 6,5
𝐸 6,5
h=𝑘 = = 1,083333 ≅ 1, 09
6

Classes 𝑥𝑖 𝑛𝑖 𝑁𝑖
[5,5 ; 6,59[ 6,05 6 6
[6,59; 7,68[ 7,14 5 11
[7,68; 8,77[ 8,23 4 15
[8,77 ; 9,86[ 9,32 7 22
[9,86; 10,95[ 10,41 3 25
[10,95; 12,04[ 11,50 5 30
TOTAL 30

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 31


2.
𝑖𝑛 50×30
; 𝐶50 ⇒ = 15
100 100

3.
Classes 𝑥𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 × 𝜇𝑖 𝑛𝑖 . (𝜇𝑖 − 𝜇̅ )2
[5,5 ; 6,59[ 6,05 6 -2 -12 33,61
[6,59; 7,68[ 7,14 5 -1 -5 9,34
[7,68; 8,77[ 8,23 4 0 0 0,54
[8,77 ; 9,86[ 9,32 7 1 7 2,81
[9,86; 10,95[ 10,41 3 2 6 8,00
[10,95; 12,04[ 11,50 5 3 15 34,67
TOTAL 30 11 88, 97

𝑋̅ = 𝑎 + ℎ𝜇̅ Prenons a=8,23


∑ 𝑛𝑖 .𝜇𝑖
Trouvons d’abord 𝜇̅ ; 𝜇̅ = 𝑛
11
𝜇̅ = 30 = 0,36666666666 ….

𝑥̅ = 8,23 + 1,09 × (0,3666666666)


= 8,23 + 0,39966666
𝑥̅ = 8,63 𝑗𝑜𝑢𝑟𝑠
Ecart type

𝑆 = √𝑉𝑎𝑟 = √ℎ2 × 𝑆𝜇 2

̅ )2
∑ 𝑛𝑖 .(𝜇𝑖 −𝜇
𝑆𝜇 2 = 𝑛

Statistique descriptive, exercices résolus Wissen corporation 32


88,97
= 30

𝑆𝜇 2 = 2,965666667

𝑆 = √(1,09)2 × 2,965666667

𝑆 = 1,88 𝑗𝑜𝑢𝑟

EXERCICE 17
Le tableau suivant donne la distribution des salaires annuels d’une
entreprise (en centaines de dollars) en 2008 :
Salaire net annuel Effectif
[0; 10[ 20
[10; 22[ 36
[22; 27[ 35
[27; 45[ 45
[45; 75[ 72
[75; 120[ 90

1) Quel est le caractère étudié ? Est-il qualitatif ? Quantitatif ? Continu ?


Discret ?
2) Quelle est la proportion des ouvriers de cette série au plus de 4500$ ?
3) Déterminer le 1er quartile de cette série statistique par la méthode
graphique. Interpréter.
4) Calculer la moyenne arithmétique de cette série, en utilisant la
méthode de changement d’origine et d’unité.
(Interro 2016-2017)
Résolution
Salaire net 𝑛𝑖 𝑁𝑖 𝑓𝑖
annuel
[0; 10[ 20 20 0,07
[10; 22[ 36 56 0,12
[22; 27[ 35 91 0,12
[27; 45[ 45 136 0,15
[45; 75[ 72 208 0,24
[75; 120[ 90 298 0,30

1. Le caractère étudié est le salaire annuel, il est quantitatif continu.


2. La proportion est de 24% + 30% soit 54%.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 33


3.

4. Pas moyen d’utiliser cette méthode car l’amplitude n’est pas constante.

EXERCICE 18
Considérons une entreprise E comportant deux établissements E1 et E2. Au
sein de l’établissement E1 le salaire moyen est égal à 1800 euros avec un
écart-type de 650. Au sein de l’établissement E2 le salaire moyen est égal à
2000 euros avec un écart-type de 110. Dans quelle entreprise selon vous le
salaire est le plus dispersé ? Justifier.
(Interro 2016-2017)
Résolution
Il suffit de calculer les coefficients de variation puis comparer.
𝐸1 𝐸2

𝑥1 = 1800 𝑒𝑢𝑟𝑜𝑠
̅̅̅ 𝑥2 = 2000 𝑒𝑢𝑟𝑜𝑠
̅̅̅
𝑆1 = 650 𝑆1 = 110
𝑆 𝑆
𝐶𝑉1 = × 100 𝐶𝑉2 = × 100
𝑥̅ 𝑥̅
650 110
𝐶𝑉1 = × 100 𝐶𝑉2 = × 100
1800 2000

𝐶𝑉1 = 36, 11% 𝑆𝐾2 = 55%

Le salaire est le plus dispersé dans 𝐸2 car 𝐶𝑉2 > 𝐶𝑉1

Statistique descriptive, exercices résolus Wissen corporation 34


EXERCICE 19

On considère la distribution des salaires (xi) de 50 agents dans une


entreprise des télécommunications en février 2005 :
Salaire (en 1500- 1600-1700 1700-1800 1800- 1900-2000
$) 1600 1900
Effectif 10 24 30 44 50
cumulé

1) Déterminer les salaires moyen, médian et modal


2) Trouver graphiquement le 50ième centile.
3) En recourant à quelques paramètres de tendance centrale choisis de
manière adéquate, discuter sur l’asymétrie de cette distribution.
4) Le conseil d’administration de cette entreprise décide, pour le mois de
mars 2005, d’une prime uniforme de 200$, ainsi que d’une
augmentation de 2,5% pour les salaires inférieurs à 1700 $.
Estimer le salaire, en mars 2005, d’un ouvrier touchant 2500$ en février
2005.
(Examen S2 2016-2017)
Résolution
Salaire 𝑁𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 . 𝑥𝑖 𝑛𝑖 . (𝑥𝑖 − 𝑥̅ )2 Marquage
[1500; 1600[ 10 10 1550 15500 338560 1er au 10e
[1600; 1700[ 24 14 1650 23100 98784 11e au 24e
[1700; 1800[ 30 6 1750 10500 1536 25e au 30e
[1800; 1900[ 44 14 1850 25900 188384 31e au 44e
[1900; 2000[ 50 6 1950 11700 279936 45e au 50e
TOTAL 50 86700 907200

∑ 𝑛𝑖 .𝑥𝑖 86700
1. 𝑥̅ = =
𝑛 50

𝑥̅ = 1734 $
Médiane
𝑛 50
Classe médiane = = 25 ⇒ [1700; 1800[
2 2
𝑛
−𝑁𝑖−1
2
𝑀𝑒 = 𝑙𝑖 + ℎ ( )
𝑛𝑖

𝑙𝑖 = 1700 ℎ = 100 𝑁𝑖−1 = 24 𝑛𝑖 = 6

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 35


50
−24
𝑀𝑒 = 1700 + 100 ( 2 6 )

𝑀𝑒 = 1716, 67 $
Mode

Classe modale 1 [1600; 1700[ Classe modale2 [1800; 1900[


∆1 ∆1
𝑀𝑜1 = 𝑙𝑖 + ℎ ∆ +∆ 𝑀𝑜1 = 𝑙𝑖 + ℎ ∆ +∆
1 2 1 2
𝑙𝑖 = 1600 ℎ = 100 𝑙𝑖 = 1800 ℎ = 100
∆1 = 𝑛𝑖 − 𝑛𝑖−1 = 14 − 10 = 4 ∆1 = 𝑛𝑖 − 𝑛𝑖−1 = 14 − 6 = 8
∆2 = 𝑛𝑖 − 𝑛𝑖+1 = 14 − 6 = 8 ∆2 = 𝑛𝑖 − 𝑛𝑖+1 = 14 − 6 = 8
4 8
𝑀𝑜1 = 1600 + 100. 4+8 𝑀𝑜2 = 1800 + 100. 8+8
𝑀𝑜1 = 1633,33 $ 𝑀𝑜2 = 1850 $

2.
𝑖.𝑛 50×50
⇒ 𝐶50 = = 25
100 100

𝑥̅ −𝑀𝑜
3. 𝑆𝐾 = 𝑆

Trouvons d’abord S.

∑ 𝑛𝑖 .(𝑥𝑖 −𝑥̅ )2 907200


𝑆=√ =√ = 134, 70
𝑛 50

Etant donné, que nous avons deux modes qui sont différents de la
moyenne, la distribution n’est pas symétrique.
4. Une prime uniforme de 200$ (quel que soit le salaire)
Augmentation de 2,5% pour des salaires inférieurs à 1700$.
Pour l’agent qui touchait 2500$ en février, il a droit à la prime uniforme
de 200$ mais pas à l’augmentation de 2,5% car son salaire est supérieur
à 1700$.
Donc il aura 2500+200 soit 2700$

Statistique descriptive, exercices résolus Wissen corporation 36


EXERCICE 20
On donne la série unidimensionnelle suivante correspondante à la
répartition des entreprises du secteur automobile en fonction de leur chiffre
en millions d’euros.
Chiffre [0; 0,25[ [0,25; 0,5[ [0,5; 1[ [1; 2,5[ [2,5; 5[ [5; 10[
d’affaire
Nombre 130 250 380 550 750 1000
cumulé
d’entreprises
a) Calculer le chiffre d’affaire moyen et l’écart-type de cette série.
b) Déterminer graphiquement la médiane et la proportion d’entreprise
dont le chiffre d’affaire est inférieur à 2 millions d’euros.
c) Examiner l’asymétrie de cette série à l’aide d’un paramètre adéquat.
Commenter
(Interro)

Résolution
Après analyse, le nombre cumulé d’entreprises représente le 𝑁𝑖
Chiffre 𝑁𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 × 𝑥𝑖 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2
d’affaire
[0; 0,25[ 130 130 0,125 16,25 1136,12383
[0,25; 0,5[ 250 120 0,375 45 878,854688
[0,5; 1[ 380 130 0,75 97,5 706,514453
[1; 2,5[ 550 170 1,75 297,5 301,278516
[2,5; 5[ 750 200 3,75 750 89,4453125
[5; 10[ 1000 250 7,5 1875 4881,33789
∑ 1000
3081,25 7993,55469

a) La moyenne
∑𝑛
𝑖=1 𝑛𝑖 ×𝑥𝑖
𝑥̅ =
𝑛
3081,25
= 1000

𝑥̅ = 3,08125
𝑥̅ = 3, 08125 𝑚𝑖𝑙𝑙𝑖𝑜𝑛𝑠 𝑑 ′ 𝑒𝑢𝑟𝑜𝑠
𝑥̅ = 3 081 250 €

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 37


Ecart-type

𝑆 = √𝑆 2
∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥̅ )
2 𝟕𝟗𝟗𝟑,𝟓𝟓𝟒𝟔𝟗
𝑆2 = = = 7,99355469
𝑛 1000

𝑆 = √7,99355469 = 2,827287515
𝑆 = 2,827287515 𝑚𝑖𝑙𝑙𝑖𝑜𝑛𝑠 𝑑′𝑒𝑢𝑟𝑜𝑠 ou

𝑆 = 2 827 287, 515 €


b) La médiane graphiquement
𝑛 1000
= = 500
2 2

c) L’asymétrie de la distribution
𝑥̅ −𝑀𝑜𝑑𝑒
𝑆𝑘 = 𝑆

Trouvons d’abord le mode


Classe modale : [5; 10[
∆1
𝑀𝑜 = 𝑙𝑖 + ℎ
∆1 +∆2

Statistique descriptive, exercices résolus Wissen corporation 38


𝑙𝑖 = 5 ℎ=5
∆1 = 250 − 200 = 50 ∆2 = 250 − 0 = 250
50
𝑀𝑜 = 5 + 5 50+250
50
=5+5 300

= 5 + 5 × 0,16666666666
= 5 + 0,8333333333333
𝑀𝑜 = 5,8333333333333 𝑀𝑖𝑙𝑙𝑖𝑜𝑛𝑠 𝑑′𝑒𝑢𝑟𝑜𝑠 ou

𝑀𝑜 = 5 833 333, 33 €
3 081 250−5 833 333,33
𝑆𝑘 = 2 827 287,515

𝑆𝑘 = 0,97
La distribution est dissymétrique à droite.

EXERCICE 21
Répondre par vrai ou faux
QUESTION REPONSE
La variance ne peut être calculée que pour une variable
mesurée au moyen d’une échelle quantitative
Si une variable est exprimée en mètre, la variance de cette
variable l’est aussi.
L’écart-type est donné par la racine carrée de la variance
La variance peut être nulle
La variance peut être négative
L’étendue tient compte de toutes les valeurs d’une série
statistique
N.B. : La mauvaise réponse annule la bonne
(Interro 2013-2014)

Résolution
QUESTION REPONSE
La variance ne peut être calculée que pour une variable Vrai
mesurée au moyen d’une échelle quantitative
Si une variable est exprimée en mètre, la variance de cette Faux
variable l’est aussi.
L’écart-type est donné par la racine carrée de la variance Vrai
La variance peut être nulle Vrai
La variance peut être négative Faux
L’étendue tient compte de toutes les valeurs d’une série Faux
statistique

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 39


EXERCICE 22
On considère la distribution des salaires (xi) de 50 agents dans une
entreprise de télécommunications en février 2005 :
Salaire (en $) 500- 1000-1500 1500-2000 2000-2500 2500-3000
1000
Fréquence 0,20 0,18 0,30 0,20 0,12
relative
1) En utilisant la méthode de changement d’origine et d’unité, déterminer
le salaire moyen et l’écart-type de cette série statistique.
2) En recourant à la représentation graphique, discuter sur l’asymétrie
de cette distribution.
3) Déterminer la proportion d’agents dont le salaire varie entre 500 et
1500$
(Examen S1 2016-2017)
Résolution
Après analyse, les fréquences relatives sont les 𝑓𝑖
𝑛𝑖
On sait que 𝑓𝑖 = ⇒ 𝑛𝑖 = 𝑓𝑖 × 𝑛
𝑛

𝑛1 = 0,20 × 50 = 10
𝑛2 = 0,18 × 50 = 9
𝑛3 = 0,30 × 50 = 15
𝑛4 = 0,20 × 50 = 10
𝑛5 = 0,12 × 50 = 6
Salaire(en $) 𝑓𝑖 𝑛𝑖 𝑥𝑖 𝜇𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 (𝜇𝑖 − 𝜇̅ )2
[500; 1000[ 0,20 10 750 -2 -20 34,596
[1000; 1500[ 0,18 9 1250 -1 -9 6,6564
[1500; 2000[ 0, 30 15 1750 0 0 0,294
[2000; 2500[ 0,20 10 2250 1 10 12,996
[2500; 3000[ 0,12 6 2750 2 12 27,4776
∑ 50
-7 82,02

Statistique descriptive, exercices résolus Wissen corporation 40


1) Méthode de changement d’origine et d’unités
𝑥𝑖 −𝑎
Trouvons la nouvelle unité : 𝜇𝑖 = ℎ

a: centre vers le milieu de classe, a=1750, h=500


750−1750 2250−1750
𝑢1 = = −2 𝑢4 = =1
500 500

1250−1750 2750−1750
𝑢2 = = −1 𝑢5 = =2
500 500

1750−1750
𝑢3 = =0
500

Moyenne
𝑥̅ = 𝑎 + ℎ𝜇̅
∑𝑛
𝑖=1 𝑛𝑖 𝜇𝑖 −7
𝜇̅ = = = −0,14
𝑛 50

𝑥̅ = 1750 + 500 × (−0,14)


= 1750 − 70
𝑥̅ = 1680 $
Ecart type

𝑆 = √ℎ2 𝑆𝜇 2

∑𝑛 ̅ )2
𝑖=1 𝑛𝑖 (𝜇𝑖 −𝜇 82,02
𝑆𝜇 2 = = = 1,6404
𝑛 50

𝑆 = √5002 × 1,6404 = √410 100 = 640,3905059


𝑆 = 640,39$

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 41


b) Asymétrie de la distribution

La distribution n’est pas symétrique car les rectangles adjacents au


rectangle du milieu n’ont pas la même longueur
c) La proportion est de 0,20+0, 18
Soit 0,38 ou 38%

EXERCICE 23
Le salaire mensuel d’une entreprise était en mars de 2800$ avec un écart-type de
200$. Si tous les salariés bénéficient d’une augmentation identique de 10% à
partir du mois d’avril puis d’une prime fixe de 100$ à partir du mois de mai.
Calculer, si possible, le salaire moyen à la suite de ces deux augmentations.
(Examen S1 2016-2017)
Résolution
𝑥̅ = 2800 $
∑𝑛
1 𝑛𝑖 𝑥𝑖
On sait que 𝑥̅ =
𝑛

Après augmentation, nous aurons : 𝑥𝑖 ′ = 𝑥𝑖 + 10% 𝑑𝑒 𝑥𝑖 + 100


10
⇔ 𝑥𝑖 ′ = 𝑥𝑖 + 100 × 𝑥𝑖 + 100

⇔ 𝑥𝑖 ′ = 𝑥𝑖 + 0,1 𝑥𝑖 + 100
La nouvelle moyenne vaut :
𝑛 ′
∑ 𝑛 𝑥
𝑥̅′ = 𝑖=1 𝑖 𝑖
𝑛

Statistique descriptive, exercices résolus Wissen corporation 42


∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 +0,1 𝑥𝑖 +100)
=
𝑛
∑𝑛
𝑖=1(𝑛𝑖 𝑥𝑖 + 𝑛𝑖 ×𝑂,1 𝑥𝑖 +100𝑛𝑖 )
=
𝑛
∑ 𝑛𝑖 𝑥𝑖 +∑ 𝑛𝑖 ×𝑂,1 𝑥𝑖 +∑ 100𝑛𝑖
=
𝑛
∑ 𝑛𝑖 𝑥𝑖 ∑ 𝑛𝑖 ×𝑂,1 𝑥𝑖 ∑ 100𝑛𝑖
= + +
𝑛 𝑛 𝑛
∑ 𝑛𝑖 𝑥𝑖 ∑ 𝑛𝑖 𝑥𝑖 ∑ 𝑛𝑖 ∑𝑛
1 𝑛𝑖 𝑥𝑖
= + 0,1 + 100 or 𝑥̅ = 𝑒𝑡 ∑𝑛𝑖=1 𝑛𝑖 = 𝑛
𝑛 𝑛 𝑛 𝑛

𝑥̅′ = 𝑥̅ + 0,1 𝑥̅ + 100


= 2800 + 0,1 × 2800 + 100
= 2800 + 280 + 100
𝑥̅′ = 3180$

EXERCICE 24
Afin de contrôler la durée de vie des ampoules fabriquées par une usine
électrique de la place, un échantillon de 30 ampoules ont été examinées. On
a observé les résultats suivants en heures.

142 77 193 120 194 147 70 149 132 180


102 182 170 226 83 173 126 114 169 97
94 159 280 172 171 90 146 206 59 126

1°) Ranger les données dans des classes de mêmes amplitudes ;


2°) Représenter l’histogramme et le polygone statistique des effectifs ;
3°) Calculer la Moyenne des données groupées en 1)
4°) Calculer le Mode et la Médiane
5°) Calculer le coefficient de variation et Interpréter le résultat trouvé.
Résolution
1°) Nombre de classes
𝑘 = 1 + 3,3 log 𝑛
= 1 + 3,3 log 30
= 1 + 3,3 × 1,477121255
= 1 + 4,874500141

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 43


= 5,874500141
𝑘 ≅ 6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
𝐸 = 𝑉𝑎𝑙𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑚𝑖𝑛
= 280 − 59
𝐸 = 221
𝐸 221
ℎ=𝑘= = 36,83 ≅ 37
6

Durée de vie 𝑛𝑖 𝑥𝑖 𝑛𝑖 𝑥𝑖 𝑁𝑖 Marquage 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2


[59; 96[ 6 77,5 465 6 1er -6e 27605,4534
[96; 133[ 7 114,5 801,5 13 7e – 13e 91771,75
[133; 170[ 6 151,5 909 19 14e -19e 137713,5
[170; 207[ 9 188,5 1696,5 28 20e -28e 319790,25
[207; 244 [ 1 225,5 225,5 29 29e 50850,25
[244; 281[ 1 262,5 262,5 30 30e 68906,25
∑ 30 4360 696637,453

2°)

Statistique descriptive, exercices résolus Wissen corporation 44


3°)
1 4360
𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑛𝑖 𝑥𝑖 = = 145,333333
30

𝑥̅ = 145,33 ℎ
4°)
Mode Médiane
Classe modale [170; 207[ 𝑛
=
30
= 15
∆1 2 2
𝑀𝑜 = 𝑙𝑖 + ℎ ∆ +∆
1 2
𝑙𝑖 = 170 ℎ = 37 Classe médiane [133; 170[
𝑛
∆1 = 9 − 6 = 3 ∆2 = 9 − 1 = 8 −𝑁𝑖−1
𝑀𝑒 = 𝑙𝑖 + ℎ (2 )
𝑛𝑖

𝑀𝑜 = 170 + 37 ×
3 𝑙𝑖 = 133 ℎ = 37 𝑁𝑖−1 = 13 𝑛𝑖 = 6
3+8 30
−13
3
= 170 + 37 × 11 𝑀𝑒 = 133 + 37 ( 2 6 )
15−13
= 133 + 37 ( )
= 170 + 10,09090909 6
2
= 180,09090909 = 133 + 37 (6)
𝑀𝑜 = 180,09 ℎ = 133 + 37 × 0,333333333333
𝑀𝑒 = 145,33ℎ

5°) Coefficient de variation


𝑆
𝐶𝑉 = 𝑥̅ × 100

Trouvons d’abord l’écart type


1 696637,453
𝑆 2 = 𝑛 ∑𝑛𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2 = = 23 221, 24843
30

𝑆 = √23 221, 24843 = 152,38

152,38
𝐶𝑉 = 145,33 × 100

𝐶𝑉 = 104,84%
La dispersion est forte car 𝐶𝑉 ≥ 17%

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 45


EXERCICE 25
Soit la série statistique suivante :
15, 35, 16, 27, 18, 70, 21,52, 23, 33, 28,14, 25, 75,106,
26,17, 05, 38, 29, 50, 30, 62, 34, 45, 76, 69, 40, 53, 74
1. Dessiner Le diagramme en tiges et feuilles, en interprétant les résultats
2. Dessiner Le diagramme en moustache, en interprétant les résultats
Résolution
1°)
Tige Feuille
0 5
1 4 5 6 7 8
2 1 3 5 6 7 8 9
3 0 3 4 5 8
4 0 5
5 0 2 3
6 2 9
7 0 4 5 6
8
9
10 6

La tige 0 représente l’intervalle de classe 0 à 9


La tige 1 représente l’intervalle de classe de 10 à 19
Ainsi de suite
Le diagramme montre que la série est dominée par des valeurs allant de 21 à
29
2°) Diagramme en moustache
- Il faut d’abord ordonner les valeurs par ordre croissant :
05, 14, 15, 16, 17, 18, 21, 23, 25, 26, 27, 28, 29, 30, 33, 34, 35, 38, 40, 45,
50, 52, 53, 62, 69, 70, 74, 75, 76, 106
- Détermination la médiane
1
𝑀𝑒 = 2 ( 𝑥𝑛 + 𝑥𝑛+1 ) ici n=30
2 2

33+34
𝑀𝑒 = = 33,5
2

- Détermination des quartiles


Q1 : 𝑛 = 30 𝑝 = 0,25 ⇒ 𝑛𝑝 = 7,5

Statistique descriptive, exercices résolus Wissen corporation 46


Comme 7,5 n’est pas un nombre entier, on a :
𝑄1 = 𝑥𝑛𝑝 = 𝑥8 = 23

Q3 : 𝑛 = 30 𝑝 = 0,75 ⇒ 𝑛𝑝 = 22,5
Comme 22,5 n’est pas un nombre entier, on a :
𝑄3 = 𝑥𝑛𝑝 = 𝑥23 = 53

- Détermination de la valeur maximale et minimale


Val max=106 et val min=05

Le diagramme :

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 47


EXERCICES D’AUTO EVALUATION
EXERCICE 26

Dans une maternité de Kinshasa, un échantillon de femmes ayant accouché


par césarienne a été prélevé, on a observé les résultats suivants en nombre de
jours de séjour à l’hôpital :
5,5 7,5 11,3 7 8,3 10 9,5 6,5 10,5 11
7,0 8 ,4 10 8,2 8 9,6 9 8 10,5 10,3
6,5 9,1 6,0 8,5 7,5 9,1 9,2 8,5 11 9,5
12 8 9,5 6 9 10 11 5,8 9 10
7,1 8,5 11 8,3 9 9,7 10 9 10,6 10,4
1) Regrouper ces données en tranches d’amplitude constante
2) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
3) En utilisant la méthode de changement d’origine et d’unité, déterminer
la moyenne et l’écart-type de cette série statistique.
(Interro 2013-2014)

EXERCICE 27
a) En quoi consiste la méthode d’échantillonnage au moyen de tables de
nombre aléatoires ? (Chapitre I)
b) Considérons une entreprise E comportant deux établissements : E1 et
E2 qui emploient chacun 100 salariés. Au sein de l’établissement E1 le
salaire moyen est égal à 2500 euros avec un écart-type de 80. Au sein
de l’établissement E2 le salaire moyen est égal à 2000 euros avec un
écart-type de 110. Dans quelle entreprise selon vous le salaire est le
plus dispersé ?
(Interro)

EXERCICE 28
Dans une maternité de Kinshasa, un échantillon de 30 femmes ayant
accouché par césarienne a été prélevé, on a observé les résultats suivants en
nombre de jours de séjour à l’hôpital :
5,5 7,5 11,3 7 8,3 10 9,5 6,5 10,5 11
7,0 8,4 10 8,2 8 9,6 9 8 10,5 10,3
6,5 9,1 6,0 8,5 7,5 9,1 9,2 8,5 11 9,5

Statistique descriptive, exercices résolus Wissen corporation 48


1) Regrouper ces données en tranches d’amplitude constante.
2) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution.
3) En utilisant la méthode de changement d’origine et d’unité, déterminer
le séjour moyen et l’écart type de cette série statistique.
(Interro générale 2012-2013)

EXERCICE 29
Le tableau suivant donne la taille (en m) d’un échantillon de 40 étudiants
d’une école supérieure.
1,55 1,6 2,05 1,10 1,85 1,01 1,58 2,01 1,31 1,77
1,2 1,90 1,65 1,95 2,49 2,49 1,19 1,88 1,75 1,30
1,13 1,20 1,82 1,31 2,01 1,42 1,85 1,31 1,20 0,76
2,80 2,01 1,85 1,42 1,80 1,05 1,95 1,65 2,02 2,01
a) Regrouper ces données en tranches d’amplitude constante
b) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
c) En utilisant la méthode de changement d’origine et d’unité, déterminez
la taille moyenne et l’écart-type de cette série statistique.
d) Déterminer les quartiles Q1 et Q2 par la méthode graphique
(Interro générale 2013-2014)

EXERCICE 30

En 2004, la répartition en pourcentages de 50 ménages d’un quartier de


Kinshasa suivant le critère de leur revenu annuel s’établissait comme suit :
Revenu annuel (en 0-300 300-600 600-900 900- 1200-1500
$) 1200
Fréquences 20 30 50 80 100
cumulées (%)

a) Déterminer le nombre des ménages dont le revenu annuel maximal est


<600$
b) Cette série peut-elle être ajustée par une distribution normale ?
Justifier votre réponse en utilisant les approches numérique et
graphique.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 49


EXERCICE 31
Le tableau suivant donne la taille (en m) d’un échantillon de 40 étudiants
d’une école supérieure.
1,35 1,6 2,05 1,10 1,80 1,01 1,58 2,01 1,31 1,77
1,2 1,90 1,45 1,95 2,49 2,49 1,19 1,80 1,75 1,2
1,13 1,20 1,82 1,31 2,01 1,40 1,85 1,31 1,20 0,76
2,80 2,00 1,85 1,42 1,80 1,05 1,95 1,65 2,02 2,01
a) Regrouper ces données en tranches d’amplitude constante
b) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
c) En utilisant la méthode de changement d’origine et d’unité, déterminez
la taille moyenne et l’écart-type de cette série statistique.
(Interro générale 2011-2012)

EXERCICE 32
Encerclez la(les) bonne(s) réponse(s) : La mauvaise réponse annule la
bonne
a) Pour comparer des distributions de variables statistiques exprimées
dans les unités différentes, on peut utiliser les caractéristiques
suivantes :
i) La médiane
ii) L’étendue interquartile
iii) Le coefficient de variation
iv) Le rapport D9 / D1
b) Pour une série d’observations d’une variable statistique :
i) La somme des écarts à la moyenne est nulle
ii) L’écart absolu moyen à la moyenne est indicateur de dispersion
iii) La médiane de la série des écarts absolus à la moyenne est une
mesure de l’asymétrie
iv) Les trois quartiles sont des indicateurs de tendance centrale.
(Interro générale 2018-2019)

Statistique descriptive, exercices résolus Wissen corporation 50


EXERCICE 33

Considérons une entreprise E comportant deux établissements : E1 et E2 qui


emploient chacun 1050 salariés. Au sein de l’établissement E1 le salaire
moyen est égal à 2500 euros avec un écart-type de 80. Au sein de
l’établissement E2 le salaire moyen est égal à 2000 euros avec un écart-type
de 110. Dans quelle entreprise selon vous le salaire est le plus dispersé ?
Justifier

(Examen S1 2018-2019)

EXERCICE 34

On donne la série unidimensionnelle suivante correspondante à la


répartition des entreprises du secteur automobile en fonction de leur chiffre
en millions d’euros.
Chiffre [0; 0,25[ [0,25; 0,5[ [0,5; 1[ [1; 2,5[ [2,5; 5[ [5; 10[
d’affaire
Nombre 130 250 380 550 750 1000
cumulé
d’entreprises
a) Calculer le chiffre d’affaire moyen et l’écart-type de la série en utilisant
la méthode de changement d’origine et d’unité
b) Déterminer graphiquement la médiane et la proportion d’entreprises
dont le chiffre d’affaire est inférieur à 3 millions d’euros.
c) Examiner l’aplatissement de cette distribution
(Examen S1 2018-2019)

EXERCICE 35

On donne la série unidimensionnelle suivante correspondant à la répartition de


1000 entreprises du secteur automobile en fonction de leur chiffre d’affaire
en millions d’euros
Chiffre Moins [0,25; 0,5[ [0,5; 1[ [1; 2,5[ [2,5; 5[ [5; 10[
d’affaire de 0,25
Nombre 0,13 0,15 0,25 0,10 0,17 0,20
relatif
d’entreprises
a) Calculer le chiffre d’affaire moyen et l’écart-type de la série en utilisant
la méthode de changement d’origine et d’unité

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 51


b) Déterminer graphiquement la médiane et la proportion d’entreprises
dont le chiffre d’affaire est inférieur à 2 millions d’euros.
c) Examiner l’asymétrie de cette distribution. Commenter
(Examen S1 2018-2019)

EXERCICE 36

Considérons une entreprise E comportant deux établissements : E1 et E2 qui


emploient chacun 1200 salariés. Au sein de l’établissement E1 le salaire
moyen est égal à 1500 euros avec un écart-type de 82. Au sein de
l’établissement E2 le salaire moyen est égal à 2500 euros avec un écart-type
de 100. Dans quelle entreprise selon vous le salaire est le plus dispersé ?
Justifier
(Examen S1 2018-2019)

EXERCICE 37

Le tableau suivant donne la taille (en m) d’un échantillon de 40 étudiants


d’une école supérieure.
1,35 1,6 2,05 1,10 1,80 1,01 1,58 2,01 1,31 1,77
1,2 1,90 1,45 1,95 2,49 2,49 1,19 1,80 1,75 1,2
1,13 1,20 1,82 1,31 2,01 1,40 1,85 1,31 1,20 0,76
2,80 2,00 1,85 1,42 1,80 1,05 1,95 1,65 2,02 2,01
2,2 2,90 2,45 2,95 2,49 2,49 2,19 2,80 2,75 2,2

a) Regrouper ces données en tranches d’amplitude constante


b) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
c) En utilisant la méthode de changement d’origine et d’unité, déterminez la
taille moyenne et l’écart-type de cette série statistique.
(Interro 2013-2014)

Statistique descriptive, exercices résolus Wissen corporation 52


EXERCICE 38
Une enquête sanitaire dans la ville de Kinshasa a permis d’obtenir des
données sur l’âge (ans) d’un échantillon de personnes vivant avec le VIH.
Voici les résultats obtenus :
15 22 32 17 25 30 21 17 37 34
16 20 28 27 54 21 32 50 25 47
34 40 43 60 18 24 24 42 44 34
25 24 32 31 21 64 35 50 40 18
17 21 29 28 55 22 33 51 26 48
a) Regrouper ces données en tranches d’amplitude constante
b) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
c) En utilisant la méthode de changement d’origine et d’unité, déterminez
la taille moyenne et l’écart-type de cette série statistique.
(Interro 2013-2014)

EXERCICE 39
On relève la taille (en cm) de 60 étudiants d’une faculté de l’université de
Kinshasa. Les résultats trouvés sont consignés dans le tableau suivant :
158 172 166 170 168 175 152 190 197 157
163 160 149 180 188 172 173 184 181 180
172 169 171 173 171 180 198 167 175 177
170 173 168 167 169 180 181 178 160 164
150 168 166 162 170 182 183 190 167 169
170 160 171 188 168 169 172 157 149 180
1) Grouper ces données par classes d’amplitude 10cm du type suivant
[140; 150[; [150; 160[…
2) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
3) Calculer la taille moyenne, médiane, modale et le coefficient de
variation
4) Quelle est la proportion d’individus dont la taille est inférieure à 175
cm
(Interro)

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 53


EXERCICE 40

a) A quoi servent les mesures de tendance centrale ?


b) Quelle mesure de tendance centrale peut être déterminée quelle que
soit l’échelle de mesure ?
c) Dans quelle situation le mode n’est-il pas révélateur ?
d) Dans quelles circonstances groupe-t-on des données par classes ?
e) Quelle hypothèse avance-t-on lorsqu’on calcule la médiane de données
groupées par classes ?
f) Quelle mesure de dispersion est recommandée si est en présence des
deux séries ayant des unités différentes. Justifier.
(Interro)

Statistique descriptive, exercices résolus Wissen corporation 54


CHAPITRE 4 STATISTIQUE DESCRIPTIVE
BIVARIEE

EXERCICE 41
Afin d’étudier comment varie le coût de maintenant (Y) d’un tracteur en
fonction de l’âge (X) ce celui-ci on a collecté les données suivantes :
Age X 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20
(mois)
Coût 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60
annuel
(mois)
a) En représentant le nuage des points, montrer qu’il existe une
dépendance linéaire entre les deux variables ;
b) Quelle est l’intensité de cette liaison ?
c) Trouver la droite de régression estimée des moindres carrées de Y en x
qui s’ajuste au mieux sur le nuage des points observés.
d) Quel serait le coût de maintenance d’un tracteur ayant fonctionné
pendant une année ?

Résolution
𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
15 48 720 225 2304
8 43 344 64 1849
36 77 2772 1296 5929
41 89 3649 1681 7921
16 50 800 256 2500
8 40 320 64 1600
21 56 1176 441 3136
21 62 1302 441 3844
53 100 5300 2809 10000
10 47 470 100 2209
32 71 2272 1024 5041
17 58 986 289 3364
58 102 5916 3364 10404
6 35 210 36 1225
20 60 1200 400 3600
∑ = 𝟑𝟔𝟐 938 27437 12490 64926

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 55


a) Le nuage des points

b) L’intensité de la liaison
1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
𝑟= 1 1
√[∑ 𝑥 2 − (∑ 𝑥)2 ][∑ 𝑦 2 − (∑ 𝑦)2 ]
𝑛 𝑛

1
27437− 362× 938
15
= 1 1
√[12490− (362)2 ][64926− (938)2 ]
15 15

339 556
27437−
15
= 131044 879 844
√[12490− ][64926− ]
15 15

27437−22 637,06667
=
√[12 490−8 736,266667][64926−58 656,26667]

4 799,933333
=
√3 753,733333×6269,73333

4 799,933333
=
√23 534 906,99

4 799,933333
= 4 851,278903

𝑟 = 0,989416075
𝑟 ≅ 0,99

Statistique descriptive, exercices résolus Wissen corporation 56


c) La droite de régression de Y en x
La droite de régression est : 𝑦 = 𝑎 + 𝑏𝑥
1ere méthode :
La droite est donnée par la formule :
𝑦 − 𝑦̅ = 𝑏(𝑥 − 𝑥̅ )
∑𝑦 938
𝑦̅ = =
𝑛 15
∑𝑥 362
𝑥̅ = =
𝑛 15
1 1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
27437−15362× 938 4 799,933333
𝑏= 1 = 1 = 3 753,733333 = 1,28
∑ 𝑥 2 − (∑ 𝑥)2 12490−15(362)2
𝑛

La droite de régression est donnée par :


𝑦 − 𝑦̅ = 𝑏(𝑥 − 𝑥̅ )
938 362
𝑦− = 1,28 (𝑥 − )
15 15
938 463,36
𝑦− = 1,28𝑥 −
15 15
463,36 938
𝑦 = 1,28𝑥 − +
15 15

𝑦 = 1,28𝑥 + 31,64
𝑦 = 31,64 + 1,28𝑥
2e méthode
𝑦 = 𝑎 + 𝑏𝑥
1 1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
27437−15362× 938 4 799,933333
𝑏= 1 = 1 = 3 753,733333 = 1,28
∑ 𝑥 2 − (∑ 𝑥)2 12490−15(362)2
𝑛

938 362 474,64


𝑎 = 𝑦̅ − 𝑏𝑥̅ = − 1,28 × = = 31,64
15 15 15

La droite est donnée par :


𝑦 = 31,64 + 1,28𝑥
d) Si le tracteur fonctionne pendant une année, l’âge (x) vaut une année,
or 1 année= 12 mois, donc x=12.
Il suffit de remplacer x par 12 dans l’équation de la droite de régression :
𝑦 = 31,64 + 1,28𝑥
= 31,64 + 1,28 × 12
= 31,64 + 15,36

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 57


𝑦 = 47
Si le tracteur fonctionne pendant une année, le coût serait de 47

EXERCICE 42
Le tableau suivant donne l’indice des prix à la consommation pour la
nourriture et les dépenses de santé pour la période allant de 1975 à 1983,
cet indice étant fixé par rapport à 1967, où il est 100.
ANNEE 1975 1976 1977 1978 1979 1980 1981 1982 1983
ALIMENTATION 175 181 192 211 235 255 275 286 292
DEPENSES DE 169 185 202 219 240 266 295 329 357
SANTE

a) Existe-il un lien significatif entre les coûts de l’alimentation et les


dépenses de santé ? Justifier votre réponse
b) Evaluer, si possible, les dépenses de santé de l’année 1998 si l’on
suppose que les coûts d’alimentation s’élèvent à 310.
Résolution
Année 𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
1975 175 169 29575 30625 28561
1976 181 185 33485 32761 34225
1977 192 202 38784 36864 40804
1978 211 219 46209 44521 47961
1979 235 240 56400 55225 57600
1980 255 266 67830 65025 70756
1981 275 295 81125 75625 87025
1982 286 329 94094 81796 108241
1983 292 357 104244 85264 127449
∑ 2102 2262 551746 507706 602622

a) Calculons d’abord le coefficient de corrélation


1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
𝑟= 1 1
√[∑ 𝑥 2 − (∑ 𝑥)2 ][∑ 𝑦 2 − (∑ 𝑦)2 ]
𝑛 𝑛

1
551 746− ×2 102×2 262
9
= 2
√[507 706−1(2 102) ][602 622−1(2262)2 ]
9 9

4 754 724
551 746−
9
=
4 418 404 5 116 644
√[507706− ][602622− ]
9 9

Statistique descriptive, exercices résolus Wissen corporation 58


551 746−528 302,6667
=
√(507706−490933,7778)(602622−568516)

23 443,33333
=
√16 772,22222×34 106

23 443,33333
=
√572 033 411,1

23 443,33333
= 23 917,21997

= 0,980186382
𝑟 = 0,98
Il existe un lien significatif entre les coûts de l’alimentation et les dépenses
de santé car |𝑟| > 0,75
b) Avant d’évaluer, il faut d’abord trouver la droite de régression de Y en
x
𝑦 = 𝑎 + 𝑏𝑥
1 1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦 551 746− ×2 102×2 262 23 443,33333
𝑛 9
𝑏= 1 = 1 2 = 16 772,22222 = 1,4
∑ 𝑥 2 − (∑ 𝑥)2 507 706− (2 102)
𝑛 9

𝑎 = 𝑦̅ − 𝑏𝑥̅
∑𝑦 2262
𝑦̅ = =
9 9
∑𝑥 2102
𝑥̅ = =
9 9
938 362 474,64
= − 1,28 × = = 31,64
15 15 15
2262 2102
𝑎= − 1,4 ×
9 9
−6808
𝑎= = −75,64
9

La droite est donnée par l’équation 𝑦 = 1,4𝑥 − 75,64


Pour l’année 1998, si les coûts de l’alimentation s’élèvent à 310, alors les
dépenses de santé seraient :
𝑦 = 1,4 × 310 − 75,64
= 434 − 75,64
𝑦 = 358,36

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 59


EXERCICE 43
Le tourisme en Europe en 2009
Pays Nombre total des touristes Recette total :y
arrivant (en millions) : x
Allemagne 4,9 450
Espagne 4,1 70
France 5,5 400
Italie 8,6 500
Suisse 4,6 250

On demande :
1°) de construire le nuage des points et dire si un ajustement linéaire parait
vraisemblable
2°) d’établir les équations de régression de Y en x et de X en y
3°) de calculer le coefficient de corrélation et d’interpréter le résultat
Résolution
Pays 𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
Allemagne 4,9 450 2205 24,01 202500
Espagne 4,1 70 287 16,81 4900
France 5,5 400 2200 30,25 160000
Italie 8,6 500 4300 73,96 250000
Suisse 4,6 250 1150 21,16 62500
∑ 27,7 1670 10142 166,19 679900

a) Le nuage des points

En observant le nuage, on constate qu’un ajustement linéaire parait


vraisemblable

Statistique descriptive, exercices résolus Wissen corporation 60


2) Les équations de régression
La droite de régression de Y en x est donnée par :
𝑦 − 𝑦̅ = 𝑏(𝑥 − 𝑥̅ )
∑𝑦 1670
𝑦̅ = = = 334
𝑛 5
∑𝑥 27,7
𝑥̅ = = = 5,54
𝑛 5
1 1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦 10142− ×27,7×1670 890,2
𝑛 5
𝑏= 1 = 1 = 12,732 = 69,92
∑ 𝑥 2 − (∑ 𝑥)2 166,19− (27,7)2
𝑛 5

𝑦 − 𝑦̅ = 𝑏(𝑥 − 𝑥̅ )
𝑦 − 334 = 69,92(𝑥 − 5,54)
𝑦 − 334 = 69,92𝑥 − 387,36
𝑦 = 69,92𝑥 − 387,36 + 334
𝒚 = 𝟔𝟗, 𝟗𝟐𝒙 − 𝟓𝟑, 𝟑𝟔
La droite de régression de X en y
𝑦 = 69,92𝑥 − 53,36
69,92𝑥 = 𝑦 + 53,36
𝑦+53,36
𝑥= 69,92

1 53,36
𝑥 = 69,92 𝑦 + 69,92

𝑥 = 0,01𝑦 + 0,76
𝑥 = 0,76 + 0,01𝑦
3) Le coefficient de corrélation
1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
𝑟= 1 1
√[∑ 𝑥 2 − (∑ 𝑥)2 ][∑ 𝑦 2 − (∑ 𝑦)2 ]
𝑛 𝑛

1
10 142− ×27,7×1670
5
= 1 1
√[166,19− (27,7)2 ][679 900− (1670)2 ]
5 5

46 259
10 142−
5
=
767,29 2 788 900
√[166,19− ][679 900− ]
5 5

10 142−9 251,8
=
√(166,19−153,458)(679 900−557 780)

890,2
=
√12,732×122120

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 61


890,2
=
√1 554 831,84

890,2
=
1 246,928963

𝑟 = 0,71

La liaison entre les deux variables n’est pas significative car |𝑟| < 0,75

EXERCICE 44
On considère la distribution des salaires (𝑥𝑖 ) dans une firme électronique en
février 2006.
Salaire 1500- 1600- 1700- 1800- 1900- 2000- 2100- 2200- 2300- 2400- 2500-
(𝑥𝑖 ) 1600 1700 1800 1900 2000 2100 2200 2300 2400 2500 2600
Effectif 1 2 10 9 8 5 5 3 2 3 2

1°) Construire la courbe cumulative des fréquences relatives


2°) – Evaluer graphiquement la médiane et les quartiles
- Retrouver ces résultats par le calcul numérique
3°) Calculer le coefficient de variation de ces données. Commenter ;
4°) Analyser graphiquement l’asymétrie et l’aplatissement de cette distribution ;
5°) Le conseil d’administration de cette entreprise décide, pour le mois de mars
2006, d’une augmentation de de 2% des salaires ainsi que d’une prime
uniforme de 50FC. Soit 𝑍𝑖 les nouveaux salaires en mars 2006.
5.1) Etudier le degré de liaison entre 𝑧𝑖 𝑒𝑡 𝑥𝑖

5.2) Estimer, si possible 𝑧̅ 𝑒𝑡 𝑠(𝑧) : moyenne et écart type des salaires en mars
2006
Résolution
Salaire 𝑛𝑖 𝑥𝑖 𝑁𝑖 𝐹𝑖 (%) Marquage 𝑛𝑖 𝑥𝑖 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2
[1500; 1600[ 1 1550 1 2 1er 1550 193600
[1600; 1700[ 2 1650 3 6 2e -3e 3300 231200
[1700; 1800[ 10 1750 13 26 4e -13e 17500 576000
[1800; 1900[ 9 1850 22 44 14e -22e 16650 176400
[1900; 2000[ 8 1950 30 60 23e -30e 15600 12800
[2000; 2100[ 5 2050 35 70 31e -35e 10250 18000
[2100; 2200[ 5 2150 40 80 36e -40e 10750 128000
[2200; 2300[ 3 2250 43 86 41e -43e 6750 202800
[2300; 2400[ 2 2350 45 90 44e -45e 4700 259200
[2400; 2500[ 3 2450 48 96 46e -48e 7350 634800
[2500; 2600[ 2 2550 50 100 49e et 50e 5100 627200
∑ 50 99500 3060000

Statistique descriptive, exercices résolus Wissen corporation 62


1°) La courbe cumulative des fréquences relatives

2°) Pour déterminer les quartiles graphiquement, on utilise la formule


𝑖𝑛
𝑎𝑣𝑒𝑐 𝑖 = 1, 2, 3
4
𝑖𝑛 1×50
Pour Q1 : = = 12,5
4 4
𝑖𝑛 2×50
Pour Q2 : = = 20
4 4
𝑖𝑛 3×50
Pour Q3 : = = 37,5
4 4

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 63


Numériquement
1er quartile
Classe Q1=[1700; 1800[
𝑖𝑛
−𝑁𝑖−1
4
𝑄1 = 𝑙𝑖 + ℎ ( )
𝑛𝑖

𝑙𝑖 = 1700 ℎ = 100 𝑁𝑖−1 = 3 𝑛𝑖 = 10


1×50
−3
4
𝑄1 = 1700 + 100 ( )
10

𝑄1 = 1795
2e quartile ou médiane
Classe Q2 : [1900; 2000[
2𝑛
−𝑁𝑖−1
4
𝑄2 = 𝑙𝑖 + ℎ ( )
𝑛𝑖

𝑙𝑖 = 1900 ℎ = 100 𝑁𝑖−1 = 22 𝑛𝑖 = 8


1×50
−22
4
𝑄2 = 1900 + 100 ( )
8

Statistique descriptive, exercices résolus Wissen corporation 64


𝑄2 = 𝑀𝑒 = 1937,5
3e quartile
Classe Q3 : [2100; 2200[
3𝑛
−𝑁𝑖−1
4
𝑄3 = 𝑙𝑖 + ℎ ( )
𝑛𝑖

𝑙𝑖 = 2100 ℎ = 100 𝑁𝑖−1 = 35 𝑛𝑖 = 5


3×50
−35
4
𝑄3 = 2100 + 100 ( )
5

𝑄3 = 2150
3°) Coefficient de variation
𝑆
𝐶𝑉 = 𝑥̅ × 100

Trouvons d’abord la moyenne et l’écart-type


∑𝑛
𝑖=1 𝑛𝑖 𝑥𝑖 99500
𝑥̅ = = = 1990
𝑛 50

∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥̅ )
2 3 060 000
𝑆2 = = = 61 200
𝑛 50

𝑆 = √𝑆 2 = √61200 = 247,39
247,39
𝐶𝑉 = × 100
1990

𝐶𝑉 = 12,43%
La dispersion de cette distribution est faible car 𝐶𝑉 < 17%
4°)

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 65


La distribution n’est pas symétrique
5°) 𝑧𝑖 = 𝑥𝑖 + 2% 𝑑𝑒 𝑥𝑖 + 50
2
𝑧𝑖 = 𝑥𝑖 + 100 × 𝑥𝑖 + 50

𝑧𝑖 = 𝑥𝑖 + 0,02 𝑥𝑖 + 50
𝑧𝑖 = 1,02𝑥𝑖 + 50
𝑥𝑖 𝑧𝑖 𝑥𝑖 𝑧𝑖 𝑥𝑖 2 𝑧𝑖 2
1550 1631 2528050 2402500 2660161
1650 1733 2859450 2722500 3003289
1750 1835 3211250 3062500 3367225
1850 1937 3583450 3422500 3751969
1950 2039 3976050 3802500 4157521
2050 2141 4389050 4202500 4583881
2150 2243 4822450 4622500 5031049
2250 2345 5276250 5062500 5499025
2350 2447 5750450 5522500 5987809
2450 2549 6245050 6002500 6497401
2550 2651 6760050 6502500 7027801
22550 23551 49401550 47327500 51567131

1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 𝑧𝑖 −𝑛 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑧𝑖
𝑟= 2 2
1 1
√[∑𝑛 2 𝑛 𝑛 2 𝑛
𝑖=1 𝑥𝑖 −𝑛 (∑𝑖=1 𝑥𝑖 ) ][∑𝑖=1 𝑧𝑖 −𝑛 (∑𝑖=1 𝑧𝑖 ) ]

1
49401550− ×22550×23551
11
= 1 1
√[47327500− (22550)2 ][51 567 131− (23551)2 ]
11 11

𝑟=1
La liaison entre les deux variables est parfaite
Avant d’estimer, nous devons trouver l’équation de la droite de régression
𝑧 = 𝑎 + 𝑏𝑥
1 1
∑ 𝑥𝑧− ∑ 𝑥 ∑ 𝑧
𝑛
49401550−11×22550×23551 1 122 000
𝑏= 1 = 1 = 1 100 000 = 1,02
∑ 𝑥 2 − (∑ 𝑥)2 47327500−11 (22550)2
𝑛

𝑎 = 𝑧̅ − 𝑏𝑥̅
∑𝑧 23551
𝑧̅ = = = 2141
9 11
∑𝑥 22 550
𝑥̅ = = = 2050
9 11

𝑎 = 2141 − 1,02 × 2050 = 50

Statistique descriptive, exercices résolus Wissen corporation 66


La droite est donnée par l’équation 𝑧 = 1,02𝑥 + 50
En se référant à la sous question 3, on a :
𝑥̅ = 1990 ⇒ 𝑧̅ = 1,02 × 1990 + 50

𝑧̅ = 2 079,8
𝑆 = 247,39 ⇒ 𝑠(𝑧) = 1,02 × 247,39 + 50
𝑠(𝑧) = 302,34

EXERCICE 45
Un laboratoire pharmaceutique souhaite connaitre l’efficacité d’un toxique T
par le temps de survie des souris auxquelles on l’administre. Les résultats
observés sur un lot de 10 souris figurent dans le tableau suivant :
Dose de T (en mg) 1 2 3 4
Temps de survie 7 4 1 2
(en heures) 8 5 3
6 6 3
a) Représenter graphiquement le nuage des points observés ;
b) Vérifier s’il existe une liaison statistique significative entre la dose du
toxique T et le temps de survie des souris auxquelles on l’administre.
c) Quel est le temps de survie d’une souris à laquelle on aurait
administré une dose de 8 mg de ce toxique T ? Commenter et justifier
votre réponse.
(Interro générale 2013-2014)

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 67


Résolution
a)

b)
𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖 2 𝑦𝑖 2
1 7 7 1 49
1 8 8 1 64
1 6 6 1 36
2 4 8 4 16
2 5 10 4 25
2 6 12 4 36
3 1 3 9 1
3 3 9 9 9
3 3 9 9 9
4 2 8 16 4
22 45 80 58 249

1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑛
𝑟= 1 2 1 2
√[∑𝑛 2 𝑛 𝑛 2 𝑛
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 ) ][∑𝑖=1 𝑦𝑖 − (∑𝑖=1 𝑦𝑖 ) ]
𝑛 𝑛

1
80− ×22×45
10
= 1 1
√[58− ×(22)2 ][249− ×(45)2 ]
10 10

80−99 −19
= =
√9,6×46,5 √446,4

𝑟 = −0,8992 ≅ −0,90
Il existe une liaison statistique significative entre la dose du toxique T et
le temps de survie des souris auxquelles l’on administre car |𝑟| ≥ 0,75

Statistique descriptive, exercices résolus Wissen corporation 68


c) 𝑦 = 𝑎 + 𝑏𝑥
1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑛
𝑏= 1 2
∑𝑛 2 𝑛
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
𝑛
1
80− ×22×45 −19
10
= 1 =
58− ×(22)2 9,6
10
𝑏 = −1,98
𝑎 = 𝑦̅ − 𝑎𝑥̅
22 45
= 10 − (−1,98) × 10
𝑎 = 11,11

𝑦 = 11,11 − 1,98𝑥

Si la dose est de 8 mg, le temps de survie serait :


𝑦 = −1,98 × 8 + 11,11
𝑦 = −4,73 ℎ𝑒𝑢𝑟𝑒𝑠
Le temps étant négatif ; ça montre que la souris ne peut pas survivre
avec cette dose.

EXERCICE 46
On donne un tableau à double entrée relatif à l’étude de la série double
suivante :
y x 156-160 161-165 166-170 171-175
46-50 16 8 2 0
51-55 3 18 5 1
56-60 1 5 10 5
61-65 0 3 8 5

a) Déterminer les distributions marginales


b) Déterminer la distribution conditionnelle de Y sachant que x
appartient à l’intervalle 56-60
c) Déterminer la distribution conditionnelle de X sachant que y
appartient à l’intervalle 161-165.
d) Les deux caractères statistiques x et y sont-ils indépendants ?
Justifier.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 69


Résolution
a) La distribution marginale en y :
𝑦𝑗 156-160 161-165 166-170 171-175
𝑛.𝑗 20 34 25 11

La distribution marginale en x
𝑥𝑖 46-50 51-55 56-60 61-65
𝑛𝑖. 26 27 21 16

b) La distribution conditionnelle de Y sachant que x appartient à


l’intervalle 56-60
𝑌𝑗 156-160 161-165 166-170 171-175
𝑛𝑖𝑗 1 5 10 5

Ou soit en % :
𝑌𝑗 156-160 161-165 166-170 171-175
𝑛𝑖𝑗 4,76 23,81 47,62 23,81

c) La distribution conditionnelle de X sachant que y appartient à


l’intervalle 161-165.
𝑋𝑖 46-50 51-55 56-60 61-65
𝑛𝑖𝑗 8 18 5 3
Ou soit en %
𝑋𝑖 46-50 51-55 56-60 61-65
𝑛𝑖𝑗 23,53 52,94 14,71 8,82

d) Les deux caractères sont indépendants si ∀ 𝑖, 𝑗 on a :


𝑛𝑖. ×𝑛.𝑗
𝑛𝑖𝑗 = 𝑛

Pour i=j=1, on a :
𝑛11 = 16 𝑛1. = 26 𝑛.1 = 20 𝑛 = 90
26×20
16 ≠ 90

16 ≠ 5,78
Donc les deux caractères ne sont pas indépendants

Statistique descriptive, exercices résolus Wissen corporation 70


EXERCICE 47
Dans une population constituée des entreprises, on a procédé à l’étude
simultanée de deux caractères statistiques quantitatifs : x le nombre d’unités
de production et y le nombre de salariés.
Les effectifs obtenus figurent dans le tableau à double entrée ci-contre :
Y x [1 − 500[ [500 − 1000[ [1000 − 2000[ ≥ 2000
1 450 40 30 5
2 40 40 40 5
≥3 10 20 30 10

a) Déterminer les distributions marginales de x et de y


b) Représenter les données par un nuage des points en assimilant à 3 la
dernière classe de x et à 2000 la dernière classe de y
c) Déterminez, en pourcentages, les diverses distributions conditionnelles
de X pour Y=y1 et Y=y2 ; commenter les résultats obtenus
d) Les deux caractères statistiques sont-ils indépendants ? justifier
Résolution
a) Distribution marginale de x
𝑥𝑖 1 2 ≥3
𝑛𝑖. 525 125 70

Distribution marginale de y
𝑦𝑗 [1 − 500[ [500 − 1000[ [1000 − 2000[ ≥ 2000
𝑛.𝑗 500 100 100 20

b) Réservée au lecteur
c) Distributions conditionnelles de X

Pour 𝑌 = 𝑦1 ⇔ 𝑌 = [1 − 500[

𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 450 40 10

En %

𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 90 8 2

Pour 𝑌 = 𝑦1 ⇔ 𝑌 = [500 − 1000[


𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 40 40 20

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 71


En %

𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 40 40 20

d) Les deux caractères sont indépendants si ∀ 𝑖, 𝑗 on a :


𝑛𝑖. ×𝑛.𝑗
𝑛𝑖𝑗 = 𝑛

Pour i=j=1, on a :
𝑛11 = 450 𝑛1. = 525 𝑛.1 = 500 𝑛 = 720
525×500
450 ≠ 720

450 ≠ 364,58
Donc les deux caractères ne sont pas indépendants

EXERCICE 48
On donne le tableau à double entrée relatif à l’étude des voitures de petite
cylindrée circulant dans Kinshasa en 1992, classées en pourcentage, par
rapport aux deux caractères suivants : x=puissance de la voiture en chevaux
et y=durée moyenne de vie des pneus.
X y 2 3 4

20 1 7 30
25 5 20 7
30 25 3 2

a) Déterminer les distributions marginales de x et y


b) Déterminer la distribution conditionnelle de Y sachant de x=3
Résolution
a) La distribution marginale de Y
𝑦𝑖 20 25 30
𝑛𝑖. 38 32 30

La distribution marginale de X :
𝑋𝑗 2 3 4
𝑛.𝑗 31 30 39

b) Réservée au lecteur

Statistique descriptive, exercices résolus Wissen corporation 72


EXERCICE 49
Le tourisme en Europe en 2016
Pays Nombre total des Recette total : y
touristes arrivant : x (en (en millions €)
millions)
Allemagne 9 450
Espagne 7 350
France 10 520
Italie 13 600
Suisse 5 250
On demande :
1°) Existe-t-il une liaison statistique entre les deux variables ?
2°) si oui, Calculer le coefficient de corrélation et interpréter le résultat
trouvé.
3°) Etablir l’équation de Régression de Y en x;
4°) A quelle recette s’attendrait-on pour 20.000 touristes arrivant dans un
des pays ?
5°) Etablir l’équation de Régression de X en y;

Résolution
𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖 2 𝑦𝑖 2
9 450 4050 81 202500
7 350 2450 49 122500
10 520 5200 100 270400
13 600 7800 169 360000
5 250 1250 25 62500
44 2170 20750 424 1017900

1°) Construisons le nuage des points pour déduire s’il existe une liaison
entre les deux variables

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 73


Oui, il existe une liaison entre les deux variables
1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
2°) 𝑟 = 1
𝑛
2 1 2
√[∑𝑛 2 𝑛 𝑛 2 𝑛
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 ) ][∑𝑖=1 𝑦𝑖 − (∑𝑖=1 𝑦𝑖 ) ]
𝑛 𝑛

1
20 750− ×44×2 170
5
= 1 1
√[424− (44)2 ][1 017 900− (2170)2 ]
5 5

95 480
20 750−
5
=
1 936 4 708 900
√[424− ][1 017 900− ]
5 5

20 750−19 096
=
√(424−387,2)(1 017 900−941 780)

1 654
=
√36,8 ×76 120
1 654
=
√2 801,216

1 654
= 1 673,683363

𝑟 = 0,99
La liaison entre les variables est significative car |𝑟| ≥ 0,75
3°) L’équation de la droite de régression de Y en x
𝑦 = 𝑎𝑥 + 𝑏
1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑛
𝑎= 1 2
∑𝑛 2 𝑛
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
𝑛
1
20 750− ×44×2 170 1 654
5
= 1 =
424− (44)2 36,8
5
𝑎 = 44,95

𝑏 = 𝑦̅ − 𝑎𝑥̅
∑𝑛
𝑖=1 𝑦𝑖 2170
𝑦̅ = = = 434
𝑛 5
∑𝑛
𝑖=1 𝑥𝑖 44
𝑥̅ = = = 8,8
𝑛 5
𝑏 = 434 − 44,95 × 8,8
434 − 395,56
𝑏 = 38,44
L’équation de la droite de régression de y en x est :
𝑦 = 44,95𝑥 + 38,44

Statistique descriptive, exercices résolus Wissen corporation 74


4°) Pour 20 000 touristes, x était donné en millions de touristes,
20 0000
Donc pour 20 000 touristes, 𝑥 = 1000 000 = 0,02

Il suffit de remplacer cette valeur dans l’équation de régression


𝑦 = 44,95𝑥 + 38,44
= 44,95 × 0,02 + 38,44
= 0,899 + 38,44
𝑦 = 39,339
La recette à attendre pour 20 000 touristes est 39, 339 millions d’euros
5°) L’équation de régression de x en y
On peut la déduire à partir de l’équation de régression de y en x
𝑦 = 44,95𝑥 + 38,44
44,95𝑥 = 𝑦 − 38,44
𝑦−38,44
𝑥= 44,95

1 38,44
𝑥 = 44,95 𝑦 − 44,95

𝑥 = 0,02𝑦 − 0,85

EXERCICE 50
On donne le tableau à double entrée relative à l’étude de la série double
suivante :
Y [156-161[ [161-166[ [166-171[ [171-176[
X
[46-51[ 10 6 14 0
[51-56[ 16 12 5 1
[56-61[ 2 4 6 17
[61-66[ 1 5 8 14

1. Déterminer toutes les distributions marginales.


2. Déterminer la distribution conditionnelle de Y sachant que x appartient à
l’intervalle [56-61[.
3. Déterminer la distribution conditionnelle de X sachant que y appartient à
l’intervalle [161-166[.
4. Les deux caractères statistiques X et Y sont-ils indépendants ? justifier.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 75


Résolution
1°) Les distributions marginales
Distribution marginale de x
𝑥𝑖 [46 − 51[ [51 − 56[ [56 − 61[ [61 − 66[
𝑛𝑖. 30 34 29 28
Distribution marginale de y
𝑦𝑗 [156 − 161[ [161 − 166[ [166 − 171[ [171 − 176[
𝑛.𝑗 29 27 33 32

2°) La distribution conditionnelle de Y sachant que x appartient à l’intervalle


de [56-61[
𝑦𝑗 [156 − 161[ [161 − 166[ [166 − 171[ [171 − 176[
𝑛𝑖𝑗 2 4 6 17

Ou en %
𝑦𝑗 [156 − 161[ [161 − 166[ [166 − 171[ [171 − 176[
𝑛𝑖𝑗 6,9 13,79 20,69 58,62

3°) La distribution conditionnelle de X sachant que y appartient à l’intervalle


[161 − 166[

𝑥𝑖 [46 − 51[ [51 − 56[ [56 − 61[ [61 − 66[


𝑛𝑖𝑗 6 12 4 5

Ou en %
𝑥𝑖 [46 − 51[ [51 − 56[ [56 − 61[ [61 − 66[
𝑛𝑖𝑗 22,22 44,44 14,81 18,52

4°) Les deux caractères sont indépendants si ∀ 𝑖, 𝑗 on a :


𝑛𝑖. ×𝑛.𝑗
𝑛𝑖𝑗 = 𝑛

Pour i=j=1, on a :
𝑛11 = 10 𝑛1. = 30 𝑛.1 = 29 𝑛 = 121
30×29
10 ≠ 121

10 ≠ 7,19
Donc les deux caractères ne sont pas indépendants

Statistique descriptive, exercices résolus Wissen corporation 76


EXERCICES D’AUTO EVALUATION

EXERCICE 51
Les données suivantes représentent les poids (Kg) de huit femmes avant et
après qu’elles aient été soumises à un régime d’amaigrissement pendant 5
semaines.
POIDS 148 170 127 151
AVANT 168
POIDS 144 164 126 139
APRES 145 127 140
1) Représenter le nuage des points correspondants à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Quel serait le résultat de la deuxième pesée d’une femme dont le poids
initial serait de 180 Kgs ?
(Interro générale 2014-2015)

EXERCICE 52
Le cout « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies dans un
échantillon d’activités sont consignées dans le tableau suivant :
X 230 250 165
235 170
243 155
Y 120 130
135 140 150
110 145
a) Représentez graphiquement le nuage de points observés de cette
distribution.
b) La relation entre les deux variables est-elle étroite ? Justifiez votre
réponse.
c) Estimez la production correspondant à 345 unités.
(Examen S2 2015-2016)

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 77


EXERCICE 53
On effectue un dosage par deux méthodes A et B sur les mêmes sujets
Méthode A 0,60 0,65 0,70 0,75
0,61
Méthode B 0,62 0,61 0,60 0,75
0,63 0,63 0,71
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux méthodes sont-ils corrélés ?
3) Quel serait le résultat du deuxième dosage si la première méthode
donnait la valeur de 1,15 ?
(Interro générale 2014-2015)

EXERCICE 54
Le cout « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies dans un
échantillon des 16 activités sont consignées dans le tableau suivant :
X 10 20 30 40 50 60 70 80
Y 285 425 580 905 905 1335 1340 1710
275 435 570 1340 1270 1660
575 1300
1) Représenter le nuage des points. Commenter
2) La relation entre les 2 variables est-elle étroite ? Justifier votre
réponse.
3) Estimer le coût d’une activité correspondant à 120 unités.
(Interro 2009-2010)

Statistique descriptive, exercices résolus Wissen corporation 78


EXERCICE 55
Les données suivantes représentent les poids (Kg) de vingt femmes avant et
après qu’elles aient été soumises à un régime d’amaigrissement pendant 5
semaines.
POIDS 148 170 127 151 145 150 142 155 162 115
AVANT 168 116
POIDS 144 164 126 139 132 144 140 154 155 114
APRES 145 127 140 135 146 142 156 157
1) Représenter le nuage des points correspondants à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
4) Trouver le point d’intersection des droites de régression de y en x et de
x en y
5) Quel serait le résultat de la deuxième pesée d’une femme dont le poids
initial serait de 180 Kgs ?
(Interro générale 2011-2012)

EXERCICE 56
Le tableau suivant présente l’évolution des indices de prix à la
consommation (IPC) et l’évolution des indices des SMIC.
IPC 102,3 102,0 105,2 106,0 107,3 109,4 112,2 113,8
SMIC 101,6 103,6 104,9 108,2 109,8 109,8 112,4 114,1

1) Tracer le diagramme du nuage des points correspondant à ces


données. Commenter
2) Analyser le degré de liaison entre les deux variables
3) Pour une année donnée, l’IPC s’élève à 132, à quel niveau pouvez-vous
estimer le SMIC ?
(Interro 2016-2017)

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 79


EXERCICE 57
On effectue un dosage, par deux méthodes A et B, sur les mêmes 10 sujets.
Méthode A 0,60 0,65 0,70 0,75 0,8
Méthode B 0,61 0,61 0,6 0,75 0,8
0,65 0,65 0,7
0,71
0,62

1) Représenter le nuage des points correspondant à ces données. Quelle


est la conclusion en tirez-vous ?
2) Les résultats de deux méthodes sont-ils corrélés au seuil de
signification de 5% ?
3) Quel serait le résultat du deuxième dosage si la première méthode
donnait la valeur de 1,15 ?
(Examen S2 2016-2017)

EXERCICE 58
La quantité d’aliments « y » consommée par un échantillon des poules
pondeuses d’une basse-cour peut être considérée comme une fonction
linéaire de l’âge d’entrée en ponte. Les données numériques résultant de
l’observation figurent dans le tableau suivant :
X(en 20 24 32 27 23
semaines)
21 25
Y (en Kg) 8,5 12,3 19,5 15,6 10,5
14

a) Représenter le nuage des points. Commenter


b) La corrélation entre les deux variables est-elle étroite ? Justifier.
c) Estimer si possible, la quantité d’aliments consommés par une poule
pondeuse âgée de douze mois
(Interro)

Statistique descriptive, exercices résolus Wissen corporation 80


EXERCICE 59
Le coût « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies sur
un échantillon de 8 activités sont enregistrés dans le tableau suivant :
X 30 40 50 60
30 42
Y 210 255285 430
275 430
1) Représenter le diagramme de dispersion
2) La relation entre les 2 variables est-elle étroite ? Justifier votre
réponse.
3) Estimer le coût d’une activité correspondant à 200 unités.
(Examen S1 2012-2013)

EXERCICE 60
Le coût « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies sur
un échantillon de 8 activités sont enregistrés dans le tableau suivant :
X 10 20 30 40
20 22
Y 210 255280 430
270 430
1) Représenter le diagramme de dispersion
2) La relation entre les 2 variables est-elle étroite ? Justifier votre
réponse.
3) Estimer le coût d’une activité correspondant à 200 unités.
(Examen S1 2012-2013)

EXERCICE 61
On effectue un dosage par deux méthodes A et B sur les mêmes 10 sujets
Méthode A 0,60 0,65 0,70 0,75 0,8
0,61 0,78
Méthode B 0,62 0,61 0,60 0,75 0,8
0,63 0,63 0,71
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux méthodes sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 81


4) Quel serait le résultat du deuxième dosage si la première méthode
donnait la valeur de 1,15 ?
(Interro générale 2012-2013)

EXERCICE 62
On effectue un dosage, par deux méthodes A et B sur les mêmes 20
sujets
Méthode 0,60 0,65 0,70 0,75 0,8 0,87 0,78 0,92 0,90 0,91
A 0,61 0,78
Méthode 0,62 0,61 0,60 0,75 0,80 0,82 0,77 0,85 0,83 0,79
B 0,63 0,63 0,71 0,81 0,75 0,82 0,81 0,75
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion tirez-vous ?
2) Les résultats de deux méthodes sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison
4) Quel serait le résultat du deuxième dosage si la première méthode
donnait la valeur de 1,15 ?
(Interro 2012-2013)

EXERCICE 63
La quantité d’aliments « y » consommée par un échantillon des poules
pondeuses d’une basse-cour peut être considérée comme une fonction
linéaire de l’âge d’entrée en ponte. Les données numériques résultant de
l’observation figurent dans le tableau suivant :
X(en 20 24 32 27 23
semaines)
Y (en Kg) 8,5 12,3 19,5 15,6 10,5
14
a) Représenter le nuage de points. Commenter
b) Estimer si possible, la quantité d’aliments consommés par une poule
pondeuse de 10 mois.
(Examen S1 2018-2019)

Statistique descriptive, exercices résolus Wissen corporation 82


EXERCICE 64
La quantité d’aliments « y » consommée par un échantillon des poules
pondeuses d’une basse-cour peut être considérée comme une fonction
linéaire de l’âge d’entrée en ponte. Les données numériques résultant de
l’observation figurent dans le tableau suivant :
X(en 22 25 32 20 24
semaines)
Y (en Kg) 9,6 13,1 19,5 8,8 12,2
11,3
a) Représenter le nuage de points. Commenter
b) Estimer si possible, la quantité d’aliments consommés par une poule
pondeuse de dix mois.
(Examen S1 2018-2019)

EXERCICE 65
Le cout « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies dans un
échantillon d’activités sont consignées dans le tableau suivant :
X 10 20 30 40 50 60 70 80 90 100
20 22
Y 210 255 280 420 520 580 910
1020 1300 1700
270 500 570
1000 1650
420 900 1280
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
(Interro et TD)

EXERCICE 66
On effectue un dosage, par deux méthodes A et B, sur les mêmes sujets :
Méthode 0,60 0,65 0,70 0,75 0,8 0,87 0,78 0,92 0,90 0,91
A 0,61 0,78
Méthode 0,61 0,60 0,75 0,82 0,77 0,85 0,83 0,79
B 0,62 0,63 0,71 0,80 0,75 0,81
0,63 0,81 0,82 0,75
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?

Statistique descriptive, exercices résolus Aimé DIUMI DIKOLO 83


2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
(Interro et TD)

EXERCICE 67
Les données suivantes représentent les poids (Kgs) de femmes avant et après
qu’elles aient été soumises à un régime d’amaigrissement pendant 5
semaines.
POIDS 148 170 127 151 145 150 142 155 162 115
AVANT 168 116
POIDS 144 126 139 132 144 140 154 155 114
APRES 145 164 140 146 156
127 135 142 157
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
(Interro)
(TD)

Ce livre est en cours de rédaction,


vos remarques et suggestions nous
seront très utiles pour améliorer la
version finale.

Statistique descriptive, exercices résolus Wissen corporation 84

Vous aimerez peut-être aussi