Académique Documents
Professionnel Documents
Culture Documents
t
a
STATISTIQUE DESCRIPTIVE
A
i
m
é
D
I
U
M
I
yyyy
AVANT PROPOS
Wissen Corporation
C’est un groupe formé essentiellement de meilleurs étudiants de nos
groupes d’étude et d’encadrement qui se sont fixés plusieurs objectifs dont le
premier est celui du partage de la connaissance en Informatique et en
mathématiques. Ainsi, pour atteindre notre premier objectif, nous
organisons des formations essentiellement gratuites pour partager le peu
que nous connaissons avec les autres. Car la connaissance, c’est comme un
chandelier, sa lumière ne diminue pas s‘il allume un autre chandelier.
Pour faire partie de Wissen, l’étudiant doit démontrer son savoir-faire
et son amour pour la connaissance pendant les cours d’encadrement etc…
Pour les externes désirant intégrer Wissen, ils doivent passer pas un test,
car ne suivant pas régulièrement les cours avec nous, c’est le seul moyen
d’apprécier leur savoir-faire et leur amour pour la connaissance.
Le cerveau est bien une richesse que nous avons tous en commun,
mais c’est son utilisation qui distingue les hommes …Parfois, il n’existe pas
de gens plus intelligents que les autres, mais c’est le travail qui nous
différencie. Pour bâtir haut, il faut creuser profond et tu seras fort dans ce
que tu te donnes.
Il y a une naissance en toute connaissance, Thucydide a dit : « Avoir
des connaissances sans les partager, c’est se mettre au niveau de celui qui
n’a pas d’idées ». Wissen Corporation est là pour assurer votre formation,
votre encadrement suivant vos désirs.
L’auteur
+243 81 083 46 16
𝑛 = 100
𝑁 = 20000 + 9600 + 7000 + 6200 + 3500 + 8900 = 55200
Pour l’Unikin Pour l’Upn
20000 6200
𝑛1 = 55200 × 100 = 36,23 ≅ 36 𝑛4 = 55200 × 100 = 11,23 ≅ 11
Il faut que 𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 + 𝑛6 = 𝑛
36+17+13+11+6+16=99≠ 100
Comme il manque une unité, on doit ajouter cela dans une Strate au choix,
j’ajoute ça dans Isc, donc dans l’Isc on va tirer 18 étudiants.
Comme nous savons le nombre d’étudiants à tirer dans chaque Strate, on
peut utiliser la méthode Systématique pour le tirage.
𝑟 = 555,56 ≅ 556
Choix de base : 1 ≤ 𝑏 ≤ 𝑟 ⇔ 1 ≤ 𝑏 ≤ 556. On est libre de choisir un nombre
compris entre 1 et 556 comme base.
Nous choisissons 𝑏 = 10. Donc les étudiants sélectionnés à l’Unikin sont
ceux ayant les numéros suivants :
10, 566, 1122, 1678, 2234, 2790, 3346, 3902, 4458, 5014, 5570, 6126,
6682, 7238, 7794, 8350, 8906, 9462, 10018, 10574, 11130, 11686, 12242,
12798, 13354, 13910,14466, 15022, 15578, 16134, 16690, 17246, 17802,
18358, 18914, 19470.
Tirage pour l’Isc
𝑁
𝑟= 𝑛
9600
= 18
𝑟 = 533,33 ≅ 533
Choix de base : 1 ≤ 𝑏 ≤ 𝑟 ⇔ 1 ≤ 𝑏 ≤ 533.
Nous choisissons 𝑏 = 500. Donc les étudiants sélectionnés à l’Isc sont ceux
ayant les numéros suivants :
500, 1033, 1566, 2099, 2632, 3165, 3698, 4231, 4764, 5297, 5830, 6363,
6896, 7429, 7962, 8495, 9028, 9561.
Tirage pour l’Ista
𝑁
𝑟= 𝑛
7000
= 13
𝑟 = 538, 46 ≅ 538
Choix de base : 1 ≤ 𝑏 ≤ 𝑟 ⇔ 1 ≤ 𝑏 ≤ 538.
Nous choisissons 𝑏 = 100. Donc les étudiants sélectionnés à l’Isc sont ceux
ayant les numéros suivants :
100, 638, 1176, 1714, 2252, 2790, 3328, 3866, 4404, 4942, 5480, 6018,
6556.
La suite est réservée au lecteur.
Choix de la base
1 ≤ 𝑏𝑎𝑠𝑒 ≤ 𝑟 ⇔ 1 ≤ 𝑏𝑎𝑠𝑒 ≤ 33
On choisit la base=5
Donc les ordinateurs qui feront partie de l’échantillon sont ceux ayant les
numéros suivant :
5, 38, 71, 104, 137, 170, 203, 236, 269, 302, 335, 368, 401, 434, 467, 500,
533, 566, 599, 632, 665, 698, 731, 764, 797, 830, 863, 896, 929 et 962.
EXERCICE 3
Considérer une population hétérogène de N=2500 individus et décomposable
en 5 States 𝐶1 , 𝐶2, , … , 𝐶5 respectivement de 𝑁1 = 600, 𝑁2 = 450, 𝑁3 = 900, 𝑁4 =
170 et 𝑁5 = 380 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠. On souhaite en extraire un échantillon
représentatif de taille n=250 individus. Comment procéder ?
Résolution
Nous allons utiliser la méthode de stratification.
Calculons d’abord le nombre d’individus à tirer dans chaque strate.
𝑁𝑖
𝑛𝑖 = ×𝑛
𝑁
N=2500
n=250
600
𝑛1 = 2500 × 250 = 60 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠
450
𝑛2 = × 250 = 45 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑠
2500
𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 = 250
Maintenant, on peut procéder au tirage dans chaque Strate
Tirage au C1
On attribue des numéros aux individus
Ensuite, on calcule la raison
600
𝑟= = 10
60
Pour l’ISC
9350
𝑛2 = 47828 × 80 = 15,64 Pour les autres
8673
𝑛2 ≅ 16 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠 𝑛5 = 47828 × 80 = 14,51
𝑛5 ≅ 14 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
Pour l’ISTA
7180
𝑛3 = 47828 × 80 = 12,01
𝑛3 ≅ 12 é𝑡𝑢𝑑𝑖𝑎𝑛𝑡𝑠
𝑛1 + 𝑛2 + 𝑛3 + 𝑛4 + 𝑛5 = 33 + 16 + 12 + 5 + 14 = 80
Ensuite, on procède au tirage dans chaque Strate (université ou institut
supérieur)
Tirage pour l’UNIKIN
Premièrement, il faut attribuer un numéro à chaque étudiant, puis calculer
la raison
Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 597
⇔ 𝑏 ∈ [1; 597]
On choisit b=5
Les étudiants de l’UNIKIN qui feront partie de l’échantillon sont ceux ayant
les numéros suivants :
5, 602, 1199, 1796, 2393, 2990, 3587, 4184, 4781, 5378, 5975, 6572, 7169,
7766, 8363, 8960, 9557, 10154, 10751, 11348, 11945, 12542, 13139,
13736, 14333, 14930, 15527, 16124, 16721, 17318, 17915, 18512 et
19109.
Tirage pour l’ISC
9350
𝑟= = 584,37 ≅ 584
16
Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 584
⇔ 𝑏 ∈ [1; 584]
On choisit b=10
Les étudiants qui feront partie de l’échantillon pour l’ISC sont ceux qui ont
les numéros suivants :
10, 594, 1178, 1762, 2346, 2930, 3514, 4098, 4682, 5266, 5850, 6434,
7018, 7602, 8186 et 8770.
Tirage pour l’ISTA
7180
𝑟= = 598,33 ≅ 598
12
Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 598
⇔ 𝑏 ∈ [1; 598]
On choisit b=500
Les étudiants qui feront partie de l’échantillon pour l’ISTA sont ceux qui ont
les numéros suivants :
500, 1098, 1696, 2294, 2892, 3490, 4088, 4686, 5284, 5882, 6480 et 7078.
Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 585
⇔ 𝑏 ∈ [1; 585]
On choisit b=100
Les étudiants qui feront partie de l’échantillon pour l’UPC sont ceux qui ont
les numéros suivants :
100, 685, 1270, 1855 et 2440
Pour les autres universités et instituts
8673
𝑟= = 619,5 ≅ 620
14
Choix de la base : 1 ≤ 𝑏 ≤ 𝑟
⇔ 1 ≤ 𝑏 ≤ 620
⇔ 𝑏 ∈ [1; 620]
On choisit b=200
Les étudiants qui feront partie de l’échantillon pour l’UPC sont ceux qui ont
les numéros suivants :
200, 820, 1440, 2060, 2680, 3300, 3920, 4540, 5160, 5780, 6400, 7020,
7640 et 8260.
EXERCICE 5
Indiquer en justifiant de quels types sont les variables présentées ci-
dessous : qualitatives ordinales ou nominales, quantitatives discrètes ou
quantitatives continues :
- La race des populations dans le monde
- Le nombre de cours dans une université
- La température d’un processeur
- La durée de vie d’un ordinateur
- La définition d’un écran : Haute définition(HD), Full HD, Ultra
HD(UHD).
EXERCICE 6
Un quartier de la commune de N’djili comprend 5 avenues. La répartition des
parcelles est donnée dans le tableau suivant :
N° avenue Nombre de parcelles Disposition des parcelles
A gauche A droite
1 30 15 15
2 25 12 13
3 35 20 15
4 20 10 10
5 15 10 5
Un étudiant de G1 Informatique désire mener une enquête sur le nombre de
téléphone en fonctionnement dans 50 parcelles.
1°. A quelle méthode va-t-il recourir en vue de constituer un échantillon
représentatif ?
2°. Donner le plan expérimental de sa collecte des données.
(Interro 2009-2010)
Résolution
1) Il va recourir à la méthode de Stratification car la population est
hétérogène
EXERCICE 8
a) Quelle qualité recherche-t-on dans un échantillon ?
b) Qu’entend-on par un échantillon représentatif tiré de la population
mère Ω
Résolution
a) La qualité recherchée est la représentativité, un échantillon doit être
représentatif
b) Un échantillon représentatif est un échantillon qui possède toutes les
caractéristiques de la population mère
EXERCICE 9
Une entreprise de dépannage veut réduire les frais d’essence de ses
véhicules en remplaçant le quart des véhicules qui circulent le plus par des
véhicules diesel et le quart des véhicules qui circulent le moins par des
véhicules plus légers ; pour cela, le comptable a relevé le kilométrage de
chaque véhicule pendant une semaine. On a obtenu les nombres suivants en
kilomètres
438 685 690 690 511 949 642 332 410 612
770 525 810 853 260 505 280 694 628 484
226 374 587 421 586 383 750 553 731 580
479 591 213 352 675 420 573 490 390 545
1°) Ranger ces données dans des classes d’amplitude 100 km
2°) Représenter graphiquement la série statistique précédente
3°) a. Calculer la médiane et les quartiles. Arrondir au km près
b. Utiliser ces résultats pour réduire le frais de l’entreprise.
Résolution
1° Etant donné que l’amplitude est déjà connue, on va grouper directement,
la valeur minimale est : 213 et la valeur maximale est 943.
classes 𝑛𝑖 𝑥𝑖
[213; 313[ 4 263
[313; 413[ 6 363
[413; 513[ 8 463
[513; 613[ 9 563
[613; 713[ 7 663
[713; 813[ 4 763
[813; 913[ 1 863
[913; 1013[ 1 963
∑ 40
3° Médiane et quartiles
classes 𝑛𝑖 𝑁𝑖 Marquage ou rang
[213; 313[ 4 4 1er – 4e
[313; 413[ 6 10 5e – 10e
[413; 513[ 8 18 11e -18e
[513; 613[ 9 27 19e -27e
[613; 713[ 7 34 28e -34e
[713; 813[ 4 38 35e -38e
[813; 913[ 1 39 39e
[913; 1013[ 1 40 40e
Médiane
𝑛 40
Pour trouver la classe médiane, on fait = = 20
2 2
20−18
= 513 + 100 ( )
9
2
= 513 + 100 (9)
1er quartile
𝑖𝑛 1×40
= = 10
4 4
10−4
= 313 + 100 ( )
6
6
= 313 + 100 (6)
= 313 + 100 × 1
𝑸𝟏 = 𝟒𝟏𝟑 𝒌𝒎𝒔
𝑄2 = 𝑀𝑒 = 535 𝑘𝑚𝑠
3e quartile
𝑖𝑛 3×40
= = 30
4 4
30−27
= 613 + 100 ( )
7
3
= 313 + 100 (7)
EXERCICE 10
Le tableau ci-dessous indique le quotient intellectuel (QI), âge mental/âge
exact exprimé en pourcentage, de 480 enfants d’une école maternelle.
centre 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126
de
classe
Effectifs 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2
Trouver par la méthode de changement d’origine et d’unité :
a) Le QI moyen pour cette école
b) L’écart-type de la distribution
Résolution
𝑥𝑖 −𝑎
La nouvelle unité est donnée par la formule 𝜇𝑖 =
ℎ
Avec a : le centre vers le milieu de classe, dans notre cas a=98.
70−98 102−98
𝜇1 = = −7 𝜇9 = =1
4 4
74−98 106−98
𝜇2 = = −6 𝜇10 = =2
4 4
78−98 110−98
𝜇3 = = −5 𝜇11 = =3
4 4
82−98 114−98
𝜇4 = = −4 𝜇12 = =4
4 4
86−98
𝜇5 = = −3
4 118−98
90−98 𝜇13 = =5
𝜇6 = = −2 4
4
122−98
94−98 𝜇14 = =6
𝜇7 = = −1 4
4
126−98
98−98 𝜇15 = =7
𝜇8 = =0 4
4
𝑥̅ = 𝑎 + ℎ 𝜇̅
Commençons par calculer 𝜇̅
∑𝑛
𝑖=1 𝑛𝑖 × 𝜇𝑖 −244
𝜇̅ = = = −0,508333333
𝑛 480
𝑥̅ = 98 + 4 × (−0,508333333)
= 98 − 2,033333333
𝑥̅ = 95,96666667
𝑥̅ = 95, 97%
Ecart type
𝑆 = √𝑆 2 𝑜𝑟 𝑆 2 = ℎ2 × 𝑆𝜇 2
Donc 𝑆 = √ℎ2 × 𝑆𝜇 2
Trouvons d’abord 𝑆𝜇 2
̅ )2
𝑛𝑖 (𝜇𝑖 −𝜇 3287,98
𝑆𝜇 2 = = = 6,849958333
𝑛 480
Revenu 𝑥𝑖 𝐹𝑖 𝑁𝑖 𝑛𝑖
annuel
[0; 300[ 150 10 5 5
[300; 600[ 450 30 15 10
[600; 900[ 750 60 30 15
[900; 1200[ 1050 90 45 15
[1200; 1500[ 1350 100 50 5
1. 45 ménages
2. Approche numérique
Calculons le coefficient de SKEWNESS.
Revenu 𝑥𝑖 𝑛𝑖 𝑛𝑖 . 𝑥𝑖 𝑛𝑖 . (𝑥𝑖 − 𝑥̅ )2 .
annuel
[0; 300[ 150 5 750 1984500
[300; 600[ 450 10 4500 1089000
[600; 900[ 750 15 11250 13500
[900; 1200[ 1050 15 15750 1093500
[1200; 1500[ 1350 5 6750 1624500
TOTAL 50 39000 5805000
𝑥̅ −𝑀𝑜
𝑆𝐾 = 𝑆
∑ 𝑛𝑖 .𝑥𝑖 39000
𝑥̅ = = = 780 $
𝑛 50
780−900
𝑆𝐾 = = −0,35
340,73
Non, cette série ne peut pas être ajustée par une distribution normale car
𝑆𝐾 ≠ 0.
Approche graphique
La série ne peut pas être ajustée par une distribution normale car les
rectangles adjacents par rapport à celui du milieu n’ont pas la même
longueur.
45×40 100×40
𝑁2 = = 18 𝑁5 = = 40
100 100
60×40
𝑁3 = = 24
100
a=1050, h=300
Pour la première classe Pour la 4e classe
150−1050 1050−1050
𝑥 ′ = 300 = −3 𝑥′ = =0
300
Pour la 3e classe
750−1050
𝑥 ′ = 300 = −1
𝑥̅ = 𝑎 + ℎ 𝑥̅′
∑ 𝑛 ′
𝑛 ×𝑥 −46
𝑥̅′ = 𝑖=1 𝑛 𝑖 = 40 = −1,15
𝑆 = √𝑆 2 or 𝑆 2 = ℎ2 . 𝑆𝑥 ′ 2
Donc 𝑆 = √ℎ2 . 𝑆𝑥 ′ 2
∑𝑛 ′ ̅̅̅′ 2
2 𝑖=1 𝑛𝑖 (𝑥 −𝑥 ) 69,1
𝑆𝑥 ′ = = = 1,7275
𝑛 40
1er quartile
𝑖𝑛 1×40
= = 10
4 4
10−8
= 300 + 300 ( )
10
2
= 300 + 300 (10)
20−18
= 600 + 300 ( )
6
2
= 600 + 300 (6)
30−24
= 900 + 300 ( )
12
= 900 + 300 × 0,
= 900 + 150
𝑄3 = 1050 $
Graphiquement
L’écart interquartile = 𝑄3 − 𝑄3
= 1050 − 360
L’écart interquartile = 690
EXERCICE 13
Le tableau ci-dessous indique le quotient intellectuel (QI), âge mental/âge
exact exprimé en pourcentage d’un échantillon d’enfants du paradis scolaire
Q.I. [70; 74[ [74; 78[ [78; 82[ [82; 86[ [86; 90[ [90; 94[ [94; 98[
effectifs 4 9 16 28 45 66 85
Trouver :
a) Le QI moyen, modal et médian pour ce paradis scolaire
b) L’écart-type de la distribution statistique
c) La courbe cumulative des fréquences relatives (Fonction de répartition)
b) Ecart type
𝑆 = √𝑆 2
∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥̅ )
2 𝟗𝟏𝟔𝟗,𝟑𝟑
𝑆2 = = = 36, 24241107
𝑛 253
𝑆 = √36, 24241107
𝑆 = 6,02016703
𝑆 = 6, 02 %
EXERCICE 14
Le tableau suivant donne la taille (en m) d’un échantillon de 30 étudiants d’une
école supérieure.
1,35 1,6 2,05 1,10 1,80 1,01 1,58 2,01 1,31 1,77
1,13 1,20 1,82 1,31 2,01 1,40 1,85 1,31 1,20 0,76
2,80 2,00 1,85 1,42 1,80 1,05 1,95 1,65 2,02 2,01
1) Regrouper ces données en tranches d’amplitude constante
2) Trouver le huitième quartile par l’approche graphique
3) En utilisant la méthode de changement d’origine et d’unité, déterminer la
taille moyenne et l’écart type de cette série statistique.
(Interro générale 2014-2015)
Résolution
1) k=1+3,3 log n
=1+3,3log 30
=5,87
k≅ 6 𝑐𝑙𝑎𝑠𝑠𝑒𝑠
E=𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑎𝑥 − 𝑉𝑎𝑙𝑒𝑢𝑟𝑚𝑖𝑛
= 2,80 – 1, 01
E= 1, 79
Classes 𝑥𝑖 𝑛𝑖
[1,01; 1,31[ 1,16 6
[1,31; 1,61[ 1,46 8
[1,61; 1,91[ 1,76 8
[1,91 ; 2,21[ 2,06 7
[2,21; 2,51[ 2,36 0
[2,51; 2,81[ 2,66 1
TOTAL 30
𝑋̅ = 𝑎 + ℎ𝜇̅
∑ 𝑛𝑖 .𝜇𝑖
Trouvons d’abord 𝜇̅ ; 𝜇̅ =
𝑛
−10
𝜇̅ = = −0,3333333333 ….
30
𝑆 = √𝑉𝑎𝑟 = √ℎ2 × 𝑆𝜇 2
̅ )2
∑ 𝑛𝑖 .(𝜇𝑖 −𝜇
𝑆𝜇 2 =
𝑛
44,67
=
30
𝑆𝜇 2 = 1,489
𝑆 = √(0,3)2 × 1,489
𝑆 = 0,37 𝑚
classes 𝑛𝑖 𝑥𝑖 𝑁𝑖
[16; 24[ 8 20 8
[24; 32[ 12 28 20
[32; 40[ 8 36 28
[40; 48[ 7 44 35
[48; 56[ 3 52 38
[56; 64] 2 60 2
3.
𝑖𝑛 1×𝑛 40
𝑄1 = = = 10
4 4 4
3×𝑛 120
𝑄3 = = = 30
4 4
𝑥̅ = 36 + 8 × (−0,225)
= 36 − 1,8
𝑥̅ = 34,2 𝑎𝑛𝑠
Ecart type
𝑆 = √𝑉𝑎𝑟 = √ℎ2 × 𝑆𝜇 2
̅ )2
∑ 𝑛𝑖 .(𝜇𝑖 −𝜇
𝑆𝜇 2 = 𝑛
78,98
= 40
𝑆𝜇 2 = 1,9745
𝑆 = √(8)2 × 1,9745
𝑆 = 11,24 𝑎𝑛𝑠
Classes 𝑥𝑖 𝑛𝑖 𝑁𝑖
[5,5 ; 6,59[ 6,05 6 6
[6,59; 7,68[ 7,14 5 11
[7,68; 8,77[ 8,23 4 15
[8,77 ; 9,86[ 9,32 7 22
[9,86; 10,95[ 10,41 3 25
[10,95; 12,04[ 11,50 5 30
TOTAL 30
3.
Classes 𝑥𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 × 𝜇𝑖 𝑛𝑖 . (𝜇𝑖 − 𝜇̅ )2
[5,5 ; 6,59[ 6,05 6 -2 -12 33,61
[6,59; 7,68[ 7,14 5 -1 -5 9,34
[7,68; 8,77[ 8,23 4 0 0 0,54
[8,77 ; 9,86[ 9,32 7 1 7 2,81
[9,86; 10,95[ 10,41 3 2 6 8,00
[10,95; 12,04[ 11,50 5 3 15 34,67
TOTAL 30 11 88, 97
𝑆 = √𝑉𝑎𝑟 = √ℎ2 × 𝑆𝜇 2
̅ )2
∑ 𝑛𝑖 .(𝜇𝑖 −𝜇
𝑆𝜇 2 = 𝑛
𝑆𝜇 2 = 2,965666667
𝑆 = √(1,09)2 × 2,965666667
𝑆 = 1,88 𝑗𝑜𝑢𝑟
EXERCICE 17
Le tableau suivant donne la distribution des salaires annuels d’une
entreprise (en centaines de dollars) en 2008 :
Salaire net annuel Effectif
[0; 10[ 20
[10; 22[ 36
[22; 27[ 35
[27; 45[ 45
[45; 75[ 72
[75; 120[ 90
4. Pas moyen d’utiliser cette méthode car l’amplitude n’est pas constante.
EXERCICE 18
Considérons une entreprise E comportant deux établissements E1 et E2. Au
sein de l’établissement E1 le salaire moyen est égal à 1800 euros avec un
écart-type de 650. Au sein de l’établissement E2 le salaire moyen est égal à
2000 euros avec un écart-type de 110. Dans quelle entreprise selon vous le
salaire est le plus dispersé ? Justifier.
(Interro 2016-2017)
Résolution
Il suffit de calculer les coefficients de variation puis comparer.
𝐸1 𝐸2
𝑥1 = 1800 𝑒𝑢𝑟𝑜𝑠
̅̅̅ 𝑥2 = 2000 𝑒𝑢𝑟𝑜𝑠
̅̅̅
𝑆1 = 650 𝑆1 = 110
𝑆 𝑆
𝐶𝑉1 = × 100 𝐶𝑉2 = × 100
𝑥̅ 𝑥̅
650 110
𝐶𝑉1 = × 100 𝐶𝑉2 = × 100
1800 2000
∑ 𝑛𝑖 .𝑥𝑖 86700
1. 𝑥̅ = =
𝑛 50
𝑥̅ = 1734 $
Médiane
𝑛 50
Classe médiane = = 25 ⇒ [1700; 1800[
2 2
𝑛
−𝑁𝑖−1
2
𝑀𝑒 = 𝑙𝑖 + ℎ ( )
𝑛𝑖
𝑀𝑒 = 1716, 67 $
Mode
2.
𝑖.𝑛 50×50
⇒ 𝐶50 = = 25
100 100
𝑥̅ −𝑀𝑜
3. 𝑆𝐾 = 𝑆
Trouvons d’abord S.
Etant donné, que nous avons deux modes qui sont différents de la
moyenne, la distribution n’est pas symétrique.
4. Une prime uniforme de 200$ (quel que soit le salaire)
Augmentation de 2,5% pour des salaires inférieurs à 1700$.
Pour l’agent qui touchait 2500$ en février, il a droit à la prime uniforme
de 200$ mais pas à l’augmentation de 2,5% car son salaire est supérieur
à 1700$.
Donc il aura 2500+200 soit 2700$
Résolution
Après analyse, le nombre cumulé d’entreprises représente le 𝑁𝑖
Chiffre 𝑁𝑖 𝑛𝑖 𝑥𝑖 𝑛𝑖 × 𝑥𝑖 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2
d’affaire
[0; 0,25[ 130 130 0,125 16,25 1136,12383
[0,25; 0,5[ 250 120 0,375 45 878,854688
[0,5; 1[ 380 130 0,75 97,5 706,514453
[1; 2,5[ 550 170 1,75 297,5 301,278516
[2,5; 5[ 750 200 3,75 750 89,4453125
[5; 10[ 1000 250 7,5 1875 4881,33789
∑ 1000
3081,25 7993,55469
a) La moyenne
∑𝑛
𝑖=1 𝑛𝑖 ×𝑥𝑖
𝑥̅ =
𝑛
3081,25
= 1000
𝑥̅ = 3,08125
𝑥̅ = 3, 08125 𝑚𝑖𝑙𝑙𝑖𝑜𝑛𝑠 𝑑 ′ 𝑒𝑢𝑟𝑜𝑠
𝑥̅ = 3 081 250 €
𝑆 = √𝑆 2
∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥̅ )
2 𝟕𝟗𝟗𝟑,𝟓𝟓𝟒𝟔𝟗
𝑆2 = = = 7,99355469
𝑛 1000
𝑆 = √7,99355469 = 2,827287515
𝑆 = 2,827287515 𝑚𝑖𝑙𝑙𝑖𝑜𝑛𝑠 𝑑′𝑒𝑢𝑟𝑜𝑠 ou
c) L’asymétrie de la distribution
𝑥̅ −𝑀𝑜𝑑𝑒
𝑆𝑘 = 𝑆
= 5 + 5 × 0,16666666666
= 5 + 0,8333333333333
𝑀𝑜 = 5,8333333333333 𝑀𝑖𝑙𝑙𝑖𝑜𝑛𝑠 𝑑′𝑒𝑢𝑟𝑜𝑠 ou
𝑀𝑜 = 5 833 333, 33 €
3 081 250−5 833 333,33
𝑆𝑘 = 2 827 287,515
𝑆𝑘 = 0,97
La distribution est dissymétrique à droite.
EXERCICE 21
Répondre par vrai ou faux
QUESTION REPONSE
La variance ne peut être calculée que pour une variable
mesurée au moyen d’une échelle quantitative
Si une variable est exprimée en mètre, la variance de cette
variable l’est aussi.
L’écart-type est donné par la racine carrée de la variance
La variance peut être nulle
La variance peut être négative
L’étendue tient compte de toutes les valeurs d’une série
statistique
N.B. : La mauvaise réponse annule la bonne
(Interro 2013-2014)
Résolution
QUESTION REPONSE
La variance ne peut être calculée que pour une variable Vrai
mesurée au moyen d’une échelle quantitative
Si une variable est exprimée en mètre, la variance de cette Faux
variable l’est aussi.
L’écart-type est donné par la racine carrée de la variance Vrai
La variance peut être nulle Vrai
La variance peut être négative Faux
L’étendue tient compte de toutes les valeurs d’une série Faux
statistique
𝑛1 = 0,20 × 50 = 10
𝑛2 = 0,18 × 50 = 9
𝑛3 = 0,30 × 50 = 15
𝑛4 = 0,20 × 50 = 10
𝑛5 = 0,12 × 50 = 6
Salaire(en $) 𝑓𝑖 𝑛𝑖 𝑥𝑖 𝜇𝑖 𝑛𝑖 𝜇𝑖 𝑛𝑖 (𝜇𝑖 − 𝜇̅ )2
[500; 1000[ 0,20 10 750 -2 -20 34,596
[1000; 1500[ 0,18 9 1250 -1 -9 6,6564
[1500; 2000[ 0, 30 15 1750 0 0 0,294
[2000; 2500[ 0,20 10 2250 1 10 12,996
[2500; 3000[ 0,12 6 2750 2 12 27,4776
∑ 50
-7 82,02
1250−1750 2750−1750
𝑢2 = = −1 𝑢5 = =2
500 500
1750−1750
𝑢3 = =0
500
Moyenne
𝑥̅ = 𝑎 + ℎ𝜇̅
∑𝑛
𝑖=1 𝑛𝑖 𝜇𝑖 −7
𝜇̅ = = = −0,14
𝑛 50
𝑆 = √ℎ2 𝑆𝜇 2
∑𝑛 ̅ )2
𝑖=1 𝑛𝑖 (𝜇𝑖 −𝜇 82,02
𝑆𝜇 2 = = = 1,6404
𝑛 50
EXERCICE 23
Le salaire mensuel d’une entreprise était en mars de 2800$ avec un écart-type de
200$. Si tous les salariés bénéficient d’une augmentation identique de 10% à
partir du mois d’avril puis d’une prime fixe de 100$ à partir du mois de mai.
Calculer, si possible, le salaire moyen à la suite de ces deux augmentations.
(Examen S1 2016-2017)
Résolution
𝑥̅ = 2800 $
∑𝑛
1 𝑛𝑖 𝑥𝑖
On sait que 𝑥̅ =
𝑛
⇔ 𝑥𝑖 ′ = 𝑥𝑖 + 0,1 𝑥𝑖 + 100
La nouvelle moyenne vaut :
𝑛 ′
∑ 𝑛 𝑥
𝑥̅′ = 𝑖=1 𝑖 𝑖
𝑛
EXERCICE 24
Afin de contrôler la durée de vie des ampoules fabriquées par une usine
électrique de la place, un échantillon de 30 ampoules ont été examinées. On
a observé les résultats suivants en heures.
2°)
𝑥̅ = 145,33 ℎ
4°)
Mode Médiane
Classe modale [170; 207[ 𝑛
=
30
= 15
∆1 2 2
𝑀𝑜 = 𝑙𝑖 + ℎ ∆ +∆
1 2
𝑙𝑖 = 170 ℎ = 37 Classe médiane [133; 170[
𝑛
∆1 = 9 − 6 = 3 ∆2 = 9 − 1 = 8 −𝑁𝑖−1
𝑀𝑒 = 𝑙𝑖 + ℎ (2 )
𝑛𝑖
𝑀𝑜 = 170 + 37 ×
3 𝑙𝑖 = 133 ℎ = 37 𝑁𝑖−1 = 13 𝑛𝑖 = 6
3+8 30
−13
3
= 170 + 37 × 11 𝑀𝑒 = 133 + 37 ( 2 6 )
15−13
= 133 + 37 ( )
= 170 + 10,09090909 6
2
= 180,09090909 = 133 + 37 (6)
𝑀𝑜 = 180,09 ℎ = 133 + 37 × 0,333333333333
𝑀𝑒 = 145,33ℎ
152,38
𝐶𝑉 = 145,33 × 100
𝐶𝑉 = 104,84%
La dispersion est forte car 𝐶𝑉 ≥ 17%
33+34
𝑀𝑒 = = 33,5
2
Q3 : 𝑛 = 30 𝑝 = 0,75 ⇒ 𝑛𝑝 = 22,5
Comme 22,5 n’est pas un nombre entier, on a :
𝑄3 = 𝑥𝑛𝑝 = 𝑥23 = 53
Le diagramme :
EXERCICE 27
a) En quoi consiste la méthode d’échantillonnage au moyen de tables de
nombre aléatoires ? (Chapitre I)
b) Considérons une entreprise E comportant deux établissements : E1 et
E2 qui emploient chacun 100 salariés. Au sein de l’établissement E1 le
salaire moyen est égal à 2500 euros avec un écart-type de 80. Au sein
de l’établissement E2 le salaire moyen est égal à 2000 euros avec un
écart-type de 110. Dans quelle entreprise selon vous le salaire est le
plus dispersé ?
(Interro)
EXERCICE 28
Dans une maternité de Kinshasa, un échantillon de 30 femmes ayant
accouché par césarienne a été prélevé, on a observé les résultats suivants en
nombre de jours de séjour à l’hôpital :
5,5 7,5 11,3 7 8,3 10 9,5 6,5 10,5 11
7,0 8,4 10 8,2 8 9,6 9 8 10,5 10,3
6,5 9,1 6,0 8,5 7,5 9,1 9,2 8,5 11 9,5
EXERCICE 29
Le tableau suivant donne la taille (en m) d’un échantillon de 40 étudiants
d’une école supérieure.
1,55 1,6 2,05 1,10 1,85 1,01 1,58 2,01 1,31 1,77
1,2 1,90 1,65 1,95 2,49 2,49 1,19 1,88 1,75 1,30
1,13 1,20 1,82 1,31 2,01 1,42 1,85 1,31 1,20 0,76
2,80 2,01 1,85 1,42 1,80 1,05 1,95 1,65 2,02 2,01
a) Regrouper ces données en tranches d’amplitude constante
b) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
c) En utilisant la méthode de changement d’origine et d’unité, déterminez
la taille moyenne et l’écart-type de cette série statistique.
d) Déterminer les quartiles Q1 et Q2 par la méthode graphique
(Interro générale 2013-2014)
EXERCICE 30
EXERCICE 32
Encerclez la(les) bonne(s) réponse(s) : La mauvaise réponse annule la
bonne
a) Pour comparer des distributions de variables statistiques exprimées
dans les unités différentes, on peut utiliser les caractéristiques
suivantes :
i) La médiane
ii) L’étendue interquartile
iii) Le coefficient de variation
iv) Le rapport D9 / D1
b) Pour une série d’observations d’une variable statistique :
i) La somme des écarts à la moyenne est nulle
ii) L’écart absolu moyen à la moyenne est indicateur de dispersion
iii) La médiane de la série des écarts absolus à la moyenne est une
mesure de l’asymétrie
iv) Les trois quartiles sont des indicateurs de tendance centrale.
(Interro générale 2018-2019)
(Examen S1 2018-2019)
EXERCICE 34
EXERCICE 35
EXERCICE 36
EXERCICE 37
EXERCICE 39
On relève la taille (en cm) de 60 étudiants d’une faculté de l’université de
Kinshasa. Les résultats trouvés sont consignés dans le tableau suivant :
158 172 166 170 168 175 152 190 197 157
163 160 149 180 188 172 173 184 181 180
172 169 171 173 171 180 198 167 175 177
170 173 168 167 169 180 181 178 160 164
150 168 166 162 170 182 183 190 167 169
170 160 171 188 168 169 172 157 149 180
1) Grouper ces données par classes d’amplitude 10cm du type suivant
[140; 150[; [150; 160[…
2) Construire l’histogramme et l’ogive des fréquences cumulées de cette
distribution
3) Calculer la taille moyenne, médiane, modale et le coefficient de
variation
4) Quelle est la proportion d’individus dont la taille est inférieure à 175
cm
(Interro)
EXERCICE 41
Afin d’étudier comment varie le coût de maintenant (Y) d’un tracteur en
fonction de l’âge (X) ce celui-ci on a collecté les données suivantes :
Age X 15 8 36 41 16 8 21 21 53 10 32 17 58 6 20
(mois)
Coût 48 43 77 89 50 40 56 62 100 47 71 58 102 35 60
annuel
(mois)
a) En représentant le nuage des points, montrer qu’il existe une
dépendance linéaire entre les deux variables ;
b) Quelle est l’intensité de cette liaison ?
c) Trouver la droite de régression estimée des moindres carrées de Y en x
qui s’ajuste au mieux sur le nuage des points observés.
d) Quel serait le coût de maintenance d’un tracteur ayant fonctionné
pendant une année ?
Résolution
𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
15 48 720 225 2304
8 43 344 64 1849
36 77 2772 1296 5929
41 89 3649 1681 7921
16 50 800 256 2500
8 40 320 64 1600
21 56 1176 441 3136
21 62 1302 441 3844
53 100 5300 2809 10000
10 47 470 100 2209
32 71 2272 1024 5041
17 58 986 289 3364
58 102 5916 3364 10404
6 35 210 36 1225
20 60 1200 400 3600
∑ = 𝟑𝟔𝟐 938 27437 12490 64926
b) L’intensité de la liaison
1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
𝑟= 1 1
√[∑ 𝑥 2 − (∑ 𝑥)2 ][∑ 𝑦 2 − (∑ 𝑦)2 ]
𝑛 𝑛
1
27437− 362× 938
15
= 1 1
√[12490− (362)2 ][64926− (938)2 ]
15 15
339 556
27437−
15
= 131044 879 844
√[12490− ][64926− ]
15 15
27437−22 637,06667
=
√[12 490−8 736,266667][64926−58 656,26667]
4 799,933333
=
√3 753,733333×6269,73333
4 799,933333
=
√23 534 906,99
4 799,933333
= 4 851,278903
𝑟 = 0,989416075
𝑟 ≅ 0,99
𝑦 = 1,28𝑥 + 31,64
𝑦 = 31,64 + 1,28𝑥
2e méthode
𝑦 = 𝑎 + 𝑏𝑥
1 1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
27437−15362× 938 4 799,933333
𝑏= 1 = 1 = 3 753,733333 = 1,28
∑ 𝑥 2 − (∑ 𝑥)2 12490−15(362)2
𝑛
EXERCICE 42
Le tableau suivant donne l’indice des prix à la consommation pour la
nourriture et les dépenses de santé pour la période allant de 1975 à 1983,
cet indice étant fixé par rapport à 1967, où il est 100.
ANNEE 1975 1976 1977 1978 1979 1980 1981 1982 1983
ALIMENTATION 175 181 192 211 235 255 275 286 292
DEPENSES DE 169 185 202 219 240 266 295 329 357
SANTE
1
551 746− ×2 102×2 262
9
= 2
√[507 706−1(2 102) ][602 622−1(2262)2 ]
9 9
4 754 724
551 746−
9
=
4 418 404 5 116 644
√[507706− ][602622− ]
9 9
23 443,33333
=
√16 772,22222×34 106
23 443,33333
=
√572 033 411,1
23 443,33333
= 23 917,21997
= 0,980186382
𝑟 = 0,98
Il existe un lien significatif entre les coûts de l’alimentation et les dépenses
de santé car |𝑟| > 0,75
b) Avant d’évaluer, il faut d’abord trouver la droite de régression de Y en
x
𝑦 = 𝑎 + 𝑏𝑥
1 1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦 551 746− ×2 102×2 262 23 443,33333
𝑛 9
𝑏= 1 = 1 2 = 16 772,22222 = 1,4
∑ 𝑥 2 − (∑ 𝑥)2 507 706− (2 102)
𝑛 9
𝑎 = 𝑦̅ − 𝑏𝑥̅
∑𝑦 2262
𝑦̅ = =
9 9
∑𝑥 2102
𝑥̅ = =
9 9
938 362 474,64
= − 1,28 × = = 31,64
15 15 15
2262 2102
𝑎= − 1,4 ×
9 9
−6808
𝑎= = −75,64
9
On demande :
1°) de construire le nuage des points et dire si un ajustement linéaire parait
vraisemblable
2°) d’établir les équations de régression de Y en x et de X en y
3°) de calculer le coefficient de corrélation et d’interpréter le résultat
Résolution
Pays 𝑥 𝑦 𝑥𝑦 𝑥2 𝑦2
Allemagne 4,9 450 2205 24,01 202500
Espagne 4,1 70 287 16,81 4900
France 5,5 400 2200 30,25 160000
Italie 8,6 500 4300 73,96 250000
Suisse 4,6 250 1150 21,16 62500
∑ 27,7 1670 10142 166,19 679900
𝑦 − 𝑦̅ = 𝑏(𝑥 − 𝑥̅ )
𝑦 − 334 = 69,92(𝑥 − 5,54)
𝑦 − 334 = 69,92𝑥 − 387,36
𝑦 = 69,92𝑥 − 387,36 + 334
𝒚 = 𝟔𝟗, 𝟗𝟐𝒙 − 𝟓𝟑, 𝟑𝟔
La droite de régression de X en y
𝑦 = 69,92𝑥 − 53,36
69,92𝑥 = 𝑦 + 53,36
𝑦+53,36
𝑥= 69,92
1 53,36
𝑥 = 69,92 𝑦 + 69,92
𝑥 = 0,01𝑦 + 0,76
𝑥 = 0,76 + 0,01𝑦
3) Le coefficient de corrélation
1
∑ 𝑥𝑦− ∑ 𝑥 ∑ 𝑦
𝑛
𝑟= 1 1
√[∑ 𝑥 2 − (∑ 𝑥)2 ][∑ 𝑦 2 − (∑ 𝑦)2 ]
𝑛 𝑛
1
10 142− ×27,7×1670
5
= 1 1
√[166,19− (27,7)2 ][679 900− (1670)2 ]
5 5
46 259
10 142−
5
=
767,29 2 788 900
√[166,19− ][679 900− ]
5 5
10 142−9 251,8
=
√(166,19−153,458)(679 900−557 780)
890,2
=
√12,732×122120
890,2
=
1 246,928963
𝑟 = 0,71
La liaison entre les deux variables n’est pas significative car |𝑟| < 0,75
EXERCICE 44
On considère la distribution des salaires (𝑥𝑖 ) dans une firme électronique en
février 2006.
Salaire 1500- 1600- 1700- 1800- 1900- 2000- 2100- 2200- 2300- 2400- 2500-
(𝑥𝑖 ) 1600 1700 1800 1900 2000 2100 2200 2300 2400 2500 2600
Effectif 1 2 10 9 8 5 5 3 2 3 2
5.2) Estimer, si possible 𝑧̅ 𝑒𝑡 𝑠(𝑧) : moyenne et écart type des salaires en mars
2006
Résolution
Salaire 𝑛𝑖 𝑥𝑖 𝑁𝑖 𝐹𝑖 (%) Marquage 𝑛𝑖 𝑥𝑖 𝑛𝑖 (𝑥𝑖 − 𝑥̅ )2
[1500; 1600[ 1 1550 1 2 1er 1550 193600
[1600; 1700[ 2 1650 3 6 2e -3e 3300 231200
[1700; 1800[ 10 1750 13 26 4e -13e 17500 576000
[1800; 1900[ 9 1850 22 44 14e -22e 16650 176400
[1900; 2000[ 8 1950 30 60 23e -30e 15600 12800
[2000; 2100[ 5 2050 35 70 31e -35e 10250 18000
[2100; 2200[ 5 2150 40 80 36e -40e 10750 128000
[2200; 2300[ 3 2250 43 86 41e -43e 6750 202800
[2300; 2400[ 2 2350 45 90 44e -45e 4700 259200
[2400; 2500[ 3 2450 48 96 46e -48e 7350 634800
[2500; 2600[ 2 2550 50 100 49e et 50e 5100 627200
∑ 50 99500 3060000
𝑄1 = 1795
2e quartile ou médiane
Classe Q2 : [1900; 2000[
2𝑛
−𝑁𝑖−1
4
𝑄2 = 𝑙𝑖 + ℎ ( )
𝑛𝑖
𝑄3 = 2150
3°) Coefficient de variation
𝑆
𝐶𝑉 = 𝑥̅ × 100
∑𝑛
𝑖=1 𝑛𝑖 (𝑥𝑖 −𝑥̅ )
2 3 060 000
𝑆2 = = = 61 200
𝑛 50
𝑆 = √𝑆 2 = √61200 = 247,39
247,39
𝐶𝑉 = × 100
1990
𝐶𝑉 = 12,43%
La dispersion de cette distribution est faible car 𝐶𝑉 < 17%
4°)
𝑧𝑖 = 𝑥𝑖 + 0,02 𝑥𝑖 + 50
𝑧𝑖 = 1,02𝑥𝑖 + 50
𝑥𝑖 𝑧𝑖 𝑥𝑖 𝑧𝑖 𝑥𝑖 2 𝑧𝑖 2
1550 1631 2528050 2402500 2660161
1650 1733 2859450 2722500 3003289
1750 1835 3211250 3062500 3367225
1850 1937 3583450 3422500 3751969
1950 2039 3976050 3802500 4157521
2050 2141 4389050 4202500 4583881
2150 2243 4822450 4622500 5031049
2250 2345 5276250 5062500 5499025
2350 2447 5750450 5522500 5987809
2450 2549 6245050 6002500 6497401
2550 2651 6760050 6502500 7027801
22550 23551 49401550 47327500 51567131
1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 𝑧𝑖 −𝑛 ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑧𝑖
𝑟= 2 2
1 1
√[∑𝑛 2 𝑛 𝑛 2 𝑛
𝑖=1 𝑥𝑖 −𝑛 (∑𝑖=1 𝑥𝑖 ) ][∑𝑖=1 𝑧𝑖 −𝑛 (∑𝑖=1 𝑧𝑖 ) ]
1
49401550− ×22550×23551
11
= 1 1
√[47327500− (22550)2 ][51 567 131− (23551)2 ]
11 11
𝑟=1
La liaison entre les deux variables est parfaite
Avant d’estimer, nous devons trouver l’équation de la droite de régression
𝑧 = 𝑎 + 𝑏𝑥
1 1
∑ 𝑥𝑧− ∑ 𝑥 ∑ 𝑧
𝑛
49401550−11×22550×23551 1 122 000
𝑏= 1 = 1 = 1 100 000 = 1,02
∑ 𝑥 2 − (∑ 𝑥)2 47327500−11 (22550)2
𝑛
𝑎 = 𝑧̅ − 𝑏𝑥̅
∑𝑧 23551
𝑧̅ = = = 2141
9 11
∑𝑥 22 550
𝑥̅ = = = 2050
9 11
𝑧̅ = 2 079,8
𝑆 = 247,39 ⇒ 𝑠(𝑧) = 1,02 × 247,39 + 50
𝑠(𝑧) = 302,34
EXERCICE 45
Un laboratoire pharmaceutique souhaite connaitre l’efficacité d’un toxique T
par le temps de survie des souris auxquelles on l’administre. Les résultats
observés sur un lot de 10 souris figurent dans le tableau suivant :
Dose de T (en mg) 1 2 3 4
Temps de survie 7 4 1 2
(en heures) 8 5 3
6 6 3
a) Représenter graphiquement le nuage des points observés ;
b) Vérifier s’il existe une liaison statistique significative entre la dose du
toxique T et le temps de survie des souris auxquelles on l’administre.
c) Quel est le temps de survie d’une souris à laquelle on aurait
administré une dose de 8 mg de ce toxique T ? Commenter et justifier
votre réponse.
(Interro générale 2013-2014)
b)
𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖 2 𝑦𝑖 2
1 7 7 1 49
1 8 8 1 64
1 6 6 1 36
2 4 8 4 16
2 5 10 4 25
2 6 12 4 36
3 1 3 9 1
3 3 9 9 9
3 3 9 9 9
4 2 8 16 4
22 45 80 58 249
1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑛
𝑟= 1 2 1 2
√[∑𝑛 2 𝑛 𝑛 2 𝑛
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 ) ][∑𝑖=1 𝑦𝑖 − (∑𝑖=1 𝑦𝑖 ) ]
𝑛 𝑛
1
80− ×22×45
10
= 1 1
√[58− ×(22)2 ][249− ×(45)2 ]
10 10
80−99 −19
= =
√9,6×46,5 √446,4
𝑟 = −0,8992 ≅ −0,90
Il existe une liaison statistique significative entre la dose du toxique T et
le temps de survie des souris auxquelles l’on administre car |𝑟| ≥ 0,75
𝑦 = 11,11 − 1,98𝑥
EXERCICE 46
On donne un tableau à double entrée relatif à l’étude de la série double
suivante :
y x 156-160 161-165 166-170 171-175
46-50 16 8 2 0
51-55 3 18 5 1
56-60 1 5 10 5
61-65 0 3 8 5
La distribution marginale en x
𝑥𝑖 46-50 51-55 56-60 61-65
𝑛𝑖. 26 27 21 16
Ou soit en % :
𝑌𝑗 156-160 161-165 166-170 171-175
𝑛𝑖𝑗 4,76 23,81 47,62 23,81
Pour i=j=1, on a :
𝑛11 = 16 𝑛1. = 26 𝑛.1 = 20 𝑛 = 90
26×20
16 ≠ 90
16 ≠ 5,78
Donc les deux caractères ne sont pas indépendants
Distribution marginale de y
𝑦𝑗 [1 − 500[ [500 − 1000[ [1000 − 2000[ ≥ 2000
𝑛.𝑗 500 100 100 20
b) Réservée au lecteur
c) Distributions conditionnelles de X
Pour 𝑌 = 𝑦1 ⇔ 𝑌 = [1 − 500[
𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 450 40 10
En %
𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 90 8 2
𝑥𝑖 1 2 ≥3
𝑛𝑖𝑗 40 40 20
Pour i=j=1, on a :
𝑛11 = 450 𝑛1. = 525 𝑛.1 = 500 𝑛 = 720
525×500
450 ≠ 720
450 ≠ 364,58
Donc les deux caractères ne sont pas indépendants
EXERCICE 48
On donne le tableau à double entrée relatif à l’étude des voitures de petite
cylindrée circulant dans Kinshasa en 1992, classées en pourcentage, par
rapport aux deux caractères suivants : x=puissance de la voiture en chevaux
et y=durée moyenne de vie des pneus.
X y 2 3 4
20 1 7 30
25 5 20 7
30 25 3 2
La distribution marginale de X :
𝑋𝑗 2 3 4
𝑛.𝑗 31 30 39
b) Réservée au lecteur
Résolution
𝑥𝑖 𝑦𝑖 𝑥𝑖 𝑦𝑖 𝑥𝑖 2 𝑦𝑖 2
9 450 4050 81 202500
7 350 2450 49 122500
10 520 5200 100 270400
13 600 7800 169 360000
5 250 1250 25 62500
44 2170 20750 424 1017900
1°) Construisons le nuage des points pour déduire s’il existe une liaison
entre les deux variables
1
20 750− ×44×2 170
5
= 1 1
√[424− (44)2 ][1 017 900− (2170)2 ]
5 5
95 480
20 750−
5
=
1 936 4 708 900
√[424− ][1 017 900− ]
5 5
20 750−19 096
=
√(424−387,2)(1 017 900−941 780)
1 654
=
√36,8 ×76 120
1 654
=
√2 801,216
1 654
= 1 673,683363
𝑟 = 0,99
La liaison entre les variables est significative car |𝑟| ≥ 0,75
3°) L’équation de la droite de régression de Y en x
𝑦 = 𝑎𝑥 + 𝑏
1
∑𝑛 𝑛 𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖 − ∑𝑖=1 𝑥𝑖 ∑𝑖=1 𝑦𝑖
𝑛
𝑎= 1 2
∑𝑛 2 𝑛
𝑖=1 𝑥𝑖 − (∑𝑖=1 𝑥𝑖 )
𝑛
1
20 750− ×44×2 170 1 654
5
= 1 =
424− (44)2 36,8
5
𝑎 = 44,95
𝑏 = 𝑦̅ − 𝑎𝑥̅
∑𝑛
𝑖=1 𝑦𝑖 2170
𝑦̅ = = = 434
𝑛 5
∑𝑛
𝑖=1 𝑥𝑖 44
𝑥̅ = = = 8,8
𝑛 5
𝑏 = 434 − 44,95 × 8,8
434 − 395,56
𝑏 = 38,44
L’équation de la droite de régression de y en x est :
𝑦 = 44,95𝑥 + 38,44
1 38,44
𝑥 = 44,95 𝑦 − 44,95
𝑥 = 0,02𝑦 − 0,85
EXERCICE 50
On donne le tableau à double entrée relative à l’étude de la série double
suivante :
Y [156-161[ [161-166[ [166-171[ [171-176[
X
[46-51[ 10 6 14 0
[51-56[ 16 12 5 1
[56-61[ 2 4 6 17
[61-66[ 1 5 8 14
Ou en %
𝑦𝑗 [156 − 161[ [161 − 166[ [166 − 171[ [171 − 176[
𝑛𝑖𝑗 6,9 13,79 20,69 58,62
Ou en %
𝑥𝑖 [46 − 51[ [51 − 56[ [56 − 61[ [61 − 66[
𝑛𝑖𝑗 22,22 44,44 14,81 18,52
Pour i=j=1, on a :
𝑛11 = 10 𝑛1. = 30 𝑛.1 = 29 𝑛 = 121
30×29
10 ≠ 121
10 ≠ 7,19
Donc les deux caractères ne sont pas indépendants
EXERCICE 51
Les données suivantes représentent les poids (Kg) de huit femmes avant et
après qu’elles aient été soumises à un régime d’amaigrissement pendant 5
semaines.
POIDS 148 170 127 151
AVANT 168
POIDS 144 164 126 139
APRES 145 127 140
1) Représenter le nuage des points correspondants à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Quel serait le résultat de la deuxième pesée d’une femme dont le poids
initial serait de 180 Kgs ?
(Interro générale 2014-2015)
EXERCICE 52
Le cout « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies dans un
échantillon d’activités sont consignées dans le tableau suivant :
X 230 250 165
235 170
243 155
Y 120 130
135 140 150
110 145
a) Représentez graphiquement le nuage de points observés de cette
distribution.
b) La relation entre les deux variables est-elle étroite ? Justifiez votre
réponse.
c) Estimez la production correspondant à 345 unités.
(Examen S2 2015-2016)
EXERCICE 54
Le cout « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies dans un
échantillon des 16 activités sont consignées dans le tableau suivant :
X 10 20 30 40 50 60 70 80
Y 285 425 580 905 905 1335 1340 1710
275 435 570 1340 1270 1660
575 1300
1) Représenter le nuage des points. Commenter
2) La relation entre les 2 variables est-elle étroite ? Justifier votre
réponse.
3) Estimer le coût d’une activité correspondant à 120 unités.
(Interro 2009-2010)
EXERCICE 56
Le tableau suivant présente l’évolution des indices de prix à la
consommation (IPC) et l’évolution des indices des SMIC.
IPC 102,3 102,0 105,2 106,0 107,3 109,4 112,2 113,8
SMIC 101,6 103,6 104,9 108,2 109,8 109,8 112,4 114,1
EXERCICE 58
La quantité d’aliments « y » consommée par un échantillon des poules
pondeuses d’une basse-cour peut être considérée comme une fonction
linéaire de l’âge d’entrée en ponte. Les données numériques résultant de
l’observation figurent dans le tableau suivant :
X(en 20 24 32 27 23
semaines)
21 25
Y (en Kg) 8,5 12,3 19,5 15,6 10,5
14
EXERCICE 60
Le coût « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies sur
un échantillon de 8 activités sont enregistrés dans le tableau suivant :
X 10 20 30 40
20 22
Y 210 255280 430
270 430
1) Représenter le diagramme de dispersion
2) La relation entre les 2 variables est-elle étroite ? Justifier votre
réponse.
3) Estimer le coût d’une activité correspondant à 200 unités.
(Examen S1 2012-2013)
EXERCICE 61
On effectue un dosage par deux méthodes A et B sur les mêmes 10 sujets
Méthode A 0,60 0,65 0,70 0,75 0,8
0,61 0,78
Méthode B 0,62 0,61 0,60 0,75 0,8
0,63 0,63 0,71
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux méthodes sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
EXERCICE 62
On effectue un dosage, par deux méthodes A et B sur les mêmes 20
sujets
Méthode 0,60 0,65 0,70 0,75 0,8 0,87 0,78 0,92 0,90 0,91
A 0,61 0,78
Méthode 0,62 0,61 0,60 0,75 0,80 0,82 0,77 0,85 0,83 0,79
B 0,63 0,63 0,71 0,81 0,75 0,82 0,81 0,75
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion tirez-vous ?
2) Les résultats de deux méthodes sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison
4) Quel serait le résultat du deuxième dosage si la première méthode
donnait la valeur de 1,15 ?
(Interro 2012-2013)
EXERCICE 63
La quantité d’aliments « y » consommée par un échantillon des poules
pondeuses d’une basse-cour peut être considérée comme une fonction
linéaire de l’âge d’entrée en ponte. Les données numériques résultant de
l’observation figurent dans le tableau suivant :
X(en 20 24 32 27 23
semaines)
Y (en Kg) 8,5 12,3 19,5 15,6 10,5
14
a) Représenter le nuage de points. Commenter
b) Estimer si possible, la quantité d’aliments consommés par une poule
pondeuse de 10 mois.
(Examen S1 2018-2019)
EXERCICE 65
Le cout « y » d’une activité dans une industrie peut être considéré comme
une fonction linéaire d’une production « x ». Les données recueillies dans un
échantillon d’activités sont consignées dans le tableau suivant :
X 10 20 30 40 50 60 70 80 90 100
20 22
Y 210 255 280 420 520 580 910
1020 1300 1700
270 500 570
1000 1650
420 900 1280
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
(Interro et TD)
EXERCICE 66
On effectue un dosage, par deux méthodes A et B, sur les mêmes sujets :
Méthode 0,60 0,65 0,70 0,75 0,8 0,87 0,78 0,92 0,90 0,91
A 0,61 0,78
Méthode 0,61 0,60 0,75 0,82 0,77 0,85 0,83 0,79
B 0,62 0,63 0,71 0,80 0,75 0,81
0,63 0,81 0,82 0,75
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
EXERCICE 67
Les données suivantes représentent les poids (Kgs) de femmes avant et après
qu’elles aient été soumises à un régime d’amaigrissement pendant 5
semaines.
POIDS 148 170 127 151 145 150 142 155 162 115
AVANT 168 116
POIDS 144 126 139 132 144 140 154 155 114
APRES 145 164 140 146 156
127 135 142 157
1) Représenter le nuage des points correspondant à ces données. Quelle
conclusion en tirez-vous ?
2) Les résultats de deux prélèvements sont-ils corrélés ?
3) Dans l’affirmative à la sous-question 2, donner l’expression
mathématique de cette liaison.
(Interro)
(TD)