Académique Documents
Professionnel Documents
Culture Documents
Modalité Effectifs
4 5
7 12
8 9
10 13
14 11
Modalité Effectifs
[300,320[ 14
[320,370[ 23
[370,410[ 31
[410,500[ 12
Calculer le centre de chacune des classes et utiliser ces centres de classes pour donner une approxi-
mation de la moyenne arithmétique de cet échantillon.
Exercice 9 12. Donner un exemple d’échantillon de taille 5 ayant une moyenne égale à 4.
1
Exercice 10 Donner un échantillon de taille 5 contenant l’élément 0 et ayant une moyenne égale à 4.
. Donner deux exemples d’échantillons différents ayant la même moyenne et le même écart-type.
Exercice 11 Sur les 108 chefs d’entreprise interrogés, 12 avaient obtenu un doctorat, 24 n’avaient
aucun diplôme, 12 avaient un MBA,(Master en administration des affaires) 24 avaient un BA (Bac)
et 36 avaient à la fois un BA et un M A. (Mastèr) Représenter le diagramme circulaire de ce jeu de
données.
Exercice 12 Sur les 263 personnes interrogées après avoir séjourné à l’hôtel B, 52 se disaient totale-
ment satisfaites de leur expérience, 110 se disaient satisfaites, 76 se disaient moyennement satisfaites
et le reste se disait insatisfait. Calculer la distribution et représenter le diagramme circulaire de
ce jeu de données. Sur une échelle de 1 à 4 (1 représentant la satisfaction totale, 4 représentant
l’insatisfaction), donner une évaluation de la satisfaction moyenne des 263 personnes.
Exercice 15 Dans l’envoi d’un télégramme, on supprime habituellement les mots qui ne sont pas
essentiels. Quel impact cela a-t-il sur la compréhension correcte du message ? Afin d’apporter un
élément de réponse à cette question, l’expérience suivante a été menée : on a présenté un message
mutilé à 60 personnes et mesuré le temps nécessaire à la reconstitution exacte du message. Les
résultats (compris entre 5 et 30 minutes) de ces 60 personnes ont donné lieu à la courbe cumulative
des fréquences suivante.
2
C1 est la classe des résultats > 2min et 6 15min
C2 est la classe des résultats > 15min et 6 17min.
C3 est la classe des résultats > 17min et 6 19min.
C4 est la classe des résultats > 19min et 6 21min.
C5 est la classe des résultats > 21min et 6 23min.
C6 est la classe des résultats > 23min et 6 30min.
1. Expliquez ce que représente la valeur de 69% associée à la borne supérieure (19 min.) de la
classe C3 .
2. Quel est le pourcentage d’observations dont la valeur est > 21min ?
3. Quel est le nombre de personnes, parmi les 60 sujets ayant participé à l’expérience, qui ont mis
un temps > 19 min et 6 21min pour reconstituer de façon exacte le message mutilé ?
4. Quelle est la classe modale de cette distribution groupée ?
5. Quelle est l’étendue de cette distribution groupée ?
6. Indiquez sur le graphique de la courbe cumulative où se situe la médiane de cette distribution
groupée.
7. Calculez la valeur de la médiane de cette distribution groupée.
8. Expliquez à quoi correspond cette médiane.
Exercice 17 Calculez une approximation de la moyenne en rangeant d’abord la liste des 100 données
brutes suivantes en 5 classes d’amplitudes égales. Utilisez en outre des classes du type [?, ?[ sauf pour
la dernière qui sera [?, 525] et la première étant [350, ?[.
350, 370, 375, 380, 390, 385, 405, 400, 390, 390, 400, 410, 420, 435, 415, 410, 410, 420, 435, 415,
410, 440, 450, 465, 445, 435, 460, 455, 440, 460, 455, 435, 460, 455, 470, 480, 485, 475, 495, 480,
490, 470, 470, 470, 470, 470, 470, 485, 475, 495, 480, 490, 470, 470, 470, 485, 475, 495, 480, 495,
3
480, 490, 485, 470, 470, 470, 470, 500, 510, 500, 515, 500, 500, 505, 500, 520, 500, 500, 505, 520,
525, 520, 500, 505, 520, 525, 520, 500, 500, 500, 525, 500, 505, 520, 525, 520, 500, 500, 505, 525.
Exercice 18 Si la moyenne arithmétique des nombres 28, x, 42, 78et104 est 62, quelle est la moyenne
arithmétique des nombres 112, 28, 42 et x
Exercice 19 Pour quelle(s) modalité(s) la fréquence cumulée atteint-elle 100% pour l’échantillon
Couleurs des yeux Effectif
Bleu 28
suivant : brun 85
vert 9
autres 3
4
Exercice 21 Grâce aux informations représentées par le diagramme,(c’est un diagramme en bâton)
déterminez quel pourcentage d’élèves a eu plus que la moyenne de la classe.
Tracez la courbe cumulative des fréquences associée à cette D.O.1. (Distribution observée univariée.)
5
Exercice 23 Reprenons la distribution groupée des âges des 40 répondants à l’enquête menée dans
une commune sur les habitudes de lecture du Journal trimestriel de la commune.
Classe Longueur Centre Effectif Fréquence Densité
[9.5,14.5[ 50 12 5 0.125=12.5% 1
[14.5,24.5[ 10 19.5 5 0.125=12.5% 0.5
[24.5,39.5[ 15 32 8 0.2=20% 0.53
[39.5,54.5[ 15 47 9 0.225=22.5% 0.6
[54.5,69.5[ 15 62 9 0.0225=22.5% 0.6
[69.5,99.5[ 30 84.5 4 0.1=10% 0.13
Total N=40 1=100%
Tracez la courbe cumulative des effectifs associée à cette D.G.1. (Distribution groupée univariée.)
Exercice 24 Soucieuse des problèmes de retard rencontrés sur ses lignes ferroviaires et des nom-
breuses réclamations introduites par les navetteurs, la SNCB a pris le parti de faire un relevé systé-
matique du retard moyen (en minutes) observé chaque jour sur certaines de ses grandes lignes. Les
résultats relatifs aux 200 derniers jours de l’année 2010 pour la ligne Bruxelles-Liège ont donné lieu
à la courbe cumulative des fréquences suivante. (N.B. Ces données sont fictives.)
6
1. Que représente la fréquence cumulée de 94% associée à la borne supérieure (20min) de la classe
C5?
2. Quelle est la part des retards quotidiens moyens qui dépassent 10 minutes ?
3. Durant les 200 jours d’observation, combien y a-t-il eu de jours pour lesquels le retard quotidien
moyen était supérieur à 15 minutes mais inférieur ou égal à 30 minutes ?
4. Construisez l’histogramme des effectifs associé à cette D.G.1.
Exercice 25
Exercice 26
Exercice 27
Exercice 28
Exercice 29
Exercice 30
Exercice 31
Exercice 32
Exercice 33
Exercice 34
Exercice 35
Exercice 36
Exercice 37
Exercice 38
Exercice 39
Exercice 40
Exercice 41
Exercice 42
Exercice 43
Exercice 44
Exercice 45
Exercice 46
Exercice 47
Exercice 48
7
Université Mohamed premier Année 2021-2022
Filières SVI,STU et LPGEC Semestre S3
Correction 1 : La variable mois de naissance, dont les modalités varient entre 1 (janvier) et 12
(décembre).
Correction 4 On calcule
5 + 12 − 2 + 5 + 3 + 8 31
= = 5, 166.
6 6
Correction 5 : On calcule
45 + 712 + 89 + 1013 + 1411
= 9, 2.
5
Correction 6 : On complète le tableau avec les centres de classes
Modalité Effectifs
[300,320[ 310 14
[320,370[ 345 23
[370,410[ 390 31
[410,500[ 455 12
et on calcule
31014 + + 45512
= 372, 81.
80
Correction 7 On range les données par ordre croissant −2, 3, 5, 5, 12 et on déduit que la médiane
est 5.
On range les données par ordre croissant 1, 1, 2, 2, 3, 4, 4, 6, 9, 12 et on déduit que la médiane est
(3 + 4)/2 = 3, 5.
1+4+2+9+3 19
Correction 8 On calcule la moyenne 5
= 5
= 3, 8. et donc la variance est
12 + 42 + 22 + 92 + 32
s2 = − (3, 8)2 = 7, 76.
5
√
On prend la racine carrée pour déduire l’écart-type s = 7, 76 = 2, 78.
On range les données par ordre croissant 1, 2, 3, 4, 9 et on déduit que l’amplitude est 9 − 1 = 8.
On établit une table d’effectifs
1
Modalité Effectif
-3 1
-2 1
1 2
3 1
4 1
5 1
Toutes les modalités ont la même fréquence excepté ”1” qui apparaît deux fois. Donc le mode est 1.
(cela ne change rien P de décider que c’est x1 et pas un des autres qui vaut 0. Ceci revient à trouver
4 nombres tels que 5i=1 xi = 20. En réfléchissant un peu on déduit que l’échantillon 0, 5, 5, 5, 5
est un exemple trivial. D’autres exemples moins triviaux sont simples à construire. L’échantillon
0, 3, 4, 5, 8 satisfait les contraintes
P imposées. De manière générale on prend n’importe quelles valeurs
pour x2, x3, x4 et x5 = 20 − 5i=2 xi.
Il est aisé de construire deux échantillons de même moyenne. Pour que les écart-types soient les
mêmes, il faut s’arranger pour que les deux échantillons aient la même dispersion. Par exemple on
peut prendre 18, 18et 18, 18, 18, 18 mais il s’agit d’un exemple trivial. Les échantillons 1, 3, 5et 1, 3, 3, 5
sont un exemple un peu moins idiot. Beaucoup d’autres exemples sont possibles.
2
Correction 12 On établit d’abord une table d’effectifs et de fréquences.
3
Correction 13 Il y a 50 cotes, donc N = 50 On obtient le tableau suivant
Cote n f fcc
0 10 20% 20%
1 2 4% 24%
2 2 4% 28%
3 1 2% 30%
4 2 4% 34%
5 1 2% 36%
6 5 10% 46%
7 5 10% 56%
8 4 8% 64%
9 5 10% 74%
10 2 4% 78%
11 1 2% 80%
12 1 2% 82%
13 2 4% 86%
14 2 4% 90%
15 1 2% 92%
16 2 4% 96%
17 0 0% 96%
18 0 0% 96%
19 1 2% 98%
20 1 2% 100%
Les effectifs sont donnés dans la deuxième colonne et les fréquences dans la troisième colonne. On
construit le diagramme suivant.
4
La variance est donnée par
et l’écart-type est
s = 5, 37
. En excluant les notes égales à 0 on travaille sur un échantillon de taille 40; on a donc le tableau
suivant.
Cote n f
1 2 5%
2 2 5% 28%
3 1 2.5% 30%
4 2 5% 34%
5 1 2.5% 36%
6 5 12.5% 46%
7 5 12.5% 56%
8 4 10% 64%
9 5 12.5% 74%
10 2 5% 78%
11 1 2.5% 80%
12 1 2.5% 82%
13 2 5% 86%
14 2 5% 90%
15 1 2.5% 92%
16 2 5% 96%
17 0 0% 96%
18 0 0% 96%
19 1 2.5% 98%
20 1 2.5% 100%
dont on déduit la moyenne
12 + 22 + + 191 + 201
x= = 8, 675.
40
10 étudiants ont obtenu une note supérieure ou égale à 12, parmi lesquels 4 ont une note strictement
supérieure à 15; donc la proportion demandée est
4
= 40%.
10
1+3+2+1+x
Correction 14 1. Il faut résoudre 5
= 4 dont on déduit x = 13
2. Il faut résoudre 312+x
4
= 13 dont on déduit x = 16
3. On sait 28+x+42+78+104
5
= 62 dont on déduit x = 58 et donc 112+28+42+x
4
= 112 + 28 + 42 + 584 =
60.
Correction 15 1. 69% est la valeur de la fréquence cumulée associée à la classe. Elle nous indique
que 69% des personnes qui ont participé à l’expérience ont mis au plus 19 minutes pour recons-
tituer le message mutilé (en d’autres termes, 69% des personnes ont mis un temps inférieur ou
égal à 19 minutes pour reconstituer intégralement le message mutilé).
5
2. La courbe cumulative nous indique que 84% des personnes qui ont participé à l’expérience ont
mis un temps inférieur ou égal à 21 minutes pour reconstituer le message. Il s’ensuit que 16%
des personnes ont mis plus de 21 minutes pour reconstituer le message.
3. Le temps nécessaire à la reconstitution du message était inférieur ou égal à 19 minutes chez
69% des personnes, inférieur ou égal à 21 minutes chez 84% des personnes ; il était donc > 19
min et 6 21 min chez 84% − 69% = 15% des 60 personnes qui ont participé à l’expérience,
c’est-à-dire chez 9 personnes.
4. Attention :Les classes n’ont pas toutes la même longueur. La classe modale est donc la classe
ayant la plus grande fréquence unitaire (plutôt que la classe ayant la plus grande fréquence).
Le tableau ci-dessous présente le détail des calculs permettant de déterminer les fréquences
unitaires.
f
Classe Cj Longueur Hj Fréq. Cumul Fj Fréq. fj densité hjj
[5 − 15] 10 9% 9% 0.009
]15 − 17] 2 33% 24% 0.12
]17 − 19] 2 69% 36% 0.18
]19 − 21] 2 84% 15% 0.075
]21 − 23] 2 87% 3% 0.015
]23 − 30] 7 100% 13% 0.019
Total 100%=1
La classe modale est donc la classe ]17 − 19].
5. La distribution groupée nous indique que les temps de reconstitution du message observés
varient de 5 minutes à 30 minutes. Dès lors, l’étendue de cette distribution groupée est égale
à E = 30 − 5 = 25min. (l’étendue est égale à l’écart entre la borne inférieure de la première
classe et la borne supérieure de la dernière classe).
6. La médiane par le graphique
6
7. La classe contenant la médiane est la classe C3 =]17 − 19]. C’est en effet la première classe
de la distribution groupée dont la fréquence cumulée est supérieure ou égale à 50% ; on peut
également observer cela sur le graphique de la courbe cumulative des fréquences que nous venons
de compléter à la question précédente. La valeur de la médiane de la distribution groupée est
dès lors égale à
50% − 33% 0.17
17 + (19 − 17) = 17 + 0.2 = 17.94.
69% − 33% 0.36
.
8. La distribution groupée nous permet d’estimer qu’approximativement la moitié (50%) des per-
sonnes qui ont participé à l’expérience ont mis au plus 17.94 minutes pour reconstituer inté-
gralement le message.
Correction 16 Un écart-type négatif est impossible à obtenir puisque c’est la racine d’un nombre
(la variance)
ce qui nous fait 30 modalités différentes. Pour construire 5 classes différentes qui doivent varier entre
350 et 525, on prend donc des classes d’amplitude
525 − 350
= 35.
5
En calculant en plus les centres, on obtient le tableau suivant :
7
28+x+42+78+104 112+28+42+x
Correction 18 On sait que 5
= 62 dont on déduit x = 58 et donc 4
=
112+28+42+58
4
= 60.
Correction 19 La notion de fréquence cumulée n’a aucun sens pour des variables qualitatives no-
minales.
Correction 20 Puisqu’on connait les fréquences cumulées, on peut calculer les fréquences de chaque
échantillon en prenant
fi = fi cc − fi−1 cc pour i > 1 et f1 = f1 cc.
On obtient alors le tableau suivant
Modalité Fréquence cumulée
1 15%
2 10%
3 25%
4 30%
5 20%
On sait aussi que l’effectif de la modalité 1 est 3, on doit alors avoir n1 = f1 N, ce qui nous donne
3 = 0, 15N et donc N = 20. De là on obtient chaque ni par la même formule et on a
Modalité Effectif
1 3
2 2
3 5
4 6
5 4
ce qui est équivalent à
1, 1, 1, 2, 2, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5.
Correction 22
Nombres de personnes dans le foyer Fréquence FCC
1 10% 10%
2 35% 45%
3 20% 65%
4 17.5% 82.5%
5 12.5% 90%
6 5% 100%
Total 100%
8
Fig. 3 – Courbe cumulative des fréquences
Correction 23
Classe Effectif ECC
[9.5,14.5[ 5 5
[14.5,24.5[ 5 10
[24.5,39.5[ 8 18
[39.5,54.5[ 9 27
[54.5,69.5[ 9 36
[69.5,99.5[ 4 40
Total N=40
Correction 24 1. Cette fréquence cumulée nous indique que, pour 94% des 200 jours d’observa-
tion, le retard quotidien moyen était inférieur ou égal à 20 minutes. Nous pouvons dès lors en
9
déduire que le retard quotidien moyen a excédé 20 minutes pour 6% des jours d’observation.
2. La courbe cumulative nous indique que 60% des retards quotidiens moyens étaient inférieurs
ou égaux à 10 minutes. La part des retards quotidiens moyens qui dépassent 10 minutes s’élève
donc à 40%.
3. La courbe cumulative nous indique que 78% des retards quotidiens moyens étaient inférieurs ou
égaux à 15 minutes et 99% étaient inférieurs ou égaux à 30 minutes. Il s’ensuit que 99%−78% =
21% des retards quotidiens moyens étaient supérieurs à 15 minutes mais inférieurs ou égaux à
30 minutes, ce qui correspond à 0.21 ∗ 200 = 42 jours d’observation.
4. Les classes de retards n’ayant pas toutes la même longueur, il est obligatoire de prendre les
hauteurs des rectangles constituant l’histogramme égales aux effectifs unitaires des classes. Pour
déterminer ces derniers, il nous faut tout d’abord calculer les fréquences des classes à partir de
leurs fréquences cumulées, puis en déduire les effectifs des classes que nous diviserons enfin par
les longueurs des classes.
Classe Longueur :lj Fréquence Fréquence : fj Effectif :nj = 200 ∗ fj Effectif uni-
n
CC :Fj taire := ljj
[0,2[ 2 15% 15%=0.15 30 15
[2,5[ 3 40% 40%-15%=25% 50 16.667
[5,10[ 5 60% 60%-40%=20% 40 8
[10,15[ 5 78% 78%-60%=18% 36 7.2
[15,20[ 5 94% 94%-78%=16% 32 6.4
[20,30[ 10 99% 99%-94%=5% 10 1
[30,60[ 30 100% 100%-99%=1% 2 0.067
Total 100 N=200
Correction 26
Correction 27
Correction 28
Correction 29
10
Fig. 6 – Histogramme des effectifs
Correction 30
Correction 31
Correction 32
Correction 33
Correction 34
Correction 35
Correction 36
Correction 37
Correction 38
Correction 39
11