Académique Documents
Professionnel Documents
Culture Documents
Exercices aléatoires
1. Exercice
La variable “votre niveau de maitrise du cours de statistiques ; insufisante, faible, moyenne
ou grande” est
(a) quantitative continue
(b) quantitative discrète
(c) qualitative ordinale
(d) qualitative nominale
Solution
La bonne réponse est qualitative ordinale.
2. Exercice
Lors d’un contrôle de français, le meilleur élève de la classe était absent. La moyenne
obtenue par les 16 élèves présents a été 8.2. Si le meilleur élève avait été présent, quelle
note minimum aurait-il dû avoir pour que cette moyenne fût au moins de 8.8 ? Veillez à
ne pas arrondir les résultats obtenus lors de vos calculs intermédiaires.
(a) 17.40
(b) 18.40
(c) 8.80
(d) 9.60
(e) 14.40
ECGE1114 - TP 1 - Solutions 1
Solution
Soit a, la note du meilleur étudiant. On a
P
xi
= 8.2.
16
Dès lors, X
xi = 8.2 × 16.
En cas de présence de notre élève absent, on a
P
xi + a
≥ 8.8.
17
Dès lors, X
xi + a ≥ 17 × 8.8.
On obtient ainsi que
a ≥ (17 × 8.8) − (8.2 × 16) = 18.4.
3. Exercice
La série suivante donne la répartition des salaires (en euros) pour les employés d’une
société belge. Le nombre de salaires dans la catégorie [1500,2000[ a été perdu.
Salaire (en euros) Effectif
[500-1000[ 36
[1000-1200[ 32
[1200-1500[ 43
[1500-2000[ k
[2000-3000[ 9
Sachant que le salaire moyen dans cette société est de 1259.12 euros, que vaut l’effectif
manquant ? Arrondissez à deux décimales votre réponse et veillez à ne pas arrondir les
réponses obtenues lors de vos calculs intermédiaires.
Solution
La bonne réponse est obtenue en résolvant l’équation :
1259.12 = 36∗750+32∗1100+43∗1350+k∗1750+9∗2500
36+32+43+9+k
,
où k est l’effectif manquant.
On obtient 17.
4. Exercice
5 étudiants participent à un test d’anglais. Les résultats obtenus (sur 20) sont les suivants :
18 ; 8.45 ; 14.95 ; 16.45 ; 19.09. Que vaut la médiane de cette série ?
Arrondissez à deux décimales votre réponse et veillez à ne pas arrondir les résultats
obtenus lors de vos calculs intermédiaires.
Solution
Il faut d’abord ordonner la série. Ensuite, puisque le nombre d’éléments est impair, il
suffit de trouver l’élément du milieu, c’est-à-dire ici celui qui se trouve en position 3. Il
s’agit bien de 16.45.
5. Exercice
Le tableau suivant résume les tailles (en cm) d’un échantillon de personnes. Quelle est
la valeur du 30ème centile ? Indiquez deux décimales à votre réponse et veillez à ne pas
arrondir les résultats obtenus lors de vos calculs intermédiaires.
ECGE1114 - TP 1 - Solutions 2
Tailles Effectifs
[150, 160[ 29
[160, 170[ 60
[170, 180[ 76
[180, 190[ 34
[190, 200[ 11
Solution
La résolution se fait par interpolation linéaire. On cherche la taille en laquelle la fréquence
cumulée vaut 0.3. En calculant les fréquences cumulées, on trouve que le centile cherché
se trouve dans la classe [160,170[. Sur cette classe de longueur 10, l’accroissement de
fréquence cumulée vaut 0.2857. En partant du point 160 en lequel la fréquence cumulée
vaut 0.1381, il nous manque encore 0.3 − 0.1381 = 0.1619 de fréquence cumulée pour
arriver au niveau souhaité de 0.3. On trouve alors via une règle de trois que, en partant
de 160, il manque 10 × 0.1619
0.2857
= 5.67 pour arriver au centile cherché. La réponse est donc
165.67.
6. Exercice
Lors d’un micro-trottoir organisé dans le centre ville de Charleroi durant une compétition
de course à pied, 68 individus ont été interrogés sur leur habitude sportive. Ils ont ainsi été
invités à renseigner la distance moyenne (en km, arrondie à l’entier le plus proche) qu’ils
parcourent lors d’un entraı̂nement. La figure ci-dessous reprend les résultats obtenus. Quel
est le mode de cette distribution ?
17
16
15
10
10
Effectifs
5
5
2 2
8 9 10 11 12 13 14 15 16
Distance moyenne parcourue (en km)
Solution
La valeur qui revient le plus souvent est : 12 km
7. Exercice
Calculer la variance non-corrigée de la série suivante : 54.2, 55.83, 58.81, 66.28, 60.37.
ECGE1114 - TP 1 - Solutions 3
Arrondissez votre réponse à la deuxième décimale et veillez à ne pas arrondir vos calculs
intermédiaires.
Solution
La moyenne de la série vaut :
54.2+55.83+...+60.37
5
= 59.098.
La variance non-corrigée vaut alors :
1
5
((54.2 − 59.098)2 + (55.83 − 59.098)2 + ... + (60.37 − 59.098)2 ) = 17.59046.
8. Exercice
Le premier recensement de la population belge a eu lieu en 1846. Le tableau de distribution
ci-dessous a été construit à partir des résultats de ce recensement et présente les effectifs
par âge d’une petite commune belge.
Age (en années) Effectifs
[0-25[ 1252
[25-50[ 221
[50-75[ 3979
[75+[ 2118
Laquelle des affirmations suivantes est vraie ? (Note importante : calculez le coefficient de
variation en utilisant l’écart-type non-corrigé !)
(a) Le coefficient de variation vaut 48.79 pourcent
(b) Le coefficient de variation vaut 2.46 pourcent
(c) Le coefficient de variation vaut 96.71 pourcent
(d) Le coefficient de variation vaut 51.15 pourcent
(e) Le coefficient de variation vaut 40.58 pourcent
Solution
La moyenne de la série vaut
12.5×1252+37.5×221+62.5×3979+87.5×2118
7570
= 60.49538.
La variance de la série vaut alors :
1
7570
× ((12.5 − 60.49538)2 × 1252 + (37.5 − 60.49538)2 × 221 + (62.5 − 60.49538)2 × 3979 +
(87.5 − 60.49538)2 × 2118) p = 602.56999.
L’écart-type vaut alors (602.56999) = 24.5473.
Dès lors, le coefficient de variation vaut
24.5473
60.49538
= 0.4058.
9. Exercice
Lors d’un micro-trottoir organisé dans le centre ville de Nivelles durant une compétition
de course à pied, 81 individus ont été interrogés sur leur habitude sportive. Ils ont ainsi été
invités à renseigner la distance moyenne (en km, arrondie à l’entier le plus proche) qu’ils
parcourent lors d’un entraı̂nement. La figure ci-dessous reprend les résultats obtenus.
Quelle est l’étendue de cette distribution ? Arrondissez votre réponse à deux décimales.
ECGE1114 - TP 1 - Solutions 4
14
13
12
11
10
8
Effectifs
6
5
5
2 2
1
0
7 8 9 10 11 12 13 14 15 16 17
Distance moyenne parcourue (en km)
Solution
L’étendue de la série statistique vaut : 10 km. On obtenait cette réponse en soustrayant
à la valeur maximale de la variable la valeur minimale de la variable : 17 km - 7 km = 10
km.
10. Exercice
Lors d’une enquête menée pour déterminer le niveau d’endettement des clients d’une
banque, la différence entre revenus et dépenses a été calculée pour 650 individus. À partir
des données obtenues, un stagiaire employé pour l’étude a calculé quelques mesures (mé-
diane, premier et troisième quartiles, minimum, maximum), avant de malencontreusement
mélanger les résultats. Aidez ce stagiaire à reconnaı̂tre les différentes mesures afin de cal-
culer l’écart interquartile de la série de données. Arrondissez à la deuxième décimale votre
réponse. Veillez à ne pas arrondir les résultats obtenus lors de vos calculs intermédiaires.
Les mesures calculées à partir de la série de données : 20.41 ; -0.73 ; 2.32 ; -10.94 ; 5.57.
Solution
L’écart interquartile de la série proposée est : 5.57 - -0.73 = 6.3.
11. Exercice
Lors d’un micro-trottoir organisé au centre commercial City 2 à Bruxelles, des clients
ont fourni une estimation de leur budget mensuel (en euros) consacré au shopping. La
figure ci-dessous reprend les résultats obtenus. Quelle est la proportion d’individus ayant
un budget shopping supérieur à 225 euros ? Arrondissez votre réponse à la deuxième
décimale. Veillez à ne pas arrondir les résultats de vos calculs intermédiaires.
ECGE1114 - TP 1 - Solutions 5
Distribution du budget shopping
23
22
20
19
17
16 16
15
15 15 15
14 14
Effectif
12
10
8
5
0
Budget (euros)
Solution
91
Cela concerne 91 individus sur 206, soit une proportion de 206
= 0.44.
Exercices supplémentaires
Solution.
— Le salaire médian des individus mariés est (très proche) de 1000 (cf la ligne à l’intérieur
du boxplot). Le salaire médian des individus non-mariés est inférieur.
— La taille des boites correspond à l’écart-interquartile. Les deux distributions ont donc
un écart interquartile similaire.
— Oui, en effet. Le salaire le plus faible correspond à l’extrémité inférieure du boxplot.
Or, celle-ci est plus basse chez les individus mariés.
— Il s’agit des valeurs extrêmes (outliers). Une valeur est considérée extrême lorsque
celle-si se distancie de la grande majorité des données. Techniquement, x est une
ECGE1114 - TP 1 - Solutions 6
Figure 1 – Boxplot lié à l’exercice supplémentaire 1
3000
2000
Salaire
1000
0
non oui
Marié
valeur extrême si x ∈ / [q0.25 − 1.5 × IQR; q0.75 + 1.5 × IQR] (où q0.25 est le premier
quartile, q0.75 est le troisième quartile et IQR est l’écart interquartile). Typiquement,
une distribution de salaire est asymétrique (à droite) parce que les plus grands salaires
se distancient nettement de la majorité des observations. Il y a donc des outliers sur le
haut de la distribution. Par contre, il n’y a pas d’outlier vers le bas puisque les salaires
les plus bas ne se distancient pas (autant) de la majorité des observations.
2. Question Un constructeur automobile a demandé à 250 de ses clients de faire part de leur
préférence concernant la couleur de leur voiture. Le tableau suivant reprend les résultats
obtenus.
b) cf Graphique 2
ECGE1114 - TP 1 - Solutions 7
Figure 2 – Graphique lié à l’exercice supplémentaire 2
diagramme en barre
80
60
effectif
40
20
0
Couleur
ECGE1114 - TP 1 - Solutions 8
Figure 3 – Graphique lié à l’exercice supplémentaire 3
21
20
20
16 16 16
15
Nombre d'observations
12
11
10
10
4
3 3 3
2 2
1 1 1
0
19 20 22 23 25 26 27 28 29 30 31 32 33 34 35 36 37 39
Notes
ECGE1114 - TP 1 - Solutions 9