Vous êtes sur la page 1sur 9

ECGE1114 - TP 1 - Analyse descriptive

A l’issue de ce TP, vous devriez maitriser les sujets suivants :


• Comprendre les notions de population, échantillon, variable d’intérêt.
→ Exercice 1
• Mesures de position.
→ Exercices 2 à 6
• Mesures de dispersion.
→ Exercices 7 à 10
• Représentation graphique d’une variable quantitative.
→ Exercices 11 et Exercices supplémentaire 1
• Représentation graphique d’une variable qualitative.
→ Exercices supplémentaire 2
• Questions transversales.
→ Exercices supplémentaire 3

Exercices aléatoires
1. Exercice
La variable “votre niveau de maitrise du cours de statistiques ; insufisante, faible, moyenne
ou grande” est
(a) quantitative continue
(b) quantitative discrète
(c) qualitative ordinale
(d) qualitative nominale
Solution
La bonne réponse est qualitative ordinale.
2. Exercice
Lors d’un contrôle de français, le meilleur élève de la classe était absent. La moyenne
obtenue par les 16 élèves présents a été 8.2. Si le meilleur élève avait été présent, quelle
note minimum aurait-il dû avoir pour que cette moyenne fût au moins de 8.8 ? Veillez à
ne pas arrondir les résultats obtenus lors de vos calculs intermédiaires.
(a) 17.40
(b) 18.40
(c) 8.80
(d) 9.60
(e) 14.40

ECGE1114 - TP 1 - Solutions 1
Solution
Soit a, la note du meilleur étudiant. On a
P
xi
= 8.2.
16
Dès lors, X
xi = 8.2 × 16.
En cas de présence de notre élève absent, on a
P
xi + a
≥ 8.8.
17
Dès lors, X
xi + a ≥ 17 × 8.8.
On obtient ainsi que
a ≥ (17 × 8.8) − (8.2 × 16) = 18.4.
3. Exercice
La série suivante donne la répartition des salaires (en euros) pour les employés d’une
société belge. Le nombre de salaires dans la catégorie [1500,2000[ a été perdu.
Salaire (en euros) Effectif
[500-1000[ 36
[1000-1200[ 32
[1200-1500[ 43
[1500-2000[ k
[2000-3000[ 9
Sachant que le salaire moyen dans cette société est de 1259.12 euros, que vaut l’effectif
manquant ? Arrondissez à deux décimales votre réponse et veillez à ne pas arrondir les
réponses obtenues lors de vos calculs intermédiaires.
Solution
La bonne réponse est obtenue en résolvant l’équation :
1259.12 = 36∗750+32∗1100+43∗1350+k∗1750+9∗2500
36+32+43+9+k
,
où k est l’effectif manquant.
On obtient 17.
4. Exercice
5 étudiants participent à un test d’anglais. Les résultats obtenus (sur 20) sont les suivants :
18 ; 8.45 ; 14.95 ; 16.45 ; 19.09. Que vaut la médiane de cette série ?
Arrondissez à deux décimales votre réponse et veillez à ne pas arrondir les résultats
obtenus lors de vos calculs intermédiaires.
Solution
Il faut d’abord ordonner la série. Ensuite, puisque le nombre d’éléments est impair, il
suffit de trouver l’élément du milieu, c’est-à-dire ici celui qui se trouve en position 3. Il
s’agit bien de 16.45.
5. Exercice
Le tableau suivant résume les tailles (en cm) d’un échantillon de personnes. Quelle est
la valeur du 30ème centile ? Indiquez deux décimales à votre réponse et veillez à ne pas
arrondir les résultats obtenus lors de vos calculs intermédiaires.

ECGE1114 - TP 1 - Solutions 2
Tailles Effectifs
[150, 160[ 29
[160, 170[ 60
[170, 180[ 76
[180, 190[ 34
[190, 200[ 11
Solution
La résolution se fait par interpolation linéaire. On cherche la taille en laquelle la fréquence
cumulée vaut 0.3. En calculant les fréquences cumulées, on trouve que le centile cherché
se trouve dans la classe [160,170[. Sur cette classe de longueur 10, l’accroissement de
fréquence cumulée vaut 0.2857. En partant du point 160 en lequel la fréquence cumulée
vaut 0.1381, il nous manque encore 0.3 − 0.1381 = 0.1619 de fréquence cumulée pour
arriver au niveau souhaité de 0.3. On trouve alors via une règle de trois que, en partant
de 160, il manque 10 × 0.1619
0.2857
= 5.67 pour arriver au centile cherché. La réponse est donc
165.67.
6. Exercice
Lors d’un micro-trottoir organisé dans le centre ville de Charleroi durant une compétition
de course à pied, 68 individus ont été interrogés sur leur habitude sportive. Ils ont ainsi été
invités à renseigner la distance moyenne (en km, arrondie à l’entier le plus proche) qu’ils
parcourent lors d’un entraı̂nement. La figure ci-dessous reprend les résultats obtenus. Quel
est le mode de cette distribution ?

17

16
15

10
10
Effectifs

5
5

2 2

8 9 10 11 12 13 14 15 16
Distance moyenne parcourue (en km)

Solution
La valeur qui revient le plus souvent est : 12 km
7. Exercice
Calculer la variance non-corrigée de la série suivante : 54.2, 55.83, 58.81, 66.28, 60.37.

ECGE1114 - TP 1 - Solutions 3
Arrondissez votre réponse à la deuxième décimale et veillez à ne pas arrondir vos calculs
intermédiaires.
Solution
La moyenne de la série vaut :
54.2+55.83+...+60.37
5
= 59.098.
La variance non-corrigée vaut alors :
1
5
((54.2 − 59.098)2 + (55.83 − 59.098)2 + ... + (60.37 − 59.098)2 ) = 17.59046.
8. Exercice
Le premier recensement de la population belge a eu lieu en 1846. Le tableau de distribution
ci-dessous a été construit à partir des résultats de ce recensement et présente les effectifs
par âge d’une petite commune belge.
Age (en années) Effectifs
[0-25[ 1252
[25-50[ 221
[50-75[ 3979
[75+[ 2118
Laquelle des affirmations suivantes est vraie ? (Note importante : calculez le coefficient de
variation en utilisant l’écart-type non-corrigé !)
(a) Le coefficient de variation vaut 48.79 pourcent
(b) Le coefficient de variation vaut 2.46 pourcent
(c) Le coefficient de variation vaut 96.71 pourcent
(d) Le coefficient de variation vaut 51.15 pourcent
(e) Le coefficient de variation vaut 40.58 pourcent
Solution
La moyenne de la série vaut
12.5×1252+37.5×221+62.5×3979+87.5×2118
7570
= 60.49538.
La variance de la série vaut alors :
1
7570
× ((12.5 − 60.49538)2 × 1252 + (37.5 − 60.49538)2 × 221 + (62.5 − 60.49538)2 × 3979 +
(87.5 − 60.49538)2 × 2118) p = 602.56999.
L’écart-type vaut alors (602.56999) = 24.5473.
Dès lors, le coefficient de variation vaut
24.5473
60.49538
= 0.4058.
9. Exercice
Lors d’un micro-trottoir organisé dans le centre ville de Nivelles durant une compétition
de course à pied, 81 individus ont été interrogés sur leur habitude sportive. Ils ont ainsi été
invités à renseigner la distance moyenne (en km, arrondie à l’entier le plus proche) qu’ils
parcourent lors d’un entraı̂nement. La figure ci-dessous reprend les résultats obtenus.
Quelle est l’étendue de cette distribution ? Arrondissez votre réponse à deux décimales.

ECGE1114 - TP 1 - Solutions 4
14

13

12

11
10

8
Effectifs

6
5
5

2 2

1
0

7 8 9 10 11 12 13 14 15 16 17
Distance moyenne parcourue (en km)

Solution
L’étendue de la série statistique vaut : 10 km. On obtenait cette réponse en soustrayant
à la valeur maximale de la variable la valeur minimale de la variable : 17 km - 7 km = 10
km.
10. Exercice
Lors d’une enquête menée pour déterminer le niveau d’endettement des clients d’une
banque, la différence entre revenus et dépenses a été calculée pour 650 individus. À partir
des données obtenues, un stagiaire employé pour l’étude a calculé quelques mesures (mé-
diane, premier et troisième quartiles, minimum, maximum), avant de malencontreusement
mélanger les résultats. Aidez ce stagiaire à reconnaı̂tre les différentes mesures afin de cal-
culer l’écart interquartile de la série de données. Arrondissez à la deuxième décimale votre
réponse. Veillez à ne pas arrondir les résultats obtenus lors de vos calculs intermédiaires.

Les mesures calculées à partir de la série de données : 20.41 ; -0.73 ; 2.32 ; -10.94 ; 5.57.
Solution
L’écart interquartile de la série proposée est : 5.57 - -0.73 = 6.3.
11. Exercice
Lors d’un micro-trottoir organisé au centre commercial City 2 à Bruxelles, des clients
ont fourni une estimation de leur budget mensuel (en euros) consacré au shopping. La
figure ci-dessous reprend les résultats obtenus. Quelle est la proportion d’individus ayant
un budget shopping supérieur à 225 euros ? Arrondissez votre réponse à la deuxième
décimale. Veillez à ne pas arrondir les résultats de vos calculs intermédiaires.

ECGE1114 - TP 1 - Solutions 5
Distribution du budget shopping

23
22
20

19

17
16 16
15

15 15 15
14 14
Effectif

12
10

8
5
0

50 100 150 200 250 300 350

Budget (euros)

Solution
91
Cela concerne 91 individus sur 206, soit une proportion de 206
= 0.44.

Exercices supplémentaires

1. Question. Un économiste s’intéresse à l’impact du statut marital (marié vs non-marié)


sur le salaire obtenu par les individus. Afin de comparer les deux distributions de salaire,
il construit les boxplots présentés dans le Graphique 1.
— Quel est le salaire médian chez les individus mariés ? Est-il supérieur ou inférieur chez
les individus non-mariés ?
— La taille des deux boites est similaire. Qu’est-ce que cela implique ?
— L’individu avec le salaire le plus faible est-il marié ?
— Que représentent les points à l’extrémité supérieure des deux boxplots ? Pourquoi n’y
en a-t-il pas à l’extrémité inférieure ? Est-ce logique ?

Solution.
— Le salaire médian des individus mariés est (très proche) de 1000 (cf la ligne à l’intérieur
du boxplot). Le salaire médian des individus non-mariés est inférieur.
— La taille des boites correspond à l’écart-interquartile. Les deux distributions ont donc
un écart interquartile similaire.
— Oui, en effet. Le salaire le plus faible correspond à l’extrémité inférieure du boxplot.
Or, celle-ci est plus basse chez les individus mariés.
— Il s’agit des valeurs extrêmes (outliers). Une valeur est considérée extrême lorsque
celle-si se distancie de la grande majorité des données. Techniquement, x est une

ECGE1114 - TP 1 - Solutions 6
Figure 1 – Boxplot lié à l’exercice supplémentaire 1

3000

2000
Salaire

1000

0
non oui
Marié

valeur extrême si x ∈ / [q0.25 − 1.5 × IQR; q0.75 + 1.5 × IQR] (où q0.25 est le premier
quartile, q0.75 est le troisième quartile et IQR est l’écart interquartile). Typiquement,
une distribution de salaire est asymétrique (à droite) parce que les plus grands salaires
se distancient nettement de la majorité des observations. Il y a donc des outliers sur le
haut de la distribution. Par contre, il n’y a pas d’outlier vers le bas puisque les salaires
les plus bas ne se distancient pas (autant) de la majorité des observations.
2. Question Un constructeur automobile a demandé à 250 de ses clients de faire part de leur
préférence concernant la couleur de leur voiture. Le tableau suivant reprend les résultats
obtenus.

Couleur bleu blanc rouge vert jaune gris


Effectif 61 34 37 27 11 80
a) De quel type est cette variable ?
b) Représenter graphiquement cette distribution.
c) Quelles mesure de position / dispersion peuvent-être calculées ? Calculez-les.
Solution
a) Il s’agit d’une variable qualitative nominale.

b) cf Graphique 2

c) On peut calculer uniquement le mode : “gris”.


3. Question. La figure 3 présente un graphique des résultats à un test (total sur 40). A par-
tir de ces résultats, vous avez calculé une série de statistiques (moyenne, mode, médiane,

ECGE1114 - TP 1 - Solutions 7
Figure 2 – Graphique lié à l’exercice supplémentaire 2

diagramme en barre

80
60
effectif

40
20
0

bleu blanc rouge vert jaune gris

Couleur

variance, étendue, écart inter-quartiles, écart-type et coefficient de variation). Malheureu-


sement, les résultats ont été mélangés. Vous les notez malgré tout et obtenez :
— 20
— 11.33
— 29
— 30
— 29.75
— 3.37
— 4
— 0.11
Note : la variance, l’écart-type et le coefficient de variation ont été calculés en utilisant la
version “non-corrigée”. A quelles statistiques les résultats correspondent-ils ?
Solution
— 20 (= étendue)
— 11.33 (= variance)
— 29 (= mode)
— 30 (= médiane)
— 29.75 ( = moyenne)
— 3.37 (= écart-type)
— 4 (= écart inter-quartile)
— 0.11 (= coefficient de variation)

ECGE1114 - TP 1 - Solutions 8
Figure 3 – Graphique lié à l’exercice supplémentaire 3

21
20
20

16 16 16
15
Nombre d'observations

12
11
10
10

4
3 3 3
2 2
1 1 1
0

19 20 22 23 25 26 27 28 29 30 31 32 33 34 35 36 37 39
Notes

ECGE1114 - TP 1 - Solutions 9

Vous aimerez peut-être aussi