Vous êtes sur la page 1sur 5

Licence d’Économie (L1)

Statistiques 1 – Corrigé TD 1

Benoît Mulkay
Université de Montpellier
2022 – 2023

CHAPITRE 2 : LES TABLEAUX

1. Une psychologue recueille des données sur le QI (quotient intellectuel) de la classe de 20 enfants
correspondant à la base de données « Absentéisme à l’école ». Les données sont les suivantes :

115 , 102 , 98 , 112 , 121 , 82 , 78 , 113 , 100 , 108 , 78 , 95 , 107 , 124 , 108 , 101 , 100 , 87 , 96 , 103

a) Faites un tableau de fréquences de cette variable en incluant les pourcentages et les pourcentages
cumulés.
b) Commentez les résultats obtenus.

CORRIGÉ
a) La variable « QI » est une variable quantitative (par nature ordonnée). On peut considérer qu’elle est
continue (même si on a ici uniquement des nombres entiers) parce qu’il y a beaucoup de valeur possible.
Pour le « QI », le zéro est purement conventionnel et ne reflète pas une absence totale d’intelligence.
L’échelle de cette variable est donc son échelle est donc une échelle d’intervalle.

On peut constater que la valeur minimale est de 78, et la valeur maximale de 121. Il est plus judicieux de
choisir de regrouper les valeurs par classes. On peut choisir un regroupement classique avec des classes
de 10 en 10.

Le tableau résumant les informations recueillies sur un échantillon de 20 enfants est le suivant :
Classe Pourcentage
Effectif Pourcentage
de Taille Cumulé
70 à 79 2 10 % 10 %

80 à 89 2 10 % 20 %
90 à 99 3 15 % 35 %
100 à 109 8 40 % 75 %
110 à 119 3 15 % 90 %

120 à 130 2 10 % 100 %

TOTAL 20 100 %

b) La plupart des enfants appartiennent à la classe « centrale » [100 à 109]. De même la majorité des
enfants (70%) ont un QI entre 90 et 119. Seuls 10 % des enfants ont un QI inférieur à 80, et 10 % des
enfants ont un QI supérieur ou égal à 120.

2. Un chercheur découvre sur le site Internet de M&M’s que la couleur des bonbons dans chaque sachet est
fixée : 24 % de bleus, 20 % d’orange, 16 % de verts, 14 % de marron, 13 % de jaunes et 13 % de rouges. Il décide
de vérifier en mangeant un paquet de M&M’s et il reporte les couleurs des bonbons dans le sachet (chaque lettre
correspond à l’initiale de la couleur) :

O,M,R,M,V,J,B,B,O,V,J,O,B,R,B,O,M,V,B,J

a) Combien y-a-t-il de M&M’s dans le paquet ?


b) Combien y-a-t-il de M&M’s de chaque couleur dans le paquet ?
c) Quelle est la proportion de chacune des couleurs de M&M’s ?
d) Calculez les effectifs cumulés des couleurs de M&M’s.
e) Est-ce que les proportions annoncées de M&M’s semblent respectées ?

(Vous pouvez vous aider d’Excel pour effectuer cet exercice)

CORRIGÉ
a) La couleur est une variable qualitative non ordonnée, son échelle est donc nominale.
Il y a 6 modalités. Par ordre alphabétique : Bleu (B), Jaune (J), Marron (M), Orange (O), Rouge (R), Vert
(V).
Le nombre de bonbons dans le paquet observé est de 20.

b) Il faut établir un tableau de fréquence simple, en effectuant le comptage des effectifs de chaque modalité :
Couleurs Fréquence
Bleu B 5
Jaune J 3
Marron M 3
Orange O 4
Rouge R 2
Vert V 3
TOTAL 20

c) On va calculer la fréquence relative, et le pourcentage de chaque modalité :

Fréqence Pourcentage
Couleurs Fréquence
Relative
Bleu B 5 0.25 25 %
Jaune J 3 0.15 15 %
Marron M 3 0.15 15 %
Orange O 4 0.20 20 %
Rouge R 2 0.10 10 %
Vert V 3 0.15 15 %
TOTAL 20 1.00 100 %

d) Cela n’a pas de sens de calculer des effectifs (fréquences relatives ou pourcentages) cumulés sur une
variable qualitative nominale. Par nature, la variable « couleur » n’est pas ordonnée. Ici on la présente
dans l’ordre alphabétique, mais on pourrait tirer les mêmes conclusions du tableau si on classait les
couleur dans un autre ordre.

e) On ajoute à notre tableau les pourcentages théoriques donnés par le fabriquant :

Pourcentage
Couleurs Fréquence Pourcentage
Théorique
Bleu B 5 25 % 24 %
Jaune J 3 15 % 13 %
Marron M 3 15 % 14 %
Orange O 4 20 % 20 %
Rouge R 2 10 % 13 %
Vert V 3 15 % 16 %
TOTAL 20 100 % 100 %*

Les pourcentages observés dans notre échantillon d’un paquet sont proches des pourcentages théoriques.
Les proportions semblent assez bien respectées, mais pour faire un test formel de l’hypothèse, il faudrait
utiliser de la statistique inférentielle que vous verrez en L2.
3. Raisonner sur des pourcentages et des effectifs est malaisé et conduit à de nombreuses erreurs. Quelles
sont les erreurs des énoncés ci-dessous.
a) Suite à la fusion de deux universités, un salarié rapporte que le nombre d’étudiants en échec a très
fortement augmenté.
b) Une personnalité voulant dénoncer les inégalités de genre déclare que « 10 % des femmes sont
dirigeantes d’entreprise ».
c) Un homme politique se désespère que le nombre d’incivilités a augmenté dans son pays depuis 50 ans.

CORRIGÉ
a) L’erreur provient du fait qu’on raisonne sur des effectifs sans prendre en compte le fait que le nombre
d’étudiants a fortement augmenté avec la fusion des 2 universités. Dans la première université, il y
avait 6 500 échecs parmi 20 000 étudiants (soit 32 %) ; alors que dans la seconde il y avait 9 000
échecs parmi 45 000 étudiants (soit 20 %).

Il y a forcément plus d’échec dans l’université fusionnée (15 500), si le nombre d’étudiants augmente
(ici on aura 65 000 étudiants au total). De même, il ne fait pas additionner les pourcentages (32 % +
20 % ≠ 52 % de taux d’échec dans l’université fusionnée. Mais :

6 500 + 9 000 15 500


= = 0,238 461 538 462 … = 23,8 %
20 000 + 45 000 65 000

b) La personnalité s’est trompé en raisonnant sur les pourcentages conditionnels (profil-lignes ou profil-
colonnes). Il voulait dire que 10 % des dirigeants d’entreprises sont des femmes !

c) Il est probable que la population du pays ait aussi augmenté depuis cinquante ans. L’homme politique
devrait plutôt raisonne sur le taux d’incivilité (proportion ou pourcentage) et non sur l’effectif ou le
nombre d’incivilité. Attention à un effet de taille (par exemple entre unité « statistique », par exemple
pays ou régions, entreprises,…).

5. Le comité d’entreprise de l’établissement Machin vous a recruté pour un stage d’essai pour préparer les
fêtes de Noël. Il veut savoir, pour chaque salarié, combien il a d’enfants dans la famille. Les résultats de votre
enquête sont les suivants :

0;1;2;2;0;0;4;4;0;2;2;1;2;0;1;1;2;2;0;2;2;4;0;0;1;0;4;1;2;1

a) La variable est-elle qualitative, quantitative discrète ou continue ?


b) Combien avez-vous interrogé de salariés ?
c) Etablissez un tableau pour présenter les résultats de votre enquête, en suivant les règles de construction
d’un tableau ?

[Bernard Py, Chapitre 2, Exercice 1]


CORRIGÉ
a) L’individu « statistique » est le salarié et la population est l’ensemble des salariés de l’établissement
Machin.

La variable « nombre d’enfants dans la famille » est une variable quantitative (par nature ordonnée)
discrète du fait du peu de valeurs observées (0, 1 , 2, et 4). On peut considérer qu’elle est mesurée avec
une échelle de rapport(avec un zéro absolu : pas d'enfant) . L’unité de mesure est ici le nombre d’enfants.

Remarquez qu’aucun salarié n’a 3 enfants. Mais on va tout de même considérer cette valeur, comme étant
théoriquement possible. Cependant il est inutile de prolonger le tableau pour 5, 6 ou davantage d’enfants
parce que ces situations ne sont pas observées.

Il y a autant de salariés interrogés que de réponses à cette enquête exhaustives parmi les salariés de
l’entreprise. En comptant le nombre d’observations données, on obtient 30 observations.

b) On effectue le tableau des fréquences. On peut y indiquer le pourcentage. De même, on peut donner la
fréquence et le pourcentage cumulé pour mieux caractériser la répartition des salariés.

Nombre Effectif Pourcentage


Effectif Pourcentage
d’enfants Cumulé cumulé
(𝒏𝒊 ) (𝒑𝒊 )
(𝒙𝒊 ) (𝒏𝒄𝒊 ) (𝒑𝒄𝒊 )
0 9 9 30 % 30 %

1 7 16 23 % 53 %

2 10 26 33 % 87 %

3 0 26 0% 87 %

4 4 30 13 % 100 %

TOTAL 30 100 %*

Si on fait le total des pourcentages, on obtient 99 % du fait des arrondis de présentation. Il vaut mieux
préciser alors que le total fait bien 100 %.

Vous aimerez peut-être aussi