Académique Documents
Professionnel Documents
Culture Documents
1 Exercice 1
Pourquoi les statistiques ? (Corrigé)
Connaissances préalables : Notions d’hypothèse et d’échantillon aléatoire
Buts spécifiques : Évaluer la compréhension des notions d’hypothèse et d’échantillon aléatoire
Outils nécessaires : Annexe 1, cours
Consignes : Prenez le temps de réfléchir avant de regarder le corrigé…
Lorsque nous faisons des statistiques, notamment en psychologie, nous sommes amenés à vérifier
des hypothèses à propos d’une population sur base d’un échantillon dit représentatif.
Exemples de réponse :
- Les adolescents dont les parents sont divorcés ont plus tendance à souffrir de dépression.
- La dépression touche davantage les adolescents de plus de 15 ans que les adolescents
jeunes.
- La dépression touche davantage les filles que les garçons
Il est important de noter la différence entre une affirmation et une hypothèse : l’hypothèse est
une prédiction qui a pour but d’être vérifiée et qui pourrait s’avérer fausse.
2. Ces chercheurs font leur étude sur base d’un échantillon de 200 adolescents de 15 ans qu’ils ont
choisis au hasard dans un établissement d’enseignement secondaire général de Virton. Peut-on
considérer que cet échantillon est représentatif des adolescents scolarisés en Belgique ?
Réponse :
Cet échantillon n’est pas représentatif. Il aurait fallu puiser l’échantillon dans les différentes
communautés linguistiques du pays, dans des grosses villes et de petits villages, dans des
milieux socio-économiques, culturels et religieux différents, choisir des adolescents d’âges
différents…
1. Des chercheurs s’intéressent à l’obésité chez les jeunes. Donnez deux exemples de variables (et
leur codage) quantitatives et qualitatives qui pourraient être utilisées dans le cadre de cette
étude.
Exemples de réponse :
• Variables qualitatives : genre (féminin, masculin); fumeur (oui, non) ; pratique d’un
sport (oui, non) ; personnalité dépressive (oui, non) …
• Variables quantitatives : nombre de repas pris sur la journée ; nombre d’he ures passées
devant la télévision par semaine ; poids ; taille ; âge ; taux de l’hormone x dans le sang ;
pratique d’un sport par semaine (pas du tout, un peu, beaucoup)…
2. Des chercheurs s’intéressent à l’obésité chez les jeunes. Donnez deux exemples de variables
indépendantes et dépendantes qui pourraient être utilisées dans le cadre de cette étude.
Exemples de réponse :
1. Un instituteur note l’ordre dans lequel ses élèves terminent leur interrogation. Le premier à finir,
le deuxième… Quelle échelle de mesure est utilisée ?
Réponse :
Une échelle ordinale
2. Dans une étude sur la perception des expressions faciales, les participants doivent classer les
photographies qu’on leur montre dans une des 3 catégories d’expression émotionnelle
suivantes : triste, joyeux ou neutre. Sur quelle échelle est mesurée l’expression émotionnelle ?
Réponse :
Une échelle nominale
3. Un questionnaire porte sur (a) l’âge, (b) le genre, (c) la profession, (d) la taille, (e) le nombre
d’enfants d’une personne. Quelles sont les échelles utilisées pour ces différentes mesures ?
Réponses :
A et D : échelle de rapports
B et C : échelle nominale
E : échelle absolue
Observons le tableau de données ci-joint (Annexe 2). Utilisons notre bon sens pour l’analyser. Une
première approche des statistiques peut se faire de manière très intuitive.
Réponse :
Un sujet, un cas ou en l’occurrence ici, un étudiant différent.
2. D’une ligne à l’autre, les valeurs attribuées à un sujet différent peuvent varier. Chaque colonne
représente donc :
Réponse :
Une variable
Le tableau que nous sommes en train d’analyser est intéressant, mais peu économique et peu
lisible en tant que tel.
Réponse :
Tableau :
5. Quelles valeurs représentent les notations suivantes et quelle est la signification de ces valeurs ?
Réponses :
• n 2 = nblonds = 3 = nombre de personnes ayant les cheveux blonds dans l’échantillon.
• f 3 = f noirs = 0,08 = proportion de personnes ayant les cheveux noirs dans l’échantillon.
N.B. : Vos réponses pourraient être différentes selon l’ordre dans lequel vous avez placé les
données dans le tableau. Dans ce cas-ci, puisque c’est une variable nominale, ça n’a pas
d’importance.
6. Représentez les données que vo us avez regroupées à l’exercice 4 sous la forme de deux
diagrammes en barres, l’un pour les fréquences absolues (nombre absolu de personnes
concernées), l’autre pour les fréquences relatives (exprimées en %). Comparez les deux
graphiques. Notez sur chaque graphe la légende, le titre, le sens et l’échelle de l’axe Y.
Fréquences absolues :
Répartition des différentes couleurs de cheveux dans l'échantillon
5
nombre de personnes
0
blonds bruns chatains noirs
Couleur de cheveux
N =12
45
40
35
30
25
%
20
15
10
0
blonds bruns chatains noirs
couleur de cheveux
N = 12
Répartition des différentes couleurs de cheveux dans l'échantillon
100
90
80
70
60
%
50
40
30
20
10
0
blonds bruns chatains noirs
couleur de cheveux
N = 12
On peut énumérer les classes dans n’importe quel ordre, on peut les disposer n’importe comment
sur l’axe horizontal d’un diagramme en barres puisqu’il s’agit d’une variable nominale.
L’apparence globale du graphique ne peut être utilisée. L’espace entre les barres est arbitraire
mais il en faut un, la largeur des barres n’a pas d’importance non plus. La seule chose qui puisse
être comparée est la hauteur des différentes barres qui représente le nombre ou la fréquence
relative de personnes qui se trouvent dans une catégorie ou une autre.
Le troisième diagramme est un peu « écrasé ». Tout dépend de l’échelle dont il faut tenir compte.
L’échelle est arbitraire, mais peut influencer (et donc fausser) l’impression donnée par un
graphique.
7. Repérez dans le tableau (Annexe 2) les variables qualitatives et quantitatives. A quelles échelles
de mesure renvoient-elles ? Donnez les 2 méthodes utilisées pour coder les variables
qualitatives.
Réponses :
8. Dressez le tableau des fréquences des notes en complétant le tableau suivant (cf. annexe 2) :
j Notes Fréq. abs. Fréq. abs. cum. Fréq. rel. en % Fréq. rel. cum.
1 11 2 2 16.67% 16.67%
2 12 3 5 25% 41.67%
3 14 1 6 8.33% 50%
4 15 2 8 16.67% 66.67%
5 16 2 10 16.67% 83.34%
6 18 2 12 16.67% 100,01% ˜ 100%
total 12 100,01%
Graphique :
Histogramme fréquences absolues des valeurs non groupées
de la variable note mesurée en points pour les 12 élèves
3
Fréquences
0
11 12 13 14 15 16 17 18
Cotes
10. Que peut-on dire par rapport à la surface de chaque rectangle de l’histogramme ci-dessus et par
rapport à la surface totale des rectangles ?
Réponse :
- Les surfaces des rectangles sont proportionnelles aux fréquences des observations
- La surface totale obtenue en sommant les surfaces de tous les rectangles de
l’histogramme correspond donc à la fréquence absolue cumulée de toutes les
observations.
N.B. : Si tous les rectangles ont la même base, on peut se contenter d’en regarder la hauteur.
11. Représentez sous la forme d’une distribution de fréquence groupée en classes de 2 points la
variable note. Indiquez les fréquences absolues, relatives, relatives cumulées et relatives
cumulées exprimées en %.
Réponse :
Fréq. rel. cum.
Fréq. abs. Fréq. rel. Fréq. rel. cum.
en %
10,5 - 12,5 5 0,42 0,42 42 %
12,5 - 14,5 1 0,08 0,50 50 %
14,5 - 16,5 4 0,33 0,83 83 %
16,5 - 18,5 2 0,17 1,00 100 %
12 1,00
1. Dans quelles conditions l’ensemble des étudiants de l’ULB seraient- ils considérés comme une
population ?
Réponse :
Dans tous les cas où on veut étudier uniquement les résultats des étudiants de l’ULB.
2. Dans quelles conditions l’ensemble des étudiants de l’ULB seraient- ils considérés comme un
échantillon ?
Réponse :
Dans tous les cas où l’étude porte sur une population plus large qu’uniquement les étudiants de
l’ULB.
3. Si l’ensemble des étudiants de l’ULB était considéré comme un échantillon, s’agirait- il d’un
échantillon aléatoire ? Expliquez votre réponse.
Réponse :
Il s’agirait d’un échantillon non aléatoire car l’ensemble des étudiants (par exemple de
Belgique) n’ a pas une chance égale d’être inclus dans l’échantillon.
1. Une hypothèse peut être définie comme une prédiction à propos des effets d’une variable
(a) ____________________ sur une variable (b) _________________.
Réponses :
a) variable indépendante
b) variable dépendante
2. Des chercheurs désirent comparer les capacités d’interactions sociales d’un groupe d’enfants de
3 ans qui sont allés à la crèche avec celles d’un groupe d’enfants de 3 ans qui n’y sont pas allés.
Quelle est la variable dépendante dans cette étude ? Quelle est la variable indépendante ?
Réponses :
La fréquentation d’une crèche = variable indépendante
Les capacités d’interactions sociales = variable dépendante
3. Dans une étude sur les capacités mnésiques, les participants doivent mémoriser en soirée une
liste de 20 mots qu’on leur demande de rappeler après un intervalle de 8 heures. Un groupe de
participants dort pendant cet intervalle, l’autre groupe est maintenu éveillé. L’expérimentateur
désire investiguer si le type d’activité (sommeil vs veille) pendant l’intervalle influence le
nombre de mots correctement rappelés. Dans cette étude, quelles sont les variables dépendante
et indépendante ?
Réponses :
variable indépendante = le type d’activité pendant l’intervalle
variable dépendante = nombre de mots correctement rappelés
1. Un chercheur a une liste avec la taille en cm d’un groupe d’enfants de 8 ans ; par exemple 123
cm, 146 cm, 130 cm… Quelle échelle de mesure est utilisée ?
Réponse :
Une échelle de rapport. Le zéro correspond à l’absence de taille (zéro absolu) et on peut utiliser
ces tailles pour former des rapports. Un enfant de 80 cm est 2 fois plus petit qu’un enfant
d’1m60.
2. Ce chercheur convertit ces tailles sur une nouvelle échelle en calculant la différence pour
chaque enfant entre sa taille et la taille moyenne du groupe. Un enfant qui a exactement la taille
moyenne du groupe a un score de 0 ; un enfant qui a 1 cm de plus que la taille moyenne du
groupe obtient un score de +1 ; en enfant qui a 2 cm de moins obtient un score de -2 … Quelle
échelle est utilisée ?
Réponse :
Une échelle d’intervalle. En effet, un score de 0 ne correspond plus à l’absence de taille mais à
la taille moyenne. De plus, un enfant qui a un score de +9 n’est pas 3 fois plus grand qu’un
enfant qui a un score de +3. Les rapports sur les tailles n’ont donc plus de sens mais sur les
différences, ils continuent à avoir du sens.
N.B. : les échelles de mesure étant hiérarchisées, indiquez le niveau le plus élevé.
1
Le QI n’est qu’une échelle ordinale mais par convention dans les études statistiques on a tendance à se comporter
comme s’il s’agissait d’une échelle de rapports.
Cinquante-quatre patients se sont rendus à la clinique un jour donné. On a attribué à chacun d’eux
une lettre en fonction du problème dont ils souffraient.
A B B E B D B G F G B
B C E B B A B B B G B
C F D G G D D G G B F
G A G A F G G G C D E
B B B G G G A B C B
Réponse :
Sur une échelle qualitative (nominale, catégorielle).
Réponse :
Graphique :
Fréquences relatives
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
A B C D E F G
Motif de la
demande
Commentaires :
Cinq des sept catégories ne recouvrent chacune que moins de 10% des motifs de consultation ce
jour- là. Ces cinq catégories réunies ne reprennent que 39% des patients. Les 61 autres pour cent
relèvent de deux catégories seulement, puisque 33% des sujets consultent pour une dépression
générale et 28% pour d’autres raisons.
L’ordre des barres sur le graphique n’a pas d’importance puisque nous sommes sur une échelle
nominale, donc en deçà d’une échelle ordinale.
17 18 19 20 22 22 23 23 24 25
25 26 26 27 27 27 27 27 28 28
28 28 28 29 29 29 29 30 30 30
30 30 31 31 31 31 31 32 32 33
33 34 35 35 36 36 38 39 40 41
Réponse :
Sur une échelle de rapports.
2. Groupez cette série en classes et construisez le tableau de la distribution observée des fréquences
absolues (effectifs) et relatives correspondant. Prenez, pour ce faire, 5 classes de même largeur.
Réponse :
Graphique :
N = 50
30
25
20
15
10
0
16,5-21,5 21,5-26,5 26,5-31,5 31,5-36,5 36,5-41,5
Commentaires :
Les âges des membres de ce club sportif se distribuent de façon symétrique de part et d’autre de
la classe "centrale", la classe 26,5 – 31,5.
La classe 26,5 – 31,5 compte le plus grand effectif : c’est la classe modale (cf. TP2).
N.B. : L’ordre des rectangles est important. Les rectangles doivent être collés les uns aux autres
parce qu’il s’agit d’une variable continue. La base des rectangles doit être identique si les
classes ont la même largeur. Un trou entre deux rectangles signifierait que la classe est vide : il
n’y a que dans ce cas que deux rectangles pourraient ne pas se toucher.
? Hypothèse : prédiction par rapport aux résultats de l’étude (qui pourrait à l’issue de l’étude
s’avérer vraie ou fausse voire être nuancée).
? Population : ensemble de tous les individus (ou évènements ou objets) qui nous intéressent
pour une étude particulière.
? Echantillon : une partie des individus sélectionnés dans la population
? Echantillon aléatoire : échantillon pris au hasard. Chaque élément de la population a une
chance égale d’être pris dans l’échantillon.
? Variable : propriété d’un objet (la couleur des cheveux, le genre…) ou d’un événement qui
peut prendre différentes valeurs (qui peut donc varier). Chaque élément de la population
prend une valeur pour chaque variable.
? Variable qualitative = catégorielle = nominale : variable dont les valeurs sont des noms,
des étiquettes.
? Variable quantitative : variable dont les valeurs sont le résultat d’une mesure.
? Variable indépendante : variable manipulée ou contrôlée par l’expérimentateur.
? Variable dépendante : variable dont on observe les changements (= les données).
? Echelle nominale : étiquette qui catégorise les observations (féminin- masculin ; blond-
brun-roux…).
? Echelle ordinale : range les personnes, objets ou événe ments le long d’un continuum.
? Echelle d’intervalles : des différences ou intervalles égaux entre les nombres sur l’échelle
reflètent des différences égales en termes de magnitude mais pas en terme de rapport.
? Echelle de rapport : les rapports entre les no mbres sur l’échelle reflètent les rapports en
magnitude. Echelle possédant un vrai zéro (zéro absolu), qui correspond à l’absence de la
chose mesurée.
? Echelle absolue : échelle basée sur des nombres entiers réels positifs, possédant un vrai
zéro, dont la fonction est le dénombrement (comptage).
? Distribution de fréquences : répartition organisée du nombre d’individus appartenant à
chacune des catégories de l’échelle de mesure.
? Distribution de fréquences groupées : lorsque la variable compte un nombre important de
valeurs, il peut être plus approprié (pour plus de clarté) de grouper certaines valeurs entre
elles et de créer ainsi des classes ( ≠ de catégories).
? Fréquence absolues = n j ou ni : effectif, c’est à dire le nombre d’observations dans chaque
catégorie ou classe.
n
? Fréquence relative = f j : rapport entre l’effectif d’une classe et l’effectif total. f j = j . Si
N
on multiplie la fréquence relative par 100, on obtient la fréquence relative exprimée en %.
nombre
Num Groupe Âge genre Taille (cm) Poids (kg) Yeux Cheveux Sport Fumer Lunettes note /20
de frères
1 1 22 F 166 55 bleus blonds 1 1 1 18 1
2 1 19 M 165 59 bleus blonds 2 4 1 12 0
3 1 22 F 173 86 marrons bruns 2 1 0 11 2
4 1 20 M 178 55 bruns bruns 2 2 0 14 1
5 2 20 M 178 61 bleus bruns 1 1 1 15 1
6 2 19 F 155 58 bruns châtains 2 1 1 16 2
7 2 19 F 171 70 verts bruns 2 3 0 15 2
8 2 20 F 165 58 verts blonds 3 1 0 18 0
9 3 21 F 170 58 bruns noirs 2 3 1 12 3
10 3 19 M 181 74 bruns bruns 4 3 0 12 0
11 3 19 F 159 52 verts châtains 2 1 0 11 0
12 3 19 F 162 45 verts châtains 3 1 1 16 2