Vous êtes sur la page 1sur 18

T.P.

1 Exercice 1
Pourquoi les statistiques ? (Corrigé)
Connaissances préalables : Notions d’hypothèse et d’échantillon aléatoire
Buts spécifiques : Évaluer la compréhension des notions d’hypothèse et d’échantillon aléatoire
Outils nécessaires : Annexe 1, cours
Consignes : Prenez le temps de réfléchir avant de regarder le corrigé…

Lorsque nous faisons des statistiques, notamment en psychologie, nous sommes amenés à vérifier
des hypothèses à propos d’une population sur base d’un échantillon dit représentatif.

1. Des chercheurs s’intéressent à la notion de dépression chez les adolescents résidents en


Belgique. Formulez une hypothèse par rapport à ce thème de recherche.

Exemples de réponse :

- Les adolescents dont les parents sont divorcés ont plus tendance à souffrir de dépression.
- La dépression touche davantage les adolescents de plus de 15 ans que les adolescents
jeunes.
- La dépression touche davantage les filles que les garçons

Il est important de noter la différence entre une affirmation et une hypothèse : l’hypothèse est
une prédiction qui a pour but d’être vérifiée et qui pourrait s’avérer fausse.

2. Ces chercheurs font leur étude sur base d’un échantillon de 200 adolescents de 15 ans qu’ils ont
choisis au hasard dans un établissement d’enseignement secondaire général de Virton. Peut-on
considérer que cet échantillon est représentatif des adolescents scolarisés en Belgique ?

Réponse :

Cet échantillon n’est pas représentatif. Il aurait fallu puiser l’échantillon dans les différentes
communautés linguistiques du pays, dans des grosses villes et de petits villages, dans des
milieux socio-économiques, culturels et religieux différents, choisir des adolescents d’âges
différents…

TP 1 – 2006/2007 (Corrigé) 1/18


T.P. 1 Exercice 2
Les variables (Corrigé)
Connaissances préalables : Variables dépendantes et indépendantes ; quantitatives et qualitatives
Buts spécifiques : Manipuler les notions de variables dépendantes et indépendantes ; quantitatives et qualitatives
Outils nécessaires : Annexe 1, cours
Consignes : euh… Aucune, si ce n’est de répondre aux questions ! ?

1. Des chercheurs s’intéressent à l’obésité chez les jeunes. Donnez deux exemples de variables (et
leur codage) quantitatives et qualitatives qui pourraient être utilisées dans le cadre de cette
étude.

Exemples de réponse :

• Variables qualitatives : genre (féminin, masculin); fumeur (oui, non) ; pratique d’un
sport (oui, non) ; personnalité dépressive (oui, non) …
• Variables quantitatives : nombre de repas pris sur la journée ; nombre d’he ures passées
devant la télévision par semaine ; poids ; taille ; âge ; taux de l’hormone x dans le sang ;
pratique d’un sport par semaine (pas du tout, un peu, beaucoup)…

2. Des chercheurs s’intéressent à l’obésité chez les jeunes. Donnez deux exemples de variables
indépendantes et dépendantes qui pourraient être utilisées dans le cadre de cette étude.

Exemples de réponse :

• Variable dépendante : poids en kg avec variable indépendante : milieu socio-


économique.
• Variable dépendante : poids en kg avec variable indépendante : culture d’origine.
• Variable dépendante : poids en kg avec variable indépendante : nombre de repas par
jour.
• Variable dépendante : nombre de repas par jour avec variable indépendante : structure
familiale.

TP 1 – 2006/2007 (Corrigé) 2/18


T.P. 1 Exercice 3
Les échelles de mesure (Corrigé)
Connaissances préalables : Les échelles de mesure
Buts spécifiques : Manipuler les différentes échelles de mesure
Outils nécessaires : Annexe 1, cours

1. Un instituteur note l’ordre dans lequel ses élèves terminent leur interrogation. Le premier à finir,
le deuxième… Quelle échelle de mesure est utilisée ?

Réponse :
Une échelle ordinale

2. Dans une étude sur la perception des expressions faciales, les participants doivent classer les
photographies qu’on leur montre dans une des 3 catégories d’expression émotionnelle
suivantes : triste, joyeux ou neutre. Sur quelle échelle est mesurée l’expression émotionnelle ?

Réponse :
Une échelle nominale

3. Un questionnaire porte sur (a) l’âge, (b) le genre, (c) la profession, (d) la taille, (e) le nombre
d’enfants d’une personne. Quelles sont les échelles utilisées pour ces différentes mesures ?

Réponses :
A et D : échelle de rapports
B et C : échelle nominale
E : échelle absolue

TP 1 – 2006/2007 (Corrigé) 3/18


T.P. 1 Exercice 4
Vocabulaire statistique descriptive (Corrigé)
Connaissances préalables : Notions de fréquence, diagramme en barres, histogramme, variables qualitatives et
quantitatives, échelles de mesure
Outils nécessaires : Annexe 2 + calculatrice, cours
Consignes : Réfléchir… et arrondir à 2 décimales

Observons le tableau de données ci-joint (Annexe 2). Utilisons notre bon sens pour l’analyser. Une
première approche des statistiques peut se faire de manière très intuitive.

1. Chaque ligne du tableau (sauf la première) représente :

Réponse :
Un sujet, un cas ou en l’occurrence ici, un étudiant différent.

2. D’une ligne à l’autre, les valeurs attribuées à un sujet différent peuvent varier. Chaque colonne
représente donc :

Réponse :
Une variable

Le tableau que nous sommes en train d’analyser est intéressant, mais peu économique et peu
lisible en tant que tel.

3. Comment pourrions-nous représenter la variable « cheveux » de manière plus « économique » ?


Placez ces données dans un tableau au nombre de lignes le plus limité possible.

Réponse :

En regroupant les données sous forme d’une distribution de fréquences, c’est-à-dire en


comptant le nombre de personnes ayant des cheveux bruns, blonds, châtains et noirs représentés
dans notre échantillon, nous obtenons le tableau de distribution de fréquences suivant :

j Cheveux Fréquences absolues (ou effectifs) n j


1 bruns 5 = n1
2 blonds 3 = n2
3 noirs 1 = n3
4 châtains 3 = n4
Total = N 12 = n5

La fréquence absolue, ou effectif, se note nj où l’indice j indique el numéro de la variable


recodée ou simplement un indice muet représentant le numéro attribué à la catégorie. Par
exemple, la fréquence absolue du groupe «cheveux bruns » se note n1 = 5 et correspond au
nombre de sujets ayant les cheveux bruns dans l’échantillon.

TP 1 – 2006/2007 (Corrigé) 4/18


4. Donnez les fréquences relatives et les fréquences relatives exprimées en pourcentages pour cette
variable.

Tableau :

j Cheveux Fréquences relatives f j Fréquences relatives en %


5
1 bruns f1 = = 0,42 42 %
12
3
2 blonds f2 = = 0,25 25 %
12
1
3 noirs f3 = = 0,08 8%
12
3
4 châtains f4 = = 0,25 25 %
12
Total 1 100 %

5. Quelles valeurs représentent les notations suivantes et quelle est la signification de ces valeurs ?

Réponses :
• n 2 = nblonds = 3 = nombre de personnes ayant les cheveux blonds dans l’échantillon.
• f 3 = f noirs = 0,08 = proportion de personnes ayant les cheveux noirs dans l’échantillon.
N.B. : Vos réponses pourraient être différentes selon l’ordre dans lequel vous avez placé les
données dans le tableau. Dans ce cas-ci, puisque c’est une variable nominale, ça n’a pas
d’importance.

6. Représentez les données que vo us avez regroupées à l’exercice 4 sous la forme de deux
diagrammes en barres, l’un pour les fréquences absolues (nombre absolu de personnes
concernées), l’autre pour les fréquences relatives (exprimées en %). Comparez les deux
graphiques. Notez sur chaque graphe la légende, le titre, le sens et l’échelle de l’axe Y.

Fréquences absolues :
Répartition des différentes couleurs de cheveux dans l'échantillon

5
nombre de personnes

0
blonds bruns chatains noirs
Couleur de cheveux

N =12

TP 1 – 2006/2007 (Corrigé) 5/18


Fréquences relatives :

Répartition des différentes couleurs de cheveux dans l'échantillon

45

40

35

30

25
%

20

15

10

0
blonds bruns chatains noirs
couleur de cheveux

N = 12
Répartition des différentes couleurs de cheveux dans l'échantillon

100
90
80
70
60
%

50
40

30
20
10
0
blonds bruns chatains noirs
couleur de cheveux

N = 12

TP 1 – 2006/2007 (Corrigé) 6/18


Commentaires :
Ces graphiques ne sont pas fondamentalement différents. Les deux premiers ont exactement la
même apparence puisque les proportions sont les mêmes ; ils auraient pu être un peu différents,
mais du moment qu’on garde une échelle proportionnellement identique, ces graphiques auront
la même forme. Dans le deuxième et le troisième nous perdons l’information concernant le
nombre absolu de personnes concernées, mais des pourcentages sont parfois plus faciles à
interpréter. Pour avoir une idée des fréquences absolues on peut aussi ajouter la valeur de « N » à
la légende du graphique. « N » désigne le nombre total d’individus dans l’échantillon.

On peut énumérer les classes dans n’importe quel ordre, on peut les disposer n’importe comment
sur l’axe horizontal d’un diagramme en barres puisqu’il s’agit d’une variable nominale.
L’apparence globale du graphique ne peut être utilisée. L’espace entre les barres est arbitraire
mais il en faut un, la largeur des barres n’a pas d’importance non plus. La seule chose qui puisse
être comparée est la hauteur des différentes barres qui représente le nombre ou la fréquence
relative de personnes qui se trouvent dans une catégorie ou une autre.

Le troisième diagramme est un peu « écrasé ». Tout dépend de l’échelle dont il faut tenir compte.
L’échelle est arbitraire, mais peut influencer (et donc fausser) l’impression donnée par un
graphique.

7. Repérez dans le tableau (Annexe 2) les variables qualitatives et quantitatives. A quelles échelles
de mesure renvoient-elles ? Donnez les 2 méthodes utilisées pour coder les variables
qualitatives.

Réponses :

- Variables qualitatives (échelle nominale) : groupe, genre, couleur de cheveux, couleur


d’yeux, lunettes.
- Variables quantitatives : âge (échelle de rapports), taille (échelle de rapports), poids
(échelle de rapports), sport (échelle ordinale), fumer (échelle ordinale), note (échelle de
rapports), nombre de frères (échelle absolue).

N.B. : Une variable qualitative peut être codée alphabétiquement ou numériquement.

8. Dressez le tableau des fréquences des notes en complétant le tableau suivant (cf. annexe 2) :

j Notes Fréq. abs. Fréq. abs. cum. Fréq. rel. en % Fréq. rel. cum.
1 11 2 2 16.67% 16.67%
2 12 3 5 25% 41.67%
3 14 1 6 8.33% 50%
4 15 2 8 16.67% 66.67%
5 16 2 10 16.67% 83.34%
6 18 2 12 16.67% 100,01% ˜ 100%
total 12 100,01%

TP 1 – 2006/2007 (Corrigé) 7/18


9. Représentez graphiquement les fréque nces absolues de la variable « note ». N’oubliez pas
d’indiquer un titre, le sens des axes et une légende. Comment s’appelle un tel graphe ?
Comment s’appelle l’axe horizontal et que représente-t- il ?

Graphique :
Histogramme fréquences absolues des valeurs non groupées
de la variable note mesurée en points pour les 12 élèves

3
Fréquences

0
11 12 13 14 15 16 17 18
Cotes

Cette représentation graphique s’appelle un histogramme. Dans un histogramme, on indique les


valeurs non observées dans l’échantillon (parce que l’axe horizontal représente une mesure
continue) d’où l’apparition d’intervalles vides. De plus, les rectangles des classes adjacentes se
touchent, il n’y a d’espace entre les colonnes que s’il y a des classes vides.

10. Que peut-on dire par rapport à la surface de chaque rectangle de l’histogramme ci-dessus et par
rapport à la surface totale des rectangles ?

Réponse :
- Les surfaces des rectangles sont proportionnelles aux fréquences des observations
- La surface totale obtenue en sommant les surfaces de tous les rectangles de
l’histogramme correspond donc à la fréquence absolue cumulée de toutes les
observations.
N.B. : Si tous les rectangles ont la même base, on peut se contenter d’en regarder la hauteur.

11. Représentez sous la forme d’une distribution de fréquence groupée en classes de 2 points la
variable note. Indiquez les fréquences absolues, relatives, relatives cumulées et relatives
cumulées exprimées en %.
Réponse :
Fréq. rel. cum.
Fréq. abs. Fréq. rel. Fréq. rel. cum.
en %
10,5 - 12,5 5 0,42 0,42 42 %
12,5 - 14,5 1 0,08 0,50 50 %
14,5 - 16,5 4 0,33 0,83 83 %
16,5 - 18,5 2 0,17 1,00 100 %
12 1,00

TP 1 – 2006/2007 (Corrigé) 8/18


T.P. 1 – Exercice supplémentaire 1
Pourquoi les statistiques ? (Corrigé)
Connaissances préalables : Notions d’hypothèse et d’échantillon aléatoire.
Buts spécifiques : Evaluer le compréhension des notions d’hypothèse et d’échantillon aléatoire.
Outils nécessaires : Annexe 1.
Consignes : Réfléchissez avant de regarder le corrigé.

1. Dans quelles conditions l’ensemble des étudiants de l’ULB seraient- ils considérés comme une
population ?

Réponse :

Dans tous les cas où on veut étudier uniquement les résultats des étudiants de l’ULB.

2. Dans quelles conditions l’ensemble des étudiants de l’ULB seraient- ils considérés comme un
échantillon ?

Réponse :

Dans tous les cas où l’étude porte sur une population plus large qu’uniquement les étudiants de
l’ULB.

3. Si l’ensemble des étudiants de l’ULB était considéré comme un échantillon, s’agirait- il d’un
échantillon aléatoire ? Expliquez votre réponse.

Réponse :

Il s’agirait d’un échantillon non aléatoire car l’ensemble des étudiants (par exemple de
Belgique) n’ a pas une chance égale d’être inclus dans l’échantillon.

TP 1 – 2006/2007 (Corrigé) 9/18


T.P. 1 – Exercice supplémentaire 2
Les variables (Corrigé)
Connaissances préalables : Variables dépendantes et indépendantes ; quantitatives et qualitatives
Buts spécifiques : Manipuler les notions de variables dépendantes et indépendantes ; quantitatives et qualitatives
Outils nécessaires : Annexe 1

1. Une hypothèse peut être définie comme une prédiction à propos des effets d’une variable
(a) ____________________ sur une variable (b) _________________.

Réponses :
a) variable indépendante
b) variable dépendante

2. Des chercheurs désirent comparer les capacités d’interactions sociales d’un groupe d’enfants de
3 ans qui sont allés à la crèche avec celles d’un groupe d’enfants de 3 ans qui n’y sont pas allés.
Quelle est la variable dépendante dans cette étude ? Quelle est la variable indépendante ?

Réponses :
La fréquentation d’une crèche = variable indépendante
Les capacités d’interactions sociales = variable dépendante

3. Dans une étude sur les capacités mnésiques, les participants doivent mémoriser en soirée une
liste de 20 mots qu’on leur demande de rappeler après un intervalle de 8 heures. Un groupe de
participants dort pendant cet intervalle, l’autre groupe est maintenu éveillé. L’expérimentateur
désire investiguer si le type d’activité (sommeil vs veille) pendant l’intervalle influence le
nombre de mots correctement rappelés. Dans cette étude, quelles sont les variables dépendante
et indépendante ?

Réponses :
variable indépendante = le type d’activité pendant l’intervalle
variable dépendante = nombre de mots correctement rappelés

TP 1 – 2006/2007 (Corrigé) 10/ 18


T.P. 1 – Exercice supplémentaire 3
Les échelles de mesure (Corrigé)

1. Un chercheur a une liste avec la taille en cm d’un groupe d’enfants de 8 ans ; par exemple 123
cm, 146 cm, 130 cm… Quelle échelle de mesure est utilisée ?

Réponse :
Une échelle de rapport. Le zéro correspond à l’absence de taille (zéro absolu) et on peut utiliser
ces tailles pour former des rapports. Un enfant de 80 cm est 2 fois plus petit qu’un enfant
d’1m60.

2. Ce chercheur convertit ces tailles sur une nouvelle échelle en calculant la différence pour
chaque enfant entre sa taille et la taille moyenne du groupe. Un enfant qui a exactement la taille
moyenne du groupe a un score de 0 ; un enfant qui a 1 cm de plus que la taille moyenne du
groupe obtient un score de +1 ; en enfant qui a 2 cm de moins obtient un score de -2 … Quelle
échelle est utilisée ?

Réponse :
Une échelle d’intervalle. En effet, un score de 0 ne correspond plus à l’absence de taille mais à
la taille moyenne. De plus, un enfant qui a un score de +9 n’est pas 3 fois plus grand qu’un
enfant qui a un score de +3. Les rapports sur les tailles n’ont donc plus de sens mais sur les
différences, ils continuent à avoir du sens.

3. Sur quelle échelle de mesure ces variables sont-elles habituellement mesurées ?

N.B. : les échelles de mesure étant hiérarchisées, indiquez le niveau le plus élevé.

Echelle Echelle Echelle Echelle de Echelle


nominale ordinale d’intervalles rapports absolue
Groupe sanguin X
Nationalité X
Température en Kelvin X
Température en degrés
X
Celsius
Connaissance en
informatique évaluée sur X
une échelle à quatre points.
Couleur des yeux X
Heure à laquelle une
X
personne va dormir
Nombre d’heures de
X
sommeil
Latéralité X
Ancienneté X
1
Intelligence (Q.I.) X

1
Le QI n’est qu’une échelle ordinale mais par convention dans les études statistiques on a tendance à se comporter
comme s’il s’agissait d’une échelle de rapports.

TP 1 – 2006/2007 (Corrigé) 11/ 18


T.P. 1 – Exercice supplémentaire 4
Distribution observée des fréquences absolues et relatives
Diagramme en barres (Corrigé)
La clinique de santé mentale d’une université utilise les lettres suiva ntes pour coder les principaux
types de problèmes poussant les patients à demander une assistance :

A : Anxiété générale D : Problèmes liés à l’alcool et aux stupéfiants


B : Dépression générale E : Problème de comportement social
C : Problèmes liés à la sexualité F : Problèmes familiaux
G : Autres problèmes

Cinquante-quatre patients se sont rendus à la clinique un jour donné. On a attribué à chacun d’eux
une lettre en fonction du problème dont ils souffraient.

A B B E B D B G F G B
B C E B B A B B B G B
C F D G G D D G G B F
G A G A F G G G C D E
B B B G G G A B C B

1. Sur quel type d’échelle nous situons-nous dans cet exercice ?

Réponse :
Sur une échelle qualitative (nominale, catégorielle).

2. Construisez le tableau de la distribution des fréquences absolues et relatives associé à ces


observations.

Réponse :

Nombre de catégories distinctes : 7 Nombre d’observations : N = 54

Catégories de la Fréquences absolues Fréquences relatives


variable type de (Effectifs)
problèmes
1 A 5 5/54 = 0,09
2 B 18 18/54 = 0,33
3 C 4 4/54 = 0,07
4 D 5 5/54 = 0,09
5 E 3 3/54 = 0,06
6 F 4 4/54 = 0,07
7 G 15 15/54 = 0,28
N=54 54/54 = 1

TP 1 – 2006/2007 (Corrigé) 12/ 18


3. Dessinez le diagramme en barres des fréquences relatives correspondant.

Graphique :

Fréquences relatives
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
A B C D E F G
Motif de la
demande

4. Commentez les résultats des deux points précédents.

Commentaires :

Cinq des sept catégories ne recouvrent chacune que moins de 10% des motifs de consultation ce
jour- là. Ces cinq catégories réunies ne reprennent que 39% des patients. Les 61 autres pour cent
relèvent de deux catégories seulement, puisque 33% des sujets consultent pour une dépression
générale et 28% pour d’autres raisons.
L’ordre des barres sur le graphique n’a pas d’importance puisque nous sommes sur une échelle
nominale, donc en deçà d’une échelle ordinale.

TP 1 – 2006/2007 (Corrigé) 13/ 18


T.P. 1 - Exercice supplémentaire 5
Variable quantitative :
Distribution observée groupée des fréquences abso lues et relatives
Histogramme et polygone des effectifs (Corrigé)
Considérons la série statistique ordonnée suivante relative aux âges des membres d’un club sportif :

17 18 19 20 22 22 23 23 24 25
25 26 26 27 27 27 27 27 28 28
28 28 28 29 29 29 29 30 30 30
30 30 31 31 31 31 31 32 32 33
33 34 35 35 36 36 38 39 40 41

1. Sur quel type d’échelle nous situons-nous dans cet exercice ?

Réponse :
Sur une échelle de rapports.

2. Groupez cette série en classes et construisez le tableau de la distribution observée des fréquences
absolues (effectifs) et relatives correspondant. Prenez, pour ce faire, 5 classes de même largeur.

Réponse :

Nombre de classes construites : 5 (classes de même largeur)


41 − 17
Valeur approchée de la largeur des classes = = 4,8
5
à Largeur des classes = 5

Limite inférieure de la première classe = 16,5


Nombre d’observations = N = 50

j Classes Fréquences Fréquences


absolues (effectifs) Relatives

1 16,5 – 21,5 4 4/50 ˜ 0,08


2 21,5 – 26,5 9 9/50 ˜ 0,18
3 26,5 – 31,5 24 24/50 ˜ 0,48
4 31,5 – 36,5 9 9/50 ˜ 0,18
5 36,5 – 41,5 4 4/50 ˜ 0,08
N=50 50/50 = 1

TP 1 – 2006/2007 (Corrigé) 14/ 18


3. Dessinez l’histogramme de cette distribution observée.

Graphique :

Histogramme des âges des membres du club sportif :

N = 50

30

25

20

15

10

0
16,5-21,5 21,5-26,5 26,5-31,5 31,5-36,5 36,5-41,5

4. Commentez vos résultats.

Commentaires :

Les âges des membres de ce club sportif se distribuent de façon symétrique de part et d’autre de
la classe "centrale", la classe 26,5 – 31,5.
La classe 26,5 – 31,5 compte le plus grand effectif : c’est la classe modale (cf. TP2).

N.B. : L’ordre des rectangles est important. Les rectangles doivent être collés les uns aux autres
parce qu’il s’agit d’une variable continue. La base des rectangles doit être identique si les
classes ont la même largeur. Un trou entre deux rectangles signifierait que la classe est vide : il
n’y a que dans ce cas que deux rectangles pourraient ne pas se toucher.

TP 1 – 2006/2007 (Corrigé) 15/ 18


T.P. 1 : Annexe 1
Rappel des notions théoriques importantes vues au TP 1
Outils nécessaires : Cours théorique de Daniel Holender, pages 1 à +/- 20.

? Hypothèse : prédiction par rapport aux résultats de l’étude (qui pourrait à l’issue de l’étude
s’avérer vraie ou fausse voire être nuancée).
? Population : ensemble de tous les individus (ou évènements ou objets) qui nous intéressent
pour une étude particulière.
? Echantillon : une partie des individus sélectionnés dans la population
? Echantillon aléatoire : échantillon pris au hasard. Chaque élément de la population a une
chance égale d’être pris dans l’échantillon.
? Variable : propriété d’un objet (la couleur des cheveux, le genre…) ou d’un événement qui
peut prendre différentes valeurs (qui peut donc varier). Chaque élément de la population
prend une valeur pour chaque variable.
? Variable qualitative = catégorielle = nominale : variable dont les valeurs sont des noms,
des étiquettes.
? Variable quantitative : variable dont les valeurs sont le résultat d’une mesure.
? Variable indépendante : variable manipulée ou contrôlée par l’expérimentateur.
? Variable dépendante : variable dont on observe les changements (= les données).
? Echelle nominale : étiquette qui catégorise les observations (féminin- masculin ; blond-
brun-roux…).
? Echelle ordinale : range les personnes, objets ou événe ments le long d’un continuum.
? Echelle d’intervalles : des différences ou intervalles égaux entre les nombres sur l’échelle
reflètent des différences égales en termes de magnitude mais pas en terme de rapport.
? Echelle de rapport : les rapports entre les no mbres sur l’échelle reflètent les rapports en
magnitude. Echelle possédant un vrai zéro (zéro absolu), qui correspond à l’absence de la
chose mesurée.
? Echelle absolue : échelle basée sur des nombres entiers réels positifs, possédant un vrai
zéro, dont la fonction est le dénombrement (comptage).
? Distribution de fréquences : répartition organisée du nombre d’individus appartenant à
chacune des catégories de l’échelle de mesure.
? Distribution de fréquences groupées : lorsque la variable compte un nombre important de
valeurs, il peut être plus approprié (pour plus de clarté) de grouper certaines valeurs entre
elles et de créer ainsi des classes ( ≠ de catégories).
? Fréquence absolues = n j ou ni : effectif, c’est à dire le nombre d’observations dans chaque
catégorie ou classe.
n
? Fréquence relative = f j : rapport entre l’effectif d’une classe et l’effectif total. f j = j . Si
N
on multiplie la fréquence relative par 100, on obtient la fréquence relative exprimée en %.

TP 1 – 2006/2007 (Corrigé) 16/ 18


? Fréquence relative cumulée : le pourcentage cumulé pour une certaine valeur de la
variable est égal à la somme des pourcentages des cas atteignant ce niveau et des
pourcentages des cas atteignant les niveaux inférieurs de la variable. La notion de
distribution cumulée s’applique aux cas des fréquences absolues et relatives, et de la
probabilité.
? Diagramme en bâtons : graphe représentant un tableau de distribution de fréquences utilisé
lorsque les données se mesurent sur une échelle nominale ou ordinale. La hauteur de chaque
barre correspond à la fréquence (absolue ou relative, exprimée en % ou pas). Il y a un espace
entre chaque barre.
? Histogramme : graphe représentant un tableau de distribution de fréquences utilisé lorsque
les données se mesurent sur une échelle d’intervalle ou de rapport. La hauteur de chaque
barre correspond à la fréquence (absolue ou relative, exprimée en % ou pas). Les barres sont
« collées » ; il n’y a d’espace vide que pour les valeurs non représentées dans l’échantillon.
? Abscisse : axe des X (axe horizontal).
? Ordonnée : axe des Y (axe vertical).

TP 1 – 2006/2007 (Corrigé) 17/ 18


T.P. 1 : Annexe 2
Exemple de tableau de données

nombre
Num Groupe Âge genre Taille (cm) Poids (kg) Yeux Cheveux Sport Fumer Lunettes note /20
de frères
1 1 22 F 166 55 bleus blonds 1 1 1 18 1
2 1 19 M 165 59 bleus blonds 2 4 1 12 0
3 1 22 F 173 86 marrons bruns 2 1 0 11 2
4 1 20 M 178 55 bruns bruns 2 2 0 14 1
5 2 20 M 178 61 bleus bruns 1 1 1 15 1
6 2 19 F 155 58 bruns châtains 2 1 1 16 2
7 2 19 F 171 70 verts bruns 2 3 0 15 2
8 2 20 F 165 58 verts blonds 3 1 0 18 0
9 3 21 F 170 58 bruns noirs 2 3 1 12 3
10 3 19 M 181 74 bruns bruns 4 3 0 12 0
11 3 19 F 159 52 verts châtains 2 1 0 11 0
12 3 19 F 162 45 verts châtains 3 1 1 16 2

TP 1 – 2006/2007 (Corrigé) 18/ 18

Vous aimerez peut-être aussi