Vous êtes sur la page 1sur 27

Vous trouverez ici

ci-dessous les
compétences, c’est
intéressant à lire avant de commencer le chapitre, puis revenez-y à
la fin du chapitre pour voir si vous voyez bien ce qu’on attend de
vous.
C1 Connaître et expliciter :
o Expliquer le vocabulaire statistique.
o Identifier les différents types de caractères statistiques
et décrire les informations graphiques et numériques qui
peuvent y être associées.
o Expliquer pour quels usages sont requis les indicateurs de
position et/ou de dispersion.
C2 Appliquer :
o Calculer ou estimer les indicateurs de position et de dispersion et
les positionner sur un graphique.
o Construire différents graphiques statistiques.
o Extraire une information de graphiques et de tableaux statistiques.
o Utiliser l’inégalité de Tchebychev.
C3 Transférer :
o Choisir un support graphique, une valeur centrale, un indice de
dispersion pour étudier une situation.
o Critiquer des informations graphiques, numériques, textuelles, …
o Commenter des informations fournies sur un même sujet par différents
supports.
o Interpréter un résultat obtenu en lien avec le caractère étudié et le contexte.

Actimath Théorie p. 21-59 / Exercices 60-76

5.1 Introduction

Nous partirons d’une enquête pour appréhender les statistiques.

Nous dirons simplement pour commencer que la statistique est l’ensemble des
méthodes scientifiques à partir desquelles on recueille, organise, résume, présente et
analyse des données, et qui permettent d’en tirer des conclusions et de prendre des
décisions judicieuses.

Vous avez découvert le domaine des statistiques en 2è me, le chapitre s’appelait «


traitement de données ». Vous avez découvert et formalisé davantage des concepts
que vous aviez déjà entendus : la moyenne, les diagrammes en bâ tonnets,
circulaires… et découvert de nouveaux concepts comme le mode, la médiane,
l’effectif et la fréquence. Vous retrouverez ces grandeurs au fil du cours.

En 5è me, ce chapitre revient, c’est le chapitre de

statistique à 2 variables. Le chapitre en 4ème se découpe

en 4 parties.

Première partie : on classifie les différentes variables que l’on peut étudier. On
n’étudie pas ou ne compare pas de la même manière la taille des personnes
( ordre ..) ou leur nationalité ( pas d’ordre).
Deuxième partie : les effectifs et les fréquences. Quand on a les résultats d’une enquête, ce sont
des nombres que l’on va analyser. On peut présenter ces nombres de différentes manières,
éventuellement en pourcentages, avec des graphes, des diagrammes…

Troisième partie : On recherche souvent une valeur centrale dans les données, pour voir si une
valeur est au-dessus ou en-dessous. Vous connaissez la moyenne, mais il y en a d’autres.

Quatrième partie : on va étudier comment les données sont réparties ou dispersées autour de
cette valeur « centrale ».

Vous avez répondu à un questionnaire général. Des élèves de math + ont analysé les données…
Tout au long de ce cours, vous allez retrouver des graphes ou des données de l’enquête de cette
année (sauf peut-être à l’un ou l’autre endroit où il s’agit des données de l’année passée).

1. Enquête : Activité 2 : Enquête (133 élèves interrogés en 4ème)

1) Vous êtes : une fille un garçon


2) Quel est votre mois / année de naissance ?
3) Vous êtes Droitier/Gaucher ?
4) Quelle est votre taille en centimètres ?
5) Comment venez-vous principalement à l’école ? Transport en commun /Pied /Vélo /Voiture/
Autre
6) Mangez-vous principalement à l’école ? Si oui, votre repas vient de la maison, commande à
l’école ou achat à l’extérieur ?
7) Nombre de pays déjà visités ?
8) Quel est votre pays d’origine ? père / mère ?
9) En moyenne, à quelle fréquence pratiquez-vous des activités sportives (tout type de sport
confondu)?
10) Quel type de sport pratiquez-vous de manière continue (max. 1 réponse) ?
11) Quelle activité extra-scolaire non-sportive pratiquez-vous de manière récurrente ?
12) Quel est votre réseau social préféré/le plus utilisé ?
13) Temps passé sur les réseaux sociaux (en moyenne par jour)?
14) Temps passé à des jeux électroniques (en moyenne par jour)? A quel moment privilégié ?
15) Temps passé à regarder des séries, films, émissions (en moyenne par jour)? A quel moment
privilégié ?
16) Temps passé à étudier (en moyenne par jour) ? A quel moment privilégié ?
17) Quelle est votre meilleure cote d’interrogation trimestrielle ? /20
18) Niveau de satisfaction de votre 4ème année : Très satisfait – Satisfait - Moyennement
satisfait - pas satisfait - pas du tout satisfait

Quand on analyse des données, on a envie de les comparer, les classer… Il est possible de
classer des personnes par taille, par ordre croissant ou décroissant. Mais s’il s’agit de
nationalité, par exemple, ce n’est plus possible. On doit donc faire différemment selon si la
variable que l’on étudie est qualitative ou quantitative.

Un certain vocabulaire de base est nécessaire. Vous pouvez retrouver votre cours de
2ème /3ème … ou bien regarder cette vidéo.
https://youtu.be/9Y4euU2djPE

Ce vocabulaire est aussi réexpliqué au début du chapitre : p21-22-23-24.

Après ces brefs rappels de vocabulaire, on va essayer de classer les différentes variables qui
ont été analysées dans le questionnaire.
Faites l’exercice et Vérifiez que vous comprenez bien : les réponses se trouvent à la fin du
dossier.

5.2 Classification des variables

Qualitatif Quantitati

Différence/ Variable dont les valeurs ne sont pas des nombres : V


Définition concerne la « qualité » a
r
i
a
b
l
e

d
o
n
t

l
e
s

v
a
l
e
u
r
s

s
o
n
t

d
e
s

n
o
m
b
r
e
s

c
o
n
c
e
r
n
e

l
a

q
u
a
n
t
i
t
é
Nominal Ordinal Discret
Différence/ Aucun ordre précis Variables qui Valeurs que l’on peut
Définition contiennent un ordre énumérer

Exemples Sexe, transport Niveau de satisfaction Nombre de pays visités

5.3 Effectifs et fréquences

3.a) Tableau de données

Que signifient les nombres obtenus dans les colonnes « effectifs cumulés », « fréquences » et
« Fréquences cumulées » ?

Effectifs Fréquence
Effectifs Fréquence cumulés cumulée
Transport en commun 96 96/133= 96 72,18%
72,18%
Voiture 18 18/133=13,53% 18+96=114 72,18%
+13,53%=85,71
%
Pied 18 13,53% 114+18=132 85,71%
+13,53%=99,24
%
Vélo 1 0,76% 133 100.00%
Total 133 100%

Exemple :
Le 2ème nombre de la colonne des effectifs signifie que il y a 18 élèves qui utilisent la voiture pour venir à
l’école
Le 3ème nombre de la colonne des fréquences signifie que 13,53% des élèves viennent à l’école à pied
Le 3ème nombre de la colonne des effectifs cumulés signifie que 132 élèves utilisent les transports, la
voiture, le vélo ou viennent à pied à l'ecole
Le 4ème nombre de la colonne des fréquences cumulées signifie que tous ces moyes de déplacement
sont utilisés à 100% par les élèves
3.b) Représentations graphiques

Plutô t que travailler avec des tableaux de valeurs, on peut aussi travailler avec des graphes, plus
faciles à lire en un coup d’œil car plus visuels :

Il existe plusieurs types de représentations, en voici deux exemples :

Le diagramme en bâtonnets : chacune


des modalités est représentée par un
rectangle de même base, de hauteur
proportionnelle à son effectif (ou à sa
fréquence).
Le diagramme circulaire ou camembert : l’aire de chaque secteur circulaire est
proportionnelle à l’effectif (ou à la fréquence) de la modalité correspondante. L’angle au
centre pour chaque secteur est de fi x 360°

N.B. Vous pourrez trouver en annexe tous les résultats obtenus du questionnaire des 4èmes
Exercice : Reprenons l’exemple sur le moyen de transport utilisé pour venir à l’école :

xi ni fi angles Légende
x 1 = en transport en commun 96 72,2% 0,722 . 360° = 259° --------------
x 2 = en voiture 18 13,5% 0,135 . 360° = --------------
48,6°
x 3 = à pied 18 13,5% 0,135 . 360° = --------------
48,6°
x 4 = à vélo 1 0,75% 0,075 . 360° = 3,8° --------------
Total 133 100%

Il est à remarquer que la somme des amplitudes des angles doit valoir 360° .

Représentez ce diagramme circulaire


P.S. Bien que ce ne soit pas une obligation, on a l’habitude de représenter par des secteurs adjacents,
les données représentant les effectifs ordonnés du plus petit au plus grand.
Le diagramme des fréquences cumulées :
Les effectifs cumulés (N i ) ou les fréquences cumulées (F i ) se représentent sur un diagramme cumulatif
qui se présente sous la forme d’une fonction dite « en escaliers ».
La fin de l’échelle est vide, on monte l’escalier pour déterminer les valeurs suivantes
Nous ne travaillerons pas beaucoup avec ce type de diagrammes

P.S. : N’oubliez pas d’indiquer la légende, les unités & échelles utilisés pour vos diagrammes

Entraînons-nous à lire ce type de diagramme (un peu plus complexe) ; attention, ce sont des
fréquences cumulées, on doit donc lire les nombres comme « moins de … ».

Par exemple :
56% correspond au pourcentage d’élèves ayant visité moins de 7 pays .

Quel pourcentage d’élèves ont visités :


a) 0 pays ? 1%

b) Moins de 2 pays ? 1%

c) Exactement 2 pays ? 0%

d) Exactement 4 pays ? 18% - 6%=

e) Moins de 6 pays? 48%

f) Plus de 2 pays ? Le reste ( 100% - 1%= 99% )

g) Plus de 10 pays ? 100%-86%=14%

h) Moins de 15 pays ? 94%


c) Tableau

Dans le cas de variables quantitatives continues, trop nombreuses pour être énumérées par
définition, nous allons les grouper par classes.

Pour être lisibles, les classes devront de préférence être de même dimension.

Prenons l’exemple du temps passé sur les réseaux sociaux.

Ce serait beaucoup trop long de tout répertorier, nous allons dès lors les grouper, par
exemple par intervalles de 30 min :

Temps passé Effectif Fréquence


[0-30min[ 5 3,8%
[30min-1h[ 20 15,0%
[1h-1h30[ 21 15,8%
[1h30-2h[ 19 14,3%
[2h-2h30[ 20 15,0%
[2h30-3h[ 13 9,8%
[3h-3h30[ 15 11,3%
[3h30-4h[ 13 9,8%
>4h 7 5,3%
Total général 133 100,0%

d) Représentations graphiques

Histogramme des effectifs :

La différence avec le diagramme en bâ tonnets (p.5) est que les rectangles sont serrés les uns
contre les autres.

Il se représente dans un repère.


Chaque classe est associée à un rectangle dont la base est délimitée par les extrémités de la
classe.
L’aire de chaque rectangle est proportionnelle à l’effectif (ou la fréquence) de la classe. Si
toutes les classes ont la même amplitude, la hauteur de chaque rectangle est proportionnelle
à l’effectif (ou à la fréquence) de la classe.

Les valeurs de la fréquence ont été arrondies.

Pour être lisibles, les classes devront de préférence être de même dimension.
Prenons l’exemple minutes sur réseau social.
Ce serait beaucoup trop long de les répertorier toutes, nous allons dès lors les grouper, par
exemple par intervalles de 30 min :
On peut s’exercer à la lecture de ce type de graphique : Quand je l'ai ouvert sur word il ne s'est pas
affiché mais j' ai lu le pdf

Quel pourcentage d’élèves passent entre 2h30 et 3h sur les réseaux sociaux ?
Cela représente combien d’élèves de quatrième? 10% càd 13 élèves sur les 133

Ce serait intéressant de comparer à l’histogramme suivant :

1. Combien d’élèves de quatrième étudient entre 2h30 et 3h par jour ?5,3% des élèves
càd 5,3/100 X 133 = 7 élèves

Voilà qui n’est pas très rassurant …


Diagramme des fréquences cumulées :

Les effectifs cumulés (N i ) ou les fréquences cumulées (F i ) se représentent par un ligne polygonale
continue : on appelle cette représentation le polygone des effectifs ou des fréquences cumulés.
La valeur cumulée de la classe se place toujours à la fin de la classe
P.S. : N’oubliez pas d’indiquer la légende, les unités & échelles utilisés pour vos diagrammes

On étudie ici la taille des élèves :

Pour une raison bizarre le graphique


ne s'est pas affiché sur word, j'ai ouvert le pdf pour le faire.

Quel pourcentage d’élèves mesurent :

a) moins de 1,65m ? 34%

b) entre 1,60m et 1,65m ? 34%-12%=22%

c) moins de 1,90m ? 98%

d) plus de 1,90m ? 100-98%=2%

e) plus de 1,70m ? 100%-56%=44%


Comment constituer ce Diagramme des fréquences cumulées ?

Prenons l’exemple des tailles des élèves (ou temps passé sur réseau social).
Ce serait beaucoup trop long de les répertorier toutes, nous allons dès lors les grouper, par
exemple par intervalles de 10 cm (ou 30 min) :

A l’aide des tableaux suivants, on pourra reporter les valeurs dans un repère où l’axe des X
représentent les différentes Classes et l’axe Y les fréquences (ou effectifs) cumulé(e)s

Les valeurs centrales se calculent comme valeur min. de la Classe  valeur max de la classe
suit : 2
Complétez les tableaux suivants :

Valeurs Fréquences Fréquences cumulées


Classes Effectifs Effectifs cumulés
centrales (en %) (en %)
[150;155[ 152,5 6 6 5 (=6/131) 5 (=f1)
[155;160[ 157,5 10 16(=10+6) 8(=10/131) 13 (=5+8)
[160;165[ 162,5 28 44 21% ( 28/131) 34%
[165;170[ 167,5 29 73 22% ( 29/131) 56.00%
[170;175[ 172,5 28 101 21% ( 28/131 ) 77%
[175;180[ 177,5 12 113 9%( 12/131 ) 86.00%
[180;185[ 182,5 11 124 8% ( 11/131 ) 94.00%
[185;190[ 187,5 5 129 4% ( 5/131 ) 98.00%
[190;195] 192,5 2 131 2% ( 2/131) 100.00%
Total 131

Questions subsidiaires :
a. Quelle est la valeur des effectifs cumulés dans la classe [190;195] : …..
b. Quelle est la valeur de la fréquence cumulée dans la classe [190;195] : …..

Valeurs Fréquences
Classes centrales Effectifs Effectifs cumulés Fréquences(en %) cumulées (en %)
[0-30[ 15 5 5 4%( 5/133) 4.00%
[30-60[ 45 20 25 15%( 20/133) 19.00%
[60-90[ 75 21 46 16%(21/133) 35.00%
105 65 14%(19/133) 49.00%
[90-120[ 19
[120-150[ 135 20 85 15%(20/133) 64.00%
[150-180[ 165 13 98 10%(13/133) 74.00%
[180-210[ 195 13 111 10%(13/133) 84.00%
[210-240[ 225 15 126 11%(15/133) 95.00%
>240 255 7 133 5%(7/133) 100.00%
Total 133
On supposera dans ce cas-ci le même accroissement que celles
des classes précédentes (càd 30 unités)

Exercices Actimaths 1-2 p. 60 et 11–12-13 p. 65


Résumons… Vocabulaire

 La population est l’ensemble sur lequel portent les observations.(les élèves de 4ème)
 Un individu est un élément de la population.(un élève)
 Le caractère (ou la variable statistique) est l’information commune recueillie à propos des
individus.(transport)
 Les modalités d’un caractère ( ou valeurs de la variable statistique) sont les différents
états ou les différentes valeurs que peut prendre le caractère. Chaque individu présente
une et une seule modalité du caractère. (voiture, vélo, …)
 Les classes sont des intervalles permettant de regrouper les données quantitatives.
 La valeur centrale d’une classe est la moyenne arithmétique des extrémités de la classe.
 L’effectif d’un caractère/d’une classe est le nombre d’individus possédant
ce caractère/classe
 L’effectif cumulé d’une classe est obtenu en faisant la somme des effectifs de cette
classe et de toutes les précédentes.
 La fréquence d’une classe est le pourcentage du nombre de fois que cette classe apparait
(c’est donc le rapport entre l’effectif du caractère et l’effectif total) : .
On l’exprime en pourcentage.
 La fréquence cumulée est obtenue en faisant la somme des fréquences de cette classe et
de toutes les classes précédentes. On l’exprime en pourcentage.
 Un diagramme en bâtonnets est un graphique représentant les effectifs des données
qualitatives. On met en abscisse (axe des X) le caractère/la classe et en ordonnée (axe des
Y) le nombre d’individus présentant ce caractère/dans cette classe.
 Un diagramme circulaire est un graphique représentant (le plus régulièrement) les
fréquences des données qualitatives. Chaque quartier de tarte représente le pourcentage
de chaque caractère/classe.
 Un histogramme est un graphique représentant les effectifs des données quantitatives. On
met en abscisse les différentes classes créées. En ordonnée, on met le nombre d’effectifs
pour chaque classe.
Un histogramme permet de visualiser certaines réponses à des questions. Par exemple, «
pour quelle classe a-t-on le plus grand effectif ? »
 Un diagramme des fréquences cumulées est un graphique représentant les fréquences
cumulées des données quantitatives. En abscisse, on met les différentes classes. En
ordonnée, on indique le pourcentage de fréquence cumulée pour cette classe.
Ce diagramme permet de répondre à des questions du type : « Quel pourcentage de … sont
plus petits que…, plus grands que… ? ».
Réponses p.3 :

Qualitatif Quantitati

Différence/ Variable dont les valeurs ne sont pas des nombres : V


Définition concerne la « qualité » a
r
i
a
b
l
e

d
o
n
t

l
e
s

v
a
l
e
u
r
s

s
o
n
t

d
e
s

n
o
m
b
r
e
s

c
o
n
c
e
r
n
e

l
a

q
u
a
n
t
i
t
é
Nominal Ordinal Discret
Différence/ Aucun ordre précis Variables qui Valeurs que l’on peut
Définition contiennent un ordre énumérer

Exemples Sexe, transport Niveau de satisfaction Nbre de pays


(voir question 18. Il y a visités
un certain ordre dans
les réponses)

Effectifs Fréquence Effectifs cumulés Fréquence cumulée

Transport en commun 96 96 72,18%

Voiture 18 114 85,71%


Pied 18 13,53% 132 99,24%
Vélo 1 0,7% 133 100%
Total 133 100 %

Le 2ème nombre de la colonne des effectifs (18) signifie que 18 élèves utilisent la voiture
Le 3ème nombre de la colonne des fréquences (13,53 %) signifie que 13,53 % des élèves viennent à pied
Le 3ème nombre de la colonne des effectifs cumulés signifie que 132 élèves viennent en transports en
commun, en voiture ou à pied
Le 4ème nombre de la colonne des fréquences cumulées signifie que 100 % utilisent un de ces quatre
modes de transport.

Réponses p.3 : effectué à partir d’un tableur excel


Réponses p 7 :
d) 12% (=18%-6%) g) 14% (100% - 86%)
a) 1% e) 48% h) 94%
b) 1% f) 99% (=100%-1%)
c) 0 % (=1%-1%) Réponses p. 9
 10 % ce qui représente
133. =13,3 donc 13
élèves.
 5,3% des élèves c’est-à-
dire 7 élèves

R pons
é es p.
p 11 :
o
n
s
e
s

p
.
1
0
:

a) 34
%
de
s
élè
ves
b) 34
%-
12
%
=2
2
%
de
s
élè
ves
c) 98
%
de
s
élè
ves

R
é
5 [60-90[ 75
6 [90-120[ 105
d) 10 %
[120-150[ 135
0 =
4 [150-180[ 165
%-
98 4 [180-210[ 195
% % [210-240[ 225
=2 >240 255
% d
e
Total 133
de
s s
élè é
ve l
s è
e) v
10 e
0 s
%-

Valeurs
Classes centrales Effectifs
[150;155[ 152,5
[155;160[ 157,5
[160;165[ 162,5
[165;170[ 167,5
[170;175[ 172,5
[175;180[ 177,5
[180;185[ 182,5
[185;190[ 187,5
[190;195] 192,5
Total
a. Quelle est la
valeur des
effectifs
cumulés dans
la classe
[190;195] : 131
b. Quelle est la
valeur de la
fréquence
cumulée dans
la classe
[190;195] : 100

Valeurs
Classes centrales Effectifs
[0-30[ 15 5
[30-60[ 45 20
Annexes : Analyse de données extraites du questionnaire des 4èmes