Vous êtes sur la page 1sur 22

TRAITEMENT NUMÉRIQUE DE DONNÉES

Traitement numérique de données – Statistiques à 1 variable


Compétences spécifiques que l’élève devra atteindre à l’issue du chapitre :

Connaître
Code Intitulé Atteint
C1_1 Expliquer en situation le vocabulaire caractérisant un ensemble de données statistiques.
C1_2 Lire les informations fournies par une représentation graphique liée à un ensemble de données
statistiques
Appliquer
C2_1 Calculer des valeurs caractéristiques d’un ensemble de données statistiques
C2_2 Construire une représentation graphique liée à un ensemble de données statistiques
C2_3 Extraire des informations d’une représentation graphique de données statistiques
Transférer
C3_1 Interpréter en contexte les valeurs caractéristiques d’un ensemble de données statistiques
C3_2 Commenter et critiquer des représentations graphiques liées à un ensemble de données
statistiques
C3_3 Commenter l’intérêt et les limites d’une étude statistique
C3_4 Réaliser une étude statistique et traiter les données en utilisant l’outil informatique (tableur)
Référence au programme : MQ32 UAA3

Table des matières


Compétences à atteindre 1
Table des matières 1
Introduction 2
1. Définitions 2
2. Vocabulaire 2
+ Exemple 3
3. Etude d’une série statistique 3
1. Exemple 1 – lancés de dés 3
+ Représentations graphiques 6
2. Exemple 2 – Examen de math 7
+ Représentations graphiques 8
3. Exemple 3 – Hauteur d’arbres 9
+ Représentations graphiques 10
4. Les paramètres d’une série statistique 10
A. Les paramètres de position 10
1. La moyenne arithmétique 10
2. le mode 12
3. La médiane 12
4. Les quartiles 14
B. Les paramètres de dispersion 15
1. Introduction 15
2. Étendue 15
3. Ecart interquartile 16
4. Variance 16
5. Ecart-type 18
5. Exercices 19
Bibliographie 22

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 1


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Introduction

LA STATISTIQUE A ENVAHI DE NOMBREUX DOMAINES : LA SCIENCE, L'ÉCONOMIE, LA

POLITIQUE, LA PÉDAGOGIE, LA PSYCHOLOGIE, LA MÉDECINE, ...

Depuis des siècles, l'homme a souvent tenu une comptabilité des personnes et des choses avec
l'espoir d'utiliser les données du passé pour la résolution des problèmes du présent et la
prévision des événements futurs. Cependant, ce n'est qu'à la fin du 19e siècle que l'on a trouvé
la méthode correcte à employer pour la résolution des problèmes de l'interprétation des
données recueillies.

UNE ÉTUDE STATISTIQUE CONSISTE À RECUEILLIR DES DONNÉES, À ORGANISER CES

DONNÉES SOUS FORME DE TABLEAUX OU DE REPRÉSENTATIONS GRAPHIQUES, À TRAITER

CES INFORMATIONS AFIN DE PERMETTRE UNE ANALYSE OBJECTIVE.

1. Définitions

La statistique est la science qui collecte, analyse et interprète des observations relatives à
un même phénomène ; elle étudie méthodiquement un ensemble de données numériques, ce
qui permet de faire un état de la situation présente et passée, de présenter ces données d'une
manière intelligible et surtout de servir de base à la prévision.

Il en résulte que le travail se découpera en trois phases :

 La collecte des informations est la phase préparatoire et probablement la plus


délicate : elle consiste à définir la population, choisir le caractère étudié, vérifier si
l’échantillon éventuellement choisi est ou non représentatif de la population. C’est de la
qualité de cette collecte que dépendra la validité des résultats trouvés.

 L’analyse des informations recueillies consiste à déterminer un certain nombre de


caractéristiques mathématiques relatives à la série statistique étudiée.

 L’interprétation des résultats obtenus lors de l’analyse permet au statisticien de tirer


un certain nombre de conclusions sur l’étude faite et de suggérer les décisions à prendre.

2. Vocabulaire

Une population est un ensemble soumis à une étude statistique.

Une série statistique est un ensemble de valeurs collectées portées sur une liste comme, par
exemple, la taille des élèves d'une classe, le nombre de voix obtenues par l'ensemble des
personnes sur une liste,...

Un échantillon est un sous-ensemble de la population.

Un caractère statistique est une propriété étudiée sur la population. Il peut être qualitatif ou
quantitatif.

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 2


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Un caractère est qualitatif s'il est non mesurable comme, par exemple, la marque d'une
voiture, l'activité professionnelle, la nationalité, ...

Un caractère est quantitatif s'il peut se mesurer, c'est-à-dire si on peut lui attribuer une valeur
numérique comme, par exemple, l'âge, le poids, le revenu annuel, ...

Dans ce qui suit, nous nous limiterons à l’étude de séries statistiques quantitatives.

Un caractère quantitatif peut être discret ou continu.


Il est discret si le caractère ne peut prendre que des valeurs isolées comme, par exemple, le
nombre d'enfants d'une famille, le nombre de voitures que possède une famille,...
Il est continu si le caractère peut prendre toutes les valeurs dans un intervalle donné partagé
en classes comme par exemple la taille d'un être humain.

Les différentes valeurs que peuvent prendre le caractère s’appellent les modalités.

Exemple :

On étudie le nombre d’enfants par famille dans la région de Mons. Pour ce faire, on interroge
différentes familles prises au hasard.

Dans ce texte, relevez : Population 

Échantillon 

Caractère étudié 

Type de caractère 

3. Etude d’une série statistique

1. Exemple 1 – lancés de dés


On lance deux dés (non pipés) et on note la somme des points obtenus. Le tableau ci-
dessous, appelé tableau brut, donne les différents résultats après 100 lancés.

5 6 4 2 4 5 6 3 4 5
12 9 7 7 8 10 5 2 7 11
4 3 7 6 7 9 7 10 6 7
7 6 4 2 5 7 9 5 6 3
6 4 7 5 6 7 9 11 10 10
7 12 6 9 11 6 5 9 7 10
12 10 8 5 8 6 9 7 10 7
8 7 6 2 8 6 6 9 6 7
5 7 5 7 11 10 6 7 9 6
3 6 5 6 11 10 6 7 10 9

Ces 100 nombres représentent les données brutes de la série statistique. Le caractère étudié
est ………………………………………………………………………………..
Ce caractère est de type …………………………………….

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 3


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Pour pouvoir étudier ce tableau, il y a lieu d’y mettre un peu d’ordre. Nous constatons que

a) le caractère observé prend des valeurs entre 2 et 12. Ce sont les modalités xi. La différence
entre les deux valeurs extrêmes s'appelle l'étendue de la série. On a donc
x1 = 2 ; x2 =3 ;...; x9 = 10 ; x10 = 11 ; x11 = 12.

L’étendue de la série = …………………….

b) certaines valeurs de xi reviennent plusieurs fois : le nombre de fois que la valeur xi se


rencontre est nommé effectif de cette valeur . On le note ni.

L'ensemble des couples (xi, ni) est la table des effectifs.

xi ni
2 4
3 4
4 ….
5 12
6 20
7 21
8 ….
9 10
10 10
11 ….
12 3
Effectif total :

L'effectif total est le nombre d'éléments de la population :


11
Effectif total  n1  n2  n3  ...  n11  n i 1
i

Dans le cas présent : N = ……………………………………………...

La fréquence d’une valeur fi est le rapport de son effectif à l'effectif total. Elle est notée :

ni
fi = .
Effectif total

Question : Combien de fois a-t-on obtenu un total au plus égal à cinq ?


Il s’agit donc des cas où la somme des points obtenus est égale à 2, 3, 4 ou 5. La réponse
s’écrit donc
4
n1  n2  n3  n4  4 = n
i 1
i = 26
Donc, dans 26 cas, la somme des points obtenus sur les deux dés est inférieure ou égale à
cinq.

L'effectif cumulé de xi est la somme des effectifs de toutes les valeurs de xi inférieures ou
i

égales à xi. On le note Ni et on a Ni = n1 + n2 +... + ni = n


j 1
j .

Il représente le nombre de fois que l'on rencontre une valeur au plus égale à xi.

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 4


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

L'ensemble des couples (xi, Ni) est la table des effectifs cumulés.

La fréquence cumulée de la valeur xi est le rapport de l'effectif cumulé à l'effectif total ; elle
est notée
Ni
Fi =
Effectif total
26
Par exemple, on a : F4 = = 0,26, ce qui signifie que 26% des lancers ont donné un total
100
inférieur ou égal à cinq.

Complétons la table des effectifs avec les nouvelles informations :

xi ni Ni fi Fi
2 4 4 0,04 0,04
3 4
4 6
5 12
6 20
7 21
8 5
9 10
10 10
11 5
12 3
Effectif total : 100

Le tableau ainsi obtenu est un tableau recensé.

Le tableau recensé est le tableau obtenu en classant les valeurs de la variable (ou les
différentes classes caractérisées par leurs limites ou leurs centres dans le cas d'un groupement
en classes – voir exemple 2) par ordre croissant ou décroissant. De plus, il doit indiquer les
effectifs, les fréquences, les effectifs cumulés et les fréquences cumulées de chaque valeur (ou
de chaque classe).

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 5


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

REPRESENTATIONS GRAPHIQUES

UNE SÉRIE STATISTIQUE PEUT ÊTRE REPRÉSENTÉE PAR DE NOMBREUX GRAPHIQUES

ET DIAGRAMMES : IL SUFFIT D’OUVRIR UN TABLEUR ET DE VOIR TOUT CE QUE L’ON

PROPOSE À L’UTILISATEUR. LE TABLEAU RECENSÉ ÉTABLI CI-DESSUS NOUS PERMET DE

TRACER PAR EXEMPLE LES DIAGRAMMES SUIVANTS :

Diagramme circulaire1 Nuage de points


20
25

12 2
16 11 3 20
4
10

12 5 Effectifs 15
9

10
8 8

6
5
4 7

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 5 10 15 20 25 30 35 xi 40 Résultats

Diagramme en bâtonnets Diagramme des effectifs cumulés

25 100

90
20 80
Effectifs cumulés

70
15
Effectifs

60

50
10 40

30
5 20

10
0 0
1 2 3 4 5 6 7 8 9 10 11 12 13 1 2 3 4 5 6 7 8 9 10 11 12 13
Résultats Résultats

On peut aussi construire les diagrammes des fréquences et des fréquences cumulées. Ils sont
cependant identiques aux deux derniers : seule la graduation de l’axe Oy varie ; en effet, au
lieu d’y voir figurer les effectifs (ou effectifs cumulés), ce sont les fréquences (ou fréquences
cumulées) qui y figurent.

1
Dans le cas présent, le diagramme circulaire est peu lisible parce que la variable xi prend trop de valeurs
différentes.

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 6


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

2. Exemple 2 – Examen de math

48 élèves d’une section Technique de qualification participent à un examen de mathématiques


noté sur 40. Voici les différents résultats :

24, 24, 14, 16, 24, 22, 19, 27, 8, 24, 23, 21, 22, 20, 16, 15, 20, 18, 23, 22, 22,
23, 31, 34, 19, 26, 36, 29, 19, 26, 28, 22, 20, 17, 13, 13, 21, 19, 31, 22, 33, 31,
24, 17, 30, 20, 22, 23.

Ces 48 résultats représentent les données brutes de la série statistique. Le caractère étudié est
………………………………………………………………………………..
Ce caractère est de type …………………………………….

Procédons comme dans le cas précédent et transformons ce tableau brut en un début de


tableau recensé.

xi ni Ni xi ni Ni xi ni Ni
8 1 1 18 1 10 28 1 40
9 0 1 19 4 14 29 1 41
10 0 1 20 4 18 30 1 42
11 0 1 21 2 20 31 3 45
12 0 1 22 7 27 32 0 45
13 2 3 23 4 31 33 1 46
14 1 4 24 5 36 34 1 47
15 1 5 25 0 36 35 0 47
16 2 7 26 2 38 36 1 48
17 2 9 27 1 39

Ce tableau volumineux ne nous donne pas une idée précise de la distribution des données.
Nous allons les grouper en classes.

La 1re colonne est la liste des différentes classes avec leurs limites. Le choix de cet
intervalle dépend de l'étendue du tableau et du nombre d'éléments.
Créons par exemple des intervalles de cinq unités : [7,5; 12,5[, [12,5;
17,5[, [17,5; 22,5[, [22,5; 27,5[, [27,5; 32,5[, [32,5; 37,5[.

La 2e colonne précise le centre de chaque classe : il s’agit de la moyenne arithmétique


7,5  12,5 12,5  17,5
des limites de la classe : x1   10 ; x2   15 ;
2 2
17,5  22,5 22,5  27,5 27,5  32,5
x3   20 ; x4   25 ; x5   30 ;
2 2 2
32,5  37,5
x6   35
2
La 3e colonne donne l’effectif de chaque classe (ni) ;
e
La 4 colonne donne l’effectif cumulé de chaque classe (Ni) ;
La 5e colonne donne la fréquence de chaque classe (fi ) ;
La 6e colonne donne la fréquence cumulée de chaque classe (Fi).
Le tableau devient donc :

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 7


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Classes Centres xi ni Ni fi Fi
 7, 5; 12,5 10 1 1 0,02 0,02
12,5; 17, 5
17,5; 22,5
 22, 5; 27,5
 27,5; 32,5
32,5; 37,5
Le groupement en classes doit répondre à un certain nombre de critères qui relèvent
surtout du bon sens : le nombre de classes doit rester raisonnable sans quoi le groupement
perd tout son intérêt. Par contre, ce nombre ne peut pas être trop petit afin d’éviter de perdre
les spécificités de la série étudiée : la valeur de chaque caractère est remplacée par celle du
centre de la classe. Les résultats d’une étude statistique peuvent varier très fort suivant la
façon dont on a formé les classes.

Remarque : Dans certains cas, le statisticien prend des classes d’amplitudes différentes. Nous
ne le ferons pas et nous nous contenterons de dire que la méthode de travail reste souvent très
semblable à ce qui va suivre.

REPRESENTATIONS GRAPHIQUES

Diagramme circulaire Diagramme en bâtonnets

[32,5; 37,5[
[7,5; 12,5[ 20

[27,5; 32,5[ [12,5; 17,5[ 15


Effectifs

10

[22,5; 27,5[ 5

[17,5; 22,5[
0
[7,5;12,5[ [12,5;17,5[ [17,5;22,5[ [22,5;27,5[ [27,5;32,5[ [32,5;37,5[

Classes

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 8


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Polygone des effectifs Polygone des effectifs cumulés

20 60

50

Effectifs cumulés
15
Effectifs

40
10 30

5 20

10
0
0
[7,5; [12,5; [17,5; [22,5; [27,5; [32,5;
0 10 20 30 40
12,5[ 17,5[ 22,5[ 27,5[ 32,5[ 37,5[
Notes obtenues
Classes

3. Exemple 3 - Hauteur d'arbres.

LORS DE L’ABATTAGE DES SAPINS (ÉPICÉAS) POUR LES FÊTES DE FIN D’ANNÉE, LES

BÛCHERONS MESURENT LA HAUTEUR DES ARBRES AFIN DE LES CLASSER POUR LA VENTE.

LE CARACTÈRE ÉTUDIÉ EST ………………………………………………………….

Ce caractère est de type …………………………………….

EXEMPLE : LE SAPIN QUI MESURE 176,3 CM APPARTIENT À L’INTERVALLE ]174,5 ; 179,5] .

NOUS TRAVAILLERONS AVEC UNE VALEUR APPROCHÉE À  0,5 CM.

Voici le tableau recensé de 400 arbres dont l'étendue des classes est de 5 cm.

classes Centre ni Ni fi Fi
[159,5 ; 164,5] 162 5 5 0,0125 0,0125
]164,5 ; 169,5] 167 7 12 0,0175 0,03
]169,5 ; 174,5] 172 15 27 0,0375 0,0675
]174,5 ; 179,5] 177 25 52 0,0625 0,13
]179,5 ; 184,5] 182 37 89 0,0925 0,2225
]184,5 ; 189,5] 187 47 136 0,1175 0,34
]189,5 ; 194,5] 192 53 189 0,1325 0,4725
]194,5 ; 199,5] 197 57 246 0,1425 0,615
]199,5 ; 204,5] 202 49 295 0,1225 0,7375
]204,5 ; 209,5] 207 38 333 0,095 0,8325
]209,5 ; 214,5] 212 28 361 0,07 0,9025
]214,5 ; 219,5] 217 21 382 0,0525 0,955
]219,5 ; 224,5] 222 12 394 0,03 0,985
]224,5 ; 229,5] 227 6 400 0,015 1

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 9


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

REPRESENTATIONS GRAPHIQUES

POLYGONE DES EFFECTIFS HISTOGRAMME

60

60
50

50
40
Effectifs

40
30

Effectifs
30
20

20
10

10
0
150 160 170 180 190 200 210 220 230 240
0
Tailles 150 160 170 180 190 200 210 220 230 240

Tailles

POLYGONE DES EFFECTIFS CUMULÉS

400

350

300
Effectifs cumulés

250

200

150

100

50

0
150 160 170 180 190 200 210 220 230 240

Tailles

4. Les paramètres d’une série statistique.

Un paramètre statistique est un nombre qui donne des informations sur une série statistique.

A. Les paramètres de position


Les paramètres de position donnent une idée de l’ordre de grandeur des valeurs du
caractère.

1. La moyenne arithmétique
La moyenne arithmétique x (couramment appelée moyenne par abus de langage)
d’une série statistique est la moyenne arithmétique de ses données.

5  6  4  ...  10  9
Exemple 1 : x =  6,92
100

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 10


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

ou de manière plus rapide et plus efficace en utilisant la table des effectifs

2  4  3  4  ...  12  3
x =  6,92
100

La moyenne arithmétique d’une série statistique est le quotient de la somme des


produits ni.xi par l’effectif total.

Donc, pour calculer une moyenne, on utilise généralement la formule suivante :


c

x = n x
i 1
i i

Effectif total

où c est le nombre d’éléments dans le cas d’une série non groupée ou le nombre de
classes dans le cas d’une série groupée.

À toi !

Fais de même et calcule la moyenne arithmétique pour l’exemple 2 et l’exemple 3 :

Avantages :

 La moyenne est le paramètre de position le plus utilisé parce qu’il est possible de
la déterminer par des calculs précis.
 Sa stabilité croît avec l’effectif total.

Inconvénient :

 La moyenne est fortement influencée par les valeurs extrêmes (parfois anormales
ou douteuses) ; dans ce cas, elle peut perdre toute signification. Il faut cependant
éviter d’éliminer ces valeurs : ce serait modifier les données.

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 11


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

2. Le mode

Le mode d'une série statistique est la valeur du caractère ou la classe qui a le plus
grand effectif (ou la plus grande fréquence).

Dans le cas d’une série groupée en classes, on parle de classe modale, classe dont
l'effectif est supérieur ou égal à tout autre effectif de classes. Une série peut avoir
plusieurs modes ou plusieurs classes modales.

Le mode de l’exemple 1 est ……...


La classe modale de l’exemple 2 est la classe …………………...
La classe modale de l’exemple 3 est la classe de centre ……………..

Avantage :

 Le mode est d’autant plus significatif qu’une valeur du caractère ou une classe
domine nettement toutes les autres.

Inconvénient :

 Le mode n’est pas susceptible d’une détermination algébrique. Il n’est donc


pas utilisable lorsqu’on doit disposer d’expressions analytiques pour la suite
des calculs.

3. La médiane

La médiane µ d'une série statistique est l'élément qui la partage en deux groupes
de même effectif.

a) Dans le cas de données non groupées, il suffit de les classer en ordre croissant
ou décroissant et de prendre l'élément du milieu.
Si la série comprend un nombre impair 2p + 1 d’éléments, la médiane  est le
(p + 1)e élément.

Exemple

La série 12, 13, 13, 15, 15, 16, 17 comprend 7 éléments ; sa médiane est le
quatrième, donc 15.

Si la série comprend un nombre pair 2p d’éléments, la médiane  est la moyenne


arithmétique entre les pe et (p+1)e éléments.

Exemple

La série 13, 14, 14, 15, 16, 16 comprend 6 éléments. La médiane est donc la
14  15
moyenne arithmétique entre le 3e et le 4e. Donc  = = 14.5
2

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 12


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

b) Dans le cas de données groupées : La détermination de  se fait graphiquement.


La médiane est l'abscisse du point d'intersection du polygone des fréquences
1
cumulées et de la droite d'équation y = . (voir exemple 3)
2

Reprenons maintenant les trois exemples traités au début de ce chapitre :


100

Exemple 1

La série comprend 100 éléments. 75

Effectifs cum ulés


La médiane µ sera donc la
moyenne du 50e et du 51e élément,
50
77
soit 7.
2
25

=7

0
1 2 3 4 5 6 7 8 9 10 11 12 13

Résultats

Exemple 2
1

Une simple lecture sur le diagramme des


Fréquences cumulées

effectifs ou des fréquences cumulés montre 0,75

que µ  21,7
0,50

0,25

 = 21,7
0
5 10 15 20 25 30 35 40

Notes

1
Exemple 3
Fréquences cumulées

Une simple lecture sur le 0,75


diagramme des effectifs ou des
fréquences cumulés montre que
µ  196 0,50

0,25

 = 196
0
150 160 170 180 190 200 210 220 230 240

Tailles

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 13


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Avantages :

 La médiane est facile à déterminer.


 Elle ne dépend pas des valeurs extrêmes de la série (qui peuvent être aberrantes »).

Inconvénient :

 Elle est basée uniquement sur les valeurs centrales.

Les quartiles

Les quartiles (notés Q1, Q2 et Q3) partagent la série en quatre groupes d'effectifs égaux.
Il est à remarquer que le deuxième quartile se confond avec la médiane.

Ils se recherchent comme la médiane, c’est-à-dire, le plus souvent, au départ du


diagramme des effectifs cumulés.

Exemple 1 100

Q1 = 5 ; Q2 =  = 7 ; Q3 = 9
75
Effectifs cum ulés

50

25

Q1 = 5 Q2 = 7 Q3 = 9

0
1 2 3 4 5 6 7 8 9 10 11 12 13

Résultats

Exemple 2 1

Q1 = 18,3 ; Q2 =  = 21,7 ;
Q3 = 26,2
Fréquences cumulées

0,75

0,50

0,25

Q1 = 18,3 Q2 = 21,7 Q3 = 25,2

0
5 10 15 20 25 30 35 40

Notes

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 14


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

1
Exemple 3

Q1 = 186,1 ; Q2 =  = 196 ;

Fréquences cumulées
0,75
Q3 = 205,8

0,50

0,25

Q2 = 196
Q1 = 186,1 Q 3 = 205,8

0
150 160 170 180 190 200 210 220 230 240

Tailles
B. Les paramètres de dispersion

1. Introduction

Considérons les deux séries suivantes donnant les résultats de deux contrôles notés sur 20.

Contrôle 1 : 5 6 6 8 8 8 12 12 12 12 14 14 16 16 18 18 19

Contrôle 2 : 8 9 10 10 11 11 12 12 12 12 12 13 14 14 14 15 15

Pour ces deux séries, le mode, la médiane et la moyenne valent 12.


Faut-il en conclure que les séries sont semblables ? L'examen de ces deux séries montre que
les résultats du second contrôle sont davantage resserrés autour de la moyenne que ceux du
premier. On dit que la dispersion des résultats est plus forte pour le premier contrôle que pour
le second.

Il faut donc compléter les informations données par les paramètres de position par des
paramètres de dispersion qui indiqueront la façon dont la série s'étend autour de ces valeurs
centrales.

2. Étendue

L’ÉTENDUE D’UNE SÉRIE STATISTIQUE EST LA DIFFÉRENCE ENTRE LA PLUS GRANDE ET LA

PLUS PETITE VALEUR DE LA SÉRIE.

Avantage : Le calcul de l'étendue est très simple.


Inconvénient : Elle dépend uniquement des valeurs extrêmes de la série qui peuvent être
anormales.
Conclusion : L'étendue est donc un médiocre paramètre de dispersion et est peu utilisé.

Exemple 1 : 12 – 2 = 10
Exemple 2 : 36 – 8 = 28
Exemple 3 : 229,5 – 159,5 = 70

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 15


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

3. Ecart interquartile

L'écart interquartile est la différence entre le troisième et le premier quartile. Il vaut Q3 - Q1.

Exemple 1 : 9 – 5 = 4
Exemple 2 : 26,2 – 18,3 = 7,9
Exemple 3 : 205,8 – 186,1 = 19,7

4. Variance

Pour évaluer la dispersion autour de la moyenne arithmétique, l'idée qui vient spontanément
est de déterminer les écarts entre la moyenne x et les diverses valeurs xi de la série.

On démontre que, pour toute série statistique, la somme des ces écarts est nulle. En effet, les
termes xi - x sont négatifs ou positifs et les termes positifs compensent les termes négatifs.

D'où l'idée de considérer soit la valeur absolue de ces écarts, soit les carrés de ceux-ci, qui
eux sont tous positifs.

Pour des raisons de facilité, c'est la seconde option qui prévaut.

Définition : La variance notée V est la moyenne arithmétique des carrés des écarts des
données par rapport à la moyenne arithmétique.
p
2

Pour calculer la variance, on utilise en pratique la formule suivante : V=


n x  x
i 1
i i

Effectif total
Afin de faciliter nos calculs ; pour rechercher la variance, nous construirons un nouveau
tableau analogue à ceux ci-dessous :

Exemple 1 :
x = 6,92 (voir page 10)
Effectif total = 100
2 2
xi ni xi  x  x  x
i 
ni . xi  x 
2 4 2 – 6,92 = -4,92 (-4,92)² = 24,2064 4*24,2064 = 96,8256
3 4 -3,92 15,3664 61,4656
4 6 -2,92 8,5264 51,1584
5 12 -1,92 3,6864 44,2368
6 20 -0,92 0,8464 16,928
7 21 0,08 0,0064 0,1344
8 5 1,08 1,1664 5,832
9 10 2,08 4,3264 43,264
10 10 3,08 9,4864 94,864
11 5 4,08 16,6464 83,232
12 3 5,08 25,8064 77,4192
Effectif total : N=100 Total (  ) = 575,36

575,36
 V=  5, 75
100

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 16


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

À toi !

Fais de même et calcule la variance pour l’exemple 2 et l’exemple 3 :

Exemple 2 :

2 2
xi ni xi  x  x  x
i 
ni . xi  x 
10 1
15 8
20 18
25 12
30 6
35 3
Effectif total : Total (  ) =

Exemple 3 :

2 2
xi ni xi  x  x  x
i 
ni . xi  x 
162 5
167 7
172 15
177 25
182 37
187 47
192 53
197 57
202 49
207 38
212 28
217 21
222 12
227 6

Effectif total : Total (  ) =

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 17


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

5. Ecart-type

L’écart-type, noté , est la racine carrée positive de la variance.

= V

L'écart-type s'exprime donc dans la même unité que les valeurs xi de la variable.

Exemple 1 :  = 2,40

Exemple 2 :  = ……….

Exemple 3 :  = ……….

Avantage :

 L'écart-type constitue un excellent testeur de dispersion, il tient compte de toutes les


données de la série statistique. Plus l’écart-type est faible, plus il y a une forte
accumulation des observations autour de la moyenne arithmétique. Plus l’écart-type
est grand, plus l'étalement est grand et plus les résultats sont éloignés de la moyenne.

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 18


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

5. Exercices

1) On étudie le nombre d’enfants par famille dans la région de Mons, Pour ce faire, on
interroge différentes familles prises au hasard, les réponses ont été enregistrées sous forme
de diagramme en bâtonnets des effectifs :

 Dans le texte, relevez : population, échantillon, caractère étudié, type de


caractère.

 Dresser pour cet exercice le tableau recensé

 Déterminer l’effectif total

 Répondre aux questions suivantes :

- Combien de familles ont 5 enfants ?


- Combien de familles ont moins de 4 enfants ?
- Combien de familles ont plus de 4 enfants ?
- Quel pourcentage de familles ont 2 enfants ?
- Quel pourcentage de familles ont moins de 3 enfants ?
- Complétez la phrase suivante : « 10% de la population de la région de Mons à
plus de ….. enfants ».

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 19


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

2) On mesure des élèves de 4ème année pour connaître la taille des adolescents de 15/16 ans.
On obtient les résultats suivants : (les tailles sont données en cm)
[ 140 ; 150[  5 élèves [170 ; 180[  32 élèves
[150 ; 160[  17 élèves [180 ; 190[  7 élèves
[160 ; 170[  38 élèves [190 ; 200[  1 élève

 Dans le texte, relevez : population, échantillon, caractère étudié, type de


caractère, effectif total.

 Dresser le tableau recensé, trace un histogramme des effectifs et réponds aux


questions suivantes :

- Combien d’élèves mesurent moins de 1,60 m ?


- Quel pourcentage d’élèves mesurent entre 170 et 180 cm ?
- Quel pourcentage d’élèves mesurent plus de 1,70 m ?
- Complète : « 20% des ados de 15/16 ans mesure moins de ………. »

3) Un professeur étudie les résultats obtenus par deux de ses classes de 5 ème année à un
contrôle noté sur 20 :
Classe de 5ème A : 5 6 6 8 8 8 12 12 12 12 14 14 16 16 18 18 19
Classe de 5ème B : 8 9 10 10 11 11 12 12 12 12 12 13 14 14 14 15 15

Pour chaque classe :

a) Trace le polygone des fréquences cumulées,


b) Détermine l’effectif total,
c) Détermine le mode ou la classe modale,
d) Détermine la médiane,
e) Détermine les quartiles (Q1 et Q3),
f) Détermine l’écart interquartile,
g) Détermine l’étendue,
h) Détermine la moyenne,
i) Détermine la variance et l’écart-type,

Recopie et transcris tes résultats dans un tableau identique à celui ci-dessous et tire une
conclusion permettant de savoir ‘en moyenne’ quelle aura été la meilleure classe à ce
contrôle.
Classe de 5ème A Classe de 5ème B
Effectif total (N)
Mode
Médiane (  )
Q1
Q3
Q3 – Q1
Étendue
Moyenne ( x )
Variance (  ² ou V)
Écart-type (  )

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 20


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

4) Lors d'un contrôle sur une route nationale (vitesse limitée à 90 km/h, on a relevé les
résultats suivants. Compléter le tableau recensé.

Vitesse Centre de Effectif (ni) Effectif Fréquence (fi) Fréquence


(km/h) classe (xi) cumulé ( N i ) cumulée ( Fi )
[70 ; 80[ 32
[80 ; 90[ 74
[90 ; 100[ 180
[100 ; 110[ 160
[110 ; 120[ 54
[120 ; 130[ 16
Total

Après avoir établi le polygone des fréquences cumulées, déterminer :


- la médiane : 
- le premier quartile : Q1 =
- le deuxième quartile : Q2 =
- le troisième quartile : Q3 =
Traduire par une phrase ce que signifie concrètement chacune de ces valeurs.
À l'aide du tableau et/ou du graphique, déduire :
- le nombre de véhicules qui roulent à moins de 100 km/h,
- le nombre de véhicules qui roulent au moins à 100 km/h,
- la fréquence des véhicules qui respectent la limitation de vitesse,
- la vitesse moyenne contrôlée sur cette route,
- le mode de cette série statistique,
- l’étendue de cette série statistique,
- l’écart interquartile,
- la variance,
- l’écart type.
Est-il nécessaire d’accentuer les contrôles sur cette route ? Explique ta réponse en essayant
d’être complet.

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 21


TRAITEMENT NUMÉRIQUE DE DONNÉES
TRAITEMENT NUMÉRIQUE DE DONNÉES

Bibliographies et sources :

 Notes dites ‘de l’inspecteur’ R. Mathar revues et adaptées à l’enseignement Technique


de qualification (Math 2h)
 Clic et Maths – Ed. De Boeck
 Astro Math – Ed. Plantyn
 Espace Math – Ed. De Boeck
 Actimath – Ed. Van In
 Site enseignement.be

5 TQ - Cours à deux périodes hebdomadaires - Statistiques à une variable 22


TRAITEMENT NUMÉRIQUE DE DONNÉES

Vous aimerez peut-être aussi