Vous êtes sur la page 1sur 10

Chapitre 9

LA STATISTIQUE

Les recensements sont nés avec le besoin de démontrer une certaine puissance d’un peuple. On
répertoriait ainsi les armes, les soldats, les récoltes, les revenus du commerce …
On retrouve les premières données de recensements dans l’Antiquité :
par exemple en Chine en 2200 avant J.C. ou bien chez les égyptiens en 1700
avant J.C..
Chez les romains, les censeurs effectuaient tous les 5 ans sur la place
publique un recensement du peuple. En l’an 21 de notre ère, l’empereur
Auguste ordonna un dénombrement général de tout son empire.
En France on trouve quelques données sur la population du Ve siècle.
En 1697, Louis XIV demanda à ses intendants une étude détaillée de l’état
politique, agricole et commercial du royaume. D’après une évaluation
statistique donnée par Vauban en 1698, la France comptait alors :
13 millions d’habitants, 1,5 millions de domestiques, 24 000 maisons
à Paris dont 4 000 à porte cochère.
Le mot « statistique » est introduit au XVIIIe siècle par l’économiste allemand Gottfried ACHENWALL.
Il désigne alors une arithmétique permettant de connaître un Etat par l’étude de sa population, de son
commerce, de son industrie …. La statistique va servir aux premières compagnies d’assurances sur la vie, et
son développement mathématique va aller de pair avec la multiplication de ses applications.
Aujourd’hui les statistiques interviennent dans des domaines aussi divers que la fixation du prix d’un billet
d’avion, les paris sportifs ou la détermination des quotas pour la pêche du thon rouge en Méditerranée.
Le mot statistique vient du latin « status » qui veut dire l’Etat.
L’activité statistique remonte à l’antiquité et consistait à recenser les populations et les ressources de l’Etat.
Depuis le XIX ème et XX ème siècle, ses méthodes se sont beaucoup développées. Elle est aujourd’hui
présente dans des domaines aussi divers que les assurances, la médecine, les études de marché, les contrôle
de qualité dans l’industrie, les prévisions économiques…

C’est une partie de la population.


Population Lorsque la population est trop nombreuse, on travaille sur un ou
plusieurs échantillons.
Individus Pour étendre les résultats collectés à l’ensemble de la population, il
est nécessaire que l’échantillon soit représentatif et non biaisé.
Caractère étudié C’est le quotient de l’effectif de la valeur par l’effectif total.
ou variable
C’est l’ensemble sur lequel porte l’étude.
Echantillon Ce sont les éléments qui composent la population.
Aspect que l’on observe sur les individus.
Série statistique
C’est l’ensemble des valeurs collectées.
- Série statistique quantitative :
Effectif Le caractère étudié peut faire l’objet d’une mesure ;
on parle plutôt de valeur.
Fréquence - Série statistique qualitative :
Le caractère n’est pas mesurable ; on parle plutôt de modalité.
Pour une valeur (ou une modalité), c’est le nombre d’individus de
la population ayant cette valeur.

1
Exemples :

- Etude de la répartition des chats pour les animaux domestiques en France.


La population est l‘ensemble des animaux domestiques en France.
Les individus sont les animaux domestiques.
Le caractère étudié est le chat.
L’échantillon serait biaisé si l’on observe seulement tous les animaux domestiques d’une
grande ville ou seulement d’un petit village de campagne.
- Exemples de valeurs d’une variable quantitative :
La pointure des chaussures : 38 ; 39 ; 40 ; 41 ; 42 ; 43.
La taille : 155;160 ; 160;165 ; 165;170 .
- Exemple de modalités d’une variable qualitative :
Le sport : tennis ; foot ; VTT ; roller ; judo.

I. VOCABULAIRE

C’est l’ensemble des méthodes qui permettent de recueillir, de classer, d'étudier et d'exploiter des données
concernant certains phénomènes que l'on veut étudier, pour tenter d'en tirer des conclusions.

Une étude statistique s’effectue sur un ensemble appelé ………………dont les éléments sont appelés
…………….. et consiste à observer, à étudier un même aspect de ces individus appelé ……………………
On distingue deux types de caractère :
- Les caractères …………………. : Ce sont les caractères dont les valeurs ne sont pas des nombres
(ex :profession, couleur des yeux…..)

- Les caractères …………………..: Ce sont des caractères qui prennent des valeurs numériques.
-Le caractère quantitatif est discret si les valeurs du caractère sont isolées ( ex : nombre d’enfants),
ces valeurs sont appelées modalités.
-Le caractère quantitatif est continu si les valeurs du caractère sont regroupées en intervalles, appelés
classes (ex : taille [170 ;175[).La « largeur » de chaque intervalle s’appelle l’amplitude.

On appelle effectif d’une valeur (resp. d’une classe, resp.d’une modalité) le nombre d’individus possédant le
caractère de cette valeur (resp. classe, resp.d’une modalité).
On appelle fréquence d’une valeur (resp. classe, resp.d’une modalité) le quotient de l’effectif de cette valeur
par l’effectif total de la population. Les fréquences sont des nombres compris entre 0 et 1, souvent
exprimées en pourcentage :
effectif de la valeur
Fréquence = (  100)
effectif de la population pour exprimer un pourcentage

Notations :
- x1 , x2 , x3 ,........., x p sont les valeurs ou les centres des classes.
- n1 , n2 , n3 ,........., np sont les effectifs respectifs des valeurs x1 , x2 , x3 ,........., x p .
- f1 , f 2 , f3 ,........., f p sont les fréquences respectives des valeurs x1 , x2 , x3 ,........., x p .
p
- N est l’effectif total : N  n1  n2  ......  n p  n .
i 1
i

2
II. CARACTERISTIQUES DE POSITION

Exercice 1 : Déterminer la médiane, la moyenne et les quartiles d’une série statistique pour un
caractère discret :
Voici les résultats de deux groupes de candidats à un test de compétence en anglais.
Note 0 1 2 3 4 5 6 7 8 9 10
Effectif 0 2 2 4 6 12 14 10 3 2 1
groupe A
Effectifs
cumulés
croissants
Effectif 3 5 5 6 7 8 9 9 7 6 6
groupe B
Effectifs
cumulés
croissants
Fréquence
groupe B
en %

1. Moyenne de groupes et sous-groupes

a. Définition

Moyenne : Notation x

n1 x1  n2 x2  ......n p x p p p
x  f1 x1  f 2 x2  ......  f p x p   fi xi
1
x
N

N
 ni xi
i 1
ou
i 1
se lit somme des ni xi
pour i allant de 1 à p

Pour le groupe A :

Pour le groupe B :

→ p 296 n°19-21

b. Propriétés – linéarité de la moyenne –

Propriété 1 :

Soit x la moyenne des nombres x1 , x2 ,......, x p et y la moyenne des nombres y1 , y2 ,......, y p et k 


- La moyenne de x1  y1 , x2  y2 ,......, x p  y p est égale à x  y .
- La moyenne des nombres x1  k , x2  k ,......, x p  k sera x  k .
- La moyenne des nombres kx1 , kx2 ,......, kx p sera k x .

3
Exemple :
- On décide d’augmenter chaque note du contrôle de 1 point. La nouvelle moyenne est ………
- Si l’on double chaque note, la moyenne de la classe est doublée.
- On décide d’augmenter toutes les notes du contrôle de 10%. La nouvelle moyenne est ………

Théorème 1:

On répartit N nombres x1 , x2 ,......, xN en deux sous-groupes disjoints ; l’un comptant p éléments et l’autre q
éléments ( on a p + q = N ).
Si m1 est la moyenne des nombres du premier groupe et m2 celle du second,

......... ...........
Alors la moyenne m des N nombres est m   ..........   ........... .
......... ...........

Remarque : Ce théorème se généralise à k sous-groupes disjoints deux à deux, k  2 .

Application :

Deux sous-groupes de sportifs se rencontrent. Le premier est constitué de 10 sportifs qui courent le 100 m avec
un temps moyen de 11 s. Le deuxième, constitué de 20 sportifs qui courent avec un temps moyen de 12 s.
a) Dans ce groupe de 30 sportifs, quel est le temps moyen pour courir un 100 m ?
b) Un troisième sous-groupe de 20 personnes rejoint ces 30 sportifs. Dans ce sous-groupe le temps moyen
de course est de 13 s. Quel sera le temps moyen de ce groupe de 50 personnes ?

→ p 296 n°24-25-42-43

2. Médiane d’une série statistique

Médiane : Notation Me ( pour une série ordonnée par ordre croissant)

Pour un caractère discret :

La médiane est une valeur Me du caractère qui partage la population en deux sous-ensembles de
…………………………..

Les éléments du premier sous-ensemble correspondent à des valeurs du caractère inférieures ou égales à Me,
ceux du second correspondent à des valeurs du caractère supérieures ou égales à Me.

N 1 N
Pour N pair, la médiane est la demi-somme des valeurs des caractères de rang et +1 :
2 2

N 1
Pour N impair, la médiane est la valeur du caractère de rang :
2

4
3. Mode d’un groupe

Mode : Notation Mo

Le mode, pour un caractère discret, est la valeur du caractère qui correspond au …………………..…………
Il peut y avoir plusieurs modes.

Pour le groupe A : Pour le groupe B :

4. Quartiles d’un groupe

Le premier Quartile Q1 d’une série statistique est la plus petite valeur de la série telle qu’au moins ……% des
valeurs de celle-ci lui sont inférieures ou égales.

Le troisième Quartile Q3 d’une série statistique est la plus petite valeur de la série telle qu’au moins ……%
des valeurs de celle-ci lui sont inférieures ou égales.

N N
-Si est un entier, le premier quartile Q1 est la valeur qui dans cette liste occupe le rang et le troisième
4 4
3N
quartile Q3 est la valeur qui dans cette liste occupe le rang .
4
N
-Si n’est pas un entier, le premier quartile Q1 est la valeur qui dans cette liste occupe le rang
4
N
immédiatement supérieur à et le troisième quartile Q3 est la valeur qui dans cette liste occupe le rang
4
3N
immédiatement supérieur à .
4

Pour le groupe A :

Pour le groupe B :

5
5. Construire le diagramme en boites ( ou boites à moustaches ) de chaque série .

Afin de représenter différentes caractéristiques d’une série statistique, on a recours, entre autres, aux
représentations dites « diagrammes en boite » ou « diagrammes à moustaches » .

Un diagramme en boite est un rectangle délimité par le premier quartile et le troisième quartile .
Pour l’obtenir, on trace un axe horizontal ( ou vertical ) sur lequel on place les valeurs de Q1 , Q3 et
Me . L’un des côtés du rectangle a pour longueur l’écart interquartile, l’autre est quelconque. On
complète ce diagramme en traçant deux traits horizontaux : l’un joignant Q1 au minimun de la série et
l’autre joignant Q3 au maximun de la série.

Min Q1 Me Q3 Max

Groupe A :

Groupe B :

Exercice 2 : Déterminer la médiane, la moyenne et les quartiles d’une série statistique pour un
caractère continu :
La capacité vitale est le volume d’air maximal pouvant être mobilisé en une seule inspiration.
Sur un échantillon de 17 personnes, on a mesuré la capacité vitale (en litres). Voici la liste des résultats :
4,15 - 4,48 - 5,24 - 4,8 - 4,95 - 4,05 - 4,3 - 4,7 - 5,51 - 4,58 - 4,12 - 5,7 - 4,85 - 5,05 - 4,65 - 4,7
- 4,28.
1) Déterminer l’étendue et la moyenne de cette série. Arrondir la moyenne au centilitre près.

2) En expliquant la méthode utilisée, déterminer la médiane de cette série.

3) On décide de regrouper les valeurs de la série par classes. Compléter le tableau suivant :
capacité vitale (en litres) [ 4 ; 4,5 [ [ 4,5 ; 5 [ [ 5 ; 5,5 [ [ 5,5 ; 6 [
Effectifs
effectifs cumulés croissants
Pour calculer la moyenne
d’une série statistique à
4) A l’aide de cette répartition par classes, déterminer la moyenne des valeurs. caractère continu, on
remplace chaque classe
par son milieu.

6
5) On admet que dans chaque classe, la répartition est uniforme. Tracer alors la courbe des effectifs
cumulés. En déduire graphiquement la médiane, Q1 et Q3 de ces valeurs et construire le diagramme en
boite.
Me est la valeur du
caractère
correspondant à la
fréquence cumulée
de 50% ou à
l’effectif cumulé
N
de
2

III. CARACTERISTIQUES DE DISPERSION

1. L’étendue

Définition : L’étendue est l’écart entre les valeurs extrêmes.

Plus l’étendue est grande plus la série est dispersée, plus l’étendue est petite plus la série est homogène.

2. Ecart interquartile

Définition :

L’intervalle interquartile d’une série statistique est l’intervalle ……………………..

L’écart interquartile d’une série statistique est le nombre …………….

Remarque :

L’écart interquartile mesure la dispersion des valeurs autour de la médiane ; plus l’écart est petit, plus les
valeurs de la série appartenant à l’intervalle interquartile sont concentrées autour de la médiane.
Contrairement à l’étendue ( notée e ) qui mesure l’écart entre la plus grande et la plus petite valeur, l’écart
interquartile élimine les valeurs extrêmes qui peuvent être douteuses, cependant il ne tient compte que de 50%
de l’effectif…..
On peut correctement résumer une série statistique par le couple : (médiane ; écart interquartile)

7
Exercice 3 : exploiter et comparer des diagrammes en boite

Les diagrammes en boite ci-dessous représentent les salaires annuels ( en milliers d’euros) en Ile-de-France et
dans les régions françaises hors Ile-de-France.

Préciser pour l’ Ile-de-France et pour les régions françaises hors Ile-de-France la valeur de la médiane et l’écart
interquartile, quelles différences peut-on relever ?

→ p 295 n°5-6-48

3. Variance et écart type

 La variance V est la moyenne des carrées des écarts à la moyenne, c'est à dire :


n1  x1  x   n2  x2  x   ....  n p  x p  x   
p
1 1
n x  x 
2
V
2 2 2
i i
N N i 1

Cependant, ce calcul risque de devenir laborieux si la moyenne n’est pas un nombre entier : on a à traiter « des
écarts à la moyenne » en général non entiers avec d’inévitables arrondis, d’où des calculs lourds et forcément
peu précis. Pour alléger ces calculs on se sert du théorème suivant :

p
1
Théorème de Koenig : V
N
n x
i 1
i i
2
 x2

 L’écart type σ est la racine carrée de la variance : σ = V

L’écart type mesure la dispersion des valeurs de la série autour de la moyenne : plus l’écart est petit, plus les
valeurs de la série sont concentrées autour de la moyenne.
L’écart type est un paramètre plus fin que l’étendue, car il tient compte de la répartition des valeurs.
L’écart type a la même unité que les valeurs de la série étudiée.

On verra que environ 95 % des valeurs d’une série sont dans l’intervalle  x  2 ; x  2  .
On peut correctement résumer une série statistique par le couple : ( moyenne ; écart type).

8
Exercice 5 :
Voici les résultats d’un devoir ( sur 10 points ), obtenus par les élèves de deux classes :
Note 0 1 2 3 4 5 6 7 8 9 10
Nombre 0 1 0 3 7 8 5 4 1 1 0
d’élèves
classe 1
Nombre 1 3 4 3 2 4 5 3 2 3 2
d’élèves
classe 2
1) Déterminer pour chacune des deux classes, la moyenne et l’écart-type.
2) Comparer les résultats de ces deux classes.

→ p 297 n°30-34-31-35-32. Attention, respectez bien l’ordre de ces exercices !

Exercice 5 : Que fait cet algorithme ?

9
Exercice 6 : Coefficient de variation

→ p 298 n° 59-61 :1) et 2)

10

Vous aimerez peut-être aussi