Vous êtes sur la page 1sur 9

Université Dr.

Moulay Tahar de Saida Année universitaire 2015-2016


Faculté de Technologie Deuxième année LMD
Probabilisées et statistiques

COURS N°3 : caractéristique de position et caractéristique dispersion

Le but des statistiques est d'analyser les données dont on dispose :

• Pour cela, on peut s'aider d'un graphique : Nous verrons notamment cette année
les diagrammes à bâtons, les histogrammes et les diagrammes en boîtes.

• On peut aussi chercher à déterminer la moyenne ou la médiane de la série. De tels


nombres permettent notamment de comparer plusieurs séries entre elles. On les
appelle indicateurs statistiques ou paramètres statistiques. On distingue les
indicateurs de position (qui proposent une valeur "centrale" de la série) et les
indicateurs de dispersion (qui indiquent si la série est très regroupée autour de son
"centre" ou non).

Nous étudierons cette année les indicateurs statistiques suivants :

I. Caractéristiques de position :
I .1- Moyenne :
Soit une série statistique à caractère quantitatif, dont les p valeurs sont données par
x1, x 2, . . ., x p d’effectifs associés n 1, n 2, . . ., n i avec n 1 + n 2 + ... + n i = N.
La moyenne pondérée de cette série est le nombre noté x qui vaut

Remarque 1 :
Lorsque la série est regroupée en classes, on calcule la moyenne en prenant pour
valeurs x i le centre de chaque classe ; ce centre est obtenu en faisant la moyenne des
deux extrémités de la classe.
Remarque 2 :
On peut aussi calculer une moyenne à partir de la distribution de fréquences :
Propriété 1 (Linéarité de la moyenne)
© Si on ajoute (ou soustrait) un même nombre k à toutes les valeurs d’une série,
alors la moyenne de cette série se trouve augmentée (resp. diminuée) de k.
© Si on multiplie (ou divise) par un même nombre non nul k toutes les valeurs d’une
série, alors la moyenne de cette série se trouve multipliée (resp. divisée) par k.
Propriété 2 (Moyenne par sous-groupes)
Soit une série statistique, d’effectifs total N, de moyenne x.
Si on divise cette série en deux sous-groupes disjoints d’effectifs respectifs p et q
(avec p + q = N) de moyennes respectives x 1 et x 2, alors on a :

II.2- Médiane :
Soit une série statistique ordonnée dont les n valeurs sont x 1 ≤ x 2 ≤ x 3 ≤ · · · ≤ x n.
La médiane est un nombre M qui permet de diviser cette série en deux sous-groupes
de même effectif.
 Si n est impair, n est la valeur de cette série qui est située au milieu, à savoir la
n+1 xn+1
valeur dont le rang est
2
, notée
2
.
Exemple :
Prenons les valeurs (notes à un DS, vitesses de vents, ...) rangées dans l'ordre
croissant :
1-3-3-3-5-5-6-7-7-8-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19
Il y a N = 28 valeurs; N:2 = 14; les deux valeurs du milieu sont la 14ème et la 15 ème
qui sont 9 et 10 ; la médiane est la moyenne entre la 14ème et la 15 ème valeur de la
série rangée dans l'ordre croissant, cad Me= 9,5
 Si n est pair, n est le centre l’intervalle médian, qui est l’intervalle formé par
n n
les deux nombres situés « au milieu » de la série, à savoir x et x +1.
2 2
Exemple :
Prenons les valeurs (notes à un DS, vitesses de vents, ...) rangées dans l'ordre
croissant :
3-5-5-6-7-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19
Il y a N = 23 valeurs; N:2 = 11,5, la médiane est la 12ème valeur de la série rangée
dans l'ordre croissant, cad Me = 10
Exemple :
Série A :
Notes obtenues à un contrôle dans une classe de 30 élèves :
2−3−3−4−5−6−6−7−7−7−8−8−8−8−8−9−9−9−9−9−9−10−10−11−11−11−13−13−15−16
On souhaite calculer la médiane de la série A.
Pour cela, on commence par remplir le tableau des effectifs cumulés croissants :
- Ensuite, l’effectif étant de 30, on choisit la moyenne entre la 15 ième et la 16 ième
note.
8+9
On obtient Med = = 8, 5.
22
- Ce qui signifie que la moitié des notes est inférieure ou égale à 8, 5, et que l’autre
moitié des notes est supérieure ou égale à 8, 5.
Dans le cas de répartition par classes, la médiane peut être évaluée soit
graphiquement, soit par interpolation affine à l’aide d’un polygone des effectifs
cumulés.
Exemple
On choisit la répartition par classes de la série A :
- On commence par créer le tableau des fréquences cumulées croissantes :
(On en profite aussi pour indiquer les fréquences cumulées décroissantes).

Puis on place les points correspondants aux extrémités de chaque classe sur un
graphique :

On détermine le point du polygône d’ordonnée 50% et on trouver eniron 8, 2.


 Pour trouver la médiane, on peut aussi tracer le polygône des fréquences
cumulées décroissantes et lire l’abscisse du point de concours des deux
polygônes. On trouve aussi 8, 2.
 Enfin, par le calcul, 50% se situe dans l’intervalle [5 ; 10 [.
On fait l’hypothèse que les longeurs des axes sont uniformément réparties dans cette
classe.
On peut alors procéder à une interpolation linéaire d’après le théoème de Thalès :
I.3- MODE :
Si les données d'une série sont discrètes, le mode est la ou les valeurs qui ont le plus
grand effectif.
Si les données ont été réparties en classes, on parle alors plutôt de classe modale.
L'étendue d'une série est la différence entre la plus grande valeur et la plus petite.
Exemple :
a) Données discrètes 9, 11, 8, 10, 13, 12, 10, 11, 10
Faisons le tableau des effectifs :

valeur 8 9 10 11 12 13
effectif 1 1 2 2 1 1
 Le mode est la valeur qui a le plus gros effectif ,10 et 11
b) Données réparties par classes

 La classe modale est la classe qui a le plus gros effectif, c'est à dire la classe
[0 ; 15[.

I.3- Quartiles, déciles :


 On appelle quartiles de la série un triplet de réels (Q 1 ; Q 2 ; Q 3) qui sépare la
série en quatre groupes de même effectif.
 Le 1er quartile Q1 est la plus petite valeur telle que 25% des données lui soit
inférieures ou égales.
 Le 3 ème quartile Q3 est la plus petite valeur telle que 75% des données lui soit
inférieures ou égales.

Remarque :
 Les trois nombres Q1, méd, Q3 partagent la série en 4 parts égales (à une unité
près)
 Q2≈ mé
 Si les données ont été réparties en classes, on ne peut déterminer la médiane
exacte. En revanche, on appellera classe médiane, la classe qui la contient (et
permet donc d'en donner un encadrement).
 L'intervalle [Q1 ; Q3] s'appelle l'intervalle interquartile.
 Le nombre Q3 – Q1 s'appelle l'écart interquartile.
Comment déterminer les quartiles Q1 et Q3 d'une série de N valeurs ?
1
On calcule la quantité ¼ de N = ×N =N: 4
4
Deux cas sont possibles: soit le résultat est entier (la division tombe juste), soit non
Cas n°1: le résultat est entier (la division tombe juste)
- on vérifie que les valeurs sont rangées par ordre croissant
- Q1 est la n ème valeur où n = N: 4
3
- Q3 est le n' ème valeur où l'entier n' = ¾ de N = ×N = 3×N : 4
4
Exemple :
Prenons les valeurs rangées dans l'ordre croissant :
1-3-3-3-5-5-6-7-7-8-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19
Il y a N = 28 valeurs, qui est divisible par 4 car 28:4=7 qui est entier
n=N: 4 = 7 donc Q1 = la 7ème valeur de la série rangée dans l'ordre croissant= 6
et n' = 3N:4 = 21 donc Q3= la 21ème valeur de la série rangée dans l'ordre croissant= 13
Cas n°2: le résultat n'est pas entier
- on vérifie que les valeurs sont rangées par ordre croissant
- on arrondit le décimal N:4 à l'entier supérieur : l'entier n ; Q1 est la n ème valeur
3
- on arrondit le décimal ¾ de N = ×N = 3N:4 à l'entier supérieur : l'entier n' ; Q 3 est
4
la n' ème valeur.
Exemple :
Prenons les valeurs rangées dans l'ordre croissant :
3-5-5-6-7-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19
Il y a N = 23 valeurs;
N:4 = 5,75 donc Q1 est la 6ème valeur de la série rangée dans l'ordre croissant donc Q 1=
8,
3N:4 = 17,25 donc Q3 est la 18 ème valeur de la série rangée dans l'ordre croissant donc
Q3= 13.
Comment interpréter des quartiles donnés?
Si on connait les quartiles Q1 et Q3 d'une série, que peut-on en déduire?
Au moins un quart (25%) des valeurs sont inférieures ou égales à Q1.
Au moins trois quarts (75%) des valeurs sont inférieurs ou égales à Q3.
Environ la moitié des valeurs se trouvent dans l'intervalle interquartile [Q1 ; Q3].
Exemple:
Dans une classe, les notes présentent un premier quartile Q 1 égal à 10 et un troisième
quartile égal à 14. On peut dire que:
Au moins un quart des élèves à une note inférieure ou égale à 10
Au moins un quart des élèves a pour note 10 ou moins de 10
En pratique: environ un quart des élèves a moins de 10, (et environ trois quarts des élèves ont
plus)
Au moins trois quarts des élèves a une note inférieure ou égale à 14
Au moins trois quarts des élèves a pour note 14 ou plus de 14
En pratique: environ trois quarts des élèves a moins de 14, (et environ un quart des élèves ont
plus)
L'intervalle interquartile est l’intervalle] 10 ; 14[.
Environ la moitié des élèves a une note entre 10 et 14.
Diagramme en boites :
La médiane comme paramètre de position et l'intervalle interquartile comme
paramètre de dispersion fournissent une bonne description d'une série statistique.
On utilise ces deux données pour construire un diagramme en boîte de la série
Soit une série de valeurs qui se résume en:
- le minimum Min = 1
- le 1er quartile Q1 = 6
- la médiane Me = 9,5
- le 3ème quartile Q3 = 13
- le maximum Max = 19
Ces 5 données permettent de construire un diagramme en boites :

Déciles :
Les déciles permettent de séparer une série statistique en dix groupes de même
effectif (à une unité près).
Un dixième des valeurs sont inférieures au premier décile D1.
Un dixième des valeurs sont supérieures au neuvième décile D9.
Comment déterminer les déciles D1 et D9 d'une série de N valeurs ?
1 1
On calcule la quantité de N = ×N =N: 10
10 10
Deux cas sont possibles: soit le résultat est entier (la division tombe juste), soit non
Cas n°1: le résultat est entier (la division tombe juste)
- on vérifie que les valeurs sont rangées par ordre croissant
- D1 est la n ème valeur où n = N: 10
9 9
- D9 est le n' ème valeur où l'entier n' = de N = ×N = 9×N : 10
10 10
Exemple
Prenons les valeurs rangées dans l'ordre croissant :
1-3-3-3-5-5-6-7-7-8-8-8-9-9-10-10-10-10-11-11-12-12-13-13-13-13-14-15-16-19
Il y a N = 30 valeurs, qui est divisible par 10 car 30:10=3 qui est entier
n=N: 10 = 3 donc D1 est la 3ème valeur de la série rangée dans l'ordre croissant donc D 1 = 3=
et n' = 9N:10 = 27 donc D 9 est la 27ème valeur de la série rangée dans l'ordre croissant donc
D9= 14
Cas n°2: le résultat n'est pas entier
- on vérifie que les valeurs sont rangées par ordre croissant
- on arrondit le décimal N:10 à l'entier supérieur : l'entier n ; D 1 est la n ème valeur -
9
on arrondit le décimal 910 de N = ×N = 9×N :10 à l'entier supérieur : l'entier n' ;
10
D9 est la n' ème valeur
Exemple
Prenons les valeurs rangées dans l'ordre croissant :
3-5-5-6-7-8-8-9-9-10-10-10-10-11-11-12-13-13-13-14-15-16-19
Il y a N = 23 valeurs;
N:10 = 2,3 donc D1 est la 3ème valeur de la série rangée dans l'ordre croissant donc D 1= 5
9N:10=20,7 donc D9 est la 21 ème valeur de la série rangée dans l'ordre croissant donc D9= 15
Comment interpréter des déciles donnés?
Si on connait les déciles D1 et D9 d'une série, que peut-on en déduire?
Au moins un dixième (10%) des valeurs sont inférieures ou égales à D1.
En pratique: environ 10% des valeurs sont inférieurs à D1
Au moins neuf dixièmes (90%) des valeurs sont inférieures ou égales à Q3.
En pratique: environ 10% des valeurs sont supérieurs à D9
Diagramme en boites :
D1 D9
9
II- Caractéristiques de dispersion :

II.1- Étendue :
Il s’agit de la première mesure de la dispersion d’une série statistique. Son principal
mérite a longtemps été d’exister, et de fournir une information sur la dispersion très
simple à obtenir.
Soit X une série statistique discrète. On appelle étendue de la série le réel, défini par
Etd(X) = max(X) −min(X).

II.2- Intervalle interquartile :


On appelle intervalle interquartiles l’intervalle [Q 1 ; Q 3].
L’amplitude de cet intervalle est appelée écart interquartiles.

II.3- Variance d’une série statistique :


La variance d’une série statistique est le nombre noté V (x) obtenu comme moyenne
des carrés des écarts constatés par rapport à la moyenne de la série :

Remarque
Cette formule s’applique bien sûr au cas d’une série statistique sans coefficients : on
est ramené à une série pour laquelle tous les coefficients valent 1.

II.4- Écart-type d’une série statistique :


L’écart-type d’une série statistique X, noté σ(X), est la racine carrée de la variance de
cette série :

Propriété :
La variance et l’écart-type présentent les propriétés suivantes :
© La variance et l’écart-type sont des nombres positifs ou nuls,
© Une variance nulle ou un écart-type nul signifient que toutes les valeurs de la série
son égales à sa moyenne,
© Plus la variance (ou l’écart-type) d’une série est grande, plus cette série est
dispersée autour de sa moyenne,

Vous aimerez peut-être aussi