Académique Documents
Professionnel Documents
Culture Documents
Paramètres statistiques
Les représentations graphiques ont permis une première synthèse visuelle de la
distribution des observations
Un paramètre statistique permet de résumer par une seule quantité numérique
une information contenue dans une distribution d’observations.
100 % - A %
Dispersi
2000 2000 2000
Tendance
1500 1500
Position
1500
on
centrale
1000 1000
A% 1000
0 0 0
0 N° individu 0 N° individu 0 N° individu
3
La moyenne
Population m (mean) Echantillon x (average)
1.1-Définition
La moyenne
intérêts et limites :
très utilisée en statistiques descriptive et inférentielle
souvent, pas toujours, la mesure la plus pertinente de la tendance centrale
1 n
x = xi
Série brute x1, x2, … ,
xn
n i=1
1 k
Série Valeurs de Effectifs Fréquences
la variable
x = nixi
groupée n i=1
x1 n1 f1= n1/n
… … …
xi ni fi= ni/n k
ni xi k
… … … = fi x i
xk nk fk= nk/n
i=1 n i=1
5
La moyenne
1 k k
x = n i x i fi x i
n i=1 i=1
6
La moyenne
Calcul de la moyenne simple
La moyenne
La moyenne
Calcul de la moyenne pondérée
La moyenne pondérée est égale au quotient de la somme
des valeurs par le nombre total de valeurs, en tenant compte du
nombre de réalisations de chacune des valeurs.
Moyenne arithmétique pondérée : x = nixi/N ou x = fixi
Exemple : voici les salaires relevés dans une entreprise.
Le salaire moyen est égal à : (1200x10) + (1600x20) + (2000x25) +
(2400x10) + (2800x10) /75= 1946.67
Moyenne pondérée des salaires mensuelles
Salaires (xi) ni nixi fi fixi
1200 10 12000 0,13 160
1600 20 32000 0,27 426,67
2000 25 50000 0,33 666,67
2400 10 24000 0,13 320
2800 10 28000 0,13 373,33
Total 75 146000 1946,67
Moyenne 1946,67 1946,67
9
La moyenne
Calcul de la moyenne dans le cas d’une variable continue
Pour chaque classe, on retiendra simplement le centre de classe
comme valeur pour réaliser les calculs.
CA [100 - 300[ [300 - 500[ [500 - 600[ [600 - 700[ [700 - 900[ Total
xi (centre de classe)
ni (nb succursales) 14 22 25 18 5 84
Xi x ni
10
La moyenne
à partir du tableau ci-dessous, on calcule le
chiffre d’affaires moyen mensuel des
succursales d’une grande enseigne :
41050/84 = 488.69.
CA [100 - 300[ [300 - 500[ [500 - 600[ [600 - 700[ [700 - 900[ Total
ni (nb succursales) 14 22 25 18 5 84
La moyenne
Population P1 Population P2
Effectif n2
Effectif n1
Moyenne x2
Moyenne x1
Population P = P1 U P2
Effectif n = n1+ n2
Moyenne x?
k
ni xi
x= 1 1 2 2
nx +n x Moyenne globale = moyenne des moyennes
n i=1 n
12
La moyenne
MOYENNES GEOMETRIQUE ET HARMONIQUE
Moyenne
géométrique
n1 n2 nk
G = x x .....x
n
1 2 k
Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance
moyen)
Moyenne n
harmonique H= k
ni
x
i=1 i
Utilisée dans le cas où l’on combine 2 variables sous forme de
rapport (pièces/heure, km/litre,…)
13
La moyenne
LA MOYENNE QUADRATIQUE
Une moyenne qui trouve des applications lorsque l'on a affaire a des phénomène
présentant un caractère sinusoïdal avec alternance de valeurs positives et de valeurs
négatives. Elle permet notamment de calculer la grandeur d'un ensemble de nombre.
Soit x1, ..., xi, ..., xr les r observations numériques d'une variable statistique X
et soit les effectifs respectifs n1, ..., ni, ..., nr de ces r valeurs numériques avec
:
i r i r
n x 2
... n x 2
... n x 2
1
Q2
1 1 i i
n1 ...ni ... nr
r r
N i 1
ni xi2 f i xi2
i 1
14
La moyenne
La moyenne
MOYENNES GEOMETRIQUE ex. 1
Les prix de l'immobilier ancien ont augmente ces
10 dernières années de la façon suivante :
En utilisant la moyenne arithmétique simple, on
obtiendrait une évolution moyenne de (9,2+
12,7+8,8+7,7+3,9+1,7+0,9+2,2+4,7+3,3) / 10 =
55,1 / 10 = 5,51 % mais ce résultat est faux compte
tenu de la relation entretenue par les taux d'une
année sur l'autre.
L'utilisation de la moyenne géométrique permet de
solutionner ce problème :
La moyenne
MOYENNES GEOMETRIQUE ex. 2
Dans un certain pays, au mois de janvier d’une
certaine année, les prix ont augmenté de 0,9 %,
puis en février de 1,2 %.
Déterminer l’augmentation mensuelle constante
qu’il y aurait dû avoir pendant les deux mois
pour obtenir le même résultat à l’issue des deux
mois.
17
La moyenne
MOYENNES HARMONIQUE ex.
Un automobiliste roule 100 km à la vitesse
constante de 90 km/h, puis encore 100 km à la
vitesse constante de 120 km/h.
Déterminer à quelle vitesse constante il aurait
dû rouler sur la distance totale pour que la durée
du voyage soit identique.
19
La moyenne
MOYENNES HARMONIQUE
20
La moyenne
LA MOYENNE QUADRATIQUE ex.
4 4 4 4
valeurs M valeurs valeurs valeurs
Intervalle
médian
M = milieu =
5,5
22
F(x) F(x)
xi ni Fi xi ni Fi
0 0
0 103 0,286 0 103 0,286
0,286 0,286
M 1 115 0,606 0, Intervalle 1 77 0,500
0,606 5 0,500 0,5
2 95 0,869 médian 2 95 0,764
0,764
3 35 0,967 0,869 M = milieu = 3 35 0,861
0,861
4 10 0,994
0,967 1,5 4 10 0,889
5 2 1 0,889
5 40 1
0,994
1
1
1 1
0,5 0,5
0 0
-2 -1 0 1 2 3 4 5 6 -2 -1 0 1 2 3 4 5 6
Intervalle médian
M
M = milieu = 1,5
24
5 0,68 0,6
0 0,50,5
[ 5 - 10 [ 0,920 0,4
10 0,92 0,3
30 0,993 M
[30 - 50 [ 1
50 1
M-3 0,5- 0,5 0,391
0,391 D'où M 3 5 3 3, 22
5-3 0,680 0,391
0,680-0,391
25
Le premier quartile est la valeur telle que 25% des observations aient une
valeur inférieure (Q1 = 51.25 ),
Le troisième quartile est la valeur telle que 75% des observations aient une
valeur inférieure (Q3 = 72.80 ),
Le deuxième correspond à la médiane.
0,9 0,9
1 0,8
0,75 0,7
0,75 0,6
0,5 0,5
0,5 0,4
0,3
0,2
0,2 0,1
MQ3D
0
0
-2 -1 0 1 2 3 4 5 6 -10 0 10 20 30 40 50 60
D2 M Q3 9
30
Le mode
Une distribution est unimodale si intérêts et limites :
elle présente un maximum marqué, et facile à déterminer
pas d'autres maxima relatifs. difficile à manipuler mathématiquement (pour
tester statistiquement des hypothèses)
La lecture s’effectue sur le diagramme
intérêt théorique : dans certains cas,
en bâtons ou l'histogramme. « bonne » manière de décrire la tendance
centrale
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6
Mode
900 1400
Mode
1900
Classe
2400
modale
2900 3500 ou plus...
Le mode
Attention ! Le mode est la seule mesure centrale qui peut être relevée et
! utilisée aussi bien pour des données qualitatives que quantitatives.
80
140
70
120
60
100
50
80
40
60
30
40 20
20 10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 4000 4500 ou
plus...
Le mode EX.1
Dans le cas d’une variable discrète
Le mode est une caractéristique de position, comme la moyenne, la
médiane ou les quantiles.
Il s’agit de la valeur la plus fréquente prise par la variable. C’est celle
pour laquelle on a le plus fort effectif.
Le mode EX.2
• S1 =
{3;3;5;5;6;6;7;7;8;8;8;9;9;10;10;11;12;12;13;13;1
3;13;13;13;14;14;16;17}
34
Le mode EX.2
• La note ≪ 13 ≫
apparait 6 fois.
Elle est, avec
une fréquence
relative de
(6/28)*100 =
21,4 % la note
la plus
representee de
la distribution.
Le mode Mo
est donc ici
égale a 13.
35
Le mode EX.3
Le mode EX.3
• Dans ce cas-ci,
deux modalites
presentent les
frequences les
plus elevees : les
notes ≪ 7 ≫ et
≪ 10 ≫ avec
toutes deux une
fréquence
relative de 16,6
% (5
occurrences
chacune).
• La distribution
comporte ici
deux modes,
Mo1 = 7 et
Mo2 = 10.
• On parle
alors de
distribution
bimodale.
37
Paramètres De Dispersion
Intervalle interquartile : IQ = Q3 - Q1
1 n
V = xi - x 1 k k
V = n i x i - x fi x i - x
2 2 2
1 k
V = n i x i2 x 2 = Moyenne des carrés - Carré de la moyenne
n i=1
Ecart-type : σ = V
39
Paramètres De Dispersion
L’étendue
L'étendue est la mesure la plus simple de la dispersion
(ou variabilité ou étalement) des observations faites sur
une variable.
L'étendue ne dépend que très indirectement de
l'ensemble des valeurs xi de la variable X.
L'étendue est très influencée par les valeurs extrêmes de
la variable statistique qui sont parfois aberrantes, ce qui
en fait une mesure peu utilisée.
40
Paramètres De Dispersion
L’étendue interquartile
De par la définition des quartiles, l’intervalle
interquartile [ Q1, Q3] contient 50 % des
observations.
Sa longueur, notée EIQ (Étendue InterQuartile), est
un indicateur de dispersion : EIQ = Q3 – Q1
Le calcul de l’étendue interquartile a l’avantage par
rapport à celui de l’étendue d’écarter les valeurs
extrêmes, souvent sans signification.
Plus généralement, les longueurs des fourchettes
définies par les déciles extrêmes, les centiles
extrêmes constituent des indicateurs de dispersion
contenant respectivement 80 % et 98 % des
observations.
41
Paramètres De Dispersion
La variance et l’écart-type
Soit X une variable statistique de distribution (xi, ni) où , on appelle variance
(mesure de dispersion ou de variabilité), notée, la moyenne arithmétique
pondérée des carrés des écarts à la moyenne arithmétique pondérée :
n x
1 1
n x
2 2
V ( x) x x
2
i i i i
N i N i
x V (x)
42
Paramètres De Dispersion
Exemple
Voici l’exemple des notes Notes des étudiants
Etudiant X Etudiant Y Etudiant Z
de 3 étudiants. 0 7 12
0 6 12
0 15 12
0 13 12
20 4 12
20 18 12
20 20 12
20 16 12
20 12 12
20 9 12
Max 20 20 12
Min 0 4 12
intevalle de
20 16 0
variation
moyenne 12 12 12
variance 96 26 0
écart-type 9,80 5,10 0
43
Paramètres De Dispersion
Exemple
Voici l’exemple des notes Notes des étudiants
Etudiant X Etudiant Y Etudiant Z
de 3 étudiants. 0 7 12
0 6 12
0 15 12
0 13 12
20 4 12
20 18 12
20 20 12
20 16 12
20 12 12
20 9 12
Max 20 20 12
Min 0 4 12
intevalle de
20 16 0
variation
moyenne 12 12 12
variance 96 26 0
écart-type 9,80 5,10 0
44
Paramètres De Dispersion
Exemple avec un
regroupement
par classes Dépenses mensuelles en emplois à domicile
Dépense en centre de
Effectifs nici ni(ci-X)2
euros classe (ci)
[300; 400[ 5 350 1750,00 309530,90
[400; 500[ 60 450 27000,00 1328656,46
[500; 600[ 15 550 8250,00 35735,54
[600; 700[ 95 650 61750,00 248944,16
[700; 800[ 30 750 22500,00 685756,80
[800; 1000[ 5 900 4500,00 453578,51
Total 210 125750,00 3062202,38
Moyenne (X) 598,81
variance 14581,92
écart-type 120,76
coeff. Var. 0,58
Source : B. PY (2007)
45
Paramètres De Dispersion
Exemple avec un
regroupement
par classes Dépenses mensuelles en emplois à domicile
Dépense en centre de
Effectifs nici ni(ci-X)2
euros classe (ci)
[300; 400[ 5 350 1750,00 309530,90
[400; 500[ 60 450 27000,00 1328656,46
[500; 600[ 15 550 8250,00 35735,54
[600; 700[ 95 650 61750,00 248944,16
[700; 800[ 30 750 22500,00 685756,80
[800; 1000[ 5 900 4500,00 453578,51
Total 210 125750,00 3062202,38
Moyenne (X) 598,81
variance 14581,92
écart-type 120,76
coeff. Var. 0,58
Source : B. PY (2007)
46
Paramètres De Dispersion
Exemple
Paramètres De Dispersion
Exemple
4,41 2,1
48
Paramètres De Dispersion
Le coefficient de variation
L'ecart-type, malgré sa pertinence dans la mesure de la dispersion
d'une distribution, possède un inconvénient majeur: il est exprime dans
l'unité de la variable a laquelle il se rapporte. Il est alors impossible de
comparer les dispersions de deux ou davantage distributions ayant un
lien entre elles (lien de causalité ou autre) et dont les valeurs s'expriment
dans des unîtes différentes.
Le coefficient de variation est une mesure de dispersion des
observations d'une variable quantitative d'intervalle qui permet de
s'affranchir de la notion d'unité et ainsi de comparer la dispersion de
différentes distributions.
x
cv
x
49
Paramètres De Dispersion
Le coefficient de variation
Exemple :
• considérons la surface des
logements dits de petite taille (1 a
3 pièces) a celle des logements
dits de
• grande taille (4 pièces et plus).
• Calculer les coefficients de
• Pour le groupe de logements de 1,
variation respectifs
2 et 3 pièces nous obtenons :
Paramètres De Dispersion
Le coefficient de variation
Exemple :
• A première vue, et en • On note que le coefficient de
examinant seulement les variation des logements de
écarts types, on pourrait petite taille est plus élève que
conclure que la dispersion de celui des logements de grande
la surface taille. Contrairement a ce que
• des logements de grande taille laissait penser les écart-type
est plus élevée que celle des calcules, la dispersion pour le
petits logements. Le calcul des groupe des petits logements
coefficients de est plus élevée que celle des
grands logements.
• variation respectifs montre
qu'il n'en est rien :
51
Paramètres De Dispersion
Comment faire la variance de plusieurs populations ?
Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Variance V1 Variance V2
Population P = P1 U P2
Effectif n = n1+ n2
Moyenne x
Variance V ?
1 k 1 k
V = n i Vi + n i x i -x
2
n i=1 n i=1
Variance globale = Moyenne des variances + Variance des moyennes
52
PROPRIETES IMPORTANTES
DE LA MOYENNE ET DE LA VARIANCE
xi yi = a x i + b
Exercice 1
• Pour les deux séries suivantes, calculer la
moyenne, la médiane, les deux quartiles et
l’étendue.
54
Exercice 1 (correction)
55
Exercice 2
Exercice 2 (correction)
57
Exercice 3
• Avant de rendre les copies à ses élèves, un professeur a fait quelques calculs
statistiques à partir de la série de leurs notes :
• moyenne : 11
• médiane : 12
• 1 er quartile : 9
• 3 ème quartile : 13
• note minimale : 4
• note maximale : 15
• On sait de plus qu’il y a 24 élèves dans la classe. Répondre par vrai ou faux
aux affirmations suivantes
Exercice 3 (correction)
Représentation graphique de la série
CA et spots publicitaires pour le
magasin Truc
Nombres de CA en
Semaines spots centaines de
publicitaires dollars
1 2 50
2 5 57
3 1 41
4 6 54
5 5 54
6 1 38
7 6 63
8 3 48
9 4 59
10 7 65
Source : adapté de Anderson et alii ( 2001)
59
Représentation graphique de la série
70
CA en centaines de $
60
50
40
30
20
10
0
0 2 4 6 8
Nombre de spots publicitaires
60
Représentation graphique de la série
61