Académique Documents
Professionnel Documents
Culture Documents
Chap2 Statistique L1... Lagrange
Chap2 Statistique L1... Lagrange
1 . Ca r a c t é r i s t i q u e s de t e n da n c e c e nt r a l e
1 . 1 L e s m o ye n n e s
1 . 1 . 1 M o ye n n e a r i t h m é t i q ue
p p
1
x
n
n i x i fi x i
i1 i1
où x 1, x 2 ,, x p sont les valeurs observées (ou les centres des classes
si la distribution est groupée), n1, n 2 ,, n p sont les effectifs
correspondants, f1, f 2 ,, fp sont les fréquences correspondantes
ni p
fi et n ni .
n i1
Propriété
y ax b
Démonstration
1 p 1 p
y
n i1
ni y i
n
n i a x i b
i1
p
1 1 p
a . ni x i b . ni
n i1 n i1
a.x b
E x e r c i c e d’ a pp l i c a t i o n
Mathématiques 10 2 20
Economie 14 4 56
Statistique 12 2 24
Langues 8 1 8
Total n9 108
1 4 108
x
n
ni x i 9
12
i 1
10 14 12 8 44
x 11
4 4
1 . 1 . 2 M o ye n n e g é om é t r i qu e
On la note généralement G.
Ainsi :
1
n n
G n x 1 x 2 x 3 x n x i
i1
n
avec xi x1 x 2 x 3 x n
i1
1
p ni n
p
G xi xifi
i 1 i 1
ni p
a ve c fi
n
et n ni .
i1
p
1
log G
n
n i log x i
i1
i 1, 2 , , p si x i 0 , o ù l o g e s t l e l o g a r i t h me n é p é r i e n .
Exercice d’application
xi ni
2 2
16 1
Total 3
Corrigé
G 2 2 16 1 1/3
64
1/3
4
O n p e u t a u s s i p a s s e r a u x l o g a r i t h me s :
1
log (G) log( 64) 1,38629
3
De la relation précédente, on tire
G exp(1,38629 ) 4 .
1 . 1 . 3 . M o ye n n e ha r m o ni q u e
Ainsi :
1 n
H
1 n 1 n 1
n i 1 x i
x
i 1 i
ou
1 1 n 1
H n i 1 x i
p
ni
1
H i 1
p p
n f
xii xii
i 1 i 1
Corrigé
2d 2d 2
VM
t1 t 2 d d 1 1
V1 V2 V1 V2
2
VM 4 km/h
1 1
3 6
n
Q 1
n xi2
i 1
1
p
2 2
ni x i 1
p
2 2
Q i 1 fi x i
p
i 1
i
n
i 1
Remarque : Soit une série pour laquelle les quatre moyennes définies
ci-dessus existent, on a alors :
H G x Q
1, 2, 5, 7, 10, 13.
Corrigé
1) Moyenne arithmétique
1 n
x x i 1 2 5 7 10 13
1
n i 1 6
1
38 6,33
6
2) Moyenne géométrique
1
n n
1 2 5 7 10 13 6
1
G x i
i 1
9100 6 4,57
1
3) Moyenne harmonique
n 6
H
n 1 1 1 1 1 1
1
xi
2 5 7 10 13
i 1
2,97
4) Moyenne quadratique
Q
1 n 2
xi
n i1
1 2
6
1 2 2 5 2 7 2 10 2 13 2
58 7,61
On vérifie : H G x Q
FQ
100
a) La médiane
Q1 Q2 Q3
c) Les déciles
D1 D5 D9
10% 10%
d) Les centiles
C1 C2 C 98 C 99
1% 1%
a) Cas discret
Fi
Fx i 1
%
Fx i
x i 1 xi x i 1
Exemple d’application
xi 0 1 2 3 4 5 6 7 8
ni 6 9 13 16 10 12 10 4 3
xi 9 10 et plus
ni 5 12
xi fi Fi
0 0,06 0,06
1 0,09 0,15
2 0,13 0,28
3 0,16 0,44
4 0,10 0,54
5 0,12 0,66
6 0,10 0,76
7 0,04 0,80
8 0,03 0,83
9 0,05 0,88
10 0,12 1,00
1) Détermination de la médiane
44 % < 50 % < 54 %
Fx i < 50 % < Fx i 1
F3 < 50 % < F4
2) Calcul de Q1
15 % < 25 % < 28 %
Fx i < 25 % < F x i 1
F1 < 25 % < F2
3) Calcul de Q 3
66 % < 75 % < 76 %
Fx i < 75 % < F x i 1
F5 < 75 % < F6
F(b) ---------------------------------------------------
- ---------------------------
F(a) -----------
a Q b
a < Q < b
% - - - - - - - - - - - - - - -
0,5 - - - - - - - - - -
Me Q
Cours de statistique descriptive
Chapitre 2 : Série statistique à un caractère
Responsable matière : Fodiyé Bakary DOUCOURE
13
FASEG – UCAD – 2015 – Plateforme d’enseignement à distance
Prime en F ni f i en % Fi en %
[0,1000[ 18 2,1 2,1
[1000,2000[ 44 5,1 7,2
[2000,3000[ 112 13,0 20,2
[3000,3500[ 120 14,0 34,2
[3500,4000[ 138 16,0 50,2
[4000,4500[ 164 19,1 69,3
[4500,5000[ 106 12,3 81,6
[5000,6000[ 98 11,4 93,0
[6000,7000[ 52 6,0 99,0
[7000,8000[ 8 1,0 100
Total 860 100,0
Q1 3000 25 20,2
3500 3000 34,2 20,2
25 20,2
Q1 3000 500 3171,43
34,2 20,2
3500 Q2 4000
34,2 50 50,2
Q 2 3500 50 34,2
4000 3500 50,2 34,2
50 34,2
Q 2 3500 500 3993,75
50,2 34,2
4500 Q3 5000
69,3 75 81,6
Q3 4500 75 69,3
5000 4500 81,6 69,3
75 69,3
Q3 4500 500 4731,70
81,6 69,3
Exemple d’application
D’où on obtient :
3 3 7 7 9 9 18 37 37 37 39
5 éléments Me 5 éléments
La médiane est : M e 9 .
2) Le premier quartile
D’où on obtient 3 3 7 7 9
Q1
3) Le troisième quartile
D’où on obtient 18 37 37 37 39
Q3
1.3. Le mode
1.3.1. Définition
Le mode M o d’une distribution statistique est sa valeur la plus fréquente.
C’est la valeur du caractère qui correspond à l’effectif le plus grand
ou à la fréquence la plus importante. Le mode permet ainsi de
connaître la valeur la plus probable du caractère.
1.3.2. Détermination
xi 0 1 2 3 4 5
ni 6 9 13 16 10 12
xi 6 7 8 9 10 et plus
ni 10 4 3 5 12
2. Caractéristiques de dispersion
Les paramètres de dispersion sont des nombres qui mesurent la
dispersion des valeurs observées autour d’un paramètre de position
x , M e , . Ces paramètres permettent de comparer des séries
statistiques de même nature.
Remarque :
p
ni x i x
r
p
r X i1
fi x i x
r
n i1
avec :
p
1
x
n
ni x i
i1
On a :
mo 1
m1 X
m2 Q (moyenne quadratique)
o 1 , 1 0
Alors :
r IN r Y a r r X
Démonstration
y i y a x i b ( a x b)
a ( xi x )
On a :
1 p
r Y n i y i y
r
n i1
1 p
ni a x i x r
n i 1
p
r 1
a n i x i x r
n i 1
a r r X
p
ni x i x
2
p
Var X i1
fi x i x
2
n i1
Formule développée
1 p
Var X n i x i 2 x 2
n i 1
m 2 m12
Démonstration
1 p
Var X n i x i x 2
n i 1
1 p
ni x i 2 2 x x i x 2
n i 1
1 p 1 p 2 1
p
ni x i 2 x ni x i x
2
ni
n i 1 n i 1 n i 1
1 p
n i x i 2 2 x .x x 2 .1
n i 1
1 p
n i 1
ni x i 2 x 2
Propriété
Soit x i une série statistique et y i la série définie par y i a x i b , où
a et b sont deux réels quelconques, alors :
Notes Effectifs
[0, 5[ 4
[5, 10[ 17
[10, 15[ 26
[15, 20[ 3
Total 50
Réponse
Notes xi ni nixi ni x i 2
[0, 5[ 2,5 4 10 25
[5, 10[ 7,5 17 127,5 956,25
[10, 15[ 12,5 26 325 4062,5
[15, 20[ 17,5 3 52,5 918,75
Total 50 515 5962,5
a) Moyenne arithmétique :
1 4 515
x ni x i 10,3
n i 1 50
b) La variance est
1 p
Var X ni xi x 2
2
n i 1
5962,5
(10,3) 2
10
13,16
1 p
ni x i x
n i 1
Mais par construction cette moyenne des écarts à la moyenne est nulle.
Donc cette quantité ne peut être une mesure de dispersion, une façon de
contourner cette difficulté est de prendre les écarts en valeur absolue.
Remarque
e Me e x
xmin C1 D1 Q1 Q3 D 9 C 99 xmax
50 %
80 %
98 %
2.5.3 Etendue
Exercice d’application
Effectifs 9 15 22 29 17 6 2
Classes xi ni ni x i Fi en % ni x i x n i x i Me
[15,25[ 20 9 180 9 230,4 237,42
[25,35[ 30 15 450 24 234,0 245,70
[35,45[ 40 22 880 46 123,2 140,36
[45,55[ 50 29 1450 75 127,6 104,98
[55,65[ 60 17 1020 92 244,8 231,54
[65,75[ 70 6 420 98 146,4 141,72
[75,85[ 80 2 160 100 68,8 67,24
Total 100 4560 1175,2 1168,96
Q 3 Q1 55 35,45 19,55
1 7 4560
x
n i 1
ni x i
100
45,60
1 7 1175,2
e x ni x i x 11,75
n i 1 100
Me 46,38
1 7 1168,96
eMe n i x i M e 11,69
n i 1 100
3. Caractéristiques de forme
3.1 La dissymétrie
Dans ce cas on a : x Me Mo
Dans ce cas on a : x Me Mo
Dans ce cas on a : Mo Me x.
3 x M e
P2
3.2. L’aplatissement
Notes Effectifs
[0, 5[ 4
[5, 10[ 17
[10, 15[ 26
[15, 20[ 3
Total 50
Réponse
xi ni ni x i ni ( x i x ) 2 n i ( x i x )3 ni ( x i x ) 4
2,5 4 10 243,36 1898,208 14806,0224
7,5 17 127,5 133,28 373,184 1044,9152
12,5 26 325 125,84 276,848 609,0656
17,5 3 52,5 155,52 1119,744 8062,1568
Total 50 515 658 874,8 24522,16
On trouve :
Moyenne arithmétique :
1 4 515
x
n i 1
ni x i
50
10,3
1 4 658
2 ni ( x i x ) 2 13,2
n i 1 50
1 4 874,8
3 ni ( x i x ) 3 17,5
n i 1 50
1 4 24522,16
4 ni ( x i x ) 4 490,4
n i1 50
3 17,5
0,4
23 / 2 47,7
4 490,4
2,8
22 173,2
Effectifs 5 15 32 40 66 25 17
Corrigé
Fi en
xi ni fi en % yi n i yi ni z i2 ni z i3 ni z i4
%
Q 3 Q 2 Q 2 Q1
CD
Q 3 Q1
7,575 11,837
CD 0,22
19,412
90
2) On a : y 0,45
200
3 X 705,75
3
0,236
22 X
2994,412
4 X 113051,82
2,62
2 2 X 43160 ,0625
4. Caractéristiques de concentration.
4.1 Introduction
4.1.1 Domaine d’application
Une série statistique est dite concentrée si une faible proportion des
individus observés possède une forte proportion des valeurs globales.
Classes xi ni nixi q i en % Q i en %
[0,10[ 5 200 1000 4 4
[10,20[ 15 200 3000 12 16
[20,30[ 25 200 5000 20 36
[30,40[ 35 200 7000 28 64
[40,50[ 45 200 9000 36 100
1000 25000 100
ni x i i
qi 100 , Qi qj
i i
n x j 1
i
On calcule la médiale par interpolation linéaire.
Mle [30 , 40 [ car les valeurs globales relatives cumulées croissantes
dépassent 50 %.
30 Mle 40
36 50 64
Mle 30 50 36
40 30 64 36
50 36
Mle 30 10 .
64 36
Mle 35
4.2.2 Propriété
.
On peut montrer que l’on a toujours Mle > M e . L’écart Mle M e est
donc toujours positif. La comparaison des valeurs de la médiane et de
la médiale constitue une mesure de concentration
L’étendue W de la série étant fixée, on peut montrer que l’écart
Mle M e est d’autant plus grand que la série est concentrée. On
prend donc le rapport de à W pour mesurer la concentration.
Mle M e
E
W W
avec
W X max X min .
Cette courbe a été introduite par Gini en 1912, lors d’études sur les
salaires et les revenus. Elle a pour but de décrire les effets de la
concentration dans une population.
La courbe de concentration nécessite la détermination des fréquences
cumulées Fi .
On a donc :
0 Fi 1
i 1,2, , p
0 Q i 1
Qi Fi
0,04 0,20
0,16 0,40
0,36 0,60
0,64 0,80
1 1
Qi
Aire de
concentration
0,5 -
Courbe de
Gini
0 0,5 1 Fi
Qi
1-- A
0 1 Fi
On appelle aire de concentration l’aire S comprise entre la courbe de
concentration et la diagonale OA du carré.
p 1
G Fj .Q j 1 Fj 1.Q j
j 1
(p = nombre de classes).
p p
1
DM
2 n in j x j xi
n i 1 j 1
où DM
2
1
2 i j j
n n x xi
n i j
p 1
G Fj .Q j 1 Fj 1.Q j
j 1
Ainsi