Vous êtes sur la page 1sur 16

SOMMAIRE SOMMAIRE

(*) WWW.SEGBM.NET
Gnralits :................................................................................................................................ 3
I. Dfinitions : .................................................................................................................... 3
II. Apport de la statistique aux conomistes : ..................................................................... 3
III. Les limites de la mthode statistique : ........................................................................... 3
IV. Le vocabulaire utilis en statistique : ............................................................................. 4
V. Quelques symboles mathmatiques utiliss : ................................................................. 6
Chapitre I : La reprsentation graphique.................................................................................... 7
I. Le diagramme en btons : .............................................................................................. 7
II. Le tuyau dorgue : .......................................................................................................... 7
III. Le diagramme :............................................................................................................... 8
IV. Le polygone des frquences : ......................................................................................... 8
V. La courbe cumulation (courbe des f cumuls) : ............................................................. 9
VI. Le diagramme polaire : ................................................................................................ 10
VII. Les graphiques secteurs : ........................................................................................... 12
Chapitre II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE........................... 13
INTRODUCTION.................................................................................................................... 13
SECTION 1 .............................................................................................................................. 13
I. LES MOYENNES....................................................................................................... 13
II. La mdiane (Me) .......................................................................................................... 24
III. Le Mode : ................................................................................................................. 26
IV. Le choix dune caractristique de tendance centrale :.............................................. 28
SECTION 2 .............................................................................................................................. 29
I. Lintervalle de variation ou ltendue : ........................................................................ 29
II. Lintervalle inter quartile : ........................................................................................... 30
III. Lcart absolu moyen : ............................................................................................. 32
SECTION III ............................................................................................................................ 34
I. La dtermination algbrique de la concentration ......................................................... 34
II. La dtermination graphique de la concentration la courbe de Lorentz GINI............... 36
Chapitre III :Les Sries double entres : Rgression Linaire (Corrlation) ........................ 38
I- notion de tableau de contingence : ............................................................................... 38
II- gnralisation du tableau de contingences : ................................................................. 39
III- La rgression linaire ................................................................................................... 40
IV- la corrlation linaire :.................................................................................................. 44
Chapitre IV : Analyse des sries chronologiques. .................................................................... 48
I Gnralits : .................................................................................................................... 48
II lanalyse de la tendance longue : trend .................................................................... 49
CHAPITRE V :Populations et chantillons, recensements et sondages .................................. 50
I. Quelques termes de base : ............................................................................................ 50
II. Exemples: ........................................................................................................ 51
III. tapes d'une enqute statistique : .................................................................... 51
EXERCICES ............................................................................................................................ 53
STATISTIQUE DESCRIPTIVE
Page 3
Statistique descriptive
GENERALITES :
I. Dfinitions :
- On appelle statistique la mthode scientifique qui vise observer, collecter,
analyser des donnes quantitatives.
- La statistique descriptive est la partie de la statistique qui sert dcrire un
phnomne, c--d de mesurer, classer les mesures, prsenter ces mesures par
quelques indicateurs de manire donner une ide simple et rapide dun phnomne
tudi.
Les statistiques se sont des donnes chiffres relatives un phnomne tudi.
EX : des statistiques du chmage.
II. Apport de la statistique aux conomistes :
La statistique est un outil indispensable tant aux thoriciens quaux praticiens de
lconomie.
1. La statistique est utile aux thoriciens :
- Elle permet de mettre en vidence (rvler) lexistence dinterdpendance entre
diffrents phnomnes conomiques. EX : M=P*T
- Elle permet de tester la validit dune hypothse thorique.
Investissement = f (revenu) =0.76R+124
Consomm
Revenu thsauris
Epargn
Investi
2. La statistique est utile aux praticiens de lconomie :
- La statistique permet aux entrepreneurs de mieux contrler la gestion de leurs
entreprises.
- Elle permet galement au pouvoir public de mieux dfinir leurs politiques
conomique, fiscale, montaire et demploi.
III. Les limites de la mthode statistique :
Pour viter des erreurs dinterprtation due une mauvaise utilisation statistique, il
faut savoir :
1. La statistique sintresse au grand nombre, elle ignore les cas particuliers.
2. La rsultante dun grand nombre dinformations peut tre diffrente de la
sommation de ces diffrentes informations.
*comportement collectif # sommation des comportements individuels
3. Quand on tudie un phnomne on nest jamais certain que lon dispose de
toues les informations le concernant.
STATISTIQUE DESCRIPTIVE
Page 4
4. Il ne faut pas oublier que la statistique nest quun outil au service de
lconomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse
conomique des rsultats.
- Les mmes causes # les mmes effets.
- Les corrlations mmes trs parfaites ne signifient pas toujours
quil y a interdpendance entre les phnomnes tudis.
IV. Le vocabulaire utilis en statistique :
1. Population statistique :
Ensemble sur lequel porte ltude
Ex : Age des tudiants de 1
re
anne : lensemble tudi cest lge.
2. Unit statistique :
Une population se compose dlments chaque lment est appel
unit statistique.
EX : la population dtudiants : lunit statistique est un tudiant.
3. Caractre statistique :
Cest le critre retenu pour tudier une population
Continu
Il peut tre quantitatif discontinu, discret
Qualitatif
Un caractre est dit quantitatif lorsquil est mesurable
Continu : cest un caractre qui peut prendre toutes les valeurs
dun intervalle donn.
EX : ge
Discontinu : cest un caractre qui ne peut prendre que quelques
valeurs dans un intervalle donn
EX : le nombre des frres, Mnage
Un caractre est dit qualitatif lorsquil nest pas mesurable
EX : la nationalit, les catgories sociales professionnelles.
4. Modalit statistique : de caractre :
On appelle une modalit les diffrentes situations possibles dun caractre.
EX : caractre sexe : modalits possibles : M/F
Caractre tat matrimonial : 4 modalits possibles :
clibataire/mari/divorc/veuf.
STATISTIQUE DESCRIPTIVE
Page 5
5. Effectifs (frquences absolues) :
Cest le nombre dunits statistiques relatif une modalit donne :
Effectifs
6. Frquence relative :
Cest la part des effectifs dune modalit.
EX : 200/600=33/100 est la frquence relative de premire modalit
7. Srie statistique :
Distribution de frquences, distribution de statistiques ou tableau statistique,
cest un tableau qui nous donne lensemble des valeurs mesurant le caractre.
EX :
Srie simple.
Srie avec des classes.
8. Classes :
On appelle classe un groupement de valeurs du caractre selon des intervalles
qui peuvent tre gaux ou ingaux.
Pour chaque classe on peut dfinir :
Une limite infrieure
Une limite suprieure
Intervalle de classe (amplitude)= limite (sup)- limite (inf)
Centre de classe = [limite (sup) + limite (inf)]/2
NB : [40-60[ signifie quon comptabilise les salaris qui gagnent entre 40 et 60DH,
en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.
45Age Effectifs
17-18
18-19
19-20
200
350
50
total 600
sexe Effectifs
Masc.
Fm.
200
100
total 300
Nombre
denfants
Arbre de
mnages
2
3
4
5
18
28
10
4
total 60
Salaires (dh) Effectifs
[40-60[
[60-70[
[70-80[
10
25
05
total 40
STATISTIQUE DESCRIPTIVE
Page 6
V. Quelque symboles mathmatiques utiliss :
1. Les valeurs du caractre = x1, x2,, xi,, xn
Notes Nombre dtudiants
x1
x
2
x
3
x4
10 x1
25 x
2
12 x
3
4 x4
2. Les effectifs sont symboliss par : x
1
, x
2
,, x
i
,, x
n
x1, x2,, xi,, xn= N =effectif total
3. Frquence relative :
F
i =
effectif de la modalit i / effectif total
4. Loprateur somme (

)
Notation : n variables
x
1
+ x
2
++ x
i
+.+ x
n
=

=
n
i
xi
1
Proprits :

= =
=
n
i
n
i
xi a axi
1 1

=
+ = = +
n
i
n
i
xi a n xi a xi a
1
.
5. Lopration de produit : (
[
)
Notation : le produit de x variable scrit :
X
1
.x
2
.x
3
.x
n
=
[
=
n
i
xi
1
Proprit :
a a
n
i
=
[
=1
n
a xi a
n
i
=
[
=1
n
[
=
n
i
xi
1
STATISTIQUE DESCRIPTIVE
Page 7
CHAPITRE I : LA REPRESENTATION GRAPHIQUE
Lintrt dun graphique cest de synthtiser des informations statistiques dune
manir image, cest dire globale.
I. Le diagramme en btons :
On sen sert pour reprsenter des sries caractre discret.
Cordonn
40 .
30 .
20 .
10 .
. . . . . . .Les valeurs de
0 1 2 3 4 5 6 caractre
Abscisse
II. Le tuyau dorgue :
On se sert de ce graphique pour reprsenter des sries caractre qualitatif
EX : La population une station balnaire est compose de :
Allemands : 45%
Franais : 30%
Espagnoles : 15%
Autres : 10%
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
Allemands Franais Espagnoles Autres
Srie1
Nombre denfants Nombre de mnage
0
1
2
3
4
5
25
42
38
15
6
Total 128
STATISTIQUE DESCRIPTIVE
Page 8
III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont
regroupes en classe.
a. Cas ou les intervalles de classe sont gaux :
0%
5%
10%
15%
20%
25%
30%
35%
40%
45%
50%
1
Allemands
Franais
Espagnoles
Autres
Remarque :
1) Lorsque une des limites de classe nest pas prcise dans un tableau il
convient de prendre comme intervalle de classe le mme que celui de la classe
suivante ou prcdente.
2) La surface des rectangles est proportionnelle leur effectif.
b. Cas ou les intervalles de classe ne sont pas gaux :
EX : Rpartition de population selon leurs salaires.
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9
Srie1
Pour tracer lhistogramme, on commence par corriger les effectifs.
IV. Le polygone des frquences :
Il permet de donner une image plus lisse du phnomne que lhistogramme. On
lobtient en joignant les milieux des sommes des rectangles de lhistogramme.
STATISTIQUE DESCRIPTIVE
Page 9
. . . . . . . .
0 10 20 30 40 50 60
Remarque :
1) La surface sous le polygone = la surface de lhistogramme.
2) Lorsquil y a un trs grand nombre de classe, lintervalle de classe devient de
plus en plus petit et le polygone de frquences se transforme en cours de frquence.
Courbe de frquences
V. La courbe de cumulation (courbe des f cumuls) :
Elle permet de connatre le nombre dobservations suprieures ou infrieures une
valeur donne.
Les 2 types de courbes de cumulation :
Courbe cumulative croissante : permet de connatre le nombre
dobservations infrieures une valeur donne.
Courbe cumulative dcroissante : il permet de connatre le nombre
dobservations suprieures une valeur donne.
a) Cas dune variable continue :
Salaire xi Xi cumuls Xi cumuls
[10-20[
[20-30[
[30-40[
[40-50[
[50-60[
[60-70[
9
13
22
10
7
4
9
22
44
54
61
65
65
56
43
21
11
4
Total 65 Moins de la borne
suprieure
Plus de la
borne
infrieure
STATISTIQUE DESCRIPTIVE
Page 10
Remarque :
On obtiendrait le mme graphique si on remplace les frquences absolues par les
frquences relatives (les pourcentages)
Courbe cumule dcroissante
Courbe cumule croissante
0
10
20
30
40
50
60
70
1 2 3 4 5 6 7
b) Cas dune variable discrte (discontinue)
NB denfants (xi) NB de mnage Xi cumuls Xi cumuls
1
2
3
4
5
10
30
20
5
15
45
65
65
60
50
20
Total 65 <=xi >=xi
Xi
65
40
20
10
Xi
0 1 2 3 4 5
VI. Le diagramme polaire :
On lutilise pour reprsenter des sries chronologiques cest dire des sries ou
les observations seront des temps rguliers.
STATISTIQUE DESCRIPTIVE
Page 11
a) Les principes des coordonnes polaires : un point M dans lespace est
parfaitement repr :
Si on connat ses coordonnes cartsiennes (x, y).
Si on connat ses coordonnes polaires (e, o).
Y M
e
O
X
b) Le diagramme polaire :
Soit la srie chronologique suivante : chiffre daffaire mensuel
Lide est de prsenter chaque mois par un
axe, nous aurons donc 12 axes, chaque axe
faisant avec son voisin un angle.
Avr
.
30 .
20 .
10 .
Juillet . . . . . . . . .. . . . . . . . . . . . . Jan
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
10 .
20.
30.
Oct.
Anne 1999 2000
Janvier
Fvrier
Mars
Avril
Mai
Juin
Juillet
Aot
Septembre
Octobre
Novembre
dcembre
55
53
65
50
43
41
35
30
34
40
45
55
65
75
72
40
42
38
32
34
38
40
33
45
STATISTIQUE DESCRIPTIVE
Page 12
VII. Les graphiques secteurs :
On les utilise pour reprsenter une srie exprime en pourcentages.
EX : Pourcentage de touristes.
FR
All
Esp
Autres
STATISTIQUE DESCRIPTIVE
Page 13
CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES
DUN SERIE
INTRODUCTION
Avec la reprsentation graphique nous avons vu comment synthtiser une srie avec
image.
Dans ce chapitre nous allons voir comment synthtiser une srie par quelques chiffres.
Ces nombres sont appels caractristiques dune srie.
Soit les srie suivantes :
Serie1 : 78-79-80-83
Srie2 : 60-70-80-90-100
Srie3 : 1-1-1-1-396
Les sries ont toutes la moyenne 80 mme si elles sont trs diffrentes les unes que les autres.
Les valeurs de la 1
re
srie sont proches de la moyenne alors que celles de la 3me sont
loignes de la moyenne.
Il y a donc ncessit, pour rsumer une srie de donnes de la prsenter en 2 types de
caractristiques :
- les caractristiques de valeurs centrales.
- les caractristiques de dispersion.
SECTION 1 : Les Caractristiques de Valeur Centrale :
I. LES MOYENNES
A- La moyenne arithmtique :
A-1 Dfinition
Etant donne n observations quon va appeler X1,X2 ,X3,Xi,Xn on
appelle une moyenne arithmtique simple le nombre X
n
x x x x
n i
+ + + + +
= X
...... .......
2 1
Somme de toutes les observations
X=
Le nombre dobservations
STATISTIQUE DESCRIPTIVE
Page 14
: Une moyenne arithmtique simple
Lorsque les observations sont groupes c'est--dire que lon observe
N1 fois X1
N2 fois X2
La moyenne arithmtique scrit :
n
n n n
x x x x
+ + +
+ + + + +
= X
....
...... .....
2 1
2 2 1 1
Une moyenne arithmtique pondre
A-2 Application
Exercice1 : soit la srie de notes suivante : 2-6-12-10-12-10-10-6
5 , 8
8
68
8
6 10 10 12 10 12 6 2
= X
=
+ + + + + + +
= X
Exercice2 : soit la srie des notes de lexercice qui peut tre prsente de la
manire suivante :

=
= X
= = X
i
n
i
i i
n
x n
1
5 , 8
8
68
Notes xi Effectifs ni ni xi
2
6
10
12
1
2
3
2
2
12
30
24
total 8 68
n
x
n
n i
i
=
= X

=
=
= X
n
i
i
n
n i
i i
n
x n
1
STATISTIQUE DESCRIPTIVE
Page 15
Exercice3 : soit les srie suivante :
rpartition selon lage
85 , 35
88
3155
= = X Annes
Moyenne de lage ou lage moyen
a-3 Mthode des simplifications des calculs
Lorsque les calculs sont compliqus, on peut les simplifier en prcdant un
changement de variable
Par changement dchelle : Tout variable Xi peut scrire : Xi= a Xi
a= nouvelle chelle Xi= nouvelle variable
Ex
X
i
a * X
i
X
i
a * X
i
24 = 1 * 24 24 = 6 * 4
36 = 1 * 36 36 = 6 * 6
a=1 a = 6 X
i
= 4
Xi = Xi a =6 Xi = 6
par changement dorigine et dchelle : tout variable Xi peut scrire
X0 = nouvelle origine a : n.chelle Xi : n. variable
Ex :
Xi X0 a Xi
14 = 4 + 2 * 5
22 = 4 + 2 * 9
age Ni Centre de
classe xi
ni xi
| | 25 20
| | 30 25
| | 35 30
| | 40 35
| | 45 40
| | 50 45
8
10
20
25
15
10
22,5
27,5
32,5
37,5
42,5
47,5
180
275
650
937,5
637,5
475
TOTAL 88 3155
'
0 i i
ax x x + =
STATISTIQUE DESCRIPTIVE
Page 16
Si on pose
a
x x
x ax x x
i
i i i
0 ' '
0

= + =
La moyenne arithmtique :
( )

= X X + = X
+ = X
+
=
+
=
= X
i
i i
i i
i
i i
i
i i i
i
i i
i
i i
n
x n
avec a x
n
x n
a x
n
x n a n x
n
ax x n
n
x n
'
' '
0
'
0
'
0
'
0
X
0
= n origine
a: n chelle
'
i
x : n variable
On utilise cette relation pour simplifier les calculs de la manire suivante
On prend pour X
0
la valeur de caractre la plus frquente
On prend a lintervalle des classes lorsque les classes sont gaux
Application :
Calculez la moyenne avec
changement du variable
x0 = 37,5 cest le centre de
classe modale
a= 5
x
i
=( x
i
- x
0
)/5

= X
i
i i
i
n
x n
'
'
X= 37,5+5(-29/88)=35,8 ans
Age effictifs xi xi= (xi- x0)/a ni*xi
20-25
25-30
30-35
35-40
40-45
45-50
8
10
20
25
15
10
22,5
27,5
32,5
37,5
42,5
47,5
-3
-2
-1
0
1
2
-24
-20
-20
0
15
20
total 88 -29
'
0 i
x a x + = X
STATISTIQUE DESCRIPTIVE
Page 17
a-4 calcul de la moyenne arithmtique laide des frquences relatives
n n i i
i
n n
i i
i i
i
n n i i
i
i i
x f x f x f
n
x n
n
x n
n
x n
n
x n x n x n x n
n
x n
+ + + =
+ + + = X
+ + + +
= = X

........
.........
......
2 2
2 2
2 2 1 1
n
i
: frquence relative

ni
do : X= f1x1 +f2x2 +.+fnxn
X=

f
i
x
i
X=12,7
B- La moyenne gomtrique :
b-1 Dfinition
tant donne n observations connues individuellement (x
1,
x
2,
x
3,,,,,,,,,,,
x
n
)
on appelle moyenne gomtrique simple de ces n observations la grandeur G t.p :
G= ) .... 2 . 1 ( ..... 2 . 1 Xn X X Xn X X
n
=
1/n
n n i
i
i
x G
1
1
|
|
.
|

\
|
=
[
=
=
b-2 calcul de G
lorsque les observations sont groupes ; chaque pondr Xi sera pondr
par leffectif correspondant, la moyenne gomtrique scrit :
G =
n
X X X X X X X X X 3 3 * 3 * 2 . 2 . 2 * 1 . 1 . 1 G= . .... 3 . 2 . 1
3 2 1 n nn n n n
Xn X X X
N= n
1
+n
2
+..+n
n
calculer G est plus facile en passant par le logarithme, en effet.
xi Ni fi fixi
10
11
12
13
14
5
8
10
12
5
0,125
0,20
0,25
0,30
0,125
1,25
1,6
2,5
3,6
0,75
40 12,7
STATISTIQUE DESCRIPTIVE
Page 18
G= ( )
n n
Xn X X X Xn X X
/ 1
..... 3 . 2 . 1 .... 2 . 1 =
log G = 1/n log (X1.X2..Xn)
= 1/n| | Xn X X log ..... 2 log 1 log + +
La moyenne gomtrique pondre
( )
n n
n
n n
n n
n
n n
n
n
x x x G
x x x G
1
2 1
2 1
....... .
........ .
2 1
2 1
=
=
( )
( )
n
x x x
x x x
n
G
n
n
n
n
n n
n
n
n n
..... . log
........ . log
1
log
2 1
2 1 2 1
2 1
= =
=
n
n x n x n
n
n
n
+ + + ...... log log .
2 2 1 1
Application : calculer la
moyenne gomtrique
2 , 8 10
9145 , 0
8
316 , 7
log
9145 , 0
= =
= =
G
G
xi ni log xi ni log xi
2
6
10
12
1
2
3
2
0,301
0,772
1
1,158
0,301
1,556
3,0
2,158
Total 8 7,316

Xi log
Log G=
Ni

=
i
i i
n
x n
G
log
log
STATISTIQUE DESCRIPTIVE
Page 19
C- la moyenne harmonique :
c-1 Dfinition
tant donne n observations connues individuellement x1,x2,x3 ..xn
on appelle moyenne hormique le nombre H tel que :
n
x
n
x
x
x
H
i
n

=
+ + +
=
1
1
......
1
1
1
2
1
moyenne harmonique simple.
Si les observations sont groupes la moyenne harmonique scrit :

=
+ +
+ + +
=
i
i
i
n
n
n
n
x
n
n n n
x
n
x
x
x
x
M
1
......
1
. .....
1
.
1
.
1
2 1
2
2
1
1
Moyenne harmonique pondre
c-2 Application
16 , 6
298 , 1
8
8
298 , 1
1
1
= =
= =

H
n
x
x
H
i
i
i
c-3 Remarque
i
i
i
i i
i
i
i
x
avecX
n
X n
n
x
n
H
1
.
1
1
= = =

xi ni 1/ xi ni.1/ xi
2
6
10
12
1
2
3
2
0,5
0,166
0,1
0,083
0,5
0,332
0,2
0,166
total 8 1,298

=
i
x
n
H
1

=
i
i
i
x
n
n
H
1
Linverse de la moyenne = moyenne des inverses
STATISTIQUE DESCRIPTIVE
Page 20
D -La moyenne quadratique :
Dfinition : Etant donn n observations connues individuellement X1 ;
X2 ;..xn
n
x
Q
n
x x x
Q
i n
=
+ + +
=
2
2
2 2
2
2
1 2
.....
moyenne quadratique simple
si les observations sont groupes, la moyenne quadratique scrit :
n
n n
n n n
x n x n x n
Q
+ + +
+ + +
=
......
. ...... . .
2 1
2 2
2 2
2
1 1 2

= =
i
i i
i
i i
n
x n
Q
n
x n
Q
2 2
2
. .
moyenne quadratique pondre
Application :
1 . 9 83
83
8
664
.
2
2
= =
= = =

Q
n
x n
Q
i
i i
xi Ni X
i
Ni. X
i

2
6
10
12
1
2
3
2
4
36
100
144
4
72
300
288
total 8 664
n
x
Q
i
=
2
2
2
2
. .
i i
i
i i
i
i i
x avecX
n
X n
n
x n
Q = = =

Carr de la moyenne = la moyenne des carrs


STATISTIQUE DESCRIPTIVE
Page 21
Gnralisation de la notion moyennes :
d.1- moyenne dordre r
on appelle moyenne dordre r la quantit M
r
tel que :
n r
n
r r
r
n
x x x
M
1
2 1
........
|
|
.
|

\
| + + +
=
n
x x x
M
r
n
r r
r
r
+ + +
=
....
2 1
Si r= 1 X =
+ + + +
=
1
1
3 2 1 1
1
.......
M
n
x x x x
M
n
si r= 2 Q M Q M
n
x x x
M
n
= =
+ + +
=
2
2 2
2
2 2
2
2
1 2
2
.......
si r= -1 H M
H
H
M n
x x x
M
n
= = =
+ + +
=

1
1
1
1 1
2
1
1 1
1
1 1 ......
si r=c 0.
d.2- le classement des moyennes : les ingalits entre les moyennes :
On dmontre que les moyennes sordonnent selon la valeur de r c--d
que si :
2 1
2 1 r r
M M r r < < Ce qui nous donne :
2 1 0 1
M M M M < < <

Q G H < X < <


Dans notre exemple, on trouve : 6,16 <8,2 <8,5 < 9,11.
d-3 Le choix dune moyenne :
En thorie, aucune moyenne nest meilleure que lautre. Lutilisation de telle
moyenne dpend du problme pos.
Exemple :
Ex1 : Soit un petit jardin sous forme de rectangle, le propritaire ne peut se souvenir
que dun seul chiffre. 9
9
Sil veut entourer son champs de fil de fer il a intrt se souvenir de la
moyenne arithmtique car le primtre est li la somme des diffrents cts.
G M =
0 c
4 4
STATISTIQUE DESCRIPTIVE
Page 22
Sil veut mettre de lengrais son jardin, il a intrt se souvenir de la
moyenne gomtrique
6 4 * 9 ; 5 , 6
4
4 9 4 9
= = =
+ + +
= X G
moyenne arithmtique du primtre =26 =6,5 * 4 6 * 4
moyenne gomtrique : surface =36 =6*6 6,5 * 6,5
Gnralits :
Dune manire gnrale, on retient la moyenne arithmtique quand les variables
sadditionnent, et on utilise la moyenne gomtrique lorsque les variables se
multiplient.
Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h.

=
+
+
=
+
+
= =
i
i
i
x
n
n
MH
tempstotal
tale distonceto
Vitessemoy
1
.
80
1
160
50
1
. 100
160 100
80
160
50
100
160 100
La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par
les distances.
Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.
( ) ( )

= X
+
+
= =
i
i i
n
x n
tempstotal
tal distonceto
moy Vitesse
3 1
80 3 50 1
.
La vitesse moyenne est gale donc la moyenne arithmtique des vitesses
pondres par le temps.
Ex 4 : Une grandeur S0 a augment sur 3 annes, dabord de 10% puis de 15% et
30% pour le 3
me
anne.
Quel est le taux moyenne de croissance ?
1
re
anne : S0 devient S1=S0 + (S0*10/100) S1 =S0(1+0,10 ) = 1,10S0
2me anne S
1
devient S2 = S1 +0,15S1 S1*1,15(S1*(1+0,15))
3me anne S2 devient S3 = S2 +0,3S2 = 1,3S2 (S2*(1+0,3))
S3 = S01,1 1,15 1,3
Moyenne gomtrique 1804 , 1 3 , 1 15 , 1 1 , 1
3
= = G
Remarque: le taux de croissance moyenne est 18,04%
STATISTIQUE DESCRIPTIVE
Page 23
Ex 5 : Un tudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la
moyenne des carts entre les notes et la moyenne arithmtique.
10
3
12 10 8
=
+ +
= X
Ecart type la moyenne moyenne arithmtique des carts = (-2+0+2)/3
8-10 = -2
10-10 =0
12-10 =2 moyenne arithmtique des carts = 0
On retrouve ici une des proprits des moyennes arithmtiques :
( ) 0 = X
i
x
Dmonstration : 0 = = =


n
x
n x x n x x x
i
i i i
Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne
quadratique
( ) ( ) ( )
6 , 1
3
8
3
8
3
2 0 2
2 2 2
2
= =
=
+ +
=
Q
Q
STATISTIQUE DESCRIPTIVE
Page 24
II. La mdiane (Me)
b-1- Dfinition :
On appelle mdiane dune srie classe par ordre croissant ou
dcroissant, la valeur du caractre qui partage en deux parties gales les effectifs.
Cest la valeur du caractre telle que la moiti des effectifs lui est
suprieure et lautre lui est infrieure.
b-2- Calcul de ME :
Cas dune variable discrte
Si la srie a un nombre impair de terme
75 62 57 12 18

Me =57
Si la srie a un nombre pair
12 25 32 44 52 69

Intervalle Mdian [32-44]
On prend le centre de lintervalle comme la mdiane :
Cas dune srie de classes :
Salaires Effectifs Effectifs cumuls
10-15
15-20
20-25
25-30
9
25
32
16
9
34
66
82
Total 82
Le calcul de la mdiane se fait en 3
tapes :
1re tape : on repre le rang de la
mdiane. Rang = 82/2 = 41
Rang =
2

ni
2me tape : on repre la classe de Me :
Il sagit de trouver la classe laquelle appartient le 41
me
individu,
pour cela on classe les individus par ordre croissant des salaires, ce qui revient
construire la colonne des effectifs cumuls. .
Me
e
[20-25], on peut calculer avec plus de prcision Me en faisant une
interpolation linaire.
3me tape : linterpolation linaire :
On connat les salaires des 34 individus 20
On connat les salaires des 66 individus 25
Le 41
me
individus cest le 7me individus que je rencontre dans la classe 20 -25,
son salaire sera obligatoirement gal 20 + supplment que lon calcule par
interpolation.
En supposant que les 32 individus de la classe 20-25 sont rpartis dune manire
uniforme dans la classe
20-25 puis sont spars par la mme quantit de salaire
On raisonne alors de la manire suivante :
Si pour 32 individus nous avons un cart de salaire de 5 DH
STATISTIQUE DESCRIPTIVE
Page 25
Pour 1 individu 5/32
Pour 7 individus 5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moiti des effectifs gagnent plus de 21,09 DH et lautre moiti gagne (moins de
21,09 DH)
b-3- Dtermination graphique de la mdiane :
Courbe cumulative
b-4-Remarque :
Salaire Xi Xi
10 15 9 9
15 - 20 25 34
20 - 25 32 66
25 - 30 16 82
Total Xi =82
STATISTIQUE DESCRIPTIVE
Page 26
Mthode rapide dinterpolation :
21 20
32
5 7
34 66
34 41
20 25
20
~ +

Me
Me
2. le 41 me individu normalement la mdiane devrait se situer entre le 41
me et le 42 me, mais on convient lorsque les effectifs sont nombreux de
prendre (N / 2)
III. Le Mode :
Cest la valeur du caractre le plus frquent.
A- Calcul Mode :
1- Cas dune variable discrte :
Xi Ni
2 4
17 16
33 15
39 16
51 8
Mo =14 Mo = 17
Srie
Uni modal Mo = 39
Srie bimodale
Srie plurimodale (srie plusieurs modes)
Xi ni
3 3
14 18
21 7
42 4
STATISTIQUE DESCRIPTIVE
Page 27
2-Cas dune srie de classe :
-Nous avons une classe modale : 20 25
- On peut prendre comme mode le centre de classe 22,5
- On peut chercher obtenir le mode avec plus de prcision :
1/ Par Mthode graphique : Elle consiste dabord construire lhistogramme
N.B : Ne pas oublier, lorsqu on construit lhistogramme de corriger les
effectifs.
2/ Par la mthode algbrique :
Mo = L1 + [d1. I / (d1 + d2)]
Mo = 20 +
* ) 25 32 (
5
(32-25) + (32 - 16)
Salaires ni
10 15 9
15 20 25
20 25 32
25 - 30 16
Total 82
STATISTIQUE DESCRIPTIVE
Page 28
L1 : Limite Infrieure de classe modale
d1 : La diffrence entre les effectifs de la classe modale et les effectifs de
classe prcdente
d2 : La diffrence entre les effectifs de classe modale et les effectifs de
classe suivante
i : Lintervalle de la classe modale
IV. VI- Le choix dune caractristique de tendance centrale :
A : Les conditions de Yule :
1 r conditions : Une modalit caractristique doit tre : dfinie de faon
objective. (2 personnes diffrentes doivent trouver le mme rsultat)
2 me conditions : Tenir compte de toutes les observations
3 me conditions : tre facile comprendre
4 me conditions : tre facile calculer
5 me conditions : Doit se prter au calcul algbrique
B : Comparaison des diffrentes caractristiques de tendance centrale :
1-La moyenne :
Elle rpond parfaitement aux conditions de Yule ; cest pour
cela quelle est la caractristique la plus utilise, mais il y a des cas ou il faut lui
prfrer la mdiane quand elle risque dtre influenc des valeurs extrmes.
EX:
X = 154 / 10 = 15,4
X = 153 / 9 = 17
2-La mdiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la mdiane ne change pas quand on augmente la valeur
dune observation qui lui est infrieure
15 22 34 41 60 122 34 41 110
1 2 34 41 60
Notes Xi Ni * Xi
1 1 1
16 2 32
17 5 85
18 2 36
10 154
STATISTIQUE DESCRIPTIVE
Page 29
3-Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est
utile, en particulier quand on cherche la valeur la plus typique dune srie :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.
SECTION 2 : Les Caractristiques de Dispersion:
Partons de 3 sries
Srie 1 : 9 11
_
X = 10
Srie 2 : 5 15
_
X = 10
Srie 3 : 1 19
_
X = 10
Les 3 sries ont la mme moyenne : 10 et portant ils sont
diffrents lunes des autres.
Dans la 1
re
srie ; les valeurs du caractre sont proches de la
moyenne. La moyenne est reprsentative.
Dans la 3 me Srie les valeurs du caractre sont loignes de la
moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les
valeurs sont proches ou loignes de la valeur centrale.
Ce nombre est appel caractristiques de dispersion.
I. Lintervalle de variation ou ltendue :
Cest la diffrence entre la plus grande valeur du caractre et la plus petite.
Lintervalle de variation = Val MAX Val MIN
2 = A
Srie 1
10 = A
srie 2
18 = A
Srie 3
Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il
dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes.
EX :
17.1820.60.Age
1000 tudiants
3 = A
43 17 60 = = A
STATISTIQUE DESCRIPTIVE
Page 30
II. Lintervalle inter quartile :
A- Dfinition des quartiles :
On appelle 1
r
quartile Q1 la valeur du caractre tel que : 25%
des observations lui sont infrieurs et 75% lui sont suprieurs. 25% < ; 75%>
2
me
quartile Q2= Me 50% < 50%>
3
m
quartile Q3= 75%< 25%>
B- Dfinition inter quartile :
On appelle inter quartile : Q3 Q1 diffrence entre 1r quartile
et 3me quartile.
N.B : Intervalle Inter quartile contient 50% des observations
C- Application :
N= 82
Rang : 82/4 =20 ,5
Classe : [15-20]
Interpolation : 15+A
Ecart I. Inter quartile
Q3 Q1
=24,3 - 17,3
= 7DH
Interprtation : Si 25 individus Augmentation de 5 DH
Si 01 Individu Augmentation 5/25 DH
(20,5 - 9) = 11,5 5/25 * 11,5
Donc Q1 = 15 + 5/25 *11,5 = 17,3 DH
2me Mthode :
Salaires Effectifs
10-15 9
15-20 25
20-25 32
25-30 16
Total 82
Ni Cum
9
34
66
82
STATISTIQUE DESCRIPTIVE
Page 31
Calcul de Q3
Rang : 82*3/4 =61,5
Classe = [20-25]
Interpolation : si 32 individus augmentation de 5 DH
01 Individu Augmentation de 5/32
(61,5 34) = 27,5 individus Augmentation 5/32 *27,5
Donc Q3 = 20+ [(5/32) *27,5]
Signification : 24,3dh cest le salaire tel que 75% gagnent plus de 24,3 et 25%
gagnent moins de 24,3 DH.
Inter. Inter quartile : 7 DH = Q3-Q1
Signification : pour 50% des effectifs lcart Maximum de salaire est de 7 DH
D Remarque :
1- Les dciles : valeur du caractre que 10 % des observations ont une valeur qui
est infrieure D1 et 90% des observations ont une valeur qui est suprieure
D1.
On appelle 9 me dcile de 9 la valeur du caractre tel que 90% des observations
lui sont infrieures, et 10% des observations lui sont suprieures. Lintervalle
inter dcile D9 - D1 contient 80% des observations
2- Les percentiles :
On appelle percentiles P1 la valeur du caractre telle que un pourcent (1%) des
observations ont une valeur infrieure P1 et 98% ont une valeur suprieure
P1.
Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de
calculer lintervalle inter percentile P
93
P
07
qui contient 86% des observations.
STATISTIQUE DESCRIPTIVE
Page 32
Lcart absolu moyen :
A- Dfinition : On appelle cart absolu moyen que lon dsigne par la
moyenne arithmtique des carts absolus entre les valeurs du caractre et
la moyenne arithmtique.
C
a
=


_
x xi ni / ni

B- Application : soit le tableau suivant :


Poids ni xi ni * xi
_
x xi
_
x xi ni
55-60
60-65
65-70
70-75
75-80
12
17
36
24
11
57,5
62,5
67,5
72,5
77,5
690
1062,50
2430
1740
852,50
10,25
5,25
0,25
4,75
9,75
123
89,25
9
114
107,25
100 6775 442,5
C
a
= 442.5 / 100 = 4.42 Kg X = 67.75 Kg
Signification : Ca = 4.42 Kg signifie quen moyenne, chaque individu
sloigne de la moyenne (67.75 Kg) de 4.42 Kg.
Remarque : Pour dire si une dispersion est grande ou non, pour comparer
deux sries entre elles, on se sert de lindice de dispersion relatif = Ca / X *100
Exemple :
Poids de filles Poids des garons
X=52 Kg X=68 Kg
Ca= 2 Kg Ca = 17 Kg
2/52 *100= 3.8% 17/68 * 100 = 25%
Dispersion Faible dispersion plus importante
IV- La variance et lcart type :
A- Dfinition :
On appelle une variance la moyenne arithmtique des carrs des carts entre les
valeurs du caractre et la moyenne arithmtique.
o
2
=

) ( x xi ni
2
/

ni
STATISTIQUE DESCRIPTIVE
Page 33
On appelle cart-type (ou cart quadratique moyen) la racine carr de 6
2

= ni x xi ni / ) (
2
_
o
B- Application :
Le mme tableau prcdent
(xi-X)
2
ni*(xi- X)
2
105,0625
27,5625
0,0625
22,5625
95,0625
1260,75
468,5625
2,25
541,50
1045,6875
3318,75

= ni x xi ni / ) (
2
_
o = 0 3318.75/10 =5.76
Signification : En moyenne chaque individu scarte du poids moyen
(67.5 kg) de 5.76 kg.
C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cfficient de
variation = / X
Ex :
X =67.75 Kg /X=(5.76/67.75) *100= 8.5%
Ex 2 :
Soient 2 modles dampoules lectrique dont on a relev les dures de
vie.
Modle 1 : Dure de vie moyenne 1400 H.
Modle 1 : Dure cart-type =100 H
Modle 2 : Dure de vie moyenne 1800 H.
Modle 2 : Dure cart-type = 250 H
STATISTIQUE DESCRIPTIVE
Page 34
Modle I Modle II
6/ X=100/1400 = 7% 250/1800 *100 = 14%
Le modle I est plus faible que le modle II
Formule dveloppe :
Donc o =

ni xi
2
x
2

ni
Poids ni xi xi
2
ni * xi
2
55-60
60-65
65-70
70-75
75-80
12
17
36
24
11
57,5
62,5
67,5
72,5
77,5
330625
390625
455625
525625
600625
39675
66406,25
164025
126150
66068,75
100 462325
o
2
= 462325 - (67.75)
2
~ 33.19
100
o = 19 . 33 =5.76
SECTION III : Les Caractristiques de Concentration
La concentration ne sapplique qu des sries statistiques ou la concentration
de la variable a un sens
EX : on peut parler de la concentration de revenus, concentration foncire
Autres EX : on ne peut pas parler de concentration dge
On peut dterminer la concentration soit algbriquement soit graphiquement
I. La dtermination algbrique de la concentration
Cette dtermination ncessite la connaissance de la mdiale
Notion de la mdiale (Ml)
A- La mdiale
Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la
mdiale est la valeur du caractre qui partage en deux parties gales le produit
cumul de ni xi.
Si xi dsigne un salaire
Ni dsigne le nombre de salaris
STATISTIQUE DESCRIPTIVE
Page 35
Le produit cumul des ni xi reprsente la totalit des salaires Verss nixi

Cest--dire la masse salariale.


La mdiale, cest le salaire tel que la moiti de la masse salariale a servi payer
une partie qui touche moins de cette Mdiale et lautre moiti de la masse s a servi
payer les gens qui touchent plus de cette Mdiale.
B- Mesure de la concentration
AM sert mesurer la diffrence entre ML et ME :
AM=ML ME
* Si AM = 0 cela veut dire que ML =ME
C'est--dire lindividu qui est au milieu leffectif est en mme
temps celui qui est plac tel que la moiti de la masse salariale a t
verse des gens qui touchent moins que lui, et lautre moiti des gens
qui reoivent plus que lui, on a donc une distribution galitaire
concentration est nulle
* Si Am = 0 cela indique quil y a une concentration
* Si Am est faible par rapport lintervalle de variation la concentration est
faible
* Si Am est important, la concentration est forte
Inter variation
C- application
salaire ni xi nixi nixi
10-15 8 12.5 112.5 112.5
15-20 25 17.5 437.5 550
20-25 32 22.5 720 1270
25-30 16 27.5 440 1710
total 82 1710
AM= ML ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linaire
7205dh
1dh 5/720dh
(855-550) =30555/720*305dh
Donc ML= 20+5/720*350
ML = 22.12dh
}
AM = ML - ME
= 22 ,12 - 21,09 ~1dh
STATISTIQUE DESCRIPTIVE
Page 36
AM/inter varia = 1/20=5% concentration faible
Lintervalle de variation
tant gale : (30-10)=20
Signification ML = 22.12 dh
Cest le salaire tel que la moiti de la masse salariale a servi payer des
gens qui gagnent moins que 22.12 dh et lautre moiti de la masse
salariale a servi payer les gens qui gagnent plus que 22.12 dh
II. La dtermination graphique de la concentration la courbe de Lorentz
GINI
A- la graphique de GINI
GINI propose de mesurer la concentration en mettant en abssices les
frquences cumules en%, et en ordonnes ni xi cumuls en %
salaire ni Fi% Fi% *n xi nixi Nixi%
Nixi%cum
10-15 9 11 11 12.5 112.5 6.6
6.6
15-20 25 30.5 41.5 17.5 437.5 25.6
32.2
20-25 32 39 80.5 22.5 720 24.1
74.3
25-30 16 13.5 100 27.5 440 25.7
100
total 82 100 1710
/ : Diagonal de lgalit
: Aire de concentration
Remarques :
1) si 10% de la population touchent 10% du revenu, 20% de la
population touchent 20% du revenu. Dans le cas dune rpartition
galitaire du salaire, laire de concentration serait confondue avec
diagonal.
2) Dans le cas dune repartions illgalitaire parfaite des salaires,
(comme dans le cas thorique ou 0.1% de la population toucherait
99.99% de la masse salariale : la courbe
STATISTIQUE DESCRIPTIVE
Page 37
B)-Le coefficient de Gini :
Gini propose de calculer la concentration laide de coefficient suivant :
Aire de concentration
C=
Aire du triangle ABC
Aire de G
C =
5000(100*100/2)
On peu estimer laire de concentration de la manire suivant :
Aire de concentration = 5000-(S1+S2+S3+S3)
B S=1/2 a*b S1 = (116.6)
S2= (41.5-11)/2(6.6+32.2)
A S3= (80.5-41.5)/2(32.2+74.3)
A S4 = (100-80.5)/2(74.3+100)
n

Si = 4404
S = n/2(a+b)
b
Remarque : 0<c<1
c = 0 Concentration lev
c = 1 Concentration faible
Donc c=5000-4404/5000~0.12
C d les gens sont pareils
STATISTIQUE DESCRIPTIVE
Page 38
CHAPITRE III :LES SERIES A DOUBLE ENTREES :
REGRESSION LINEAIRE (CORRELATION)
I- notion de tableau de contingence :
A. une distribution statistique double
Cest une distribution ou lobservation seffectue selon 2 caractres.
EX : Rpartition des tudiants selon la taille et lge
Rpartition des logements selon le nbre de pices et superficie
B. distributions marginales
Ce sont les distributions relatives la seul variable X ou Y
a- la rpartition des logements selon le nombre de pices (X)
Nbre de
pices (x)
Nbre de logement
1 4
2 18
3 12
4 17
5 6
total 57
Cette distribution qui concerne la seule variable x est applle distribution marginale (marginal
car on la trouve la marge du tableau statistique)
On peut calculer la moyenne de cette distribution, (et sa signification est le nbre de pices
moyenne par logement)
Moyenne appele moy.marginale note
b- la rpartition des logements selon la superficie :
superficie y Nbre de logements
10-30 4
30-50 16
50-70 20
70-80 17
total 57
superficie
nbr de piece
10-30 30-50 50-70 70-80 total
1 3 1
2 1 14 3 18
3 1 7 4 12
4 10 7 17
5 6 6 6
total 4 16 20 17 57
STATISTIQUE DESCRIPTIVE
Page 39
Cette distribution qui concerne la seule variable y est appele distribution marginale on peut
calculer la moyenne (qui exprime la surface moy des logements) applle moy.marginal note
C. Les distributions conditionnelles :
On appelle distribution Conditionnelle la distribution ou lon a pos une condition sur lune
des variables.
Ex : Rparation de logements de 30-50m
Cette distribution est appele Distribution Conditionnelle parce que lon ne sintresse quaux
logements qui satisfont la condition de surface 30-50 m
2
.
On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pices des
logts de 30-50 m
2
) on appelle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
Remarque il existe autant de distributions conditionnelles relatives au caractre x que le
caractre y a de modalits
II- gnralisation du tableau de contingences :
x y Y
1
Y
2
. Y
j
. Y
m
total
X1
X
11
X
12
. X
1j
. X
1m X1.
X
2
X
21
. X
2j
. X
2m
X
2
.
. .
X
i
Xi1 Xi2 . Xij . Xim X
i
.
. .
Xk
X
k1
X
k2
. X
kj
. X
km Xk.
total x.
1
x.
2
. x.
j
. x.
m
x..
x
1
x
2
. . . x
k =
les modalits de x
y
1
y
2
. . . y
k =
les modalits de y
x1 .effectifs pour la 1
re
modalits de x et pour toutes les modalits de y
La distribution marginale de X :
X(xi) Xi.
X
1
X
2
.
.
Xi
X
k
X
1.
X
2.
.
.
Xi.
X
k.
Total X..
STATISTIQUE DESCRIPTIVE
Page 40
La distribution marginale de y :
Distribution conditionnelle relatif X et Y
Dist. Conditionnelle relative X Dist. Conditionnelle relative Y
III- La rgression linaire
A. Prsentation du problme :
Soit le tableau suivant :
qu
Prix
42 51 60 62 74 83 Total
70 1 1
75 1 1
77 1 1
80 1 1
86 1 1
93 1 1
Total 1 1 1 1 1 1 6
Ce tableau est un tableau de contingence ou les observations sont connues individuellement,
on peut prsenter plus simplement ce tableau de la manire suivante :
y(xi) X
j
.
y1
y2
.
.
y
i
ym
X.1
X.2
.
.
X.
i
Xm.
Total X..
y Xij
y
1
y2
.
.
y
i
y
m
X
i1
Xi2
.
.
X
ij
X
im
Total Xi.
X X
ij
X1
X2
.
.
X
i
Xk
X1j
X2j
.
.
X
ij
Xkj
Total X.j
STATISTIQUE DESCRIPTIVE
Page 41
Nous avons un ensemble de points un nuage statistique qui nous indique que les prix est
les quantits voluent selon la mme tendance.
Il est possible de schmatiser ce nuage :
-Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil faudra
trouver.
a=pente de droite
b=ordonne lorigine
Une telle droite est appelle droite de rgression D(x)
A=coefficient de rgression
La rgression cest le fait de relier y x par une fonction
Calcule des paramtres de la droite de rgression :
B. la mthode des moindres carrs
Notion de moindres carrs :
Partons dun nuage statistique thorique :
- Il sagit de rsumer ce nuage par une droite.
- Soit y= ax+b lquation de la droite recherche.
- Pour toute valeur de x (x
i
) nous avons une valeur rellement observe y.
- Pour toute valeur x
i
, nous avons une valeur calcule sur la droite y.
- Pour toute une valeur xi, nous avons une erreur destimation gale | yi yi |.
STATISTIQUE DESCRIPTIVE
Page 42
y
i
x 0
- La droite de rgression idale doit tre de telle manire que la somme des erreurs
destimation doit tre la plus faible possible, | yi yi | doit tre minimum.
- Pour viter les valeurs absolues, on convient de calculer les carrs des erreurs. La
droite de rgression doit tre telle que :
(y
i
y
i
)
2
minimum, et on appelle cela la condition des moindres carrs.
C. Calcul des paramtres de la droite de rgression.
Il sagit de trouver y= ax + b sachant que : (y
i
y
i
)
2
min.
Remplaons yi par sa valeur (yi (axi+b))
2
min.
Posons (y
i
ax ; - f)
2
= Z (a , b).
Pour que Z soit minimum, il suffit dannuler (rendre nul) les drivs de ce polynme par
rapport a et par rapport b.
1 Calcul de b :
Supposons a est connu, et drivons par rapport a b et a.
dZ / db = 2 [ (yi ax ; -b)] (-1) = 0 Z = U
2
Z = 2UU
[yi ax ; -b) = 0
yi axi nb = 0 U = (yi ax ; -b)
Divisons par n, on obtient (yi / n axi / n b = 0
- a X = b
Donc :
b = - a X
La droite de rgression passe donc par le point moyen ( X, ).
2 Calcul des a :
ax
M xi x
X
i
X
Le paramtre a Que nous cherchons correspond la pente de la droite de rgression qui passe
par le point moyen M ( X ; ).
Procdons un changement dorigine, et prenons comme nouvelle origine le point moyen
M(x ; ), les nouvelles cordonnes deviennent :
Xi = xi X
Yi = yi -
La droite de rgression a pour quation y = ax
y
Y

STATISTIQUE DESCRIPTIVE
Page 43
La condition des moindres carre scrit ;
(yi i)
2
min
(yi yi)
2
= (yi axi )
2
min
Drivons par rapport a : 2 [ (y
i
ax
i
)] (-X
i
) = 0
[ (y
i
ax
i
)] X
i
= 0 => (y
i
a
i
) X
i
= 0 => x
i
y
i
a x
i
2
= 0
Donc a = xi yi /xi
2
= (xi x) (yi - )/ (xi x)
2
3- lquation de la droite de rgression :
Dy(x) =
Y = ax + b
a = (xi - X ) (yi - ) / (xi X )
2
b = - a
D Application:
Prix(x) Qts(y)
70
75
77
80
86
33
72
51
60
62
74
83
481 372
Trouver Dy (x).
Dy (x) a pour quation:
Y = ax + b
a =

2
xi xi
x
=


2
_
_ _
) (
) )( (
x x
y y x x
i
i i
x

= =

n
x
i
481 / 6 = 80
y

= 372 / 6 = 62
xi - X yi - (xi-X ) (yi - ) (xi-X )
2
-10
-5
-3
0
6
13
-20
-11
-2
0
12
21
200
55
6
0
72
273
100
25
9
0
36
169
606 339
a = 606 / 339 = 1.79
b = 62 (1.73)80
b = -81
Donc
Dy
(x)
a pour quation :
y = 1.79x 81
La loi de loffre pour ce bien
STATISTIQUE DESCRIPTIVE
Page 44
IV- la corrlation linaire :
Dans le paragraphe prcdent, nous avions estim y en fonction de x, et nous avions obtenu la
droite de rgression Dy(x)
On peut pour le mme nuage statistique estimer x en fonction de y, et trouver la droite de
rgression Dx(y) lui aura pour quation.
Pour toute yi, nous avons une valeur observe xi.
Pour toute y
i
, nous avons une valeur estime sur la droite x
i
Pour toute y
i
, nous avons une erreur destimation gale | x
i
x
i
|
Dx(y) idale est tel que : | xi xi | minimum ou encore (xi xi)
2
minimum
En procdant de la mme manire que dans le paragraphe prcdent, on trouve lquation de
Dx(y).
X = ay + b
a = x
i
y
i
yi
2
b = X a
Dans le rfrentiel XMY nous obtenons 2 droites :
Soit y = ax pour Dy(x)
Soit x = ay pour Dx(y)
Ou encore y = 1/a x
4 cas peuvent se produire :
1
er
cas : les 2 droites sont confondues
Y= ax
X = ay a = 1/a aa = 1
Y = 1/yx
STATISTIQUE DESCRIPTIVE
Page 45
2me cas : les 2 droite font entre elles un angle trs faible :
3me cas : les 2 droite font entre elles un angle lev :
4me cas : les 2 variables sont indpendantes lune de lautre :
Si on appelle coff de corrlation la Quantit r tel que : r
2
= a . a

, on peut crire :
- Si r = 1 on a une corrlation parfaite.
- Si r = +1 on a une corrlation parfaite positive.
- Si r = -1 on a une corrlation parfaite.
Corr. positive : c d les variables varient dans le mme sens.
- Si r = -1 = corrlation parfaite ngative.
C d les deux phnomnes varient en sens inverse.
Par exemple Prix et Quantit
- Si 0 < r < 1 = la corrlation est positive, elle est dautant plus forte que lon se
rapproche de 1.
- Si -1 < r < 0 = la corrlation est ngative, et elle est dautant plus forte que lon se
rapproche de -1.
- Si r = 0 = corrlation nulle.
STATISTIQUE DESCRIPTIVE
Page 46
Application : calculer le coefficient de corrlation dune autre faon (existe-t-il un lien entre y
et x).
Prix Qt
x

x
y -
(x

x ) (y
i
- ) (x

x )
2
(y
i
- )
2
70
75
77
80
86
33
42
51
60
62
74
83
606 339 1110
r
2
= a. a =
1110
606
339
606
donc r = 0.98
a =


=
2
2
) (
) )( (
x x
y y x x
x
y x
i
i i
i
i i
= =
339
606
1.79
a =


=
2
2
) (
) )( (
y y
y y x x
y
y x
i
i i
i
i i
= =
1110
606
0.545
On a une trs forte corrlation car r = 0.975 tend vers 1
Remarque : lorsquon crit r
2
= a. ar = racine a .a, nous avons une expression trs
positif. Comment trouver alors le signe dune corrlation ?
Rponse : le sens de la corrlation est donne par le signe de a et a.
- Si a et a sont >0le produit a.a >0corrlation positive.
- Si a et a sont <0le produit a.a>0 corrlation ngative.
On peut dire dune corrlation quelle est trs satisfaisante partir 0.86.
On peut dire dune corrlation quelle parfaite partir de 0.96.
IV formule facilitant les calculs :
1/ calcul de a :
a = (x
i
X) (y
i
- ) =
D
N
, N = x
i
y
i
- x
i


x y
i
+

x
(x
i
x)
2
Or

x =
N
x
i
x
i
= n

x
=
N
y
i
y
i
= n
On remplace : N = xi yi - n

x -n

x + n

x
N =

y x n y x
i i
D = (xi

x )
2
= (xi
2
2xi

x + x
2
) = xi
2
2

x xi + n

x
2
= xi
2
2n

x
2
+ n

x
2
D = xi
2
nX
2
STATISTIQUE DESCRIPTIVE
Page 47
Donc a =
2
2

x n x
y x n y x
i i
Formule dveloppe
xi y
i
X
i
y
i
x
i
2
x
2 calcul de r :
x
i
y
i
n X
r2= a.a a =
xi
2
nX
2
x
i
y
i
n X
a =
yi
2
n
2
Donc r = ' * a a
V Autre formule de r :
[ (xi X ) (yi - )]
2
r =
(xi X)
2
(yi - )
2
Or (xi X )
2

2
x = (x
i
X )
2
= n
2
x
n
(yi )
2

2
y = (yi )
2
= n
2
y
n
(xi X ) (yi )
Donc r ==
y x n
y y x x
i i
2 2 2
2
. .
)] )( [(
o o



n.x. y
Si on appelle : covariance de x et de y lexpression :
(xi X) (yi )
Cov (xy)
n
Cov (xy)
r scrit : r =
x.y
STATISTIQUE DESCRIPTIVE
Page 48
CHAPITRE IV : ANALYSE DES SERIES
CHRONOLOGIQUES.
I Gnralits :
A. Dfinition :
Une srie chronologique est une srie o les observations de la variable sont faites des
intervalles rguliers de temps.
B. les diffrentes composantes dune srie chronologique.
Soit la srie chronologique suivante : Evolution trimestrielle du chiffre daffaire dune
entreprise
trimtres 1 2 3 4
1998
1999
2000
2001
120
130
144
157
148
162
178
196
155
169
186
210
120
132
145
160
Reprsentation graphique de la srie :
Lexamen dune srie chronologique rvle lexistence de diffrences composantes :
Un mouvement de tendance longue ( long terme), appele trend .
Un mouvement saisonnier qui est les variations saisonnires.
Des variations accidentelles : ce sont des variations imprvisibles dues des circonstances
exceptionnelles.
C. intrt dune analyse dune srie chronologique :
Lanalyse des sries chronologiques permet de sparer le mouvement de long terme du
mouvement saisonnier, ce qui nous permettra de faire des calculs de prvision.
STATISTIQUE DESCRIPTIVE
Page 49
II lanalyse de la tendance longue : trend
Dterminer le trend, cela revient lisser la srie pour liminer les variations saisonnires,
cette technique de lissage de la srie est appele Ajustement. Les 2 mthodes dajustement
les plus utiliss sont :
La mthode des moyennes mobiles.
Lajustement analytique.
A. la mthode des moyennes mobiles :
Elle consiste diviser un nuage statistique en sous nuages comprenant chacune
(n1) donnes du sous nuages prcdent, et remplacer chaque sous nuage par un point tel
que : xi = mdiane des x
i
y
i
= moyenne des valeurs y
i
.
B. Oprations sur les matrices :
1 matrices transposes :
1 3 4 1 2
A = A = 3 -1
2 -1 5 4 5
2 Laddition :
1 -1 3 0 4 3 1 3 6
+ =
2 4 1 3 -1 -1 5 3 0
(aij) + (b
i
j) = (a
i
j + b
i
j)
Proprits :
- commutativit
- association
- lment neutre
- lment symtrique a
ii
= 0
(n ;p)
la matrice nulle
t (a+b) = t
a
+t
b
3- Multiplication par un rel :
1 -1 3 3 -3 9
3 * =
2 4 1 6 12 3
STATISTIQUE DESCRIPTIVE
Page 50
CHAPITRE V :POPULATIONS ET ECHANTILLONS,
RECENSEMENTS ET SONDAGES
Les journaux, la tlvision, les revues nous inondent constamment de graphiques, de
tableaux et de statistiques de toutes sortes, dans diffrents domaines :
Politique Sondages, rfrendums, popularit des partis politiques et de leur chef.
Social
Criminalit, suicide, avortement, racisme, pratiques religieuses, orientations
sexuelles, habitudes alimentaires.
conomie
Importations, exportations, prix de vente, taux d'inflation, indice des prix la
consommation (IPC), taux d'intrt, salaires, taux de chmage, cotes
boursires, indices boursiers, dficits gouvernementaux.
Dmographie Taux de mortalit, taux de natalit, population par province, par nationalit.
Culture Entres au box office, cotes d'coutes.
tudes Rsultats scolaires, prts et bourses, cote R et cote Z.
Sports Meilleurs compteurs, classement des quipes, salaires des joueurs.
Ces prsentations peuvent parfois nous induire en erreur volontairement ou non.
Il nous faut donc dvelopper un esprit critique et savoir interprter ces
informations.
I. Quelques termes de base :
La population cible est l'ensemble de tous les objets que l'on tudie.
Une unit statistique est un objet de cette population.
Un chantillon est une partie choisie d'une population.
Le nombre d'objets composant une population ou un chantillon est appel sa taille.
Lorsque l'on veut connatre certaines caractristiques d'une population, on dit qu'on
enqute sur la population.
Une enqute peut tre ralise auprs de toute la population ou sur un chantillon.
Un recensement est une enqute ralise auprs de toute la population.
STATISTIQUE DESCRIPTIVE
Page 51
Un sondage est une enqute ralise sur un chantillon.
II. Exemples:
1. tude portant sur la langue maternelle des Qubcois:
la population est l'ensemble des Qubcois
et la caractristique est la langue maternelle.
2. tude portant sur la dure des ampoules lectriques produites l'usine X.
La population est constitue des ampoules lectriques produites l'usine X
et la caractristique tudie est la dure des ampoules.
3. Une compagnie pharmaceutique veut vrifier un nouveau vaccin contre une certaine maladie.
On administre ce produit 50 patients atteints de la maladie.
La population est forme de tous les gens atteints de la maladie,
l'chantillon est form des 50 patients qui on a administr le mdicament et la
caractristique tudie est la rponse au mdicament.
Les cots levs et les dlais trop longs, relis un recensement, sont les
principales raisons qui nous amnent utiliser un sondage puisque la taille d'un
chantillon est beaucoup plus petite que celle de la population.
Au Canada, il y a un recensement tous les cinq ans. Le dernier date de 1996.
III. tapes d'une enqute statistique :
1. Dterminer la population cible et les caractristiques de cette population que l'on veut
tudier.
2. Dterminer la manire dont l'chantillon va tre prlev.
STATISTIQUE DESCRIPTIVE
Page 52
3. Construire des instruments (questionnaires ou autres).
4. tablir un pr-test ou tude-pilote.
5. Recueillir les donnes.
6. Compiler les donnes.
7. Mettre en forme les donnes.
8. Analyser les donnes (analyse descriptive ou infrentielle).
9. Interprter les rsultats.
10. Communiquer les rsultats.
STATISTIQUE DESCRIPTIVE
Page 53
EXERCICES
STATISTIQUE DESCRIPTIVE
Page 54
I OBJECTIFS VISES :
1. construction dun tableau statistique :
2. distinguer une variable quantitative dune variable qualitative
3. reprsentation graphique des variables quantitatives discrtes et continues
4. calcul et interprtation des caractristiques de tendance centrale :
moyenne.
mdiane
mode
quartiles
5. calcul et interprtation des caractristiques de dispersion :
variance
cart type
coefficient de variation
Exercice 1 :
Dans une entreprise de 80 salaris on a enregistr les salaires mensuels suivants :
- 54 salaris gagnent 6 000 dirhams ou plus ;
- 34 salaris gagnent 8 000 dirhams ou plus ;
- 20 salaris gagnent 10 000 dirhams ou plus ;
- 8 salaris gagnent 12 000 dirhams ou plus ;
1. Prsenter ces donnes dans un tableau avec des classes de mme amplitude en
sachant quaucun salari ne gagne plus de 14 000 DH.
2. Calculer la moyenne et donner sa signification.
3. Calculer la mdiane et donner sa signification.
4. Calculer le mode graphiquement, algbriquement et donner sa signification.
5. Combien gagnent les 20% des salaris les mieux pays.
Exercice 2 :
La rpartition des salaris dune entreprise de confection selon leurs gains
mensuels (en milliers de dirhams) se prsente comme suit :
Gains mensuels effectifs
[4-6[
[6-8[
[8-12[
[12-18[
[18-20[
20 et plus
25
40
58
27
6
4
1. dterminer graphiquement le salaire modal
2. calculer le coefficient de variation
3. calculer ltendue
4. calculer algbriquement et graphiquement la mdiane.
STATISTIQUE DESCRIPTIVE
Page 55
Exercice 3 :
La rpartition par ge dune population dun centre de vacances est comme suit :
Classe dage (en annes) effectifs
0-5
5-15
15-25
25-35
35-45
45-55
55-60
60-75
75-100
16
42
44
40
30
32
15
36
15
1. tracer lhistogramme de cette distribution
2. calculer lcart type et donner sa signification
3. on dsire rajeunir cette population en invitant au centre des vacances des
personnes de la classe [25-35[.combien faudrait-il en faire venir pour que
la moyenne de la population soit de 35 ans.
Exercice 4 :
Dans une commune urbaine, on a relev la rpartition en pourcentages de
10 000 contribuables selon le montant des impts pays.
Classes dimpts Frquences relatives en pourcentages
1-3
3-6
6-L2
L2-12
12-18
18-22
22-30
8
12
20
26
F6
10
6
1. Trouver les valeurs manquantes de ce tableau sachant que la moyenne est gale
11,42
2. tracer la courbe cumulative croissante
3. dterminer graphiquement et algbriquement limpt mdian. donner sa signification
4. quel est le pourcentage des contribuables qui paient un impt annuel suprieur
20 000dh ?cela reprsente combien de personnes ?
Exercice 5 :
Soit la distribution statistique suivante qui donne la rpartition des propritaires
terriens selon la superficie des terres cultivables dans une certaine rgion agricole :
Superficie des terres en hectares Nombre de propritaires
2-4
4-8
8-14
14-20
20-40
40-100
24
36
22
18
14
6
STATISTIQUE DESCRIPTIVE
Page 56
Partie I :
1. prciser le caractre tudi et prciser sa nature.
2. donner la signification de du centre de la 2
me
classe.
3. dterminer rapidement la mdiane et donner sa signification
4. dterminer algbriquement le mode et donner sa signification
5. calculer la superficie moyenne et lcart type. Que peut on conclure ?
6. dterminer le 1
er
et le 9
me
dcile et donner leurs significations
Partie II :
1. dterminer graphiquement la concentration foncire dans cette rgion agricole,
Calculer lindice de GINI
2. dterminer algbriquement la concentration
3. dterminer graphiquement le pourcentage des propritaires dont la superficie des
terres est infrieure la mdiale.
Exercice 6 :
Pendant 9 annes les bnfices dune entreprise ont augment :
de 4% par an pendant les 3 premires annes.
de 7% par an pendant les 4 annes suivantes.
De 10% par an pendant les 2 dernires annes de la priode considre.
Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?
Exercice 7 :
Le tableau suivant donne la rpartition des salaires mensuels des cadres dune
entreprise :
Salaires en 1000DH Nombre des cadres
6-8
8-10
10-16
16-22
22-30
30-34
34-38
50
70
80
50
50
80
20
total 400
1. prciser le caractre tudi et sa nature
2. reprsenter graphiquement cette distribution, tracer le polygone des frquences
3. dterminer rapidement :
- le salaire mdian des cadres donner sa signification.
- Le 3
me
quartile (Q3). donner sa signification.
4. donner graphiquement le salaire modal des cadres.
5. calculer le salaire moyen des cadres.
6. Calculer le coefficient de variation et donner sa signification
7. Pour motiver davantage ses cadres, lentreprise dcide une augmentation gnrale des
salaires de 20%. Calculer la nouvelle moyenne et le nouveau coefficient de variation.
1L-cours-statistiques.doc
STATISTIQUES

I) UN PEU DE VOCABULAIRE

Toute tude statistique s'appuie sur des donnes. Dans le cas ou ces donnes sont numriques (99% des cas), on
distingue les donnes discrtes (qui prennent un nombre fini de valeurs : par ex, le nombre de voitures par
famille en France) des donnes continues (qui prennent des valeurs quelconques : par ex, la taille des animaux
d'un zoo).
Dans le cas d'une srie discrte, le nombre de fois ou l'on retrouve la mme valeur s'appelle l'effectif de cette
valeur. Si cet effectif est exprim en pourcentage, on parle alors de frquence de cette valeur. (cf 17 p82)
Dans le cas d'une srie continue, on rpartit souvent les donnes par classes. (cf 13 p82)

Dans les exercices, les donnes se prsenteront donc ainsi :

donnes "en vrac"
discrtes
tableau des effectifs ou des frquences
donnes "en vrac"
donnes numriques
continues
donnes rparties par classes


Le but des statistiques est d'analyser les donnes dont on dispose :
Pour cela, on peut s'aider d'un graphique : Nous verrons notamment cette anne les diagrammes btons, les
histogrammes et les diagrammes en botes (ou moustaches).
On peut aussi chercher dterminer la moyenne ou la mdiane de la srie. De tels nombres permettent
notamment de comparer plusieurs sries entre elles. On les appelle indicateurs statistiques ou paramtres
statistiques. On distingue les indicateurs de position (qui proposent une valeur "centrale" de la srie) et les
indicateurs de dispersion (qui indiquent si la srie est trs regroupe autour de son "centre" ou non).
Nous tudierons cette anne les indicateurs statistiques suivants :

Indicateurs de position : Indicateurs de dispersion :
mode, classe modale tendue
mdiane, classe mdiane quartiles, dciles cart interquartile
moyenne cart type

1L-cours-statistiques.doc
II) DIAGRAMMES A BATONS OU HISTOGRAMMES

1) Quelles diffrences voyez-vous entre les deux graphiques ci-dessous ?

1
1
2 3 4 5 6
Diagramme btons


0 1
1
2 3 4 5 6
Histogramme

Dans le diagramme btons, l'axe des abscisses n'est pas gradu et la largeur des btons ne signifie rien.
Dans l'histogramme, l'axe des abscisses est gradu et les btons sont donc "colls" les uns aux autres.
L'histogramme est donc surtout utilis pour reprsenter graphiquement des sries continues o les donnes ont
t rparties en classes.
Attention, Excel appelle histogramme les diagrammes btons et ne sais pas faire de vrais histogrammes !

2) Le cas des classes d'amplitudes diffrentes
Pour reprsenter la srie ci-contre, quel est le
graphique le plus quitable ?


10
1
20 30 40 50 60 70 80 90 0
Histogramme 1


10 20 30 40 50 60 70 80 90 0
Histogramme 2
1 personne


L'histogramme 1 est inadapt car il laisse entendre que la majorit des gens psent moins de 50 kg !
L'histogramme 2 est quitable car on a pondr la hauteur de chaque bton en tenant compte de l'amplitude de
la classe. Pour construire ce deuxime histogramme, on ralise le tableau ci-dessous :
classe [0 ; 50[ [50 ; 60[ [60 ; 70[ [70 ; 90]
effectif 5 2 4 4
amplitude
effectif/amplitude

Remarques :
Dans l'histogramme 1, c'est la hauteur des btons qui permet de lire l'effectif.
Dans l'histogramme 2, c'est l'aire des btons qui permet de lire l'effectif.
Dans l'histogramme 2, nous n'avons pas trac l'axe des ordonnes, car il aurait fallu le graduer en nombre de
personnes par kilo ! Par contre, pour permettre la lecture du graphique, nous avons indiqu en lgende la
signification de l'unit d'aire.
Dans les exercices, quand les classes ont toutes la mme amplitude, on fait un histogramme de type 1,
quand les classes ont des amplitudes diffrentes, ont fait un histogramme de type 2.
poids (Kg) [0 ; 50[ [50 ; 60[ [60 ; 70[ [70 ; 90]
nbre de personnes 5 2 4 4
1L-exo-statistiques.doc : A, B, C, D, E, F, G, H
1L-cours-statistiques.doc
III) MODE, ETENDUE

1) Dfinitions
Si les donnes d'une srie sont discrtes, le mode est la ou les valeurs qui ont le plus grand effectif.
Si les donnes ont t rparties en classes, on parle alors plutt de classe modale.
L'tendue d'une srie est la diffrence entre la plus grande valeur et la plus petite.

2) Dans les exercices :
a) Donnes discrtes 9, 11, 8, 10, 13, 12, 10, 11, 10
Faisons le tableau des effectifs :
valeur 8 9 10 11 12 13
effectif

Le mode est la valeur qui a le plus gros effectif, c'est dire
13 8 5 donc l'etendue de cette serie est

Remarque :
Ici, vu le petit nombre de donnes, faire un tableau des effectifs est un peu artificiel. Par contre, ds que l'on
travaille sur un nombre important de donnes, il devient vite trs utile pour mettre en vidence le mode et
l'tendue de la srie.

b) Donnes rparties par classes
classe [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20]
effectif 0 5 14 2

La classe modale est la classe qui a le plus gros effectif, c'est dire la classe
20 5 = 15 donc l'tendue de cette srie est infrieure ou gale

Remarque :
Par simplification, on dira souvent que l'tendue est 15 mais c'est un abus de langage ! En effet, dans le
tableau des donnes ci dessus, rien ne permet d'affirmer que les valeurs extrmes sont 5 et 20 !
1L-cours-statistiques.doc
IV) MEDIANE, QUARTILES, DECILES

1) Dfinitions
Soit une srie range par ordre croissant. Appelons n l'effectif total de la srie.

Dfinitions Pour dterminer le rang
La mdiane

C'est la valeur "centrale" de la srie. On dit qu'elle
partage la srie en deux moitis
si n est impair :
la mdiane est la valeur de rang
si n est pair :
nous prendrons la moyenne des deux valeurs qui sont
au centre de la srie, c'est dire dont les rangs
entourent le nombre
Les quartiles (partagent la srie en 4 : il y en a donc )

Le 1
er
quartile Q1 est la plus petite valeur telle que
25% des donnes lui soit infrieures ou gales.
Le 3
me
quartile Q3 est la plus petite valeur telle que
75% des donnes lui soit infrieures ou gales.


Q1 est la valeur dont le rang est le premier entier
suprieur ou gal
Q3 est la valeur dont le rang est le premier entier
suprieur ou gal
Les dciles (partagent la srie en 10 : il y en a donc )

Le 1
er
dcile D1 est la plus petite valeur telle que
10% des donnes lui soit infrieures ou gales.
Le 9
me
dcile D9 est la plus petite valeur telle que
90% des donnes lui soit infrieures ou gales.


D1 est la valeur dont le rang est le premier entier
suprieur ou gal
D9 est la valeur dont le rang est le premier entier
suprieur ou gal

Remarques :
Les trois nombres Q1, md, Q3 partagent la srie en 4 parts gales ( une unit prs)
Q2 D
Si les donnes ont t rparties en classes, on ne peut dterminer la mdiane exacte. En revanche, on appellera
classe mdiane, la classe qui la contient (et permet donc d'en donner un encadrement).
L'intervalle [Q1 ; Q3] s'appelle l'intervalle interquartile.
Le nombre Q3 Q1 s'appelle l'cart interquartile.


1L-cours-statistiques.doc
2) Dans les exercices :
a) Donnes discrtes "en vrac" 21, 25, 28, 30, 27, 24, 31, 21, 28, 30, 25, 28, 26, 25

Ordonnons la srie par ordre croissant :
21, 21, 24, 25, 25, 25, 26, 27, 28, 28, 28, 30, 30, 31

Il y a 14 termes :

14+1
2
= 7,5. La mdiane est donc la demi somme des
me
et
me
termes : md =
+
2
=

14
4
= 3,5. Le 1
er
quartile est donc le
me
terme : Q1 =

314
4
= 10,5. Le 3
me
quartile est donc le
me
terme : Q3 =
8 5 3. L'ecart interquartile est donc


b) Tableau d'effectifs
valeur 1 2 3 4 5 6
effectif 6 11 25 19 15 5
effectif cumul

L'effectif total est de

81+1
2
= 41. La mdiane est donc le
me
terme : md =

81
10
= 8,1. Le 1
er
dcile est donc le
me
terme : D1 =

81
4
= 20,25. Le 1
er
quartile est donc le
me
terme : Q1 =

381
4
= 60,75. Le 3
me
quartile est donc le
me
terme : Q3 =

981
10
= 72,9. Le 9
me
dcile est donc le
me
terme : D9 =


c) Donnes rparties par classes
classe [0 ; 2[ [2 ; 4[ [4 ; 6[ [6 ; 8]
frquence 10% 38% 45% 7%
frquence cumule

48% des valeurs sont
Et 93% des valeurs sont
La classe mdiane est donc la classe
On peut donc en dduire l'encadrement suivant md <



Bien interprter la dernire ligne !
La valeur 3 va du rang au rang
Bien interprter ce tableau !
45% des valeurs sont comprises
entre
93% des valeurs sont
p80: 3, 4
1L-exo-statistiques.doc : I, J, K, L
vido-projecteur : 1L-cmp-quartiles.xls
1L-cours-statistiques.doc
3) Diagrammes en botes

Le diagramme en bote d'une srie l'allure suivante :
min md Q1 Q3 max
axe gradu


Remarques :
Lorsque la srie est trop importante, que l'on ne connat pas les valeurs extrmes ou qu'on les considre
comme non significatives, on raccourci souvent les moustaches au dciles D1 et D9.
La bote centrale reprsente l'intervalle interquartile et contient donc la moiti des donnes.
Vous devez lgender votre diagramme (min, max, nom de la srie) et graduer l'axe.
On emploie surtout ce type de diagramme pour comparer plusieurs sries entre elles.
Ces diagrammes ont reu beaucoup de noms diffrents : botes pattes, diagrammes moustaches,

Ex :
Deux classes de 1L comparent leurs rsultats du trimestre et dclarent : "nos classes ont le mme profil puisque
dans les deux cas la mdiane des rsultats est 10". Qu'en pensez-vous ?

notes 5 6 7 8 9 10 11 12 13 14 15 16
effectifs 1L1 0 3 4 4 5 7 3 4 2 1 0 0
effectifs 1L2 2 4 3 3 3 4 3 2 2 3 1 2

1) Vrifier que les deux mdianes valent 10 et dterminer les quartiles de chaque srie
2) Tracer cte cte les diagrammes en boites de ces deux sries.

Pour la 1L1 : L'effectif total est 3+4+4++1 = 33
33+1
2
= 17 donc la mdiane est le 17
me
terme de la srie : Md = 10
33
4
= 8,25 donc le 1
er
quartile est le 9
me
terme de la srie : Q1 = 8
333
4
= 24,75 donc le 3
me
quartile est le 25
me
terme de la srie : Q3 = 11

Pour la 1L2 : L'effectif total est 2+4+3++2 = 32
32+1
2
= 16,5 donc la mdiane est la moyenne des 16
me
et 17
me
terme de la srie : Md =
10+10
2
= 10
32
4
= 8 donc le 1
er
quartile est le 8
me
terme de la srie : Q1 = 7
332
4
= 24 donc le 3
me
quartile est le 24
me
terme de la srie : Q3 = 12

Diagrammes en botes :




Bilan : Le graphique ci- dessus met bien
en vidence que l'cart interquartile et l'tendue sont plus resserrs en 1L1 qu'en 1L2 donc les lves de 1L1 ont
globalement un niveau plus homogne que ceux de 1L2.

5 10 15
notes
max min
1L1
1L2
p81: 7
p82: 12
1L-exo-statistiques.doc : M, N, O, P
vido-projecteur : 1L-outil-boites-a-moustaches.xls
1L-cours-statistiques.doc
V) MOYENNE, ECART TYPE, DONNEES GAUSSIENNES


1) Dfinitions

Soit la srie statistique ci-contre :
valeurs x1 x2 xp
effectifs n1 n2 np

La moyenne est : x =
n1x1 + n2x2 + + npxp
n1 + n2 + + np


L'cart type est : =
n1(x1 x) + n2(x2 x) + + np(xp x)
n1 + n2 + + np


Remarques :
L'cart type mesure la dispersion de la srie autour de sa moyenne.
Vous entendrez aussi parler de variance de la srie. Il s'agit en fait de
2

V =
n1(x1 x) + n2(x2 x) + + np(xp x)
n1 + n2 + + np

L'avantage de l'cart type sur la variance est qu'il s'exprime, comme la moyenne, dans la mme unit que les
donnes.
Dans le cas de donnes regroupes en classes, on ne peut calculer la valeur exacte de la moyenne ou de l'cart
type. On peut toutefois en dterminer une bonne approximation en remplaant chaque classe par son milieu
dans les formules ci-dessus.


2) Dans les exercices :
a) Tableau des frquences
valeurs 12 13 14 15 16
frquences 0,05 0,17 0,43 0,30 0,05
x =


=


b) Donnes rparties en classes
classes [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20[
effectifs 7 12 14 2

Remplaons chaque classe par son milieu :
x





AP sur l'cart type puis reprendre les donnes, les prsenter dans un
tableau d'effectif et en dduire les 2 formules ci-dessous
p82: 13, 14
1L-exo-statistiques.doc : Q, R, S
Salle info : 1L-cmp-moyenne-ecart-type.xls
1L-cours-statistiques.doc
3) Proprits
a) Addition ou Multiplication de toutes les donnes par un mme nombre :
Ex Soit la srie : 10, 12, 14. x = et =
Ajoutons 2 : la nouvelle srie est : 12, 14, 16. x = et =
Divisons par 2 : la nouvelle srie est : 6, 7, 8. x = et =

Cas gnral : Soit un rel quelconque :
Si l'on ajoute toutes les donnes, la moyenne augmente d'
l'cart type ne change pas
Si on multiplie toutes les donnes par , la moyenne est multiplie par
l'cart type est multiplie par


b) Moyennes partielles
Ex : Sur les 5 premires interros, Paul a eu 12,5 de moyenne. Il vient d'avoir 15,5 la 6
me
interro.
Les notes ayant toutes le mme coefficient, quelle est sa nouvelle moyenne ?
La somme des notes des 5 premires interros est : 12,5 5
La somme des notes des 6 interros est donc : 12,5 5 + 15,5
La nouvelle moyenne est donc : x =
12,5 5 + 15,5
6
= 13

Cas gnral : Si on runis deux groupes disjoints ayant respectivement pour moyennes et effectifs, x1 et n1
d'une part, x2 et n2 d'autre part, la moyenne de l'ensemble sera alors :
x =
n1 x1 + n2 x2
n1 + n2



4) Moyenne et mdiane
Quand on modifie les valeurs extrmes d'une srie, la moyenne change contrairement la mdiane qui ne
change pas. On dit que la moyenne est "sensible aux valeurs extrmes".
Il arrive que certaines de ces valeurs extrmes soient douteuses ou influent de faon exagre sur la moyenne.
On peut alors, soit calculer une moyenne lague (c'est dire recalculer la moyenne sans ces valeurs
gnantes), soit utiliser la mdiane.
Comment interprter un cart entre la moyenne et la mdiane ?
Soit la srie suivante :
8 9 10 11 12

Ici la moyenne et la mdiane sont identiques : la srie est bien "centre".
Soit la nouvelle srie :
8 9 10 12 14

Ici la moyenne est plus importante que la mdiane : la srie est plus "tale vers la droite".


p82: 16, 17
1L-exo-statistiques.doc : T, U, V