Vous êtes sur la page 1sur 67

Technicien Spcialis en Commerce

SOMMAIRE
Gnralits :................................................................................................................................ 2
I. Dfinitions :.................................................................................................................... 2
II. Apport de la statistique aux conomistes : ..................................................................... 2
III. Les limites de la mthode statistique : ........................................................................... 2
IV. Le vocabulaire utilis en statistique : ............................................................................. 3
V. Quelques symboles mathmatiques utiliss : ................................................................. 5
Chapitre I : La reprsentation graphique .................................................................................... 6
I. Le diagramme en btons : .............................................................................................. 6
II. Le tuyau dorgue : .......................................................................................................... 6
III. Le diagramme :............................................................................................................... 7
IV. Le polygone des frquences : ......................................................................................... 7
V. La courbe cumulation (courbe des f cumuls) : ............................................................. 8
VI. Le diagramme polaire : .................................................................................................. 9
VII. Les graphiques secteurs :........................................................................................... 11
Chapitre II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE ........................... 12
INTRODUCTION.................................................................................................................... 12
SECTION 1 .............................................................................................................................. 12
I. LES MOYENNES....................................................................................................... 12
II. La mdiane (Me) .......................................................................................................... 23
III. Le Mode : ................................................................................................................. 25
IV. Le choix dune caractristique de tendance centrale :.............................................. 27
SECTION 2 .............................................................................................................................. 28
I. Lintervalle de variation ou ltendue : ........................................................................ 28
II. Lintervalle inter quartile : ........................................................................................... 29
III. Lcart absolu moyen : ............................................................................................. 31
SECTION III ............................................................................................................................ 33
I. La dtermination algbrique de la concentration ......................................................... 33
II. La dtermination graphique de la concentration la courbe de Lorentz GINI............... 35
Chapitre III :Les Sries double entres : Rgression Linaire (Corrlation) ........................ 37
I- notion de tableau de contingence : ............................................................................... 37
II- gnralisation du tableau de contingences : ................................................................. 38
III- La rgression linaire ................................................................................................... 39
IV- la corrlation linaire :.................................................................................................. 43
Chapitre IV : Analyse des sries chronologiques..................................................................... 47
I Gnralits : .................................................................................................................... 47
II lanalyse de la tendance longue : trend .................................................................... 48
CHAPITRE V :Populations et chantillons, recensements et sondages .................................. 49
I. Quelques termes de base : ............................................................................................ 49
II. Exemples: ........................................................................................................ 50
III. tapes d'une enqute statistique : .................................................................... 50
EXERCICES ............................................................................................................................ 52
STATISTIQUE DESCRIPTIVE
GENERALITES :
I. Dfinitions :
Statistique descriptive
- On appelle statistique la mthode scientifique qui vise observer, collecter,
analyser des donnes quantitatives.
- La statistique descriptive est la partie de la statistique qui sert dcrire un
phnomne, c--d de mesurer, classer les mesures, prsenter ces mesures par
quelques indicateurs de manire donner une ide simple et rapide d'un phnomne
tudi.
Les statistiques se sont des donnes chiffres relatives un phnomne tudi.
EX : des statistiques du chmage.
II. Apport de la statistique aux conomistes :
La statistique est un outil indispensable tant aux thoriciens qu'aux praticiens de
l'conomie.
1. La statistique est utile aux thoriciens :
- Elle permet de mettre en vidence (rvler) l'existence d'interdpendance entre
diffrents phnomnes conomiques. EX : M=P*T
- Elle permet de tester la validit d'une hypothse thorique.
Investissement = f (revenu) =0.76R+124
Consomm
Revenu thsauris
Epargn
Investi
2. La statistique est utile aux praticiens de l'conomie :
- La statistique permet aux entrepreneurs de mieux contrler la gestion de leurs
entreprises.
- Elle permet galement au pouvoir public de mieux dfinir leurs politiques
conomique, fiscale, montaire et d'emploi.
III. Les limites de la mthode statistique :
Pour viter des erreurs d'interprtation due une mauvaise utilisation statistique, il
faut savoir :
1. La statistique s'intresse au grand nombre, elle ignore les cas particuliers.
2. La rsultante d'un grand nombre d'informations peut tre diffrente de la
sommation de ces diffrentes informations.
*comportement collectif # sommation des comportements individuels
3. Quand on tudie un phnomne on n'est jamais certain que l'on dispose de
toues les informations le concernant.
Page 2
STATISTIQUE DESCRIPTIVE
4. Il ne faut pas oublier que la statistique n'est qu'un outil au service de
l'conomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse
conomique des rsultats.
- Les mmes causes # les mmes effets.
- Les corrlations mmes trs parfaites ne signifient pas toujours
qu'il y a interdpendance entre les phnomnes tudis.
IV. Le vocabulaire utilis en statistique :
1. Population statistique :
Ensemble sur lequel porte l'tude
Ex : Age des tudiants de 1
re
anne : l'ensemble tudi c'est l'ge.
2. Unit statistique :
Une population se compose d'lments chaque lment est appel
unit statistique.
EX : la population d'tudiants : l'unit statistique est un tudiant.
3. Caractre statistique :
C'est le critre retenu pour tudier une population
Continu
Il peut tre quantitatif discontinu, discret
Qualitatif
9 Un caractre est dit quantitatif lorsqu'il est mesurable
] Continu : c'est un caractre qui peut prendre toutes les valeurs
d'un intervalle donn.
EX : ge
] Discontinu : c'est un caractre qui ne peut prendre que quelques
valeurs dans un intervalle donn
EX : le nombre des frres, Mnage
9 Un caractre est dit qualitatif lorsqu'il n'est pas mesurable
EX : la nationalit, les catgories sociales professionnelles.
4. Modalit statistique : de caractre :
On appelle une modalit les diffrentes situations possibles d'un caractre.
EX : caractre sexe : modalits possibles : M/F
Caractre tat matrimonial : 4 modalits possibles :
clibataire/mari/divorc/veuf.
Page 3
STATISTIQUE DESCRIPTIVE
5. Effectifs (frquences absolues) :
C'est le nombre d'units statistiques relatif une modalit donne :
45Age Effectifs
17-18
18-19
19-20
200
350
50
Effectifs
total 600
6. Frquence relative :
C'est la part des effectifs d'une modalit.
EX : 200/600=33/100 est la frquence relative de premire modalit
7. Srie statistique :
Distribution de frquences, distribution de statistiques ou tableau statistique,
c'est un tableau qui nous donne l'ensemble des valeurs mesurant le caractre.
EX :
sexe Effectifs
Masc.
Fm.
200
100
Nombre
d'enfants
Arbre de
mnages
total 300 2 18
3 28
Salaires (dh) Effectifs 4 10
[40-60[ 10 5 4
[60-70[ 25
[70-80[ 05
total 60
total 40
Srie avec des classes.
8. Classes :
Srie simple.
On appelle classe un groupement de valeurs du caractre selon des intervalles
qui peuvent tre gaux ou ingaux.
Pour chaque classe on peut dfinir :
] Une limite infrieure
] Une limite suprieure
] Intervalle de classe (amplitude)= limite (sup)- limite (inf)
] Centre de classe = [limite (sup) + limite (inf)]/2
NB : [40-60[ signifie qu'on comptabilise les salaris qui gagnent entre 40 et 60DH,
en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.
Page 4
STATISTIQUE DESCRIPTIVE
V. Quelque symboles mathmatiques utiliss :
1. Les valeurs du caractre = x1, x2,., xi,., xn
Notes Nbre d'tudiants
1x 10 x1
2x 25 x2
3x 12 x3
4x 4 x4
2. Les effectifs sont symboliss par : x1, x2,., xi,., xn
x1, x2,., xi,., xn= N =effectif total
3. Frquence relative :
Fi = effectif de la modalit i / effectif total
4. L'oprateur somme (
_
)
Notation : n variables
n
x1+ x2+.+ xi+..+ xn=
_
xi
i =1
Proprits :
n n
_
axi = a
_
xi
i =1
n
i =1
n
_
a + xi =
_
_
a
_
xi = n a.
i
+ xi
i =1
5. L'opration de produit : (
[
)
Notation : le produit de x variable s'crit :
n
X1.x2.x3..xn =
[
xi
i =1
Proprit :
nn n
[
a = a
n
[
axi = a
n
[
xi
i =1 i=1 i =1
Page 5
STATISTIQUE DESCRIPTIVE
CHAPITRE I : LA REPRESENTATION GRAPHIQUE
L'intrt d'un graphique c'est de synthtiser des informations statistiques d'une
manir image, c'est dire globale.
I. Le diagramme en btons :
On s'en sert pour reprsenter des sries caractre discret.
Cordonn
Nombre d'enfants Nombre de mnage
0 25
1 42
2 38
3 15
4 6
5
40 .
30 .
20 .
10 .
. . . . . . .Les valeurs de
0 1 2 3 4 5 6 caractre
Abscisse
Total 128
II. Le tuyau dorgue :
On se sert de ce graphique pour reprsenter des sries caractre qualitatif
EX : La population une station balnaire est compose de :
Allemands : 45%
Franais : 30%
Espagnoles : 15%
Autres : 10%
5 0 %
4 5 %
4 0 %
Srie1
3 5 %
3 0 %
2 5 %
2 0 %
1 5 %
1 0 %
5 %
0 %
Allemands Franais Espagnoles Autres
Page 6
STATISTIQUE DESCRIPTIVE
III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont
regroupes en classe.
a. Cas ou les intervalles de classe sont gaux :
5 0 %
4 5 %
4 0 %
3 5 %
3 0 %
Allemands
F ran ais
E spagnoles
Autres
2 5 %
2 0 %
1 5 %
1 0 %
5 %
0 %
1
Remarque :
1) Lorsque une des limites de classe n'est pas prcise dans un tableau il
convient de prendre comme intervalle de classe le mme que celui de la classe
suivante ou prcdente.
2) La surface des rectangles est proportionnelle leur effectif.
b. Cas ou les intervalles de classe ne sont pas gaux :
EX : Rpartition de population selon leurs salaires.
2 5
Srie1
2 0
1 5
1 0
5
0
1 2 3 4 5 6 7 8 9
Pour tracer l'histogramme, on commence par corriger les effectifs.
IV. Le polygone des frquences :
Il permet de donner une image plus lisse du phnomne que l'histogramme. On
l'obtient en joignant les milieux des sommes des rectangles de l'histogramme.
Page 7
STATISTIQUE DESCRIPTIVE
. . . . . . . .
0 10 20 30 40 50 60
Remarque :
1) La surface sous le polygone = la surface de l'histogramme.
2) Lorsqu'il y a un trs grand nombre de classe, l'intervalle de classe devient de
plus en plus petit et le polygone de frquences se transforme en cours de frquence.
Courbe de frquences
V. La courbe de cumulation (courbe des f cumuls) :
Elle permet de connatre le nombre d'observations suprieures ou infrieures une
valeur donne.
Les 2 types de courbes de cumulation :
] Courbe cumulative croissante : permet de connatre le nombre
d'observations infrieures une valeur donne.
] Courbe cumulative dcroissante : il permet de connatre le nombre
d'observations suprieures une valeur donne.
a) Cas d'une variable continue :
Salaire xi Xi cumuls Xi cumuls
[10-20[ 9 9 65
[20-30[ 13 22 56
[30-40[ 22 44 43
[40-50[ 10 54 21
[50-60[ 7 61 11
[60-70[ 4 65 4
Total 65 Moins de la borne
suprieure
Plus de la
borne
infrieure
Page 8
STATISTIQUE DESCRIPTIVE
Remarque :
On obtiendrait le mme graphique si on remplace les frquences absolues par les
frquences relatives (les pourcentages)
Courbe cumule dcroissante
Courbe cumule croissante
70
60
50
40
30
20
10
0
1 2 3 4 5 6 7
b) Cas d'une variable discrte (discontinue)
NB d'enfants (xi) NB de mnage Xi cumuls Xi cumuls
1 5 5 65
2 10 15 60
3 30 45 50
4 20 65 20
Total 65 <=xi >=xi
Xi
65
40
20
10
Xi
0 1 2 3 4 5
VI. Le diagramme polaire :
On l'utilise pour reprsenter des sries chronologiques c'est dire des sries ou
les observations seront des temps rguliers.
Page 9
STATISTIQUE DESCRIPTIVE
a) Les principes des coordonnes polaires : un point M dans l'espace est
parfaitement repr :
] Si on connat ses coordonnes cartsiennes (x, y).
] Si on connat ses coordonnes polaires (e, o).
Y M
e
O
X
b) Le diagramme polaire :
Soit la srie chronologique suivante : chiffre d'affaire mensuel
Anne 1999 2000
Janvier 55 65
Fvrier 53 75
Mars 65 72
Avril 50 40
Mai 43 42
Juin 41 38
Juillet 35 32
Aot 30 34
Septembre 34 38
Octobre 40 40
Novembre 45 33
dcembre 55 45
L'ide est de prsenter chaque mois par un
axe, nous aurons donc 12 axes, chaque axe
faisant avec son voisin un angle.
Avr
.
30 .
20 .
10 .
Juillet . . . . . . . . .. . . . . . . . . . . . . Jan
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
10 .
20 .
30.
Oct.
Page 10
STATISTIQUE DESCRIPTIVE
VII. Les graphiques secteurs :
On les utilise pour reprsenter une srie exprime en pourcentages.
EX : Pourcentage de touristes.
F R
All
E sp
Autres
Page 11
STATISTIQUE DESCRIPTIVE
CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES
UN SERIE
INTRODUCTION
image.
Avec la reprsentation graphique nous avons vu comment synthtiser une srie avec
Dans ce chapitre nous allons voir comment synthtiser une srie par quelques chiffres.
Ces nombres sont appels caractristiques dune srie.
Soit les srie suivantes :
Serie1 : 78-79-80-83
Srie2 : 60-70-80-90-100
Srie3 : 1-1-1-1-396
Les sries ont toutes la moyenne 80 mme si elles sont trs diffrentes les unes que les autres.
Les valeurs de la 1
re
srie sont proches de la moyenne alors que celles de la 3me sont
loignes de la moyenne.
Il y a donc ncessit, pour rsumer une srie de donnes de la prsenter en 2 types de
caractristiques :
- les caractristiques de valeurs centrales.
- les caractristiques de dispersion.
SECTION 1 : Les Caractristiques de Valeur Centrale :
I. LES MOYENNES
A- La moyenne arithmtique :
A-1 Dfinition
Etant donne n observations qu'on va appeler X1,X2 ,X3,..Xi,.Xn on
appelle une moyenne arithmtique simple le nombre X
Somme de toutes les observations
X=
Le nombre d'observations
X =
x
1
+ x
2
+ ....... + x
i
+ ...... + x
n
n
Page 12
STATISTIQUE DESCRIPTIVE
n
_
x
i
:
X =
i =n : Une moyenne arithmtique simple
n
Lorsque les observations sont groupes c'est--dire que l'on observe
N1 fois X1
N2 fois X2
La moyenne arithmtique s'crit :
X =
x
1
+ x
1
+ ..... + x
2
+ x
2
+......
n
1
+ n
2
+.... + n
n
e
n
_
n
i
x
i
Une moyenne arithmtique pondre
X =
i =n
n
_
n
i
i =1
A-2 Application
Exercice1 : soit la srie de notes suivante : 2-6-12-10-12-10-10-6
X =
2 + 6 +12 +10 +12 +10 +10 + 6
=
68
8 8
X = 8 5,
Exercice2 : soit la srie des notes de l'exercice qui peut tre prsente de la
manire suivante :
Notes xi E ffectifs ni ni xi
X =
68
= 8 5,
8
n
_
n
i
x
i
2 1 2
6 2 12
10 3 30
X =
i =1
12 2 24
_
n
i
total 8 68
Page 13
STATISTIQUE DESCRIPTIVE
Exercice3 : soit les srie suivante :
rpartition selon l'age
age Ni Centre de
classe xi
ni xi
X=
3155
=35
85,
88
Annes
[20 ~ [25 8
[25 ~ [30 10
[30 ~ [35 20
[35 ~ [40 25
22,5
27,5
32,5
37,5
180
275
650
937,5
Moyenne de l'age ou l'age moyen
[40 ~ [45
15
[45 ~ [50
10
42,5
47,5
637,5
475
TOTAL 88 3155
a-3 Mthode des simplifications des calculs
Lorsque les calculs sont compliqus, on peut les simplifier en prcdant un
changement de variable
Par changement d'chelle : Tout variable Xi peut s'crire : Xi= a X'i
a= nouvelle chelle Xi= nouvelle variable
Ex
Xi a * X'i Xi a * X'i
24 = 1 * 24 24 = 6 * 4
36 = 1 * 36 36 = 6 * 6
a=1 a = 6 X'i = 4
Xi = X'i a =6 X'i = 6
par changement d'origine et d'chelle : tout variable Xi peut s'crire
'
x +
i
= x
0
ax
i
X0 = nouvelle origine a : n.chelle X'i : n. variable
Ex :
Xi X0 a X'i
14 = 4 + 2 * 5
22 = 4 + 2 * 9
Page 14
STATISTIQUE DESCRIPTIVE
Si on pose x = x
+ ax
'
x
'
=
x
i
~ x
0
0i i i
a
La moyenne arithmtique :
X =
_
n
i
x
i
_
n
i
_
( )+
'
=
n
i
x
0
ax
i
_
n
i
=
_ _
+
'
0
x n
i
a n
i
x
i
X = x
0
_
n
i
+ a
_
'
n
i
x
i
_
n
i
=X x a+ X
' '
i
avecX
i
=
_
'
n
i
x
i
0
X0= n origine
a: n chelle
'
x : n variable
i
n
_ i
'
X = x +
0
a x
i
On utilise cette relation pour simplifier les calculs de la manire suivante
On prend pour X0 la valeur de caractre la plus frquente
On prend a l'intervalle des classes lorsque les classes sont gaux
Application :
Calculez la moyenne avec
Age effictifs xi xi= (xi- x0)/a ni*xi
changement du variable
x0 = 37,5 c'est le centre de
classe modale
a= 5
x'i =( xi - x0)/5
20-25 8
25-30 10
30-35 20
35-40 25
40-45 15
45-50 10
22,5 -3
27,5 -2
32,5 -1
37,5 0
42,5 1
47,5 2
-24
-20
-20
0
15
20
=
_
'
n
'
X
i
x
i
total 88 -29
_
i
n
i
X = 37,5+5(-29/88)=35,8 ans
Page 15
STATISTIQUE DESCRIPTIVE
a-4 calcul de la moyenne arithmtique l'aide des frquences relatives
X =
_
n
i
x
i
=
n x
n+ x
+ ...... + n
i
x
i
+ n
n
x
n
_
n
i 1 1 2 2 _
n
i
X =
n
i
x
i
+
n
2
x
2
+......... +
n
n
x
n
_
n
i _
n
i _
n
i
= f
i
x
i
+ f
2
x
2
+ ........ + f
n
x
n
ni
: frquence relative
_
ni
xi Ni fi fixi
d'o : X = f1x1 +f2x2 +...+fnxn
X =
_
fixi
10 5
11 8
12 10
13 12
14 5
0,125
0,20
0,25
0,30
0,125
1,25
1,6
2,5
3,6
0,75
X =12,7
B- La moyenne gomtrique :
b-1 Dfinition
40 12,7
tant donne n observations connues individuellement (x1,x2,x3,,,,,,,,,,, xn)
on appelle moyenne gomtrique simple de ces n observations la grandeur G t.p :
G=
n
X .1 X
.....2
Xn = (X .1 X
....2
Xn)
1/n
1
i =n n
G =
[
x
i
i 1=
b-2 calcul de G
lorsque les observations sont groupes ; chaque pondr Xi sera pondr
par l'effectif correspondant, la moyenne gomtrique s'crit :
G =
n
X .1 X .1 X1* X .2 X .2 X2 * X3* X
3X3
G= X1
n
.
1
X 2
n2
.X 3
n3
....Xn .
n
nn
N= n1+n2 +...+nn
calculer G est plus facile en passant par le logarithme, en effet.
Page 16
STATISTIQUE DESCRIPTIVE
G=
n
X .1 X
....2
Xn = (
)X .1 X .2 X .....3
Xn
1/ n
log G = 1/n log (X1.X2...Xn)
= 1/n[ ]log X1+ log X 2..... + log Xn
_
log Xi
Log G=
Ni
La moyenne gomtrique pondre
=G
n
n1
x1
n
2
.x
2
n
n
........x
n
=G (
)
n
x
1
.
1
x
n
2
.......
2
1
x
nn n
n
logG
(
)x
1
log
.
n
x
n x........
n
(xlo
g
n
1
x.
n
2
x.....
n
)
n
1
=
1
2
n
2
2
n
=
1
n
x n n x n
n
1 log.
+
1 2
log
2
+ +......
n
=
n
log G =
_
n
i
_
log x
i
n
i
Application : calculer la
xi ni log xi ni log xi
moyenne gomtrique
logG =
7 316 ,
= 0 9145 ,
2 1
6 2
10 3
12 2
0,301
0,772
1
1,158
0,301
1,556
3,0
2,158
8
G = 10
0,9145
= ,8 2
Total 8 7,316
Page 17
STATISTIQUE DESCRIPTIVE
C- la moyenne harmonique :
c-1 Dfinition
tant donne n observations connues individuellement x1,x2,x3 ...xn
on appelle moyenne hormique le nombre H tel que :
1
=
1
x
1
H
+
1
+...... +
x
2
n
1
x
n
_
=
1
x
i
n
H =
n
1
_
x
i
moyenne harmonique simple.
Si les observations sont groupes la moyenne harmonique s'crit :
1
x .
1
x
x+ .
1
x
+..... + n
n
.
1
_
n
i
1
1 2
1
=
2
x
n
=
x
i
M n
1
+ n
2
+
n......
n
_
n
i
_
n
i
=H
Moyenne harmonique pondre
_
n
i
1
x
i
xi ni 1/ xi ni.1/ xi
c-2 Application
2 1
6 2
10 3
12 2
0,5
0,166
0,1
0,083
0,5
0,332
0,2
0,166
1
=
_
x
i
H n
i
total 8 1,298
1
x
=
,1 298
i
8
H =
8
= 616,
, 1 298
c-3 Remarque
1
_
n
i
1
x
i _
n
i
.X
i 1
=
H
_
n
i
=
_
n
i
avecX
i
=
x
i
L'inverse de la moyenne = moyenne des inverses
Page 18
STATISTIQUE DESCRIPTIVE
D -La moyenne quadratique :
Dfinition : Etant donn n observations connues individuellement X1 ;
X2 ;..xn
2
Q =
x x+
2
+
2
+ x
n
Q
_
=
i
x
2
12 2 .....
2
n n
Q =
_
x
i
2
m
n
oyenne quadratique simple
si les observations sont groupes, la moyenne quadratique scrit :
22 2
Q
2
=
n
1
.x
1
+ n
2
.x
2
+...... + n
n
.x
n
n
1
+ n
2
+...... + n
n
2
Q =
_
Q =
2
n
i
.x
i
_
2
n
i
.x
i
moyenne quadratique pondre
n
_ i
n
_ i
Application :
xi Ni Xi Ni. Xi
2
=
_
=
2
=
Q
i
n .x
i
_
n
i
664
83 8
2 1
6 2
10 3
4
36
100
4
72
300
Q = 83 = 9 1. 12 2 144 288
_
2
total 8 664
Q
2
=
i
n .x
i
i
n
_
=
_
i
n .X
i
avecX
_ i
n
i
= x
2
i
Carr de la moyenne = la moyenne des carrs
Page 19
STATISTIQUE DESCRIPTIVE
Gnralisation de la notion moyennes :
d.1- moyenne d'ordre r
on appelle moyenne d'ordre r la quantit Mr tel que :
1
rr r n
M =
x
1
+ x
2
+........ + x
n
r n
rr r
r
M =
x
1
r
+ x
2
+.... + x
n
n
M
1
=
1
x
+ x
2
+ x
3
+....... + x
n
M
1
Si r= 1
1 1
= X
n
22 2
si r= 2
M
2
=
x
1 + x
2
+....... + x
n
M
2
= Q
2
M = Q
n
2 2 2
si r= -1
~1
M
~1
=
x
1
~1
~1
+ x2
~1
+ ...... + x
n
1
= H
~1
=
1
M 1
= H
si r=r 0.
n
M
r 0
= G
M
~
1
H
d.2- le classement des moyennes : les ingalits entre les moyennes :
On dmontre que les moyennes s'ordonnent selon la valeur de r c--d
que si :
1
r < r
2
M
1r
<
2 1~
M
r
Ce qui nous donne : M
< M
0
< M
1
< M
2
H < G < X < Q
Dans notre exemple, on trouve : 6,16 <8,2 <8,5 < 9,11.
d-3 Le choix d'une moyenne :
En thorie, aucune moyenne n'est meilleure que l'autre. L'utilisation de telle
moyenne dpend du problme pos.
Exemple :
Ex1 : Soit un petit jardin sous forme de rectangle, le propritaire ne peut se souvenir
que d'un seul chiffre. 9
4 4
9
S'il veut entourer son champs de fil de fer il a intrt se souvenir de la
moyenne arithmtique car le primtre est li la somme des diffrents cts.
Page 20
STATISTIQUE DESCRIPTIVE
S'il veut mettre de l'engrais son jardin, il a intrt se souvenir de la
moyenne gomtrique
X =
9 + 4 + 9 + 4
= ,6 ;5 G
=
4
9 * 4 = 6
moyenne arithmtique du primtre =26 =6,5 * 4 = 6 * 4
moyenne gomtrique : surface =36 =6*6 = 6,5 * 6,5
Gnralits :
D'une manire gnrale, on retient la moyenne arithmtique quand les variables
s'additionnent, et on utilise la moyenne gomtrique lorsque les variables se
multiplient.
Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h.
Vitessemoy = =
100 +
taledistonceto
160
=
100 +160
tempstotal
100
+
160 100.
1
+160
1
MH
=
_
i
n
50 80 50 80
_
i
n .
1
x
i
La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par
les distances.
Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.
Vitesse
moy.
( )
=
taldistonceto
=
1 50
+ (3 )80
X =
_
i
n
i
x
_ i
n
tempstotal 1+ 3
La vitesse moyenne est gale donc la moyenne arithmtique des vitesses
pondres par le temps.
Ex 4 : Une grandeur S0 a augment sur 3 annes, d'abord de 10% puis de 15% et
30% pour le 3
me
anne.
Quel est le taux moyenne de croissance ?
1
re
anne : S0 devient S1=S0 + (S0*10/100) S1 =S0(1+0,10 ) = 1,10S0
2me anne S1 devient S2 = S1 +0,15S1 S1*1,15 (S1*(1+0,15))
3me anne S2 devient S3 = S2 +0,3S2 = 1,3S2 (S2*(1+0,3))
S3 = S01,1 1,15 1,3
Moyenne gomtrique G =
3
1
1,
115
,
13, =11804,
Remarque: le taux de croissance moyenne est 18,04%
Page 21
STATISTIQUE DESCRIPTIVE
Ex 5 : Un tudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la
moyenne des carts entre les notes et la moyenne arithmtique.
X=
8 +10 +12
=10
3
Ecart type la moyenne moyenne arithmtique des carts = (-2+0+2)/3
8-10 = -2
10-10 =0
12-10 =2 moyenne arithmtique des carts = 0
On retrouve ici une des proprits des moyennes arithmtiques :
i
~ X) 0
_
(x =
Dmonstration :
x ~ x =
_ _ _i
i
x ~ nx =
_
x
i
~ n
_
x
i
= 0
n
Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne
quadratique
( )2
2
(0)
2
(2)
2
8
Q
2
=
~
+ +
=
3 3
=Q
8
=1 6,
3
Page 22
STATISTIQUE DESCRIPTIVE
II. La mdiane (Me)
b-1 - Dfinition :
On appelle mdiane d'une srie classe par ordre croissant ou
dcroissant, la valeur du caractre qui partage en deux parties gales les effectifs.
C'est la valeur du caractre telle que la moiti des effectifs lui est
suprieure et l'autre lui est infrieure.
b-2 - Calcul de ME :
Cas d'une variable discrte
Si la srie a un nombre impair de terme
75 62 57 12 18 Me =57
Si la srie a un nombre pair
12 25 32 44 52 69 Intervalle Mdian [32-44]
On prend le centre de l'intervalle comme la mdiane :
Cas d'une srie de classes :
Salaires Effectifs Effectifs cumuls
10-15 9 9
15-20 25 34
20-25 32 66
25-30 16 82
Le calcul de la mdiane se fait en 3
tapes :
1re tape : on repre le rang de la
mdiane. Rang = 82/2 = 41
Total 82
2me tape : on repre la classe de Me :
Rang =
_
ni
2
Il s'agit de trouver la classe laquelle appartient le 41
me
individu,
pour cela on classe les individus par ordre croissant des salaires, ce qui revient
construire la colonne des effectifs cumuls. .
Me [20-25], on peut calculer avec plus de prcision Me en faisant une
interpolation linaire.
3me tape : l'interpolation linaire :
On connat les salaires des 34 individus 20
On connat les salaires des 66 individus 25
Le 41
me
individus c'est le 7me individus que je rencontre dans la classe 20 -25,
son salaire sera obligatoirement gal 20 + supplment que l'on calcule par
interpolation.
En supposant que les 32 individus de la classe 20-25 sont rpartis d'une manire
uniforme dans la classe
20-25 puis sont spars par la mme quantit de salaire
On raisonne alors de la manire suivante :
Si pour 32 individus nous avons un cart de salaire de 5 DH
Page 23
STATISTIQUE DESCRIPTIVE
Pour 1 individu 5/32
Pour 7 individus 5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moiti des effectifs gagnent plus de 21,09 DH et l'autre moiti gagne (moins de
21,09 DH)
b-3- Dtermination graphique de la mdiane :
Courbe cumulative
b-4-Remarque :
Salaire Xi Xi
10 15 9 9
15 - 20 25 34
20 - 25 32 66
25 - 30 16 82
Total Xi =82
Page 24
STATISTIQUE DESCRIPTIVE
Mthode rapide dinterpolation :
Me ~
25 ~
20
=
20
41 ~ 34
Me
66 ~ 34
=
7 5
32
+ 20 = 21
2. le 41 me individu normalement la mdiane devrait se situer entre le 41
me et le 42 me, mais on convient lorsque les effectifs sont nombreux de
prendre (N / 2)
III. Le Mode :
Cest la valeur du caractre le plus frquent.
A- Calcul Mode :
1- Cas dune variable discrte :
Xi ni
3 3
14 18
21 7
42 4
Xi Ni
2 4
17 16
33 15
39 16
51 8
Mo =14 Mo = 17
Srie
Uni modal Mo = 39
Srie bimodale
Srie plurimodale (srie plusieurs modes)
Page 25
STATISTIQUE DESCRIPTIVE
2-Cas dune srie de classe :
Salaires ni
10 15 9
15 20 25
20 25 32
25 - 30 16
Total 82
-Nous avons une classe modale : 20 25
- On peut prendre comme mode le centre de classe 22,5
- On peut chercher obtenir le mode avec plus de prcision :
1/ Par Mthode graphique : Elle consiste dabord construire lhistogramme
N.B : Ne pas oublier, lorsqu on construit lhistogramme de corriger les
effectifs.
2/ Par la mthode algbrique :
Mo = L1 + [d1. I / (d1 + d2)]
Mo = 20 +
( 32 ~ 25 ) *
5
(32-25) + (32 - 16)
Page 26
STATISTIQUE DESCRIPTIVE
L1 : Limite Infrieure de classe modale
d1 : La diffrence entre les effectifs de la classe modale et les effectifs de
classe prcdente
d2 : La diffrence entre les effectifs de classe modale et les effectifs de
classe suivante
i : Lintervalle de la classe modale
IV. VI- Le choix dune caractristique de tendance centrale :
A : Les conditions de Yule :
1 r conditions : Une modalit caractristique doit tre : dfinie de faon
objective. (2 personnes diffrentes doivent trouver le mme rsultat)
2 me conditions : Tenir compte de toutes les observations
3 me conditions : tre facile comprendre
4 me conditions : tre facile calculer
5 me conditions : Doit se prter au calcul algbrique
B : Comparaison des diffrentes caractristiques de tendance centrale :
1-La moyenne :
Elle rpond parfaitement aux conditions de Yule ; cest pour
cela quelle est la caractristique la plus utilise, mais il y a des cas ou il faut lui
prfrer la mdiane quand elle risque dtre influenc des valeurs extrmes.
EX:
Notes Xi Ni * Xi
1 1 1
16 2 32
17 5 85
18 2 36
10 154
X = 154 / 10 = 15,4
X = 153 / 9 = 17
2-La mdiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la mdiane ne change pas quand on augmente la valeur
dune observation qui lui est infrieure
15 22 34 41 60 122 34 41 110
1 2 34 41 60
Page 27
STATISTIQUE DESCRIPTIVE
3-Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est
utile, en particulier quand on cherche la valeur la plus typique dune srie :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.
SECTION 2 : Les Caractristiques de Dispersion:
Partons de 3 sries
Srie 1 : 9 11
Srie 2 : 5 15
Srie 3 : 1 19
_
X = 10
_
X = 10
_
X = 10
Les 3 sries ont la mme moyenne : 10 et portant ils sont
diffrents lunes des autres.
Dans la 1
re
srie ; les valeurs du caractre sont proches de la
moyenne. La moyenne est reprsentative.
Dans la 3 me Srie les valeurs du caractre sont loignes de la
moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les
valeurs sont proches ou loignes de la valeur centrale.
Ce nombre est appel caractristiques de dispersion.
I. intervalle de variation ou ltendue :
Cest la diffrence entre la plus grande valeur du caractre et la plus petite.
Lintervalle de variation = Val MAX Val MIN
A = 2 Srie 1
A = 10
srie 2
A = 18
Srie 3
Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il
dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes.
EX :
17.1820.60.Age
1000 tudiants
A = 3
A = 60 ~ 17 = 43
Page 28
STATISTIQUE DESCRIPTIVE
II. intervalle inter quartile :
A- Dfinition des quartiles :
On appelle 1
r
quartile Q1 la valeur du caractre tel que : 25%
des observations lui sont infrieurs et 75% lui sont suprieurs. 25% < ; 75%>
2
me
quartile Q2= Me 50% < 50%>
3
m
quartile Q3= 75%< 25%>
B- Dfinition inter quartile :
On appelle inter quartile : Q3 Q1 diffrence entre 1r quartile
et 3me quartile.
N.B : Intervalle Inter quartile contient 50% des observations
C- Application :
N= 82
Rang : 82/4 =20 ,5
Classe : [15-20]
Interpolation : 15+ A
Salaires Effectifs
10-15 9
15-20 25
20-25 32
25-30 16
Total 82
Ecart I. Inter quartile
Q3 Q1
=24,3 - 17,3
= 7DH
Ni Cum
9
34
66
82
Interprtation : Si 25 individus Augmentation de 5 DH
Si 01 Individu Augmentation 5/25 DH
(20,5 - 9) = 11,5 5/25 * 11,5
Donc Q1 = 15 + 5/25 *11,5 = 17,3 DH
2me Mthode :
Page 29
STATISTIQUE DESCRIPTIVE
Calcul de Q3
Rang : 82*3/4 =61,5
Classe = [20-25]
Interpolation : si 32 individus augmentation de 5 DH
01 Individu Augmentation de 5/32
(61,5 34) = 27,5 individus Augmentation 5/32 *27,5
Donc Q3 = 20+ [(5/32) *27,5]
Signification : 24,3dh cest le salaire tel que 75% gagnent plus de 24,3 et 25%
gagnent moins de 24,3 DH.
Inter. Inter quartile : 7 DH = Q3-Q1
Signification : pour 50% des effectifs lcart Maximum de salaire est de 7 DH
D Remarque :
1- Les dciles : valeur du caractre que 10 % des observations ont une valeur qui
est infrieure D1 et 90% des observations ont une valeur qui est suprieure
D1.
On appelle 9 me dcile de 9 la valeur du caractre tel que 90% des observations
lui sont infrieures, et 10% des observations lui sont suprieures. Lintervalle
inter dcile D9 - D1 contient 80% des observations
2- Les percentiles :
On appelle percentiles P1 la valeur du caractre telle que un pourcent (1%) des
observations ont une valeur infrieure P1 et 98% ont une valeur suprieure
P1.
Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de
calculer lintervalle inter percentile P93 P07 qui contient 86% des observations.
Page 30
STATISTIQUE DESCRIPTIVE
cart absolu moyen :
A- Dfinition : On appelle cart absolu moyen que lon dsigne par la
moyenne arithmtique des carts absolus entre les valeurs du caractre et
la moyenne arithmtique.
_
Ca=
_
ni xi ~ x /
_
ni
B- Application : soit le tableau suivant :
Poids ni xi ni * xi
_ _
xi ~ x ni xi ~ x
55-60 12
60-65 17
65-70 36
70-75 24
75-80 11
57,5
62,5
67,5
72,5
77,5
690
1062,50
2430
1740
852,50
10,25
5,25
0,25
4,75
9,75
123
89,25
9
114
107,25
100 6775 442,5
Ca= 442.5 / 100 = 4.42 Kg X = 67.75 Kg
Signification : Ca = 4.42 Kg signifie quen moyenne, chaque individu
sloigne de la moyenne (67.75 Kg) de 4.42 Kg.
Remarque : Pour dire si une dispersion est grande ou non, pour comparer
deux sries entre elles, on se sert de lindice de dispersion relatif = Ca / X *100
Exemple :
Poids de filles Poids des garons
X=52 Kg X=68 Kg
Ca= 2 Kg Ca = 17 Kg
2/52 *100= 3.8% 17/68 * 100 = 25%
Dispersion Faible dispersion plus importante
IV- La variance et lcart type :
A- Dfinition :
On appelle une variance la moyenne arithmtique des carrs des carts entre les
valeurs du caractre et la moyenne arithmtique.
c
2
=
_
ni(xi ~ x)
2
/
_
ni
Page 31
STATISTIQUE DESCRIPTIVE
On appelle cart-type (ou cart quadratique moyen) la racine carr de 6
2
_
=c
_ _
ni(xi ~ x)
2
/ ni
B- Application :
Le mme tableau prcdent
(xi- X)
2
ni*(xi- X)
2
105,0625
27,5625
0,0625
22,5625
95,0625
1260,75
468,5625
2,25
541,50
1045,6875
3318,75
_
=c
_
_
ni(xi ~ x)
2
/
ni = 3318.75/100 =5.76
Signification : En moyenne chaque individu scarte du poids moyen
(67.5 kg) de 5.76 kg.
C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cfficient de
variation = / X
Ex :
X =67.75 Kg / X=(5.76/67.75) *100= 8.5%
Ex 2 :
Soient 2 modles dampoules lectrique dont on a relev les dures de
vie.
Modle 1 : Dure de vie moyenne 1400 H.
Modle 1 : Dure cart-type =100 H
Modle 2 : Dure de vie moyenne 1800 H.
Modle 2 : Dure cart-type = 250 H
Page 32
STATISTIQUE DESCRIPTIVE
Modle I Modle II
6/ X=100/1400 = 7% 250/1800 *100 = 14%
Le modle I est plus faible que le modle II
Formule dveloppe :
Donc c =
_
ni xi
2
x
2
_
ni
Poids ni xi xi
2
ni * xi
2
55-60 12
60-65 17
65-70 36
70-75 24
75-80 11
57,5
62,5
67,5
72,5
77,5
330625
390625
455625
525625
600625
39675
66406,25
164025
126150
66068,75
100 462325
c
2
= 462325 - (67.75)
2
= 33.19
100
=c 33
19.
=5.76
SE CTION III : Les Caractristiques de Concentration
La concentration ne sapplique qu des sries statistiques ou la concentration
de la variable a un sens
EX : on peut parler de la concentration de revenus, concentration foncire
Autres EX : on ne peut pas parler de concentration dge
On peut dterminer la concentration soit algbriquement soit graphiquement
I. La dtermination algbrique de la concentration
Cette dtermination ncessite la connaissance de la mdiale
Notion de la mdiale (Ml)
A- La mdiale
Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la
mdiale est la valeur du caractre qui partage en deux parties gales le produit
cumul de ni xi.
Si xi dsigne un salaire
Ni dsigne le nombre de salaris
Page 33
STATISTIQUE DESCRIPTIVE
Le produit cumul des ni xi reprsente la totalit des salaires Verss
_
Cest--dire la masse salariale.
nixi
La mdiale, cest le salaire tel que la moiti de la masse salariale a servi payer
une partie qui touche moins de cette Mdiale et lautre moiti de la masse s a servi
payer les gens qui touchent plus de cette Mdiale.
B- Mesure de la concentration
AM sert mesurer la diffrence entre ML et ME :
AM=ML ME
* Si AM = 0 cela veut dire que ML =ME
C'est--dire l'individu qui est au milieu l'effectif est en mme
temps celui qui est plac tel que la moiti de la masse salariale a t
verse des gens qui touchent moins que lui, et l'autre moiti des gens
qui reoivent plus que lui, on a donc une distribution galitaire
concentration est nulle
* Si Am = 0 cela indique qu'il y a une concentration
* Si Am est faible par rapport l'intervalle de variation la concentration est
faible
* Si Am est important, la concentration est forte
Inter variation
C- application
salaire ni xi nixi nixi
10-15 8 12.5 112.5 112.5
15-20 25 17.5 437.5 550
20-25 32 22.5 720 1270
25-30 16 27.5 440 1710
total 82 1710
AM= ML ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linaire
720 5dh
1dh 5/720dh
(855-550) =3055 5/720*305dh
Donc ML= 20+5/720*350
}
ML = 22.12dh
A M = ML - ME
= 22 ,12 - 21,09 = 1dh
Page 34
STATISTIQUE DESCRIPTIVE
AM/inter varia = 1/20=5% concentration faible
L'intervalle de variation
tant gale : (30-10)=20
Signification ML = 22.12 dh
C'est le salaire tel que la moiti de la masse salariale a servi payer des
gens qui gagnent moins que 22.12 dh et l'autre moiti de la masse
salariale a servi payer les gens qui gagnent plus que 22.12 dh
II. La dtermination graphique de la concentration la courbe de Lorentz
GINI
A- la graphique de GINI
GINI propose de mesurer la concentration en mettant en abssices les
frquences cumules en%, et en ordonnes ni xi cumuls en %
salaire ni Fi% Fi% *n xi nixi Nixi% Nixi%cum
10-15 9 11 11 12.5 112.5 6.6 6.6
15-20 25 30.5 41.5 17.5 437.5 25.6 32.2
20-25 32 39 80.5 22.5 720 24.1 74.3
25-30 16 13.5 100 27.5 440 25.7 100
total 82 100 1710
Remarques :
/ : Diagonal de lgalit
: Aire de concentration
1) si 10% de la population touchent 10% du revenu, 20% de la
population touchent 20% du revenu. Dans le cas dune rpartition
galitaire du salaire, laire de concentration serait confondue avec
diagonal.
2) Dans le cas dune repartions illgalitaire parfaite des salaires,
(comme dans le cas thorique ou 0.1% de la population toucherait
99.99% de la masse salariale : la courbe
Page 35
STATISTIQUE DESCRIPTIVE
B)-Le coefficient de Gini :
Gini propose de calculer la concentration laide de coefficient suivant :
Aire de concentration
C=
Aire du triangle ABC
Aire de G
C =
5000(100*100/2)
On peu estimer laire de concentration de la manire suivant :
Aire de concentration = 5000-(S1+S2+S3+S3)
B S=1/2 a*b S1 = (116.6)
S2= (41.5-11)/2(6.6+32.2)
A S3= (80.5-41.5)/2(32.2+74.3)
A S4 = (100-80.5)/2(74.3+100)
n
_
Si = 4404
S = n/2(a+b)
b
Remarque : 0<c<1
c = 0 Concentration lev
c = 1 Concentration faible
Donc c=5000-4404/5000=0.12
C d les gens sont pareils
Page 36
STATISTIQUE DESCRIPTIVE
CHAPITRE III :LES SERIES A DOUBLE ENTREES :
REGRESSION LINEAIRE (CORRELATION)
I- notion de tableau de contingence :
A. une distribution statistique double
Cest une distribution ou lobservation seffectue selon 2 caractres.
EX : Rpartition des tudiants selon la taille et lge
Rpartition des logements selon le nbre de pices et superficie
superficie
nbr de piece
10-30 30-50 50-70 70-80 total
1 3 1
2 1 14 3 18
3 1 7 4 12
4 10 7 17
5 6 6 6
total 4 16 20 17 57
B. distributions marginales
Ce sont les distributions relatives la seul variable X ou Y
a- la rpartition des logements selon le nombre de pices (X)
Nbre de
pices (x)
Nbre de logement
1 4
2 18
3 12
4 17
5 6
total 57
Cette distribution qui concerne la seule variable x est applle distribution marginale (marginal
car on la trouve la marge du tableau statistique)
On peut calculer la moyenne de cette distribution, (et sa signification est le nbre de pices
moyenne par logement)
Moyenne appele moy.marginale note
b- la rpartition des logements selon la superficie :
superficie y Nbre de logements
10-30 4
30-50 16
50-70 20
70-80 17
total 57
Page 37
STATISTIQUE DESCRIPTIVE
Cette distribution qui concerne la seule variable y est appele distribution marginale on peut
calculer la moyenne (qui exprime la surface moy des logements) applle moy.marginal note
C. Les distributions conditionnelles :
On appelle distribution Conditionnelle la distribution ou lon a pos une condition sur lune
des variables.
Ex : Rparation de logements de 30-50m
Cette distribution est appele Distribution Conditionnelle parce que lon ne sintresse quaux
logements qui satisfont la condition de surface 30-50 m
2
.
On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pices des
logts de 30-50 m
2
) on appelle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
Remarque il existe autant de distributions conditionnelles relatives au caractre x que le
caractre y a de modalits
II- gnralisation du tableau de contingences :
x y Y1 Y2 . Yj . Ym total
X1 X11 X12 . X1j . X1m X1.
X2 X21 . X2j . X2m X2.
. .
Xi Xi1 Xi2 . Xij . Xim Xi.
. .
Xk Xk1 Xk2 . Xkj . Xkm Xk. total
x.1 x.2 . x.j . x.m x..
x1 x2 . . . xk = les modalits de x
y1 y2 . . . yk = les modalits de y
x1 .effectifs pour la 1
re
modalits de x et pour toutes les modalits de y
La distribution marginale de X :
X(xi) Xi.
1X X1.
2X X2.
. .
. .
iX Xi.
kX Xk.
Total X..
Page 38
STATISTIQUE DESCRIPTIVE
La distribution marginale de y :
y(xi) Xj.
1y X.1
2y X.2
. .
. .
iy X.i
my Xm.
Total X..
Distribution conditionnelle relatif X et Y
Dist. Conditionnelle relative X Dist. Conditionnelle relative Y
X Xij
y Xij
1X X1j
2X X2j
. .
. .
iX Xij
kX Xkj
1y Xi1
2y Xi2
. .
. .
iy Xij
my Xim
Total X.j
Total Xi.
III- La rgression linaire
A. Prsentation du problme :
Soit le tableau suivant :
qu
Prix
42 51 60 62 74 83 Total
70 1 1
75 1 1
77 1 1
80 1 1
86 1 1
93 1 1
Total 1 1 1 1 1 1 6
Ce tableau est un tableau de contingence ou les observations sont connues individuellement,
on peut prsenter plus simplement ce tableau de la manire suivante :
Page 39
STATISTIQUE DESCRIPTIVE
Nous avons un ensemble de points un nuage statistique qui nous indique que les prix est
les quantits voluent selon la mme tendance.
Il est possible de schmatiser ce nuage :
-Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil faudra
trouver.
a=pente de droite
b=ordonne lorigine
Une telle droite est appelle droite de rgression D(x)
A=coefficient de rgression
La rgression cest le fait de relier y x par une fonction
Calcule des paramtres de la droite de rgression :
B. la mthode des moindres carrs
Notion de moindres carrs :
Partons dun nuage statistique thorique :
- Il sagit de rsumer ce nuage par une droite.
- Soit y= ax+b lquation de la droite recherche.
- Pour toute valeur de x (xi) nous avons une valeur rellement observe y.
- Pour toute valeur xi, nous avons une valeur calcule sur la droite y.
- Pour toute une valeur xi, nous avons une erreur destimation gale | yi yi |.
Page 40
STATISTIQUE DESCRIPTIVE
- La droite de rgression idale doit tre de telle manire que la somme des erreurs
destimation doit tre la plus faible possible, | yi yi | doit tre minimum.
- Pour viter les valeurs absolues, on convient de calculer les carrs des erreurs. La
droite de rgression doit tre telle que :
(yi yi)
2
minimum, et on appelle cela la condition des moindres carrs.
C. Calcul des paramtres de la droite de rgression.
Il sagit de trouver y= ax + b sachant que : (yi yi)
2
min.
Remplaons yi par sa valeur (yi (axi+b))
2
min.
Posons (yi ax ; - f)
2
= Z (a , b).
Pour que Z soit minimum, il suffit dannuler (rendre nul) les drivs de ce polynme par
rapport a et par rapport b.
1 Calcul de b :
Supposons a est connu, et drivons par rapport a b et a.
dZ / db = 2 [ (yi ax ; -b)] (-1) = 0 Z = U
2
Z = 2UU
[yi ax ; -b) = 0
yi axi nb = 0 U = (yi ax ; -b)
Divisons par n, on obtient (yi / n axi / n b = 0
- aX = b
Donc :
b = - aX
La droite de rgression passe donc par le point moyen ( X , ).
2 Calcul des a :
ax
y
Y yi

M xi x
Xi
x0
X
Le paramtre a Que nous cherchons correspond la pente de la droite de rgression qui passe
par le point moyen M ( X ; ).
Procdons un changement dorigine, et prenons comme nouvelle origine le point moyen
M(x ; ), les nouvelles cordonnes deviennent :
Xi = xi X
Yi = yi -
La droite de rgression a pour quation y = ax
Page 41
STATISTIQUE DESCRIPTIVE
La condition des moindres carre scrit ;
(yi i)
2
min
(yi yi)
2
= (yi axi)
2
min
Drivons par rapport a : 2 [ (yi axi)] (-Xi) = 0
(yi axi)] Xi = 0 => (yi ai) Xi = 0 => xi yi a xi
2
= 0
Donc a = xi yi /xi
2
= (xi x) (yi - )/ (xi x)
2
3- lquation de la droite de rgression :
Dy(x) =
Y = ax + b
a = (xi - X) (yi - ) / (xi X)
2
b = - a
D Application:
Prix(x) Qts(y)
70 72
75 51
77 60
Dy (x) a pour quation:
Y = ax + b
_ _
_
xi xi
_
(x
i
~ x)(y
i
~ y)
80 62
86 74
33 83
a = =
x
_
2
_
(x
i
_
~ x)
2
481 372 _
~
x
i
=
x
n
~
= 481 / 6 = 80
y = 372 / 6 = 62
Trouver Dy (x).
xi - X yi - (xi- X) (yi - ) (xi- X)
2
-10
-5
-3
0
6
13
-20
-11
-2
0
12
21
200
55
6
0
72
273
100
25
9
0
36
169
a = 606 / 339 = 1.79
b = 62 (1.73)80
b = -81
Donc
Dy(x) a pour quation :
y = 1.79x 81
606 339
La loi de loffre pour ce bien
Page 42
STATISTIQUE DESCRIPTIVE
IV- la corrlation linaire :
Dans le paragraphe prcdent, nous avions estim y en fonction de x, et nous avions obtenu la
droite de rgression Dy(x)
On peut pour le mme nuage statistique estimer x en fonction de y, et trouver la droite de
rgression Dx(y) lui aura pour quation.
Pour toute yi, nous avons une valeur observe xi.
Pour toute yi, nous avons une valeur estime sur la droite xi
Pour toute yi, nous avons une erreur destimation gale | xi xi |
Dx(y) idale est tel que : | xi xi | minimum ou encore (xi xi)
2
minimum
En procdant de la mme manire que dans le paragraphe prcdent, on trouve lquation de
Dx(y).
X = ay + b
a = xi yi
2
yi
b = X a
Dans le rfrentiel XMY nous obtenons 2 droites :
Soit y = ax pour Dy(x)
Soit x = ay pour Dx(y)
Ou encore y = 1/a x
4 cas peuvent se produire :
1
er
cas : les 2 droites sont confondues
Y= ax
X = ay a = 1/a aa = 1
Y = 1/yx
Page 43
STATISTIQUE DESCRIPTIVE
2me cas : les 2 droite font entre elles un angle trs faible :
3me cas : les 2 droite font entre elles un angle lev :
4me cas : les 2 variables sont indpendantes lune de lautre :
Si on appelle coff de corrlation la Quantit r tel que : r
2
= a . a

, on peut crire :
- Si r = 1 on a une corrlation parfaite.
- Si r = +1 on a une corrlation parfaite positive.
- Si r = -1 on a une corrlation parfaite.
Corr. positive : c d les variables varient dans le mme sens.
- Si r = -1 = corrlation parfaite ngative.
C d les deux phnomnes varient en sens inverse.
Par exemple Prix et Quantit
- Si 0 < r < 1 = la corrlation est positive, elle est dautant plus forte que lon se
rapproche de 1.
- Si -1 < r < 0 = la corrlation est ngative, et elle est dautant plus forte que lon se
rapproche de -1.
- Si r = 0 = corrlation nulle.
Page 44
STATISTIQUE DESCRIPTIVE
Application : calculer le coefficient de corrlation dune autre faon (existe-t-il un lien entre y
et x).
~~ ~
Prix Qt
x
x
y -
(x x ) (yi - ) (x x )
2
(yi - )
2
70 42
75 51
77 60
80 62
86 74
33 83
606 339 1110
r
2
= a. a =
606

606
donc r = 0.98
339 1110
~ ~
_
x y
=
_
(x
~ x)( y ~ y)
a =
i i
2
_
ii
=
~
~
_
606
=1.79
ix
(x
i
~
x)
2
~
339
_
x y
=
_
(x
~ x)( y ~ y)
a =
i i
2
_
ii
=
~
~
_
606
= 0.545
iy
( y
i
y)
2
1110
On a une trs forte corrlation car r = 0.975 tend vers 1
: Remarque : lorsquon crit r
2
= a. a r = racine a .a, nous avons une expression trs
positif. Comment trouver alors le signe dune corrlation ?
Rponse : le sens de la corrlation est donne par le signe de a et a.
- Si a et a sont >0 le produit a.a >0 corrlation positive.
- Si a et a sont <0 le produit a.a>0 corrlation ngative.
On peut dire dune corrlation quelle est trs satisfaisante partir 0.86.
On peut dire dune corrlation quelle parfaite partir de 0.96.
IV formule facilitant les calculs :
1/ calcul de a :
a = (xi X) (yi - ) =
N
, N = x
i yi - xi
~ ~
x y
(xi x)
2
D
~
_
x
i
i + x
~
Or x =
=
N
_
y
i
N
xi = n x
yi = n
~~ ~
On remplace : N = xi yi - n x -n x + n x
~ ~
N =
_
x
i
y
i
~ n x y
~~ ~ ~
D = (xi x )
2
= (xi
2
2xi x + x
2
) = xi
2
2 x xi + n x
2
~ ~
= xi
2
2n x
2
+ n x
2
D = xi
2
nX
2
Page 45
STATISTIQUE DESCRIPTIVE
~ ~
_
x
i
y
i
~ n x y
Donc a =
~
2
_
x
2
~ n x
Formule dveloppe
xi yi Xi yi xi
2
x
2 calcul de r :
xi yi nX
r2= a.a a =
xi
2
nX
2
xi yi nX
a =
yi
2
n
2
Donc r = a *a'
V Autre formule de r :
[ (xi X) (yi - )]
2
r =
(xi X)
2
(yi - )
2
Or (xi X)
2

2
x = (xi X)
2
= n
2
x
n
(yi )
2

2
y = (yi )
2
= n
2
y
n
Donc r ==
_
[(x
i
~
~ x)( y
i
~
~ y)]
2
(xi X) (yi )
n.x. y
n
2
.
2
x.
2
y
Si on appelle : covariance de x et de y lexpression :
(xi X) (yi )
Cov (xy)
n
Cov (xy)
r scrit : r =
x.y
Page 46
STATISTIQUE DESCRIPTIVE
CHAPITRE IV : ANALYSE DES SERIES
CHRONOLOGIQUES.
I Gnralits :
A. Dfinition :
Une srie chronologique est une srie o les observations de la variable sont faites des
intervalles rguliers de temps.
B. les diffrentes composantes dune srie chronologique.
Soit la srie chronologique suivante : Evolution trimestrielle du chiffre daffaire dune
entreprise
trimtres 1 2 3 4
1998
1999
2000
2001
120
130
144
157
148
162
178
196
155
169
186
210
120
132
145
160
Reprsentation graphique de la srie :
Lexamen dune srie chronologique rvle lexistence de diffrences composantes :
Un mouvement de tendance longue ( long terme), appele trend .
Un mouvement saisonnier qui est les variations saisonnires.
Des variations accidentelles : ce sont des variations imprvisibles dues des circonstances
exceptionnelles.
C. intrt dune analyse dune srie chronologique :
Lanalyse des sries chronologiques permet de sparer le mouvement de long terme du
mouvement saisonnier, ce qui nous permettra de faire des calculs de prvision.
Page 47
STATISTIQUE DESCRIPTIVE
II lanalyse de la tendance longue : trend
Dterminer le trend, cela revient lisser la srie pour liminer les variations saisonnires,
cette technique de lissage de la srie est appele Ajustement. Les 2 mthodes dajustement
les plus utiliss sont :
La mthode des moyennes mobiles.
Lajustement analytique.
A. la mthode des moyennes mobiles :
Elle consiste diviser un nuage statistique en sous nuages comprenant chacune
(n1) donnes du sous nuages prcdent, et remplacer chaque sous nuage par un point tel
que : xi = mdiane des xi yi = moyenne des valeurs yi.
B. Oprations sur les matrices :
1 matrices transposes :
1 3 4 1 2
A = A = 3 -1
2 -1 5 4 5
2 Laddition :
1 -1 3 0 4 3 1 3 6
+ =
2 4 1 3 -1 -1 5 3 0
(aij) + (bij) = (aij + bij)
Proprits :
- commutativit
- association
- lment neutre
- lment symtrique a
ii
= 0
(n ;p)
la matrice nulle
t (a+b) = t
a
+t
b
3- Multiplication par un rel :
1 -1 3 3 -3 9
3 * =
2 4 1 6 12 3
Page 48
STATISTIQUE DESCRIPTIVE
CHAPITRE V :POPULATIONS ET ECHANTILLONS,
RECENSEMENTS ET SONDAGES
Les journaux, la tlvision, les revues nous inondent constamment de graphiques, de
tableaux et de statistiques de toutes sortes, dans diffrents domaines :
Sondages, rfrendums, popularit des partis politiques et de leur chef.
Social
Criminalit, suicide, avortement, racisme, pratiques religieuses, orientations
sexuelles, habitudes alimentaires.
Importations, exportations, prix de vente, taux d'inflation, indice des prix la
conomie consommation (IPC), taux d'intrt, salaires, taux de chmage, cotes
boursires, indices boursiers, dficits gouvernementaux.
Dmographie Taux de mortalit, taux de natalit, population par province, par nationalit.
Culture Entres au box office, cotes d'coutes.
tudes Rsultats scolaires, prts et bourses, cote R et cote Z.
Sports Meilleurs compteurs, classement des quipes, salaires des joueurs.
Ces prsentations peuvent parfois nous induire en erreur volontairement ou non.
Il nous faut donc dvelopper un esprit critique et savoir interprter ces
informations.
I. Quelques termes de base :
La population cible est l'ensemble de tous les objets que l'on tudie.
Une unit statistique est un objet de cette population.
Un chantillon est une partie choisie d'une population.
Le nombre d'objets composant une population ou un chantillon est appel sa taille.
Lorsque l'on veut connatre certaines caractristiques d'une population, on dit qu'on
enqute sur la population.
Une enqute peut tre ralise auprs de toute la population ou sur un chantillon.
Un recensement est une enqute ralise auprs de toute la population.
Page 49
STATISTIQUE DESCRIPTIVE
Un sondage est une enqute ralise sur un chantillon.
II. Exemples:
1. tude portant sur la langue maternelle des Qubcois:
la population est l'ensemble des Qubcois
et la caractristique est la langue maternelle.
2. tude portant sur la dure des ampoules lectriques produites l'usine X.
La population est constitue des ampoules lectriques produites l'usine X
et la caractristique tudie est la dure des ampoules.
3. Une compagnie pharmaceutique veut vrifier un nouveau vaccin contre une certaine maladie.
On administre ce produit 50 patients atteints de la maladie.
La population est forme de tous les gens atteints de la maladie,
l'chantillon est form des 50 patients qui on a administr le mdicament et la
caractristique tudie est la rponse au mdicament.
Les cots levs et les dlais trop longs, relis un recensement, sont les
principales raisons qui nous amnent utiliser un sondage puisque la taille d'un
chantillon est beaucoup plus petite que celle de la population.
Au Canada, il y a un recensement tous les cinq ans. Le dernier date de 1996.
III. tapes d'une enqute statistique :
1. Dterminer la population cible et les caractristiques de cette population que l'on veut
tudier.
2. Dterminer la manire dont l'chantillon va tre prlev.
Page 50
STATISTIQUE DESCRIPTIVE
3. Construire des instruments (questionnaires ou autres).
4. tablir un pr-test ou tude-pilote.
5. Recueillir les donnes.
6. Compiler les donnes.
7. Mettre en forme les donnes.
8. Analyser les donnes (analyse descriptive ou infrentielle).
9. Interprter les rsultats.
10. Communiquer les rsultats.
Page 51
STATISTIQUE DESCRIPTIVE
EXERCICES
Page 52
STATISTIQUE DESCRIPTIVE
I OBJ ECTIFS VISES :
1. construction dun tableau statistique :
2. distinguer une variable quantitative dune variable qualitative
3. reprsentation graphique des variables quantitatives discrtes et continues
4. calcul et interprtation des caractristiques de tendance centrale :
moyenne.
mdiane
mode
quartiles
5. calcul et interprtation des caractristiques de dispersion :
variance
cart type
coefficient de variation
Exercice 1 :
Dans une entreprise de 80 salaris on a enregistr les salaires mensuels suivants :
- 54 salaris gagnent 6 000 dirhams ou plus ;
- 34 salaris gagnent 8 000 dirhams ou plus ;
- 20 salaris gagnent 10 000 dirhams ou plus ;
- 8 salaris gagnent 12 000 dirhams ou plus ;
1. Prsenter ces donnes dans un tableau avec des classes de mme amplitude en
sachant quaucun salari ne gagne plus de 14 000 DH.
2. Calculer la moyenne et donner sa signification.
3. Calculer la mdiane et donner sa signification.
4. Calculer le mode graphiquement, algbriquement et donner sa signification.
5. Combien gagnent les 20% des salaris les mieux pays.
Exercice 2 :
La rpartition des salaris dune entreprise de confection selon leurs gains
mensuels (en milliers de dirhams) se prsente comme suit :
Gains mensuels effectifs
[4-6[ 25
[6-8[ 40
[8-12[ 58
[12-18[ 27
[18-20[ 6
20 et plus 4
1. dterminer graphiquement le salaire modal
2. calculer le coefficient de variation
3. calculer ltendue
4. calculer algbriquement et graphiquement la mdiane.
Page 53
STATISTIQUE DESCRIPTIVE
Exercice 3 :
La rpartition par ge dune population dun centre de vacances est comme suit :
Classe dage (en annes) effectifs
0-5
5-15
15-25
25-35
35-45
45-55
55-60
60-75
75-100
16
42
44
40
30
32
15
36
15
1. tracer lhistogramme de cette distribution
2. calculer lcart type et donner sa signification
3. on dsire rajeunir cette population en invitant au centre des vacances des
personnes de la classe [25-35[.combien faudrait-il en faire venir pour que
la moyenne de la population soit de 35 ans.
Exercice 4 :
Dans une commune urbaine, on a relev la rpartition en pourcentages de
10 000 contribuables selon le montant des impts pays.
Classes dimpts Frquences relatives en pourcentages
1-3 8
3-6 12
6-L2 20
L2-12 26
12-18 F6
18-22 10
22-30 6
1. Trouver les valeurs manquantes de ce tableau sachant que la moyenne est gale
11,42
2. tracer la courbe cumulative croissante
3. dterminer graphiquement et algbriquement limpt mdian. donner sa signification
4. quel est le pourcentage des contribuables qui paient un impt annuel suprieur
20 000dh ?cela reprsente combien de personnes ?
Exercice 5 :
Soit la distribution statistique suivante qui donne la rpartition des propritaires
terriens selon la superficie des terres cultivables dans une certaine rgion agricole :
Superficie des terres en hectares Nombre de propritaires
2-4 24
4-8 36
8-14 22
14-20 18
20-40 14
40-100 6
Page 54
STATISTIQUE DESCRIPTIVE
Partie I :
1. prciser le caractre tudi et prciser sa nature.
2. donner la signification de du centre de la 2
me
classe.
3. dterminer rapidement la mdiane et donner sa signification
4. dterminer algbriquement le mode et donner sa signification
5. calculer la superficie moyenne et lcart type. Que peut on conclure ?
6. dterminer le 1
er
et le 9
me
dcile et donner leurs significations
Partie II :
1. dterminer graphiquement la concentration foncire dans cette rgion agricole,
Calculer lindice de GINI
2. dterminer algbriquement la concentration
3. dterminer graphiquement le pourcentage des propritaires dont la superficie des
terres est infrieure la mdiale.
Exercice 6 :
Pendant 9 annes les bnfices dune entreprise ont augment :
de 4% par an pendant les 3 premires annes.
de 7% par an pendant les 4 annes suivantes.
De 10% par an pendant les 2 dernires annes de la priode considre.
Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?
Exercice 7 :
Le tableau suivant donne la rpartition des salaires mensuels des cadres dune
entreprise :
Salaires en 1000DH Nombre des cadres
6-8 50
8-10 70
10-16 80
16-22 50
22-30 50
30-34 80
34-38 20
total 400
1. prciser le caractre tudi et sa nature
2. reprsenter graphiquement cette distribution, tracer le polygone des frquences
3. dterminer rapidement :
- le salaire mdian des cadres donner sa signification.
- Le 3
me
quartile (Q3). donner sa signification.
4. donner graphiquement le salaire modal des cadres.
5. calculer le salaire moyen des cadres.
6. Calculer le coefficient de variation et donner sa signification
7. Pour motiver davantage ses cadres, lentreprise dcide une augmentation gnrale des
salaires de 20%. Calculer la nouvelle moyenne et le nouveau coefficient de variation.
Page 55
STATISTIQUE DESCRIPTIVE
II OBJ ECTIFS VISES :
1. Calcul de la fonction linaire
2. calcul et commentaire du coefficient de corrlation
3. interprtation des distributions marginales
4. interprtation des distributions conditionnelles
Exercice 8 :
Une entreprise a prsent ses dpenses de publicit et ses chiffres pour les 6
dernires annes dans le tableau suivant (en 10
6
DH)
Dpenses de publicit Chiffre daffaires
2 10
4 16
10 50
14 120
18 140
24 210
1. Lentreprise pense qu il ya un lien entre dpenses de publicit (X) et le chiffre
daffaire(Y).pouvez vous le confirmer ?
2. tablir par la mthode des moindres carrs la relation liant le chiffre daffaires et
les dpenses de publicit
3. combien lentreprise peut-elle esprer raliser comme chiffre daffaireS avec des
dpenses de publicit de 30 ?
Exercice 9 :
On a observ une population en retenant 2 caractres : le nombre denfants(X) et la
taille du logement (Y).les rsultats sont les suivants :
Nombre de pices 2 3 4 Total
Nombre denfants
1 22 15 9 46
2 7 38 22 67
3 0 7 30 37
Total 29 60 61 150
1. calculer le nombre moyen denfants et le nombre moyen de pices des logements.
~
2. calculer
3. calculer
x2 et donner sa signification
~
y
3
et donner sa signification
4. on se propose de voir sil existe un lien entre le nombre denfants et la surface des
logements. Confirmer
Page 56
STATISTIQUE DESCRIPTIVE
Exercice 10 :
Le tableau suivant donne la rpartition des salaris dune entreprise de btiment selon le
nombre denfants charge X et les salaires mensuels perus y en milliers de DH
Nombre de pices Y 1-3 3-5 5-9
Nombre denfants X
1 4 8 16
2 6 12 24
3 3 6 12
4 2 4 8
1. donner la distribution marginale de la variable X
2. donner la distribution conditionnelle de la variable Y lie la modalit 4 de X.
3. que signifient les valeurs 16 et 3 souligne dans le tableau
4. vrifier de deux manires diffrentes que les deux variables sont indpendantes.
Dites dans ce cas est gal le coefficient de corrlation linaire : r (sans le
calculer.
5. calculer la variance marginale de Y.
Exercice 11 :
Une tude ralise dans un club sportif concernant le poids et la taille de 124 adhrents
a fourni les informations suivantes :
poids en Kg Y 50-60 60-65 65-75 75-80
taille en mtres X
1,60-1,70 12 7 6 4
1,70-1,75 ? 6 8 3
1,75-1,80 9 8 8 4
1,80-1,90 ? 7 5 6
1,90-2,00 3 5 3 3
1. complter le tableau sachant quil y a 27 adhrents qui mesurent entre 1.70met
1.75m.
2. quels sont les caractres tudis ? Quelle est leur nature ?
3. que signifient les chiffres 7 et 8souligns dans le tableau
4. quelle est la moyenne du poids des adhrents ? Comment appelle-t-on cette
moyenne ?
5. quelle est la taille moyenne des adhrents ? Comment appelle-t-on cette
moyenne ?
6. en dsignant par X la taille et par Y le poids calculer et donner la signification
_
de y
2
_
7. donner sans la calculer la signification de x3
Page 57
STATISTIQUE DESCRIPTIVE
Exercice 12 :
Une entreprise commerciale a prsent ses ventes xi et ses frais de publicit yi au
cours du premier semestre de lanne 2003 comme suit (en 1000 DH)
Mois Ventes Frais de publicit
Janvier 40
Fvrier 30
Mars 42
Avril 46
Mai 44
juin 38
1.1
0.8
1.2
1.4
1.3
1.1
1. dterminer une fonction linaire qui donne le montant des ventes lorsquon
connat les frais de publicit.
2. quel serait le montant des ventes si les frais de publicit atteindront
3500DH.
3. dterminer sil y a ou non une liaison entre les ventes et les frais de
publicit.
Page 58