Vous êtes sur la page 1sur 58

SOMMAIRE

Gnralits : ...........................................................................................................................2

I. Dfinitions : ................................................................................................................2
II. Apport de la statistique aux conomistes : ...................................................................2
III. Les limites de la mthode statistique : .........................................................................2
IV. Le vocabulaire utilis en statistique : ...........................................................................3
V. Quelques symboles mathmatiques utiliss : ...............................................................5

Chapitre I : La reprsentation graphique .................................................................................6


I. Le diagramme en btons : ...........................................................................................6
II. Le tuyau dorgue : .......................................................................................................6
III. Le diagramme : ...........................................................................................................7
IV. Le polygone des frquences : ......................................................................................7
V. La courbe cumulation (courbe des f cumuls) : ...........................................................8
VI. Le diagramme polaire : ...............................................................................................9
VII. Les graphiques secteurs : ........................................................................................ 11

Chapitre II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE ........................... 12


INTRODUCTION ................................................................................................................ 12
SECTION 1.......................................................................................................................... 12
I. LES MOYENNES ................................................................................................... 12
II. La mdiane (Me) ....................................................................................................... 23
III. Le Mode : ............................................................................................................. 25
IV. Le choix dune caractristique de tendance centrale : ............................................ 27
SECTION 2.......................................................................................................................... 28
I. Lintervalle de variation ou ltendue : ......................................................................28
II. Lintervalle inter quartile : ........................................................................................ 29
III. Lcart absolu moyen : .......................................................................................... 31
SECTION III ........................................................................................................................ 33
I. La dtermination algbrique de la concentration........................................................ 33
II. La dtermination graphique de la concentration la courbe de Lorentz GINI ............... 35
Chapitre III :Les Sries double entres : Rgression Linaire (Corrlation) ........................ 37
I- notion de tableau de contingence : ............................................................................. 37
II- gnralisation du tableau de contingences : ............................................................... 38
III- La rgression linaire ................................................................................................ 39
IV- la corrlation linaire : .............................................................................................. 43

Chapitre IV : Analyse des sries chronologiques................................................................... 47


I Gnralits : ................................................................................................................ 47
II lanalyse de la tendance longue : trend .................................................................. 48

CHAPITRE V :Populations et chantillons, recensements et sondages ................................. 49


I. Quelques termes de base : ......................................................................................... 49
II. Exemples: ..................................................................................................... 50
III. tapes d'une enqute statistique : .................................................................. 50

EXERCICES ........................................................................................................................ 52
STATISTIQUE DESCRIPTIVE

Statistique descriptive
GENERALITES :
I. Dfinitions :
On appelle statistique la mthode scientifique qui vise observer, collecter,
analyser des donnes quantitatives.
La statistique descriptive est la partie de la statistique qui sert dcrire un
phnomne, c--d de mesurer, classer les mesures, prsenter ces mesures par
quelques indicateurs de manire donner une ide simple et rapide dun phnomne
tudi.
Les statistiques se sont des donnes chiffres relatives un phnomne tudi.
EX : des statistiques du chmage.

II. Apport de la statistique aux conomistes :


La statistique est un outil indispensable tant aux thoriciens quaux praticiens de
lconomie.
1. La statistique est utile aux thoriciens :
Elle permet de mettre en vidence (rvler) lexistence dinterdpendance entre
diffrents phnomnes conomiques. EX : M=P*T
Elle permet de tester la validit dune hypothse thorique.

Investissement = f (revenu) =0.76R+124


Consomm
Revenu thsauris
Epargn
Investi

2. La statistique est utile aux praticiens de lconomie :


La statistique permet aux entrepreneurs de mieux contrler la gestion de leurs
entreprises.
Elle permet galement au pouvoir public de mieux dfinir leurs politiques
conomique, fiscale, montaire et demploi.

III. Les limites de la mthode statistique :


Pour viter des erreurs dinterprtation due une mauvaise utilisation statistique, il
faut savoir :
1. La statistique sintresse au grand nombre, elle ignore les cas particuliers.
2. La rsultante dun grand nombre dinformations peut tre diffrente de la
sommation de ces diffrentes informations.
*comportement collectif # sommation des comportements individuels
3. Quand on tudie un phnomne on nest jamais certain que lon dispose de
toues les informations le concernant.

Page 2
STATISTIQUE DESCRIPTIVE

4. Il ne faut pas oublier que la statistique nest quun outil au service de


lconomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse
conomique des rsultats.
Les mmes causes # les mmes effets.
Les corrlations mmes trs parfaites ne signifient pas toujours
quil y a interdpendance entre les phnomnes tudis.

IV. Le vocabulaire utilis en statistique :

1. Population statistique :

Ensemble sur lequel porte ltude


Ex : Age des tudiants de 1reanne : lensemble tudi cest lge.

2. Unit statistique :
Une population se compose dlments chaque lment est appel
unit statistique.
EX : la population dtudiants : lunit statistique est un tudiant.

3. Caractre statistique :

Cest le critre retenu pour tudier une population


Continu
Il peut tre quantitatif discontinu, discret
Qualitatif
Un caractre est dit quantitatif lorsquil est mesurable
Continu : cest un caractre qui peut prendre toutes les valeurs
dun intervalle donn.
EX : ge

Discontinu : cest un caractre qui ne peut prendre que quelques


valeurs dans un intervalle donn
EX : le nombre des frres, Mnage

Un caractre est dit qualitatif lorsquil nest pas mesurable


EX : la nationalit, les catgories sociales professionnelles.

4. Modalit statistique : de caractre :

On appelle une modalit les diffrentes situations possibles dun caractre.


EX : caractre sexe : modalits possibles : M/F
Caractre tat matrimonial : 4 modalits possibles :
clibataire/mari/divorc/veuf.

Page 3
STATISTIQUE DESCRIPTIVE

5. Effectifs (frquences absolues) :

Cest le nombre dunits statistiques relatif une modalit donne :


45Age Effectifs
17-18 200
18-19 350
19-20 50
Effectifs total 600

6. Frquence relative :
Cest la part des effectifs dune modalit.
EX : 200/600=33/100 est la frquence relative de premire modalit

7. Srie statistique :

Distribution de frquences, distribution de statistiques ou tableau statistique,


cest un tableau qui nous donne lensemble des valeurs mesurant le caractre.
EX :
sexe Effectifs
Masc. 200 Nombre Arbre de
Fm. 100 denfants mnages
total 300 2 18
3 28
Salaires (dh) Effectifs 4 10
[40-60[ 10 5 4
[60-70[ 25 total 60
[70-80[ 05
total 40 Srie simple.

Srie avec des classes.

8. Classes :

On appelle classe un groupement de valeurs du caractre selon des intervalles


qui peuvent tre gaux ou ingaux.
Pour chaque classe on peut dfinir :
Une limite infrieure
Une limite suprieure
Intervalle de classe (amplitude)= limite (sup)- limite (inf)
Centre de classe = [limite (sup) + limite (inf)]/2
NB : [40-60[ signifie quon comptabilise les salaris qui gagnent entre 40 et 60DH,
en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.

Page 4
STATISTIQUE DESCRIPTIVE

V. Quelque symboles mathmatiques utiliss :

1. Les valeurs du caractre = x1, x2,, xi,, xn

Notes Nbre dtudiants


x1 10 x1
x2 25 x2
x3 12 x3
x4 4 x4

2. Les effectifs sont symboliss par : x1, x2,, xi,, xn


x1, x2,, xi,, xn= N =effectif total

3. Frquence relative :

Fi = effectif de la modalit i / effectif total


4. Loprateur somme ( )

Notation : n variables
n
x1+ x2++ xi+.+ xn= xi
i 1

Proprits :

n n

axi a xi
i 1 i 1
n n

a xi a xi n.a xi
i i 1

5. Lopration de produit : ( )

Notation : le produit de x variable scrit :


n
X1.x2.x3.xn = xi
i 1

Proprit :
n n n

a a n
i 1
axi a n
i 1
xii 1

Page 5
STATISTIQUE DESCRIPTIVE

CHAPITRE I : LA REPRESENTATION GRAPHIQUE


Lintrt dun graphique cest de synthtiser des informations statistiques dune
manir image, cest dire globale.

I. Le diagramme en btons :

On sen sert pour reprsenter des sries caractre discret.


Cordonn
Nombre denfants Nombre de mnage
40 .
0 25 30 .
1 42 20 .
2 38 10 .
3 15 . . . . . . . Les valeurs de
4 6 0123456 caractre
5
Abscisse
Total 128

II. Le tuyau dorgue :

On se sert de ce graphique pour reprsenter des sries caractre qualitatif


EX : La population une station balnaire est compose de :
Allemands : 45%
Franais : 30%
Espagnoles : 15%
Autres : 10%

50%

45%
Srie1
40%

35%

30%

25%

20%

15%

10%

5%

0%
Allemands Franais Espagnoles Autres

Page 6
STATISTIQUE DESCRIPTIVE

III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont
regroupes en classe.
a. Cas ou les intervalles de classe sont gaux :
50%

45%

40%
Allemands
35% Franais
Espagnoles
30% Autres

25%

20%

15%

10%

5%

0%
1

Remarque :
1) Lorsque une des limites de classe nest pas prcise dans un tableau il
convient de prendre comme intervalle de classe le mme que celui de la classe
suivante ou prcdente.
2) La surface des rectangles est proportionnelle leur effectif.

b. Cas ou les intervalles de classe ne sont pas gaux :

EX : Rpartition de population selon leurs salaires.

25

Srie1
20

15

10

0
1 2 3 4 5 6 7 8 9

Pour tracer lhistogramme, on commence par corriger les effectifs.

IV. Le polygone des frquences :


Il permet de donner une image plus lisse du phnomne que lhistogramme. On
lobtient en joignant les milieux des sommes des rectangles de lhistogramme.

Page 7
STATISTIQUE DESCRIPTIVE

. . . . . . . .
0 10 20 30 40 50 60

Remarque :
1) La surface sous le polygone = la surface de lhistogramme.
2) Lorsquil y a un trs grand nombre de classe, lintervalle de classe devient de
plus en plus petit et le polygone de frquences se transforme en cours de frquence.

Courbe de frquences

V. La courbe de cumulation (courbe des f cumuls) :

Elle permet de connatre le nombre dobservations suprieures ou infrieures une


valeur donne.
Les 2 types de courbes de cumulation :
Courbe cumulative croissante : permet de connatre le nombre
dobservations infrieures une valeur donne.
Courbe cumulative dcroissante : il permet de connatre le nombre
dobservations suprieures une valeur donne.

a) Cas dune variable continue :

Salaire xi Xi cumuls Xi cumuls

[10-20[ 9 9 65
[20-30[ 13 22 56
[30-40[ 22 44 43
[40-50[ 10 54 21
[50-60[ 7 61 11
[60-70[ 4 65 4
Total 65 Moins de la borne Plus de la
suprieure borne
infrieure

Page 8
STATISTIQUE DESCRIPTIVE

Remarque :
On obtiendrait le mme graphique si on remplace les frquences absolues par les
frquences relatives (les pourcentages)
Courbe cumule dcroissante
Courbe cumule croissante
70

60

50

40

30

20

10

0
1 2 3 4 5 6 7

b) Cas dune variable discrte (discontinue)

NB denfants (xi) NB de mnage Xi cumuls Xi cumuls


1 5 5 65
2 10 15 60
3 30 45 50
4 20 65 20
Total 65 <=xi >=xi

Xi

65
40
20
10
Xi
0 1 2 3 4 5

VI. Le diagramme polaire :


On lutilise pour reprsenter des sries chronologiques cest dire des sries ou
les observations seront des temps rguliers.

Page 9
STATISTIQUE DESCRIPTIVE

a) Les principes des coordonnes polaires : un point M dans lespace est


parfaitement repr :
Si on connat ses coordonnes cartsiennes (x, y).
Si on connat ses coordonnes polaires (e, o).

Y M
e
O
X
b) Le diagramme polaire :

Soit la srie chronologique suivante : chiffre daffaire mensuel

Anne 1999 2000


Janvier 55 65
Fvrier 53 75
Mars 65 72
Avril 50 40
Mai 43 42 Lide est de prsenter chaque mois par un
Juin 41 38 axe, nous aurons donc 12 axes, chaque axe
Juillet 35 32 faisant avec son voisin un angle.
Aot 30 34
Septembre 34 38
Octobre 40 40
Novembre 45 33
dcembre 55 45

Avr
.
30 .
20 .
10 .
Juillet . . . . . . . . .. . . . . . . . . . . . . Jan
80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80
10 .
20 .
30 .

Oct.

Page 10
STATISTIQUE DESCRIPTIVE

VII. Les graphiques secteurs :

On les utilise pour reprsenter une srie exprime en pourcentages.


EX : Pourcentage de touristes.

FR
All
Esp
Autres

Page 11
STATISTIQUE DESCRIPTIVE

CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES


DUN SERIE

INTRODUCTION

Avec la reprsentation graphique nous avons vu comment synthtiser une srie avec
image.
Dans ce chapitre nous allons voir comment synthtiser une srie par quelques chiffres.
Ces nombres sont appels caractristiques dune srie.

Soit les srie suivantes :


Serie1 : 78-79-80-83
Srie2 : 60-70-80-90-100
Srie3 : 1-1-1-1-396

Les sries ont toutes la moyenne 80 mme si elles sont trs diffrentes les unes que les autres.
Les valeurs de la 1re srie sont proches de la moyenne alors que celles de la 3me sont
loignes de la moyenne.
Il y a donc ncessit, pour rsumer une srie de donnes de la prsenter en 2 types de
caractristiques :
- les caractristiques de valeurs centrales.
- les caractristiques de dispersion.

SECTION 1 : Les Caractristiques de Valeur Centrale :

I. LES MOYENNES

A- La moyenne arithmtique :

A-1 Dfinition

Etant donne n observations quon va appeler X1,X2 ,X3,Xi,Xn on


appelle une moyenne arithmtique simple le nombre

Somme de toutes les observations


=
Le nombre dobservations

x1 x 2 ....... xi ...... x n

n

Page 12
STATISTIQUE DESCRIPTIVE

x i
i n : Une moyenne arithmtique simple
n
Lorsque les observations sont groupes c'est--dire que lon observe

N1 fois X1
N2 fois X2

La moyenne arithmtique scrit :

x1 x1 ..... x 2 x 2 ......

n1 n2 .... nn

n x i i
Une moyenne arithmtique pondre
i n
n

n i 1
i

A-2 Application

Exercice1 : soit la srie de notes suivante : 2-6-12-10-12-10-10-6

2 6 12 10 12 10 10 6 68

8 8
8,5

Exercice2 : soit la srie des notes de lexercice qui peut tre prsente de la
manire suivante :
Notes xi Effectifs ni ni xi

68
8,5 2 1 2
8 6 2 12
n

n x i i
10
12
3
2
30
24
i 1

n i
total 8 68

Page 13
STATISTIQUE DESCRIPTIVE

Exercice3 : soit les srie suivante : age Ni Centre de ni xi


rpartition selon lage classe xi
20 25 8 22,5 180
25 30 10 27,5 275

3155
35,85 Annes 30 35 20 32,5 650
88
Moyenne de lage ou lage moyen
35 40 25 37,5 937,5
40 45 15 42,5 637,5
45 50 10 47,5 475

TOTAL 88 3155

a-3 Mthode des simplifications des calculs

Lorsque les calculs sont compliqus, on peut les simplifier en prcdant un


changement de variable

Par changement dchelle : Tout variable Xi peut scrire : Xi= a Xi

a= nouvelle chelle Xi= nouvelle variable

Ex
Xi a * Xi Xi a * Xi

24 = 1 * 24 24 = 6 * 4

36 = 1 * 36 36 = 6 * 6

a=1 a=6 Xi = 4
Xi = Xi a =6 Xi = 6

par changement dorigine et dchelle : tout variable Xi peut scrire

xi x0 axi'

X0 = nouvelle origine a : n.chelle Xi : n. variable

Ex :
Xi X0 a Xi

14 = 4 + 2 * 5

22 = 4 + 2 * 9

Page 14
STATISTIQUE DESCRIPTIVE

xi x 0
Si on pose xi x0 axi' xi'
a

La moyenne arithmtique :

ni x i
ni

n x ax
i 0
'
i

n i

x n a n x '

0 i i i

n i

x a
n x i
'
i

n
0
i

x0 a avec ' '



n x i
'
i

n
i i
i

X0= n origine
a: n chelle
x0 a xi'
xi' : n variable

On utilise cette relation pour simplifier les calculs de la manire suivante


On prend pour X0 la valeur de caractre la plus frquente
On prend a lintervalle des classes lorsque les classes sont gaux

Application :

Age effictifs xi xi= (xi- x0)/a ni*xi


Calculez la moyenne avec 20-25 8 22,5 -3 -24
changement du variable 25-30 10 27,5 -2 -20
x0 = 37,5 cest le centre de 30-35 20 32,5 -1 -20
classe modale 35-40 25 37,5 0 0
a= 5 40-45 15 42,5 1 15
xi =( xi - x0)/5 45-50 10 47,5 2 20
total 88 -29
'

n x i
'
i

n
i
i

= 37,5+5(-29/88)=35,8 ans

Page 15
STATISTIQUE DESCRIPTIVE

a-4 calcul de la moyenne arithmtique laide des frquences relatives

n x i i

n1 x1 n2 x 2 ...... ni xi nn x n
n i ni
ni x i n x n x
2 2 ......... n n
ni ni ni
f i xi f 2 x 2 ........ f n x n

ni
: frquence relative
ni xi Ni fi fixi
10 5 0,125 1,25
do : = f1x1 +f2x2 +.+fnxn 11 8 0,20 1,6
12 10 0,25 2,5
= fixi 13
14
12
5
0,30
0,125
3,6
0,75
=12,7 40 12,7

B- La moyenne gomtrique :

b-1 Dfinition

tant donne n observations connues individuellement (x1,x2,x3,,,,,,,,,,, xn)


on appelle moyenne gomtrique simple de ces n observations la grandeur G t.p :

G= n X 1. X 2..... Xn ( X 1. X 2.... Xn) 1/n

1
in n
G xi
i 1
b-2 calcul de G

lorsque les observations sont groupes ; chaque pondr Xi sera pondr


par leffectif correspondant, la moyenne gomtrique scrit :

G = n X 1. X 1. X 1 * X 2. X 2. X 2 * X 3 * X 3 X 3 G= n X 1n1. X 2 n 2. X 3 n3.... Xn nn .
N= n1+n2 +..+nn

calculer G est plus facile en passant par le logarithme, en effet.

Page 16
STATISTIQUE DESCRIPTIVE

G= n X 1. X 2.... Xn X 1. X 2. X 3..... Xn
1/ n

log G = 1/n log (X1.X2..Xn)

= 1/n log X 1 log X 2..... log Xn

log Xi
Log G=
Ni

La moyenne gomtrique pondre

G n x1n1 .x 2n2 ........ x nnn


G x1n1 .x 2n2 ....... x nnn 1
n

1

log G log x1 .x2 ........ xn
n1 n2 nn

log x1n1 .x2n2 ..... xnnn
n n
n1 . log x1 n2 log x2 ...... nnnn
=
n

log G
n log xi i

n i

Application : calculer la xi ni log xi ni log xi


moyenne gomtrique 2 1 0,301 0,301
6 2 0,772 1,556
10 3 1 3,0
7,316 12 2 1,158 2,158
log G 0,9145 Total 8 7,316
8
G 100,9145 8,2

Page 17
STATISTIQUE DESCRIPTIVE

C- la moyenne harmonique :

c-1 Dfinition

tant donne n observations connues individuellement x1,x2,x3 ..xn


on appelle moyenne hormique le nombre H tel que :

1
1
1
x1

x2
...... 1
xn 1x
i

H n n

n
H
1
moyenne harmonique simple.
xi

Si les observations sont groupes la moyenne harmonique scrit :

1
x1 . 1
x1
x2 . 1
x2
..... n n . 1
xn n 1x
i
i

M n1 n2 ...... nn n
n
i

H
i

Moyenne harmonique pondre


n 1x
i
i

xi ni 1/ xi ni.1/ xi
2 1 0,5 0,5
6 2 0,166 0,332
10 3 0,1 0,2
c-2 Application 12 2 0,083 0,166
total 8 1,298

1 x i
1
xi 1,298

H ni 8
8
H 6,16
1,298

c-3 Remarque
1 n 1x
i
n .X 1
avecX i
i i i

H n i n i xi

Linverse de la moyenne = moyenne des inverses

Page 18
STATISTIQUE DESCRIPTIVE

D -La moyenne quadratique :

Dfinition : Etant donn n observations connues individuellement X1 ;


X2 ;..xn

Q
2 x12 x 22 ..... x n2
Q
2 xi2
n n

Q
x 2
i

n moyenne quadratique simple

si les observations sont groupes, la moyenne quadratique scrit :


n .x 2 n2 .x22 ...... nn .xn2
Q2 1 1
n1 n2 ...... nn

Q 2

n .x i
2
i
Q
n .x
i
2
i
moyenne quadratique pondre
n i n i

Application :
xi Ni Xi Ni. Xi

Q2
n .x
i
2
i

664
83
2 1 4 4
n i 8 6
10
2
3
36
100
72
300
Q 83 9.1 12 2 144 288

total 8 664

Q 2

n .x i
2
i

n .X i i
avecXi xi2
n i n i

Carr de la moyenne = la moyenne des carrs

Page 19
STATISTIQUE DESCRIPTIVE

Gnralisation de la notion moyennes :

d.1- moyenne dordre r

on appelle moyenne dordre r la quantit Mr tel que :

1
x r x 2r ........ x nr n
M r 1

n

x1r x2r .... xnr


M rr
n

x1 x 2 x3 ....... x n
Si r= 1 M 11 M 11
n

x12 x22 ....... xn2


si r= 2 M 22 M 22 Q 2 M 2 Q
n

x11 x21 ...... xn1 1 1


si r= -1 M 11 H 1 M1 H
n M 1 H

si r= 0. M 0 G

d.2- le classement des moyennes : les ingalits entre les moyennes :

On dmontre que les moyennes sordonnent selon la valeur de r c--d


que si : r1 r2 M r1 M r2 Ce qui nous donne : M 1 M 0 M 1 M 2
H GQ
Dans notre exemple, on trouve : 6,16 <8,2 <8,5 < 9,11.

d-3 Le choix dune moyenne :

En thorie, aucune moyenne nest meilleure que lautre. Lutilisation de telle


moyenne dpend du problme pos.

Exemple :

Ex1 : Soit un petit jardin sous forme de rectangle, le propritaire ne peut se souvenir
que dun seul chiffre. 9
4 4
9

Sil veut entourer son champs de fil de fer il a intrt se souvenir de la


moyenne arithmtique car le primtre est li la somme des diffrents cts.

Page 20
STATISTIQUE DESCRIPTIVE

Sil veut mettre de lengrais son jardin, il a intrt se souvenir de la


moyenne gomtrique

9494
6,5; G 9 * 4 6
4
moyenne arithmtique du primtre =26 =6,5 * 4 6 * 4
moyenne gomtrique : surface =36 =6*6 6,5 * 6,5

Gnralits :
Dune manire gnrale, on retient la moyenne arithmtique quand les variables
sadditionnent, et on utilise la moyenne gomtrique lorsque les variables se
multiplient.

Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h.


distoncetotale 100 160 100 160
Vitessemoy
tempstotal 100 160 1 1
100. 160
50 80 50 80

MH
ni
ni . 1 xi
La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par
les distances.

Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.

distoncetotal 1 50 3 80
Vitesse.moy
tempstotal 1 3

n x
i i

n i

La vitesse moyenne est gale donc la moyenne arithmtique des vitesses


pondres par le temps.

Ex 4 : Une grandeur S0 a augment sur 3 annes, dabord de 10% puis de 15% et


30% pour le 3me anne.

Quel est le taux moyenne de croissance ?

1re anne : S0 devient S1=S0 + (S0*10/100) S1 =S0(1+0,10 ) = 1,10S0


2me anne S1 devient S2 = S1 +0,15S1 S1*1,15 (S1*(1+0,15))
3me anne S2 devient S3 = S2 +0,3S2 = 1,3S2 (S2*(1+0,3))
S3 = S01,1 1,15 1,3

Moyenne gomtrique G 3 1,11,15 1,3 1,1804


Remarque: le taux de croissance moyenne est 18,04%

Page 21
STATISTIQUE DESCRIPTIVE

Ex 5 : Un tudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la


moyenne des carts entre les notes et la moyenne arithmtique.

8 10 12
10
3

Ecart type la moyenne moyenne arithmtique des carts = (-2+0+2)/3


8-10 = -2
10-10 =0
12-10 =2 moyenne arithmtique des carts = 0

On retrouve ici une des proprits des moyennes arithmtiques :



xi 0
x
Dmonstration : x x x
i i n x xi n
n
0
i

Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne


quadratique

Q2
22 02 22
8
3 3
8
Q 1,6
3

Page 22
STATISTIQUE DESCRIPTIVE

II. La mdiane (Me)


b-1- Dfinition :

On appelle mdiane dune srie classe par ordre croissant ou


dcroissant, la valeur du caractre qui partage en deux parties gales les effectifs.
Cest la valeur du caractre telle que la moiti des effectifs lui est
suprieure et lautre lui est infrieure.

b-2- Calcul de ME :

Cas dune variable discrte


Si la srie a un nombre impair de terme
75 62 57 12 18 Me =57
Si la srie a un nombre pair
12 25 32 44 52 69 Intervalle Mdian [32-44]

On prend le centre de lintervalle comme la mdiane :


Cas dune srie de classes :

Salaires Effectifs Effectifs cumuls Le calcul de la mdiane se fait en 3


10-15 9 9 tapes :
15-20 25 34 1re tape : on repre le rang de la
20-25 32 66 mdiane. Rang = 82/2 = 41
25-30 16 82
Total 82
Rang =
ni
2
2me tape : on repre la classe de Me :
Il sagit de trouver la classe laquelle appartient le 41me individu,
pour cela on classe les individus par ordre croissant des salaires, ce qui revient
construire la colonne des effectifs cumuls. .
Me [20-25], on peut calculer avec plus de prcision Me en faisant une
interpolation linaire.

3me tape : linterpolation linaire :

On connat les salaires des 34 individus 20


On connat les salaires des 66 individus 25

Le 41me individus cest le 7me individus que je rencontre dans la classe 20 -25,
son salaire sera obligatoirement gal 20 + supplment que lon calcule par
interpolation.
En supposant que les 32 individus de la classe 20-25 sont rpartis dune manire
uniforme dans la classe
20-25 puis sont spars par la mme quantit de salaire
On raisonne alors de la manire suivante :
Si pour 32 individus nous avons un cart de salaire de 5 DH

Page 23
STATISTIQUE DESCRIPTIVE

Pour 1 individu 5/32


Pour 7 individus 5/32 * 7 = 1.09 DH
Me=20+1.09 =21.09
La moiti des effectifs gagnent plus de 21,09 DH et lautre moiti gagne (moins de
21,09 DH)

b-3- Dtermination graphique de la mdiane :

Courbe cumulative

b-4-Remarque :

Salaire Xi Xi
10 15 9 9
15 - 20 25 34
20 - 25 32 66
25 - 30 16 82 Total Xi =82

Page 24
STATISTIQUE DESCRIPTIVE

Mthode rapide dinterpolation :

Me 20 41 34 75
Me 20 21
25 20 66 34 32

2. le 41 me individu normalement la mdiane devrait se situer entre le 41


me et le 42 me, mais on convient lorsque les effectifs sont nombreux de
prendre (N / 2)

III. Le Mode :

Cest la valeur du caractre le plus frquent.

A- Calcul Mode :

1- Cas dune variable discrte :

Xi ni Xi Ni
3 3 2 4
14 18 17 16
21 7 33 15
42 4 39 16
51 8
Mo =14 Mo = 17
Srie
Uni modal Mo = 39
Srie bimodale
Srie plurimodale (srie plusieurs modes)

Page 25
STATISTIQUE DESCRIPTIVE

2-Cas dune srie de classe :

Salaires ni -Nous avons une classe modale : 20 25


10 15 9 - On peut prendre comme mode le centre de classe 22,5
15 20 25 - On peut chercher obtenir le mode avec plus de prcision :
20 25 32
25 - 30 16
Total 82

1/ Par Mthode graphique : Elle consiste dabord construire lhistogramme

N.B : Ne pas oublier, lorsqu on construit lhistogramme de corriger les


effectifs.

2/ Par la mthode algbrique :

Mo = L1 + [d1. I / (d1 + d2)]

(32 25) *
Mo = 20 + 5
(32-25) + (32 - 16)

Page 26
STATISTIQUE DESCRIPTIVE

L1 : Limite Infrieure de classe modale


d1 : La diffrence entre les effectifs de la classe modale et les effectifs de
classe prcdente
d2 : La diffrence entre les effectifs de classe modale et les effectifs de
classe suivante
i : Lintervalle de la classe modale

IV. VI- Le choix dune caractristique de tendance centrale :


A : Les conditions de Yule :

1 r conditions : Une modalit caractristique doit tre : dfinie de faon


objective. (2 personnes diffrentes doivent trouver le mme rsultat)
2 me conditions : Tenir compte de toutes les observations
3 me conditions : tre facile comprendre
4 me conditions : tre facile calculer
5 me conditions : Doit se prter au calcul algbrique

B : Comparaison des diffrentes caractristiques de tendance centrale :


1-La moyenne :
Elle rpond parfaitement aux conditions de Yule ; cest pour
cela quelle est la caractristique la plus utilise, mais il y a des cas ou il faut lui
prfrer la mdiane quand elle risque dtre influenc des valeurs extrmes.

EX:

Notes Xi Ni * Xi X = 154 / 10 = 15,4


1 1 1 X = 153 / 9 = 17
16 2 32
17 5 85
18 2 36
10 154

2-La mdiane :
Elle ne satisfait pas les conditions de yule.
En effet, la valeur de la mdiane ne change pas quand on augmente la valeur
dune observation qui lui est infrieure

15 22 34 41 60 122 34 41 110
1 2 34 41 60

Page 27
STATISTIQUE DESCRIPTIVE

3-Le mode :
Ne remplit pas les conditions de Yule, mais il y a des cas ou il est
utile, en particulier quand on cherche la valeur la plus typique dune srie :
Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure
moyenne, mais va stocker les chaussures les plus vendues.

SECTION 2 : Les Caractristiques de Dispersion:

Partons de 3 sries
_
Srie 1 : 9 11 X = 10
_
Srie 2 : 5 15 X = 10
_
Srie 3 : 1 19 X = 10
Les 3 sries ont la mme moyenne : 10 et portant ils sont
diffrents lunes des autres.
Dans la 1re srie ; les valeurs du caractre sont proches de la
moyenne. La moyenne est reprsentative.
Dans la 3 me Srie les valeurs du caractre sont loignes de la
moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les
valeurs sont proches ou loignes de la valeur centrale.
Ce nombre est appel caractristiques de dispersion.

I. Lintervalle de variation ou ltendue :

Cest la diffrence entre la plus grande valeur du caractre et la plus petite.


Lintervalle de variation = Val MAX Val MIN
2 Srie 1 10 srie 2 18 Srie 3
Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il
dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes.
EX :
17.1820.60.Age
1000 tudiants
3

60 17 43

Page 28
STATISTIQUE DESCRIPTIVE

II. Lintervalle inter quartile :

A- Dfinition des quartiles :


On appelle 1r quartile Q1 la valeur du caractre tel que : 25%
des observations lui sont infrieurs et 75% lui sont suprieurs. 25% < ; 75%>
2me quartile Q2= Me 50% < 50%>
m
3 quartile Q3= 75%< 25%>

B- Dfinition inter quartile :

On appelle inter quartile : Q3 Q1 diffrence entre 1r quartile


et 3me quartile.
N.B : Intervalle Inter quartile contient 50% des observations

C- Application :
N= 82
Rang : 82/4 =20 ,5
Classe : [15-20]
Interpolation : 15+
Salaires Effectifs Ecart I. Inter quartile Ni Cum
10-15 9 9
15-20 25 Q3 Q1 34
20-25 32 =24,3 - 17,3 66
25-30 16 = 7DH 82
Total 82

Interprtation : Si 25 individus Augmentation de 5 DH


Si 01 Individu Augmentation 5/25 DH

(20,5 - 9) = 11,5 5/25 * 11,5

Donc Q1 = 15 + 5/25 *11,5 = 17,3 DH

2me Mthode :

Page 29
STATISTIQUE DESCRIPTIVE

Calcul de Q3
Rang : 82*3/4 =61,5
Classe = [20-25]
Interpolation : si 32 individus augmentation de 5 DH

01 Individu Augmentation de 5/32

(61,5 34) = 27,5 individus Augmentation 5/32 *27,5

Donc Q3 = 20+ [(5/32) *27,5]


Signification : 24,3dh cest le salaire tel que 75% gagnent plus de 24,3 et 25%
gagnent moins de 24,3 DH.
Inter. Inter quartile : 7 DH = Q3-Q1
Signification : pour 50% des effectifs lcart Maximum de salaire est de 7 DH

D Remarque :

1- Les dciles : valeur du caractre que 10 % des observations ont une valeur qui
est infrieure D1 et 90% des observations ont une valeur qui est suprieure
D1.
On appelle 9 me dcile de 9 la valeur du caractre tel que 90% des observations
lui sont infrieures, et 10% des observations lui sont suprieures. Lintervalle
inter dcile D9 - D1 contient 80% des observations

2- Les percentiles :
On appelle percentiles P1 la valeur du caractre telle que un pourcent (1%) des
observations ont une valeur infrieure P1 et 98% ont une valeur suprieure
P1.
Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de
calculer lintervalle inter percentile P93 P07 qui contient 86% des observations.

Page 30
STATISTIQUE DESCRIPTIVE

Lcart absolu moyen :

A- Dfinition : On appelle cart absolu moyen que lon dsigne par la


moyenne arithmtique des carts absolus entre les valeurs du caractre et
la moyenne arithmtique.

_
C a= ni xi x / ni

B- Application : soit le tableau suivant :


_
Poids ni xi ni * xi _
xi x ni xi x

55-60 12 57,5 690 10,25 123


60-65 17 62,5 1062,50 5,25 89,25
65-70 36 67,5 2430 0,25 9
70-75 24 72,5 1740 4,75 114
75-80 11 77,5 852,50 9,75 107,25
100 6775 442,5

Ca= 442.5 / 100 = 4.42 Kg = 67.75 Kg

Signification : Ca = 4.42 Kg signifie quen moyenne, chaque individu


sloigne de la moyenne (67.75 Kg) de 4.42 Kg.

Remarque : Pour dire si une dispersion est grande ou non, pour comparer
deux sries entre elles, on se sert de lindice de dispersion relatif = Ca / X *100
Exemple :
Poids de filles Poids des garons
=52 Kg =68 Kg
Ca= 2 Kg Ca = 17 Kg

2/52 *100= 3.8% 17/68 * 100 = 25%


Dispersion Faible dispersion plus importante

IV- La variance et lcart type :


A- Dfinition :
On appelle une variance la moyenne arithmtique des carrs des carts entre les
valeurs du caractre et la moyenne arithmtique.

2 = ni( xi x) / ni
2

Page 31
STATISTIQUE DESCRIPTIVE

On appelle cart-type (ou cart quadratique moyen) la racine carr de 62

_
ni( xi x) 2 / ni

B- Application :
Le mme tableau prcdent

(xi- )2 ni*(xi- )2

105,0625 1260,75
27,5625 468,5625
0,0625 2,25
22,5625 541,50
95,0625 1045,6875

3318,75
_
ni( xi x) / ni
2
= 3318.75/100 =5.76

Signification : En moyenne chaque individu scarte du poids moyen


(67.5 kg) de 5.76 kg.

C- Remarque :
Si on veut savoir la valeur de dispersion on utilise le cfficient de
variation = /
Ex :
=67.75 Kg / =(5.76/67.75) *100= 8.5%

Ex 2 :
Soient 2 modles dampoules lectrique dont on a relev les dures de
vie.

Modle 1 : Dure de vie moyenne 1400 H.


Modle 1 : Dure cart-type =100 H
Modle 2 : Dure de vie moyenne 1800 H.
Modle 2 : Dure cart-type = 250 H

Page 32
STATISTIQUE DESCRIPTIVE

Modle I Modle II
6/ =100/1400 = 7% 250/1800 *100 = 14%
Le modle I est plus faible que le modle II

Formule dveloppe :
= ni xi
2 2
Donc x
ni
Poids ni xi xi2 ni * xi2
55-60 12 57,5 330625 39675
60-65 17 62,5 390625 66406,25
65-70 36 67,5 455625 164025
70-75 24 72,5 525625 126150
75-80 11 77,5 600625 66068,75
100 462325
2
= 462325 - (67.75)2 33.19
100

= 33.19 =5.76

SECTION III : Les Caractristiques de Concentration

La concentration ne sapplique qu des sries statistiques ou la concentration


de la variable a un sens
EX : on peut parler de la concentration de revenus, concentration foncire
Autres EX : on ne peut pas parler de concentration dge
On peut dterminer la concentration soit algbriquement soit graphiquement

I. La dtermination algbrique de la concentration

Cette dtermination ncessite la connaissance de la mdiale


Notion de la mdiale (Ml)

A- La mdiale

Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la
mdiale est la valeur du caractre qui partage en deux parties gales le produit
cumul de ni xi.
Si xi dsigne un salaire
Ni dsigne le nombre de salaris

Page 33
STATISTIQUE DESCRIPTIVE

Le produit cumul des ni xi reprsente la totalit des salaires Verss nixi

Cest--dire la masse salariale.


La mdiale, cest le salaire tel que la moiti de la masse salariale a servi payer
une partie qui touche moins de cette Mdiale et lautre moiti de la masse s a servi
payer les gens qui touchent plus de cette Mdiale.

B- Mesure de la concentration

M sert mesurer la diffrence entre ML et ME :


M=ML ME
* Si M = 0 cela veut dire que ML =ME
C'est--dire lindividu qui est au milieu leffectif est en mme
temps celui qui est plac tel que la moiti de la masse salariale a t
verse des gens qui touchent moins que lui, et lautre moiti des gens
qui reoivent plus que lui, on a donc une distribution galitaire
concentration est nulle
* Si m 0 cela indique quil y a une concentration
* Si m est faible par rapport lintervalle de variation la concentration est
faible
* Si m est important, la concentration est forte
Inter variation

C- application

salaire ni xi nixi nixi


10-15 8 12.5 112.5 112.5
15-20 25 17.5 437.5 550
20-25 32 22.5 720 1270
25-30 16 27.5 440 1710
total 82 1710

M= ML ME
Calcule de la ML :
Rang = 1710/2=855
Classe [20.25]
Interpolation linaire
720 5dh
1dh 5/720dh
(855-550) =3055 5/720*305dh

Donc ML= 20+5/720*350

ML = 22.12dh
M = ML - ME
= 22 ,12 - 21,09 1dh

Page 34
STATISTIQUE DESCRIPTIVE

M/inter varia = 1/20=5% concentration faible


Lintervalle de variation
tant gale : (30-10)=20
Signification ML = 22.12 dh

Cest le salaire tel que la moiti de la masse salariale a servi payer des
gens qui gagnent moins que 22.12 dh et lautre moiti de la masse
salariale a servi payer les gens qui gagnent plus que 22.12 dh

II. La dtermination graphique de la concentration la courbe de Lorentz


GINI
A- la graphique de GINI
GINI propose de mesurer la concentration en mettant en abssices les
frquences cumules en%, et en ordonnes ni xi cumuls en %

salaire ni Fi% Fi% *n xi nixi Nixi% Nixi%cum


10-15 9 11 11 12.5 112.5 6.6 6.6
15-20 25 30.5 41.5 17.5 437.5 25.6 32.2
20-25 32 39 80.5 22.5 720 24.1 74.3
25-30 16 13.5 100 27.5 440 25.7 100
total 82 100 1710

/ : Diagonal de lgalit
: Aire de concentration

Remarques :

1) si 10% de la population touchent 10% du revenu, 20% de la


population touchent 20% du revenu. Dans le cas dune rpartition
galitaire du salaire, laire de concentration serait confondue avec
diagonal.
2) Dans le cas dune repartions illgalitaire parfaite des salaires,
(comme dans le cas thorique ou 0.1% de la population toucherait
99.99% de la masse salariale : la courbe

Page 35
STATISTIQUE DESCRIPTIVE

B)-Le coefficient de Gini :

Gini propose de calculer la concentration laide de coefficient suivant :

Aire de concentration
C=
Aire du triangle ABC

Aire de G
C=
5000(100*100/2)

On peu estimer laire de concentration de la manire suivant :


Aire de concentration = 5000-(S1+S2+S3+S3)

B S=1/2 a*b S1 = (116.6)


S2= (41.5-11)/2(6.6+32.2)
A S3= (80.5-41.5)/2(32.2+74.3)
A S4 = (100-80.5)/2(74.3+100)
n Si = 4404
S = n/2(a+b)
b

Remarque : 0<c<1
c = 0 Concentration lev

c = 1 Concentration faible

Donc c=5000-4404/5000 0.12


C d les gens sont pareils

Page 36
STATISTIQUE DESCRIPTIVE

CHAPITRE III :LES SERIES A DOUBLE ENTREES :


REGRESSION LINEAIRE (CORRELATION)

I- notion de tableau de contingence :


A. une distribution statistique double
Cest une distribution ou lobservation seffectue selon 2 caractres.
EX : Rpartition des tudiants selon la taille et lge
Rpartition des logements selon le nbre de pices et superficie
superficie 10-30 30-50 50-70 70-80 total
nbr de piece

1 3 1
2 1 14 3 18
3 1 7 4 12
4 10 7 17
5 6 6 6
total 4 16 20 17 57

B. distributions marginales

Ce sont les distributions relatives la seul variable X ou Y

a- la rpartition des logements selon le nombre de pices (X)


Nbre de Nbre de logement
pices (x)
1 4
2 18
3 12
4 17
5 6
total 57

Cette distribution qui concerne la seule variable x est applle distribution marginale (marginal
car on la trouve la marge du tableau statistique)
On peut calculer la moyenne de cette distribution, (et sa signification est le nbre de pices
moyenne par logement)
Moyenne appele moy.marginale note
b- la rpartition des logements selon la superficie :

superficie y Nbre de logements


10-30 4
30-50 16
50-70 20
70-80 17
total 57

Page 37
STATISTIQUE DESCRIPTIVE

Cette distribution qui concerne la seule variable y est appele distribution marginale on peut
calculer la moyenne (qui exprime la surface moy des logements) applle moy.marginal note

C. Les distributions conditionnelles :

On appelle distribution Conditionnelle la distribution ou lon a pos une condition sur lune
des variables.
Ex : Rparation de logements de 30-50m
Cette distribution est appele Distribution Conditionnelle parce que lon ne sintresse quaux
logements qui satisfont la condition de surface 30-50 m2.
On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pices des
logts de 30-50 m2) on appelle cette moyenne : moyenne conditionnelle.
Dans cet exercice on calcule
Remarque il existe autant de distributions conditionnelles relatives au caractre x que le
caractre y a de modalits

II- gnralisation du tableau de contingences :


x y Y1 Y2 . Yj . Ym total
X1 X11 X12 . X1j . X1m X1.
X2 X 21 . X 2j . X2m X2.
. .
Xi Xi1 Xi2 . Xij . Xim Xi.
. .
Xk Xk1 Xk2 . Xkj . Xkm Xk.
total x.1 x.2 . x.j . x.m x..
x1 x2 . . . xk = les modalits de x
y1 y2 . . . yk = les modalits de y
x1 .effectifs pour la 1re modalits de x et pour toutes les modalits de y

La distribution marginale de X :

X(xi) Xi.
X1 X1.
X2 X2.
. .
. .
Xi Xi.
Xk Xk.
Total X..

Page 38
STATISTIQUE DESCRIPTIVE

La distribution marginale de y :

y(xi) Xj.
y1 X.1
y2 X.2
. .
. .
yi X.i
ym Xm.
Total X..
Distribution conditionnelle relatif X et Y

Dist. Conditionnelle relative X Dist. Conditionnelle relative Y

X Xij y Xij
X1 X1j y1 Xi1
X2 X2j y2 Xi2
. . . .
. . . .
Xi Xij yi Xij
Xk Xkj ym Xim
Total X.j Total Xi.

III- La rgression linaire


A. Prsentation du problme :
Soit le tableau suivant :

qu 42 51 60 62 74 83 Total
Prix
70 1 1
75 1 1
77 1 1
80 1 1
86 1 1
93 1 1
Total 1 1 1 1 1 1 6

Ce tableau est un tableau de contingence ou les observations sont connues individuellement,


on peut prsenter plus simplement ce tableau de la manire suivante :

Page 39
STATISTIQUE DESCRIPTIVE

Nous avons un ensemble de points un nuage statistique qui nous indique que les prix est
les quantits voluent selon la mme tendance.
Il est possible de schmatiser ce nuage :
-Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil faudra
trouver.
a=pente de droite
b=ordonne lorigine
Une telle droite est appelle droite de rgression D(x)
A=coefficient de rgression
La rgression cest le fait de relier y x par une fonction
Calcule des paramtres de la droite de rgression :

B. la mthode des moindres carrs


Notion de moindres carrs :

Partons dun nuage statistique thorique :

Il sagit de rsumer ce nuage par une droite.


Soit y= ax+b lquation de la droite recherche.
Pour toute valeur de x (xi) nous avons une valeur rellement observe y.
Pour toute valeur xi, nous avons une valeur calcule sur la droite y.
Pour toute une valeur xi, nous avons une erreur destimation gale | yi yi |.

Page 40
STATISTIQUE DESCRIPTIVE


La droite de rgression idale doit tre de telle manire que la somme des erreurs
destimation doit tre la plus faible possible, | yi yi | doit tre minimum.
Pour viter les valeurs absolues, on convient de calculer les carrs des erreurs. La
droite de rgression doit tre telle que :
(yi yi) 2 minimum, et on appelle cela la condition des moindres carrs.

C. Calcul des paramtres de la droite de rgression.


Il sagit de trouver y= ax + b sachant que : (yi yi) 2 min.
Remplaons yi par sa valeur (yi (axi+b)) 2 min.
Posons (yi ax ; - f) 2 = Z (a , b).
Pour que Z soit minimum, il suffit dannuler (rendre nul) les drivs de ce polynme par
rapport a et par rapport b.
1 Calcul de b :
Supposons a est connu, et drivons par rapport a b et a.
dZ / db = 2 [ (yi ax ; -b)] (-1) = 0 Z = U2
Z = 2UU
[yi ax ; -b) = 0
yi axi nb = 0 U = (yi ax ; -b)
Divisons par n, on obtient (yi / n axi / n b = 0
- a = b
Donc :
b = - a

La droite de rgression passe donc par le point moyen ( , ).


2 Calcul des a :

ax
y

Y yi

M xi x

Xi

0 x X

Le paramtre a Que nous cherchons correspond la pente de la droite de rgression qui passe
par le point moyen M ( ; ).
Procdons un changement dorigine, et prenons comme nouvelle origine le point moyen
M(x ; ), les nouvelles cordonnes deviennent :
Xi = xi

Yi = yi -

La droite de rgression a pour quation y = ax

Page 41
STATISTIQUE DESCRIPTIVE

La condition des moindres carre scrit ;


(yi i) 2 min
(yi yi) 2 = (yi axi) 2min

Drivons par rapport a : 2 [ (yi axi)] (-Xi) = 0


[ (yi axi)] Xi = 0 => (yi ai) Xi = 0 => xi yi a xi2 = 0
Donc a = xi yi /xi2 = (xi x) (yi - )/ (xi x) 2

3- lquation de la droite de rgression :

Dy(x) =
Y = ax + b
2
a = (xi - ) (yi - ) / (xi )

b=-a

D Application:
Prix(x) Qts(y) Dy (x) a pour quation:
70 72 Y = ax + b
75 51 _ _
77 60
a=
xi xi =
(x i x)( yi y )
x
80 62 2
_

(x
86 74
i x) 2
33 83
481 372
x i
481 / 6 = 80
x= n

y = 372 / 6 = 62

Trouver Dy (x).
xi - yi - (xi- ) (yi - ) (xi- ) 2
-10 -20 200 100 a = 606 / 339 = 1.79
-5 -11 55 25 b = 62 (1.73)80
-3 -2 6 9 b = -81
0 0 0 0 Donc
6 12 72 36 Dy(x) a pour quation :
13 21 273 169 y = 1.79x 81
606 339 La loi de loffre pour ce bien

Page 42
STATISTIQUE DESCRIPTIVE

IV- la corrlation linaire :

Dans le paragraphe prcdent, nous avions estim y en fonction de x, et nous avions obtenu la
droite de rgression Dy(x)
On peut pour le mme nuage statistique estimer x en fonction de y, et trouver la droite de
rgression Dx(y) lui aura pour quation.

Pour toute yi, nous avons une valeur observe xi.


Pour toute yi, nous avons une valeur estime sur la droite x i
Pour toute yi, nous avons une erreur destimation gale | xi xi |
Dx(y) idale est tel que : | xi xi | minimum ou encore (xi xi) 2 minimum
En procdant de la mme manire que dans le paragraphe prcdent, on trouve lquation de
Dx(y).
X = ay + b
a = xi yi
yi2
b = a

Dans le rfrentiel XMY nous obtenons 2 droites :


Soit y = ax pour Dy(x)
Soit x = ay pour Dx(y)
Ou encore y = 1/a x
4 cas peuvent se produire :

1er cas : les 2 droites sont confondues


Y= ax
X = ay a = 1/a aa = 1
Y = 1/yx

Page 43
STATISTIQUE DESCRIPTIVE

2me cas : les 2 droite font entre elles un angle trs faible :

3me cas : les 2 droite font entre elles un angle lev :

4me cas : les 2 variables sont indpendantes lune de lautre :

r
Si on appelle coff de corrlation la Quantit tel que : r = a . a , on peut crire :
2

Si r = 1 on a une corrlation parfaite.


Si r = +1 on a une corrlation parfaite positive.
Si r = -1 on a une corrlation parfaite.
Corr. positive : c d les variables varient dans le mme sens.
Si r = -1 = corrlation parfaite ngative.
C d les deux phnomnes varient en sens inverse.
Par exemple Prix et Quantit
Si 0 < r < 1 = la corrlation est positive, elle est dautant plus forte que lon se
rapproche de 1.
Si -1 < r < 0 = la corrlation est ngative, et elle est dautant plus forte que lon se
rapproche de -1.
Si r = 0 = corrlation nulle.

Page 44
STATISTIQUE DESCRIPTIVE

Application : calculer le coefficient de corrlation dune autre faon (existe-t-il un lien entre y
et x).

Prix Qt x x y- (x x ) (yi - ) (x x ) 2 (yi - ) 2
70 42
75 51
77 60
80 62
86 74
33 83
606 339 1110
r2
= a. a =
606 606

339 1110
donc r = 0.98

a=
xi y i
( xi x)( y i y) =
606
1.79
x 2
i
( x x) i

2 339

a =
x y i i

( x x)( y y) = 606 0.545
i i

y 2
i
( y y) i
1110
2

On a une trs forte corrlation car r = 0.975 tend vers 1


Remarque : lorsquon crit r = a. a r = racine a .a, nous avons une expression trs
2

positif. Comment trouver alors le signe dune corrlation ?


Rponse : le sens de la corrlation est donne par le signe de a et a.
Si a et a sont >0 le produit a.a >0 corrlation positive.
Si a et a sont <0 le produit a.a>0 corrlation ngative.
On peut dire dune corrlation quelle est trs satisfaisante partir 0.86.
On peut dire dune corrlation quelle parfaite partir de 0.96.
IV formule facilitant les calculs :
1/ calcul de a :
N
a = (xi ) (yi - ) = , N = xi yi - xi x yi + x
D
(xi x) 2

Or x =
x i xi = n x
N

=
y i yi = n
N


On remplace : N = xi yi - n x -n x + n x

N= x y i i n x y

D = (xi x ) 2 = (xi2 2xi x + x2) = xi2 2 x xi + n x 2

= xi2 2n x 2 + n x 2
D = xi2 n 2

Page 45
STATISTIQUE DESCRIPTIVE

Donc a =
xi y i n x y
2
x2 n x
Formule dveloppe

xi yi Xi yi xi2

x
2 calcul de r :
xi yi n
r2= a.a a=
xi2 n 2

xi yi n
a =
yi2 n 2

Donc r= a * a'

V Autre formule de r :

[ (xi ) (yi - )] 2
r=
(xi ) 2 (yi - ) 2
Or (xi ) 2
2x = (xi ) 2 = n2 x
n

(yi ) 2
2
y= (yi ) 2 = n2 y
n

(xi ) (yi )

Donc r ==
[( x i x)( y i y)]2
n.x. y
n 2 . 2 x. 2 y

Si on appelle : covariance de x et de y lexpression :

(xi ) (yi )
Cov (xy)
n
Cov (xy)
r scrit : r =
x.y

Page 46
STATISTIQUE DESCRIPTIVE

CHAPITRE IV : ANALYSE DES SERIES


CHRONOLOGIQUES.

I Gnralits :

A. Dfinition :
Une srie chronologique est une srie o les observations de la variable sont faites des
intervalles rguliers de temps.

B. les diffrentes composantes dune srie chronologique.


Soit la srie chronologique suivante : Evolution trimestrielle du chiffre daffaire dune
entreprise

trimtres 1 2 3 4
1998 120 148 155 120
1999 130 162 169 132
2000 144 178 186 145
2001 157 196 210 160

Reprsentation graphique de la srie :

Lexamen dune srie chronologique rvle lexistence de diffrences composantes :


Un mouvement de tendance longue ( long terme), appele trend .
Un mouvement saisonnier qui est les variations saisonnires.
Des variations accidentelles : ce sont des variations imprvisibles dues des circonstances
exceptionnelles.

C. intrt dune analyse dune srie chronologique :


Lanalyse des sries chronologiques permet de sparer le mouvement de long terme du
mouvement saisonnier, ce qui nous permettra de faire des calculs de prvision.

Page 47
STATISTIQUE DESCRIPTIVE

II lanalyse de la tendance longue : trend


Dterminer le trend, cela revient lisser la srie pour liminer les variations saisonnires,
cette technique de lissage de la srie est appele Ajustement. Les 2 mthodes dajustement
les plus utiliss sont :
La mthode des moyennes mobiles.
Lajustement analytique.

A. la mthode des moyennes mobiles :


Elle consiste diviser un nuage statistique en sous nuages comprenant chacune
(n1) donnes du sous nuages prcdent, et remplacer chaque sous nuage par un point tel
que : xi = mdiane des xi yi = moyenne des valeurs yi.

B. Oprations sur les matrices :

1 matrices transposes :
1 3 4 1 2
A= A= 3 -1
2 -1 5 4 5

2 Laddition :
1 -1 3 0 4 3 1 3 6
+ =
2 4 1 3 -1 -1 5 3 0

(aij) + (bij) = (aij + bij)

Proprits :
- commutativit
- association
- lment neutre
- lment symtrique aii = 0(n ;p) la matrice nulle
t (a+b) = ta+tb

3- Multiplication par un rel :


1 -1 3 3 -3 9
3* =
2 4 1 6 12 3

Page 48
STATISTIQUE DESCRIPTIVE

CHAPITRE V :POPULATIONS ET ECHANTILLONS,


RECENSEMENTS ET SONDAGES

Les journaux, la tlvision, les revues nous inondent constamment de graphiques, de


tableaux et de statistiques de toutes sortes, dans diffrents domaines :

Politique Sondages, rfrendums, popularit des partis politiques et de leur chef.

Criminalit, suicide, avortement, racisme, pratiques religieuses, orientations


Social
sexuelles, habitudes alimentaires.

Importations, exportations, prix de vente, taux d'inflation, indice des prix la


conomie consommation (IPC), taux d'intrt, salaires, taux de chmage, cotes
boursires, indices boursiers, dficits gouvernementaux.

Dmographie Taux de mortalit, taux de natalit, population par province, par nationalit.

Culture Entres au box office, cotes d'coutes.

tudes Rsultats scolaires, prts et bourses, cote R et cote Z.

Sports Meilleurs compteurs, classement des quipes, salaires des joueurs.

Ces prsentations peuvent parfois nous induire en erreur volontairement ou non.

Il nous faut donc dvelopper un esprit critique et savoir interprter ces


informations.

I. Quelques termes de base :


La population cible est l'ensemble de tous les objets que l'on tudie.

Une unit statistique est un objet de cette population.

Un chantillon est une partie choisie d'une population.

Le nombre d'objets composant une population ou un chantillon est appel sa taille.

Lorsque l'on veut connatre certaines caractristiques d'une population, on dit qu'on
enqute sur la population.
Une enqute peut tre ralise auprs de toute la population ou sur un chantillon.

Un recensement est une enqute ralise auprs de toute la population.

Page 49
STATISTIQUE DESCRIPTIVE

Un sondage est une enqute ralise sur un chantillon.

II. Exemples:
1. tude portant sur la langue maternelle des Qubcois:

la population est l'ensemble des Qubcois


et la caractristique est la langue maternelle.

2. tude portant sur la dure des ampoules lectriques produites l'usine X.

La population est constitue des ampoules lectriques produites l'usine X


et la caractristique tudie est la dure des ampoules.

3. Une compagnie pharmaceutique veut vrifier un nouveau vaccin contre une certaine maladie.
On administre ce produit 50 patients atteints de la maladie.

La population est forme de tous les gens atteints de la maladie,


l'chantillon est form des 50 patients qui on a administr le mdicament et la
caractristique tudie est la rponse au mdicament.

Les cots levs et les dlais trop longs, relis un recensement, sont les
principales raisons qui nous amnent utiliser un sondage puisque la taille d'un
chantillon est beaucoup plus petite que celle de la population.
Au Canada, il y a un recensement tous les cinq ans. Le dernier date de 1996.

III. tapes d'une enqute statistique :


1. Dterminer la population cible et les caractristiques de cette population que l'on veut
tudier.
2. Dterminer la manire dont l'chantillon va tre prlev.

Page 50
STATISTIQUE DESCRIPTIVE

3. Construire des instruments (questionnaires ou autres).


4. tablir un pr-test ou tude-pilote.
5. Recueillir les donnes.
6. Compiler les donnes.
7. Mettre en forme les donnes.
8. Analyser les donnes (analyse descriptive ou infrentielle).
9. Interprter les rsultats.
10. Communiquer les rsultats.

Page 51
STATISTIQUE DESCRIPTIVE

EXERCICES

Page 52
STATISTIQUE DESCRIPTIVE

I OBJECTIFS VISES :

1. construction dun tableau statistique :


2. distinguer une variable quantitative dune variable qualitative
3. reprsentation graphique des variables quantitatives discrtes et continues
4. calcul et interprtation des caractristiques de tendance centrale :
moyenne.
mdiane
mode
quartiles
5. calcul et interprtation des caractristiques de dispersion :
variance
cart type
coefficient de variation

Exercice 1 :

Dans une entreprise de 80 salaris on a enregistr les salaires mensuels suivants :


54 salaris gagnent 6 000 dirhams ou plus ;
34 salaris gagnent 8 000 dirhams ou plus ;
20 salaris gagnent 10 000 dirhams ou plus ;
8 salaris gagnent 12 000 dirhams ou plus ;

1. Prsenter ces donnes dans un tableau avec des classes de mme amplitude en
sachant quaucun salari ne gagne plus de 14 000 DH.
2. Calculer la moyenne et donner sa signification.
3. Calculer la mdiane et donner sa signification.
4. Calculer le mode graphiquement, algbriquement et donner sa signification.
5. Combien gagnent les 20% des salaris les mieux pays.

Exercice 2 :
La rpartition des salaris dune entreprise de confection selon leurs gains
mensuels (en milliers de dirhams) se prsente comme suit :
Gains mensuels effectifs
[4-6[ 25
[6-8[ 40
[8-12[ 58
[12-18[ 27
[18-20[ 6
20 et plus 4

1. dterminer graphiquement le salaire modal


2. calculer le coefficient de variation
3. calculer ltendue
4. calculer algbriquement et graphiquement la mdiane.

Page 53
STATISTIQUE DESCRIPTIVE

Exercice 3 :

La rpartition par ge dune population dun centre de vacances est comme suit :
Classe dage (en annes) effectifs
0-5 16
5-15 42
15-25 44
25-35 40
35-45 30
45-55 32
55-60 15
60-75 36
75-100 15
1. tracer lhistogramme de cette distribution
2. calculer lcart type et donner sa signification
3. on dsire rajeunir cette population en invitant au centre des vacances des
personnes de la classe [25-35[.combien faudrait-il en faire venir pour que
la moyenne de la population soit de 35 ans.

Exercice 4 :

Dans une commune urbaine, on a relev la rpartition en pourcentages de


10 000 contribuables selon le montant des impts pays.
Classes dimpts Frquences relatives en pourcentages
1-3 8
3-6 12
6-L2 20
L2-12 26
12-18 F6
18-22 10
22-30 6
1. Trouver les valeurs manquantes de ce tableau sachant que la moyenne est gale
11,42
2. tracer la courbe cumulative croissante
3. dterminer graphiquement et algbriquement limpt mdian. donner sa signification
4. quel est le pourcentage des contribuables qui paient un impt annuel suprieur
20 000dh ?cela reprsente combien de personnes ?

Exercice 5 :

Soit la distribution statistique suivante qui donne la rpartition des propritaires


terriens selon la superficie des terres cultivables dans une certaine rgion agricole :

Superficie des terres en hectares Nombre de propritaires


2-4 24
4-8 36
8-14 22
14-20 18
20-40 14
40-100 6

Page 54
STATISTIQUE DESCRIPTIVE

Partie I :
1. prciser le caractre tudi et prciser sa nature.
2. donner la signification de du centre de la 2me classe.
3. dterminer rapidement la mdiane et donner sa signification
4. dterminer algbriquement le mode et donner sa signification
5. calculer la superficie moyenne et lcart type. Que peut on conclure ?
6. dterminer le 1er et le 9me dcile et donner leurs significations
Partie II :
1. dterminer graphiquement la concentration foncire dans cette rgion agricole,
Calculer lindice de GINI
2. dterminer algbriquement la concentration
3. dterminer graphiquement le pourcentage des propritaires dont la superficie des
terres est infrieure la mdiale.

Exercice 6 :
Pendant 9 annes les bnfices dune entreprise ont augment :

de 4% par an pendant les 3 premires annes.


de 7% par an pendant les 4 annes suivantes.
De 10% par an pendant les 2 dernires annes de la priode considre.

Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?

Exercice 7 :
Le tableau suivant donne la rpartition des salaires mensuels des cadres dune
entreprise :

Salaires en 1000DH Nombre des cadres


6-8 50
8-10 70
10-16 80
16-22 50
22-30 50
30-34 80
34-38 20
total 400

1. prciser le caractre tudi et sa nature


2. reprsenter graphiquement cette distribution, tracer le polygone des frquences
3. dterminer rapidement :
le salaire mdian des cadres donner sa signification.
Le 3me quartile (Q3). donner sa signification.
4. donner graphiquement le salaire modal des cadres.
5. calculer le salaire moyen des cadres.
6. Calculer le coefficient de variation et donner sa signification
7. Pour motiver davantage ses cadres, lentreprise dcide une augmentation gnrale des
salaires de 20%. Calculer la nouvelle moyenne et le nouveau coefficient de variation.

Page 55
STATISTIQUE DESCRIPTIVE

II OBJECTIFS VISES :
1. Calcul de la fonction linaire
2. calcul et commentaire du coefficient de corrlation
3. interprtation des distributions marginales
4. interprtation des distributions conditionnelles

Exercice 8 :
Une entreprise a prsent ses dpenses de publicit et ses chiffres pour les 6
dernires annes dans le tableau suivant (en 106 DH)
Dpenses de publicit Chiffre daffaires
2 10
4 16
10 50
14 120
18 140
24 210

1. Lentreprise pense qu il ya un lien entre dpenses de publicit (X) et le chiffre


daffaire(Y).pouvez vous le confirmer ?
2. tablir par la mthode des moindres carrs la relation liant le chiffre daffaires et
les dpenses de publicit
3. combien lentreprise peut-elle esprer raliser comme chiffre daffaireS avec des
dpenses de publicit de 30 ?

Exercice 9 :

On a observ une population en retenant 2 caractres : le nombre denfants(X) et la


taille du logement (Y).les rsultats sont les suivants :
Nombre de pices 2 3 4 Total

Nombre denfants
1 22 15 9 46
2 7 38 22 67
3 0 7 30 37
Total 29 60 61 150

1. calculer le nombre moyen denfants et le nombre moyen de pices des logements.



2. calculer x 2 et donner sa signification

3. calculer y 3 et donner sa signification
4. on se propose de voir sil existe un lien entre le nombre denfants et la surface des
logements. Confirmer

Page 56
STATISTIQUE DESCRIPTIVE

Exercice 10 :

Le tableau suivant donne la rpartition des salaris dune entreprise de btiment selon le
nombre denfants charge X et les salaires mensuels perus y en milliers de DH

Nombre de pices Y 1-3 3-5 5-9

Nombre denfants X
1 4 8 16
2 6 12 24
3 3 6 12
4 2 4 8
1. donner la distribution marginale de la variable X
2. donner la distribution conditionnelle de la variable Y lie la modalit 4 de X.
3. que signifient les valeurs 16 et 3 souligne dans le tableau
4. vrifier de deux manires diffrentes que les deux variables sont indpendantes.
Dites dans ce cas est gal le coefficient de corrlation linaire : r (sans le
calculer.
5. calculer la variance marginale de Y.

Exercice 11 :
Une tude ralise dans un club sportif concernant le poids et la taille de 124 adhrents
a fourni les informations suivantes :
poids en Kg Y 50-60 60-65 65-75 75-80

taille en mtres X
1,60-1,70 12 7 6 4
1,70-1,75 ? 6 8 3
1,75-1,80 9 8 8 4
1,80-1,90 ? 7 5 6
1,90-2,00 3 5 3 3

1. complter le tableau sachant quil y a 27 adhrents qui mesurent entre 1.70met


1.75m.
2. quels sont les caractres tudis ? Quelle est leur nature ?
3. que signifient les chiffres 7 et 8souligns dans le tableau
4. quelle est la moyenne du poids des adhrents ? Comment appelle-t-on cette
moyenne ?
5. quelle est la taille moyenne des adhrents ? Comment appelle-t-on cette
moyenne ?
6. en dsignant par X la taille et par Y le poids calculer et donner la signification
_
de y 2
_
7. donner sans la calculer la signification de x 3

Page 57
STATISTIQUE DESCRIPTIVE

Exercice 12 :

Une entreprise commerciale a prsent ses ventes xi et ses frais de publicit yi au


cours du premier semestre de lanne 2003 comme suit (en 1000 DH)

Mois Ventes Frais de publicit


Janvier 40 1.1
Fvrier 30 0.8
Mars 42 1.2
Avril 46 1.4
Mai 44 1.3
juin 38 1.1

1. dterminer une fonction linaire qui donne le montant des ventes lorsquon
connat les frais de publicit.
2. quel serait le montant des ventes si les frais de publicit atteindront
3500DH.
3. dterminer sil y a ou non une liaison entre les ventes et les frais de
publicit.

Page 58

Vous aimerez peut-être aussi