Vous êtes sur la page 1sur 58

SOMMAIRE

Gnralits :................................................................................................................................ 2 I. II. III. IV. V. Dfinitions :.................................................................................................................... 2 Apport de la statistique aux conomistes : ..................................................................... 2 Les limites de la mthode statistique : ........................................................................... 2 Le vocabulaire utilis en statistique : ............................................................................. 3 Quelques symboles mathmatiques utiliss : ................................................................. 5

Chapitre I : La reprsentation graphique.................................................................................... 6 I. Le diagramme en btons : .............................................................................................. 6 II. Le tuyau dorgue : .......................................................................................................... 6 III. Le diagramme :............................................................................................................... 7 IV. Le polygone des frquences : ......................................................................................... 7 V. La courbe cumulation (courbe des f cumuls) : ............................................................. 8 VI. Le diagramme polaire : .................................................................................................. 9 VII. Les graphiques secteurs :........................................................................................... 11 Chapitre II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE ........................... 12 INTRODUCTION.................................................................................................................... 12 SECTION 1 .............................................................................................................................. 12 I. LES MOYENNES....................................................................................................... 12 II. La mdiane (Me) .......................................................................................................... 23 III. Le Mode : ................................................................................................................. 25 IV. Le choix dune caractristique de tendance centrale :.............................................. 27 SECTION 2 .............................................................................................................................. 28 I. Lintervalle de variation ou ltendue : ........................................................................ 28 II. Lintervalle inter quartile : ........................................................................................... 29 III. Lcart absolu moyen :............................................................................................. 31 SECTION III ............................................................................................................................ 33 I. La dtermination algbrique de la concentration ......................................................... 33 II. La dtermination graphique de la concentration la courbe de Lorentz GINI............... 35 Chapitre III :Les Sries double entres : Rgression Linaire (Corrlation) ........................ 37 I- notion de tableau de contingence : ............................................................................... 37 II- gnralisation du tableau de contingences : ................................................................. 38 III- La rgression linaire ................................................................................................... 39 IV- la corrlation linaire :.................................................................................................. 43 Chapitre IV : Analyse des sries chronologiques..................................................................... 47 I Gnralits : .................................................................................................................... 47 II lanalyse de la tendance longue : trend .................................................................... 48 CHAPITRE V :Populations et chantillons, recensements et sondages .................................. 49 I. Quelques termes de base : ............................................................................................ 49 II. Exemples: ........................................................................................................ 50 III. tapes d'une enqute statistique : .................................................................... 50 EXERCICES ............................................................................................................................ 52

STATISTIQUE DESCRIPTIVE

Statistique descriptive
GENERALITES : I. Dfinitions :
On appelle statistique la mthode scientifique qui vise observer, collecter, analyser des donnes quantitatives. La statistique descriptive est la partie de la statistique qui sert dcrire un phnomne, c--d de mesurer, classer les mesures, prsenter ces mesures par quelques indicateurs de manire donner une ide simple et rapide dun phnomne tudi. Les statistiques se sont des donnes chiffres relatives un phnomne tudi. EX : des statistiques du chmage.

II. Apport de la statistique aux conomistes :


La statistique est un outil indispensable tant aux thoriciens quaux praticiens de lconomie.

1. La statistique est utile aux thoriciens :

Elle permet de mettre en vidence (rvler) lexistence dinterdpendance entre diffrents phnomnes conomiques. EX : M=P*T Elle permet de tester la validit dune hypothse thorique. Investissement = f (revenu) =0.76R+124 Consomm Revenu thsauris Epargn Investi

2. La statistique est utile aux praticiens de lconomie :

La statistique permet aux entrepreneurs de mieux contrler la gestion de leurs entreprises. Elle permet galement au pouvoir public de mieux dfinir leurs politiques conomique, fiscale, montaire et demploi.

III. Les limites de la mthode statistique :


Pour viter des erreurs dinterprtation due une mauvaise utilisation statistique, il faut savoir : 1. La statistique sintresse au grand nombre, elle ignore les cas particuliers. 2. La rsultante dun grand nombre dinformations peut tre diffrente de la sommation de ces diffrentes informations. *comportement collectif # sommation des comportements individuels 3. Quand on tudie un phnomne on nest jamais certain que lon dispose de toues les informations le concernant.

Page 2

STATISTIQUE DESCRIPTIVE 4. Il ne faut pas oublier que la statistique nest quun outil au service de lconomiste, ce qui nous oblige de ne jamais, oublier de faire une analyse conomique des rsultats. Les mmes causes # les mmes effets. Les corrlations mmes trs parfaites ne signifient pas toujours quil y a interdpendance entre les phnomnes tudis.

IV. Le vocabulaire utilis en statistique :


1. Population statistique :
Ex : Age des tudiants de 1reanne : lensemble tudi cest lge.

Ensemble sur lequel porte ltude

2. Unit statistique : Une population se compose dlments chaque lment est appel unit statistique.
EX : la population dtudiants : lunit statistique est un tudiant.

3. Caractre statistique : Cest le critre retenu pour tudier une population


Continu quantitatif discontinu, discret Qualitatif Un caractre est dit quantitatif lorsquil est mesurable Continu : cest un caractre qui peut prendre toutes les valeurs dun intervalle donn. EX : ge Il peut tre Discontinu : cest un caractre qui ne peut prendre que quelques valeurs dans un intervalle donn EX : le nombre des frres, Mnage Un caractre est dit qualitatif lorsquil nest pas mesurable EX : la nationalit, les catgories sociales professionnelles.

4. Modalit statistique : de caractre :


On appelle une modalit les diffrentes situations possibles dun caractre. EX : caractre sexe : modalits possibles : M/F Caractre tat matrimonial : 4 modalits possibles : clibataire/mari/divorc/veuf.

Page 3

STATISTIQUE DESCRIPTIVE

5.

Effectifs (frquences absolues) :

Cest le nombre dunits statistiques relatif une modalit donne : 45Age Effectifs 17-18 200 18-19 350 19-20 50 Effectifs total 600

6. Frquence relative :
Cest la part des effectifs dune modalit. EX : 200/600=33/100 est la frquence relative de premire modalit

7. Srie statistique :
Distribution de frquences, distribution de statistiques ou tableau statistique, cest un tableau qui nous donne lensemble des valeurs mesurant le caractre. EX : sexe Masc. Fm. total Salaires (dh) [40-60[ [60-70[ [70-80[ total Effectifs 200 100 300 Effectifs 10 25 05 40 Srie avec des classes. Nombre denfants 2 3 4 5 total Srie simple. Arbre de mnages 18 28 10 4 60

8. Classes :
On appelle classe un groupement de valeurs du caractre selon des intervalles qui peuvent tre gaux ou ingaux. Pour chaque classe on peut dfinir : Une limite infrieure Une limite suprieure Intervalle de classe (amplitude)= limite (sup)- limite (inf) Centre de classe = [limite (sup) + limite (inf)]/2 NB : [40-60[ signifie quon comptabilise les salaris qui gagnent entre 40 et 60DH, en incluant ceux qui gagnent 40 DH et excluant ceux qui gagnent 60Dh.

Page 4

STATISTIQUE DESCRIPTIVE

V. Quelque symboles mathmatiques utiliss :


1. Les valeurs du caractre = x1, x2,, xi,, xn
Notes x1 x2 x3 x4 Nbre dtudiants 10 x1 25 x2 12 x3 4 x4

x1, x2,, xi,, xn= N =effectif total

2. Les effectifs sont symboliss par : x1, x2,, xi,, xn 3. Frquence relative :

Fi = effectif de la modalit i / effectif total

4. Loprateur somme (
Notation : n variables x1+ x2++ xi+.+ xn= xi
i =1 n

Proprits :

axi = a xi
i =1 i =1

a + xi = a xi = n.a + xi
i i =1

5. Lopration de produit : ( )
Notation : le produit de x variable scrit : X1.x2.x3.xn =

xi
i =1

Proprit :

a = a n
i =1

axi = a n
i =1

xi
i =1

Page 5

STATISTIQUE DESCRIPTIVE

CHAPITRE I : LA REPRESENTATION GRAPHIQUE


Lintrt dun graphique cest de synthtiser des informations statistiques dune manir image, cest dire globale.

I. Le diagramme en btons :
On sen sert pour reprsenter des sries caractre discret. Cordonn Nombre denfants Nombre de mnage 40 . 0 25 30 . 1 42 20 . 2 38 10 . 3 15 . . . . . . .Les valeurs de 4 6 0123456 caractre 5 Total 128 Abscisse

II. Le tuyau dorgue :


On se sert de ce graphique pour reprsenter des sries caractre qualitatif EX : La population une station balnaire est compose de : Allemands : 45% Franais : 30% Espagnoles : 15% Autres : 10%

50% 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% Allemands Franais Espagnoles Autres Srie1

Page 6

STATISTIQUE DESCRIPTIVE

III. Le diagramme :
Il permet de reprsenter des sries de caractres ou les observations sont regroupes en classe. a. Cas ou les intervalles de classe sont gaux :
50% 45% 40% 35% 30% 25% 20% 15% 10% 5% 0%
1

Allemands Franais Espagnoles Autres

Remarque : 1) Lorsque une des limites de classe nest pas prcise dans un tableau il convient de prendre comme intervalle de classe le mme que celui de la classe suivante ou prcdente. 2) La surface des rectangles est proportionnelle leur effectif. b. Cas ou les intervalles de classe ne sont pas gaux :

EX : Rpartition de population selon leurs salaires.


25

Srie1 20

15

10

0 1 2 3 4 5 6 7 8 9

Pour tracer lhistogramme, on commence par corriger les effectifs.

IV. Le polygone des frquences :


Il permet de donner une image plus lisse du phnomne que lhistogramme. On lobtient en joignant les milieux des sommes des rectangles de lhistogramme.

Page 7

STATISTIQUE DESCRIPTIVE

. . . . . . . . 0 10 20 30 40 50 60 Remarque : 1) La surface sous le polygone = la surface de lhistogramme. 2) Lorsquil y a un trs grand nombre de classe, lintervalle de classe devient de plus en plus petit et le polygone de frquences se transforme en cours de frquence.

Courbe de frquences

V. La courbe de cumulation (courbe des f cumuls) :


Elle permet de connatre le nombre dobservations suprieures ou infrieures une valeur donne. Les 2 types de courbes de cumulation : Courbe cumulative croissante : permet de connatre le nombre dobservations infrieures une valeur donne. Courbe cumulative dcroissante : il permet de connatre le nombre dobservations suprieures une valeur donne. a) Salaire [10-20[ [20-30[ [30-40[ [40-50[ [50-60[ [60-70[ Total Cas dune variable continue : xi 9 13 22 10 7 4 65 Xi cumuls 9 22 44 54 61 65 Moins de la borne suprieure Xi cumuls 65 56 43 21 11 4 Plus de la borne infrieure

Page 8

STATISTIQUE DESCRIPTIVE

Remarque : On obtiendrait le mme graphique si on remplace les frquences absolues par les frquences relatives (les pourcentages) Courbe cumule dcroissante Courbe cumule croissante
70 60

50

40

30

20

10

0 1 2 3 4 5 6 7

b) Cas dune variable discrte (discontinue) NB denfants (xi) 1 2 3 4 Total NB de mnage 5 10 30 20 65 Xi cumuls 5 15 45 65 <=xi Xi cumuls 65 60 50 20 >=xi

Xi 65 40 20 10 Xi 0 1 2 3 4 5

VI. Le diagramme polaire :


On lutilise pour reprsenter des sries chronologiques cest dire des sries ou les observations seront des temps rguliers.

Page 9

STATISTIQUE DESCRIPTIVE
a) Les principes des coordonnes polaires : un point M dans lespace est parfaitement repr : Si on connat ses coordonnes cartsiennes (x, y). Si on connat ses coordonnes polaires (e, o).

Y e O b)

X Le diagramme polaire :

Soit la srie chronologique suivante : chiffre daffaire mensuel Anne Janvier Fvrier Mars Avril Mai Juin Juillet Aot Septembre Octobre Novembre dcembre 1999 55 53 65 50 43 41 35 30 34 40 45 55 2000 65 75 72 40 42 38 32 34 38 40 33 45

Lide est de prsenter chaque mois par un axe, nous aurons donc 12 axes, chaque axe faisant avec son voisin un angle.

Avr . 30 . 20 . 10 . . . . . . . . . .. . . . . . . . . . . . . 80 70 60 50 40 30 20 10 10 20 30 40 50 60 70 80 10 . 20 . 30 . Oct.

Juillet

Jan

Page 10

STATISTIQUE DESCRIPTIVE

VII. Les graphiques secteurs :

On les utilise pour reprsenter une srie exprime en pourcentages. EX : Pourcentage de touristes.

FR All Esp Autres

Page 11

STATISTIQUE DESCRIPTIVE

CHAPITRE II : LES PRANCIPALES CARACTERISTIQUES DUN SERIE INTRODUCTION


Avec la reprsentation graphique nous avons vu comment synthtiser une srie avec image. Dans ce chapitre nous allons voir comment synthtiser une srie par quelques chiffres. Ces nombres sont appels caractristiques dune srie. Soit les srie suivantes : Serie1 : 78-79-80-83 Srie2 : 60-70-80-90-100 Srie3 : 1-1-1-1-396 Les sries ont toutes la moyenne 80 mme si elles sont trs diffrentes les unes que les autres. Les valeurs de la 1re srie sont proches de la moyenne alors que celles de la 3me sont loignes de la moyenne. Il y a donc ncessit, pour rsumer une srie de donnes de la prsenter en 2 types de caractristiques : - les caractristiques de valeurs centrales. - les caractristiques de dispersion.

SECTION 1 : Les Caractristiques de Valeur Centrale :


I. LES MOYENNES
A- La moyenne arithmtique : A-1 Dfinition Etant donne n observations quon va appeler X1,X2 ,X3,Xi,Xn on appelle une moyenne arithmtique simple le nombre Somme de toutes les observations

=
Le nombre dobservations

x1 + x 2 + ....... + xi + ...... + x n n

Page 12

STATISTIQUE DESCRIPTIVE

n Lorsque les observations sont groupes c'est--dire que lon observe N1 fois X1 N2 fois X2 La moyenne arithmtique scrit :
x1 + x1 + ..... + x 2 + x 2 + ...... n1 + n 2 + .... + n n

x
i =n

: Une moyenne arithmtique simple

n x
i =n n i

Une moyenne arithmtique pondre

n
i =1

A-2 Application Exercice1 : soit la srie de notes suivante : 2-6-12-10-12-10-10-6


2 + 6 + 12 + 10 + 12 + 10 + 10 + 6 68 = 8 8 = 8,5 =

Exercice2 : soit la srie des notes de lexercice qui peut tre prsente de la manire suivante : Notes xi Effectifs ni ni xi
= 68 = 8,5 8
n i =1 i i

n x = n
i

2 6 10 12 total

1 2 3 2 8

2 12 30 24 68

Page 13

STATISTIQUE DESCRIPTIVE

Exercice3 : soit les srie suivante : rpartition selon lage

age

Ni

3155 = 35,85 Annes 88 Moyenne de lage ou lage moyen

[20 25[ [25 30[ [30 35[ [35 40[ [40 45[ [45 50[
TOTAL

Centre de classe xi

ni xi

8 10 20 25 15 10 88

22,5 27,5 32,5 37,5 42,5 47,5

180 275 650 937,5 637,5 475 3155

a-3 Mthode des simplifications des calculs Lorsque les calculs sont compliqus, on peut les simplifier en prcdant un changement de variable Par changement dchelle : Tout variable Xi peut scrire : Xi= a Xi a= nouvelle chelle Ex
Xi 24 36 = = a 1 1 * * * Xi 24 36 Xi 24 36 = = a 6 6 * * * Xi 4 6

Xi= nouvelle variable

a=1 Xi = Xi

a=6 a =6

Xi = 4 Xi = 6

par changement dorigine et dchelle : tout variable Xi peut scrire

xi = x 0 + axi'
X0 = nouvelle origine

a : n.chelle

Xi : n. variable

Ex : Xi 14 22 X0 = 4 = 4 + + a 2 2 * * Xi 5 9

Page 14

STATISTIQUE DESCRIPTIVE

Si on pose xi = x0 + axi' xi' =

xi x0 a

La moyenne arithmtique : ni x i = ni

n (x + ax ) = n x n + a n x = n n x = x +a n
i 0 ' i i 0 i i i i ' i 0 i ' i

' i

= x 0 + a avec
X0= n origine a: n chelle xi' : n variable

' i

n x = n
i i

' i

= x0 + a xi'

On utilise cette relation pour simplifier les calculs de la manire suivante On prend pour X0 la valeur de caractre la plus frquente On prend a lintervalle des classes lorsque les classes sont gaux Application : Calculez la moyenne avec changement du variable x0 = 37,5 cest le centre de classe modale a= 5 xi =( xi - x0)/5 Age 20-25 25-30 30-35 35-40 40-45 45-50 total effictifs 8 10 20 25 15 10 88 xi 22,5 27,5 32,5 37,5 42,5 47,5 xi= (xi- x0)/a -3 -2 -1 0 1 2 ni*xi -24 -20 -20 0 15 20 -29

' i

n x = n
i i

' i

= 37,5+5(-29/88)=35,8 ans

Page 15

STATISTIQUE DESCRIPTIVE

a-4 calcul de la moyenne arithmtique laide des frquences relatives

= =

n x n
i i

n1 x1 + n2 x 2 + ...... + ni xi + nn x n ni

ni x i n x n x + 2 2 + ......... + n n n i ni ni

= f i xi + f 2 x 2 + ........ + f n x n

ni

ni

frquence relative xi 10 11 12 13 14 Ni 5 8 10 12 5 40 fi 0,125 0,20 0,25 0,30 0,125 fixi 1,25 1,6 2,5 3,6 0,75 12,7

do : = f1x1 +f2x2 +.+fnxn

= =12,7

fixi

B- La moyenne gomtrique : b-1 Dfinition tant donne n observations connues individuellement (x1,x2,x3,,,,,,,,,,, xn) on appelle moyenne gomtrique simple de ces n observations la grandeur G t.p : G= n X 1. X 2..... Xn = ( X 1. X 2.... Xn) 1/n

i =n G = xi i =1 b-2 calcul de G

lorsque les observations sont groupes ; chaque pondr Xi sera pondr par leffectif correspondant, la moyenne gomtrique scrit : G = n X 1. X 1. X 1 * X 2. X 2. X 2 * X 3 * X 3 X 3 N= n1+n2 +..+nn

G= n X 1n1. X 2 n 2. X 3 n 3.... Xn nn .

calculer G est plus facile en passant par le logarithme, en effet.

Page 16

STATISTIQUE DESCRIPTIVE

G= n X 1. X 2.... Xn = ( X 1. X 2. X 3..... Xn ) log G = 1/n log (X1.X2..Xn) = 1/n [log X 1 + log X 2..... + log Xn]

1/ n

log Xi
Log G= Ni

La moyenne gomtrique pondre


n n G = n x1n1 .x 2 2 ........x n n n n G = x1n1 .x 2 2 .......x n n

n n log x1n1 .x2 2 .....xn n 1 nn n1 n2 log G = log x1 .x2 ........xn = n n

n1.logx1 + n2 logx2 +...... nnn + n n

log G =

n log n
i i

xi

Application : calculer la moyenne gomtrique


7,316 = 0,9145 8 G = 10 0,9145 = 8,2 log G =

xi 2 6 10 12 Total

ni 1 2 3 2 8

log xi 0,301 0,772 1 1,158

ni log xi 0,301 1,556 3,0 2,158 7,316

Page 17

STATISTIQUE DESCRIPTIVE

Cc-1 Dfinition

la moyenne harmonique :

tant donne n observations connues individuellement x1,x2,x3 ..xn on appelle moyenne hormique le nombre H tel que :

1 = H H=

x1

1 + ...... + 1 xn x2 = n

1x
n

n 1

moyenne harmonique simple.

xi

Si les observations sont groupes la moyenne harmonique scrit :

1 = M

x1 . 1

x1

+ x2 . 1

+ ..... + nn . 1 x2 xn = n1 + n2 + ......nn

n 1x n
i i

H=
Moyenne harmonique pondre

n n 1x
i i

xi
2 6 10 12 total

ni
1 2 3 2 8

c-2 Application

1/ xi 0,5 0,166 0,1 0,083

ni.1/ xi
0,5 0,332 0,2 0,166 1,298

1 = H

xi

ni

1,298 8

H=
c-3 Remarque

8 = 6,16 1,298

1 = H

n 1x n
i i

n .X n
i i

avecX i =

1 xi

Linverse de la moyenne = moyenne des inverses

Page 18

STATISTIQUE DESCRIPTIVE

-La moyenne quadratique :

Dfinition : Etant donn n observations connues individuellement X1 ; X2 ;..xn 2 2 x12 + x 2 + ..... + x n xi2 2 2 Q = Q = n n
Q=

x
n

2 i

moyenne quadratique simple

si les observations sont groupes, la moyenne quadratique scrit : 2 2 n .x 2 + n2 .x 2 + ...... + nn .x n Q2 = 1 1 n1 + n2 + ...... + nn


2

n .x = n
i i
2 i

2 i

Q=

n .x n
i i

2 i

moyenne quadratique pondre

Application :

Q2 =

n .x n
i i

664 = 83 8

Q = 83 = 9.1

xi 2 6 10 12 total

Ni 1 2 3 2 8

Xi 4 36 100 144

Ni. Xi 4 72 300 288 664

n .x = n
i i

2 i

n .X n
i i

avecX i = xi2

Carr de la moyenne = la moyenne des carrs

Page 19

STATISTIQUE DESCRIPTIVE

Gnralisation de la notion moyennes : d.1moyenne dordre r

on appelle moyenne dordre r la quantit Mr tel que :


r r x r + x 2 + ........ + x n Mr = 1 n r r x1r + x 2 + .... + x n n

M rr =

1 Si r= 1 M 1 =

x1 + x 2 + x3 + ....... + x n 1 M1 = n
2 2 x12 + x 2 + ....... + x n 2 M 2 = Q2 M 2 = Q n

2 si r= 2 M 2 =

1 si r= -1 M 1 =

x11 + x 2 1 + ...... + x n 1 1 1 = H 1 = M1 = H n M 1 H

si r=

0.

M 0 = G

d.2-

le classement des moyennes : les ingalits entre les moyennes :

On dmontre que les moyennes sordonnent selon la valeur de r c--d que si : r1 < r 2 M r1 < M r2 Ce qui nous donne : M 1 < M 0 < M 1 < M 2

H <G<<Q Dans notre exemple, on trouve : 6,16 <8,2 <8,5 < 9,11.
d-3 Le choix dune moyenne : En thorie, aucune moyenne nest meilleure que lautre. Lutilisation de telle moyenne dpend du problme pos. Exemple : Ex1 : Soit un petit jardin sous forme de rectangle, le propritaire ne peut se souvenir que dun seul chiffre. 9

4
9

Sil veut entourer son champs de fil de fer il a intrt se souvenir de la moyenne arithmtique car le primtre est li la somme des diffrents cts.

Page 20

STATISTIQUE DESCRIPTIVE

Sil veut mettre de lengrais son jardin, il a intrt se souvenir de la moyenne gomtrique

9+4+9+4 = 6,5; G = 9 * 4 = 6 4 moyenne arithmtique du primtre =26 =6,5 * 4 6 * 4 moyenne gomtrique : surface =36 =6*6 6,5 * 6,5 =
Gnralits : Dune manire gnrale, on retient la moyenne arithmtique quand les variables sadditionnent, et on utilise la moyenne gomtrique lorsque les variables se multiplient. Ex2 : Une voiture parcourt 100Km/h, puis 160Km/h 80Km/h. distoncetotale 100 + 160 100 + 160 Vitessemoy = = = 100 160 1 1 tempstotal 100. + 160 + 50 80 50 80 ni MH = ni . 1 xi La vitesse moyenne est gale la moyenne harmonique des vitesses pondres par les distances. Ex3 : Une voiture roule pendant une heure 50 Km/h puis 3h 80Km/h.

Vitesse.moy =
=

distoncetotal (1 50) + (3 80) = 1+ 3 tempstotal

n x n
i

i i

La vitesse moyenne est gale donc la moyenne arithmtique des vitesses pondres par le temps. Ex 4 : Une grandeur S0 a augment sur 3 annes, dabord de 10% puis de 15% et 30% pour le 3me anne. Quel est le taux moyenne de croissance ? 1re anne : S0 devient S1=S0 + (S0*10/100) S1 =S0(1+0,10 ) = 1,10S0 2me anne S1 devient S2 = S1 +0,15S1 S1*1,15 (S1*(1+0,15)) 3me anne S2 devient S3 = S2 +0,3S2 = 1,3S2 (S2*(1+0,3)) S3 = S01,1 1,15 1,3 Moyenne gomtrique G = 3 1,1 1,15 1,3 = 1,1804 Remarque: le taux de croissance moyenne est 18,04%

Page 21

STATISTIQUE DESCRIPTIVE

Ex 5 : Un tudiant a obtenu les notes suivantes : 8-10-12 on veut calculer la moyenne des carts entre les notes et la moyenne arithmtique.

8 + 10 + 12 = 10 3
moyenne arithmtique des carts = (-2+0+2)/3 moyenne arithmtique des carts = 0

Ecart type la moyenne 8-10 = -2 10-10 =0 12-10 =2

On retrouve ici une des proprits des moyennes arithmtiques : xi = 0

Dmonstration :

=0 n Si on veut calculer la moyenne des carts, il vaut mieux calculer la moyenne quadratique
i i i

x x =x

n x = xi n

Q2 = Q=

( 2)2 + (0)2 + (2)2


3 8 = 1,6 3

8 3

Page 22

STATISTIQUE DESCRIPTIVE

II. La mdiane (Me) b-1- Dfinition :


On appelle mdiane dune srie classe par ordre croissant ou dcroissant, la valeur du caractre qui partage en deux parties gales les effectifs. Cest la valeur du caractre telle que la moiti des effectifs lui est suprieure et lautre lui est infrieure.

b-2- Calcul de ME :
Cas dune variable discrte Si la srie a un nombre impair de terme Me =57 75 62 57 12 18 Si la srie a un nombre pair 12 25 32 44 52 69 Intervalle Mdian [32-44] On prend le centre de lintervalle comme la mdiane : Cas dune srie de classes : Salaires 10-15 15-20 20-25 25-30 Total Effectifs 9 25 32 16 82 Effectifs cumuls 9 34 66 82 Le calcul de la mdiane se fait en 3 tapes : 1re tape : on repre le rang de la mdiane. Rang = 82/2 = 41 Rang =

ni

2me tape : on repre la classe de Me : Il sagit de trouver la classe laquelle appartient le 41me individu, pour cela on classe les individus par ordre croissant des salaires, ce qui revient construire la colonne des effectifs cumuls. . Me [20-25], on peut calculer avec plus de prcision Me en faisant une interpolation linaire. 3me tape : linterpolation linaire : On connat les salaires des 34 individus 20 On connat les salaires des 66 individus 25 Le 41me individus cest le 7me individus que je rencontre dans la classe 20 -25, son salaire sera obligatoirement gal 20 + supplment que lon calcule par interpolation. En supposant que les 32 individus de la classe 20-25 sont rpartis dune manire uniforme dans la classe 20-25 puis sont spars par la mme quantit de salaire On raisonne alors de la manire suivante : Si pour 32 individus nous avons un cart de salaire de 5 DH

Page 23

STATISTIQUE DESCRIPTIVE
Pour 1 individu 5/32 Pour 7 individus 5/32 * 7 = 1.09 DH Me=20+1.09 =21.09 La moiti des effectifs gagnent plus de 21,09 DH et lautre moiti gagne (moins de 21,09 DH)

b-3- Dtermination graphique de la mdiane : Courbe cumulative

b-4-Remarque : Salaire 10 15 15 - 20 20 - 25 25 - 30 Xi 9 25 32 16 Xi 9 34 66 82

Total Xi =82

Page 24

STATISTIQUE DESCRIPTIVE

Mthode rapide dinterpolation :

Me 20 41 34 75 = Me = + 20 21 25 20 66 34 32

2. le 41 me individu normalement la mdiane devrait se situer entre le 41 me et le 42 me, mais on convient lorsque les effectifs sont nombreux de prendre (N / 2) III. Le Mode : Cest la valeur du caractre le plus frquent. A- Calcul Mode : 1- Cas dune variable discrte : Xi 3 14 21 42 ni 3 18 7 4 Xi Ni 2 4 17 16 33 15 39 16 51 8 Mo = 17

Mo =14 Srie Uni modal

Mo = 39 Srie bimodale Srie plurimodale (srie plusieurs modes)

Page 25

STATISTIQUE DESCRIPTIVE

2-Cas dune srie de classe : Salaires 10 15 15 20 20 25 25 - 30 Total ni 9 25 32 16 82 -Nous avons une classe modale : 20 25 - On peut prendre comme mode le centre de classe 22,5 - On peut chercher obtenir le mode avec plus de prcision :

1/ Par Mthode graphique : Elle consiste dabord construire lhistogramme

N.B : Ne pas oublier, lorsqu on construit lhistogramme de corriger les effectifs. 2/ Par la mthode algbrique : Mo = L1 + [d1. I / (d1 + d2)] Mo = 20 +
( 32
25 ) *

(32-25) + (32 - 16)

Page 26

STATISTIQUE DESCRIPTIVE

L1 : Limite Infrieure de classe modale d1 : La diffrence entre les effectifs de la classe modale et les effectifs de classe prcdente d2 : La diffrence entre les effectifs de classe modale et les effectifs de classe suivante i : Lintervalle de la classe modale IV. VI- Le choix dune caractristique de tendance centrale : A : Les conditions de Yule : 1 r conditions : Une modalit caractristique doit tre : dfinie de faon objective. (2 personnes diffrentes doivent trouver le mme rsultat) 2 me conditions : Tenir compte de toutes les observations 3 me conditions : tre facile comprendre 4 me conditions : tre facile calculer 5 me conditions : Doit se prter au calcul algbrique B : Comparaison des diffrentes caractristiques de tendance centrale : 1-La moyenne : Elle rpond parfaitement aux conditions de Yule ; cest pour cela quelle est la caractristique la plus utilise, mais il y a des cas ou il faut lui prfrer la mdiane quand elle risque dtre influenc des valeurs extrmes. EX: Notes 1 16 17 18 Xi 1 2 5 2 10 Ni * Xi 1 32 85 36 154 X = 154 / 10 = 15,4 X = 153 / 9 = 17

2-La mdiane : Elle ne satisfait pas les conditions de yule. En effet, la valeur de la mdiane ne change pas quand on augmente la valeur dune observation qui lui est infrieure 15 22 34 41 60 1 2 34 41 60 122 34 41 110

Page 27

STATISTIQUE DESCRIPTIVE

3-Le mode : Ne remplit pas les conditions de Yule, mais il y a des cas ou il est utile, en particulier quand on cherche la valeur la plus typique dune srie : Ex : un vendeur de chaussures ne va pas stocker des chaussures de pointure moyenne, mais va stocker les chaussures les plus vendues.

SECTION 2 : Les Caractristiques de Dispersion:


Partons de 3 sries Srie 1 : 9 Srie 2 : 5 Srie 3 : 1 11 15
_

X
_

= 10 = 10

X
_

19 X = 10 Les 3 sries ont la mme moyenne : 10 et portant ils sont diffrents lunes des autres. Dans la 1re srie ; les valeurs du caractre sont proches de la moyenne. La moyenne est reprsentative. Dans la 3 me Srie les valeurs du caractre sont loignes de la moyenne. Il faut donc lorsquon rsume une srie, indiquer par un nombre si les valeurs sont proches ou loignes de la valeur centrale. Ce nombre est appel caractristiques de dispersion. I. Lintervalle de variation ou ltendue : Cest la diffrence entre la plus grande valeur du caractre et la plus petite. Lintervalle de variation = Val MAX Val MIN = 10 srie 2 = 18 Srie 3 = 2 Srie 1 Etendu ou intervalle de variation nest pas un indicateur toujours fiable, car il dpend des valeurs extrmes qui prouvent tre fausses ou aberrantes. EX : 17.1820.60.Age 1000 tudiants
=3

= 60 17 = 43

Page 28

STATISTIQUE DESCRIPTIVE

II. Lintervalle inter quartile : A- Dfinition des quartiles : On appelle 1r quartile Q1 la valeur du caractre tel que : 25% des observations lui sont infrieurs et 75% lui sont suprieurs. 25% < ; 75%> 2me quartile Q2= Me 50% < 50%> 3m quartile Q3= 75%< 25%> B- Dfinition inter quartile : On appelle inter quartile : Q3 Q1 diffrence entre 1r quartile et 3me quartile. N.B : Intervalle Inter quartile contient 50% des observations C- Application : N= 82 Rang : 82/4 =20 ,5 Classe : [15-20] Interpolation : 15+ Salaires Effectifs Ecart I. Inter quartile 10-15 9 Q3 Q1 15-20 25 =24,3 - 17,3 20-25 32 = 7DH 25-30 16 Total 82 Interprtation : Si 25 individus Si 01 Individu (20,5 - 9) = 11,5 5/25 * 11,5

Ni Cum 9 34 66 82

Augmentation de 5 DH Augmentation 5/25 DH

Donc Q1 = 15 + 5/25 *11,5 = 17,3 DH 2me Mthode :

Page 29

STATISTIQUE DESCRIPTIVE

Calcul de Q3 Rang : 82*3/4 =61,5 Classe = [20-25] Interpolation : si 32 individus 01 Individu (61,5 34) = 27,5 individus

augmentation de 5 DH Augmentation de 5/32 Augmentation 5/32 *27,5

Donc Q3 = 20+ [(5/32) *27,5] Signification : 24,3dh cest le salaire tel que 75% gagnent plus de 24,3 et 25% gagnent moins de 24,3 DH. Inter. Inter quartile : 7 DH = Q3-Q1 Signification : pour 50% des effectifs lcart Maximum de salaire est de 7 DH D Remarque : 1- Les dciles : valeur du caractre que 10 % des observations ont une valeur qui est infrieure D1 et 90% des observations ont une valeur qui est suprieure D1. On appelle 9 me dcile de 9 la valeur du caractre tel que 90% des observations lui sont infrieures, et 10% des observations lui sont suprieures. Lintervalle inter dcile D9 - D1 contient 80% des observations 2- Les percentiles : On appelle percentiles P1 la valeur du caractre telle que un pourcent (1%) des observations ont une valeur infrieure P1 et 98% ont une valeur suprieure P1. Pour le statisticien KELLY pour supprimer les valeurs aberrantes il suffit de calculer lintervalle inter percentile P93 P07 qui contient 86% des observations.

Page 30

STATISTIQUE DESCRIPTIVE

Lcart absolu moyen : A- Dfinition : On appelle cart absolu moyen que lon dsigne par la moyenne arithmtique des carts absolus entre les valeurs du caractre et la moyenne arithmtique. Ca=

ni xi x /

ni

B- Application : soit le tableau suivant : Poids


55-60 60-65 65-70 70-75 75-80

ni
12 17 36 24 11 100

xi
57,5 62,5 67,5 72,5 77,5

ni * xi
690 1062,50 2430 1740 852,50 6775

xi x

ni xi x

10,25 5,25 0,25 4,75 9,75

123 89,25 9 114 107,25 442,5

Ca= 442.5 / 100 = 4.42 Kg

= 67.75 Kg

Signification : Ca = 4.42 Kg signifie quen moyenne, chaque individu sloigne de la moyenne (67.75 Kg) de 4.42 Kg. Remarque : Pour dire si une dispersion est grande ou non, pour comparer deux sries entre elles, on se sert de lindice de dispersion relatif = Ca / X *100 Exemple : Poids de filles Poids des garons =52 Kg =68 Kg Ca= 2 Kg Ca = 17 Kg 2/52 *100= 3.8% Dispersion Faible 17/68 * 100 = 25% dispersion plus importante

IV- La variance et lcart type : A- Dfinition : On appelle une variance la moyenne arithmtique des carrs des carts entre les valeurs du caractre et la moyenne arithmtique.
2 = ni ( xi x) /
2

ni
Page 31

STATISTIQUE DESCRIPTIVE

On appelle cart-type (ou cart quadratique moyen) la racine carr de 62


=

ni ( xi x) 2 / ni

B- Application : Le mme tableau prcdent (xi- )2 105,0625 27,5625 0,0625 22,5625 95,0625 ni*(xi- )2 1260,75 468,5625 2,25 541,50 1045,6875 3318,75
=

ni( xi x) / ni
2

3318.75/100 =5.76

Signification : En moyenne chaque individu scarte du poids moyen (67.5 kg) de 5.76 kg. C- Remarque : Si on veut savoir la valeur de dispersion on utilise le cfficient de variation = / Ex : =67.75 Kg / =(5.76/67.75) *100= 8.5% Ex 2 : Soient 2 modles dampoules lectrique dont on a relev les dures de vie. Modle 1 : Dure de vie moyenne 1400 H. Modle 1 : Dure cart-type =100 H Modle 2 : Dure de vie moyenne 1800 H. Modle 2 : Dure cart-type = 250 H

Page 32

STATISTIQUE DESCRIPTIVE

Modle I Modle II 250/1800 *100 = 14% 6/ =100/1400 = 7% Le modle I est plus faible que le modle II Formule dveloppe : 2 Donc = ni xi

ni

Poids
55-60 60-65 65-70 70-75 75-80

ni
12 17 36 24 11 100

xi
57,5 62,5 67,5 72,5 77,5

xi2
330625 390625 455625 525625 600625

ni * xi2
39675 66406,25 164025 126150 66068,75 462325

= 462325 - (67.75)2 33.19 100

= 33.19 =5.76

SECTION III : Les Caractristiques de Concentration


La concentration ne sapplique qu des sries statistiques ou la concentration de la variable a un sens EX : on peut parler de la concentration de revenus, concentration foncire Autres EX : on ne peut pas parler de concentration dge On peut dterminer la concentration soit algbriquement soit graphiquement I. La dtermination algbrique de la concentration
Cette dtermination ncessite la connaissance de la mdiale Notion de la mdiale (Ml)

A- La mdiale
Si dans une srie on dsigne par xi la valeur du caractre, par ni les effectifs, la mdiale est la valeur du caractre qui partage en deux parties gales le produit cumul de ni xi. Si xi dsigne un salaire Ni dsigne le nombre de salaris

Page 33

STATISTIQUE DESCRIPTIVE

Le produit cumul des ni xi reprsente la totalit des salaires Verss

nixi

Cest--dire la masse salariale. La mdiale, cest le salaire tel que la moiti de la masse salariale a servi payer une partie qui touche moins de cette Mdiale et lautre moiti de la masse s a servi payer les gens qui touchent plus de cette Mdiale. B- Mesure de la concentration
M sert mesurer la diffrence entre ML et ME : M=ML ME * Si M = 0 cela veut dire que ML =ME C'est--dire lindividu qui est au milieu leffectif est en mme temps celui qui est plac tel que la moiti de la masse salariale a t verse des gens qui touchent moins que lui, et lautre moiti des gens qui reoivent plus que lui, on a donc une distribution galitaire concentration est nulle * Si m 0 cela indique quil y a une concentration * Si m est faible par rapport lintervalle de variation la concentration est faible * Si m est important, la concentration est forte Inter variation

C- application
salaire 10-15 15-20 20-25 25-30 total ni 8 25 32 16 82 xi 12.5 17.5 22.5 27.5 nixi 112.5 437.5 720 440 1710 nixi 112.5 550 1270 1710

M= ML ME Calcule de la ML : Rang = 1710/2=855 Classe [20.25] Interpolation linaire

720 5dh 1dh 5/720dh (855-550) =3055 5/720*305dh

Donc ML= 20+5/720*350

ML = 22.12dh

M = ML - ME = 22 ,12 - 21,09 1dh

Page 34

STATISTIQUE DESCRIPTIVE

M/inter varia = 1/20=5% concentration faible Lintervalle de variation tant gale : (30-10)=20 Signification ML = 22.12 dh

Cest le salaire tel que la moiti de la masse salariale a servi payer des gens qui gagnent moins que 22.12 dh et lautre moiti de la masse salariale a servi payer les gens qui gagnent plus que 22.12 dh

II. La dtermination graphique de la concentration la courbe de Lorentz


GINI
A- la graphique de GINI GINI propose de mesurer la concentration en mettant en abssices les frquences cumules en%, et en ordonnes ni xi cumuls en %
salaire 10-15 15-20 20-25 25-30 total ni 9 25 32 16 82 Fi% 11 30.5 39 13.5 100 Fi% *n 11 41.5 80.5 100 xi 12.5 17.5 22.5 27.5 nixi 112.5 437.5 720 440 1710

Nixi% 6.6 25.6 24.1 25.7

Nixi%cum 6.6 32.2 74.3 100

: Diagonal de lgalit : Aire de concentration

Remarques :

1) si 10% de la population touchent 10% du revenu, 20% de la population touchent 20% du revenu. Dans le cas dune rpartition galitaire du salaire, laire de concentration serait confondue avec diagonal. 2) Dans le cas dune repartions illgalitaire parfaite des salaires, (comme dans le cas thorique ou 0.1% de la population toucherait 99.99% de la masse salariale : la courbe

Page 35

STATISTIQUE DESCRIPTIVE

B)-Le coefficient de Gini : Gini propose de calculer la concentration laide de coefficient suivant :

Aire de concentration C= Aire du triangle ABC Aire de G C= 5000(100*100/2) On peu estimer laire de concentration de la manire suivant : Aire de concentration = 5000-(S1+S2+S3+S3) B A A n S = n/2(a+b) b Remarque : 0<c<1 c = 0 Concentration lev c = 1 Concentration faible Donc c=5000-4404/5000 0.12 C d les gens sont pareils S=1/2 a*b S1 = (116.6) S2= (41.5-11)/2(6.6+32.2) S3= (80.5-41.5)/2(32.2+74.3) S4 = (100-80.5)/2(74.3+100) Si = 4404

Page 36

STATISTIQUE DESCRIPTIVE

CHAPITRE III :LES SERIES A DOUBLE ENTREES : REGRESSION LINEAIRE (CORRELATION) Inotion de tableau de contingence :

A. une distribution statistique double Cest une distribution ou lobservation seffectue selon 2 caractres. EX : Rpartition des tudiants selon la taille et lge Rpartition des logements selon le nbre de pices et superficie 10-30 30-50 50-70 70-80 total superficie nbr de piece

1 2 3 4 5 total

3 1

1 14 1 16

3 7 10 6 20

4 7 6 17

18 12 17 6 57

B. distributions marginales

Ce sont les distributions relatives la seul variable X ou Y


a- la rpartition des logements selon le nombre de pices (X) Nbre de Nbre de logement pices (x) 1 4 2 18 3 12 4 17 5 6 total 57

Cette distribution qui concerne la seule variable x est applle distribution marginale (marginal car on la trouve la marge du tableau statistique) On peut calculer la moyenne de cette distribution, (et sa signification est le nbre de pices moyenne par logement) Moyenne appele moy.marginale note b- la rpartition des logements selon la superficie :
superficie y 10-30 30-50 50-70 70-80 total Nbre de logements 4 16 20 17 57

Page 37

STATISTIQUE DESCRIPTIVE Cette distribution qui concerne la seule variable y est appele distribution marginale on peut calculer la moyenne (qui exprime la surface moy des logements) applle moy.marginal note

C. Les distributions conditionnelles :

On appelle distribution Conditionnelle la distribution ou lon a pos une condition sur lune des variables. Ex : Rparation de logements de 30-50m Cette distribution est appele Distribution Conditionnelle parce que lon ne sintresse quaux logements qui satisfont la condition de surface 30-50 m2. On peut calculer la moyenne de cette distribution (c-a-d le nombre moyen de pices des logts de 30-50 m2) on appelle cette moyenne : moyenne conditionnelle. Dans cet exercice on calcule Remarque il existe autant de distributions conditionnelles relatives au caractre x que le caractre y a de modalits

II-

gnralisation du tableau de contingences :


Ym X1m X2m Xim Xkm x.m total X1. X2. Xi. Xk. x..

Y2 . Yj . x y Y1 X1 X11 X12 . X1j . X2 X21 . X2j . . . Xi Xi1 Xi2 . Xij . . . Xk Xk1 Xk2 . Xkj . total x.1 x.2 . x.j . x1 x2 . . . xk = les modalits de x y1 y2 . . . yk = les modalits de y x1 .effectifs pour la 1re modalits de x et pour toutes les modalits de y La distribution marginale de X : X(xi) X1 X2 . . Xi Xk Total Xi. X1. X2. . . Xi. Xk. X..

Page 38

STATISTIQUE DESCRIPTIVE

La distribution marginale de y : y(xi) y1 y2 . . yi ym Total Xj. X.1 X.2 . . X.i Xm. X..

Distribution conditionnelle relatif X et Y Dist. Conditionnelle relative X X X1 X2 . . Xi Xk Total Xij X1j X2j . . Xij Xkj X.j Dist. Conditionnelle relative Y y y1 y2 . . yi ym Total Xij Xi1 Xi2 . . Xij Xim Xi.

III-

La rgression linaire A. Prsentation du problme :

Soit le tableau suivant : qu Prix 70 75 77 80 86 93 Total 42 1 1 1 1 1 1 1 1 1 1 1 1 51 60 62 74 83 Total 1 1 1 1 1 1 6

Ce tableau est un tableau de contingence ou les observations sont connues individuellement, on peut prsenter plus simplement ce tableau de la manire suivante :

Page 39

STATISTIQUE DESCRIPTIVE

Nous avons un ensemble de points un nuage statistique qui nous indique que les prix est les quantits voluent selon la mme tendance. Il est possible de schmatiser ce nuage : -Par une fonction simple : la fonction linaire (Droite) qui sont inconnus et quil faudra trouver. a=pente de droite b=ordonne lorigine Une telle droite est appelle droite de rgression D(x) A=coefficient de rgression La rgression cest le fait de relier y x par une fonction Calcule des paramtres de la droite de rgression :

Notion de moindres carrs :

B. la mthode des moindres carrs

Partons dun nuage statistique thorique :

Il sagit de rsumer ce nuage par une droite. Soit y= ax+b lquation de la droite recherche. Pour toute valeur de x (xi) nous avons une valeur rellement observe y. Pour toute valeur xi, nous avons une valeur calcule sur la droite y. Pour toute une valeur xi, nous avons une erreur destimation gale | yi yi |.

Page 40

STATISTIQUE DESCRIPTIVE La droite de rgression idale doit tre de telle manire que la somme des erreurs destimation doit tre la plus faible possible, | yi yi | doit tre minimum. Pour viter les valeurs absolues, on convient de calculer les carrs des erreurs. La droite de rgression doit tre telle que : (yi yi) 2 minimum, et on appelle cela la condition des moindres carrs.

C. Calcul des paramtres de la droite de rgression.


Il sagit de trouver y= ax + b sachant que : (yi yi) 2 min. Remplaons yi par sa valeur (yi (axi+b)) 2 min. Posons (yi ax ; - f) 2 = Z (a , b). Pour que Z soit minimum, il suffit dannuler (rendre nul) les drivs de ce polynme par rapport a et par rapport b. 1 Calcul de b : Supposons a est connu, et drivons par rapport a b et a. Z = U2 dZ / db = 2 [ (yi ax ; -b)] (-1) = 0 Z = 2UU [yi ax ; -b) = 0 yi axi nb = 0 U = (yi ax ; -b) Divisons par n, on obtient (yi / n axi / n b = 0 - a = b Donc : b = - a La droite de rgression passe donc par le point moyen ( , ). 2 Calcul des a : ax y Y yi M xi Xi 0 x X x

Le paramtre a Que nous cherchons correspond la pente de la droite de rgression qui passe par le point moyen M ( ; ). Procdons un changement dorigine, et prenons comme nouvelle origine le point moyen M(x ; ), les nouvelles cordonnes deviennent : Xi = xi Yi = yi - La droite de rgression a pour quation y = ax Page 41

STATISTIQUE DESCRIPTIVE La condition des moindres carre scrit ; (yi i) 2 min (yi yi) 2 = (yi axi) 2min Drivons par rapport a : 2 [ (yi axi)] (-Xi) = 0 [ (yi axi)] Xi = 0 => (yi ai) Xi = 0 => xi yi a xi2 = 0 Donc a = xi yi /xi2 = (xi x) (yi - )/ (xi x) 2 3- lquation de la droite de rgression : Dy(x) = Y = ax + b a = (xi - ) (yi - ) / (xi ) 2 b=-a

D Application: Prix(x) Qts(y) 72 70 51 75 60 77 62 80 74 86 83 33 481 372

Dy (x) a pour quation: Y = ax + b a=

xi xi x
2

(x

x)( yi y )
i

x=

x
n

(x
i

x) 2

= 481 / 6 = 80

y = 372 / 6 = 62
Trouver Dy (x). xi - yi - -20 -10 -11 -5 -2 -3 0 0 12 6 21 13
(xi- ) (yi - ) 200 55 6 0 72 273 606 (xi- ) 2 100 25 9 0 36 169 339

a = 606 / 339 = 1.79 b = 62 (1.73)80 b = -81 Donc Dy(x) a pour quation : y = 1.79x 81 La loi de loffre pour ce bien

Page 42

STATISTIQUE DESCRIPTIVE

IV- la corrlation linaire :


Dans le paragraphe prcdent, nous avions estim y en fonction de x, et nous avions obtenu la droite de rgression Dy(x) On peut pour le mme nuage statistique estimer x en fonction de y, et trouver la droite de rgression Dx(y) lui aura pour quation.

Pour toute yi, nous avons une valeur observe xi. Pour toute yi, nous avons une valeur estime sur la droite xi Pour toute yi, nous avons une erreur destimation gale | xi xi | Dx(y) idale est tel que : | xi xi | minimum ou encore (xi xi) 2 minimum En procdant de la mme manire que dans le paragraphe prcdent, on trouve lquation de Dx(y). X = ay + b a = xi yi yi2 b = a

Dans le rfrentiel XMY nous obtenons 2 droites : Soit y = ax pour Dy(x) Soit x = ay pour Dx(y) Ou encore y = 1/a x 4 cas peuvent se produire : 1er cas : les 2 droites sont confondues Y= ax X = ay Y = 1/yx a = 1/a aa = 1

Page 43

STATISTIQUE DESCRIPTIVE 2me cas : les 2 droite font entre elles un angle trs faible :

3me cas : les 2 droite font entre elles un angle lev :

4me cas : les 2 variables sont indpendantes lune de lautre :

Si on appelle coff de corrlation la Quantit

r tel que : r = a . a , on peut crire :


2

Si r = 1 on a une corrlation parfaite. Si r = +1 on a une corrlation parfaite positive. Si r = -1 on a une corrlation parfaite. Corr. positive : c d les variables varient dans le mme sens. Si r = -1 = corrlation parfaite ngative. C d les deux phnomnes varient en sens inverse. Par exemple Prix et Quantit Si 0 < r < 1 = la corrlation est positive, elle est dautant plus forte que lon se rapproche de 1. Si -1 < r < 0 = la corrlation est ngative, et elle est dautant plus forte que lon se rapproche de -1. Si r = 0 = corrlation nulle.

Page 44

STATISTIQUE DESCRIPTIVE Application : calculer le coefficient de corrlation dune autre faon (existe-t-il un lien entre y et x). Prix 70 75 77 80 86 33
2

Qt 42 51 60 62 74 83

x x

y-

(x x ) (yi - )

(x x ) 2 (yi - ) 2

606

339

1110

606 606 r = a. a = 339 1110 donc r = 0.98 a=

xi y i x
2
i

( xi x)( y i y)

a =

x y y
i

( x x) ( x x)( y y) = 606 = 0.545 = 1110 ( y y)


2
i i i

606 = 1.79 339

On a une trs forte corrlation car r = 0.975 tend vers 1 Remarque : lorsquon crit

r = a. a
2

r = racine a .a, nous avons une expression trs

positif. Comment trouver alors le signe dune corrlation ? Rponse : le sens de la corrlation est donne par le signe de a et a. Si a et a sont >0 le produit a.a >0 corrlation positive. Si a et a sont <0 le produit a.a>0 corrlation ngative. On peut dire dune corrlation quelle est trs satisfaisante partir 0.86. On peut dire dune corrlation quelle parfaite partir de 0.96. IV formule facilitant les calculs : 1/ calcul de a : N a = (xi ) (yi - ) = , N = xi yi - xi x yi + x D (xi x) 2 xi xi = n x Or x = N y i yi = n = N On remplace : N = xi yi - n x -n x + n x N=

x y
i

nx y

D = (xi x ) 2 = (xi2 2xi x + x2) = xi2 2 x xi + n x 2 = xi2 2n x 2 + n x 2 D = xi2 n 2

Page 45

STATISTIQUE DESCRIPTIVE

Donc a =

xi y i n x y x2 n x
2

Formule dveloppe xi yi Xi yi xi2

x 2 calcul de r : r2= a.a a= xi yi n xi2 n 2 xi yi n yi2 n 2

a =

Donc

r=

a * a'

V Autre formule de r : r= [ (xi ) (yi - )] 2

(xi ) 2 (yi - ) 2 Or (xi ) 2 2 x = n y=


2

(xi ) 2 = n2x

(yi ) 2 n

(yi ) 2 = n2y

Donc r ==

[( x

x)( y i y )] 2

(xi ) (yi ) n.x. y

n 2 . 2 x. 2 y

Si on appelle : covariance de x et de y lexpression : (xi ) (yi ) n Cov (xy) r scrit : r = x.y Page 46

Cov (xy)

STATISTIQUE DESCRIPTIVE

CHAPITRE IV : ANALYSE DES SERIES CHRONOLOGIQUES. I Gnralits : A. Dfinition :


Une srie chronologique est une srie o les observations de la variable sont faites des intervalles rguliers de temps.

B. les diffrentes composantes dune srie chronologique.


Soit la srie chronologique suivante : Evolution trimestrielle du chiffre daffaire dune entreprise trimtres 1998 1999 2000 2001 1 120 130 144 157 2 148 162 178 196 3 155 169 186 210 4 120 132 145 160

Reprsentation graphique de la srie :

Lexamen dune srie chronologique rvle lexistence de diffrences composantes : Un mouvement de tendance longue ( long terme), appele trend . Un mouvement saisonnier qui est les variations saisonnires. Des variations accidentelles : ce sont des variations imprvisibles dues des circonstances exceptionnelles.

C. intrt dune analyse dune srie chronologique :


Lanalyse des sries chronologiques permet de sparer le mouvement de long terme du mouvement saisonnier, ce qui nous permettra de faire des calculs de prvision.

Page 47

STATISTIQUE DESCRIPTIVE

II lanalyse de la tendance longue : trend


Dterminer le trend, cela revient lisser la srie pour liminer les variations saisonnires, cette technique de lissage de la srie est appele Ajustement. Les 2 mthodes dajustement les plus utiliss sont : La mthode des moyennes mobiles. Lajustement analytique.

A. la mthode des moyennes mobiles :


Elle consiste diviser un nuage statistique en sous nuages comprenant chacune (n1) donnes du sous nuages prcdent, et remplacer chaque sous nuage par un point tel que : xi = mdiane des xi yi = moyenne des valeurs yi.

B.

Oprations sur les matrices : 1 2 3 -1 4 5

1 matrices transposes : 1 3 4 A= 2 -1 5 2 Laddition : 1 -1 3 + 2 4 1 (aij) + (bij) Proprits : = 0 4 3 = 3 -1 -1 (aij + bij)

A=

1 3 6 5 3 0

commutativit association lment neutre lment symtrique

t (a+b) = ta+tb
3- Multiplication par un rel : 1 -1 3 3 -3 9 3* = 2 4 1 6 12 3

aii = 0(n ;p)

la matrice nulle

Page 48

STATISTIQUE DESCRIPTIVE

CHAPITRE V :POPULATIONS ET ECHANTILLONS, RECENSEMENTS ET SONDAGES

Les journaux, la tlvision, les revues nous inondent constamment de graphiques, de tableaux et de statistiques de toutes sortes, dans diffrents domaines : Politique Social

Sondages, rfrendums, popularit des partis politiques et de leur chef. Criminalit, suicide, avortement, racisme, pratiques religieuses, orientations sexuelles, habitudes alimentaires. Importations, exportations, prix de vente, taux d'inflation, indice des prix la consommation (IPC), taux d'intrt, salaires, taux de chmage, cotes boursires, indices boursiers, dficits gouvernementaux.

conomie

Dmographie Taux de mortalit, taux de natalit, population par province, par nationalit. Culture tudes Sports

Entres au box office, cotes d'coutes. Rsultats scolaires, prts et bourses, cote R et cote Z. Meilleurs compteurs, classement des quipes, salaires des joueurs.

Ces prsentations peuvent parfois nous induire en erreur volontairement ou non. Il nous faut donc dvelopper un esprit critique et savoir interprter ces informations.

I.

Quelques termes de base :

La population cible est l'ensemble de tous les objets que l'on tudie. Une unit statistique est un objet de cette population. Un chantillon est une partie choisie d'une population. Le nombre d'objets composant une population ou un chantillon est appel sa taille. Lorsque l'on veut connatre certaines caractristiques d'une population, on dit qu'on enqute sur la population. Une enqute peut tre ralise auprs de toute la population ou sur un chantillon. Un recensement est une enqute ralise auprs de toute la population.

Page 49

STATISTIQUE DESCRIPTIVE
Un sondage est une enqute ralise sur un chantillon.

II.

Exemples:
1. tude portant sur la langue maternelle des Qubcois: la population est l'ensemble des Qubcois et la caractristique est la langue maternelle.

2. tude portant sur la dure des ampoules lectriques produites l'usine X. La population est constitue des ampoules lectriques produites l'usine X et la caractristique tudie est la dure des ampoules.

3. Une compagnie pharmaceutique veut vrifier un nouveau vaccin contre une certaine maladie. On administre ce produit 50 patients atteints de la maladie. La population est forme de tous les gens atteints de la maladie, l'chantillon est form des 50 patients qui on a administr le mdicament et la caractristique tudie est la rponse au mdicament.

Les cots levs et les dlais trop longs, relis un recensement, sont les principales raisons qui nous amnent utiliser un sondage puisque la taille d'un chantillon est beaucoup plus petite que celle de la population. Au Canada, il y a un recensement tous les cinq ans. Le dernier date de 1996.

III.

tapes d'une enqute statistique :


1. Dterminer la population cible et les caractristiques de cette population que l'on veut tudier. 2. Dterminer la manire dont l'chantillon va tre prlev.

Page 50

STATISTIQUE DESCRIPTIVE 3. Construire des instruments (questionnaires ou autres). 4. tablir un pr-test ou tude-pilote. 5. Recueillir les donnes. 6. Compiler les donnes. 7. Mettre en forme les donnes. 8. Analyser les donnes (analyse descriptive ou infrentielle). 9. Interprter les rsultats. 10. Communiquer les rsultats.

Page 51

STATISTIQUE DESCRIPTIVE

EXERCICES

Page 52

STATISTIQUE DESCRIPTIVE

OBJECTIFS VISES :

construction dun tableau statistique : distinguer une variable quantitative dune variable qualitative reprsentation graphique des variables quantitatives discrtes et continues calcul et interprtation des caractristiques de tendance centrale : moyenne. mdiane mode quartiles 5. calcul et interprtation des caractristiques de dispersion : variance cart type coefficient de variation
Exercice 1 :

1. 2. 3. 4.

Dans une entreprise de 80 salaris on a enregistr les salaires mensuels suivants : 54 salaris gagnent 6 000 dirhams ou plus ; 34 salaris gagnent 8 000 dirhams ou plus ; 20 salaris gagnent 10 000 dirhams ou plus ; 8 salaris gagnent 12 000 dirhams ou plus ; 1. Prsenter ces donnes dans un tableau avec des classes de mme amplitude en sachant quaucun salari ne gagne plus de 14 000 DH. 2. Calculer la moyenne et donner sa signification. 3. Calculer la mdiane et donner sa signification. 4. Calculer le mode graphiquement, algbriquement et donner sa signification. 5. Combien gagnent les 20% des salaris les mieux pays.
Exercice 2 : La rpartition des salaris dune entreprise de confection selon leurs gains mensuels (en milliers de dirhams) se prsente comme suit : Gains mensuels effectifs 25 [4-6[ 40 [6-8[ 58 [8-12[ 27 [12-18[ 6 [18-20[ 4 20 et plus

1. 2. 3. 4.

dterminer graphiquement le salaire modal calculer le coefficient de variation calculer ltendue calculer algbriquement et graphiquement la mdiane.

Page 53

STATISTIQUE DESCRIPTIVE
Exercice 3 :

La rpartition par ge dune population dun centre de vacances est comme suit : Classe dage (en annes) effectifs 16 0-5 42 5-15 44 15-25 40 25-35 30 35-45 32 45-55 15 55-60 36 60-75 15 75-100 1. tracer lhistogramme de cette distribution 2. calculer lcart type et donner sa signification 3. on dsire rajeunir cette population en invitant au centre des vacances des personnes de la classe [25-35[.combien faudrait-il en faire venir pour que la moyenne de la population soit de 35 ans.
Exercice 4 :

1. 2. 3. 4.

Dans une commune urbaine, on a relev la rpartition en pourcentages de 10 000 contribuables selon le montant des impts pays. Classes dimpts Frquences relatives en pourcentages 8 1-3 12 3-6 20 6-L2 26 L2-12 F6 12-18 10 18-22 6 22-30 Trouver les valeurs manquantes de ce tableau sachant que la moyenne est gale 11,42 tracer la courbe cumulative croissante dterminer graphiquement et algbriquement limpt mdian. donner sa signification quel est le pourcentage des contribuables qui paient un impt annuel suprieur 20 000dh ?cela reprsente combien de personnes ?
Exercice 5 :

Soit la distribution statistique suivante qui donne la rpartition des propritaires terriens selon la superficie des terres cultivables dans une certaine rgion agricole : Superficie des terres en hectares 2-4 4-8 8-14 14-20 20-40 40-100 Nombre de propritaires 24 36 22 18 14 6

Page 54

STATISTIQUE DESCRIPTIVE Partie I : prciser le caractre tudi et prciser sa nature. donner la signification de du centre de la 2me classe. dterminer rapidement la mdiane et donner sa signification dterminer algbriquement le mode et donner sa signification calculer la superficie moyenne et lcart type. Que peut on conclure ? dterminer le 1er et le 9me dcile et donner leurs significations Partie II : 1. dterminer graphiquement la concentration foncire dans cette rgion agricole, Calculer lindice de GINI 2. dterminer algbriquement la concentration 3. dterminer graphiquement le pourcentage des propritaires dont la superficie des terres est infrieure la mdiale.

1. 2. 3. 4. 5. 6.

Exercice 6 : Pendant 9 annes les bnfices dune entreprise ont augment :

de 4% par an pendant les 3 premires annes. de 7% par an pendant les 4 annes suivantes. De 10% par an pendant les 2 dernires annes de la priode considre. Quelle est laugmentation moyenne des bnfices de cette entreprise sur les 9 annes ?
Exercice 7 : Le tableau suivant donne la rpartition des salaires mensuels des cadres dune entreprise :

Salaires en 1000DH 6-8 8-10 10-16 16-22 22-30 30-34 34-38 total

Nombre des cadres 50 70 80 50 50 80 20 400

1. prciser le caractre tudi et sa nature 2. reprsenter graphiquement cette distribution, tracer le polygone des frquences 3. dterminer rapidement : le salaire mdian des cadres donner sa signification. Le 3me quartile (Q3). donner sa signification. 4. donner graphiquement le salaire modal des cadres. 5. calculer le salaire moyen des cadres. 6. Calculer le coefficient de variation et donner sa signification 7. Pour motiver davantage ses cadres, lentreprise dcide une augmentation gnrale des salaires de 20%. Calculer la nouvelle moyenne et le nouveau coefficient de variation.

Page 55

STATISTIQUE DESCRIPTIVE
II OBJECTIFS VISES : Calcul de la fonction linaire calcul et commentaire du coefficient de corrlation interprtation des distributions marginales interprtation des distributions conditionnelles

1. 2. 3. 4.

Exercice 8 : Une entreprise a prsent ses dpenses de publicit et ses chiffres pour les 6 dernires annes dans le tableau suivant (en 106 DH) Dpenses de publicit Chiffre daffaires 10 2 16 4 50 10 120 14 140 18 210 24

1. Lentreprise pense qu il ya un lien entre dpenses de publicit (X) et le chiffre daffaire(Y).pouvez vous le confirmer ? 2. tablir par la mthode des moindres carrs la relation liant le chiffre daffaires et les dpenses de publicit 3. combien lentreprise peut-elle esprer raliser comme chiffre daffaireS avec des dpenses de publicit de 30 ?

Exercice 9 :

On a observ une population en retenant 2 caractres : le nombre denfants(X) et la taille du logement (Y).les rsultats sont les suivants : 2 3 4 Total Nombre de pices Nombre denfants 1 2 3 Total

22 7 0 29

15 38 7 60

9 22 30 61

46 67 37 150

1. calculer le nombre moyen denfants et le nombre moyen de pices des logements. 2. calculer x 2 et donner sa signification 3. calculer y 3 et donner sa signification 4. on se propose de voir sil existe un lien entre le nombre denfants et la surface des logements. Confirmer

Page 56

STATISTIQUE DESCRIPTIVE
Exercice 10 :

Le tableau suivant donne la rpartition des salaris dune entreprise de btiment selon le nombre denfants charge X et les salaires mensuels perus y en milliers de DH Nombre de pices Y 1-3 3-5 5-9

Nombre denfants X 1 4 8 16 2 6 12 24 3 6 12 3 4 2 4 8 1. donner la distribution marginale de la variable X 2. donner la distribution conditionnelle de la variable Y lie la modalit 4 de X. 3. que signifient les valeurs 16 et 3 souligne dans le tableau 4. vrifier de deux manires diffrentes que les deux variables sont indpendantes. Dites dans ce cas est gal le coefficient de corrlation linaire : r (sans le calculer. 5. calculer la variance marginale de Y.

Exercice 11 : Une tude ralise dans un club sportif concernant le poids et la taille de 124 adhrents a fourni les informations suivantes : 50-60 60-65 65-75 75-80 poids en Kg Y

taille en mtres X 1,60-1,70 1,70-1,75 1,75-1,80 1,80-1,90 1,90-2,00

12 ? 9 ? 3

7 6 8 7 5

6 8 8 5 3

4 3 4 6 3

1. complter le tableau sachant quil y a 27 adhrents qui mesurent entre 1.70met 1.75m. 2. quels sont les caractres tudis ? Quelle est leur nature ? 3. que signifient les chiffres 7 et 8souligns dans le tableau 4. quelle est la moyenne du poids des adhrents ? Comment appelle-t-on cette moyenne ? 5. quelle est la taille moyenne des adhrents ? Comment appelle-t-on cette moyenne ? 6. en dsignant par X la taille et par Y le poids calculer et donner la signification de y 2 7. donner sans la calculer la signification de x 3
_ _

Page 57

STATISTIQUE DESCRIPTIVE

Exercice 12 :

Une entreprise commerciale a prsent ses ventes xi et ses frais de publicit yi au cours du premier semestre de lanne 2003 comme suit (en 1000 DH) Mois Janvier Fvrier Mars Avril Mai juin Ventes 40 30 42 46 44 38 Frais de publicit 1.1 0.8 1.2 1.4 1.3 1.1

1. dterminer une fonction linaire qui donne le montant des ventes lorsquon connat les frais de publicit. 2. quel serait le montant des ventes si les frais de publicit atteindront 3500DH. 3. dterminer sil y a ou non une liaison entre les ventes et les frais de publicit.

Page 58

Vous aimerez peut-être aussi