Statistiques Descriptives

Vous aimerez peut-être aussi

Vous êtes sur la page 1sur 35

Semestre

Module
Elment
Enseignant

:2
: Mthodes Quantitatives
: Statistiques
: Mr BENMOUSSA
Elments du cours










Dfinitions et lments du vocabulaire


Ralisation dun tableau statistique
Graphiques statistiques de base
Les caractristiques de tendance centrale et de position
Les moyennes
Les paramtres de dispersion
La concentration
Ltude de la corrlation

Numrisation & Conception

Mr Mohamed-Fadil ZIADI

Le Portail des Etudiant dEconomie

www.e-tahero.net
contact@e-tahero.net

Professeur BENMOUSSA

Statistiques I

Chapitre 1 : DEFINITIONS ET ELEMENTS DU VOCABULAIRE


I-

Dfinitions et objets :

La statistique est la science qui a pour objet de recueillir un ensemble de donnes


numriques relatives tel ou tel phnomne alatoire et dexploiter cette information pour
tablir toutes relations de causalit par lanalyse et linterprtation.
Un phnomne alatoire est un phnomne comportant des variables alatoires, cest
dire des variables lies au hasard et dont les valeurs ne peuvent en consquence tre
connues davance. (Exemple : le nombre de points marqu par un d)
On distingue :
La statistique descriptive ou statistique de constatation, qui concerne les tableaux,
les graphiques relatives des inventaires, des enregistrements, des
recensementsetc.
La mthode statistique qui concerne lensemble des procds et mthodes pour
lanalyse et linterprtation.
1- Domaines dapplication :
Le domaine dutilisation de la statistique est tellement tendu quil serait impossible de
citer toutes les applications, mais on va citer quelques exemples :
- La recherche biologique et mdicale ;
- La recherche spatiale ;
- Le contrle des fabrications dans lindustrie ;
- Le sondage dopinion ; les enqutes de march ;
- Les assurances ;
- Les recherches oprationnelles ;
- Ltude de la conjoncture ;
- La dtermination des indices conomiques.

www.e-tahero.net Z.M.F

Les sondages dopinion, en particulier, ont connu une extension considrable au cours de
ces dernires annes.
Les perfectionnements considrables intervenus dans le domaine des machines calculer
ont contribu tendre les possibilits de la statistique.
2- Ensemble, sous-ensembles, units :
 Un ensemble ou rfrentiel statistique compos dlments ou dunits statistiques est
dit population ou univers.
 Un sous-ensemble de lensemble est un chantillon.
 Une unit statistique doit tre dfinie sans ambigut. Elle peut comporter de nombreux
caractres, ceux-ci pourront eux mme comporter plusieurs modalits.

Portail des Etudiants dEconomie

-2-

Professeur BENMOUSSA

Statistiques I

Exemple :
* Ensemble de production : 135 ouvriers de lusine X ;
* Echantillon : 5 ouvriers ;
* Unit : 1 ouvrier de lusine X ;
* Caractres : a- le salaire (modalits)
b- anciennet (modalits)
3- Caractres qualitatifs et quantitatifs continus ou directs :
 Les caractres quantitatifs sont ceux auxquels on peut attribuer une valeur numrique.
(Exemple : une taille)
 Les caractres qualitatifs sont ceux auxquels on peut seulement associer une valeur
numrique arbitraire. (Exemple : une couleur)
Un ensemble coordonn des valeurs dun caractre quantitatif constitue une suite ou
srie statistique.
 Un caractre continu est un caractre qui peut prendre nimporte quelle valeur
numrique. (Exemple : une surface, un prix)
 Un caractre discret ou discontinu est un caractre qui ne peut prendre que des valeurs
isoles en gnral des nombres entiers. (Exemple : nombre de personnes dans une famille).
Dans le cas dun caractre discontinu, linterprtation est dnue de sens.
II-

Elaboration des statistiques :

www.e-tahero.net Z.M.F

- La collection des renseignements ;


- Le recensement et sondage ;
- Enqutes et questionnaires ;
- Dpouillement.

Portail des Etudiants dEconomie

-3-

Professeur BENMOUSSA

Statistiques I

Chapitre 2 : REALISATION DUN TABLEAU STATISTIQUE


Un tableau permet une prsentation synthtique des informations recueillies, il doit se
suffire lui mme, cest pourquoi il est ncessaire quil comporte les indications
suivantes :
* Le titre indiquant lobjet du travail statistique ;
* Lunit de mesure qui a t utilise ;
* La rfrence de la source de la documentation.
I-

Prsentation dun tableau :

Dune faon gnrale, un tableau se compose :


* Dune colonne indiquant les diffrentes modalits de la variable xi ;
* Dune ou plusieurs autres colonnes indiquant leffectif correspondant ces diverses
modalits.
Mais selon que la variable est discrte ou continue, les tableaux se prsentent de la faon
suivante.
1- Tableau concernant une variable directe :
 Exemple :
Distribution du personnel dune entreprise en fonction du nombre denfants.
Nombre d'enfants
xi
0
1
2
3
4
5
6 et +

Effectifs
ni
12
31
29
11
4
2
1
Total : 90

www.e-tahero.net Z.M.F

 Remarque : Lecture du tableau :


12 membres du personnel portent zro enfant.
31 membres du personnel portent un enfant.

Portail des Etudiants dEconomie

-4-

Professeur BENMOUSSA

Statistiques I

2- Tableau concernant une variable continue :


 Exemple :
Distribution des rceptions de marchandises en fonction du nombre de colis.
Nombre de colis
xi
15
6 10
11 15
16 20
21 30
31 et +

Effectifs
ni
20
30
60
50
30
10
Total: 200

 Remarque : lecture du tableau :


* Nous avons reu 20 fois des livraisons contenant des colis entre 1 et 5.
* Les amplitudes peuvent tre ingales.
* La colonne des xi peut tre prsente de la faon suivante :
15
5 10
10 15
etc.
Mais il faut indiquer clairement la convention de bornage choisi.
II-

Notions de frquence :

La deuxime colonne dun tableau de statistique enregistre le nombre de fois que la valeur
de la variable mentionne dans la premire colonne a t rencontre.
Il sagit dune frquence, note fi, et celle-ci peut apparatre sous divers aspects selon les
critres retenus.

www.e-tahero.net Z.M.F

1- Frquence absolue, frquence relative :


* La frquence absolue, comme son nom lindique, donne le nombre dunits en valeurs
absolues.
* La frquence relative est calcule en divisant chaque frquence absolue par leffectif
total de la population.
En dautres termes, la frquence est exprime en valeurs relatives multiplie par 100
donne un pourcentage.

Portail des Etudiants dEconomie

-5-

Professeur BENMOUSSA

Valeur de colis
xi
15
6 10
11 15
16 20
21 30
31 et +

Statistiques I

absolues
20
30
60
50
30
10
total: 200

frquences f
relatives
0,1
0,15
0,3
0,25
0,15
0,05
total: 1

10 %
15 %
30 %
25 %
15 %
5%
total: 100 %

 Remarques :
* Pour les frquences relatives, le tableau se lis comme suit :
10 % des livraisons reues contenaient entre 1 et 5 colis.
* La somme des frquences relatives est toujours gale 1.
2- Frquences simples, frquences cumules :
* Les frquences simples, quelles soient absolues ou relatives, indiquent comment se
distribue la variable par rapport aux diffrentes modalits.
* Les frquences cumules, quelles soient absolues ou relatives, indiquent comment se
rpartis la variable par rapport aux diffrentes modalits. Il existe deux catgories de
frquences cumules :
- Les frquences cumules croissantes qui indiquent combien dunits de la
population sont caractrises par une valeur infrieure ;
- Les frquences cumules dcroissantes qui indiquent combien dunits de la
population sont caractrises par une valeur suprieure.

www.e-tahero.net Z.M.F

Valeur de
colis.
xi
15
6 10
11 15
16 20
21 30
31 et +

Frquences absolues
Simples
Cumules
Croissantes Dcroissantes
20
20
200
30
50
180
60
110
150
50
160
90
30
190
40
10
200
10
200

* 80 % des livraisons comportent moins 20 colis.


* 45 % des livraisons comportent plus de 16 colis.

Portail des Etudiants dEconomie

-6-

Frquences relatives
Simples
Cumules
Croissantes Dcroissantes
0,1
0,1
1
0,15
0,25
0,9
0,3
0,55
0,75
0,25
0,8
0,45
0,15
0,95
0,2
0,05
1
0,05
1

Professeur BENMOUSSA

III-

Statistiques I

Typologie des tableaux :

Selon le nombre de variables observes sur une mme unit, plusieurs tableaux sont
possibles :
* Tableau simple entre cest dire qui tudie une seule variable ;
* Tableau double entre cest dire qui tudie deux variables.
 Exemple :

www.e-tahero.net Z.M.F

Statistique du personnel dune entreprise en fonction des salaires (xi) et de lge (yi).

Portail des Etudiants dEconomie

-7-

Professeur BENMOUSSA

Statistiques I

Chapitre 3 : GRAPHIQUES STATISTIQUES DE BASE

La reprsentation graphique des frquences simples ou cumules relatives une variable


statistique donne lieu aux distinctions entre graphiques de distribution et graphiques de
rpartition.
I-

Graphiques de frquences simples, fonction de distribution :


1- Cas dune variable discrte ou discontinue :

La reprsentation graphique des frquences simples dune variable discrte peut


seffectuer sous la forme de graphique en bton.
La valeur observe de la variable est porte sur laxe des abscisses de la variable, et la
frquence simple correspondante est porte sur laxe des ordonns, cette dernire peut tre
exprimer en valeur relative ou en valeur absolue, le bton est un segment de droite
perpendiculaire laxe des abscisses (ox), de langueur ou de hauteur proportionnelle
leffectif correspondant.
 Exemple :

www.e-tahero.net Z.M.F

Distinction du personnel dune entreprise en fonction du nombre denfants.


Nombre d'enfants par personne (xi) Le nombre de personnes concernes (ni)
0
12
1
31
2
29
3
11
4
6
5
3
Total : 92
ni
Distribution du personnel dune entreprise en fonction
du nombre denfants.
40

35
31
29

30

25

20

15
12
10
11

6
5
3


xi
0

Portail des Etudiants dEconomie

-8-

Professeur BENMOUSSA

Statistiques I

 Remarque :
Dans le cas dune variable discrte, il ne faut pas joindre les sommets des btons car par
dfinition, il nexiste pas de valeurs intermdiaires entre deux positions de la variable.
2- Cas dune variable statistique continue :
La reprsentation graphique des frquences simples dune variable continue peut
seffectuer sous la forme dun histogramme.
En portant dans laxe des abscisses les valeurs des classes du caractre, et en leur donnant
les frquences correspondantes, ou reprsente la structure de la population tudie.
a- Principes de construction de lhistogramme :
Pour chaque classe, on lve un rectangle ayant une base proportionnelle lintervalle de
classes, et hauteur proportionnelle la frquence simple. Dans ce cas, ce sont les surfaces
et non les hauteurs qui sont proportionnelles leffectif.
Dans la pratique deux cas peuvent se prsenter :
 Cas damplitude gale :
Exemple :
Distribution du courrier du mois de fvrier dune entreprise en fonction du nombre des
lettres reues.
Frquences absolues (ni)
5
7
6
4
2
1
Total : 25

www.e-tahero.net Z.M.F

Nombre des lettres reues (xi)


10 15
15 20
20 25
25 30
30 35
35 40

Portail des Etudiants dEconomie

-9-

Amplitudes
5
5
5
5
5
5

Professeur BENMOUSSA

Statistiques I

Histogramme du courrier du mois de fvrier de


l'entreprise X
8
7
6
5
4
3
2
1
0

7
6
5
4
2
1

10 15
15 20
20 25
25 30
30 35
35 40

Frquences absolues (n)


x

Lhistogramme est constitu par lensemble des rectangles adjacent. Nous vrifions par
exemple le rectangle reprsentatif de la classe 30 35 (effectif 2) a une surface double de
celle du rectangle reprsentatif de la classe 35 40 (effectif 1).
 Cas damplitude ingale :
Dans ce cas, on respecte la proportionnalit des surfaces, il faut rectifier en consquence
les hauteurs.
Supposant que la distribution prcdente, sur une priode de deux mois, se prsente de la
faon suivante :

www.e-tahero.net Z.M.F

Nombre des lettres reues (xi)


10 15
15 20
20 25
25 35
35 40
40 45

Frquences absolues (ni)


3
9
12
18
6
3
Total : 51

Amplitude
5
5
5
10
5
5

En effet, lintervalle de la classe 25 35 est double des autres, ce qui se traduit si on ne


modifie pas les frquences par une marque de proportionnalit entre les surfaces.
Il convient donc de rendre les classes gales. Lamplitude de la classe 25 35 tant le
double des amplitudes des autres classes, il faut avant toute reprsentation graphique de
diviser par 2 la frquence correspondante de la classe.

Portail des Etudiants dEconomie

- 10 -

Professeur BENMOUSSA

Statistiques I

ni
Histogramme du courrier de deux mois de lentreprise X
16
14
12
10
8
6
4
2

12
9

9
6

10

15

20

25

30

35

40

45

xi

50

Le segment pointill indique la transformation effectue et met en garde le lecteur sur le


caractre relatif des effectifs rpartis entre les classes 25 30 et 30 35.
b- Le polygone des frquences :
Le polygone des frquences obtenues en joignant par des segments de droites au milieu
des bases suprieurs des rectangles permet de rendre compte de la continuit de la
variable.
En titre dexemple, on peut prendre la figure prcdente :

ni
Histogramme du courrier de deux mois de lentreprise X
16
14
12
10
8
6
4

www.e-tahero.net Z.M.F

12
9

6
3

II-

10

15

20

25

30

35

40

45

xi

50

Graphique de frquences cumules, fonction de rpartition :


1- Cas dune variable statistique directe :

Portail des Etudiants dEconomie

- 11 -

Professeur BENMOUSSA

Statistiques I

La reprsentation graphique des frquences cumules dune variable directe seffectue


sous la forme de graphique en escalier.
Les sauts correspondent aux valeurs possibles de la variable et ils sont gaux aux
frquences cumules croissantes ou dcroissantes.
 Exemple :
Rpartition du personnel dune entreprise en fonction du nombre denfants.

Frquences
absolues
Simples Cumules
Croissantes Dcroissantes
12
12
89
31
43
77
29
72
46
11
83
17
4
87
6
2
89
2
89

xi

0
1
2
3
4
5

Simples
0,135
0,348
0,326
0,124
0,045
0,022
1

Frquences
relatives
Cumules
Croissantes Dcroissantes
0,135
1
0,483
0,865
0,804
0,517
0,936
0,191
0,977
0,067
1
0,022

Rpartition croissante :
ni
90
80
70
60
50
40
30
20
10

fi

83
72

43

12

www.e-tahero.net Z.M.F

90

87

xi

La lecture de ce graphique permet didentifier la rpartition (absolue ou relative) du


personnel ayant x enfants ou moins.
- Exemple :
43 salaris 48% des salaris ont un enfant ou moins.

Portail des Etudiants dEconomie

- 12 -

Professeur BENMOUSSA

Statistiques I

Rpartition dcroissante :
ni
90
80
70
60
50
40
30
20
10

fi
89

77

46

17
6

xi

Ici les rsultats donns sont inverss, savoir x enfants ou plus.


- Exemple :
77 salaris ou 86% des salaris ont un enfant ou plus.
2- Cas dune variable statistique continue :
La courbe des frquences cumules croissantes se construit en portant les points
correspondants chaque classe la limite suprieure de lintervalle de classes.
La prsence de classes damplitude ingale nentrane aucune modification en ce qui
concerne la construction de cette courbe.
La courbe des frquences cumules dcroissantes se construit en portant les points
correspondants chaque classe la limite infrieure de lintervalle de classes.
 Exemple :
Soit le tableau suivant :

www.e-tahero.net Z.M.F

xi

10 15
15 20
20 25
25 35
35 40
40 45
45 50

Frquences
absolues
Simples
Cumules
Croissantes
3
3
9
12
12
24
18
42
6
48
3
51
1
52
52

Portail des Etudiants dEconomie

Simples
Dcroissantes
52
49
40
28
10
4
1

- 13 -

0,057
0,173
0,230
0,346
0,115
0,057
0,019
1

Frquences
relatives
Cumules
Croissantes Dcroissantes
0,057
1
0,230
0,943
0,460
0,770
0,806
0,540
0,921
0,194
0,978
0,074
1
0,022

Professeur BENMOUSSA

Statistiques I

ni
90
80
70
60
50
40
30
20
10

52
52

48

49

51

42

40
28
12

24

10

10

15

20

25

30

35

40

45

xi

50

www.e-tahero.net Z.M.F

On contrle lexactitude du graphique en vrifiant que lintersection des deux courbes a


pour abscisse la moiti de leffectif.

Portail des Etudiants dEconomie

- 14 -

Professeur BENMOUSSA

Statistiques I

Chapitre 4 : LES CARACTERUSTIQUES DE TENDANCE CENTRALE ET DE


POSITION.

I-

Le mode :
1- Dfinition :

Le mode est la valeur de la variable qui correspond la frquence maximale.


Dans le cas dune variable discontinue, le mode se dtermine de la faon suivante :
 Exemple :
xi

ni
12
31
29
11
6
3
Total : 92

0
1
2
3
4
5

ni
40

30

25

20

15

10

35

31

12
11
6

www.e-tahero.net Z.M.F

29

xi

Donc le mode est 25, qui correspond au battons le plus lev du graphique.
Dans le cas dune variable continue, le mode sapplique la classe qui correspond la
frquence maximale. Celle ci sappelle classe modale .

 Remarque :

Portail des Etudiants dEconomie

- 15 -

Professeur BENMOUSSA

Statistiques I

La valeur du mode dans ces conditions dpend de lamplitude des classes et quil faut
vrifier lgalit des intervalles de classes.
 Exemple :
xi
100 110
110 120
120 125
125 130
130 140
140 160

ni
8
22
18
20
12
6

Amplitude
10
10
5
5
10
20

Effectifs corrigs
8
22
36
40
12
3

Dans ce cas, la classe modale est 125 130 .


Le mode = 125 + (4/ 4+28). 5 = 125,625
En gnral, la formule du mode est la suivante :
d1
Mode (Mo) = l1 +
.a
d1 + d2
II-

La mdiane :
1- Dfinition :

La mdiane (M) est la valeur de la variable qui partage leffectif en deux parties gales, les
lments de la population tant rongs par ordre croissant ou dcroissant. En dautre
terme, la mdiane est la valeur statistique qui correspond sur la courbe cumulative une
ordonne reprsentant une frquence relative 0,5 ou 50%, ce qui entrane que 50% des
observations seront infrieures la mdiane et 50% seront suprieures la mdiane.
a- Cas dune variable discrte ou discontinue :

www.e-tahero.net Z.M.F

Il nexiste pas, en gnral, de valeur mdiane, sauf dans lhypothse o la srie possde un
nombre de terme impair est connu individuellement.
 Exemple :
30 4 8 10 6 12 13 15 16
4 6 8 10 12 13 15 16 30
4 termes
4 termes

Mdiane

Portail des Etudiants dEconomie

- 16 -

Professeur BENMOUSSA

Statistiques I

b- Cas dune variable continue :


La valeur de la mdiane peut de dterminer soit par calcul numrique, soit graphiquement.
 Par le calcul numrique :
Lquation F (M) = 0,5 admet une solution dpendante de leffectif tudi :
* Partager le total des effectifs en deux.
- Si le total des frquences simples o effectif est impaire, cest dire (2n+1), le rang
de la mdiane va tre gale [(2n+1) +1] / 2.
- Si le total des frquences simples o effectif est paire, cest dire 2n/2 et (2n+1) / 2.
* Rechercher la classe correspondante aux rangs dtermins ;
* Dterminer au postulant une rpartition homogne des valeurs dans la classe la valeur de
la mdiane par interpolation linaire.
 Exemple :

Xi

Frquences
Simples

1000 1500
1500 2000
2000 2500
2500 3000
3000 3500

6
12
25
17
5
65

Cumuls
Croissantes
6
18
43
60
65

Dcroissantes
65
59
47
22
5

www.e-tahero.net Z.M.F

* Le rang est le suivant :


[(2n+1) + 1] / 2 = 33me rang.
* Recherche de la classe correspondante au 33me rang :
Nous savons daprs le tableau que la valeur de 2000 correspond au 18me rang, et que la
valeur de 2500 correspond au 43me rang. La valeur du 33me rang se trouve comprise entre
2000 et 2500, la classe mdiane est donc 2000 2500.
La valeur exacte de la mdiane est alors dtermine par lapplication dune rgle de trois :
Mdiane = 2000 + x.
Calculant cette valeur de x :
Sur lintervalle de cet effectif occupe donc un sous intervalle de 500/25 = 20.
Pour arriver au 33me rang, il faut donc ajouter 33-18 = 15 sous intervalles.
Donc x= 2015 = 300.
Et puis la mdiane = 2000+300 = 2300.

Portail des Etudiants dEconomie

- 17 -

Professeur BENMOUSSA

Statistiques I

Autre solution plus simple :


M = 2000 + 500 [ (33-18) / (43-18)].
M = 2300.
2- Dtermination graphique :
ni
90
80
70
60
50
40
30
20
10

52
52

48

49

51

42

40
28
12

24

10

10

15

20

25

30

35

40

45

xi

50

Si on prend en titre dexemple ce graphique, la mdiane dans ce cas est denviron 27.
 Exercice :
On donne la rpartition de 100 ouvriers dune entreprise selon leur salaire journalier.

www.e-tahero.net Z.M.F

Salaires
journaliers
80 - 120
120 - 160
160 - 200
200 - 240

ni
10
30
40
20
100

Frquences cumules
croissantes
10
40
80
100

Frquences cumules
dcroissantes
100
90
60
20

Mdiane = 160 + 40 [ (50-40) (80-40)] = 170.


Donc50% des ouvriers touches un salaire journalier plus que 170 DHS. Et 50% des
salaris touchent moins de 170 DHS.

Portail des Etudiants dEconomie

- 18 -

Professeur BENMOUSSA

Statistiques I

Chapitre 5 : LES MOYENNES


Une moyenne paramtre de tendance centrale, est un nombre dont la dtermination utilise
lensemble des valeurs de la variable.
En rgle gnrale, une moyenne est dfinie de la faon suivante :
X = 1/n [f(x1) + f(x2) + f(x3) + + f (xn)]
La fonction f(x) tant une fonction continue monotone, croissante ou dcroissante.
Selon lexpression de f(x), on peut distinguer la moyenne arithmtique, la moyenne
gomtrique, harmonique et quadratique.
I-

La moyenne arithmtique :

Cette moyenne scrit en abrg :

1- Dfinition :
a- Moyenne arithmtique simple :
Si la variable statistique est donne sous forme de srie (x1, x2, x3 xn), la moyenne
arithmtique est le rapport :
x1 + x2 + x3 + + xn
X=

= (1/n). xi

n
 Exemple :
Les notes obtenues par un candidat un examen sont les suivants : 8 9 12 14 17.
8 + 9 + 12 + 14 + 17
X=

= 12.
5

www.e-tahero.net Z.M.F

b- Moyenne arithmtique pondre :


Lorsque la variable statistique est donne sous forme de tableau de distribution, c'est-dire quand les valeurs de la variables sont affectes de frquence, la moyenne arithmtique
scrit de la faon suivante :
ni xi
X=

= 550/50 = 11.
ni

Portail des Etudiants dEconomie

- 19 -

Professeur BENMOUSSA

Statistiques I

 Exemple :
Notes (xi)
4
6
8
9
10
12
13
14
17

Effectifs (ni)
1
2
4
7
10
13
5
6
2
50

ni xi
4
12
32
63
100
156
65
84
34
550

fi
0,02
0,04
0,08
0,14
0,2
0,26
0,1
0,12
0,04
1

fi x i
0,08
0,24
0,64
1,26
2
3,12
1,3
1,68
0,68
11

fi x i
X=

= 11/1 = 11.
fi

Dans le cas de variables groupes en classes, le calcule est le mme en prenant pour valeur
de la variable le centre des classes.
2- Calcule en cas dune variable groupe en classes :
a- Calcule par changement dorigine :
La formule de la moyenne est la suivante :
ni (xi x0)

www.e-tahero.net Z.M.F

X = x0 +

ni

 Exemple :
classes
40 - 45
45 - 50
50 - 55
55 - 60
60 - 65
65 - 70
70 - 75

ni
xi
xi x0
ni (xi x0)
8
42,5
-15
-120
12
47,5
-10
-120
28
52,5
-5
-140
30
57,5
0
0
58
62,5
5
290
29
67,5
10
290
7
72,5
15
105
172
305
xi, cest le centre des calasses qui est calculer comme suit : (40 + 45) / 2

Portail des Etudiants dEconomie

- 20 -

Professeur BENMOUSSA

Statistiques I

Donc :
ni (xi x0)
X = x0 +
ni

= 59,27.

Avec : x0 = 57,5.
b- Calcule par changement dchelle :
Si les valeurs de la srie sont des multiples entiers dune valeur k (qui peut tre
galement lintervalle de classes). Il est recommand de prendre k comme unit.
ni [(xi x0) / k]
X = x0 + k

ni

 Exemple :
classes
40 - 45
45 - 50
50 - 55
55 - 60
60 - 65
65 - 70
70 - 75

ni
8
12
28
30
58
29
7
172

xi
42,5
47,5
52,5
57,5
62,5
67,5
72,5

(xi - x0)/k
-3
-2
-1
0
1
2
3

ni [(xi x0) /k]


- 24
- 24
- 28
0
58
58
21
61

ni [(xi x0) / k]
X = x0 + k

= 59,27.
ni

Avec : k = lamplitude.

www.e-tahero.net Z.M.F

II-

Moyenne gomtrique :

Lorsque les valeurs dune srie statistique varient en gros selon une progression
gomtrique, il est prfrable de substituer la moyenne arithmtique la moyenne
gomtrique (xG).

1- Dfinition :

Portail des Etudiants dEconomie

- 21 -

Professeur BENMOUSSA

Statistiques I

La moyenne gomtrique de n valeur positive dun caractre est la racine nime du


produit de ces valeurs.
xG =

x1.x 2.x3....xn

 Exemple:
Le chiffre daffaire mensuel dun nouveau produit a t au cours des six derniers mois :
256 332 432 562 731 950 .
xG = 6 256 * 332 * 432 * 562 * 731 * 950 = 492.
 Gnralisation:
Lorsque les valeurs de la variable sont affectes dune frquence, la moyenne gomtrique
est donne par la formule suivante :
Log xG = 1/n ( ni . log xi).
 Exemple :
xi
2
4
8
16
12

ni
4
5
8
2
1
20

log xi
0,301
0,602
0,403
1,204
1,505

ni . log xi
1,204
3,01
7,224
2,408
1,505
15,351

En appliquant la dernire formule :


Log xG = 0,76755
xG = 5,8.
III-

Moyenne harmonique :

www.e-tahero.net Z.M.F

1- Dfinition :
La moyenne harmonique est linverse des moyennes arithmtiques des inverses.
ni
xH =
IV-

ni 1/n

Moyenne quadratique :

Portail des Etudiants dEconomie

- 22 -

Professeur BENMOUSSA

Statistiques I

1- Dfinition :
La moyenne quadratique est dfinie par la formule suivante :
n i x i2
xQ =

ni

2- Observation :
Il faut savoir que :

xG

xH.

www.e-tahero.net Z.M.F

xQ x

Portail des Etudiants dEconomie

- 23 -

Professeur BENMOUSSA

Statistiques I

Chapitre 6 : LES PARAMETRES DE DISPERSION.

I-

Ltendu :

Ce paramtre galement appel intervalle de variation .


1- Dfinition :
Ltendu dune srie statistique est la diffrence entre la plus grande valeur et la plus petite
valeur du caractre.
e = xM xm.
2- Application :
Soit la srie statistique suivante :
xi
100
105
110
115
120

ni
2
15
28
16
3

e = 120 100 = 20.


3- Commentaire :
La simplicit de ce calcule ne doit pas le faire oublier que ltude est trs sensible aux
fluctuations des valeurs (valeurs extrmes) qui sont souvent peu reprsentatives. Cette
valeur caractristique qui correspond un concept, forme utilise dans la pratique. (Lcart
entre le premier et le dernier coureur, lcart entre la meilleure et plus faible note).

www.e-tahero.net Z.M.F

II-

Les intervalles :

Ces caractristiques permettent une mesure de dispersion qui limine linfluence des
valeurs extrmes.
1- Les intervalles interquartiles :
a- Dfinition :
Lintervalle interquartile dune srie statistique est gal la diffrence :
Q3 Q1.
Portail des Etudiants dEconomie

- 24 -

Professeur BENMOUSSA

Statistiques I

xi
1000 - 1500
1500 - 2000
2000 - 2500
2500 - 3000

ni
6
14
17
18

ni
6
8
3
1
18

* Calculer Q1 :
Rang = 18/4 = 4,5.
Q1 = 1000 + 500 [(4,5 0) / (6 0)].
Q1 = 1375.
* Calculer Q3 :
Rang = (18/4).3 = 13,5.
Q3 = 1500 + 500 [(13,5 6) / (14 6)].
Q3 = 1968,75.
Q3 Q1 = 1968,756 1375 = 593,75.
On trouve dans cet intervalle 50% des observations concentres autour de la mdiane. Plus
lintervalle est rduit, plus la concentration autour des valeurs centrales est forte.
III-

La variance, lcart type :

1- Dfinitions :
* La variance dune srie statistique est la moyenne arithmtique des carrs des carts
[ni (xi x)2]
V =
ni
* Lcart type est la racine carre de la variance :
= V

www.e-tahero.net Z.M.F

2- Application:
a- dtermination directe de la variance :

Portail des Etudiants dEconomie

- 25 -

Professeur BENMOUSSA

Statistiques I

xi

ni

ni xi

xi - x

(xi x)2

ni (xi x)

ni xi2

17
19
21
23
25
27
29
31

1
1
2
6
5
3
2
0
20

17
19
42
138
125
81
58
0
480

-7
-5
-3
-1
1
3
5
7

49
25
9
1
1
9
25
49

49
25
18
6
5
27
50
0
180

289
361
882
3174
3125
2187
1682
0
11700

fi x i
X=

= 24.
fi
= V = 3.

Lorsquune moyenne arithmtique est une valeur entire, les calcules sont assez simples,
mais la plupart du temps la moyenne est un nombre dcimal, ce qui rend llvation au
carre des cart plus difficile. Lhypothse de non utilisation de machines, nous proposons
les amliorations du calcul suivantes :
b- Autres modes de dtermination :
Expression dveloppe de la variance :
(ni xi )2 x2
V =
ni
Calcul de la variance, formule simplifie :

www.e-tahero.net Z.M.F

Comme pour la moyenne, le recours aux procds de simplification peut tre utile.
* Calcul de variance par changement dorigine :
En posant une valeur arbitraire x0 (la plupart du temps cette valeur sera centrale)
lexpression de la variance devient :

Portail des Etudiants dEconomie

- 26 -

Professeur BENMOUSSA

Statistiques I

ni (xi x0) ( x x0)


2

V =
ni
* Calcul de la variance en faisant un changement dchelle :
Dans les sries intervalles de classes gaux, il est conseill de trouver un nombre k
qui signifie en maximum lcart (xi x0). On peut alors crire :
k2. ni [(xi x ) / k]2
V =
ni
La combinaison des deux procds de simplification permet dcrire la formule gnrale :
k2. ni [(xi x0 ) / k]2 - (x x0)2
V =

www.e-tahero.net Z.M.F

ni

Portail des Etudiants dEconomie

- 27 -

Professeur BENMOUSSA

Statistiques I

Chapitre 7 : LA CONCENTRATION.

www.e-tahero.net Z.M.F

La notion de concentration est apparente celle de dispersion. On sait limportance tenue


par lide de concentration dans les phnomnes conomiques.
Soit un ensemble statistique dont chaque lment est affect dun caractre susceptible
daddition. Ainsi un ensemble dindividus ou dunit de production classs selon la
fortune, le revenu, les salaires verss ou les salaris occups, le chiffre daffaire, et enfin la
surface exploite.
Il est possible de classer ces units :
* Selon leur nombre ;
* Selon limportance du caractre procd.
Cette distinction conduis une double figuration, c'est--dire conduire :
* Un histogramme donnant le nombre des effectifs par classes ;
* Un histogramme donnant limportance du caractre procd par classes.
On peut partir de ces histogrammes dterminer mes mdianes.
Dans lhistogramme donnant limportance du caractre procd par classes, la mdiane
porte un nom spcial mdiale .
La mdiale est une valeur particulire du caractre. Cette valeur du caractre est tel que
tous les caractres suprieurs, constitue une moiti de la masse globale des caractres,
lautre moiti tant constitue par tous les caractres infrieurs.
Lanalyse de la concentration pourrait rsulter de la comparaison des deux histogrammes,
plus prcisment de la mesure de lcart entre la mdiale et la mdiane.
On procde cependant autrement, en exprimant les deux distributions sur un mme
graphique. Ce graphique porte le nom de courbe de concentration ou courbe de GINI ou
courbe de Lorenz.
Cette courbe se construit partir des frquences cumules relatives en pourcentage.
Dans un graphique cartsien on porte :
* En abscisse, les frquences relatives cumules du nombre des effectifs (fi) ;
* En ordonn, les frquences relatives cumules du caractre procd par classes.
Le rsultat de la concentration est une courbe obtenue point par point.
fi x i %
100%
B

A
100%
fi %
La concavit de la concentration est toujours dirige vers le bas. La surface S sappelle
laire de la concentration. Quand laire est nulle, il y a absence de concentration, quand
elle est gale la surface du demis carre, il y a concentration totale.
On dfinis ainsi un indice de concentration par le rapport suivant :
Portail des Etudiants dEconomie

- 28 -

Professeur BENMOUSSA

Statistiques I

C = (5000 S) / 5000. (Coefficient de concentration).


Cet indice varie entre 0 et 1.
 Exemple :
Soit la distribution statistique donnant le nombre de salaris par classes de salaire.
Classes Nombre
de
de
salaire salaris
(n)
0 - 10
4
oct-20
3
20 - 30
2
30 - 40
1
10

ni

xi

ni xi

nixi

fi

fi
en %

fi x i

Fixi
en %

4
7
9
10

5
15
25
35

20
45
50
35
150

20
65
115
150

0,4
0,3
0,2
0,1

40
70
90
100

0,13
0,3
0,33
0,23

13
43
76
100

* Construire lhistogramme donnant le nombre des effectifs par classes.


ni
6
5
4
3
2
1

10

20

30

40

Classes

50

* Dterminer la mdiane :
Rang : 10/2 = 5.
Mdiane = 10 + 10[(5-4)/(7-4)] = 13,33.
* Construire lhistogramme donnant limportance du caractre procd par classes.

www.e-tahero.net Z.M.F

ni xi
60
50
40
30
20
10

10

20

30

40

Classes

50

Portail des Etudiants dEconomie

- 29 -

Professeur BENMOUSSA

Statistiques I

* Dterminer la mdiale :
Rang : 150/2 = 75.
Mdiale = 20 + 10 [(75 65) / (115 65)] = 22.
* Que peut on dire de la diffrence : Ml Me = M.
22 13,33 = 8,66.
Si M est grand par rapport au domaine de variation du caractre, la concentration est
grande ;
Si M est petit par rapport au domaine de variation du caractre, la concentration est
petite.
* Construire la courbe de concentration :
fi x i %
90

43
S

13
A

S1

S2

40

S3

1 S4
90 100%

70

S1 = (40 . 13) / 2 = 260.


S2 = [(13 + 43).30] / 2 = 845.
S3 = [(43 + 76).20] / 2 = 1190.
S4 = [(76 + 100).10] / 2 = 880.
S1 + S2 + S3 + S4 = 3170.

www.e-tahero.net Z.M.F

Donc : C = (5000 3170) / 5000 = 0,36.

Portail des Etudiants dEconomie

- 30 -

fi %

Professeur BENMOUSSA

Statistiques I

Chapitre 8 : LETUDE DE LA CORRELATION.


Afin de faciliter les prises de dcisions, les responsables dentreprises essayent de
dterminer des indices annonciateurs du futur. Cette recherche de liaison entre les
phnomnes peut tre plus ou moins confi.
Par exemple, dans une entreprise, lexprience montre que le chiffre daffaire du
printemps dune anne indique avec une certaine fiabilit celui de lautomne, et ceux
malgr une absence apparente de cause entre les deux phnomnes.
Cependant, cette vision simpliste de relations nindique pas ou mal la dure et lintensit
de ces liaisons. Il est donc ncessaire de les confier. La statistique permet de rpondre ce
besoin en mesurant de la relation existante entre deux phnomnes, cest la corrlation.
Enfin, lexistence de corrlation entre deux phnomnes nimplique pas obligatoirement
une relation causale entre ces deux phnomnes.
Le chiffre daffaire du printemps de lanne n ne prsente pas la cause du chiffre
daffaire de lautomne suivant, il nen est seulement quun indicateur.
Le lieu de corrlation entre deux phnomnes est un lien intermdiaire :
* La liaison fonctionnelle quon la note y = f(x). Par exemple la circonfrence dun cercle
y est fonctionnelle de la grandeur de son rayon x .
* Lindpendance totale. Par exemple lvolution du prix de lessence et celle des
cotisations de la scurit sociale.
Cest ce qui explique que la mthode de la corrlation se ramne au calcul de liaison
fonctionnelle une approximation pr.
Ca sera la dmarche de notre dveloppement :
* Les droites de rgression ;
* Le coefficient de corrlation.
I-

Les nuages de points :

Il sagit des reprsentations graphiques des diffrentes courbes de deux caractres. Il


permet de visualiser globalement les liens de dpendance statistique. Ce dernier, quand il
existe peut tre linaire ou pas. Pour la simplicit de notre expos, nous ne traitons que la
corrlation linaire.
y

www.e-tahero.net Z.M.F

*
*

*
*

*
*

*
* *

x
Dpendance linaire parfaite.
Portail des Etudiants dEconomie

x
Dpendance linaire forte.
- 31 -

Professeur BENMOUSSA

II-

Statistiques I

Les droites de rgression :

1- Remarque :
Lexistence dune relation linaire ne suffit pas comme lien de cause effet.
La mesure de la corrlation est purement mathmatique et peut tre effectu entre des
phnomnes indpendants, il faudra donc toujours expliquer le pourquoi dune forte
corrlation.
Dans le cas dune srie de deux variables x et y , il est possible de considrer
successivement chaque variable comme variable explique, puis comme variable
explicable. Dans ces conditions, nous pouvons calculer deux droites de rgression.
a- La droite de rgression de y en x dquation y = ax + b :
Permettant de dterminer y connaissant x .
b- La droite de rgression de x en y dquation x = ay + b :
Permettant de dterminer x connaissant y .
 Application :

www.e-tahero.net Z.M.F

Une entreprise souhaite expliquer et prvoir ses ventes y par rapport des dpenses de
publicit engages x , ou au contraire dterminer les dpenses de publicit y en
fonction de ces ventes x .
Pour concrtiser ces notions, nous allons utiliser lexemple suivant :
Dpenses
de
Vente "Y" Xi = xi -x
publicit
"X"
800
1500
-110
870
1900
-40
900
2000
-10
920
2300
10
970
2500
60
1000
3000
90
5460
13200

Yi =yi -y

xi yi

(xi x)2

(yi y)2

-700
-300
-200
100
300
800

77000
12000
2000
1000
18000
72000
182000

12100
1600
100
100
3600
8100
25600

490000
90000
40000
90000
90000
640000
1360000

1- Droite de rgression de y en x :
* Choix des variables :
Nous somme dans le situation suivante : lentrepreneur dsir prvoir ses ventes (Y :
variable explique) par rapport des dpenses de publicit engages (X : variable
explicative).

Portail des Etudiants dEconomie

- 32 -

Professeur BENMOUSSA

Statistiques I

* Caractristique de la droite y = ax + b :
Lquation de cette droite se dtermine en appliquant la mthode des moindres carre.
Cette droite passe par le point moyen (x , y) du nuage des points et que la valeur de sa
pente (a) se dtermine par la formule suivante :
(Xi Yi)
a =
Xi2
x = 5460/6 = 910.

y = 13200 / 6 = 2200.

Xi = xi x
Yi = yi y.
Donc : b = 2200- (7,10 * 910) = - 4270.
a = 7,1.
Enfin : y = 7,1 x 4270.
2- Droite de rgression de x en y :
* Choix des variables :
Nous sommes dans la situation suivante : lentrepreneur veut dterminer ses dpenses de
publicit (qui devient variable explique y ) en fonction de ses ventes qui devient
variable explicative X .
* Caractristique de la droite :
Lquation de cette droite se dtermine de la faon suivante : elle passe par le point
moyen(x , y) et a pour pente la formule suivante :
(Xi Yi)
a =

= 182000/1360000 = 0,13.

Yi2

b = x - ay = 617,40.
Donc: x = 0,13 + 617,40.

www.e-tahero.net Z.M.F

 Commentaire:
Il existe donc une liaison certaine entre les deux phnomnes. Certes les dpenses de
publicit expliquent correctement les ventes, mais cette dernire influence certainement les
dpenses de publicits futures qui leur tour conditionnent les ventes.
En gnralisant :
* Droite de rgression de y en x : D (yx) ;
* Droite de rgression de x en y : D (xy) ;
* Graphique ;
* Consquences.

Portail des Etudiants dEconomie

- 33 -

Professeur BENMOUSSA

Statistiques I

a- Le dnominateur de a est la carr de lcart type de la srie de xi (soit sa variance).


De mme pour a le dnominateur reprsente la variance de la srie y .
b- Les deux droites de rgression ont des coefficients directeurs a et a de mme
signe. En effet, les dnominateurs de celui-ci sont toujours positifs et leurs numrateurs
sont identiques.
c- Les deux droites de rgression D et D ne sont confondues que dans le cas
suivent : a = 1/a a.a = 1.
d- Le numrateur de a et de a sont gaux, leur valeur commune (xiyi) sappelle
covariance de la srie statistique.
III-

Le coefficient de corrlation :
1- Dfinition :

Le coefficient de corrlation r est un indicateur de dpendance entre deux phnomnes.


Ce concept est trs utile dans la gestion et ladministration des entreprises. Il permet
dentrevoir, puis de vrifier lexistence dun bien entre des phnomnes tel que les salaires
et les prix, labsentisme et taux de primes, les accidents du travail et les heures
supplmentairesetc.
De faon graphique, le coefficient de corrlation indique le plus ou mois grand de degr de
rapprochement des deux droites de rgression.
Il est dfini comme tant gale la racine carre du produit de la pente des deux droites de
rgression.
(r2 = aa) r= aa' .
r = (Xi Yi) =

(Xi2). (Yi2)

 Remarque:
Le coefficient de corrlation :
* Est un nombre sans dimension entre 0 et 1 ;
* il est toujours du signe de (Xi Yi) qui peut tre positif, nul ou ngatif.

www.e-tahero.net Z.M.F

 Interprtation de la corrlation et de la rgression :


* Lorsque les points du nuage ne sont pas aligns, le coefficient de corrlation (r) est, en
valeur absolue, infrieur 1. Donc -1 < r < 1. Les deux droites de rgressions sont alors
distinctes (aa < 1).
* La fidlit de la reprsentation du nuage des points par les droites de rgression est
fonction de la valeur des coefficients de corrlation. Plus cette dernire en valeur absolue
sapproche de 1 , plus cette fidlit est importante.
* si r est proche de 1 , les deux phnomnes sont en relation troite et leur sens de
variation est identique : un accroissement de x correspond un accroissement de y .
Comme par exemple lvolution des salaires et des prix.
Portail des Etudiants dEconomie

- 34 -

Professeur BENMOUSSA

Statistiques I

www.e-tahero.net Z.M.F

* Si r est proche -1 , les deux phnomnes sont en relation troite, et leur sens de
variation est inverse. Autrement dit un accroissement de x correspond une
diminution de y .
* Si r est comprise entre - 0,5 et 0 ,5 , il ny a pas de vritable relation linaire
entre x et y . Cela peut provenir dune indpendance ou dune relation non linaire
entre les deux phnomnes x et y .
Le nuage de points est dans ce cas trs indicatif.
En rgle gnrale, la corrlation :
- Est bonne si r 0,8.
- Est moyenne si 0,5 < r< 0,8.
- Est mauvaise si
r< 0,5.

Portail des Etudiants dEconomie

- 35 -

Vous aimerez peut-être aussi