Vous êtes sur la page 1sur 182

UNIVERSITE SIDI MOHAMED BEN ABDELLAH

ECOLE NATIONALE DE COMMERCE ET DE GESTION


-FES-

Enseignant: Abdessamad OUCHEN

1 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Introduction générale
Le mot statistique tire son origine du latin statisticus
relatif à l’état (status). Il est apparu vers le milieu du
XVIIème siècle.
Au pluriel, les « statistiques » signifient un ensemble de
données numériques relatives à un groupe d’individus. On
parle des statistiques du chiffre d’affaires, de celles du
produit intérieur brut, de celles du cours d’un indice
boursier, etc.
Au singulier, la « statistique » signifie un ensemble des
méthodes qui permettent de rassembler, de présenter et
d’analyser un ensemble de données numériques.
2 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Dans un premier temps, la statistique a été employée
dans un sens purement descriptif de recueil ou de
collection de faits chiffrés, les statistiques.

Dans un second temps, elle a été utilisée pour étendre


les résultats et dégager des lois (l’inférence). Elle vise à
dégager, à partir de données observées sur quelques
individus d’une population, des résultats valables pour
l’ensemble de la population. Elle est alors un moyen
scientifique d’analyse et de compréhension d’un
phénomène étudié. Elle s’applique à l’économie ainsi
qu’à toutes les sciences sociales et de la nature.

3 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


La méthodologie statistique Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

la statistique descriptive qui consiste à remplacer des


données nombreuses par des indicateurs les plus pertinents
possibles ainsi qu’à les résumer sous forme de tableaux ou
de graphiques ;

l’inférence statistique qui vise, à partir de la description


statistique, la mise en évidence de certaines permanences ou
lois statistiques qui peuvent constituer des outils de prévision ;

la théorie des probabilités (objet du cours du calcul des


probabilités en 2ème année) qui signifie l’analyse
mathématique des phénomènes dans lesquels le hasard
intervient et qui est utilisée pour déterminer les précisions
des estimations de certains paramètres (la théorie de
l’estimation) ou des tests de certaines hypothèses (la théorie
des tests) : l’inférence statistique (objet du cours de la
statistique appliquée en 3ème année). 4
• les séries statistiques simples (à un
Chapitre 1
caractère)

• les séries statistiques doubles (à deux


Chapitre 2
caractères)

Chapitre 3 • les indices statistiques

5 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


6 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 1- Définitions
1- Population, individu et échantillon
1-1- Population

La population est l’ensemble des éléments auxquels


se rapportent les données étudiées, par exemple
l’ensemble des étudiants d’un établissement, l’ensemble
des produits d’une usine, l’ensemble des poissons d’une
rivière, l’ensemble des entreprises d’un secteur donné,
etc.
7 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-2- Individu ou unité statistique
Un individu est un élément de la population. En
d’autres termes, c’est l’élément de l’ensemble que l’on
veut étudier, par exemple un étudiant est un individu
lorsque l’on étudie la population des étudiants d’un
établissement, un produit est un individu lorsque l’on
étudie la population des produits d’une usine, etc.

1-3- Echantillon
C’est un sous-ensemble d’une population statistique.

8 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2- Variable statistique ou caractère et ses modalités
2-1- Variable statistique ou caractère

Un individu peut être décrit selon un ou plusieurs


caractères ou variables qui peuvent être des
caractéristiques qualitatives ou prendre des valeurs
numériques.

Par exemple, une entreprise d’un secteur donné peut être


décrite selon son chiffre d’affaires, ou selon le nombre de
ses salariés, ou encore selon sa forme juridique.
9 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-2- Modalités d’un caractère ou d’une variable
statistique
Les modalités sont les différentes situations
disjonctives et exhaustives d’un caractère et chaque
individu présente alors une modalité et une seule du
caractère.

2-3- Caractère quantitatif discret ou continu


Un caractère ou variable X est quantitatif si ses
diverses modalités sont mesurables ou repérables, c’est-à-
dire à chaque modalité j est associé un nombre xj.
10 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
a- Un caractère est discret si les différentes
modalités du caractère sont des valeurs numériques
isolées. Par exemple, pour l’ensemble des assurés d’une
société d’assurance automobile, on associe à chaque
adhérent le nombre annuel d’accidents déclarés qui est
un des entiers : x1=0, x2=1, x3=2,…

11 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Cas d’une variable discrète

On considère 10 familles d’un quartier avec au moins un


enfant de 0 à 17 ans (en âge révolu) : f1, f2, …, f10. A chaque
famille fi est associé le nombre d’enfants xi : x1=1, x2=2,
x3=1, x4=2, x5=3, x6=4, x7=3, x8=5, x9=1, x10=2.
La population statistique P est l’ensemble des familles du
quartier ayant au moins un enfant de 0 à 17 ans (en âge
révolu): P={f1, f2, …, f10}.

Chaque élément fi de P, c’est-à-dire chacun des 10 familles,


est un individu ou une unité statistique.
12 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
La variable statistique est l’application X : P → {1, 2, 3, …}
qui, à chaque famille fi, associe le nombre X(fi)=xi d’enfants.

On constate que X(P)={1, 2, 3, 4, 5} et que les nombres


d’observations associées à chacune des valeurs de X(P) sont
respectivement : n1=3, n2=3, n3=2, n4=1 et n5=1.

Nombre 1 2 3 4 5
d’enfants
Effectifs ni 3 3 2 1 1

13 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


b- Un caractère est continu s’il peut prendre n’importe quelle
valeur d’un intervalle. Par exemple, pour l’ensemble des employés
d’une entreprise, les salaires appartiennent aux intervalles suivants:
[3000 DH; 6000 DH[; [6000 DH; 9000 DH[; [9000 DH; 12000 DH[;
[12000 DH; 15000 DH[; [15000 DH; 18000 DH[ et
[18000 DH; 21000 DH[.

14 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Cas d’une variable continue

Le quartier industriel Sidi Brahim dispose de 25 PME. A chaque entreprise ei de la


population statistique P={e1, e2, e3, …, e25} est associé le chiffre d’affaires ci. On définit ainsi une
applicationX : P → ℝ+, ei → X(ei) = ci.

Chiffre d’affaires c < 40 40 ≤ c < 50 50 ≤ c < 60 60 ≤ c < 70 70 ≤ c < 80


annuel (en millions
de DH)
Effectifs 2 8 8 4 3

Les valeurs possibles de X appartiennent à 5 intervalles : [0, 40[ ; [40, 50[ ; [50, 60[ ;
[60, 70[ ; [70, 80[ dont les effectifs respectifs associés sont n1=2 ; n2=8 ; n3=8 ;
n4=4 ; et n5=3.
15 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-4- Caractère qualitatif

Un caractère est qualitatif si chaque modalité ne peut être


mesurée ou repérée par un nombre. Toutefois, il est
toujours possible de rendre numérique une telle variable
en associant un nombre à chaque modalité et les modalités
sont alors codées. Sur des variables qualitatives codées,
les opérations algébriques n’ont généralement pas de sens.
Par exemple, la situation matrimoniale d’un individu :
1) célibataire, 2) marié, 3) veuf, 4) divorcé.
16 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 2- Distributions statistiques et représentations
graphiques

1- Variables statistiques discrètes

Soit X une variable discrète qui prend les valeurs


numériques x1, x2, …, xK (où x1< x2< …< xK) et soit ni les
effectifs associés à chaque valeur xi. Le nombre total
d’observations est n=n1+n2+…+nK.

17 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-1- Présentation en tableau

18 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-2- Représentations graphiques

a- Diagramme en bâtons

Dans un système d’axe cartésien, portant en abscisses


les valeurs xi de la variable statistique X et en ordonnées
les effectifs ni ou les fréquences fi, on trace, à partir de
chaque valeur xi, un segment de droite vertical (le bâton)
dont la hauteur (la longueur du bâton) est proportionnelle
à l’effectif ni ou à la fréquence fi relative et on obtient
ainsi le digramme en bâtons.
19 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple :

Le tableau ci-dessous présente la distribution de 100


familles selon le nombre de pièces du logement.

Nombre de 1 2 3 4 5 6 7 8 Total
pièces
Effectifs 10 15 15 30 10 12 5 3 100
Fréquences 0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03 1

20 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


21 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
22 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-3- Effectif cumulé et fréquence relative cumulée

a- Effectif cumulé (croissant)


L’effectif cumulé croissant jusqu’à une valeur xh de la
variable X est le nombre d’individus pour lesquels la variable X
prend une valeur inférieure ou égale à xh.

b- Fréquence relative cumulée (croissante)


La fraction Fh du nombre total d’individus pour lesquels la
variable X prend une valeur inférieure ou égale à xh est la
fréquence relative cumulée croissante des valeurs de X jusqu’à xh.
23 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Valeurs de X Effectifs Effectifs cumulés Fréquences Fréquences relatives
ou modalités xi ni croissants Ni relatives fi cumulées croissantes Fi
x1 n1 N1 = n1 f1 = n1 / n F1 = f1
x2 n2 N2 = n1 + n2 f2 = n2 / n F2 = f1 + f2
x3 n3 N3 = n1 + n2 + n3 f3 = n3 / n F3 = f1 + f2 + f3
. . . . .
. . . . .
. . . . .
xh nh Nh = n1 + n2 +…+ nh fh = nh / n Fh = f1 + f2 + … + fh
. . . . .
. . . . .
. . . . .
xk nk 𝑘 fk = nk / n Fk = 1
Nk = 𝑖=1 𝑛𝑖 =𝑛

24 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple :
On reprend le cas de la distribution de 100 familles
selon le nombre de pièces du logement.

Nombre de 1 2 3 4 5 6 7 8 Total
pièces
Effectifs 10 15 15 30 10 12 5 3 100
Fréquences 0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03 1

25 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Nombre Effectifs Effectifs Fréquences Fréquences
de pièces ni cumulés relatives fi relatives cumulées
croissants Ni croissantes Fi
1 10 10 0,1 0,1
2 15 25 0,15 0,25
3 15 40 0,15 0,4
4 30 70 0,3 0,7
5 10 80 0,1 0,8
6 12 92 0,12 0,92
7 5 97 0,05 0,97
8 3 100 0,03 1
Total 100 - 1 -
26 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2- Variables statistiques continues

Subdiviser le domaine des


valeurs numériques
Lorsque n est l’analyse ci- possibles de la variable
grand (une dessus de cette statistique continue en K
infinité des série classes consécutives
d’observations de d’amplitudes égales ou
valeurs
vient fastidieuse
observables (par exemple, la non :
d’une généralisation du [e0,e1[, [e1, e2[, …,
variable diagramme en [ek-1, ek[ et de grouper
continue) bâtons) toutes les observations qui
appartiennent à une
même classe.

27 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


L’intervalle [ei-1, ei[ fermé à gauche, ouvert à droite, est
appelé ième classe (i = 1, 2, …, k). Son amplitude est
égale à : ai = ei - ei-1.

28 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2-1- Présentation en tableau Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Tableau- Effectifs et fréquences relatives


Valeurs de X Effectifs ni Fréquences relatives fi
e0 ≤ x < e1 n1 f1 = n 1 / n
e1 ≤ x < e2 n2 f2 = n 2 / n
. . .
. . .
. . .
ei-1 ≤ x < ei ni fi = n i / n
. . .
. . .
. . .
ek-1 ≤ x < ek nk fk = nk / n
ni est l’effectif de la classe [ei-1, ei[.
29
La fréquence relative de la ième classe est fi=ni/n.
Exemple :
Le tableau ci-dessous présente la répartition des
salaires de 200 salariés de l’entreprise Atlas.
Tableau- Effectifs et fréquences relatives

Valeurs du salaire Effectifs ni Fréquences


en DH relatives fi
3000 ≤ x < 6000 50 0,25
6000 ≤ x < 9000 90 0,45
9000 ≤ x < 12000 30 0,15
12000 ≤ x < 15000 15 0,075
15000 ≤ x < 18000 10 0,05
18000 ≤ x < 21000 5 0,025
30
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-2- Représentations graphiques
a- Histogramme
On peut représenter dans un repère orthogonal la
fréquence relative de chaque classe par la surface d’un
rectangle qui lui est égale ou proportionnelle.
Cette représentation, nommée histogramme, est ainsi
obtenue par la juxtaposition de rectangles dont les
bases représentent les différentes classes et dont les
surfaces sont proportionnelles aux fréquences relatives
des classes.
31 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
En effet, à la ième classe, correspond un rectangle
dont la base est l’intervalle [ei-1, ei[ et dont la
surface est proportionnelle à la fréquence fi.

32 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


les classes ont toutes les classes sont
la même amplitude d’amplitudes inégales
• les hauteurs des • la hauteur du rectangle
rectangles sont correspondant à la ième
égales aux classe d’amplitude ai
fréquences sera hi = fi . ar / ai où ar
représente l’amplitude
de référence (la plus
petite des amplitudes).

33 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Histogramme des fréquences
hi

𝑓𝑎
ℎ2 = (𝑒 2−𝑒𝑟
2 1)

𝑓𝑎
𝑖 𝑟
ℎ𝑖 = (𝑒 −𝑒
𝑖 𝑖−1 )

𝑓𝑎
ℎ1 = (𝑒 1−𝑒𝑟
1 0)

𝑓𝑘 𝑎𝑟
ℎ𝑘 = (𝑒
𝑘 −𝑒 𝐾−1 )

e0 e1 e2 ei-1 ei ek-1 ek xi
ai
34 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Remarque : Pour une série d’observations relatives à une
variable statistique X discrète ou continue classée, la
donnée des modalités xi et de leurs fréquences fi est
appelée « distribution statistique » de la variable X.

35 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemples :
i) cas de classes avec amplitudes égales :
On reprend l’exemple de la distribution des salaires
des salariés de l’entreprise Atlas.
Histogramme
0,5
0,4
0,3
hi =fréquence fi
0,2
0,1
0
0 3000 6000 9000 12000 15000 18000 21000
valeurs du salaire
36 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) cas de classes avec amplitudes inégales :
Le tableau ci-dessous présente la distribution de chômeurs
inscrits à l’ANAPEC selon l’ancienneté de chômage en Janvier
2015.
Ancienneté d’inscription Effectif ni Fréquence fi hi = fi . ar / ai
(en milliers)

Moins d’un mois 362 0,168 0,168


D’un mois à moins de 3 mois 409,8 0,19 0,095
De trois mois à moins de six mois 326,2 0,151 0,0503
De six mois à moins d’un an 382,2 0,177 0,0295
D’un an à moins de deux ans 398,6 0,185 0,0154
De deux ans à moins de trois ans 150,8 0,07 0,0058
Trois ans ou plus 125,8 0,058 0,0024
Total 2155,4 1 -
La classe « trois ans ou plus » est supposée bornée supérieurement par 5 ans (60 mois).
37
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
38 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
b- Polygone des fréquences :
*Lorsque les classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ ont une
même amplitude a (a = ei - ei-1), on joint par des
segments de droites les milieux des sommets des
rectangles de l’histogramme des fréquences. Le milieu
Mi du sommet du rectangle relatif à la classe [ei-1, ei[ a
pour abscisse xi = (ei-1 + ei) / 2 et pour ordonnée yi = fi.
Aux extrémités, on ajoute les segments [M0 M1] et
[Mk Mk+1] où M0 et Mk+1 ont respectivement pour
coordonnées (e0 – a / 2, 0) et (ek + a / 2, 0).
39 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple 1:
On reprend l’exemple de la distribution des salaires
des salariés de l’entreprise Atlas.
Histogramme et polygone des fréquences
0,5
0,45
0,4
0,35
0,3
hi=fréquence
0,25
fi
0,2
0,15
0,1
0,05
0
0 3000 6000 9000 12000 15000 18000 21000
valeur du salaire

40 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Lorsque les classes n’ont pas la même amplitude, on
considère parmi les k classes celle ou celles qui ont la plus
petite longueur θ. On subdivise l’histogramme des
fréquences en sous rectangles de même base égale à la
longueur θ. On joint par des segments les milieux des
intervalles de longueur θ des sommets des sous rectangles
de l’histogramme des fréquences à partir du point
M0(e0 - θ/2, 0) jusqu’au point Mk(ek + θ/2, 0).
Remarque :
L’aire située sous le polygone doit être égale à l’aire
41
de l’ensemble des rectangles de l’histogramme.
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple :

On reprend l’exemple de la distribution de chômeurs inscrits à


l’ANAPEC selon l’ancienneté de chômage en Janvier 2015.
Puisque les amplitudes des classes sont inégales et la plus petite
amplitude est θ=1, on subdivise alors l’histogramme des fréquences
en sous rectangles de même base égale à la longueur θ=1 et on joint
par des segments les milieux des intervalles de longueur θ=1 des
sommets des sous rectangles de l’histogramme des fréquences à
partir du point M0(-1/2, 0) jusqu’au point M62 (60,5 , 0).

42 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Histogramme et polygone des fréquences

hi

.
M1

M2
.. M3

.
M0
0 1 3 6 12 24 36
.
M61 Mois
60

43 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Remarques :
i) L’aire située sous le polygone doit être égale à l’aire de
l’ensemble des rectangles de l’histogramme.
ii) Si l’amplitude la plus petite n’est pas un diviseur
commun des autres amplitudes, on choisit une valeur de
θ, autre que la plus petite amplitude, qui doit être un
diviseur commun de toutes les amplitudes afin de
faciliter la subdivision des rectangles de l’histogramme
en des sous rectangles de base θ.
44 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-3- Effectif cumulé et fréquence relative cumulée

a- Effectif cumulé croissant

L’effectif cumulé croissant de la hème classe est le


nombre d’individus Nh pour lesquels la variable X prend
une valeur inférieur à eh.

45 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


b- Fréquence relative cumulée (croissante)

La fréquence cumulée croissante de la hème classe est la


fraction Fh du nombre total d’individus pour lesquels la
variable X prend une valeur inférieure à eh.

46 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Tableau- Effectifs, fréquences relatives, effectifs cumulés
croissants, fréquences relatives cumulées croissantes

47 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple :
On reprend le cas de la distribution des chômeurs inscrits à
l’ANAPEC selon l’ancienneté de chômage en Janvier 2015.
Ancienneté d’inscription Effectif ni Fréquences fi
(en milliers)
Moins d’un mois 362 0,168
D’un mois à moins de 3 mois 409,8 0,19
De trois mois à moins de six 326,2 0,151
mois
De six mois à moins d’un an 382,2 0,177
D’un an à moins de deux ans 398,6 0,185
De deux ans à moins de trois ans 150,8 0,07
Trois ans ou plus 125,8 0,058
Total 2155,4 1
La classe « trois ans ou plus » est supposée bornée supérieurement par 5 ans (60 mois).
48 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Tableau- Effectifs, fréquences relatives, effectifs cumulés
croissants, fréquences relatives croissantes
Ancienneté d’inscription Effectifs Effectifs Fréquence Fréquences
ni cumulés s relatives relatives
croissants Ni fi cumulées
croissantes Fi
Moins d’un mois 362 362 0,168 0,168
D’un mois à moins de 3 mois 409,8 771,8 0,19 0,358
De trois mois à moins de six mois 326,2 1098 0,151 0,509
De six mois à moins d’un an 382,2 1480,2 0,177 0,686
D’un an à moins de deux ans 398,6 1878,8 0,185 0,871
De deux ans à moins de trois ans 150,8 2029,6 0,07 0,941
Trois ans ou plus 125,8 2155,4 0,058 1
Total 2155,4 - 1 -

49 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3- Variables qualitatives

Soit C une variable qualitative qui prend les modalités


c1, c2, …,cK et soit ni les effectifs associés à chaque
modalité ci. Le nombre total d’observations est
n=n1+n2+…+nK.

50 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3-1- Présentation en tableau
Tableau- Effectifs et fréquences relatives
Modalités du caractère C Effectifs ni Fréquences relatives fi
c1 n1 f1=n1/n
c2 n2 f2=n2/n
. . .
. . .
. . .
ci ni fi=ni/n
. . .
. . .
. . .
ck-1 nk-1 fk-1=nk-1/n
ck nk fk=nk/n
𝑘 𝑘

𝑛𝑖 = 𝑛 𝑓𝑖 = 1
𝑖=1 𝑖=1

ni est l’effectif de la modalité ci.


51 La fréquence relative de la modalité ci est fi=ni/n.
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3-2- Représentations graphiques
a- Diagramme en « tuyaux d’orgue »
Dans un repère orthogonal, portant en abscisses les
modalités ci de la variable qualitative C et en ordonnées les
effectifs ni ou les fréquences fi, on trace, à partir de chaque
modalité ci, un rectangle (tuyau) qui a pour base cette
modalité ci et comme hauteur l’effectif ni ou la fréquence
fi. La base de chacun des rectangles ne possède aucune
signification numérique puisque la variable est qualitative
et les bases des rectangles sont égales.
52 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple :

Le tableau ci-dessous présente la distribution de 100


personnes selon la catégorie socioprofessionnelle.
Catégories Effectifs Fréquences
Socioprofessionnelles ni fi
Agriculteurs 10 0,1
Commerçants 30 0,3
Cadres 20 0,2
Ouvriers 30 0,3
Retraités 10 0,1
Total 100 1
53 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Diagramme en tuyaux d'orgue
0,35

0,3

0,25

0,2

Fréquences fi
0,15

0,1

0,05

0
Agriculteurs Commerçants Cadres Ouvriers Retraités
Catégories socioprofessionnelles

54 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


b- Diagramme en secteurs

Appelé aussi « Camembert » ou digramme circulaire,


le diagramme en secteurs partage un disque en des aires
proportionnelles aux effectifs (ou aux fréquences).

55 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple :
On reprend l’exemple de la distribution de 100
personnes selon la catégorie socioprofessionnelle.

Catégories Effectifs Fréquences


Socioprofessionnelles ni fi
Agriculteurs 10 0,1
Commerçants 30 0,3
Cadres 20 0,2
Ouvriers 30 0,3
Retraités 10 0,1
Total 100 1

56 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Diagramme en secteurs :

On porte sur le disque successivement :


-Angle AôB : [AôB] = 0,1 x 360°=36°. La surface du secteur
(AOB) représente la part des agriculteurs dans l’ensemble des 100
personnes ;
-Angle BôC : [BôC] = 0,3 x 360° = 108°. La surface du secteur
(BOC) représente la part des commerçants dans l’ensemble des
100 personnes ;
-Angle CôD : [CôD] = 0,2 x 360° = 72°. Le secteur (COD)
représente la part des cadres dans l’ensemble des 100 personnes ;
-Angle DôE : [DôE] = 0,3 x 360° = 108°. Le secteur (DOE)
représente la part des ouvriers dans l’ensemble des 100 personnes ;
-Angle EôA : [EôA] = 0,1 x 360° = 36°. Le secteur (EOA)
représente la part des retraités dans l’ensemble des 100 personnes.

57 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Diagramme en secteurs
A Retraités Agriculteurs
A A
B 10% 10%
B E B
B
A E
B

Ouvriers Commerçants
30% 30%
O
C

C
D
C
D C
C
C
D D D D Cadres
20%
58 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 3- Les indicateurs statistiques

• Les indicateurs de tendance centrale ;

• Les indicateurs de dispersion ;

• Les indicateurs de forme.

59 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-Les indicateurs de tendance centrale

Ce sont des indicateurs qui synthétisent l’ensemble


d’une série statistique en faisant ressortir une position
centrale de la valeur du caractère étudié. Ils regroupent
la valeur médiane, différents types de moyennes et la
valeur modale.

60 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-1-Moyenne arithmétique 𝒙

La valeur moyenne d’une série statistique est la somme de toutes les observations
divisée par le nombre total d’observations. Autrement dit, la valeur moyenne 𝑥 d’une série de
1 𝑛 𝑥 1 +𝑥 2 +⋯+𝑥𝑛
n observations 𝑥1 , 𝑥2 , …,𝑥𝑛 est 𝑥 = 𝑖=1 𝑥𝑖 = .
𝑛 𝑛

61 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


i) le cas d’une variable discrète :

Lorsque les n observations d’une variable discrète X prennent l’une des k valeurs 𝑥1,
𝑥2, …, 𝑥𝑘 avec respectivement les effectifs 𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la
1 𝑘 𝑛 1 𝑥 1 + 𝑛 2 𝑥 2 +⋯+ 𝑛 𝑘 𝑥 𝑘
valeur moyenne 𝑥 est : 𝑥 = 𝑛 𝑖=1 𝑛𝑖 𝑥𝑖 = 𝑛

62 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la distribution de 100 familles
selon le nombre de pièces du logement.

Nombre de 1 2 3 4 5 6 7 8 Total
pièces
Effectifs 10 15 15 30 10 12 5 3 100
Fréquences 0,1 0,15 0,15 0,3 0,1 0,12 0,05 0,03 1

8
1 10𝑥1 + 15𝑥2 + 15𝑥3 + 30𝑥4 + 10𝑥5 + 12𝑥6 + 5𝑥7 + (3𝑥8)
𝑥= 𝑛𝑖 𝑥𝑖 = = 3,86
𝑛 100
𝑖=1

63 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


ii) le cas d’une variable continue :

Lorsque les n observations d’une variable continue X sont regroupées en K classes


[e0 , e1[,[e1, e2[, …, [ek-1, ek[ d’effectifs respectifs𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1+ 𝑛2 + …+ 𝑛𝑘 = 𝑛, la
1 𝑘 𝑛 1 𝑥 1 +𝑛 2 𝑥 2 +⋯+𝑛 𝑘 𝑥 𝑘
valeur moyenne 𝑥 est : 𝑥 = 𝑖=1 𝑛𝑖 𝑥𝑖 = où 𝑥𝑖 est le centre de la
𝑛 𝑛
ème 𝑒𝑖−1 +𝑒𝑖
i classe : 𝑥𝑖 = 2
.

64 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la répartition des salaires
de 200 salariés de l’entreprise Atlas.
Tableau- Effectifs et fréquences relatives
Valeurs du salaire en DH Effectifs ni Fréquences relatives fi
3000 ≤ x < 6000 50 0,25
6000 ≤ x < 9000 90 0,45
9000 ≤ x < 12000 30 0,15
12000 ≤ x < 15000 15 0,075
15000 ≤ x < 18000 10 0,05
18000 ≤ x < 21000 5 0,025
Total 200 1
6
1 50𝑥4500 + 90𝑥7500 + 30𝑥10500 + 15𝑥13500 + 10𝑥16500 + (5𝑥19500)
𝑥 = 𝑛𝑖 𝑥𝑖 = = 8400 𝐷𝐻
𝑛 200
65 𝑖=1Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-2-Autres moyennes usuelles

i) Moyenne harmonique H :

La moyenne harmonique H de la série de valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑛 , supposées toutes non


nulles, est l’inverse de la moyenne arithmétique des inverses des valeurs xi :

𝑛
1 1 1 1 1 1 1
= = ( + + ⋯+ )
𝐻 𝑛 𝑥𝑖 𝑛 𝑥1 𝑥2 𝑥𝑛
𝑖=1

66 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑘 ,
non nulles, avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur
moyenne harmonique est :

𝑘
1 1 𝑛𝑖 1 𝑛1 𝑛2 𝑛𝑘
= = ( + + ⋯+ )
𝐻 𝑛 𝑥𝑖 𝑛 𝑥1 𝑥2 𝑥𝑛
𝑖=1
𝑛 𝑛
𝐻= 𝑛 =𝑛 𝑛 𝑛𝑘
𝑘 𝑖 1 2
𝑖=1 𝑥 𝑥 + 𝑥 + ⋯ + 𝑥
𝑖 1 2 𝑛
La définition de la moyenne harmonique présuppose que X ne prend
pas la valeur 0.
67 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du
logement.
8
1 1 𝑛𝑖 1 10 15 15 30 10 12 5 3
= = + + + + + + + = 0,3509
𝐻 𝑛 𝑥𝑖 100 1 2 3 4 5 6 7 8
𝑖=1

𝑛 100
Ou encore : 𝐻 = =
8 𝑛 𝑖 10 15 15 30 10 12 5 3
= 2,8498
𝑖=1 𝑥 + + + + + ++
𝑖 1 2 3 4 5 6 7 8
68 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) Moyenne géométrique G :

La moyenne géométrique G de la série de valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑛 , supposées toutes


strictement positives, est définie ainsi :

𝑛
𝑛
𝐺= 𝑥𝑖 = 𝑛 𝑥1 𝑥2 … 𝑥𝑛
𝑖=1

Cette formule implique :

𝑛
1
𝑙𝑛 𝐺 = ln⁡(𝑥𝑖 )
𝑛
𝑖=1

69 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …, 𝑥𝑘 ,
strictement positives, avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛,
la valeur moyenne géométrique est :

𝑘
𝑛
𝐺= 𝑥𝑖 𝑛 𝑖 = 𝑛 𝑥1 𝑛 1 𝑥2 𝑛 2 … 𝑥𝑘 𝑛 𝑘
𝑖=1

𝐺= 𝑥𝑖 𝑓 𝑖 = 𝑥1 𝑓1 𝑥2 𝑓2 … 𝑥𝑘 𝑓 𝑘
𝑖=1

Ces formules impliquent:

𝑙𝑛 𝐺 = 𝑓𝑖 𝑙𝑛⁡(𝑥𝑖 )
𝑖=1

70 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du
logement.

8
𝑛
100
𝐺= 𝑥𝑖 𝑛 𝑖 = 110 215 315 430 510 612 75 83
𝑖=1

8 𝑓𝑖
𝐺= 𝑥
𝑖=1 𝑖 = 10,1 20,15 30,15 40,3 50,1 60,12 70,05 80,03 =3,3882

71 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


iii) Moyenne quadratique Q :

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 ,…,𝑥𝑘
avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la valeur moyenne
quadratique Q est la racine carrée de la moyenne arithmétique des carrés des valeurs 𝑥𝑖 :

𝑘
1 1
𝑄= 𝑛𝑖 (𝑥𝑖 )2 = (𝑛1 𝑥1 2 + 𝑛2 𝑥2 2 + ⋯ + 𝑛𝑘 𝑥𝑘 2 )
𝑛 𝑛
𝑖=1

72 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la distribution de 100
familles selon le nombre de pièces du logement.

1 8 2 1 2
𝑄= 𝑛𝑖 (𝑥𝑖 ) = [ 10 𝑥 1 + 15 𝑥 22 + 15 𝑥 32 + 30 𝑥 42 + 10 𝑥 52 + 12 𝑥 62 + 5 𝑥 72 +( 3 𝑥 82)] = 4,2474
𝑛 𝑖=1 100

73 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


N.B. : Quelle que soit la série statistique considérée où tous les 𝑥𝑖 sont strictement positifs :

H≤G≤x≤Q

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du


logement.
H = 2,8498 ≤ G = 3,3882 ≤ x = 3,86 ≤ Q = 4,2474

74 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-3-Le mode

i) le cas d’une variable discrète :

Lorsque les n observations d’une variable discrète X prennent l’une des k valeurs 𝑥1, 𝑥2,
…, 𝑥𝑘 avec respectivement les effectifs 𝑛1, 𝑛2 , …, 𝑛𝑘 , avec 𝑛1+ 𝑛2 + …+ 𝑛𝑘 = 𝑛, le mode
𝑚𝑜 est la valeur 𝑥𝑖𝑜 de la variable statistique pour laquelle l’effectif 𝑛𝑖𝑜 est maximal : 𝑚𝑜 = 𝑥𝑖𝑜 .

75 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la distribution de 100
familles selon le nombre de pièces du logement.

Avec la valeur 𝑥4=4, l’effectif 𝑛4 = 30 est maximal.

Le mode est alors 𝑚𝑜 = 𝑥4 = 4.

76 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


ii) le cas d’une variable continue :

Lorsque les n observations d’une variable continue X sont regroupées en K classes


[e0, e1[, [e1, e2[, …, [ek-1, ek[ d’effectifs respectifs 𝑛1 , 𝑛2 , … , 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛,
la classe modale est celle qui, dans l’histogramme des fréquences , a la plus grande ordonnée.
L’intervalle [eio-1, eio[ est la classe modale si et seulement si :

𝑓 𝑖𝑜 𝑎 𝑟 𝑓𝑖 𝑎𝑟
ℎ𝑖𝑜 = (𝑒 > ℎ𝑖 = ∀ 𝑖 ≠ 𝑖𝑜
𝑖𝑜 −𝑒 𝑖𝑜−1 ) (𝑒 −𝑒 )
𝑖 𝑖−1

77 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


𝑑1
La valeur 𝑚𝑜 = 𝑒𝑖𝑜−1 + (𝑒𝑖𝑜 − 𝑒𝑖𝑜−1)(𝑑 +𝑑 ) est la valeur modale, où :𝑒𝑖𝑜−1 est
1 2

l’extrémité inférieure de la classe modale, 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1 est l’amplitude de la classe modale,
𝑑1 = 𝑓𝑖 − 𝑓𝑖−1 et 𝑑2 = 𝑓𝑖 − 𝑓𝑖+1 lorsque les classes ont la même amplitude ou
𝑑1 = 𝑓′𝑖 − 𝑓′𝑖−1 et 𝑑2 = 𝑓′𝑖 − 𝑓′𝑖+1 lorsque les classes ont des amplitudes différentes.

78 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la répartition des salaires
de 200 salariés de l’entreprise Atlas.

D’après l’histogramme, c’est la classe [6000 ; 9000[


qui a la plus grande ordonnée : h2 = f2 = 0,45.

D’où la classe modale est [eio-1, eio[ = [6000 ; 9000[ et la valeur modale est :

𝑑1 0,45 − 0,25
𝑚𝑜 = 𝑒𝑖𝑜−1 + 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1 = 6000 + 9000 − 6000 = 7200 𝐷𝐻
𝑑1 + 𝑑2 0,45 − 0,25 + 0,45 − 0,15

79 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Quant à l’exemple de la distribution des chômeurs inscrits à
l’ANAPEC selon l’ancienneté de chômage en Janvier 2015, c’est
la classe [0 ; 1[ qui a la plus grande ordonnée :
h1 = f1 . ar / a1 = f’1 = 0,168.

D’où la classe modale est [eio-1, eio[ = [0 ; 1[ et la valeur modale est :

𝑑1 0,168−0
𝑚𝑜 = 𝑒𝑖𝑜−1 + 𝑒𝑖𝑜 − 𝑒𝑖𝑜−1 =0+ 1−0 = 0,6971 𝑚𝑜𝑖𝑠.
𝑑 1 +𝑑 2 0,168−0+0,168−0,095

80 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Dans la plupart des cas concrets, il y a une seule
valeur modale, la distribution est dite alors unimodale.
Si la distribution sur une population comporte deux ou
plusieurs modes (distribution bimodale ou
multimodale) cela laisse à penser qu’il existe deux ou
plusieurs groupes distincts dans la population. Par
exemple, la distribution des pointures de chaussures
des hommes et femmes réunies.

81 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-4- La médiane et les quantiles
a- La médiane

La médiane est la valeur de la variable statistique


telle qu’il ait autant d’observations supérieures et
d’observations inférieures à cette valeur. Elle partage la
série statistique en deux parties d’égal effectif.

82 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


i) le cas d’une variable discrète :
*Soit une série statistique de n observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 connues, distinctes ou non
et classées par ordre de valeurs croissantes : 𝑥1 ≤ 𝑥2 ≤ … ≤ 𝑥𝑛 .

On appelle médiane la valeur 𝑚𝑒 , telle que : (nombre d’observations inférieures ou


égales à 𝑚𝑒 ) ≥ n/2 et (nombre d’observations supérieures ou égales à 𝑚𝑒 ) ≥ n/2. Autrement
dit, il y a au moins 50 % des observations qui ont une valeur inférieure ou égale à 𝑚𝑒 la
médiane et il y a au moins 50% des observations qui ont une valeur supérieure ou égale à 𝑚𝑒 .

Sa définition dépend de la parité de n :


- Si n est un nombre impair (n = 2 p + 1), la valeur médiane sera 𝑚𝑒 = 𝑥𝑝+1 ;


- Si n est un nombre pair (n = 2 p), la valeur médiane sera 𝑚𝑒 = (𝑥𝑝∗ + 𝑥𝑝+1 )/2.

83 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple:
Afin de réaliser une étude sur la rentabilité sectorielle
dans le secteur S1, une enquête permet d’obtenir les taux
de rentabilité en % de 8 entreprises : 2,5 ; 3 ; 3,1 ; 4,1 ;
5,4 ; 4,5 ; 5,2 ; 2,5.
La valeur médiane de cet échantillon est obtenue en
classant ces 8 valeurs par ordre croissant :
Rang de 1 2 3 4 5 6 7 8
l’observation i
Rentabilité 2,5 2,5 3,0 3,1 4,1 4,5 5,2 5,4
financière (en%)
xi

84 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Le nombre d’observations n = 8 étant un nombre
pair (n = 2 p avec p = 4) la valeur médiane me
correspond à 𝑥𝑝∗ + 𝑥𝑝+1∗ /2soit:

𝑥4∗ + 𝑥5∗ /2 = 3,1 + 4,1 /2 = 3,6.

85 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Pour comparer la rentabilité des firmes de ce secteur S1
à celle des firmes du secteur S2, on a prélevé dans ce
dernier un échantillon de 9 entreprises : 3 ; 3,5 ; 3,8 ;
4,1 ; 4,1 ; 4,5 ; 5,5 ; 5,5 ; 4,2.

Pour obtenir la valeur médiane de ce deuxième


échantillon, on réécrit les valeurs de cette série dans
l’ordre croissant :
Rang de 1 2 3 4 5 6 7 8 9
l’observation i
Rentabilité 3 3,5 3,8 4,1 4,1 4,2 4,5 5,5 5,5
financière (en%)
xi
86 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
La taille de l’échantillon étant un nombre impair
(n = 2p +1 avec p = 4), la valeur médiane me correspond
à xp+1* : me = x5 = 4,1.

87 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


ii) le cas d’une variable continue :

Lorsque les n observations d’une variable continue X sont


regroupées en K classes [e0, e1[, [e1, e2[, …, [ek-1, ek[ d’effectifs
respectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la classe
médiane est la classe [ei-1, ei[ dont la fréquence cumulée
croissante approche 0,5 par excès, c’est-à-dire Fi>0,5.

88 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Par interpolation linéaire, on a :

0,5 − 𝐹𝑖−1
𝑚𝑒 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
𝐹𝑖 − 𝐹𝑖−1

0,5 − 𝐹𝑖−1
= 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
𝑓𝑖

89 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On reprend l’exemple de la répartition des salaires de
200 salariés de l’entreprise Atlas.

la classe médiane est la classe [6000, 9000[ dont la


fréquence cumulée croissante approche 0,5 par excès,
c’est-à-dire F2 = 0,70 > 0,5.

90 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


D’où : la classe médiane est : [e1, e2[=[6000 ; 9000[ et, par
interpolation linéaire, on a :

0,5 − 𝐹1 0,5 − 𝐹1
𝑚𝑒 = 𝑒1 + 𝑒2 − 𝑒1 = 𝑒1 + 𝑒2 − 𝑒1
𝐹2 − 𝐹1 𝑓2

0,5 − 0,25
𝑚𝑒 = 6000 + 9000 − 6000
0,70 − 0,25

0,5 − 0,25
= 6000 + 9000 − 6000 = 7666,6667
0,45

91 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


b- Les quantiles
Le quantile est un indicateur de position. Il est une
généralisation de la notion de médiane.
Le quantile d’ordre α (0 ≤ α ≤ 1), noté 𝑥𝛼 , est tel
qu’une proportion α des individus ait une valeur du
caractère X inférieure ou égale à 𝑥𝛼 . Le quantile
𝑥0,5 est égal à la médiane.
Les quantiles les plus courants sont : les quartiles,
les déciles et les centiles.
92 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Les quartiles sont les valeurs d’une série ou d’une
distribution statistique rangées par ordre croissant (ou
décroissant) qui partagent l’effectif total en quatre
parties égales. Ils sont les quantiles d’ordre ¼, ½ et ¾.
Ils sont ainsi notés : Q1 = premier quartile = 𝑥0,25 ;
Q2 = deuxième quartile = médiane = 𝑥0,5
et Q3 = troisième quartile = 𝑥0,75 (Q1 ≤ Q2 ≤ Q3).

93 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


i) le cas d’une variable discrète :

Les trois quartiles Q1, Q2 et Q3 sont des nombre


qui partagent les n observations en 4 classes qui
ont chacune un effectif sensiblement égal à n/4. Le
second quartile coïncide évidemment avec la
médiane.

94 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


 Premier quartile. Le premier quartile Q1 est défini comme
suit :

Q1= (xn/4* + xn/4+1*)/2 si n/4 est un entier ;

Q1= x[n/4]+1* (où [n/4] est la partie entière de n/4) si n/4 n’est
pas un entier.

On a la propriété : il y a au moins 25 % des observations qui


ont une valeur inférieure ou égale à 𝑄1 et il y a au moins 75%
des observations qui ont une valeur supérieure ou égale à 𝑄1 .

95 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


 Deuxième quartile. Sa valeur Q2 est égale à la médiane me.
 Troisième quartile. Sa valeur Q3 est définie comme suit :

Q3= (x3n/4* +x3n/4+1*)/2 si 3n/4 est un entier ;

Q3= x[3n/4]+1* (où [3n/4] est la partie entière de 3n/4) si 3n/4


n’est pas un entier.

On a la propriété : il y a au moins 75 % des observations qui


ont une valeur inférieure ou égale à 𝑄3 et il y a au moins 25%
des observations qui ont une valeur supérieure ou égale à 𝑄3 .

96 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple :

Pour l’échantillon des 8 firmes issues de S1, le nombre


d’observations n étant égal à 8, n/4 est l’entier 2.

Par suite Q1= (xn/4* + xn/4+1*)/2=(x2* + x3*)/2=(2,5+3)/2=2,75.

3n/4 étant l’entier 6, on a:

Q3=(x3n/4* + x3n/4+1*)/2=(x6* + x7*)/2=(4,5+5,2)/2=4,85.

Pour les 9 firmes issues de S2 le nombre d’observations n


n’est pas divisible par 4 car n/4=9/4=2,25. Et [n/4] la partie
entière de n/4 étant égale à 2, on a Q1= x[n/4]+1* = Q1= x* =3,8. De
même, on a Q3= x[3n/4]+1* = x7* =4,5.
97 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
ii) le cas d’une variable continue :

 Premier quartile. La classe qui contient le premier quartile est la classe [ei-1, ei[ dont la
fréquence cumulée croissante approche 0,25 par excès, c’est-à-dire Fi>0,25.

Par interpolation linéaire on a :

0,25 − 𝐹𝑖−1
𝑄1 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
𝐹𝑖 − 𝐹𝑖−1

 Deuxième quartile. Sa valeur Q2 est égale à la médiane me.


 Troisième quartile. La classe qui contient le troisième quartile est la classe [ei-1, ei[
dont la fréquence cumulée croissante approche 0,75 par excès, c’est-à-dire Fi>0,75.

Par interpolation linéaire on a :

0,75 − 𝐹𝑖−1
𝑄3 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1
𝐹𝑖 − 𝐹𝑖−1

98 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple :

On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise


Atlas.

 La classe qui contient le premier quartile est la classe [6000, 9000[ telle que
F(9000) = 0,7 > 0,25 et F(6000) = 0,25 ≤ 0,25. Par interpolation linéaire on a :

0,25 − 𝐹𝑖−1 0,25 − 0,25


𝑄1 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1 = 6000 + 9000 − 6000 = 6000.
𝐹𝑖 − 𝐹𝑖−1 0,7 − 0,25

 Deuxième quartile. Sa valeur Q2 est égale à la médiane me = 7666,6667.


 Troisième quartile. Sa valeur estimée Q3 est définie par F(Q3) = 0,75. La classe
qui contient le troisième quartile est la classe [9000, 12000[ telle que
F(12000)=0,85 > 0,75 et F(9000)=0,7 ≤ 0,75. Par interpolation linéaire on a :

0,75 − 𝐹𝑖−1 0,75 − 0,7


𝑄3 = 𝑒𝑖−1 + 𝑒𝑖 − 𝑒𝑖−1 = 9000 + 12000 − 9000 ≈ 10000.
𝐹𝑖 − 𝐹𝑖−1 0,85 − 0,7
99 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2- Les indicateurs de dispersion
2-1-La dispersion en termes d’écarts moyens

Le calcul des écarts moyens se basent sur les caractéristiques de tendance centrale, telles que :
la valeur médiane me ou la valeur moyenne 𝑥. Il considère ces écarts en valeur absolue ou en
puissance paire afin de traduire correctement la dispersion.

100 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


a-Ecarts absolus moyens
i) Ecart absolu moyen par rapport à la valeur médiane 𝑚𝑒

L’écart absolu moyen par rapport à la valeur médiane me d’une série de n observations
𝑥1 , 𝑥2 , …, 𝑥𝑛 est

𝑛
1 1
𝑒𝑚 𝑒 = 𝑥𝑖 − 𝑚𝑒 = ( 𝑥1 − 𝑚𝑒 + 𝑥2 − 𝑚𝑒 + ⋯ + 𝑥𝑛 − 𝑚𝑒 )
𝑛 𝑛
𝑖=1

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘
avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, l’écart absolu
moyen par rapport à la valeur médiane me est :

𝑘
1 1
𝑒𝑚 𝑒 = 𝑛𝑖 𝑥𝑖 − 𝑚𝑒 = (𝑛1 𝑥1 − 𝑚𝑒 + 𝑛2 𝑥2 − 𝑚𝑒 + ⋯ + 𝑛𝑘 𝑥𝑘 − 𝑚𝑒 )
𝑛 𝑛
𝑖=1

101 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


ii) Ecart absolu moyen par rapport à la moyenne arithmétique 𝑥

L’écart absolu moyen par rapport à la moyenne arithmétique x d’une série de n


observations 𝑥1 , 𝑥2 , …, 𝑥𝑛 est

𝑛
1 1
𝑒x = 𝑥𝑖 − x = ( 𝑥1 − x + 𝑥2 − x + ⋯ + 𝑥𝑛 − x )
𝑛 𝑛
𝑖=1

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘
avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, l’écart absolu
moyen par rapport à la moyenne arithmétique x est :

𝑘
1 1
𝑒x = 𝑛𝑖 𝑥𝑖 − x = (𝑛1 𝑥1 − x + 𝑛2 𝑥2 − x + ⋯ + 𝑛𝑘 𝑥𝑘 − x )
𝑛 𝑛
𝑖=1

102 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


b- Variance et écart-type

Ils mesurent la dispersion des données autour de la moyenne.

La variance d’une variable statistique X est la moyenne arithmétique des carrés des
écarts à la moyenne arithmétique :

1 𝑛 1 𝑛
Var(X) = V(X) = 𝑛 𝑖=1(𝑥𝑖 − 𝑥 )2 = 𝑛 𝑖=1 𝑥𝑖
2
− 𝑥2

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘
avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, la variance de X
est :

1 𝑘 1 𝑘
V(X) = 𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥 )2 = 𝑖=1 𝑛𝑖 𝑥𝑖
2
− 𝑥2
𝑛 𝑛

Lorsque X est une variable continue les 𝑥𝑖 sont les centres des classes [ei-1 ; ei[ :
𝑒 𝑖−1 +𝑒 𝑖
𝑥𝑖 =
2

103 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


L’écart-type est la racine carrée de la variance : 𝜎𝑋 = 𝑉(𝑋)

L’écart-type est exprimé dans la même unité que les observations, alors que la
variance s’exprime dans le carré de cette unité.

N.B. : L’écart-type donne plus de poids aux observations extrêmes que l’écart absolu moyen à
la moyenne : 𝜎𝑋 ≥ 𝑒𝑥 .

104 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple 1 (le cas d’une variable discrète):

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du


logement.
𝒙𝒊 𝒏𝒊 𝒏𝒊𝒙𝟐𝒊 𝒙𝒊 − 𝒙 (𝒙𝒊 − 𝒙)𝟐 𝒏𝒊 (𝒙𝒊 − 𝒙)𝟐
1 10 10 -2,86 8,1796 81,796
2 15 60 -1,86 3,4596 51,894
3 15 135 -0,86 0,7396 11,094
4 30 480 0,14 0,0196 0,588
5 10 250 1,14 1,2996 12,996
6 12 432 2,14 4,5796 54,9552
7 5 245 3,14 9,8596 49,298
8 3 192 4,14 17,1396 51,4188
Total 100 1804 - - 314,04

105 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1 𝑘 2 2 1804
La variance de X est : 𝑉 𝑋 = 𝑛 𝑖=1 𝑛𝑖 𝑥𝑖 − 𝑥 = 100 − 3,862 = 3,1404 𝑝𝑖è𝑐𝑒𝑠2

1 𝑘 2 314,04
Ou encore : V(X) = 𝑛 𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥) = 100 = 3,1404 𝑝𝑖è𝑐𝑒𝑠2

L’écart-type de X est : 𝜎𝑋 = 𝑉(𝑋) = 1,7721 𝑝𝑖è𝑐𝑒𝑠.

106 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple 2 (le cas d’une variable continue):

On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise


Atlas.

Valeurs du 𝒙𝒊 (le centre


salaire en de la classe 𝒏𝒊 𝒏𝒊 𝒙𝒊 𝒏𝒊 𝒙𝟐𝒊 𝒙𝒊 − 𝒙 (𝒙𝒊 − 𝒙)𝟐 𝒏𝒊 (𝒙𝒊 − 𝒙)𝟐
milliers de DH [ei-1; ei[)
4,5 50 225 1012,5 -3,9 15,21 760,5
3≤x<6
7,5 90 675 5062,5 -0,9 0,81 72,9
6≤x<9
10,5 30 315 3307,5 2,1 4,41 132,3
9 ≤ x < 12

12 ≤ x < 15 13,5 15 202,5 2733,75 5,1 26,01 390,15

16,5 10 165 2722,5 8,1 65,61 656,1


15≤ x < 18

18 ≤ x < 21 19,5 5 97,5 1901,25 11,1 123,21 616,05

- 200 1680 16740 - - 2628


Total

107 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1 𝑘 1680
La moyenne arithmétique est 𝑥 = 𝑛𝑥
𝑛 𝑖=1 𝑖 𝑖
= 200
= 8,4 𝑚𝑖𝑙𝑙𝑖𝑒𝑟𝑠 𝑑𝑒 𝐷𝐻.

La variance de X est :

𝑘
1 2 2
16740
𝑉𝑋 = 𝑛𝑖 𝑥𝑖 − 𝑥 = − 8,42 = 13,14 (𝑚𝑖𝑙𝑙𝑖𝑒𝑟𝑠 𝑑𝑒 𝐷𝐻)2
𝑛 200
𝑖=1

1 𝑘 2628
Ou encore : V(X) = 𝑛 (𝑥 − 𝑥 )2 = = 13,14 (𝑚𝑖𝑙𝑙𝑖𝑒𝑟𝑠 𝑑𝑒 𝐷𝐻)2
𝑛 𝑖=1 𝑖 𝑖 200

L’écart-type de X est : 𝜎𝑋 = 𝑉(𝑋) = 3,6249 𝑚𝑖𝑙𝑙𝑖𝑒𝑟𝑠 𝑑𝑒 𝐷𝐻.

108 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


c- Moment centré d’ordre h :

Le moment centré d’ordre h est la moyenne arithmétique des écarts des valeurs de X à
leur moyenne arithmétique élevés à la puissance h :

𝑛
1
𝜇ℎ = (𝑥𝑖 − 𝑥)ℎ
𝑛
𝑖=1

Lorsque les n observations d’une variable X prennent l’une des k valeurs 𝑥1 , 𝑥2 , …,𝑥𝑘
avec respectivement les effectifs 𝑛1 , 𝑛2 , …, 𝑛𝑘 , avec 𝑛1 + 𝑛2 + …+ 𝑛𝑘 = 𝑛, le moment centré
d’ordre h est :

𝑘
1
𝜇ℎ = 𝑛𝑖 (𝑥𝑖 − 𝑥 )ℎ
𝑛
𝑖=1

Remarque : La variance est le moment centré d’ordre 2.

109 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2-2- Coefficients de dispersion relative de la distribution

𝑄3 −𝑄1
i) coefficient interquartile =
𝑄2

𝜎𝑋
ii) coefficient de variation = 𝑥 . Cet indicateur est utile pour comparer la dispersion d’un

caractère sur des populations ayant des valeurs moyennes très différentes ou exprimées dans
des unités de mesure différente (monnaies différentes…).

110 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3- Indicateurs de forme
3-1- Coefficient d’asymétrie

i) Une distribution symétrique

𝑚𝑜 = 𝑚𝑒 = 𝑥

111 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


ii) Une distribution asymétrique étalée à droite

𝑚𝑜 𝑚𝑒 𝑥

112 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


iii) Une distribution asymétrique étalée à gauche

𝑥 𝑚𝑒 𝑚𝑜

113 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


𝜇3 1 𝑛
Le coefficient d’asymétrie de Fisher (ou skewness) : 𝛾 = 3 où 𝜇3 = 𝑖=1(𝑥𝑖 − 𝑥)3
𝜎𝑋 𝑛
1 𝑘
ou 𝜇3 = 𝑛 𝑖=1 𝑛𝑖 (𝑥𝑖 − 𝑥)3 est le moment centré d’ordre 3 et 𝜎𝑋3 est l’écart-type élevé au

cube.

Il est nul si la distribution des fréquences relatives est symétrique autour de la


moyenne, négatif si la distribution est unimodale étalée vers la gauche, et positif si la
distribution est unimodale étalée vers la droite.

114 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3-2- Coefficient d’aplatissement

𝜇4
Le coefficient d’aplatissement Г de Fisher (ou Kurtosis) : Г = − 3 où
𝜎𝑋4
1 𝑛 1 𝑘
𝜇4 = (𝑥 − 𝑥 ) 4
ou 𝜇4 = 𝑛 (𝑥 − 𝑥 ) 4
est le moment centré d’ordre 4 et 𝜎𝑋4 est
𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖 𝑖

l’écart-type élevé à la puissance 4.

Ce coefficient est nul pour une distribution normale (attention « normale » fait référence à la
négatif ou
loi statistique normale), positif ou négatif
positif selon que la distribution est plus ou moins aplatie

que la distribution normale de même moyenne et de même écart-type.

115 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple 1 (le cas d’une variable discrète):

On reprend l’exemple de la distribution de 100 familles selon le nombre de pièces du


logement.
𝒙𝒊 𝒏𝒊 𝒙𝒊 − 𝒙 (𝒙𝒊 − 𝒙)𝟑 𝒏𝒊 (𝒙𝒊 − 𝒙)𝟑 (𝒙𝒊 − 𝒙)𝟒 𝒏𝒊 (𝒙𝒊 − 𝒙)𝟒
1 10 -2,86 -23,3937 -233,9366 66,9059 669,0586

2 15 -1,86 -6,4349 -96,5228 11,9688 179,5325

3 15 -0,86 -0,6361 -9,5408 0,5470 8,2051

4 30 0,14 0,0027 0,0823 0,0004 0,0115

5 10 1,14 1,4815 14,8154 1,6890 16,8896

6 12 2,14 9,8003 117,6041 20,9727 251,6728

7 5 3,14 30,9591 154,7957 97,2117 486,0586

8 3 4,14 70,9579 212,8738 293,7659 881,2977

Total 100 - 82,7372 160,1712 493,0614 2492,7264

116 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Le coefficient d’asymétrie de Fisher (ou skewness) est :

𝜇3 160,1712/100
𝛾= 3= = 0,2878 > 0. D’où la distribution est asymétrique étalée à
𝜎𝑋 1,77213

droite.

Le coefficient d’aplatissement Г de Fisher (ou Kurtosis) est :

𝜇4 2492,7264/100
Г= −3= − 3 = −0,4724 < 0. La distribution est plus aplatie (une
𝜎𝑋4 1,77214

distribution platikurtique) que la distribution normale.

117 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple 2 (le cas d’une variable continue):

On reprend l’exemple de la répartition des salaires de 200 salariés de l’entreprise


Atlas.

𝒙 (le centre
Valeurs du salaire 𝒊
de la classe 𝒏𝒊 𝒙𝒊 − 𝒙 (𝒙𝒊 − 𝒙)𝟑 𝒏𝒊 (𝒙𝒊 − 𝒙)𝟑 (𝒙𝒊 − 𝒙)𝟒 𝒏𝒊 (𝒙𝒊 − 𝒙)𝟒
en milliers de DH
[ei-1; ei[)
4,5 50 -3,9 -59,3190 -2965,9500 231,3441 11567,2050
3≤x<6
7,5 90 -0,9 -0,7290 -65,6100 0,6561 59,0490
6≤x<9
10,5 30 2,1 9,2610 277,8300 19,4481 583,4430
9 ≤ x < 12

12 ≤ x < 15 13,5 15 5,1 132,6510 1989,7650 676,5201 10147,8015

16,5 10 8,1 531,4410 5314,4100 4304,6721 43046,7210


15≤ x < 18

18 ≤ x < 21 19,5 5 11,1 1367,6310 6838,1550 15180,7041 75903,5205

- 200 - 1980,9360 11388,6000 20413,3446 141307,7400


Total

118 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Le coefficient d’asymétrie de Fisher (ou skewness) est :

𝜇3 11388,6/200
𝛾= 3= = 1,1955 > 0. D’où la distribution est asymétrique étalée à
𝜎𝑋 3,6249 3

droite.

Le coefficient d’aplatissement Г de Fisher (ou Kurtosis) est :

𝜇4 141307,74/100
Г= 4 −3= − 3 = 1,0921 > 0. La distribution est moins aplatie (une
𝜎𝑋 3,6249 4

distribution leptokurtique) que la distribution normale.

119 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


120 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Lorsque les observations portent simultanément sur
deux caractères, et lorsqu’elles sont trop nombreuses pour
qu’on les cite une à une, on les présente sous la forme
d’un tableau à double entrée. On définit alors la
distribution conjointe, les distributions marginales et les
distributions conditionnelles. L’étude de la distribution de
deux variables se produit par celle de leur liaison. L’étude
de la liaison entre les variables observées, appelée
communément l’étude des corrélations, dépend de leur
nature.
121 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section1- Distributions statistiques à deux
variables
1- Distribution conjointe
Désignons par X et Y les deux variables qui peuvent être
qualitatives ou quantitatives, et qui peuvent être de même nature.
Les k modalités de X sont désignées par x1, …, xi, …, xk ; les l
modalités de Y sont désignées par y1, … , yj, … , yl. La ième
modalité d’une variable désigne le centre de la ième classe dans le
cas d’une variable quantitative continue.

122 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Tableau- Tableau de contingence : distribution conjointe de
deux variables
Modalité de Y y1 … yj … yl Total
Modalité de X

x1 n11 … n1j … n1l n1.


. . . . . . .
. . . . . . .
. . . . . . .
xi ni1 … nij … nil ni.
. . . . . . .
. . . . . . .
. . . . . . .
xk nk1 … nkj … nkl nk.

Total n.1 … n.j … n.l n


123 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Tableau- Exemple de tableau de contingence : distribution des nombres
d’accidents dans l’année écoulée de 100 assurés selon leurs âges.
Nombre
d’accidents
𝑦1 = 0 𝑦2 = 1 𝑦3 = 2 𝑦4 = 3 𝑦5 = 4 Total
Y

Age X

[18 ; 26[ 𝑛11 = 2 𝑛12 = 6 𝑛13 = 4 𝑛14 = 2 𝑛15 = 1 𝑛1. = 15

[26 ; 34[ 𝑛21 = 5 𝑛22 = 10 𝑛23 = 8 𝑛24 = 1 𝑛25 = 1 𝑛2. = 25

[34 ; 42[ 𝑛31 = 10 𝑛32 = 15 𝑛33 = 4 𝑛34 = 1 𝑛35 = 0 𝑛3. = 30

[42 ; 50[ 𝑛41 = 5 𝑛42 = 3 𝑛43 = 5 𝑛44 = 7 𝑛45 = 0 𝑛4. = 20

[50 ; 58[ 𝑛51 =1 𝑛52 = 2 𝑛53 = 4 𝑛54 = 2 𝑛55 = 1 𝑛5. = 10

Total 𝑛.1 = 23 𝑛.2 = 36 𝑛.3 = 25 𝑛.4 = 13 𝑛.5 = 3 n = 100

124 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


L’effectif nij désigne le nombre de fois où la modalité xi de la
variable X et la modalité yj de la variable Y ont été observées
simultanément.

L’effectif ni. est le nombre total d’observations de la modalité


xi de X, quelle que soit la modalité de Y :

𝑛𝑖. = 𝑛𝑖𝑗
𝑗=1

125 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


De même, l’effectif n.j est le nombre total d’observations
de la modalité yj de Y, quelle que soit la modalité de X :

𝑛.𝑗 = 𝑛𝑖𝑗
𝑖=1

𝑘 𝑙
On a évidemment : 𝑖=1 𝑛𝑖. = 𝑗=1 𝑛.𝑗 =𝑛

126 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


La distribution conjointe peut aussi être définie
par les fréquences :

𝑛𝑖𝑗
𝑓𝑖𝑗 =
𝑛

127 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2- Distributions marginales

Les k couples (xi, ni.) forment la distribution


marginale de la variable X.

Les l couples (yj, n.j) forment la distribution


marginale de la variable Y.

Les distributions marginales peuvent aussi être


données sous forme de fréquences :

𝑛𝑖. 𝑛.𝑗
𝑓𝑖. = et 𝑓.𝑗 =
𝑛 𝑛
128 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple : On reprend l’exemple de distribution des nombres d’accidents (Y) dans
l’année écoulée de 100 assurés selon leurs âges (X).

Les distributions marginales de X et Y sont :


*Pour la variable X « l’âge de l’assuré » :

Valeur de X [18 ; 26[ [26 ; 34[ [34 ; 42[ [42 ; 50[ [50 ; 58[ Total

Effectif 𝑛𝑖. 𝑛1. = 15 𝑛2. = 25 𝑛3. = 30 𝑛4. = 20 𝑛5. = 10 n = 100

Ou encore :

Valeur de X [18 ; 26[ [26 ; 34[ [34 ; 42[ [42 ; 50[ [50 ; 58[ Total

𝑛 𝑖.
Fréquence 𝑓𝑖. = 𝑓1. = 0,15 𝑓2. = 0,25 𝑓3. = 0,3 𝑓4. = 0,2 𝑓5. = 0,1 1
𝑛

129 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Pour la variable Y « le nombre d’accidents dans l’année écoulée » :

Valeur de Y 𝑦1 = 0 𝑦2 = 1 𝑦3 = 2 𝑦4 = 3 𝑦5 = 4 Total
Effectif 𝑛.𝑗 𝑛.1 = 23 𝑛.2 = 36 𝑛.3 = 25 𝑛.4 = 13 𝑛.5 = 3 n = 100
Ou encore :

Valeur de Y 𝑦1 = 0 𝑦2 = 1 𝑦3 = 2 𝑦4 = 3 𝑦5 = 4 Total
𝑛 .𝑗
Fréquence 𝑓.𝑗 = 𝑓.1 = 0,23 𝑓.2 = 0,36 𝑓.3 = 0,25 𝑓.4 = 0,13 𝑓.5 = 0,03 1
𝑛

130 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Lorsque la variable X est quantitative, on peut calculer sa
moyenne marginale 𝑥 et son écart-type marginal 𝜎𝑥 :
𝑘 𝑘
𝑥= 𝑖=1 𝑓𝑖. 𝑥𝑖 et 𝜎𝑥 2 = 𝑖=1 𝑓𝑖. 𝑥𝑖 − 𝑥 2

Lorsque la variable Y est quantitative, on peut calculer


sa moyenne marginale 𝑦 et son écart-type marginal 𝜎𝑦 :

𝑙 𝑙
𝑦= 𝑗=1 𝑓.𝑗 𝑦𝑗 et 𝜎𝑦 2 = 𝑗=1 𝑓.𝑗 𝑦𝑗 − 𝑦 2

131 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple : On reprend l’exemple de distribution des nombres d’accidents (Y) dans
l’année écoulée de 100 assurés selon leurs âges (X).

La moyenne marginale 𝑥, la variance marginale 𝜎𝑥2 et l’écart-type marginal 𝜎𝑥 sont :

𝑘 𝑘
𝑥= 𝑖=1 𝑓𝑖. 𝑥𝑖 = 36,8 𝑎𝑛𝑠 ; 𝜎𝑥2 = 𝑖=1 𝑓𝑖. (𝑥𝑖 − 𝑥)2 = 91,36 𝑎𝑛𝑠 2 et 𝜎𝑥 = 9,5582 𝑎𝑛𝑠

La moyenne marginale 𝑦 , la variance marginale 𝜎𝑦2 et l’écart-type marginal 𝜎𝑦 sont :

𝑙 𝑙
𝑦= 𝑗 =1 𝑓.𝑗 𝑦𝑗 = 1,37 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑠 ; 𝜎𝑦2 = 𝑗=1 𝑓.𝑗 (𝑦𝑗 − 𝑦)2 = 1,1331 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑠 2 ;

et 𝜎𝑦 = 1,0645 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑠

132 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3- Distributions conditionnelles

La distribution de la variable Y, la variable X étant


égale à xi, est appelée distribution conditionnelle de Y
pour X=xi :

Y/X=xi y1 … yj … yl Total
Effectif ni1 … nij … nil ni.

133 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Cette distribution des ni. observations, satisfaisant à la
condition X=xi, est présentée sous la forme de fréquences
conditionnelles :

𝑛𝑖𝑗 𝑙
𝑓𝑗/𝑖 = avec: 𝑗=1 𝑓𝑗/𝑖 =1
𝑛𝑖.

Y/X=xi y1 … yj … yl Total
Fréquence f1/i … fj/i … fl/i 1

134 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


La fréquence fj/i se lit « f indice j si i » (les fréquences

fj/i sont aussi parfois notées 𝑓𝑗𝑖 ), c’est-à-dire fréquence


de yj si X=xi. Il y a k distributions conditionnelles de
Y pour X=xi (i=1, …, k).

Lorsque la variable Y est quantitative, on peut calculer


pour chaque valeur xi sa moyenne conditionnelle 𝑦𝑖 et
son écart-type conditionnel 𝜎𝑖 :
𝑙 𝑙
𝑦𝑖 = 𝑗=1 𝑓𝑗/𝑖 𝑦𝑗 et 𝜎𝑖2 = 𝑗=1 𝑓𝑗/𝑖 𝑦𝑗 − 𝑦𝑖 2

135 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Les k modalités de X induisant une partition des
observations en k sous-groupes, la moyenne 𝑦 peut
s’exprimer comme somme pondérée des k moyennes
𝑦𝑖 :

𝑦= 𝑓𝑖. 𝑦𝑖
𝑖=1

136 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple : On reprend l’exemple de distribution des nombres d’accidents (Y) dans
l’année écoulée de 100 assurés selon leurs âges (X).

La distribution conditionnelle de Y pour 𝑋 = 𝑥2 ∈ [26 ; 34[ est :

Y/ 𝑋 = 𝑥2 ∈ [26 ; 34[ 𝑦1 = 0 𝑦2 = 1 𝑦3 = 2 𝑦4 = 3 𝑦5 = 4 Total


Effectif 𝑛21 = 5 𝑛22 = 10 𝑛23 = 8 𝑛24 = 1 𝑛25 = 1 𝑛2. = 25

Ou encore :

Y/ 𝑋 = 𝑥2 ∈ [26 ; 34[ 𝑦1 = 0 𝑦2 = 1 𝑦3 = 2 𝑦4 = 3 𝑦5 = 4 Total


𝑛 2𝑗
Fréquence 𝑓𝑗 /2 = 𝑓1/2 = 0,2 𝑓2/2 = 0,4 𝑓3/2 = 0,32 𝑓4/2 = 0,04 𝑓5/2 = 0,04 1
𝑛 2.

137 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


La moyenne conditionnelle 𝑦2 (pour chaque valeur 𝑥 ∈
[26 ; 34[) est :
2

𝑙=5

𝑦2 = 𝑓𝑗/2 𝑦𝑗 = 1,32 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑠


𝑗=1

La variance conditionnelle 𝜎22 (pour chaque valeur 𝑥 ∈


[26 ; 34[) est :
2

𝑙=5

𝜎22 = 𝑓𝑗/2 𝑦𝑗 − 𝑦2 2
= 0,9376 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑠 2
𝑗=1

138 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Symétriquement, on a l distributions conditionnelles de X
et on définit les fréquences conditionnelles f indice i si j :

𝑛𝑖𝑗 𝑘
𝑓𝑖/𝑗 = avec: 𝑖=1 𝑓𝑖/𝑗 =1
𝑛.𝑗

X/Y=yi x1 … xi … xk Total
Fréquence f1/j … fi/j … fk/j 1

139 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Lorsque la variable X est quantitative, on peut calculer pour
chaque valeur yj sa moyenne conditionnelle 𝑥𝑗 et son écart-type
conditionnel 𝜎𝑗 :

𝑘
𝑥𝑗 = 𝑖=1 𝑓𝑖/𝑗 𝑥𝑖 et 𝜎𝑗2 = 𝑘
𝑖=1 𝑓𝑖/𝑗 𝑥𝑖 − 𝑥𝑗 2

et on a la relation suivante entre la moyenne 𝑥 et les l moyennes


conditionnelles 𝑥𝑗 :

𝑥= 𝑓.𝑗 𝑥𝑗
𝑗=1

140 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple : On reprend l’exemple de distribution des nombres
d’accidents (Y) dans l’année écoulée de 100 assurés selon leurs âges
(X).
La distribution conditionnelle de X pour 𝑌 = 𝑦3 = 2 accidents est :

X/Y=y3 [18 ; 26[ [26 ; 34[ [34 ; 42[ [42 ; 50[ [50 ; 58[ Total

Effectif 𝑛𝑖3 𝑛13 = 4 𝑛23 = 8 𝑛33 = 4 𝑛43 = 5 𝑛53 = 4 𝑛.3 = 25

Ou encore :

X/Y=y3 [18 ; 26[ [26 ; 34[ [34 ; 42[ [42 ; 50[ [50 ; 58[ Total

Fréquence 𝑛13 𝑛23 𝑛33 𝑛43 𝑛53 1


𝑓1/3 = = 0,16 𝑓2/3 = = 0,32 𝑓3/3 = = 0,16 𝑓4/3 = = 0,2 𝑓5/3 = = 0,16
𝑛𝑖3 𝑛.3 𝑛.3 𝑛.3 𝑛.3 𝑛.3
𝑓𝑖/3 =
𝑛.3

141 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


La moyenne conditionnelle 𝑥3 pour 𝑦3 = 2 accidents est :

𝑥3 = 𝑓𝑖/3 𝑥𝑖 = 37,04 𝑎𝑛𝑠


𝑖=1

La variance conditionnelle 𝜎 2𝑗 est :

𝜎32 = 𝑓𝑖/3 𝑥𝑖 − 𝑥3 2 = 114,2784 𝑎𝑛𝑠 2


𝑖=1

L’écart-type conditionnel 𝜎3 est égal à 10,6901 ans.


142
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 2- La liaison entre deux variables quantitatives

1- Caractéristiques d’un couple de deux variables


statistiques

1-1- Moyenne d’une somme de deux variables statistiques

𝑥+𝑦 =𝑥+𝑦
𝑎𝑥 + 𝑏𝑦 + 𝑐 = 𝑎𝑥 + 𝑏𝑦 + 𝑐 ∀ a, b, c ∈ ℝ

143 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-2- Covariance entre deux variables statistiques

Soient X et Y deux variables quantitatives. La covariance de


X et Y est la quantité :
𝑘 𝑙 𝑘 𝑙

𝑐𝑜𝑣 𝑋, 𝑌 = 𝑓𝑖𝑗 𝑥𝑖 − 𝑥 𝑦𝑗 − 𝑦 = 𝑓𝑖𝑗 𝑥𝑖 𝑦𝑗 − 𝑥 𝑦


𝑖=1 𝑗=1 𝑖=1 𝑗=1

144 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Les propriétés de la covariance sont :

*Cov(X, Y) = Cov(Y, X) ;

*Cov(X, X) = V(X) ;

*V(X+Y) = V(X) + V(Y) + 2 Cov(X, Y) ;

*Cov(aX, Y) = a Cov(X, Y) ;

*Si X et Y sont indépendantes, Cov(X, Y)=0 ; la réciproque est


fausse.

145 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


La covariance permet d’apprécier si les deux variables X et Y
ont tendance à être liées linéairement. L’inconvénient est que son
interprétation est difficile car sa valeur dépend du choix des
unités sur X ou sur Y. Pour cette raison, il est préférable d’utiliser
le coefficient de corrélation linéaire.

146 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-3- Coefficient de corrélation linéaire

Le coefficient de corrélation linéaire entre deux


variables statistiques X et Y est le rapport de leur
covariance par le produit de leurs écarts-types :
𝑐𝑜𝑣 𝑋,𝑌
𝑟 𝑋, 𝑌 = 𝑎𝑣𝑒𝑐 − 1 ≤ 𝑟 𝑋, 𝑌 ≤ 1
𝜎𝑋 𝜎𝑌

147 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*r(X, Y) = r(Y, X);

*Lorsque r(X, Y) < 0, alors la relation linéaire entre X


et Y est négative ;

*Lorsque r(X, Y) > 0, alors la liaison linéaire est


positive ;

*Lorsque r(X, Y) = 0, alors la liaison linéaire est


nulle ; il existe peut être une liaison non linéaire entre
X et Y;
148 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Le coefficient de corrélation linéaire entre deux
variables quantitatives indépendantes est nul, mais la
réciproque n’est pas vraie :

𝑋 𝑒𝑡 𝑌 𝑖𝑛𝑑é𝑝𝑒𝑛𝑑𝑎𝑛𝑡𝑒𝑠 →
↚ 𝑟 𝑋, 𝑌 = 0

149 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2- Ajustement linéaire d’un nuage de points :

Lors d’une étude simultanée de deux variables


quantitatives X et Y sur des individus, on cherche si ces
variables sont liées. X et Y peuvent alors être liées par
une relation fonctionnelle du type y = f(x).

150 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Ces deux variables peuvent être totalement
indépendantes, telles que la taille de l’étudiant et sa
note de statistique, totalement dépendantes telles que
la distance x du rayon d’une sphère et son volume y
4
liées par la relation 𝑦 = 𝜋𝑥 3 , ou partiellement
3

dépendantes telles que certaines variables en économie,


en médecine et pour d’autres sciences.

151 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Indépendance et dépendance fonctionnelle de X et Y

152 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Dépendance partielle de X et Y et ajustements possibles

153 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Pour cette dernière situation, si l’on représente
graphiquement l’ensemble des points (xi, yi) sur un
système d’axe, la forme du nuage de points peut inviter à
ajuster une droite, une parabole, une courbe
exponentielle, etc. Ces courbes peuvent être obtenues
graphiquement ou encore par une méthode algébrique
dont la plus connue s’appelle la méthode des moindres
carrés.

154 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


On observe simultanément les variables
quantitatives X et Y sur n individus, on trace
l’ensemble des points Mi(xi, yi), et on veut ajuster
une droite d’équation y = ax + b qui passe au « plus
près des points Mi ».

155 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


En adoptant la méthode des moindres carrés, les paramètres
a et b de la droite y = ax + b sont :

𝑥𝑖 − 𝑥 𝑦𝑖 − 𝑦 𝑥𝑖 𝑦𝑖 − 𝑛𝑥𝑦
𝑎= =
𝑥𝑖 − 𝑥 2 𝑥𝑖2 − 𝑛𝑥 2

En divisant le numérateur et le dénominateur par n, on


obtient :

𝐶𝑜𝑣 𝑥, 𝑦
𝑎=
𝜎𝑥2

où: 𝑎représente la pente de la droite.


156 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Quant à la constante b, elle s’obtient par la relation :
𝑏 = 𝑦 − 𝑎𝑥 , où 𝑏 représente l’ordonnée à l’origine.

Cette droite est la droite des moindres carrés de y en x


ou encore la droite de régression de y en x.

157 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Remarque : Droite des moindres carrés de x en y : 𝑥 = 𝑎′ 𝑦 + 𝑏′

Cette droite s’obtient en minimisant la somme des carrés des


écarts parallèlement à l’axe des abscisses.

Il suffit d’échanger x et y dans les formules qui donnent a et b


pour obtenir a’ et b’, ainsi la droite a pour équation :
1 𝑏′
𝑥 = 𝑎′ 𝑦 + 𝑏′ ou : 𝑦 = 𝑥 −
𝑎′ 𝑎′
𝐶𝑜𝑣 𝑥,𝑦
𝑎′ = et 𝑏 ′ = 𝑥 − 𝑎′𝑦
𝜎𝑦2

158 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3- Qualité d’ajustement linéaire :

3-1- Le coefficient de détermination 𝒓𝟐

En vue de mesurer la qualité d’ajustement


linéaire on calcule le coefficient de détermination
𝑟 2 , qui est égal au coefficient de corrélation linéaire

𝐶𝑜𝑣 𝑋,𝑌 2
au carré 𝑟 2 = 2 2 . Plus 𝑟 2 est proche de 1
𝜎𝑥 𝜎𝑦

plus la qualité d’ajustement est bonne.

159 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3-2- L’équation de la décomposition de la variation
totale de Y

La somme des carrés totale (SCT) = la somme des carrés expliquée (SCE) + la somme des carrés résiduelle (SCR)

𝑛 𝑛 𝑛

𝑦𝑖 − 𝑦 2 = 𝑦𝑖 − 𝑦 2 + 𝑦𝑖 − 𝑦𝑖 2

𝑖=1 𝑖=1 𝑖=1

où: les 𝑦𝑖 sont les valeurs observées de Y ;

les 𝑦𝑖 sont les valeurs estimées de Y ;

et 𝑦 est la moyenne arithmétique de Y.

160 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


3-3- La quantité (1-𝒓𝟐

La quantité (1-𝑟 2 est égale à la proportion de variation de Y


non expliquée par la droite des moindres carrés.

𝑛 2
𝑖=1 𝑦𝑖 − 𝑦𝑖 𝑆𝐶𝑅
1 − 𝑟2 = 𝑛 2
=
𝑖=1 𝑦𝑖 − 𝑦 𝑆𝐶𝑇

𝑛 2
𝑖=1 𝑦𝑖 − 𝑦𝑖 𝑆𝐶𝑅
𝑟2 =1− 𝑛 2
=1−
𝑖=1 𝑦𝑖 − 𝑦 𝑆𝐶𝑇

161 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


162 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Les indices sont des rapports entre une ou plusieurs
observations d’une même grandeur, ils permettent de supprimer le
problème des unités.

Les indices simples sont notamment utiles dans le calcul des


taux de variation.

Les indices synthétiques permettent de résumer, à l’aide des


moyennes arithmétique, harmonique et géométrique, l’évolution
d’un agrégat de grandeurs économiques.

Les coefficients de concentration ont pour objet la saisie des


déformations des distributions se traduisant par un regroupement
des individus dans une ou plusieurs classes.
163 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 1- Indices simples ou élémentaires

Soit G une grandeur économique qui varie dans le temps et qui prend les
valeurs : 𝐺0 , …, 𝐺𝑡 , …, 𝐺𝑇 aux dates tϵ{0 ;1 ;… ;T} .

1- définition :

On appelle indice simple ou élémentaire, la grandeur simple définie par le


𝐺𝑡
rapport suivant 𝐼𝑡/0 = avec tϵ{0 ;1 ;… ;T} où t=0 est la date de référence ou
𝐺0

époque de base et où t est la date courante.

Nous pouvons également exprimer les indices en % :

𝐺𝑡
𝐼𝑡/0 % = 𝑥 100 avec tϵ{0 ;1 ;… ;T}.
𝐺0

164 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2- Propriétés des indices simples :

2-1- La circularité :

𝐺𝑡 𝐺𝑡′ 𝐺𝑡
𝐼𝑡/0 = 𝐼𝑡/𝑡′ 𝐼𝑡′/0 = = avec t ϵ {0 ;1 ;… ;T} et t’ ϵ {0 ;1 ;… ;T}.
𝐺𝑡′ 𝐺0 𝐺0

2-2- La réversibilité :

1 1
𝐼𝑡/0 = = avec t ϵ {0 ; 1 ; … ; T}
𝐼0/𝑡 𝐺0
𝐺𝑡
2-3- L’enchainement :

𝐺𝑡 𝐺𝑡−1 𝐺1 𝐺𝑡
𝐼𝑡/0 = 𝐼𝑡/𝑡−1 𝐼𝑡−1/𝑡−2 𝑥 … 𝑥 𝐼1/0 = 𝑥…𝑥 =
𝐺𝑡−1 𝐺𝑡−2 𝐺0 𝐺0

165 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Exemple :

Depuis 2005, Monsieur Madani déjeune tous les premiers samedis du mois d’avril
dans un restaurant. Son menu est composé d’une salade verte, du poisson, d’une portion de
fromage, d’une glace à la vanille et il boit de limonade. Le même repas lui a été servi chaque
année avec quelques modifications sur les quantités qu’il consomme :

Tableau de données pour indice synthétique

2005 2010 2015

Quantité en Prix en Quantités en Prix en euros Quantités en Prix en


grammes dirhams par grammes par kg grammes dirhams par
kg kg

Salade verte 120 20 150 26 160 31

Poisson 300 70 200 100 180 120

Fromage 50 8 60 10 80 12

Glace à la 40 20 60 25 70 30
vanille

Bouteille de 1 10 1 13 1 15
limonade

166 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Calculer les indices élémentaires de prix de chacun des
éléments du repas de Monsieur Madani, base 1 en 2005.

Tableau-Indices simples base 1 en 2005

Indices élémentaires Indices élémentaires


𝑮 𝑮𝟐𝟎𝟏𝟓
𝑰𝟐𝟎𝟏𝟎/𝟐𝟎𝟎𝟓 = 𝟐𝟎𝟏𝟎 𝑰𝟐𝟎𝟏𝟓/𝟐𝟎𝟎𝟓 =
𝑮𝟐𝟎𝟎𝟓 𝑮𝟐𝟎𝟎𝟓

Salade verte 1,3 1,55


Poisson 1,43 1,71
Fromage 1,25 1,5

Glace à la vanille 1,25 1,5

Bouteille de
1,3 1,5
limonade

167 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*En utilisant les propriétés des indices élémentaires, calculer
pour les éléments du repas de Monsieur Madani les indices
élémentaires de prix I2005/2010 et I2005/2015 sauf pour la limonade.

Indices élémentaires Indices élémentaires


1 1
𝐼2005/2010 = 𝐼 𝐼2005/2015 =
2010 /2005 𝐼2015/2005
Salade verte 0,77 0,65
Poisson 0,70 0,58
Fromage 0,80 0,67
Glace à la vanille 0,80 0,67

168 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


*Calculer l’indice I2010/2015 pour la limonade en utilisant les indices
I2010/2005 et I2005/2015.

Selon la propriété de la circularité : 𝐼2010/2015 = 𝐼2010/2005 𝑥 𝐼2005/2015


1 1 1 1
Où : 𝐼2005/2010 = 𝐼 = 1,3 = 0,77 et 𝐼2005/2015 = 𝐼 = 1,5 = 0,67
2010/2005 2015/2005

D’où : 𝐼2010/2015 = 𝐼2010/2005 𝑥 𝐼2005/2015 = 1,3 𝑥 0,67 = 0,87

169 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Section 2- Indices synthétiques
1- Indices des prix

Pour un article i, le prix est noté 𝑝𝑖 et les quantités achetées


de ce même article sont notées 𝑞 𝑖 . Les dépenses pour l’année de
base et pour l’année courante sont 𝑑0𝑖 = 𝑝0𝑖 𝑞0𝑖 et 𝑑𝑡𝑖 = 𝑝𝑡𝑖 𝑞𝑡𝑖
respectivement. Les coefficients budgétaires de l’article i
mesurent la part de la dépense totale consacrée à cet article aux
dates 0 (époque de base) et t (époque courante) :

𝑝0𝑖 𝑞0𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖 𝑛 𝑛


𝑤0𝑖 = 𝑛 𝑝𝑖 𝑞 𝑖 et 𝑤𝑡𝑖 = 𝑛 𝑝𝑖 𝑞 𝑖 avec 𝑤
𝑖=1 0
𝑖
= 𝑤
𝑖=1 𝑡
𝑖
=1
𝑖=1 0 0 𝑖=1 𝑡 𝑡
170
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-1- Indice de Laspeyres des prix:

L’indice de Laspeyres des prix est la moyenne arithmétique pondérée des

𝑖 𝑝𝑡𝑖 𝑝0𝑖 𝑞0𝑖


indices élémentaires de prix 𝐼𝑡/0 = , la pondération utilisée 𝑤0𝑖 = 𝑛 𝑝𝑖 𝑞 𝑖
𝑝0𝑖 𝑖=1 0 0

étant celle de l’époque de base :

𝑛 𝑖 𝑖 𝑝𝑡𝑖
𝑛 𝑖=1 𝑝0 𝑞0 𝑛 𝑖 𝑖
𝑝 𝑖 𝑝0𝑖 𝑖=1 𝑡 𝑞0
𝑝
𝐿𝑡/0 = 𝑤0𝑖 𝐼𝑡/0 = 𝑛 𝑖 𝑖
= 𝑛 𝑖 𝑖
𝑖=1 𝑖=1 𝑝0 𝑞0 𝑖=1 𝑝0 𝑞0

𝑝 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 "𝑡"


𝐿𝑡/0 =
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 "0"

171 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


1-2- Indice de Paasche des prix :

L’indice de Paasche des prix est la moyenne harmonique pondérée des

𝑖 1 𝑝0𝑖
indices élémentaires des prix 𝐼0/𝑡 = = , la pondération utilisée
𝑝𝑖𝑡 𝑝𝑡𝑖
𝑝𝑖0

𝑝𝑡𝑖 𝑞𝑡𝑖
𝑤𝑡𝑖 = 𝑛 𝑝𝑖 𝑞 𝑖 étant celle de l’époque courante :
𝑖=1 𝑡 𝑡

𝑛 𝑖 𝑖 𝑛 𝑖 𝑖
𝑝 1 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖=1 𝑝𝑡 𝑞𝑡
𝑃𝑡/0 = 𝑛 𝑖 𝑖
= 𝑖
= 𝑛 𝑖 𝑖
𝑖=1 𝑤𝑡 𝐼0/𝑡 𝑛 𝑖 𝑖 𝑝0 𝑖=1 𝑝0 𝑞𝑡
𝑖=1 𝑝𝑡 𝑞𝑡 𝑖
𝑝𝑡

𝑝 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "𝑡" 𝑎𝑢 𝑝𝑟𝑖𝑥 "𝑡"


𝑃𝑡/0 =
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑑𝑒 "t" 𝑎𝑢 𝑝𝑟𝑖𝑥 "0"
172 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-3- Indice de Fisher des prix :

L’indice de Fisher des prix est la moyenne géométrique simple des indices
de prix de Laspeyres et de Paasche :

𝑛 𝑖 𝑖 𝑛 𝑖 𝑖
𝑝 𝑝 𝑝 𝑖=1 𝑝𝑡 𝑞0 𝑖=1 𝑝𝑡 𝑞𝑡
𝐹𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0 = 𝑛 𝑖 𝑖 𝑛 𝑖 𝑖
𝑖=1 𝑝0 𝑞0 𝑖=1 𝑝0 𝑞𝑡

173 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


2- Indices des quantités :

2-1- Indices de Laspeyres des quantités :

L’indice de Laspeyres des quantités est la moyenne arithmétique pondérée

𝑖 𝑞𝑡𝑖
des indices élémentaires des quantités 𝐼𝑡/0 = , la pondération utilisée
𝑞0𝑖

𝑝0𝑖 𝑞0𝑖
𝑤0𝑖 = 𝑛 𝑝𝑖 𝑞 𝑖 étant celle de l’époque de base :
𝑖=1 0 0

𝑛 𝑖 𝑖 𝑞𝑡𝑖
𝑛 𝑖=1 𝑝0 𝑞0 𝑛 𝑖 𝑖
𝑞 𝑖 𝑞0𝑖 𝑖=1 𝑝0 𝑞𝑡
𝐿𝑡/0 = 𝑤0𝑖 𝐼𝑡/0 = 𝑛 𝑖 𝑖
= 𝑛 𝑖 𝑖
𝑖=1 𝑖=1 𝑝0 𝑞0 𝑖=1 𝑝0 𝑞0

𝑞 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "𝑡" au prix 𝑑𝑒 "0"


𝐿𝑡/0 =
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "0" 𝑎𝑢 𝑝𝑟𝑖𝑥 𝑑𝑒 "0"
174 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
2-2- Indice de Paasche des quantités :

L’indice de Paasche des quantités est la moyenne harmonique pondérée des

𝑖 1 𝑞0𝑖
indices élémentaires des quantités 𝐼0/𝑡 = = , la pondération utilisée
𝑞𝑖𝑡 𝑞𝑡𝑖
𝑞𝑖0

𝑝𝑡𝑖 𝑞𝑡𝑖
𝑤𝑡𝑖 = 𝑛 𝑝𝑖 𝑞 𝑖 étant celle de l’époque courante :
𝑖=1 𝑡 𝑡

𝑛 𝑖 𝑖 𝑛 𝑖 𝑖
𝑞 1 𝑖=1 𝑝𝑡 𝑞𝑡 𝑖=1 𝑝𝑡 𝑞𝑡
𝑃𝑡/0 = 𝑛 𝑖 𝑖
= 𝑖
= 𝑛 𝑖 𝑖
𝑖=1 𝑤𝑡 𝐼0/𝑡 𝑛 𝑖 𝑖 𝑞0 𝑖=1 𝑝𝑡 𝑞0
𝑖=1 𝑝𝑡 𝑞𝑡 𝑖
𝑞𝑡

𝑞 𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "𝑡" 𝑎𝑢 𝑝𝑟𝑖𝑥 𝑑𝑒 "𝑡"


𝑃𝑡/0 =
𝑉𝑎𝑙𝑒𝑢𝑟 𝑑𝑒𝑠 𝑞𝑢𝑎𝑛𝑡𝑖𝑡é𝑠 𝑒𝑛 "0" au prix de "𝑡"
175 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
3- L’indice de dépense et la réversibilité selon les facteurs

Pour un article i, le prix est noté 𝑝𝑖 et les quantités achetées de ce même


article sont notées 𝑞𝑖 . Les dépenses pour l’année de base et pour l’année courante
sont : 𝑑0𝑖 = 𝑝0𝑖 𝑞0𝑖 et 𝑑𝑡𝑖 = 𝑝𝑡𝑖 𝑞𝑡𝑖 respectivement. On définit l’indice de dépense
𝐷𝑡/0 de l’année courante t à la date de référence 0 :

𝑛 𝑖 𝑖 𝑛 𝑖
𝑖=1 𝑝𝑡 𝑞𝑡 𝑖=1 𝑑𝑡
𝐷𝑡/0 = 𝑛 𝑖 𝑖
= 𝑛 𝑖
𝑖=1 𝑝0 𝑞0 𝑖=1 𝑑0

On peut démontrer l’égalité suivante, connue sous le nom de réversibilité selon


les facteurs :

𝑝 𝑞 𝑞 𝑝
𝐷𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0 = 𝐿𝑡/0 𝑃𝑡/0

176 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Application :
On reprend l’exemple de l’application ci-dessus de
Monsieur Madani de la première section.

*Calculer l’indice des prix du repas de Monsieur


Madani, pour les années 2010 (notée 1) et 2015 (notée
2) base 1 en 2005 (notée 0), en employant les
constructions des indices de Laspeyres et de Paasche.

177 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Tableaux de données pour les indices synthétiques
p0 q0 p1 q1 p2 q2
Salade verte 20 0,12 26 0,15 31 0,16
Poisson 70 0,3 100 0,2 120 0,18
Fromage 8 0,05 10 0,06 12 0,08
Glace à la
20 0,04 25 0,06 30 0,07
vanille
Bouteille de
10 1 13 1 15 1
limonade

p0q0 p1q0 p2q0 p1q1 p0q1 p2q2 p0q2


Salade verte 2,4 3,12 3,72 3,9 3 4,96 3,2
Poisson 21 30 36 20 14 21,6 12,6
Fromage 0,4 0,5 0,6 0,6 0,48 0,96 0,64

Glace à la vanille 0,8 1 1,2 1,5 1,2 2,1 1,4

Bouteille de limonade 10 13 15 13 10 15 10
Total 34,6 47,62 56,52 39 28,68 44,62 27,84

178 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Indices synthétiques des prix de Laspeyres :

-Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) :


5 𝑖 𝑖
𝑝 𝑖=1 𝑝1 𝑞0 47,62
𝐿1/0 = 5 𝑖 𝑖
= = 1,3763 (𝑜𝑢 137,63 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
𝑖=1 0 𝑞0
𝑝 34,6

-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) :


5 𝑖 𝑖
𝑖=1 2 𝑞0
𝑝 56,52
𝐿𝑝2/0 = 5 𝑖 𝑖
= = 1,6335 (𝑜𝑢 163,35 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
𝑖=1 0 𝑞0
𝑝 34,6

179 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Indices synthétiques des prix de Paasche :

-Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) :


5 𝑖 𝑖
𝑝 𝑖=1 𝑝1 𝑞1 39
𝑃1/0 = =
5 𝑖 𝑖 28,68
= 1,3598 (𝑜𝑢 135,98 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
𝑖=1 𝑝0 𝑞1

-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) :


5 𝑖 𝑖
𝑝 𝑖=1 𝑝2 𝑞2 44,62
𝑃2/0 = =
5 𝑖 𝑖 27,84
= 1,6027 (𝑜𝑢 160,27 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
𝑖=1 𝑝0 𝑞2

180 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Indices de Fisher des prix :

-Pour l’année 2010 (notée 1) base 1 en 2005 (notée 0) :

5 𝑖 𝑖 5 𝑖 𝑖
𝑝 𝑝 𝑝 𝑖=1 1 𝑞0
𝑝 𝑖=1 1 𝑞1
𝑝
𝐹1/0 = 𝐿1/0 𝑃1/0 = 5 𝑖 𝑖 5 𝑖 𝑖
= 1,3763 𝑥 1,3598 = 1,368 (𝑜𝑢 136,8 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
𝑖=1 𝑝0 𝑞0 𝑖=1 𝑝0 𝑞1

-Pour l’année 2015 (notée 2) base 1 en 2005 (notée 0) :

5 𝑖 𝑖 5 𝑖 𝑖
𝑝 𝑝 𝑝 𝑖=1 2 𝑞0
𝑝 𝑖=1 2 𝑞2
𝑝
𝐹2/0 = 𝐿2/0 𝑃2/0 = 5 𝑖 𝑖 5 𝑖 𝑖
= 1,6335 𝑥 1,6027 = 1,618 (𝑜𝑢 161,8 𝑒𝑛 𝑏𝑎𝑠𝑒 100)
𝑖=1 𝑝0 𝑞0 𝑖=1 𝑝0 𝑞2

181 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès


Références bibliographiques

BOURBONNAIS, (Régis), Econométrie, 7ème édition DUNOD,


Janvier 2009.
GOLDFARB (Bernard) et PARDOUX (Catherine), Introduction à la
méthode statistique, Gestion-Economie, Edition DUNOD, 2000.
LECOUTRE (Jean-Pierre), Statistique et probabilités, Cours et exercices
corrigés, Edition DUNOD, 2012.
LETHIELLEUX (Maurice), Exercices de statistiques et probabilités avec
rappels de cours en 12 fiches, Edition DUNOD, 2009.
MONINO (Jean-Louis), KOSIANSKI (Jean-Michel), et LE CORNU
(François), TD Statistique descriptive, Édition DUNOD, 2010.
PUPION (Pierre-Charles), Statistique pour la gestion, Edition DUNOD,
2008.

182 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Vous aimerez peut-être aussi