Vous êtes sur la page 1sur 74

Univérsité Mohamed Premier

Faculté Pluridisciplinaire
FPN-Nador

Statistique descriptive

Professeur : B. GANBOURI

Filière : Economie et Gestion


Année universitaire : 20 20-2021
2018-2019

Département de l’Economie et Gestion - Faculté Pluridisciplinaire de Nador -


B.P 300,Selouane 62700 Nador - fpn@ump.ac.ma
2
Table des matières

1 Introduction générale à la statistique 5


1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Terminologie de base . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2.2 Variable statistique . . . . . . . . . . . . . . . . . . . . 7
1.2.3 Typologie des variables . . . . . . . . . . . . . . . . . . 8
1.2.4 Données statistiques . . . . . . . . . . . . . . . . . . . 9
1.3 Notations et symboles . . . . . . . . . . . . . . . . . . . . . . 9
1.3.1 Notations indicées . . . . . . . . . . . . . . . . . . . . 9
1.3.2 Le symbole de somme «sigma» . . . . . . . . . . . . . 9
1.3.3 Le symbole de produit «Pi» . . . . . . . . . . . . . . . 10
1.3.4 Série statistique . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2 Statistique descriptive univariée 15


2.1 Cas d’une variable quantitative discrète . . . . . . . . . . . . . 15
2.1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . 15
2.1.2 Tableau statistique . . . . . . . . . . . . . . . . . . . . 18
2.1.3 Représentations garphiques . . . . . . . . . . . . . . . 19
2.1.4 Notion de quantile et application . . . . . . . . . . . . 22
2.1.5 Paramètre de position : Mode, Mediane, Moyenne . . . 24
2.1.6 Paramètres de dispersion . . . . . . . . . . . . . . . . . 27
2.1.7 Paramètres de forme . . . . . . . . . . . . . . . . . . . 29
2.1.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Cas d’une variable quantitative continue . . . . . . . . . . . . 33
2.2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . 33
2.2.2 Tableau statistique . . . . . . . . . . . . . . . . . . . . 34
2.2.3 Représentations graphiques . . . . . . . . . . . . . . . 35
2.2.4 Les quantiles . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.5 Paramètres de position . . . . . . . . . . . . . . . . . . 38
2.2.6 Paramètres de dispersion . . . . . . . . . . . . . . . . . 40

3
4 TABLE DES MATIÈRES

2.2.7 Paramètres de forme . . . . . . . . . . . . . . . . . . . 41


2.3 Cas d’une varaible qualitative . . . . . . . . . . . . . . . . . . 41
2.3.1 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . 46

3 Statistique descriptive bivariée 47


3.1 Deux variables quantitatives . . . . . . . . . . . . . . . . . . . 47
3.1.1 Organisation des données . . . . . . . . . . . . . . . . . 48
3.1.2 Caractéristiques numériques . . . . . . . . . . . . . . . 54
3.1.3 Relations statistiques . . . . . . . . . . . . . . . . . . . 56
3.1.4 Représentation graphique : le nuage de points . . . . . 58
3.1.5 Régression linéaire . . . . . . . . . . . . . . . . . . . . 59
3.2 Une variable quantitative et une qualitative . . . . . . . . . . 61
3.2.1 Les données . . . . . . . . . . . . . . . . . . . . . . . . 61
3.2.2 Représentation graphique . . . . . . . . . . . . . . . . 62
3.2.3 Liaison entre variable quantitative et variable qualitative 64

4 Taux et indices 67
4.1 Calcul du taux . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4.1.1 Le taux d’évolution et coefficients multiplicateurs . . . 67
4.1.2 Évolutions successives . . . . . . . . . . . . . . . . . . 68
4.1.3 Taux d’évolution moyen . . . . . . . . . . . . . . . . . 68
4.1.4 Taux d’évolution d’un produit et d’un rapport . . . . . 68
4.2 Indices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.2.1 Indices élémentaires . . . . . . . . . . . . . . . . . . . . 69
4.2.2 Indices synthétiques . . . . . . . . . . . . . . . . . . . 71
Chapitre 1

Introduction générale à la
statistique

On commence par donner une définition générale à la statistique. On


précise ensuite la différence entre la statistique descriptive, qui fait l’objet de
ce cours, et la statistique inférentielle qu’on ne traite pas ici. On termine
ce chapitre par la définition des termes qui font le langage de la suite de ce
cours.

1.1 Définition
On appelle statistique l’ensemble des méthodes et techniques permettant
d’analyser (on dira plutot de traiter) des ensembles d’observations.

Les méthodes en question, dites méthodes statistiques, relèvent es-


sentiellement des mathématiques et font appel à l’outil informatique. Ces
méthodes permettent de passer de la donnée à la connaissance. Elles portent
sur le traitement, l’analyse et la transmission :

• Identifier le problème.

• Collecter les données.

• Classer et synthétiser les données.

• Présenter les données.

• Analyser les données.

5
6 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE

• Interpréter les résultats obtenus afin de de prendre la meilleure décision.


La statistique est divisée aujourd’huit en deux parties :
1. La statistique descriptive : est l’ensemble des méthodes dont l’objectif
est la description des données étudiées à travers :

• Leur présentation numérique la plus commode possible.


• Leur présentation graphique.
• Le calcul de caractéristiques numériques.
2. La statistique inférentielle (ou mathématique) : on désigne par ce terme,
les méthodes dont l’objectif principal est de formuler des lois sur une
population globale, à partir de ses observations sur une partie restreinte
de cette population.

On note que cette partie de la statistique n’est pas traitée dans ce cours.

1.2 Terminologie de base


1.2.1 Vocabulaire
On précise ici des termes statistiques très courants et qui seront utilisés
par la suite :
Population : ensemble concerné par une étude statistique. On parle aussi
de champs de l’étude.

• L’ensemble des entreprises au maroc.

• Les étudiants de moins de 22 ans à la faculté pluridisciplinaire de Nador.

• L’ensemble des logements de la ville de Nador.

Individu (ou unité statistique) : tout élément de la population consi-


dérée. On parle aussi de unité statistique.

• Une entreprises au maroc.

• Un étudiant de moins de 22 ans à la faculté pluridisciplinaire de Nador.

• Un logement sur la ville de Nador.


1.2. TERMINOLOGIE DE BASE 7

Echantillon : tout sous-ensemble de la population.

• Les entreprises de la région Est du maroc.

• Les étudiants de moins de 22 ans du S.E.G.

• Les logements du quartier Elmatar.

Taille de l’échantillon : le cardinale de l’échantillon = : le nombre d’in-


dividus qu’il contient.

échantillon de taille 200, de taille 1000.......

En général, on note par n la taille de l’échantillon considéré.

Enquête : c’est l’opération consistant a observer, ou mesurer, ou ques-


tionner..., l’ensemble des individus d’un échantillon (ou de la population com-
plète).

Recensement : enquête dans laquelle l’échantillon observé est en fait la


populaion tout entière. On dira aussi : enquête exhaustive

Au maroc, on organise, de façon plus ou moins régulière, le recensement


général de la populaion.

Sondage : c’est une enquête dans laquelle l’échantillon observé est un


sous-ensemble strict de la populaion. Il est dit aussi : enquête non exhaus-
tive

1.2.2 Variable statistique


On appelle variable (statistique) une caractéristique observée ou mesurée
sur les individus d’une population. On parlera aussi de caractère statistique.

Couleur, nationalité, taille, poids, salaire, sexe, âge......

Valeurs ou modalités : sont les valeurs prisent par la variable.


8 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE

1.2.3 Typologie des variables


On distingue deux types de variables :

1. Variable quantitative : est celle qui prend des valeurs ou modalités


numériques.

Salaire, âge, nombre d’enfants par ménage......

Il existent deux types de variables quantitatives :

• Discrète : c’est une variable quantitative ne prenant que des va-


leurs entières (plus rarement décimales). le nombre de valeurs
d’une telle variable est habituellement assez faible.

nombre d’enfants par ménage, nombre d’années d’études après le bac,....

• Continue : c’est une variable quantitative dont les modalités qui


lui sont associées ne sont pas des valeurs numériques précises, mais
des intervalles dans R appelés classes.

salaire, âge....

2. Variable qualitative : est celle dont ses modalités ne sont pas numé-
riques ou bien, ne sont pas mesurables.

Sexe, couleur, nationalité, socioprofessionelle,....

Il existent deux types de variables qualitatives :

• Ordinale : La variable est dite qualitative ordinale quand les mo-


dalités peuvent être ordonnées.
Mention au bac, taille d’un vêtement ....

• Nominale : La variable est dite qualitative nominale quand les


modalités ne peuvent pas être ordonnées.

Sexe, secteurs d’activités, état civil....


1.3. NOTATIONS ET SYMBOLES 9

1.2.4 Données statistiques


On appelle données statistiques l’ensemble des individus observés, l’en-
semble des variables étudiées et les modalités possibles de ces variables.

En général, les données statistiques sont représentées sous forme de ta-


bleau.

1.3 Notations et symboles


1.3.1 Notations indicées
Par simplicité, on notera une variable statistique par une lettre : X, Y, Z....

Soit X une variable observée sur les individus d’une population, (ou
échantillon), de taille n. Il est indispensable de pouvoir présenter symbo-
liquement la valeur de la variable X correspondant à chacun des n individus
étudiés.

On distingue par la valeur de la variable X relative à l’individu i. La


lettre i est appelée indice.
Cette indice peut prendre n’importe laquelle des valeurs :

1, 2, 3, ....., j − 1, j, j + 1....., n,

auxquelles correspondent, respectivement, les valeurs :

x1 , x2 , x3 , ....., xj−1 , xj , xj+1 , ....., xn .

La notation xj−1 < xj se lit xj−1 précède xj et xj+1 > xj se lit xj+1 suit
xj .

1.3.2 Le symbole de somme «sigma»


Pour raccourcir une écriture comporte la somme des valeurs xi d’une
P
variable X, on utilise le symbole . Ainsi, au lieu d’écrire

x1 + x2 + x3 + ..... + xn ,
Pi=n
il est plus commode d’écrire i=1 xi , qui est par définition :
i=n
X
xi = x1 + x2 + x3 + ...... + xn .
i=1
10 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE

On peut écrire aussi :


i=n
X n
X n
X
xi = xi = xi .
i=1 i=1 1

Propriétés

n
X n
X n
X
(xi + yi ) = xi + yi .
i=1 i=1 i=1

Pour tout nombre réel constant a, on a :


n n n
!
X X X
axi = a xi , et a = na.
i=1 i=1 i=1

1.3.3 Le symbole de produit «Pi»


Pour raccourcir une écriture comporte le produit des valeurs xi d’une
Q
variable X, on utilise le symbole . Ainsi, au lieu d’écrire

x1 × x2 × x3 × ..... × xn ,
Qn
il est plus commode d’écrire i=1 xi , qui est par définition :
n
Y
xi = x1 × x2 × x3 × ..... × xn .
i=1

Propriété

Pour tout nombre réel constant a, on a :


n n
!
n
Y Y
axi = a xi
i=1 i=1

1.3.4 Série statistique


On appelle série statistique, la suite des valeurs prises par une variable X
sur les unités d’observations.
Le nombre d’unités d’observation est noté n.
Les valeurs de la variable X sont notées :

x1 , x2 , ......., xn .
1.3. NOTATIONS ET SYMBOLES 11

• Dans le cas où les modalités peuvent être ordonnées, on peut présenter


la série statistique dans l’ordre naturel en notant :

x(1) , x(2) , x(3) , ....., x(n) .

Une telle série est dite série ordonnée. Par exemple, la série ordonnée
de la série suivante :

0 1 1 0 3 4 0 4 2 4 3 2 2 0,

est :

0 0 0 0 1 1 2 2 2 3 3 4 4 4.

• Une série statistique relative à une seule variable est dite série statis-
tique simple.

Exemples
Exemple 1.1
Après une enquête réalisée auprès de 20 étudiants sur leurs ”mention” au
bac, on a obtenu les résultats suivants :

P P B AB AB AB TB P B AB
E P B B E P P AB AB B

On note, P : Passable, AB : Assez-bien, B : bien, TB : Très-bien, E :


Excellent.

Remarque : On peut donner les codes suivants :

P = 0, AB = 1, B = 2, T B = 3, E = 4.

• Population : 20 étudiants.

• Unité statistique : un étudiant.

• Variable : mention au bac (on la note par X).

• Type de variable : qualitative ordinale.

• Série statistique : ici, on a : n = 20 et la série statistique est :

x1 = P, x2 = P, x3 = B, x4 = AB, x5 = AB, ....., x20 = B.


12 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE

Exemple 1.2
Parmi tous les employée d’une entreprise, on interroge sept employés sur leur
sexe, leur âge et leur revenu mensuel net. La codification a été faite selon le
tableau suivant :

sexe age revenu mensuel net (DH)


employée 1 1 43 4600
employée 2 1 34 3785
employé 3 2 38 3950
employé 4 2 53 5200
employé 5 2 29 3325
employée 6 1 31 3890
employé 7 2 40 4159

Remarque : On code 1 les femmes et 2 les hommes.

• Population : les employés de l’entreprise.

• Echantillon : sept employés.

• Individu : un employé.

• Variable : ici, on a trois variables : X= : sexe, Y= : âge et Z= : revenu


mensuel net.

• Type de variable : X : qualitative nominale, Y : quantitative discrète,


Z : quantitative discrète.

• Série statistique : Pour :

X: 1 1 2 2 2 1 2
 Y : 43 34 38 53 29 31 40
 Z : 4600 3785 3950 5200 3325 3890 4159

1.4 Exercices
Exercice 1.1
- Pour chacune des variables suivantes, préciser si elle est qualitative, quan-
titative discrète ou quantitative continue :
1.4. EXERCICES 13

(a) Revenu annuel (b) Citoyenneté. c) Distance


(d) Taille (e) Lieu de résidence (f) Âge
(g) Couleur des yeux (h) Nombre de langues parlées
Exercice 1.2
Pour les sujets d’étude qui suivent, spécifie : l’unité statistique, la variable
statistique et son type :

1. Étude du temps de validité des lampes électriques.


2. Étude de l’absentéisme des ouvriers, en jours, dans une usine.
3. Répartition des étudiants d’une promotion selon la mention obtenue
sur le diplôme du Bac.

Exercice 1.3
Proposer des exemples de variable quantitative transformée en variable
qualitative. Préciser les modalités de cette dernière.
14 CHAPITRE 1. INTRODUCTION GÉNÉRALE À LA STATISTIQUE
Chapitre 2

Statistique descriptive
univariée

2.1 Cas d’une variable quantitative discrète


2.1.1 Introduction
On considère ici une variable quantitative discrète unique, notée X. L’ob-
jectif de ce paragraphe est d’étudier cette variable en suivant ces trois étapes :

• Présenter les données dans un tableau (statistique).

• Représenter les données graphiquement.

• Donner les principales caractéristiques numériques.

Exemple 2.1
Le gérant d’un magasin vendant des ordinateurs a relevé le nombre d’or-
dinateurs vendus par jour. Son relevé a porté sur les ventes au cours des 50
jours de l’été. Le relevé des observations est listée ci-dessous :

7 13 8 10 6 12 10 8 6 10
6 14 7 15 9 11 12 11 12 5
14 10 8 10 14 12 8 5 7 13
12 16 11 6 10 10 12 12 15 14
5 14 9 6 13 11 10 11 12 15

• La population est les 50 jours.

15
16 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

• La variable étudiée ici est X =nombre d’ordinateurs vendus par jour.

• Le nombre total des valeurs prisent par X est n = 50

Les observations ci-dessus ne sont pas présentées de façon commode.


Ainsi :

• Il y a des valeurs de la variable X qui sont répliquées plus qu’une fois,


par exemple la valeur 5 apparait dans la list 3 fois.

• On s’intéresse aux valeurs distinctes de X et on les range par ordre


croissant.

• Les valeurs distinctes de la variable X rangées par ordre croissant sont :

5 6 7 8 9 10 11 12 13 14 15 16

qu’on les note, respectivement par :

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 ,

ou par : {xi ; i = 1, 2, ....., J}, avec J est le nombre total des valeurs
distinctes de la variable X, (ici, J = 12).

• La valeur x1 = 5 apparait dans la liste précédente 3 fois, on dit que


l’effectif associé à x1 est 3 et on écrit : n1 = 3. Ainsi, n2 = 5, n3 =
3, n4 = 4, ......n12 = 1

• Les effectifs peuvent être remplacés par des quantités appellées fré-
quences et qui sont exprimées par :fi = nni . Celles-ci, souvent expri-
mées en pourcentages en les multipliant par 100 : pi = 100 × fi .
3
Pour x1 ona n1 = 3, f1 = 50
= 0, 06
et p1 = 100 × f1 = 6%.

Remarque : Le nombre total des valeurs prisent par X est égal à la


sommes des effectifs :
i=12
X
n = n1 + n2 + n3 + .... + n17 + n12 = ni .
i=1
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 17

• On peut calculer les effectifs cumulés et les fréquences cumulées,


quantités exprimées respectivement par :
j=i
X j=i
X
Ni = nj , Fi = fj .
j=1 j=1

Pour x3 , on a :
j=3
X
N3 = nj = n1 + n2 + n3 = 3 + 5 + 3 = 11
j=1

j=3
X
F3 = fj = f1 + f2 + f3 = 0, 06 + 0, 1 + 0, 06 = 0, 22
j=1

• Maintenant, on peut présenter les données de la liste précedente de fa-


çon plus commode en les représentant dans un tableau, appelé tableau
statistique, dont la première colonne comprte l’ensemble des valeurs
distinctes de la variable X rangées par ordre croissant. Dans la seconde
colonne, on dispose, en face de chaque valeur xi l’effectif associé ni et
on rajoute dans la troisème colonne soit les effectifs cumulé, soit les
fréquences cumulées :
Il est conseillé à l’étudiant de reprendre les calculs pour bien en comprendre
le principe.
18 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

xi ni Ni fi (%) Fi (%)
5 3 3 6 6
6 5 8 10 16
7 3 11 6 22
8 4 15 8 30
9 2 17 4 34
10 8 25 16 50
11 5 30 10 60
12 8 38 16 76
13 3 41 6 82
14 5 46 10 92
15 3 49 6 98
16 1 50 2 100
Total 50 - 100 -

Table 2.1 – Tableau statistique des valeurs observées de l’Exemple 2.1

2.1.2 Tableau statistique


On considère ici une variable quantitative discrète X. Soient x1 , x2 , ......, xJ ,
les valeurs distinctes de X.
Ces valeurs peuvent être ordonnées :

x1 < x2 < x3 < ...... < xj−1 < xj < ..... < xJ

Effectif : On appelle effectif d’une valeur xj le nombre de réplication de


la valeur xj et on le note par nj .
Fréquence : On appelle fréquence associée à la valeur xj la quantitée
notée fi et donnée par : fj = nnj
n designe le nombre total d’observations : n = i=J
P
i=1 ni
Effectifs cumulés : On appelle effectifs cumulés associé à la valeur xj ,
la quantité notée Nj et définie par :
i=j
X
Nj = n1 + n2 + ... + nj = ni
i=1

Autrement dit, Nj représente le nombre total des valeurs (distinctes et


non distinctes) de la variables X qui sont inferieures ou égales à xj .
On note que NJ = n
fréquences cumulées : On appelle fréquences cumuleés associé à la
valeur xj , la quantité notée Fj et définie par :
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 19

i=j
X
Fj = f1 + f2 + ... + fj = fi
i=1

On note que FJ = 1 et ∀i : 0 ≤ Fi ≤ 1
Tableau statistique :
c’est un tableau dans lequel on représente, de façon synthétique, les don-
née statistique relatives à la variable quantitative discrète étudiée : X. Il se
compose de :

• La première colonne comprte l’ensemble des valeurs distinctes de la


variable X rangées par ordre croissant.

• Dans la seconde colonne, on dispose, en face de chaque valeur xi l’effectif


associé ni

• La troisème colonne comprte soit les effectifs cumulé, soit les fréquences
cumulées.

2.1.3 Représentations garphiques


Pour une variable quantitative discrète, on rencontre essentiellement deux
types de représentations graphiques : le diagramme en bâtons et le diagramme
cumulatif et qui sont, en fait, complémentaires.

1) Diagramme en bâtons :

Il permet de donner une vision d’ensemble des observations réalisées. Il


comporte :

• Un axe horizental (l’abscisse), sur lequel figurent les valeurs distinctes


de la variable X.

• Un axe vertical (l’ordonnée), sur lequel figurent les effectifs.

• En face de chaque valeur figure un trait vertical (un bâton), dont la


hauteur est proportionnelle à l’éffectif correspondant.

Le diagramme en bâtons des données statistiques de l’Exemple 2.1 est


comme suit :
20 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

Effectif
8− • •

7−

6−

5− • • •

4− •

3− • • • •

2− •

1− •

. . . . . . . . . . . .
0 5 6 7 8 9 10 11 12 13 14 15 16
Age
FIG. 2.1 - Diagramme en bâtons relatif aux données de l’exemple 2.1

2) Diagramme cumulatif : Fonction de répartition

C’est un diagramme sert à représenter les fréquences cumulées, ou encore


les effectifs cumulés. Cette représentation se fait au moyen d’une fonction
dite fonction de répartition, qui est définie de R dans l’intervalle [0, 1] par :



 0, x < x1 ;
F (x) = F , xj ≤ x < xj+1 ;
 j

1, xJ ≤ x.
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 21

Fréquences cumulées
1− • •

0.9−

0.8−

0.7−

0.6− •

0.5− •

0.4−

0.3− •

0.2−

0.1−

0 . . . . . . . . . . . .
5 6 7 8 9 10 11 12 13 14 15 16
Age
FIG. 2.2 - Diagramme cumulatif relatif aux données de l’exemple 2.1

Illustration

Le diagramme cumulatif comporte :

• Un axe horizental (l’abscisse), sur lequel figurent les valeurs distinctes


de la variable X.

• Un axe vertical (l’ordonnée), sur lequel figurent les fréquences cumulées.

• En face de chaque valeur figure un point dont l’ordonnée est égale à la


fréquence cumulée correspondant.

• Les différents points sont joints par des segments horizontaux puisque,
par définition, pour une variable discrète la fréquence cumulée reste
constante entre deux valeurs successives.
22 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

2.1.4 Notion de quantile et application


On a vu que la fréquence cumulée Fj (0 ≤ Fj ≤ 1) donne la proportion
des valeurs inférieures ou égales à xj .
Soit α un nombre réel tel que 0 ≤ α ≤ 1. On recherche une valeur de la
variable X dont la fréquence cumulée correspondant est approximativement
égale à α. Autrement dit, si on note cette valeur par xα , (n’est pas nécessai-
rement unique), on aura Fα ' α.

Définition : La valeur xα défine ci-dessus est dite le quantile (ou frac-


tile) d’ordre α et c’est l’image inverse de α par la fonction de répartition :
xα = F −1 (α).

Les quantiles les plus utulisés sont associés à certaines valeurs particu-
lières de α :

La mediane et les quartiles

1. La mediane : est le quartile d’ordre 12 (x 1 ). Elle partage la série en


2
deux ensembles d’effectifs (ou de fréquences) égaux.

2. Le premier quartile : est le quantile d’ordre 14 (x 1 ) : 25% des valeurs


4
sont inférieures ou égales à x 1 , tandis que 75% lui sont supérieures.
4

3. Le troisième quartile : est le quantile d’ordre 34 (x 1 ) : 75% des valeurs


4
sont inférieures ou égales à x 3 , tandis que 25% lui sont supérieures.
4

Reprenant les données de l’Exemple 2.1 et la colonne des fréquences cumulées


du Tableau 2.1 :

• La fréquence cumulée associée à la valeur 10 est 50%. Cela signifie que


50% des valeurs sont inférieures ou égales à 10 et donc 50% sont supé-
rieures à cette valeur. On peut dire que la mediane est : x 1 = 10.
2

• Comme il n’y a pas de valeurs dont la fréquence cumulée soit exactement


égale à 25%, on prend comme premier quartile la valeur correspondante
à la fréquence cumulée qui est juste supérieure à 25%, c.à.d : x 1 = x4 = 8.
4

• Par un raisonnement analogue à celui fait pour déterminer le premier


quartile, on peut prendre comme troisième quartile la valeur : x 3 = x8 =
4
12.
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 23

Remarque : On a constaté avec cet exemple, que la determination des


quantiles est souvent approximative pour une variable discrète.

Méthode approximative

Pour une serie statistique ordonnées :


x(1) , x(2) ......, x(n) ,
on a :

• Si n = 2k + 1 (n impair) : la médiane est unique et vaut x 1 = x(k+1) .


2

• Si n = 2k (n impair) : on choisit comme médiane la valeur x 1 =


2
1
2
(x (k) + x (k+1) ).
• Si nα est un entier, alors : xα = 12 (xnα + xnα+1 ).
Ce choix respecte la définition mais n’est pas cohérent avec la conven-
tion adoptée pour la médiane (cas de α = 12 )
• Si nα n’est pas un entier, alors : xα = xdJαe .
Où, dnαe désigne le plus petit nombre entier supérieur ou égal à nα
(successeur de la partie entière de nα).
Ce choix respecte la défnition et est cohérent avec la convention adoptée
pour la médiane.

Il est demandé à l’étudiant de retrouver les quartiles des données de l’exemple


2.1 en utilisant la méthode décrite ci-dessus après avoir présenter la série en
ordre.
Autres quartiles
Les déciles : Elles partagent l’ensemble des observations en 10 parties
d’effectifs égaux (chacune contien 10% des observations). Il existe 9 déciles :
x 1 : le premier décile, .
10
.
.
x 9 : le neuvième décile.
10

Les centiles : Elles partagent l’ensemble des observations en 100 parties


d’effectifs égaux (chacune contien 1% des observations). Il existe 99 centiles :
x 1 : le premier centile, .
109
.
.
x 99 : le 99ième centile,
10
24 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

2.1.5 Paramètre de position : Mode, Mediane, Moyenne


Les indicateurs statistiques de position (dits aussi de tendance centrale)
considérés fréquemment sont le mode, la médiane et la moyenne.

1. Le mode : est la valeur qui a le plus grand effectif (ou la plus grande
fréquence ) et il est dénoté par M0 .

Remarque : On peut avoir plus d’un mode ou rien.

A partir du tableau statistique 2.1 (ou du diagramme en bâtons 2.1), on a


deux mode pour l’exemple 2.1 :

M0 = x6 = 10 et M0 = x8 = 12.

Remarque : On dit que cette série est bimodale.

2. La mediane : déjà définie.

3. La moyenne arithmétique : est donnée par la formule :


J J
1X X
x= ni xi = f i xi
n i=1 i=1

Le calcule de la moyenne arithmétique des données de l’Exemple 2.1 nous


donne le résultat :

12
1 X
x = ni xi
50 i=1
1
= (3 × 5 + 5 × 6 + 3 × 7 + 4 × 8 + 2 × 9 + 8 × 10
50
+5 × 11 + 8 × 12 + 3 × 13 + 5 × 14 + 3 × 15 + 1 × 16)
= 10.34

On voit que cette valeur, x = 10.34, n’existe pas dans la série statistique, cependant elle
demeure un indicateur de tendance centrale pour caractériser le centre de cette série.
Remarque : La moyenne arithmétique n’est pas nécessairement une
valeur possible.

Autres moyennes
Elles existent d’autres types de moyennes qui ont d’usage approprié
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 25

dans des études statistiques particulières :

4. La moyenne géométrique : si (∀i), xi ≥ 0, elle est donnée par la formule :

J
! n1
1
ni
= (xn1 1 × xn2 2 × ..... × xnJ J ) n .
Y
G= xi
i=1

On peut exprimer la moyenne géométrique comme l’exponentielle de la


moyenne arithmétique des logarithmes des valeurs observées :

  
J
! n1
xni i
Y
G = exp log 
  

i=1

J
!!
1
xni i
Y
= exp log
n i=1
J
!
1X
= exp log(xni i )
n i=1
J
!
1X
= exp ni log(xi ) .
n i=1

La moyenne géométrique s’utilise pour le calcul d’un taux d’intérêt


"moyen".
26 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

Supposons qu’une banque offre une possibilité de placement et prévoit pour


la première année un intérêt de 3%, pour la deuxième année un intérêt de 7%
mais pour la troisème année 8%. Quel est le capital acqui après 3 ans si on
place 1000Dh ?

Après 1 an on a, 1000 × 1.03 = 1030DH.


Après 2 ans on a, 1030 × 1.07 = 1102.1DH.
Après 3 ans on a, 1102 × 1.08 = 1190.268DH.
Donc le capital acqui après 3 ans est C = 1190.268DH.
La moyenne arithmétique des taux est t = 1.03+1.07+1.08
3
= 1.06, si on utilise
cette valeur pour calculer le capital acqui après 3 ans (C), on aura :
1000 × (1.06)3 = 1191.016DH, une valeur ne donne pas la réalité !
La moyenne géométrique des taux est :

G = 3 1.03 × 1.07 × 1.08 = 1.059778048.

Si on applique ce taux on obtient :

1000 × (1.059778048)3 = 1190.268DH.

Alors, la moyenne géométrique est la manière appropriée de calculer le taux


moyen.
 n
t
Rappelons que le capital acqui se calcule par la formule : Cn = C 1 + 100
.
où, C est le capital de base, t le taux et n est le nombre d’années.

5. La moyenne harmonique : si (∀i), xi ≥ 0, elle est donnée par la formule :

n n
H = PJ ni = n1 n2 nJ
i=1 xi x1
+ x2
+ ..... + xJ

La moyenne harmonique s’utilise souvent pour calculer la moyenne des


vitesses. Voici l’exemple suivant :
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 27

Un véhicule effectue un trajet de 100 km aller et retour. A l’aller sa vitesse


moyenne est 80 km/h, au retour 50 km/h. Quelle est la vitesse moyenne sur
tout le trajet ?.
Rappelons que la vitesse est donnée par : v = dt , où d designe la distance
parcourue, et t est le temps mis au parcours.
On note v1 = 80km/h, v2 = 50km/h et d = 100km.
Le temps mis au parcours d’aller est t1 = vd1 = 1h25min.
Le temps mis au parcours du retour est t2 = vd2 = 2h.
Le temps total mis lorsque cet véhicule parcourt ce trajet aller et retour est
200
t = t1 +t2 = 3h25min, et donc la vitesse moyenne est vmoy = 3.25 ≈ 61.54km/h
v1 +v2
La moyenne arithmétique des vitesse est v = 2 = 65km/h
La moyenne harmonique des vitesse est H = 1 +2 1 ≈ 61.54km/h
v1 v2
La moyenne harmonique est donc la manière fiable pour calculer la vitesse
moyenne.

Propriété : On peut montrer que H ≤ G ≤ x.

Remarque
Les moyennes dont on a indiqué les formules plus haut sont dite moyennes
pondérées ; cela signifie que chaque valeur xi de la variable est multipliée
(pondérée) par un coefficient, ici par l’effectif ni qui lui correspond.
On parle de moyennes simples quand on n’effectue pas de pondération. Au-
trement dit, lorsque toutes les valeurs xi ont le même effectif qui vaut 1.
Dans ce cas, On remplace tout les ni par 1 dans les formules précédentes
(ni = 1, ∀i = 1, ...n).
Par exemple, si 5 étudiants ont pour âge respectif 18, 19, 20, 21 et 22 ans,
leur âge moyen est donné par 18+19+20+21+22
5
= 20 ans.

Il est demandé à l’étudiant d’établir les formules des moyennes aritmétique


simple, géométrique simple et harmonique simple.

2.1.6 Paramètres de dispersion


1. L’étendue : est l’écart entre la plus grande et la plus petite des valeurs
observées :
E = xJ − x1

Cette caractéristique donne une première idée sur la dispersion des ob-
servations.
28 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

2. L’intervalle interquartiles : est l’écart entre le troisème et le premier


quartiles :
IQ = x 3 − x 1 .
4 4

Cette caractéristique est intéressante car est totalement indépendante


des valeurs extrêmes.

3. La variance : est la moyenne des carrés des écarts à la moyenne arith-


métique :
J J
1X 2
fi (xi − x)2 .
X
V ar(X) = ni (xi − x) =
n i=1 i=1

On peut montrer que la variance s’exprime aussi par la formule :


J J
! !
1X
ni x2i − x2 = fi x2i − x2 .
X
V ar(X) =
n i=1 i=1

4. L’écart-type : est la racine carrée positive de la variance :


q
σX = V ar(X).

La variance est un indicateur de la distance moyenne entre la moyenne


arithmétique x et les valeurs de la variable X. Elle mesure la dispersion
d’une série statistique autour de sa moyenne :
– Plus il est petit, plus les caractères sont concentrés autour de la
moyenne (on dit que la série est homogène).
– Plus il est grand, plus les caractères sont dispersés autour de la
moyenne (on dit que la série est hétérogène).
En reprenant les données de l’Exemple 2.1, on calcule :

L’étendue : est x12 − x1 = 16 − 5 = 11.


L’interquartille : est x 3 − x 1 = 12 − 8 = 4.
4 4
La variance : est
12
!
1 X
V ar(X) = ni x2i
50 i=1
1
= (3 × 52 + 5 × 62 + 3 × 72 + 4 × 82 + 2 × 92 + 8 × 102 + 5 × 112
50
+8 × 122 + 3 × 132 + 5 × 142 + 3 × 152 + 1 × 162 ) − (10.34)2
= 8.98

p √
L’écart-type : est σX = V ar(X) = 8.98 = 2.99.
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 29

2.1.7 Paramètres de forme


- On dit q’une série statistique est symétrique si le polygone des effectifs
(ou des fréquences) est symétrique par rapport à un axe vertical passant
par son sommet. Dans un tel cas, le mode, la médiane et la moyenne se
confondent.

16−

14−
12− M0 = x 1 = x
2
10− • •
8−
6−
4− • •
2− • •
• . . . . . . . •.
0 10 20 30 40 50 60 70 80
FIG. 2.3 - Cas d’une série symétrique

- On dit qu’une série statistique est dissymétrique à droite si la portion


du polygone des effectifs ( ou des fréquences) située à droite du sommet est
plus longue que l’autre.

16−

14−
12− M0 < x 1 < x
2
10− • •
8−
6−

4− •

2− •
• . . . . . . . •.
0 10 20 30 40 50 60 70 80
FIG. 2.4 - Cas d’une série dissymétrique à droite

- On dit qu’une série statistique est dissymétrique à gauche si la portion


du polygone des effectifs ( ou des fréquences) située à gauche du sommet est
plus longue que l’autre.
30 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

16−

14−
12− x < x 1 < M0
2
10− • •
8−
6−

4− •
• •
2−
• . . . . . . . •.
0 10 20 30 40 50 60 70 80
FIG. 2.5 - Cas d’une série dissymétrique à gauche

Il existe différentes manières de caractériser et de mesurer la dissymétrie.


Parmi ces manières, on cite :

1. Coefficient d’asymétrie de Fisher :

µ3
γ1 = 3
,
σX
1 Pi=J Pi=J
où, µ3 = n i=1 ni (xi − x)3 = i=1 fi (xi − x)3 .

Le signe du coefficient de Fischer indique le sens de l’asymétrie :

a) Si γ1 < 0, alors la série est dissymétrique à gauche.


b) Si γ1 = 0, alors la série est symétrique.
c) Si γ1 > 0, alors la série est dissymétrique à droite.

2. Coefficient d’asymétrie de Yule :

x 3 + x 1 − 2x 1
4 4 2
CY =
x3 − x1
4 4

La valeur du coefficient de Yule est toujours comprise entre −1 et +1


et son signe indique le sens de l’asymétrie :

a) Si −1 ≤ CY < 0, alors la série est dissymétrique à gauche.


b) Si CY = 0, alors la série est symétrique.
c) Si 0 < CY ≤ 1, alors la série est dissymétrique à droite.
2.1. CAS D’UNE VARIABLE QUANTITATIVE DISCRÈTE 31

3. Coefficient d’asymétrie de Pearson :

x − M0
CP =
σX

Sa valeur est généralement comprise entre -1 et +1 :

a) Si CP < 0, alors la série est dissymétrique à gauche.


b) Si CP = 0, alors la série estsymétrique.
c) Si CP > 0, alors la série est dissymétrique à droite.

Pour la série statistique donnée dans l’Exemple 2.1, les différents coefficients
d’asymétrie sont :
µ3 9.98 ∼
γ1 = 3
= = 0.37
σX 2.993
3
4
+ 14 − 2 12 12 + 8 − 2 × 10
CY = 3 1 = =0
4
−4 12 − 8
10.34−12 ∼
(
x − M0 2.99 = −0.6, pour M0 = 12 ;
CP = = 10.34−8 ∼
σX 2.99 = 0.8, pour M0 = 8.
(Veuillez refaire les calculs et intérpreter les résultats).

2.1.8 Exercices
Exercice 2.1
Les notes obtenus par les étudiant d’une classe à un contrôle de mathé-
matique sont listées comme suit :

19 4 18 9 10 12 10 11 13 12
9 8 4 5 8 16 12 4 18 12

1) Établir le tableau statistique représentant la série ci-dessous en pré-


sentant les effectifs, les effectifs cumulés, les fréquences et les fréquences cu-
mulées.
2) Représenter sur un diagramme en bâtons cette série statistique.
3) Determiner la fonction de répartition de cette série.
4) Donner les valeurs de la médiane, le premier quartile et le troisième
quartile.
32 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

5) Calculer les paramètres de dispersion : L’étendue, l’intervalle inter-


quartiles, la variance et l’écart-type.
6) Etudier la dissymetrie de cette série

Exercice 2.2
Dans une petite localité, on a relevé de nombre de pièces par apparte-
ment :

Nombre de pièces 1 2 3 4 5 6 7
Nombre d’appartements1 48 72 96 64 39 25 3

1) Définir la population étudiée, l’individu et la variable.


2) Quel est le type de la variable ?.
3) Établir le tableau statistique représentant la série ci-dessous en pré-
sentant les effectifs, les effectifs cumulés, les fréquences et les fréquences cu-
mulées.
4) Représenter sur un diagramme en bâtons cette série statistique.
5) Déterminer la fonction de répartition des effectifs.
6) Donner les valeurs de la médiane, le premier quartile et le troisième
quartile.
7) Calculer les paramètres de dispersion : L’étendue, l’intervalle inter-
quartiles, la variance et l’écart-type.
8) Etudier la dissymetrie de cette série
2.2. CAS D’UNE VARIABLE QUANTITATIVE CONTINUE 33

2.2 Cas d’une variable quantitative continue


2.2.1 Introduction
Lorsqu’une variable quantitative prend un grand nombre de valeurs dis-
tinctes, on regroupe celles-ci en des intervalles contigus appelés classes. Une
telle varaible est dite variable quantitative continue.
Le nombre J de classes produites s’obtient en utulisant les règles algè-
briques suivantes :

1. Règle de Sturge : J = 1 + (3, 3 log10 (n),


1 √
2. Règle de Yule : J = 2.5n 4 = 2.5 4 n,

où, n est le nombre total des observations.


Remarque : Dans les deux règles, on arrondit à l’entier le plus proche,
car un nombre de classes doit être un entier.
Désignons par [b0 , b1 [, [b1 , b2 [, ......, [bJ−1 , bJ [, (ou ([bi−1 , bi [, i = 1, 2, ...., J)),
les classes considérées. On note :

• [bi−1 , bi [ est dit la classe i,


• bi la borne supérieure de la classe i,
• bi−1 la borne inférieure de la classe i,
bi−1 +bi
• ci = 2
le centre de la classe i,
• ai = bi − bi−1 l’amplitude de la classe i.

Généralement, on choisit des classes de même amplitude, (appelée aussi


intarvalle de classe) qui se calcule approximativement comme suit : xmax −xJ
min
,
avec xmax et xmin , respectivement la plus grande et la plus petite valeur
observée dans la série statistique.
A partir de la plus petite valeur observée, on obtient les bornes de classes
en additionnant successivement l’amplitude.
Exemple 2.2
Dans une usine fabriquant de tubes de plastiques, on a prélevé un échan-
tillon de 44 tubes dont on a mesuré le diamètre en centimètre (cm). Voici les
résultats :
1.94 2.00 2.10 1.95 1.96 1.99 1.98 2.11 2.14 2.15 2.22
2.69 2.25 2.25 2.12 2.14 2.15 2.27 2.30 2.34 2.24 2.38
2.27 2.16 2.12 2.40 2.41 2.45 2.50 2.52 2.45 2.53 2.65
2.56 2.66 2.63 2.60 2.72 2.76 2.84 2.52 1.97 1.99 2.38
34 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

Pour présenter les données listées ci-dessus, il n’est pas pratique de prévoir
une case par diamètre ! On regroupe les valeurs de cette variable en classes
d’amplitudes égales.
Nombre de classes : ici, on a n = 44.
• Selon la règle de Sturge : le nombre de classes est J = 1+3.3×log(44) ∼ =
6.42 ≈ 6 classes √
• Selon la règle de Yule : le nombre de classes est J = 2.5× 4 44 ∼= 6.43 ≈ 6
classes
Amplitude de classes : On a xmax = 2.84cm et xmin = 1.94cm, donc
xmax − xmin = 0.90cm. Ainsi , l’amplitude est 0.90 6
= 0.15.
Par suite, on peut regrouper les mésures de diamètres par classe d’ampli-
tude 0.15 et rangées par ordre croissant :

[1.94, 2.09[ [2.09, 2.24[ [2.24, 2.39[ [2.39, 2.54[ [2.54, 2.69[ [2.69, 2.84[,
qu’on les note respectivement par :

[b0 , b1 [ [b1 , b2 [ [b2 , b3 [ [b3 , b4 [ [b4 , b5 [ [b5 , b6 [.

2.2.2 Tableau statistique


On utilise encore un tableaus statistique analogue à celui vu pour le cas
d’une variable quantitative discrète, en disposant cette fois-ci, dans la pre-
mière colonne les classes rangées par ordre croissant. Les notions d’effectifs,
de fréquences, d’effectifs cumulés et de fréquences cumulées sont définies de
la même façon que dans le cas discret.
Le tableau statistique représentant les données de l’Exemple 2.2 est comme suit :

[bi−1 , bi [ ni Ni fi Fi
[1.94, 2.09[ 8 8 0.18 0.18
[2.09, 2.24[ 10 18 0.23 0.41
[2.24, 2.39[ 9 27 0.20 0.61
[2.39, 2.54[ 8 35 0.18 0.79
[2.54, 2.69[ 5 40 0.11 0.90
[2.69, 2.84[ 4 44 0.10 1.00
Total 44 - 1.00 -

Table 2.2 – Tableau statistique correspondant aux données de l’Exemple 2.2


2.2. CAS D’UNE VARIABLE QUANTITATIVE CONTINUE 35

2.2.3 Représentations graphiques

Pour une variable quantitative continue, on rencontre deux types de re-


présentations graphiques :

1. L’histogramme : est un graphique consiste à représenter les fré-


quences (resp. les effectifs) des classes. Elle comporte :

• Un axe horizental sert à raprésenter les bornes bi des classes de la


varaible considérée.

• Un axe vertical sur lequel figurent ce que l’on appelle la densité


de fréquence (resp. densité d’effectif ) qui est donnée par :
di = afii (resp. hi = naii ).

• Chaque classe i est représentée par un rectangle dont la base est


délimitée par les bornes correspondantes et dont la hauteur est la
densité de fréquence di (resp. la densité d’effectif hi ).
La surface de ce rectangle est : fi (resp. ni ).

• L’aire de l’histogramme de fréquence est égale à 1, puisque l’aire de


chaque rectangle est égale à la fréquence de la classe i : ai ×di = fi .

• L’aire de l’histogramme d’effectif est égale à l’effectif total n,


puisque l’aire de chaque rectangle est égale à l’effectif de la classe
i : ai × hi = ni .

En reprenant les données de l’Exemple 2.2, l’amplitude de classe est 0.15 (


pour tout i, ai = 0.15). Ainsi :

f1 0.18
d1 = = = 1.20, d2 = 1.53, d3 = 1.33, d4 = 1.20, d5 = 0.73, d6 = 0.66
0.15 0.15
L’histogramme de fréquence de l’Exemple 2.2 est comme suit :
36 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

Densité de fréquence
2−

1−

0 p p p p p p p
1.94 2.09 2.24 2.39 2.54 2.69 2.84
Diamètre en cm
FIG. 2.6 - L’histogramme de fréquence des données de l’Exemple 2.2

2. La courbe cumulée : C’est une courbe sert à représenter les fré-


quences cumulées, ou encore les effectifs cumulés. Cette représentation
se fait au moyen de la fonction de répartition définie de R dans l’inter-
valle [0, 1] par :



 0, x < b0 ;
F (x) = Fj + dj (x − bj ), bj−1 ≤ x < bj ;
bJ ≤ x.


1,
2.2. CAS D’UNE VARIABLE QUANTITATIVE CONTINUE 37

1− •

0.9− •

0.8− •

0.7−

0.6− •
α M (α, xα )
0.5−

0.4− •

0.3−

0.2− •
0.1−

0 •p p p p p p p
1.94 2.09 2.24 xα 2.39 2.54 2.69 2.84
FIG. 2.7 - La courbe cumulative correspondante aux données de l’Exemple 2.2

Illustration

La courbe cumulative comporte :


• Un axe horizental (l’abscisse), sur lequel figurent les bornes des classes.
• Un axe vertical (l’ordonnée), sur lequel figurent les fréquences cumulées.
• Chaque classe est représentée par un point unique dont l’abscisse est
la borne supérieure de la classe et l’ordonnée est la fréquence cumulée
de cette classe.
• Les différents points sont joints par des segments de droites.

2.2.4 Les quantiles


Pour déterminer le quantile xα , on doit commencer par la détermination
de la classe contenant xα , puis le déterminer dans cette classe par l’inter-
polation linéaire ;
38 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

Si xα le quantile d’ordre α est dans la classe [bj−1 , bj ], alors :

α − Fj−1 α − Fj−1
xα = bj−1 + aj × = bj−1 + aj × .
Fj − Fj−1 fj

Remarque : Le quantile xα peut être déterminé de façon directe à partir


la courbe cumulative. Cela sighifie que xα est l’ordonnée du point M de la
courbe cumulative dont l’abscisse est α (Voir la figure 2.7).

Calculons le premier, le deuxième et le troisième quartiles de la série staistique


donnée dans l’Exemple 2.2 :

• D’après le tableau statistique 2.2 ou la courbe cumulative (Fig. 2.7), le


premier quartile x 1 se trouve dans la deuxième classe [2.09, 2.24[. On
4
aura donc :
0.25 − F1 0.25 − 0.18
x 1 = b 1 + a2 = 2.09 + 0.15 × ≈ 2.13
4 F2 − F1 0.41 − 0.18

• De manière analogue, le deuxième quartile (mediane) x 1 se trouve dans


2
la troisième classe [2.24, 2.39[, donc :

0.5 − F2 0.5 − 0.41


x 1 = b 2 + a3 = 2.24 + 0.15 × ≈ 2.30
2 F3 − F2 0.61 − 0.41

• le troisième quartile x 3 se trouve dans la quatrième classe [2.39, 2.54[,


4
donc :
0.75 − F3 0.75 − 0.61
x 3 = b 3 + a4 = 2.39 + 0.15 × ≈ 2.50
4 F4 − F3 0.79 − 0.61

2.2.5 Paramètres de position


1. Le mode : dans le cas de variable continue, on parle plutôt de classe
modale ; c’est la classe qui a le plus grand effectif ( ou la plus grande
fréquence).
Si la classe modale est la classe j : [bj−1 , bj [, alors le mode se calcule de
la manière exacte suivante :
∆1
M0 = bj−1 + aj ,
∆1 + ∆ 2
avec, ∆1 = nj − nj−1 et ∆2 = nj − nj+1 .
2.2. CAS D’UNE VARIABLE QUANTITATIVE CONTINUE 39

NB : La classe modale n’est pas obligatoirement unique.


Pour la série de l’Exemple 2.2, la classe modale est la deuxième classe :
[2.09, 2.24]. Calculons le mode :
On a ∆1 = n2 − n1 = 10 − 8 = 2 et ∆2 = n2 − n3 = 10 − 9 = 1, donc :
M0 = b1 + ∆1∆+∆ 1
2
a2 = 2.09 + 23 × 0.15 = 2.19.

1
2. La mediane : est le quartile d’ordre 2
défini au paragraphe précédent.

3. Les moyennes arithmétique, géométrique et harmonique d’une varaible


quantitative continue se déterminent par les mêmes formules que dans
le cas de variable discrète, mais avec la necessité de remplacer les valeurs
xi par les centres de classes ci . Ainsi :

J J
1X X
x= n i ci = f i ci ,
n i=1 i=1

J
! n1
1
ni
= (cn1 1 × cn2 2 × ..... × cnJ J ) n ,
Y
G= ci
i=1

n n
H = PJ ni = n1 c2 nJ
i=1 ci c1
+ c2
+ ..... + cJ

Le calcul des moyennes des données de l’Exemple 2.2, nous donne les résultats :
6
X
x = f i ci
i=1
= 0.18 × 2.015 + 0.23 × 2.165 + 0.2 × 2.315 + 0.18 × 2.465
+ 0.11 × 2.615 + 0.1 × 2.765
≈ 2.33

v
u 6
uY n
44

44
G= t c i i = 2.0158 × 2.16510 × 2.3159 × 2.4658 × 2.6155 × 2.7654 ≈ 2.32
i=1

44 44
H = P6 ni = 8 10 9 8 5 4 ≈ 2.30
i=1 ci 2.015
+ 2.165
+ 2.315
+ 2.465 + 2.615
+ 2.765
40 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

2.2.6 Paramètres de dispersion


Pour une vraiable continue, l’étendue et l’intervalle interquartiles ont la
même définition que dans le cas discret mais dans les formules qui expriment
la variance et l’écart-type on doit prendre comme valeur xi les centres de
classes ci .

1. L’étendue : E = xmax − xmin .


Remarque : si on ne connait pas les valeurs maximale et minimale,
on prend comme étendue : E = bJ − b0 .

2. L’intarvalle interquartiles : IQ = x 3 − x 1 .
4 4

3. La varaince :
J J
1X
ni (ci − x)2 = fi (ci − x)2 .
X
V ar(X) =
n i=1 i=1

Elle s’exprime aussi par la formule :


J J
! !
1X 2 2
fi c2i − x2 .
X
V ar(X) = n i ci − x =
n i=1 i=1

q
4. L’écart-type : σX = V ar(X).

Les paramètres de dispersion de la série statistique donnée dans l’Exemple 2.2


sont :

• L’étendue : E = 2.84 − 1.94 = 0.9.

• L’intarvelle interquartiles : IQ = x 3 − x 1 = 2.50 − 2.13 = 0.37.


4 4

• La varaince :
6
!
fi c2i − x2
X
V ar(X) =
i=1
= 0.18 × 2.0152 + 0.23 × 2.1652 + 0.2 × 2.3152 + 0.18 × 2.4652
+ 0.11 × 2.6152 + 0.1 × 2.7652 − 2.332
≈ 0.06
q √
• l’écart-type : σX = V ar(X) = 0.06 ≈ 0.77
2.3. CAS D’UNE VARAIBLE QUALITATIVE 41

2.2.7 Paramètres de forme


Pour caractériser graphiquement la dissymétrie d’une série statistique
d’une variable continue, on trace sur l’histogramme, un polygone joignant
les points milieux des bases supérieures des rectangles. A l’aide de ce poly-
gone, la difinition de la dissymétrie est la même que dans le cas d’une variable
quantitative discrète. Voici un exemple :

12−


10−

8−

6−

4− • •
• •
2− •

0 p p p p p p p p p p p
2 4 6 8 10 12 14 16 18 120 22
FIG. 2.8 - Cas d’une série dissymétrique à gauche

Les coefficients de Yule et Pearson qui mésurent l’asymétrie d’une série conti-
nue ont les même expressions que dans le cas d’une variable discrète, mais
pour le coefficient de Fischer on doit remplacer dans la formule µ3 , les valeurs
xi par les centres de classes ci .
Est demandé à l’étudiant d’étudier la dissymétrie de la série donnée dans
l’Exemple 2.2.

2.3 Cas d’une varaible qualitative


Dans l’étude statistique d’une variable qualitative, il n’existe pas de ca-
ractéristiques numériques (à cause de la nature non numérique de cette va-
raible). On se contentera donc de faire des tableaux statistique pour présenter
les données et des représentations graphiques.
Les représentations graphiques les plus courantes pour une variable qua-
litative, sont :

1. le digramme en colonnes,
42 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

2. le digramme en secteurs.
on va traiter ici le cas d’une variable qualitative ordinale et le cas d’une
variable qualitative nominale, dans les deux exemples suivants :
Exemple 2.3 ( cas d’une variable ordinale)
Une enquête réalisée auprès de 40 étudiants sur leur mention obtenu au
Bac. Les résultats sont coadifiés comme suit :
P P AB B B P AB AB P P
AB P AB B TB P AB TB P B
P AB TB E B E AB TB P E
P AB P B B P AB TB TB P
1. Tableau statistique

• La variable étudiée est : X =: mention obtenu au Bac.


• Le type de la variable est qualitative ordinale.
• la variable a 5 modalités distinctes qui peuvent être ordonnées par
ordre croissant :
P < AB < B < T B < E.

• Le tableau statistique de cette série est le suivant :

Mention au Bac ni Ni fi Fi
P 14 14 0.35 0.35
AB 10 24 0.25 0.60
B 7 31 0.175 0.775
TB 6 37 0.15 0.925
E 3 40 0.075 1.00
Total 40 - 1.00 -

Table 2.3 – Tableau statistique correspondant aux données de l’Exemple 2.3

2. Représentation graphique
Pour une variable qualitative ordinale (ou nominale), on a deux sortes
de représentations graphiques :

A) Diagramme en colonnes des effectifs :


On représente les effectifs de la variable qualitative ordinale étu-
diée ici, au moyen d’un diagramme en barres comme suite :
2.3. CAS D’UNE VARAIBLE QUALITATIVE 43

Effectifs
14−

12−

10−

8−

6−

4−

2−

0
P AB B TB E
FIG. 2.9 - Diagramme en colonnes dess effectifs

B) Diagramme en secteurs des fréquences :


On représente les fréquences de la variable qualitative ordinale
étudiée, au moyen d’un diagramme en secteurs comme suite :

35%

AB 25%

7.5%
E

15%
17.5%
TB
B
FIG. 2.10 - Diagramme en secteurs dess fréquences
44 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

Exemple 2.4 (cas de variable nominale)

On note au préalable, que les notions d’ffectifs cumulés et de fréquences


cumulées n’ont pas de sens pour une variable qualitative nominale (elles ne
sont pas définies).

On s’interesse à l’état matrimonial (état-civile) d’un groupe de 20 per-


sonnes, âgées de plus de 18 ans. on a les données suivantes :

M M D C C C C D C V
V C D D C C C M M M

1. Tableau statistique

• La variable étudiée est : X =: état matrimonial.


• Le type de la variable est qualitative nominale.
• la variable a 4 modalités distinctes qui ne peuvent pas être ordon-
nées.
C M D V

• Le tableau statistique de cette série est le suivant :

Etat matrimonial ni fi
C 9 0.45
M 5 0.25
D 4 02
V 2 0.1

Table 2.4 – Tableau statistique correspondant aux données de l’Exemple 2.4

2. Représentation graphique

A) Diagramme en colonnes des effectifs :


2.3. CAS D’UNE VARAIBLE QUALITATIVE 45

Effectifs

10−

8−

6−

4−

2−

0
C M D V
FIG. 2.11 - Diagramme en colonnes dess effectifs

B) Diagramme en secteurs des fréquences :

45%

10%
25% V
M

20%

D
FIG. 2.12 - Diagramme en secteurs dess fréquences
46 CHAPITRE 2. STATISTIQUE DESCRIPTIVE UNIVARIÉE

2.3.1 Exercices
Exercice 2.3
La série suivante représente le nombre de pièces non-conformes par jour,
dans une entreprise :
122 111 154 98 93 67 134 167 123 142 132 151 127 119 137 130 127 135 187
165 161 151 143 148 132 127 99 132 139 100 136 132 127 167 118 116 83 77.
1) Classer ces données dans des classes de même amplitude
2) Calculer la médiane et déterminer la classe modale
3) Calculer les moyennes arithmétique, géométrique, et harmonique
4) Etudier l’asymétrie de cette série
5) Calculer la variance, l’écart-type.
Exercice 2.4
Dans une usine fabriquant des composantes électroniques, le service d’étude
de qualité a procédé à la mesure de la durée de vie d’un lot de 40 pièces. On
notera X cette durée de vie mesuré en centaine d’heurs. Les résultats sont
regroupés dans le tableau suivant :
X ] 5 ; 9] ] 9 ; 11] ] 11 ; 19]
Effectifs 42 72 102
1) Tracer l’histogramme de cette distribution
2) Donner la fonction de répartition de cette variable statistique X et tracer
son graphe
3) Quelle est la classe modale
4) Calculer la médiane, l’âge moyen et l’écart type
5) Calculer le premier et le troisième quartile ainsi que l’intervalle interquar-
tile
Exercice 2.4
Une enquête portant sur les villes marocaines visitées par un groupe des
élèves d’une établissement scolaire sur nador, nous donne la répartition sui-
vante :
Ville Nombre d’élèves
Rabat 27
Tanger 38
Fes 52
Marrakech 15
Agadir 33

1) Déterminer la population et la nature de la variable étudiée.


2) Donner dans un tableau, les ffectifs et les fréquences.
3) Représenter dans un diagramme en secteurs les fréquences de cette série.
Chapitre 3

Statistique descriptive bivariée

Dans ce chapitre, on va étudier simultanément deux variables, notées X


et Y , définies sur la même population (ou la même échantillon). Autrement
dit, un même individu sera étudié à l’aide de deux caractères. Par exemple,
dans un groupe des enfants, on peut regarder le poids et la taille de chaque
enfant en même temps. L’objectif principal de cette étude est de mettre en
évidence une éventuelle liaison entre ces deux variable.
On va commencer par l’étude de deux variables quantitatives, puis, on va
traiter le cas d’une variable quantitaive et une variable qualitative.

3.1 Deux variables quantitatives


On considère ici, deux varibales quantitatives, notées X et Y qui sont dé-
finies sur une même population de taille n (contient n individus). On notera :

• xi , i = 1, 2, ...., J : les J modalités distinctes de la variable X et rangées


par ordre croissant.

• yj , j = 1, 2, ...., K : les K modalités distinctes de la variable Y et


rangées par ordre croissant.

• Les deux variables X et Y sont mesurées sumultanément sur chacun


des n individus de la population.

• nij l’effectif correspondant au couple (xi , yj ) : représente le nombre


d’individus qui prennent en même temps la valeur xi et yj .

• Si X et Y sont des variables quantitatives discrètes : xi et yj désignent


les valeurs prisent, respectivement, par X et Y .

47
48 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

• Si X et Y sont des variables quantitatives continues : xi et yj désignent


les centres des classes de X et Y respectivement.

3.1.1 Organisation des données


Une série statistique où deux variables sont étudiées simultanément est
dite série statistique double. La donnée de base pour une telle série, est
la présentation de ses informations brutes (pas encore traitées) dans un ta-
bleau comporte : n lignes pour les n individus et deux colonnes pour les deux
variables X et Y .
Exemple 3.1
Une enquête réalisée auprès de 20 salariés sur leur nombre d’enfants (va-
riable notée X) et sur leur salaire mensuel (variable notée Y ), en milliers
de dirhams, simultanèment. Le relevé des informations est donné dans le
tableaux suivant :
Salarié N o 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
nombre d’en- 1 2 2 1 3 3 2 0 1 4 3 2 2 0 1 3 2 2 3 3
fants : xi
Salaire : yi 4.5 5.5 5 4.7 6.5 6 5.7 5 5.5 7.5 6.5 6.4 5.5 4.6 4 7.6 5 5.5 6.5 7
(mDh)

Table 3.1 – Tableau des observations brutes

Au vu de ces données, plusieures questions peuvent être posées :


Les salariés qui ont plus d’enfants, ont-ils un salaire elevé ?
Y a-t-il un lien entre le nombre d’enfants et le salaire mensule ? Et si oui,
comment s’exprime ce lien ?
Ces questions et d’autres vont être élaborées au cours de cette partie.

1. Distributuion conjointe
Définition : On appelle série conjointe des effectifs de X et Y l’en-
semble des informations (xi , yj , nij ), pour i = 1, ..., J et j = 1, ..., K.

Pour représenter la série conjointe du couple (X, Y ), on utilise un


tableau à double entrée appelé :

Tableau de contingence
3.1. DEUX VARIABLES QUANTITATIVES 49

HH
Y
H y1 y2 ... yj ... yK
X HH
H
x1 n11 n12 ... n1j ... n1K
x2 n21 n22 ... n2j ... n2K
... ...
xi ni1 ni2 ... nij ... niK
... ...
xJ nJ1 nJ2 ... nJj ... nJK

Table 3.2 – Tableau de contingence

Remarque :
J X
X K
nij = n,
i=1 j=1
PJ PK
où la double somme i=1 j=1 s’exprime par :
J X
X K J
X J
X J
X J
X
nij = (ni1 + ni2 + ... + niK ) = ni1 + ni2 + ... + niK
i=1 j=1 i=1 i=1 i=1 i=1

Dans l’Exemple 3.1, en regroupant les valeurs de la variable Y en classes de


même amplitude à l’aide la règle de Sturge, on donne le tableau de contingence
représentant la distribution conjointe du couple (X, Y ) :

HH Y
H
[4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6]
X H
HH
0 1 1 0 0 0
1 3 0 1 0 0
2 0 2 4 1 0
3 0 0 1 3 2
4 0 0 0 0 1

Table 3.3 – Tableau de contingence correspondant à l’Exemple 3.1

Par exemple, le chiffre 3 situé dans la deuxième colonne est l’effectif associé
au couple (0, [4, 4.72[). Il indique que trois salariés ayant 1 enfant et ayant en
même temps un salaire compris entre 4000Dh et 4720Dh.
50 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

2. Distributuion marginale
On obtien la distribution marginale en ajoutant au tableau de contin-
gence les totaux en lignes et en colonnes, comme suit :
HH
Y
H y1 y2 ... yj ... yK Totaux
X HH
H
x1 n11 n12 ... n1j ... n1K n1•
x2 n21 n22 ... n2j ... n2K n2•
... ...
xi ni1 ni2 ... nij ... niK ni•
... ...
xJ nJ1 nJ2 ... nJj ... nJK nJ•
Totaux n•1 n•2 ... n•j ... n•K n

Table 3.4 – Tableau représentant la distribution marginale

Illustration :

I En marge à droite (totaux en lignes), pour chaque indice i, l’effectif


ni• est le nombre total d’apparition de la valeur xi de la variable
X quelle que soit la modalité de la variable Y . Autrement dit :
K
X
ni• = nij = total de la ligne i
j=1

Les J couples (xi , ni• ) definissent la distribution marginale de


la variable X.
Remarque : on a :
J
X
ni• = n
i=1

I En marge en bas (totaux en colonnes), pour chaque indice j, l’effectif


n•j est le nombre total d’apparition de la valeur yj de la variable
Y quelle que soit la modalité de la variable X. Autrement dit :
J
X
n•j = nij = total de la colonne j
i=1

Les K couples (yj , n•j ) definissent la distribution marginale de


la variable Y .
3.1. DEUX VARIABLES QUANTITATIVES 51

Remarque : on a :
K
X
n•j = n
j=1

En reprenant les données de l’Exemple 3.1, la distribution marginale est la suivante :

HH Y
HH
[4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Totaux
X HH
0 n11 =1 n12 =1 n13 =0 n14 =0 n15 =0 n1• = 2
1 n21 =3 n22 =0 n23 =1 n24 =0 n25 =0 n2• = 4
2 n31 =0 n32 =2 n33 =4 n34 =1 n35 =0 n3• = 7
3 n41 =0 n42 =0 n43 =1 n44 =3 n45 =2 n4• = 6
4 n51 =0 n52 =0 n53 =0 n51 =0 n55 =1 n5• = 1
Totaux n•1 =4 n•2 =3 n•3 =6 n•4 =4 n•5 =3 20

Table 3.5 – Tableau représentant la distribution marginale correspondante


à l’Exemple 3.1

La distribution marginale de la variable X est donnée par :

X 0 1 2 3 4 Effectif total
Effectifs 2 4 7 6 1 20

Table 3.6 – Tableau représentant la distribution marginale de la variable X

La distribution marginale de la variable Y est donnée par :

Y [4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Effectif total
Effectifs 4 3 6 4 3 20

Table 3.7 – Tableau représentant la distribution marginale de la variable Y

3. Distributuion conditionnelle
I On appelle distribution conditionnelle de Y pour X = xi , la
série statistique de la variable Y sachant que la variable X prend
la modalité xi et on la note par : Y/X=xi .
A la ligne i du tableau de contingence, on lit la distribution de la
variable Y sachant que X = xi .
52 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

I On appelle distribution conditionnelle de X pour Y = yj , la


série statistique de la variable X sachant que la variable Y prend
la modalité yj et on la note par : X/Y =yj .
A la colonne j du tableau de contingence, on lit la distribution de
la variable X sachant que Y = yj .

Dans l’Exemple 3.1, la distribution conditionnelle de Y sachant que le salarié


a trois enfants est :
(Obtenue par la ligne 5 du tableau de contingence)

Y/X=3 [4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Effectif total
Effectifs 0 0 1 3 2 6

Table 3.8 – Tableau représentant la distribution conditionnelle de Y sachant


X=3

Et la distribution conditionnelle de X sachant que le salarié a un salair mensuel


compris entre 6160Dh et 6880Dh est :
(Obtenue par la colonne 5 du tableau de contingence)

X/Y =[6.16,6.88[ 0 1 2 3 4 Effectif total


Effectifs 0 0 1 3 0 4

Table 3.9 – Tableau représentant la distribution conditionnelle de X sachant


Y = [6.16, 6.88[

4. Fréquences associées à un couple de variables


Dans l’étude simultanée de deux variables, on a trois notions de fré-
quences (ou proportions) :
nij
I La fréquence du couple (xi , yj ) est donnée par : fij = n
.
ni• PK
I La fréquence marginale de xi est definie par : fi• = n
= j=1 fij .
n•j PJ
I La fréquence marginale de yj est definie par : f•j = n
= i=1 fij .
I La fréquence conditionnelle de xi sachant que Y = yj est :
nij
fi/Y =y = .
j n•j
3.1. DEUX VARIABLES QUANTITATIVES 53

I La fréquence conditionnelle de yj sachant que X = xi est :


nij
fj/X=x = .
i ni•
Propriété : La relation entre les differentes fréquences s’exprime
par : fij = fi/Y =y × f•j = fj/X=x × fi• ,
j i
fij fij
ou encore : fi/Y =y = f•j
et fj/X=x = fi•
.
j i

Dans le tablau suivant, on donne les fréquences des couples (xi , yj ) et les fréquences
marginales des modalités xi et yj correspondantes aux données de l’Exemple 3.1 :

HH Y
HH
[4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Totaux
X HH
0 f11 = 0.05 f12 = 0.05 f13 = 0 f14 = 0 f15 = 0 f1• = 0.10
1 f21 = 0.15 f22 = 0 f23 = 0.05 f24 = 0 f25 = 0 f2• = 0.20
2 f31 = 0 f32 = 0.10 f33 = 0.20 f34 = 0.05 f35 = 0 f3• = 0.35
3 f41 = 0 f42 = 0 f43 = 0.05 f44 = 0.15 f45 = 0.10 f4• = 0.30
4 f51 = 0 f52 = 0 f53 = 0 f54 = 0 f55 = 0.05 f5• = 0.05
Totaux f•1 = 0.20 f•2 = 0.15 f•3 = 0.30 f•4 = 0.20 f•5 = 0.15 1

Table 3.10 – Tableau représentant les fréquences et les fréquences marginales


de l’Exemple 3.1

En tenant compte du tableau (Table 3.8), les fréquence conditionnelles de Y sachant


que le salarié a trois enfants sont données par :

Y/X=3 [4, 4.72[ [4.72, 5.44[ [5.44, 6.16[ [6.16, 6.88[ [6.88, 7.6] Total
fréquences f1/X=3 = 0 f2/X=3 = 0 f3/X=3 = 16 f4/X=3 = 36 f5/X=3 = 26 1

Table 3.11 – Tableau représentant les fréquences conditionnelles de Y sa-


chant que X = 3

Et d’après le tableau (Table 3.9), les fréquences conditionnelles de X sachant que le


salarié a un salair mensuel compris entre 6160Dh et 6880Dh sont :
(Avec, y4 = [6.16, 6.88[)
54 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

X|Y =[6.16,6.88[ 0 1 2 3 4 Total


1 3
fréquences f1/Y =y = 0 f2/Y =y = 0 f3/Y =y = 4
f4/Y =y = 4
f5/Y =y = 0 1
4 4 4 4 4

Table 3.12 – Tableau représentant les fréquences conditionnelles de X sa-


chant que Y = [6.16, 6.88[

3.1.2 Caractéristiques numériques


1. Moyennes et variances des distributions marginales :

I La moyenne de la distribution marginale de la variable X est donnée


par :
J J
1X X
x= ni• xi = fi• xi .
n i=1 i=1

I La moyenne de la distribution marginale de la variable Y est donnée


par :
K K
1X X
y= n•j yj = f•j yj .
n j=1 j=1

I La variance de la distribution marginale de la variable X est donnée


par :
J J
1X
ni• x2i − x2 = fi• x2i − x2 .
X
V ar(X) =
n i=1 i=1
q
Et σX = V ar(X).
I La variance de la distribution marginale de la variable Y est donnée
par :
K J
1X
n•j yj2 − y 2 = f•j yj2 − y 2 .
X
V ar(Y ) =
n j=1 j=1
q
Et σY = V ar(Y ).
NB : Dans les formules ci-dessus, on remplace les valeurs de la
variable par les centres de classes dans le cas d’une variable conti-
nue.

2. Moyennes et variances des distributions conditionnelles :


I La moyenne de X sachant que Y = yj est :
J J
1 X X
x/Y =yj = nij xi = fi/Y =y xi .
n•j i=1 i=1
j
3.1. DEUX VARIABLES QUANTITATIVES 55

I La moyenne de Y sachant que X = xi est :


K K
1 X X
y /X=x = nij yj = fj/X=xi yj .
i ni• j=1 j=1

I La variance de X sachant que Y = yj est :


J J
1 X 2 2
fi/Y =y x2i − x2/Y =y .
X
V ar(X/Y =yj ) = nij xi − x/Y =y =
n•j i=1 j
i=1
j j

q
Et σX/Y =y = V ar(X/Y =yj ).
j

I La variance de Y sachant que X = xi est :


K K
1 X
nij yj2 − y 2/X=x = fj/X=x yj2 − y 2/X=x .
X
var(Y/X=xi ) =
ni• j=1 i
j=1
i i

q
Et σY/X=x = var(Y/X=xi ).
i

NB : Dans les formules ci-dessus, on remplace les valeurs de la


variable par les centres de classes dans le cas d’une variable conti-
nue.

En reprenant les données de l’Exemple 3.1, on a :

I La moyenne de la distribution marginale de la variable X est :

x = 0.1 × 0 + 0.2 × 1 + 0.35 × 2 + 0.3 × 3 + 0.05 × 4 = 2

et : var(X)
√ = 0.1 × 02 + 0.2 × 12 + 0.35 × 22 + 0.3 × 33 + 0.05 × 43 − 22 = 1.1, et :
σX = 1.1 ∼ = 1.05.

I La moyenne de la distribution marginale de la variable Y est :

y = 0.2 × 4.36 + 0.15 × 5.08 + 0.3 × 5.8 + 0.2 × 6.52 + 0.15 × 7.24 = 5.764

et : var(Y )√= 0.2×4.362 +0.15×5.082 +0.3×5.82 +0.2×6.522 +0.15×7.242 −5.7642 ≈ 0.906,


et : σY = 0.906 ∼ = 0.95.

NB : On a utilisé ici, les centres de classes comme valeurs pour la variable continue Y .
56 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

I En tenant compte du tableau 3.11, la moyenne conditionnelle de Y sachant que X = 3 est :


1 3 2
y /X=3 = 0 × 4.36 + 0 × 5.08 + × 5.8 + × 6.52 + × 7.24 = 6.64
6 6 6
et :var(Y/X=3 ) = 0 × 4.362 + 0 × 5.082 + 61 × 5.82 + 36 × 6.522 + 62 × 7.242 − 6.642 = 0.2448

et : σY/X=3 = 0.2448 ≈ 0.50.

NB : On a utilisé ici, les centres de classes comme valeurs pour la variable continue Y .

I D’après les données du tableau 3.12, la moyenne conditionnelle de X sachant que Y =


[6.16, 6.88[ est :
1 3
x/Y =[6.16,6.88[ = 0 × 0 + 0 × 1 + × 2 + × 3 + 0 × 4 = 2.25
4 4
1 3
et : var(Y/X=3 ) = 0 × 02 + 0 × 12 + × 22 + × 32 + 0 × 42 − 2.252 = 2.6875 et :
√ 4 4
σX/Y =[6.16,6.88[ = 2.6875 ≈ 1.64.

3.1.3 Relations statistiques


1. Independance
La variable Y est dite indépendante de la variable X pour la population
étudiée lorsque la distribution conditionnelle de Y par rapport à une
modalité de X est la même, quelque soit la modalité. Si la variable Y
est indépendante de la variable X, alors on a la relation suivante, pour
tout i et j :
fij = fi• × f•j , ou : fi/Y =y = fi•
j

2. Covariance et corrélation linéaire


Pour mesurer la dependance linéaire entre les deux variables X et Y ,
on calcule la covariance, qui généralise à deux variables la notion de
varaince. Sa formule s’exprime par :
J X K J X K
1X X
cov(X, Y ) = nij (xi − x)(yj − y) = fij (xi − x)(yj − y)
n i=1 j=1 i=1 j=1

ou encore, par la formule pratique suivante :


   
J X K J X K
1X X
cov(X, Y ) =  nij xi yj  − x × y =  fij xi yj  − x × y
n i=1 j=1 i=1 j=1
3.1. DEUX VARIABLES QUANTITATIVES 57

Pour les données de l’Exemple 3.1, la covariance est :


5 X
X 5
cov(X, Y ) = fij xi cj − x × y
i=1 j=1

Avec, ci sont les centres de classes de la variable Y . En excluant les valeurs nulles et les fréquences
nulles données dans le tableau 3.10, on aura :

cov(X, Y ) = f21 x2 c1 + f23 x2 c3 + f32 x3 c2 + f33 x3 c3 + f34 x3 c4 + f43 x4 c3 + f44 x4 c4


+ f45 x4 c5 + f55 x5 c5 − x × y
= 0.15 × 1 × 4.36 + 0.05 × 1 × 5.8 + 0.1 × 2 × 5.08 + 0.2 × 2 × 5.8
+ 0.05 × 2 × 6.52 + 0.05 × 3 × 5.8 + 0.15 × 3 × 6.52 + 0.1 × 3 × 7.24
+ 0.05 × 4 × 7.24 − 2 × 5.764
= 0.828
Propriétés :
- La covaraince est un indicateur symétrique :
cov(X, Y ) = cov(Y, X).
- La covariance est une notion qui généralise la variance :
cov(X, X) = V ar(X).
- La covariance vérifie l’inégalié de Cauchy-Schwartz :
[cov(X, Y )]2 ≤ V ar(X)V ar(Y ).
Remarques :
- La covariance prend n’importe quelle valeur réelle, qui peut être po-
sitive, nulle ou négative.
- La covariance dépend des unités de mesures dans lesquelles sont ex-
primées les variables considérées, ce qui rend son interprétation diffi-
cile. D’où la définition de coefficient de corrélation linéaire, noté
r(X, Y ). On l’obtient en divisant la covariance par le produit de l’écart-
type pour X et de l’écart-type pour Y :
cov(X, Y )
r(X, Y ) = .
σX σY

Pour les données de l’Exemple 3.1, le coefficient de corrélation linéaire est :

cov(X, Y ) 0.828
r(X, Y ) = = ≈ 0.83.
σX σY 1.05 × 0.95
58 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

Propriétés :
- Le coefficient de correlation est indépendant de l’échelle utilisée pour
les mesures et prend sa valeur dans l’intervalle [−1, 1].
- Le coefficient de correlation est symétrique : r(X, Y ) = r(Y, X).
- La correlation entre une série statistique et elle-même vaut nécessai-
rement 1, c’est-à-dire que r(X, X) = 1 et r(Y, Y ) = 1.

3. Liaison linéaire :

Le coefficient de correlation est un indicateur qui mesure la présence et


l’intensité de la liaison linéaire entre les deux variable X et Y . Ainsi :
- Plus |r(X, Y )| est proche de 1 plus X et Y sont liées linéairement.
– Plus |r(X, Y )| est proche de 0 plus il y a l’absence de liaison linéaire
entre X et Y .
- Si |r(X, Y )| = 1, alors il existe des nombres réels a et b tels que :
Y = aX + b. Dans ce cas, on dit qu’il y a une liaison linéaire exacte.
- Si r(X, Y ) = 0, alors dans ce cas, les deux variables X et Y sont non
correlées.

Pour la serie données dans l’exemple 3.1, on a r(X, Y ) = 0.83 est une valeur positive
plus proche de 1. On peut dire qu’il y a une dependance linéaire entre le nombre
d’enfants et le salaire mensuel. Autrement dit, plus le salarié a plus d’enfants plus
que son salair est elevé. dans la suite, on va mettre en evidence cette situation
graphiquement et numériquement.

3.1.4 Représentation graphique : le nuage de points

Pour représenter les observations simultanées de deux varaibles quantita-


tives, on considère un repère cartésien où sur lequel chaque couple d’observa-
tion (xi , yj ) sera représenté par un point. Lensemble de ces points est appelé
nuage de points ou diagramme de dispersion.
3.1. DEUX VARIABLES QUANTITATIVES 59

7.24− • •
6.52− • •
5.8− • •

5.08− • •

4.36− •

p p p p
0 1 2 3 4
FIG. 3.1 - Nuage de points associé aux observations de l’Exemple 3.1

Remarque : Dans le cas de deux variables homogènes (exprimées dans la


même unité), on prend la même échelle sur les deux axes ; dans le cas de
deux variables hétérogènes (comme le cas de l’Exemple 3.1), on doit choisir
des échelles appropriées ou bien on considère les variables centrés et réduites,
à savoir qu’une variable centrée et réduite associée à une variable X est la
variable X−x
σX
(elle est de moyenne nulle et d’écart-type égal à 1).

3.1.5 Régression linéaire


Si le nuage de points observé est nettement allongé le long d’une droite
(ou "presque" linéaire), ce qui traduit numériquement par le fait que |r(X, Y )|
est voisin de 1. Alors, il y a de fortes chances que la liaison entre X et Y soit
linéaire. c’est-à-dire qu’on peut exprimer la variable Y comme une fonction
linéaire de X :
Y = aX + b, a, b ∈ R.
Afin de déterminer les valeurs de a et b, on résoud un problème d’optimisation
basé sur la méthode des moindres carrés. Autrement dit, on cherche a
et b qui rendent minimale la quantité suivante :
n
[yi − (axi + b)]2 .
X
F (a, b) =
i=1

On notera que |yi − (axi + b)| représente, dans le nuage de points, la distance
verticale du point de coordonnées (xi , yi ) à la droite d’equation y = ax + b.
La minimisation de F en a et b fournit la solution unique suivante :
cov(X, Y )
a= ; b = y − ax
V ar(X)
60 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

Propriétés :
- La droite d’équation y = ax + b est appelée droite de régression linéaire
de Y sur X ; elle passe par le barycentre du nuage des points, qui le point G
de coordonnées (x, y) et on la note par (DY /X ).
- Si r(X, Y ) > 0, alors a > 0 : la droite (DY /X ) est ascendante.
- Si r(X, Y ) < 0, alors b < 0 : la droite (DY /X ) est descendante.
Pour les observations données dans l’Exemple 3.1, on a vu que r(X, Y ) = 0.83 est
une valeur positive plus proche de 1. La régression linéaire de la variable Y sur la
variable X est donc réalisée et on a :
cov(X, Y ) 0.828
a= = ' 0.75 et b = y − ax = 5.764 − 0.75 × 2 ' 4.264
V ar(X) 1.1

Donc la droite de régression de Y sur X est a pour équation :

(DY /X ) : y = 0.75x + 4.264

et qui est tracée dans la figure suivante :

(DY /X )

7.24− • •
6.52− • •
5.8− ◦• •

5.08− • •

4.36− •

p p p p
0 1 2 3 4
FIG. 3.2 - Droite de régression associée aux observations de l’Exemple 3.1

Remarque :
- Lorsque r(X, Y ) > 0, alors les deux variables ont tendance à varier dans le
même sens (comme le cas de l’Exemple 3.1).
- Lorsque r(X, Y ) < 0, alors les deux variables ont tendance à varier en sens
opposés.
3.2. UNE VARIABLE QUANTITATIVE ET UNE QUALITATIVE 61

3.2 Une variable quantitative et une qualita-


tive
3.2.1 Les données
On considère ici, une variable qualitative X de J modalité : x1 , ..., xk , ..., xJ
et une variable quantitative Y de moyenne y de variance V ar(Y ), définies
toutes les deux sur une même population de n individus.
On note Ck le sous-ensemble des individus qui ont la modalité xk de la
variable X. Ainsi, on a J sous-ensembles : C1 , C2 , ..., Ck , ..., CJ .
On obtient donc une partition de la population étudiées en J classe qui
sont les sous-ensembles Ck (k = 1, ...J).
On note par nk l’effectif de la classe Ck . On a : Jk=1 nk = n.
P

Soient yik (i = 1, 2, ..., nk ), les valeurs prisent par la variable quantitative


Y sur la classe Ck . On peut alors définir la moyenne et la variance partielles
de Y sur chaque classe Ck qu’on les notera respectivemet yk et V ar(yk ) par :
nk nk
1 X 1 X
yk = yik et V ar(yk ) = (yik − yk )2 .
nk i=1 nk i=1

On peut visualiser les données dans le tableau suivant :

C1 (X = x1 ) C2 (X = x2 ) .... Ck (X = xk ) .... CJ (X = xJ )
y11 , y21 , ..., yn1 1 y12 , y22 , ..., yn2 2 .... y1k , y2k , ..., ynk k .... y1J , y2J , ..., ynJ J
y1 y2 .... yk .... yJ
V ar(y1 ) V ar(y2 ) .... V ar(yk ) .... V ar(yJ )

Exemple 3.2
Dans un groupe de 15 étudiants, on s’interesse à leur notes obtenues à un
examen terminal et leur assiduités en cours. Les résultats sont données dans
le tableau suivant :

Etudiant No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Note sur 20 15 14 12 8 16 13 10 17 4 8 11 6 8 7 12
Assiduité A A A A A B B B B B C C C C C

Table 3.13 – Notes obtenues par 15 étudiants à un examen terminal en


fonction de leur assiduité en cours
62 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

Ici, la variable quantitative est la note obtenue notée Y dont la moyenne


est y ' 10.73 et la variance est V ar(Y ) ' 13.93, et la variable qualitative est
l’assiduité notée X qui a trois modalités :
A = parfaite assiduité ; B = assiduité correcte ; C = nombreuses absences.
la population étudiée ici se répartie en trois classes :
- C1 : la classe correspondante à la modalité A dont l’effectif est 5
- C2 : la classe correspondante à la modalité B dont l’effectif est 5
- C3 : la classe correspondante à la modalité C dont l’effectif est 5
Après le calcul des moyennes et variances partielles, on resume les données
dans le tableau siuvant :

C1 (X = A) C2 (X = B) C3 (X = C)
15, 14, 12, 8, 16 13, 10, 17, 4, 8 11, 6, 8, 7, 12
y1 = 13 y2 = 10.4 y3 = 8.8
V ar(y1 ) = 8 V ar(y2 ) = 19.44 V ar(y3 ) = 5.36

Table 3.14 – Tableau représentant les données de l’Exemple 3.2

3.2.2 Représentation graphique

On utilise en général un graphique en boîtes parallèles. Sur un même gra-


phique doté d’une échelle verticale unique on représente pour Y une boîte
pour chacune des classes définies par X. La comparaison de ces boîtes donne
une idée assez claire de la liaison entre les deux variables ; plus les boîtes sont
positionnées différemment, plus les valeurs de Y sont fonction de X, donc
plus les deux variables sont liées.

Illustration
La boîte représentante la variable Y pour une classe définie par la variable X
est la partie du graphique comprise entre les premier et troisième quartille de
Y . La mediane située à l’intérieur de la boîte est représentée par un trai hori-
zental. Dans les parties haute et basse de la boîte figurent des traits verticals
joignant le minimum au premier quartile (en bas) et le toisième quartile au
maximum (en haut).
3.2. UNE VARIABLE QUANTITATIVE ET UNE QUALITATIVE 63

Pour les données dans l’Exemple 3.2, les valeurs de la mediane, le premier quartile
et le troisième quartile pour chaque classe défine par X sont :
- Pour la classe C1 : la mediane est 14, le premier quartille est 12 et le troisième
quartile est 15.
- Pour la classe C2 : la mediane est 10, le premier quartille est 8 et le troisième
quartile est 13.
- Pour la classe C3 : la mediane est 8, le premier quartille est 7 et le troisième quartile
est 11.
Ainsi, le graphique en boîtes parallèles représenatant les données de l’Exemple 3.2
est le suivant :

120−

18−

16−

14−

12−

10−

8−

6−

4−

2−

p p p
0 C1 C2 C3
FIG. 3.3 - Boîtes parallèles associées aux observations de l’Exemple 3.2

Remarque :
Les boîtes parallèles de cet exemple sont positionnées différemment, donc
elles indiquent une liaison importante entre les notes obtenues et l’assiduité.
64 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE

3.2.3 Liaison entre variable quantitative et variable qua-


litative
1. Formules de décomposition
- La décomposition de la moyenne y sur la partition définie par X est
donnée par la formule :
J
1X
y= nk yk .
n k=1
- La décomposition de la variance de Y sur la partition définie par X
est donnée par la formule :
J J
1X 2 1X
V ar(X) = nk (yk − y) + nk V ar(yk ).
n k=1 n k=1

- la quantité n1 Jk=1 nk (yk − y)2 est appelée variance expliquée par X ;


P

( on l’appelle aussi variance inter-classes, ou entre les classes) ; et est


notée s2E .
- la quantité n1 Jk=1 nk V ar(yk ) est appelée variance résiduelle ; ( on
P

l’appelle aussi variance intra-classes, ou à l’intérieur des classes) ; et est


notée s2R .
En reprenant les données de l’Exemple 3.2 et en tenant compte du tableau 3.14, on
aura :
-
3
1 X
s2E = nk (yk − y)2
15 k=1
1 h i
= 5 × (13 − 10.73)2 + 5 × (10.4 − 10.73)2 + 5 × (8.8 − 10.73)2
15
' 3

-
3
1 X 1
s2R = nk V ar(yk ) = (5 × 8 + 5 × 19.44 + 5 × 5.36) ' 10.93
15 k=1 15
1 P3
- On vérifie bien que : y = 15 k=1 nk yk et V ar(Y ) = s2E + s2R .

2. Rapport de corrélation
C’est un indice de liaison entre les deux variables X et Y noté CY /X .
Il est défini par : v
u s2E
u
sE
CY /X = t =
V ar(Y ) σY
3.2. UNE VARIABLE QUANTITATIVE ET UNE QUALITATIVE 65

Propriétés :
- CY /X est compris entre 0 et 1.
- Plus que CY /X est grand, plus la liaison entre X et Y est forte.
Pour les données d l’Exemple 3.2, on a :
v s
s2E
u
u 3
CY /X = t = ' 0.46,
V ar(Y ) 13.93
un valeur qui est grande, ce qui implique qu’il y une liaison importante entre les
notes obtenues et l’assiduité. D’où le résultat déjà indiqué par les boîtes parallèles
(Fig 3.3).
66 CHAPITRE 3. STATISTIQUE DESCRIPTIVE BIVARIÉE
Chapitre 4

Taux et indices

4.1 Calcul du taux


4.1.1 Le taux d’évolution et coefficients multiplicateurs
Definition. On appelle taux d’évolution ; (appelé aussi taux de crois-
sance) ; entre une valeur initiale Vi et une valeur finale Vf le nombre réel noté
T et défini ainsi :
Vf
T = −1
Vi
On a : T = VVfi − 1 ⇔ Vf = (1 + T )Vi .
Remarques :
- Le taux peut s’exprimé en pourcentage en multipliant T par 100 ; c.à.d :
100T %
- Vf − Vi est appelé variation absolue.
- Si T > 0 l’évolution est une augmentation.
- Si T < 0 l’évolution est une dimninuation.
- 1 + T est dit coefficient multiplicateur et noé souvent CM.
Exemple :

Vi Vf T CM Type d’évolution variation absolue


9 12.96 14.4% 2.44 Augmentation 3.96
24 18 −25% 0.75 Diminuation -6

Table 4.1 – Exemple de taux d’évolutions

67
68 CHAPITRE 4. TAUX ET INDICES

4.1.2 Évolutions successives


Si T1 , T2 , ...., Tk sont des taux successifs. Alors, le taux global sur la pé-
riode 1,2,...k est :
T = (1 + T1 )(1 + T2 )....(1 + Tk ) − 1.
Exemple : Soit une hausse de 3% suivie d’une hausse de 5% puis d’une
baisse de 4%. Qulle est le taux d’évolution global sur les 3 périodes ?
Réponse : T = (1 + 0.03)(1 + 0.05)(1 − 0.04) − 1 = 0.03824 ; c.à.d : 3.824%

4.1.3 Taux d’évolution moyen


Soit T = (1 + T1 )(1 + T2 )....(1 + Tk ) − 1, le taux d’évolution global sur la
période 1, . . . , k.
Le taux de d’évolution moyen sur cette période est donné par :
√ q
T = k 1 + T − 1 = k (1 + T1 )(1 + T2 )....(1 + Tk ) − 1.
Le coefficient multiplicateur 1 + T est alors la moyenne géométrique des
coefficients 1 + T1 , 1 + T2 , ..., 1 + Tk .
Exemple : soit une grandeur qui a augmenté successivement de 10%, 20%
et 40%.
Son taux global est T = (1 + 0.1)(1 + 0.2)(1 + 0.4) − 1 = 0848.
Et son taux d’évolution moyen sur les trois périodes est :
√ √
3
T = 3 1 + T − 1 = 1.848 − 1 = 0.227.

4.1.4 Taux d’évolution d’un produit et d’un rapport


Soient deux grandeurs à la date t : Ut = (1 + TU )U0 et Vt = (1 + TV )V0 .
- La grandeur qui représente leur produit est :
Wt = Ut × Vt = (1 + TU )(1 + TV )U0 V0 = (1 + TU )(1 + TV )W0 .
Et son taux d’évolution est :
Wt
TW = − 1 = (1 + TU )(1 + TV ) − 1.
W0
- La grandeur qui représente leur rapport est :
Ut (1 + TU )U0 1 + TU
Zt = = = Z0 .
Vt (1 + TV )V0 1 + TV
Et son taux d’évolution est :
Zt 1 + TU
TZ = −1= − 1.
Z0 1 + TV
4.2. INDICES 69

4.2 Indices
L’indice d’une grandeur est le rapport entre la valeur de cette grandeur au
cours d’une période courante et sa valeur au cours d’une période de base. Il
mesure la variation relative de la valeur entre la période de base et la période
courante. Souvent, on multiplie le rapport par 100 ; on dit : indice base 100.

4.2.1 Indices élémentaires


Définition : L’indice élémentaire base 100 d’une grandeur Vt à la date t
par rapport à la date 0 est défini par :
Vt
It0 = × 100,
V0
où, V0 représente la valeur de référence.
Exemple : Si le prix du litre d’essence passe de 9.80Dh en 2017 à 10.30Dh
en 2018, l’indice du prix du litre d’essence base 100 entre 2017 et 2018 est :
10.29
I20182017 = × 100 = 105.
9.80
Remarque :
- Le lien entre le taux et l’indice s’exprime par :
Vt It0
CM = 1 + T = = ⇒ It0 = (1 + T ) × 100.
V0 100
- un indice supérieur à 100 correspond à une hausse : Vt > V0 .
- Un indice inférieur à 100 correspond à une baisse : Vt < V0 .
Propriétés :
Un indice élémentaire satisafait à la propeiété de :
1. Circularité ou transférabilité :
Si une grandeur V prend les valeurs V0 , Vt et Vt0 aux instants 0 ; t et t0
alors son indice est :
1
It0 = Itt0 × It0 0 × .
100
Exemple : Le chiffre d’affaires (CA) d’une entreprise a augmenté de
30% de 2014 à 2016 et a diminué de 25% de 2016 à 2018. Le CA a-t-il
diminué ou augmenté de 2014 à 2018 ?
Réponse : On a :
1 130 × 75
I20182014 = I20182016 × I20162014 × = = 97.5.
100 100
70 CHAPITRE 4. TAUX ET INDICES

Puisque I20182014 < 100, alors le chiffre d’affaire (CA) a diminué, et le


I
taux d’évolution est de ( 2018
100
2014
− 1)% ; c.à.d : −0.025. Donc il y a une
diminuation de 2.5%.

2. réversibilité :
Si une grandeur V prend les valeurs V0 et Vt aux instants 0 et t alors
son indice est :
1002
I0t = .
It0
Exemple : Si un prix augmente de 20% de 2016 à 2018, que dire de
son évolution de 2018 à 2016 ?
Réponse : On a I20182016 = 120 et on cherche I20162018 .
1002
Alors, I20162018 = I2018 ' 83.33.
2016
Autrement dit, le prix a diminué de 16.76% de 2018 à 2016. .

3. Indice de produit et de rapport :


- Si une grandeur V est égale au produit des grandeurs V1 et V2 ; c.à.d :
V = V1 V2 , alors son indice est :

V V1

V2
 1
It = It × It × .
0 0 0
100

- Si une grandeur V est égale au rapport des grandeurs V1 et V2 ; c.à.d :


V = VV12 , alors son indice est :

V1
!
V It 1
It = V2
0
× .
0
It 0
100

Exemple : Soit P et Q les prix et quantités d’un produit vendu par


une entreprise. Si le prix de ce produit augmente de 60% de 2014 à
2018 et si les quantités vendues ont diminue de 50% de 2014 à 2018,
quelle est l‘évolution des recettes de 2014 à 2018 ?
P Q
Réponse : On a : I2018 2014
= 160 et I2018 2014
= 50. On cherche
R
I2018 2014
tel que : R = P Q. Alors :

R

P Q
 1 160 × 50
I2018 = I2018 × I2018 × = = 80.
2014 2014 2014
100 100

Par suite, les recettes ont diminué de 20% de 2014 à 2018.


4.2. INDICES 71

4.2.2 Indices synthétiques


Un indice symthétique mesure la variation de la valeur d’une grandeur
complexe définie comme l’agrégation d’un ensemble de grandeurs élémen-
taires. Les indices synthétiques les plus utilisés en économie sont ceux de
Laspeyres, Paasche et Fisher. A l’aide desquels on peut mesurer l’évolu-
tion des composants prix et quantités.
Notation : Dans un panier de J produits (ou biens), on notera :
- Pj (t) : le prix du produit j à l’instant t.
- Qj (t) : la quantité du produit j à l’instant t.
- Vj (t) = Pj (t) × Qj (t) : la valeur du produit j à l’instant t.
- V (t) = j Vj (t) = j (Pj (t) × Qj (t)) : la valeur globale de l’ensemble de
P P

produits.
- L’indice de la valeur globale est :

(Pj (t) × Qj (t))


P
Vt
V
It = × 100 = P j × 100.
V0 j (Pj (0) × Qj (0))
0

Exemple : Examninons le panier d’une ménagère au temps 2014 et 2018. Il


contient quatre produits dont le prix et les quantités achetées figurent dans
le tableau suivant :

2014 2018
Prix (Dh) Quantité Prix (Dh) Quantité
Produit 1 3.88 7 4.13 8
Produit 2 7.50 4 8.42 3
Produit 3 12.45 3 11.71 5

Quelle est l’évolution des recettes pour ce panier ?


Réponse : L’indice de la valeur globale pour ce panier est :

(Pj (2018) × Qj (2018)) 4.13 × 8 + 8.42 × 3 + 11.71 × 5


P
V
I2018 = Pj ×100 = ×100 ' 123.64.
j (Pj (2014) × Qj (2014)) 3.88 × 7 + 7.5 × 4 + 12.45 × 3
2014

Les recettes ont donc augmenté de 23.64% de 2014 à 2018. Mais cette aug-
mentation est-elle due à une augmentation des prix ou des quantités ?
Pour pouvoir déterminer l’influence des prix ou des quantités, il faut définir
des scénarios permettant d’isoler soit les prix soit les quantités. C’est l’idée
des indices de Laspeyres et de Paasche :
72 CHAPITRE 4. TAUX ET INDICES

1. Indice de Laspeyres des prix : C’est un indice qui mesure des prix
des biens composant un panier entre deux dates 0 et t, en prenant
comme référence la valeur du panier au temps initial t = 0 et en sup-
posant que les quantités des biens du panier n’ont pas varié entre les
deux dates. Il est donné par la formule :

(Pj (t) × Qj (0))


P
LPt0 = Pj × 100.
j (Pj (0) × Qj (0))

2. Indice de Laspeyres des quantités : C’est un indice qui mesure


des prix des biens composant un panier entre deux dates 0 et t, en
prenant comme référence la valeur du panier au temps initial t = 0 et
en supposant que les prix des biens du panier n’ont pas varié entre les
deux dates. Il est donné par la formule :

(Pj (0) × Qj (t))


P
LQ
t0 = Pj × 100.
j (Pj (0) × Qj (0))

En reprenant l’exemple précédent, les indices de Laspeyres des prix et


des quantités respectivement sont :

(Pj (2018) × Qj (2014))


P
LP20182014 = Pj × 100
j (Pj (2014) × Qj (2014))
4.13 × 7 + 8.42 × 4 + 11.71 × 3
= × 100
3.88 × 7 + 7.5 × 4 + 12.45 × 3
' 103.40.

(Pj (2014) × Qj (2018))


P
LQ
20182014 = Pj × 100
j (Pj (2014) × Qj (2014))
3.88 × 8 + 7.5 × 3 + 12.45 × 5
= × 100
3.88 × 7 + 7.5 × 4 + 12.45 × 3
' 122.50.

Interpretation : A quantités fixées en 2014, les prix ont augmentés


de 3.4% de 2014 à 2018. Et à prix fixés en 2014, les quantités ont aug-
menté de 22.5%.
4.2. INDICES 73

3. Indices de Paasche : Les indices de Paasche des prix et des quantités


sont respectivement définis par :

(Pj (t) × Qj (t))


P
P
Pt = Pj × 100.
j (Pj (0) × Qj (t))
0

(Pj (t) × Qj (t))


P
Q
Pt = Pj × 100.
j (Pj (t) × Qj (0))
0

En reprenant l’exemple précédent, les indices de Paasche des prix et


des quantités respectivement sont :

(Pj (2018) × Qj (2018))


P
P
P2018 = Pj × 100
j (Pj (2014) × Qj (2018))
2014

4.13 × 8 + 8.42 × 3 + 11.71 × 5


= × 100
3.88 × 8 + 7.5 × 3 + 12.45 × 5
' 100.90.

(Pj (2018) × Qj (2018))


P
Q
P2018 = Pj × 100
j (Pj (2018) × Qj (2014))
2014

4.13 × 8 + 8.42 × 3 + 11.71 × 5


= × 100
4.13 × 7 + 8.42 × 4 + 11.71 × 3
' 119.58.

Interpretation : A quantités fixées en 2018, les prix ont augmentés


de 0.9% de 2014 à 2018. Et à prix fixés en 2018, les quantités ont aug-
menté de 19.58%.

4. Indices de Fisher : Les indices de Fisher des prix et des quantités


sont respectivement définis comme la moyenne géométrique des indices
de Laspeyres et de Paasche des prix (resp. des quantités), c-à-d :
q q
Q
P
Ft 0
= LPt0 × Pt
P
0
et Ft 0
= LQ Q
t0 × Pt0 .

Dans le tableaux suivant, on donne les différents indices relativement


à l’exemple précédent :
74 CHAPITRE 4. TAUX ET INDICES

V
I20182014
LP20182014 LQ
20182014
P
P20182014
Q
P2018 2014
P
F20182014
Q
F20182014
123.64 103.90 122.50 100.90 119.58 102.14 121.03

Vous aimerez peut-être aussi