Vous êtes sur la page 1sur 178

Université Cadi Ayyad Filière 

: Sc. Eco. et de Gestion


Faculté des Sciences Juridiques Economiques et Module : Méthodes Quantitatives I
Sociales - Marrakech Matière : Statistique Descriptive I
Année universitaire : 2020/2021 1° Semestre

 LES OUTILS DE TRAITEMENT DE


L’INFORMATION

 STATISTIQUE DESCRIPTIVE

Présenté par
Pr : Fouad NAOUI.

10/11/21 STAT F. NAOUI 1


PRESENTATION

1) Intérêts et objectifs du cours;

2) Méthodologie à suivre;

3) Présentation du programme de la matière;

4) Présentation de La Bibliographie.

10/11/21 STAT F. NAOUI 2


3. PROGRAMME
Titre I - La présentation des statistiques:
-Les termes de la statistique

-Tableaux et graphiques statistiques

Titre II - Statistique descriptive à une dimension :


La réduction des données
-Les caractéristiques de tendance centrale statistique

-Les caractéristiques de dispersion

-Les caractéristiques de concentration et de formes

Titre III - Statistique descriptive à deux dimensions:


L’analyse de la relation entre deux variables
10/11/21 STAT F. NAOUI 3
Titre IV– Les indices statistiques : Plan du Chapitre

S1 : Les indices élémentaires : principes généraux


-

-Définition, propriétés et premiers calculs d’indices

S2 : Les indices synthétiques : principes généraux


-Les indices classiques : I/Prix ; I/Quantité ; I/Valeurs.
-Les indices arithmétiques et harmoniques

S3 : Les indices de LASPEYRES


-
-I/LAS des Prix - I/LAS des Quantités

S4 : Les indices de PAASCHE


-
-I/ PAASCHE des Prix - I/PAASCHE des Quantités

S5 : L’indices de FISCHER : L’indice de valeur


-

10/11/21 STAT F. NAOUI 4


TITRE V:
LES SÉRIES CHRONOLOGIQUES

 S1) : Intérêt, définitions et présentation graphique;

 S2) : Les notions mathématiques indispensables à la compréhension de


celles-ci ;

 S3) : Les méthodes courantes : Les méthodes d’ajustement et de


lissage;

 S4) : Mesure des composantes d’une SC.

10/11/21 STAT F. NAOUI 5


4. BIBLIOGRAPHIE
BOURSIN,j.(1992) « Statistique Descriptive » Paris Montchrestien. 
1.

LETHIELLEUX,M.(1998) « Statistique Descriptive » Paris Dunod. 


2.

LABROUSSE, C. (1988) « Statistiques exercices corrigés avec


3.

rappels de cours » Ed. Dunod 5ème édition . 

GRAIS B. (1991-98) « Exercices corrigés de Statistique Descriptive »


4.

Ed. Dunod 3ème édition. 

5.HUBLER, J. (2007) « Statistique descriptive appliquée à la gestion et


à l’économie » Paris breal, 2007.

10/11/21 STAT F. NAOUI 6


Partie I :
LA PRESENTATION DES STATISTIQUES :

Les termes de la statistique descriptive


-

Tableaux et graphiques statistiques


-

10/11/21 STAT F. NAOUI 7


Chapitre I:
Les termes de la statistique descriptive

1. Qu’est-ce-que la statistique descriptive ?

2. Le vocabulaire de la statistique
descriptive

3. Le processus de la statistique descriptive.

10/11/21 STAT F. NAOUI 8


Les termes de la statistique descriptive
1- Qu’est-ce-que la statistique descriptive ?
La statistique descriptive (moderne), dont les origines remontent à
environ 1660, apparait comme une science d’observation (et/ou
collecter), de classement, de synthèse et d’interprétation des
grandeurs observées.

La statistique descriptive est la partie de la statistique qui sert à


décrire un phénomène, c-à-d de mesurer, classer les mesures,
présenter ces mesures par quelques indicateurs de manière à donner
une idée simple et rapide d’un phénomène étudié.

Attention : Les statistiques se sont des données chiffrées relatives à


un phénomène étudié.

10/11/21 STAT F. NAOUI 9


1- Qu’est-ce-que la statistique descriptive ?
Aujourd’hui la statistique apparait comme un outil de
plus en plus crucial dans tous les domaines de l’activité
humaine. Elle intervient dans l’agriculture, la biologie , les
affaires, les communications, la chimie, l’éducation,
l’économie, la sociologie, etc.

Ainsi, en tant qu’instrument de la connaissance, la


statistique est indispensable à celui qui veut analyser une
situation lui permettant de porter un jugement afin de
prendre une décision et faire des prévisions futures.

10/11/21 STAT F. NAOUI 10


1- Qu’est-ce-que la statistique descriptive ?

Donc, appliquée dans différents domaines, l’analyse


statistique se caractérise généralement par :

 ses concepts utilisés

 ainsi que par sa propre méthodologie appelée démarche


statistique.

10/11/21 STAT F. NAOUI 11


2. Le vocabulaire de la statistique descriptive
Comme toute discipline, la statistique a son propre vocabulaire
qu’il faut connaître :

- La Population (univers ou l’ensemble statistique) :


c’est l’ensemble d’individus ou d’unités statistiques (personnes, objets,
concepts abstraits) observées et étudiées. 

Exemples :
- la population des étudiants de telle université ;

- la population des entreprises;

- la population des appareils électroniques;

- les salaires distribués par les entreprises ;

10/11/21 STAT F. NAOUI 12


2. Le vocabulaire de la statistique descriptive
- L’Individu ou l’unité statistique : C’est l’élément de
base de la population

- L’Echantillon : Il constitue une partie (un sous-


ensemble) de la population qui fera l’objet d’une
analyse partielle.

- L’Enquête : Ensemble des opérations à entreprendre


pour collecter des données relatives à une
population.

10/11/21 STAT F. NAOUI 13


2. Le vocabulaire de la statistique descriptive

 Recensement : si toutes les unités de la population


considérée sont observées individuellement, l’enquête est
dite complète ou exhaustive. On parle aussi de
recensement.

 Sondage: On parle de sondage lorsque la partie des unités


statistiques de la population étudiée est appelée
échantillon. Dans ce cas l’enquête est dite partielle ou par
échantillonage.

10/11/21 STAT F. NAOUI 14


2. Le vocabulaire de la statistique descriptive

On parlera alors de :

Analyse exhaustive Analyse par échantillon

Recensement Echantillon

Généralisation

10/11/21 STAT F. NAOUI 15


2. Le vocabulaire de la statistique descriptive

Caractère : un caractère est un phénomène étudié sur une population donnée. C’est l’élément commun à toute la population étudiée.

Exemples : Exemples :
les étudiants d’un les fleurs d’un jardin
établissement peuvent peuvent être
être étudiés selon les étudiées selon les
caractères :
caractères :
 notes
 Couleur
 niveau d’étude
 Milieu d’origine
 branche
 Etat civil
 âge
10/11/21 STAT F. NAOUI 16
2. Le vocabulaire de la statistique descriptive
 Les Modalité : Dans une population donnée, un caractère peut varier
d’un individu à l’autre. On dit que ce caractère présente différentes
modalités.

 On appelle Modalités d’un caractère les différentes situations (numérique


ou pas) que peut prendre un caractère auprès des unités statistiques étudiées.

Exemples: Exemple :
- Le caractère sexe peut prendre - Pour l’«état matrimonial» des
2 modalités : - masculin - féminin personnes on aura 5 modalités
- Pour les étudiants étudiés selon possibles : célibataire, marié,
le caractère du niveau d’étude, on divorcé, veuf, en concubinage.
trouve :
* niveau 1ère année,
* niveau 2ème année, ...

10/11/21 STAT F. NAOUI 17


2. Le vocabulaire de la statistique descriptive

Caractère Quantitatif Caractère Qualitatif
c’est un caractère mesurable c’est un caractère non
dont les modalités sont mesurable. Les modalités ne
représentées par des chiffres. sont plus représentées par
Exemples : des nombres mais par des
- les chiffres d’affaires,
situations, des états ou des
considérations diverses.
- les salaires,
Exemples :
- les notes,
* la couleur des fleurs,
- le nombre d’enfants par

famille, ... * le sexe,


* les branches d’activité,
* les typologies des Eses, ...

10/11/21 STAT F. NAOUI 18


2. Le vocabulaire de la statistique descriptive

Caractère Quantitatif

Caractère Quantitatif continu Caractère Quantitatif discret


ou discontinu
 C’est une variable qui ne peut
 Il peut prendre n’importe quelle prendre que des valeurs entières :
valeurs à l’intérieur d’un opération de dénombrement ou
intervalle donné. Il existe dans ce comptage
cas une infinité de valeurs
possibles à l’intérieur d’un
 Exemple :
 nombre d’enfant par famille,
intervalle  nombre d’épreuves réussies en fin
 Exemple : le poids, la taille d’année,
 nombre de page d’un livre

10/11/21 STAT F. NAOUI 19


3. Processus de l’analyse statistique.
 
Le processus désigne la démarche statistique à laquelle on recours
généralement pour analyser et traiter un phénomène. Celle-ci se
base notamment sur :

le recensement exhaustif ou partiel des données;

le regroupement des données;

 le traitement des données;

L’extrait des informations.


10/11/21 STAT F. NAOUI 20
3. Processus de l’analyse statistique.
 Il est récapitulé par le schéma suivant :
Recensement
Échantillon
Les modèles Statistique
d’Estimation Inférentielle
Collecte/Codage/
Enregistrement
Les modèles des Statistique de
Probabilités Probabilités
Constitution des
fichiers des données

Sortie des résultats Présentation et


dépouillement Statistique
Descriptive
Analyse statistique Calcul des
des résultats caractéristiques

10/11/21 STAT F. NAOUI 21


3. Processus de l’analyse statistique.

Il en sort ainsi que la statistique descriptive est un ensemble d’outils


qui permettent de décrire et de réduire les populations nombreuses.

Pour se faire, elle utilise une démarche particulière nécessitant les


étapes suivantes:

1.Groupement des données (tableaux, représentations graphiques)

2.Traitement des informations obtenues (calcul des caractéristiques);

3.Analyse des résultats.

10/11/21 STAT F. NAOUI 22


Exercices
Exercice N°I
A partir des tableaux suivants, préciser: La population, l’unité statistique,
le caractère, le nombre des modalités, la nature du caractère et la
représentation graphique appropriée.

 Structure de l’emploi au Maroc – Année N  Répartition du nombre de pièces par


Secteurs d’activité Part (%) maison selon le milieu de résidence:
Ag, Fo, Pê et Mine 4,9
Nombre de pièces M. Urbain (%)
Industrie, Bâtiment 34,5
1 pièce 24,68
Commerce 19
2 pièces 21,45
Hôtels et restaurants 2,7
3 pièces 20,50
Transport et communication 7,9
Finances et Banques 6,6 4 pièces 16,54
Emploi domestique 20,3 5 pièces et + 16,83
Secteur public 4,1 Total 100
Total 100
10/11/21 STAT F. NAOUI 23
Chapitre II:
Distributions, tableaux et graphiques statistiques

 Introduction
Après la collecte d’information, l’analyse statistique
nous réserve en général trois différentes méthodes
pour décrire et expliquer les phénomènes nombreux :
ü    Les tableaux statistiques ;
ü    Les représentations graphiques ;
ü Le calcul des différentes caractéristiques des
populations étudiées.

10/11/21 STAT F. NAOUI 24


Chapitre II:
Distribution, Tableaux et Graphiques statistiques
I. Distribution et Tableaux statistiques

II. Représentation graphique : Les


graphiques statistiques

10/11/21 STAT F. NAOUI 25


I. DISTRIBUTION ET TABLEAUX STATISTIQUES
A. Distributions statistiques

a) Les Séries Statistiques : Définition


Une série statistique est une simple énumération des unités observées :
x1 ; x2 ; x3 ; ....... ; xi ; ...... ; xn
n1 ; n2 ; n3 ; ....... ; ni ; ...... ; np avec :

* xi  : représente la modalité « i » du caractère x (observé)


* ni : représente le nombre de fois où xi est observée.
* n : représente l’effectif total des unités observées.
Exemple : le nombre d’enfants dans 60 familles
- Les observations : 1 ; 6 ; 2 ; 3 ; 0 ; 3 ; 5 ; 4 ; .....
- Effectif : 60 familles
10/11/21 STAT F. NAOUI 26
I. DISTRIBUTION ET TABLEAUX STATISTIQUES
A. Distributions statistiques

b) Définition d’une distribution statistique:


« La distribution Statistique se définit par
la manière de regrouper et d’organiser les
unités statistiques observées »
Elles concernent le codage et l’enregistrement
des séries statistiques observées afin de les
rendre plus représentatives des phénomènes
étudiés.

10/11/21 STAT F. NAOUI 27


I-A. Distributions statistiques

c) Typologie des DS
c-1. Les distributions non groupées
Il s’agit de présenter toutes les observations sous une forme plus
simple à comprendre et à interpréter.
Modalités Effectifs ni Fréquences fi

M1 n1 f1
M2 n2 f2
n3 f3
M3
n4 f4
M4
Total n 1
10/11/21 STAT F. NAOUI 28
Exemple 1 : le nombre d’enfants dans 60 familles
Nbre d’enfants Effectif absolu Fréquence
par famille xi ni relative fi
1 20 0,33
2 15 0,25
3 11 0,17
4 09 0,15
5 et plus O5 0,1
Total 60 1

10/11/21 STAT F. NAOUI 29


Exemple 2 : le nombre des entreprises
marocaines dans les principaux secteurs
d’activité.
Secteurs effectifs fréquences

Primaire 725 0.28


Secondaire 905 0.34
Tertiaire 1000 0.38

Total 2630 1

10/11/21 STAT F. NAOUI 30


I-A. Distributions statistiques
c) Typologie des DS
c-1. Les distributions groupées
On parle de distribution groupée lorsque les valeurs
observées sont trop nombreuses de telle manière que leur lecture
pose des difficultés dans l’analyse.
Ainsi les valeurs se trouvent groupées sous forme de «classes
distinctes».
Chaque classe aura alors :
-   une valeur minimale (borne inférieure)
-   une valeur maximale (borne supérieure)
-   un centre de classe (ou valeur médiane)

10/11/21 STAT F. NAOUI 31


I-A. Distributions statistiques

le tableau deviendra alors:

Classes Effectifs ni Centres Ci Fréquences fi

[a , b] n1 (a+b)/2 f1
[c , d] n2 (c+d)/2 f2
n3 f3
[e , f] (e+f)/2
f4
Total n 1

10/11/21 STAT F. NAOUI 32


Exemple : Supposons la distribution statistique
des salaires de l’entreprise marocaine SOFAX.
Salaires Effectifs ni Centres Ci Fréquences fi

[5 000, 15 000[ 125 10 000 0.71


[15 000, 20 000[ 25 17 500 0.14
[20 000, 30 000[ 15 25 000 0.09
[30 000,35 000] 10 32 500 0.06

Total 175 1

10/11/21 STAT F. NAOUI 33


I. DISTRIBUTION ET TABLEAUX STATISTIQUES

I-B. Tableaux statistiques


la série statistique appelée également Distribution de


fréquences ou Distribution de statistiques, est un tableau
qui nous donne l’ensemble des valeurs mesurant le
caractère.
Nombre Arbre de Salaires (dh) Effectifs
d’enfants ménages
2 18
[40-60[ 10
3 28 [60-70[ 25
4 10 [70-80[ 05
5 4
total 60 total 40

10/11/21 STAT F. NAOUI 34


I. DISTRIBUTION ET TABLEAUX STATISTIQUES
 I-B. Tableaux statistiques
 - Effectif (fréquence absolue) :
 C’est le nombre d’unités statistiques relatif à une modalité donnée :
Age Effectif absolu Effectif relatif
(fréquence absolue) (fréquence relative)

17-18 200 0,33=34%


 18-19 350 0,58=58%
19-20 50 0,08=8%
total 600 1= 100%
- Fréquence relative :
C’est la part des effectifs d’une modalité.
Exemple: 200/600 = 1/3 = 0,33 est la fréquence relative de la première
modalité.

10/11/21 STAT F. NAOUI 35


I-B. Tableaux statistiques
 - Classes :
La Série statistique peut être simple ou composée de classes.
On appelle classe un groupement de valeurs du
caractère selon des intervalles qui peuvent être égaux ou
inégaux.
Chaque classe est caractérisée par :
-   une borne inférieure (valeur minimale)
-   une borne supérieure (valeur maximale)
-   un centre de classe (ou valeur médiane)

NB : Une classe qui n’a pas de borne inférieur ou


supérieure est dite classe ouverte
10/11/21 STAT F. NAOUI 36
I-B. Tableaux statistiques
 - Intervalle de classe
C’est l’amplitude de classe qui représente l’écart entre les deux
bornes
I = limite (sup)- limite (inf)

 - Centre de classe (ou point central)


Il est calculé comme suit
Ci= [limite (sup) + limite (inf)]/2

NB: « [40-60[ « signifie qu’on comptabilise les salariés qui gagnent


entre 40 et 60DH, en incluant ceux qui gagnent 40 DH et excluant
ceux qui gagnent 60Dh.
10/11/21 STAT F. NAOUI 37
II. Représentation graphique : Les graphiques
statistiques

La représentation graphique est un deuxième moyen


statistique qui sert à visualiser et à déceler les principales
caractéristiques de la distribution statistique.

Différents modes de représentation graphique sont possibles


selon la nature du caractère de la série statistique étudiée.

10/11/21 STAT F. NAOUI 38


II. Représentation graphique : Les graphiques
statistiques

II- 1 . Représentation d’une distribution qualitative

pour les Variables Qualitatives on peut opter pour :

 le Diagramme en « tuyaux d’orgue » ;


 le Diagramme circulaire.

10/11/21 STAT F. NAOUI 39


 le Diagramme en « Tuyaux d’orgue » ;
- Chaque modalité doit être
représentée par un rectangle Diagramme en "Tuyaux d'Orgue"
dont la hauteur est
25000
proportionnelle à l’effectif
correspondant et la base est 20000
constante, 15000

eff. Eses
10000
- La représentation graphique 5000
peut être faite sur la base des 0
fréquences relatives calculées primaire secondaire tertiaire
pour les différentes secteurs
modalités.

10/11/21 STAT F. NAOUI 40


 le Diagramme Circulaire ou
graphique à secteur.

Les modalités sont Diagramme circulaire


représentées par des tertiaire
25% primaire
secteurs dont l’angle est 29%

proportionnel à
l’effectif (ou à la
fréquence
correspondante).
secondaire
46%

10/11/21 STAT F. NAOUI 41


II. 2. Représentation d’une variable
quantitative.

II-2-1. Quantitative discrète

Trois sortes de représentations seront possibles :

le diagramme en bâtons ;


le polygone de fréquences ;
le polygone de fréquences cumulées.

10/11/21 STAT F. NAOUI 42


II-2-1. Représentation d’une variable quantitative
discrète
le diagramme en bâtons

Chaque modalité est représentée par un bâton dont la hauteur


est proportionnelle à l’effectif correspondant.

Diagramme en Bâtons

100
80
e ffe c ti f

60
40
20
0
1 2 3 4 5
Nbre de pièces

10/11/21 STAT F. NAOUI 43


II-2-1. Représentation d’une variable
quantitative discrète
le polygone de fréquences ;

Diagramme en Bâtons
Le polygone de fréquences est
traduit par la courbe joignant 100
les sommets des bâtons du 80
60
diagramme en bâtons.

effectif
40
20
0
1 2 3 4 5
Nbre de pièces

10/11/21 STAT F. NAOUI 44


II-2-1. Représentation d’une variable quantitative
discrète
 le polygone de fréquences cumulées.

3. Le polygone de fréquences cumulées est construit en joignant les bâtons par des
segments horizontaux.

fi

xi

10/11/21 STAT F. NAOUI 45


II. 2. Représentation d’une variable quantitative.
II- 2- 2. Quantitative continue
Généralement, la représentation graphique la plus
utilisée dans ce cas est celle de l’Histogramme.

10/11/21 STAT F. NAOUI 46


II- 2- 2. Quantitative continue
 L’histogramme se
compose par des
rectangles dont :

 les bases traduisent


les amplitudes des
classes ;
Histogramme
 les hauteurs sont
représentées par les
fréquences ; effectifs
 les surfaces sont
proportionnelles aux
effectifs. 5-10 10-15 15-20 20-25 25-30

tranches d'âges

10/11/21 STAT F. NAOUI 47


Exercices

Exercice I:
Une enquête menée auprès de 20 ménages, portant sur le nombre de pièces par maison a
donné les résultats suivants:

A) Etablir une distribution de fréquence.


B) Représenter graphiquement la distribution de fréquence établie.
C) Etablir la distribution des fréquences cumulées et les diagrammes de fréquences
cumulées.
01 04 5 et 02 5 et
+ +
5 et 02 04 01 04
+
03 01 04 02 03
01 03 03 02 02

10/11/21 STAT F. NAOUI 48


Exercices
Exercice II:
On dispose des notes attribuées à 36 étudiants :

A) Etablir une distribution de fréquence.


B) Représenter graphiquement la distribution de fréquence établie.
C) Etablir la distribution des fréquences cumulées et les diagrammes de fréquences
cumulées.
10 16,5 03 03,5 17 08 15 08,5 09
11 10, 5 07 13 09,75 15,5 00 13 13
08 08 13 02 09 16 1O 11,5 10
14,5 12,25 11 07 11,5 03 11 09 12

10/11/21 STAT F. NAOUI 49


Exercice III:
 Le tableau suivant donne la distribution
de fréquence du nombre d’enfant dans
300 familles:

Nbre Nbre de famille 1) Représenter graphiquement cette


distribution ;
d’enfants ni
2) Etablir le diagramme de fréquences
0 13 cumulées croissantes;
1 22 3) Quel est le nombre de familles ayant au
plus 4 enfants ;
2 46 4) Quel est le nombre de familles ayant au
3 49 moins 2 enfants ;
5) Quel est le pourcentage des familles qui
4 58
n’ont pas d’enfants ;
5 42 6) Quel est le pourcentage des familles qui
6 39 ont des enfants ;
7) Quel est le pourcentage des familles qui
Plus de 6 31 ont moins de 4 enfants.
Total 300

10/11/21 STAT F. NAOUI 50


Exercice IV:

Soit le tableau suivant représentant la


répartition de 100 exploitations agricole
selon leurs superficies en hectares :
TAF
Superficies Nbres
A) Représenter graphiquement cette série à l’aide :
entre d’exp ni
- A-1) d’un histogramme;
00 – 20 ha 10 - A-2) d’un polygone de fréquences ;
20 – 30 ha 15 - A-3) d’un polygone de fréquences cumulées
croissantes ;
30 – 40 ha 25
- A-4) d’un polygone de fréquences cumulées
40 – 50 ha 30 décroissantes.
50 – 60 ha 10
B) Quelle est :
60 – 70 ha 06
- B-1) la proportion des exploitations agricoles dont
70 – 90 ha 04 la superficie est inférieure à 50 ha ?;
Total 100 - B-2) la proportion des exploitations agricoles dont
la superficie est supérieure ou égale à 40 ha ?

10/11/21 STAT F. NAOUI 51


Titre II: La statistique Descriptive à une dimension :
Réduction des données

La réduction des données statistiques est une troisième façon


de décrire les données brutes ( après les tableaux statistiques et les
graphiques)

La réduction des données est donc une méthode de la


statistique descriptive qui a pour but le calcul des paramètres
statistiques qui permettent de caractériser de façon simple les séries
statistiques et les distributions de fréquences statistiques afin de
porter des jugements sur les unités statistiques observées.

Trois type de paramètres statistiques sont à distinguer:

10/11/21 STAT F. NAOUI 52


Trois type de paramètres statistiques sont à
distinguer:

 - Les paramètres de position (ou valeurs de tendance centrale) :


Ils servent à caractériser l’ordre de grandeurs des observations.
Il s’agit de la moyenne, du mode, de la médiane et de la
médiale.

 - Les paramètres de dispersion : Ils permettent de chiffrer la


variabilité des valeurs observées autour d’un paramètre de
position. Il s’agit de la variance, l’écart type, le coefficient de
variation et le coefficient de concentration.

 - Les paramètres de forme : Ils permettent de caractériser la


forme d’une distribution. Il s’agit du coefficient d’asymétrie et
du coefficient d’aplatissement.

10/11/21 STAT F. NAOUI 53


I - Les paramètres de position (ou valeurs
de tendance centrale): Les 4M
 I- 1 : Le Mode

 I-2 : La Médiane

 I-3 : La Médiale

 I-4 : La Moyenne

10/11/21 STAT F. NAOUI 54


I-1 . Le Mode : Mo

A) Définition :
le mode est la valeur de la variable la plus fréquente dans la
population étudiée.

En d’autres termes, le mode est la modalité de la variable à la quelle est associée le


plus grand effectif( ou la plus grande fréquence)

D ia g ra m m e e n B â to n s Histogramme
100

effectifs
80
60
effectif

40
20
0
5-10 15-20 20-25 25-30
1 2 3 4 5 10-15
N b re d e p iè c e s
tranches d'âges

10/11/21 STAT F. NAOUI 55


I-1 . Le Mode
B) Modalités de calcul :
B-1 : Cas d’une SERIE STATISTIQUE
Le mode est l’observation que l’on rencontre le plus
fréquemment.
Remarque
Le mode peut ne pas exister, ou s’il existe, il peut ne pas être
unique
Exemples : chercher le mode dans les 3 cas suivants :
- 2, 2, 2, 7, 7, 7, 7, 11, 11, 11, 11, 11, 14, 16, 17, 18, 18

- 3, 7, 12, 12, 12, 12, 13, 14, 16, 16, 16, 16, 18

- 0, 2, 5, 9, 10, 12, 15, 17, 18

10/11/21 STAT F. NAOUI 56


I-1 . Le Mode
B) Modalités de calcul :
B-2 : Cas d’une distribution de fréquence d’une variable discrète
Dans le cas d’une distribution de fréquences non groupée, le mode
correspond à la valeur qui possède le plus grand effectif ou la plus grande
fréquence.
Nbre d’employés Nbre de magasins de Proportion des
Exemples : commerce N commerçants
i

0 50 5 %
1 100 10 %
2 200 20 %
3 150 15 %
4 12 12 %
5 160 16 %
6 130 13 %
7 90 9 %
TOTAL 1000 100 %

10/11/21 STAT F. NAOUI 57


I-1 . Le Mode
B) Modalités de calcul :
B-3 : Cas d’une variable continue (groupée en classe)
Dans ce cas on parle de classe modale, celle-ci correspond à
la classe dont la fréquence est la plus élevée.
Le mode sera donc le point central de la clase modale si les
classes ont la même amplitude, dans le cas contraire, il faut
travailler avec les effectifs ajustés
Exemple : La répartition de la surface, en m² de 100 logements est la suivante :
Surface en m² Nbre de logements ni
0-20 10
20-40 18
40-60 22
60-100 38
100-160 8
160-200 4
Total 100
10/11/21 STAT F. NAOUI 58
I-2 . La Médiane : Mé
A) Définition :

Elle correspond à la valeur de la distribution statistique


telle que la moitié des observations lui sont inférieures
ou égales et la moitié lui sont supérieures ou égales.

Me
50% 50%

10/11/21 STAT F. NAOUI 59


I-2 . La Médiane : Mé
B) Modalités de calcul :
B-1 cas d’une SERIE STATISTIQUE
Pour une série statistique de n observations :
x1 ; x2 ; x3 ; ....... ; xi ; ...... ; xn
 Si le nombre d’observation est impair, la médiane est
l’observation de rang (n+1)/2. La médiane est alors
Me = X(n+1)/2
 Si le nombre d’observation est pair, la médiane est
comprise entre l’observation de rang (n)/2 et
l’observation de rang (n/2) +1.
Xn/2 <Me < X(n/2)+1
La valeur de la médiane sera alors la moyenne simple
des deux observations
Me = (X(n/2) +1 + X(n/2) )/2
10/11/21 STAT F. NAOUI
60
I-2 . La Médiane : Mé
B) Modalités de calcul :
B-1 cas d’une SERIE STATISTIQUE

Soit les deux séries statistiques (des notes


d’examen) suivantes :

Xi = 14; 12; 10; 15; 20.


-

Xi = 20; 8; 12; 14; 15; 10.


-

Calculer la médiane.
10/11/21 STAT F. NAOUI 61
I-2 . La Médiane : Mé

Solutions :

1. Soit la série statistique suivante :


Xi = 10; 12; 14; 15; 20.
n = 5  Me = X(5+1)/2= X(3) = 14

2. Soit la série Xi = 20; 8; 12; 14; 15; 10.

M e   X 6 / 2  X ( 6 / 2)1 
n=6  1
2

 Me = 13
10/11/21 STAT F. NAOUI 62
I-2 . La Médiane : Mé
B) Modalités de calcul :
B-2 Cas d’une distribution de fréquence d’une variable discrète
 La méthode de calcul est la même que dans le cas d’une série
statistique.
 Exemple : Nbre ’employés Nbre de commerçants Proportion des
ni commerçants

0 50 5 %

1 100 10 %

2 200 20 %

3 150 15 %

4 120 12 %

5 160 16 %

6 130 13 %

7 90 9 %

TOTAL 1000 100 %

10/11/21 STAT F. NAOUI 63


I-2 . La Médiane : Mé
B) Modalités de calcul :
B-3 : Cas d’une variable continue (groupée en
classe)
Le calcul de la médiane se fait en deux étapes :
-D’abord, la détermination de la classe médiane,

-Ensuite la détermination de la médiane.

Remarques : Il est à signaler que pour le calcul de la médiane


d’une variable continue :
-Il n’ya aucune différence selon que les classes de la variable sont

d’amplitudes constantes ou variables ;


-Il n’ya aucune différence selon que N est pair ou impair ;

10/11/21 STAT F. NAOUI 64


B) Modalités de calcul de la Mé :
B-3 : Cas d’une variable continue (groupée en classe)

1) Détermination de la classe médiane :

 La classe médiane est la classe de valeurs de la


variables contenant la médiane. Elle est
déterminée à partir des effectifs ou des
fréquences cumulés.
 La classe médiane est donc celle qui correspond
à la valeur N/2 (dans la colonne des effectifs ou
des fréquences cumulés)

10/11/21 STAT F. NAOUI 65


B) Modalités de calcul de la Mé :
B-3 : Cas d’une variable continue (groupée en classe)

2) la détermination de la médiane.

 La méthode généralement utilisée pour


ce faire est celle de l’interpolation
linéaire.
Généralement, la médiane dans ce cas est
donnée par la formule suivante :
N 
  N ( i 1) croissant 
 2 
M e  L0  ai
ni
10/11/21 STAT F. NAOUI 66
B) Modalités de calcul :
B-3 : Cas d’une variable continue (groupée en classe)

 Exercice Taille (m) effectifs


ni
< 1,60 6
 Soit la distribution 1,60-1,70 7
d’une population des 1,70-1,80 8

étudiants selon leur 1,80-1,90 2


≥ 1,90 1
taille (en mètres) :
Total 24

10/11/21 STAT F. NAOUI 67


B) Modalités de calcul de la Mé :
Solution de l’exercice
La médiane correspond ici à la valeur de rang
N
2

 
24
càd .  12
2
Ce qui implique que : Me = X12

10/11/21 STAT F. NAOUI 68


B) Modalités de calcul de la Mé :
Solution de l’exercice
Me = X12 : Cette modalité se trouve dans la classe médiane
[1,60-1,70[ ( voir les effectifs croissants 3ème colonne) laquelle
correspond à 7 observations.

Taille (m) Effectifs Effectifs


ni cumulés
croissants  24 
< 1,60 6 6   6
 2 
1,60-1,70 7 13 M e  1,60  0,1
1,70-1,80 8 21 7
1,80-1,90 2 23
≥ 1,90 1 24
Total 24 M e  1,685m

10/11/21 STAT F. NAOUI 69


B) Modalités de calcul de la Mé :
Solution de l’exercice
On obtiendra le même résultat si on procède par interpolation linéaire :
1,60 Me 1,70

6 12 13
 

12  6 M e  1,60
 
13  6 1,70  1,60
(12 6)(1,701,60)
M  1,60 
e 13 6

 M e  1,685m
10/11/21 STAT F. NAOUI 70
B) Modalités de calcul de la Mé :
Solution de l’exercice

Interprétation:
On a donc, parmi la population étudiée, autant de
personnes dont la taille est inférieure à 1,685m que de
personnes avec une taille supérieure à cette valeur.

10/11/21 STAT F. NAOUI 71


I-2 . La Médiane : Mé

Exercice :
Soit la distribution statistique représentant le salaire horaire (en
dh) attribué au salariés d’une usine de confection à Marrakech.
Calculer et interpréter la médiane de cette distribution :

Xi en dh ni
[20-30[ 10
[30-40[ 20
[40-50[ 15
[50-60[ 25
[60-70[ 30
Total 100

10/11/21 STAT F. NAOUI 72


I-3 . La Médiale : Ml

A) Définition :
Elle désigne la valeur de la distribution statistique telle
que la somme pondérée des observations qui lui sont
inférieures est égale la somme pondérée des
observations qui lui sont supérieures
 
Attention : n

La médiale (notée Ml ) partage la masse totale  ( n x )


i 1
i i

(et non plus le total des observations) en deux parties


égales.

10/11/21 STAT F. NAOUI 73


I-3 . La Médiale : Ml

B) Modalités de calcul de la Ml :
Exemple : Soit le salaire horaire (en dh) attribué
au salariés d’une usine de confection à
Marrakech :

Xi en dh ni
[20-30[ 10
[30-40[ 20
[40-50[ 15
[50-60[ 25
[60-70[ 30
Total 100

10/11/21 STAT F. NAOUI 74


I-3 . La Médiale : Ml

B) Modalités de calcul de la Ml :

xi ni ni croissants Ci niCi niCicrois.


20-30 10 10 25 250 250
30-40 20 30 35 700 950
40-50 15 45 45 675 1625
50-60 25 70 55 1375 3000
60-70 30 100 65 1950 4950

TOTAL 100 -- -- 4950 --

10/11/21 STAT F. NAOUI 75


I-3 . La Médiale : Ml
B) Modalités de calcul de la Ml :

1- Détermination de la classe médiale :


La classe médiale est la classe de valeurs de la variables
contenant la médiale. Elle est déterminée à partir
effectifs cumulés de la masse totale.
La classe médiane est donc celle qui correspond à la
valeur
n

 (n x ) 4950
  2475
i i
i 1

2 2
Cette valeur se trouve dans la classe médiale 50-60.

10/11/21 STAT F. NAOUI 76


I-3 . La Médiale : Ml
B) Modalités de calcul de la Ml :
2) la détermination de la médiane.
a) Par la formule

 4950 
  1625 
 2 
M l  50  10  56,18dhs
b) Par 1375
interpolation
50 Ml 60
1625 2475 3000

60  50 M l  50 10  850
  Ml   50  56,18dhs
3000  1625 2475  1625 1375
10/11/21 STAT F. NAOUI 77
I-3 . La Médiale : Ml

Interprétation:

Si la distribution statistique représente la répartition


des salaires, on dira que 50% de la masse totale des
salaires distribués par l’entreprise sont constitués par des
salaires inférieurs à 56,18 dhs.
L’autre moitié des salaires est distribués sous forme de
salaires supérieurs à 56,18 dhs.

10/11/21 STAT F. NAOUI 78


I-4 . La Moyenne : x

A) Définition
 
Dans les caractéristiques de tendance centrale, La moyenne demeure
l’outil statistique le plus utilisé et le plus significatif. C’est la valeur telle que ,
comme ci toutes les autres observations étaient égales à cette valeur.

Par ailleurs, dans la famille des moyennes connues (géométrique,


harmonique, quadratique) on ne retient ici que La moyenne arithmétique.
 
Définition :
La moyenne arithmétique d’une distribution
statistique pour une variable X est égale au rapport de la
somme des valeurs observées de cette variable sur le
nombre total des observations.
10/11/21 STAT F. NAOUI 79
B) Modalités de calcul de la x:

 Cas d’une série statistique unitaire (non


pondérée ou simple) :
n

 (x ) i n
x i 1
( avec N   ( ni ))
N i 1

 Exemple : Les 5 enfants d’une famille ont : 5 ans, 7 ans,


11 ans, 15ans, 16ans

x  10,8
10/11/21 STAT F. NAOUI 80
B) Modalités de calcul de la x:
 Cas d’une variable statistique discrète
(pondérée) :
n

 (n i xi )
x  i 1
N

 Ou, en travaillant avec des fréquences relatives au lieu des


effectifs :
n n
ni
x   ( f i xi ) avec f i  et ( f ) 1 i
i 1 N i 1
10/11/21 STAT F. NAOUI 81
B) Modalités de calcul de la x :
 Exemple : On étudie la distribution de 24 étudiants selon leurs
âges , calculer et interpréter la moyenne de cette distribution :
Age Effectifs ni Age Effectifs ni.xi
(xi) (xi) ni
18 6 18 6 108
19 10 19 10 190
20 4
20 4 80
21 2
21 2 42
22 2
TOTAL 24 22 2 44
TOTAL 24 464
n

 (n x ) i i
464
x i 1
  19,333ans
N 24
10/11/21 STAT F. NAOUI 82
B) Modalités de calcul de la x :
Reprenant le même exemple en travaillant cette fois-ci
avec les fréquences relatives. On obtiendra le même
résultat :
Age Fréquences fi.xi
Age Fréquences fi (xi) fi
(xi)
18 6 18 6/24 4,5
19 10 19 10/24 7,9166
20 4 20 4/24 3,3333
21 2
21 2/24 1,75
22 2
TOTAL 24 22 2/24 1,8333
TOTAL 24/24=1 19,333
n
x  ( f
i 1
i .xi )  19,333ans

10/11/21 STAT F. NAOUI 83


B) Modalités de calcul de la x:
Cas d’une variable statistique continue :
Les modalités de la variable X sont alors des classes et par convention on
retient comme valeur de la variable et on utilisera dans les calcules de
moyennes les centres de classes
n

 (n c ) 40,5
x   1,687
i i
i 1

N 24
Ou, en travaillant avec des fréquences relatives au lieu des effectifs :

n n
ni
x   ( f i ci ) avec f i  et ( f ) 1
i
i 1 N i 1

10/11/21 STAT F. NAOUI 84


B) Modalités de calcul de la x :
 Exemple : On étudie la distribution de 24 étudiants selon
leurs taille : Taille (m) Effectifs ci ni ci
Taille (m) Effectifs ni ni
ni ni
< 1,60 6 1,55 9,3
< 1,60 6
1,60-1,70 7 1,65 11,55
1,60-1,70 7
1,70-1,80 8 1,70-1,80 8 1,75 14

1,80-1,90 2 1,80-1,90 2 1,85 3,7


≥ 1,90 1 ≥ 1,90 1 1,95 1,95
Total 24
Total 24 40,5
n

 (n c ) 40,5
x    1,687 m
i i
i 1

N 24
10/11/21 STAT F. NAOUI 85
I-4 . La Moyenne : x

Résumé de calcul de la x:
Notations:
1 n

 Cas d’une série statistique unitaire: x   (x )


N
i
i 1

 (n x )
 Cas d’une VSD: x  i 1
i i

N
k

 (n c )
 Cas d’une VSC: x  i 1
i i

N
k : le nombre des valeurs distinctes que renferme
la variable statistique.
10/11/21 STAT F. NAOUI 86
I-4 . La Moyenne :

C ) Propriétés de la moyenne :
Si on definit une nouvelle variable Y telle que :
Y  aX  b avec a et b des constantes réelles
alors y  a x  b
La somme des différence par rapport
à la moyenne est toujours nullles
k

 (x
i 1
i - x)  0

La somme des carrés


des écarts à la moyenne
est tjrs minimale

10/11/21 STAT F. NAOUI 87


II - Les paramètres de dispersion

Cinq caractéristiques de dispersion seront


analysées à cet égard :

 L’écart absolu moyen;


 La variance ;

L’écart-type;

Le coefficient de variation;

L’écart Interquartile.

10/11/21 STAT F. NAOUI 88


II - Les paramètres de dispersion
II-1. L’écart absolu moyen
Définition : « L’Em est défini par la moyenne arithmétique des
écarts calculés par rapport à la moyenne en valeur absolue»

 Notation :
1 n
Em   ni xi  x
n i 1

L’Em mesure l’éloignement des valeurs de la Série par


rapport à sa moyenne.

L’écart moyen est très rarement utilisé pour caractériser


la dispersion, on lui préfère la variance et l’écart type

10/11/21 STAT F. NAOUI 89


II - Les paramètres de dispersion

II-2. La variance
  A) - Définition:
 On appelle variance d’une variable X la moyenne arithmétique
des carrés des écarts des valeurs de cette variable à sa moyenne
arithmétique
1 k k
 Notation: V ( x)   ²   ni ( xi  x)² = V ( x)   
N i 1
2

i 1
f i .( xi  x)²


k
1 C’est la moyenne des carrés moins
=  ni xi  x ²
2

N i 1
le carré de la moyenne.

Remarque : Comme auparavant, s’il s’agit d’une VSC, les observations xi seront
remplacées par les centres de classe ci.

10/11/21 STAT F. NAOUI 90


II - Les paramètres de dispersion
II-2. La variance
  B) - Les propriétés de la variance:
Si a est une constante alors V(a)  0

Si on definit une nouvelle variable Y telle que :


Y  aX  b avec a et b des constantes réelles,
alors V (Y )  a 2 .V ( X )

Si on definit une nouvelle variable Y telle que :


Y  X Z avec X et Z des variables,
alors V (Y )  V ( X )  V ( Z )
10/11/21 STAT F. NAOUI 91
II - Les paramètres de dispersion
 II-3. L‘écart-type
  Définition:
« Il est égal à la racine carrée de la variance »
 On note :

 ni xi  x 
k
1
  V (x) 
2
 
N i 1

Interprétation: Généralement, l’écart-type nous renseigne sur la


dispersion (ou l’éloignement) de chaque observation xi de la
variable par rapport à la moyenne arithmétique. Il est exprimé
dans la même unité que la variable statistique analysée.

10/11/21 STAT F. NAOUI 92


II - Les paramètres de dispersion
Exemple: le nombre de 400 femmes en activité
selon l’âge est représenté dans une population
comme suit :
Tranches- ni
âges
20-25 50
25-30 100
30-35 80
35-40 110
40 et+ 60

TOTAL 400

10/11/21 STAT F. NAOUI 93


II - Les paramètres de dispersion
solution:
ni Ci nici nici² ni(ci-x)²
50 22,5 1125 25312,5 5382,03
100 27,5 2750 75625 2889,06
80 32,5 2600 84500 11,25
110 37,5 4125 154687,5 2352,97
60 42,5 2550 108375 5558,44
400 13150 448500 16193,75
10/11/21 STAT F. NAOUI 94
II - Les paramètres de dispersion
D’où :
  la moyenne
  1 k
x   ( nici )  32,875
n i 1

 l’âge moyen des femmes en activité est


d’environ 33 ans.

10/11/21 STAT F. NAOUI 95


II - Les paramètres de dispersion
 La variance sera égale :
1 k 16193,75
 ²   ni (ci  x)²   40,48
n i 1 400

 L’écart-type   40,48  6,36

Ce qui signifie que l’âge des 400 femmes


observées s’éloigne en moyenne de 6,36 ans
de l’âge moyen qui est de 32,875 ans.

10/11/21 STAT F. NAOUI 96


II - Les paramètres de dispersion
II-4. Le coefficient de variation
Définition:
« Le CV est défini par le rapport la moyenne
arithmétique et l’écart-type de la même
variable»
 Notation: On note :
Ecart type
CV  100
x
Dans notre exemple on aura:
6,36
CV  100  19,35%
32,875
10/11/21 STAT F. NAOUI 97
II - Les paramètres de dispersion

Remarque :
Le CV doit être beaucoup utilisé dans le cadre de
la comparaison de la dispersion de deux ou
plusieurs variables.
S’il existe une autre variable telle que:
y
CV  100  10%
y

On dira que la variable X est plus dispersée par


rapport à sa moyenne que la variable Y.

10/11/21 STAT F. NAOUI 98


II - Les paramètres de dispersion
II-5. L’écart Interquartile
Définition 1:
« Les quartiles représentent des modalités qui
permettent de répartir la population en quatre
parties égales»
 Notation:
Généralement ils sont au nombre de 3 et on les
note : Q1, Q2 et Q3 dont l’ordre est
respectivement de 25%, 50% et 75% c à d ¼ ,
2/4 (1/2) et ¾ des observations.

10/11/21 STAT F. NAOUI 99


II - Les paramètres de dispersion
Les quartiles sont calculés de la même manière
que la médiane.
Avec: n 
ai  0,25  f ( i 1)  
ai   n( i 1)  
 4 
Q1  l0   l0 
ni fi

n 
ai  0,5  f ( i 1)  
ai   n( i 1)  
 2 
Q2  l0   l0 
ni fi
 3n 
ai  0,75  f ( i 1)  
ai   n( i 1)  
 4 
Q3  l0   l0 
ni fi
10/11/21 STAT F. NAOUI 100
II - Les paramètres de dispersion
Définition 2 :
L’EIQ est défini par la différence entre Q3 et Q1
de la même variable
 Notation:
Eiq  Q3  Q1

Il représente les 50% d’observations qui sont


centrés au niveau de la population en laissant
exactement 25% à droite et 25% à gauche.

10/11/21 STAT F. NAOUI 101


II - Les paramètres de dispersion

Définition 3:
Les Déciles représentent des modalités qui permettent de
répartir la population en Dix parties égales

 Notation :
Généralement ils sont au nombre de 9 et on les note : d1, d2, … d 9
dont l’ordre est respectivement de 10%, 20%, … et 90%.

Ils permettent de centraliser les parts d’observations au niveau de la


population en laissant des parts à droite et des parts à gauche.

[d9-d1] représente 80% des observations au centre.


10/11/21 STAT F. NAOUI 102
Thème n°1: La statistique Descriptive à une dimension

Exemple:
ages ni niCum Ci nici nici Cum nici² niIci-xI
20-25 50 50 22,5 1125 1125 25312,5 518,75
25-30 100 150 27,5 2750 3875 75625 537,50
30-35 80 230 32,5 2600 6475 84500 30,00
35-40 110 340 37,5 4125 10600 154688 508,75
40 + 60 400 42,5 2550 13150 108375 577,50
TOTAL 400 13150 448500 2172,50

MOY 32,875
VAR 40,48 n/4 100
ET 6,36 2n/4 200
CV 0,19346 3n/4 300
EAM 5,43125
Q1 27,50 Q2 33,13 Q3 38,18

EIQ 10,68
10/11/21 STAT F. NAOUI 103
III - Les paramètres de concentration
Les caractéristiques de concentration permettent
d’analyser la concentration des unités statistiques.

Une population peut être, en effet, soit fortement ou


faiblement concentrée.

La concentration peut être étudiée graphiquement ou


numériquement. Ainsi les paramètres les plus utilisées
sont :
La courbe de Lorentz;

L’indice de concentration.

10/11/21 STAT F. NAOUI 104


III - Les paramètres de concentration
I- La courbe de Lorentz

A) Le principe

B) La construction de la courbe

10/11/21 STAT F. NAOUI 105


I- La courbe de concentration ou
courbe de LORENZ
 A)-Le principe
- Cette courbe est obtenue en calculant les fréquences relatives cumulées
croissantes des observations après les avoirs classées par ordre croissant et les
masses relatives cumulées croissantes.

ni ni xi
Cumulées croissantes et Cumulées croissantes
N  (ni xi )
- Cette courbe permet de comparer la distribution observée des masses du
caractère avec une distribution qui serait une distribution «égalitaire», de
concentration nulle des masses de caractère.

10/11/21 STAT F. NAOUI 106


I- La courbe de concentration :
B)-La construction de la courbe
- La courbe de LORENZ s’inscrit
toujours dans un carré de côté
unitaire dont les abscisses sont
les fréquences relatives
cumulées croissantes et les
ordonnées sont les masses
relatives cumulés croissantes.
- Dans le cas où toutes les
observations seraient égales
entre elles, la courbe de
concentration correspond à la
bissectrice.
- Plus la courbe s ’éloigne de la
bissectrice plus la concentration
est élevée.
10/11/21 STAT F. NAOUI 107
III - Les paramètres de concentration
II- L’indice de concentration.

A) Le coefficient de GINI

B) L’indice de concentration

10/11/21 STAT F. NAOUI 108


III - Les paramètres de concentration
A) Le coefficient de GINI
L'indice de Gini est un coefficient qui évalue la dispersion d'une série
statistique. Il se définit en général à partir de la courbe de Lorenz d'une
variable aléatoire positive X définie sur une population. L'indice de
Gini de X est le double de l'aire de la surface délimitée par la courbe
de Lorenz et la première diagonale du carré unité.

L'indice de Gini est très utilisé en économie comme mesure des inégalités
dans une population.

Remarquons qu'il est toujours compris entre 0 et 1:


 - Si l'indice de Gini est proche de 0, ceci signifie que les inégalités
dans la population sont faibles.
 - Si l'indice de Gini est proche de 1, alors, au contraire, les
inégalités sont fortes.
10/11/21 STAT F. NAOUI 109
III - Les paramètres de concentration
 B) L’indice de concentration

 On peut étudier la concentration directement à


partir de la différence entre la médial e et la
médiane d’une distribution

Médiale  Médiane
Ic  100
Etendu

10/11/21 STAT F. NAOUI 110


Titre III - Statistique descriptive à deux dimensions:
L’analyse de la relation entre deux variables
1) Intérêts et objectifs du chapitre;

2) Le tableau de contingence ou tableau à double entrées;

3) Distribution marginale et distribution conditionnelle;

4) Réduction des données;

5) La covariance et correlation

10/11/21 STAT F. NAOUI 111


Titre III - Statistique descriptive à deux dimensions:
L’analyse de la relation entre deux variables
1.  Intérêts et objet de la SDDD
  En réalité, les phénomènes économiques et gestionnaires sont
analysés selon plusieurs caractères qui sont simultanément pris en
considération.
 

D’où le recours à plusieurs séries statistiques utilisées en


même temps pour étudier la même population.
 

L’intérêt d’une SSDD est de caractériser la relation (la dépendance


ou l’indépendance) qui est susceptible d’exister entre deux
variables statistiques qui, elles, peuvent être qualitatives ou
quantitatives, continues ou discontinues.

10/11/21 STAT F. NAOUI 112


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

2) Distribution de fréquences
 
La SSDD peut être résumée de deux manières différentes :

  Série statistique double,


  Tableau de contingence.

Ces deux méthodes servent à condenser l’ensemble des


informations collectées sur la population à étudier.

10/11/21 STAT F. NAOUI 113


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

2) Distribution de fréquences
2. 1. Série statistique double
 

Supposons deux variables statistiques X


et Y dont les observations sont résumées
comme suit :
 
X : x1 ; x2 ; x3 ; …. ; xi ; …. ; xN
Y : y1 ; y2 ; y3 ; …. ; yj ; …. ; yN
 
Avec : N désigne le nombre total des
observations.
10/11/21 STAT F. NAOUI 114
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

2) Distribution de fréquences
2. 2. Tableau de contingence
  C’est un tableau à deux entrées, une entrée pour les modalités
du premier caractère et l’autre entrée pour le deuxième caractère.
Les deux caractères peuvent être tous qualitatifs ou tous
quantitatifs, ou mixtes. Pour la variable statistique, elle peut être
discrète ou continue groupée en classe. A l’intérieur du tableau on
trouve les fréquences absolues ou relatives conjointes.
On parle alors de:
1. distributions marginales de X et Y;
2. distributions conditionnelles de X et de Y

10/11/21 STAT F. NAOUI 115


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

2. 2. Tableau de contingence
Marginale
Y de X
y1 y2 … yj …. yN
  X
ni.
x1 n11 n12 n1j n1p n1.
x2 n21 n22 n2j n2p n2.
x3 n31 n32 n3j n3p n3.
. . . . . .
. . . . . .
. . . . . .
xi ni1 ni2 nij nip ni.
. . . . . .
. . . . . .
. . . . . .
xk nk1 nk2 nkj nkp nk.

Marginale
de Y n.1 n.2 -- n.j n.p n..=N
n.j

10/11/21 STAT F. NAOUI 116


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

Exemple: 453 employés d’une entreprise


sont analysés selon leurs salaires (X) et leur
ancienneté (Y) tels que :
(ancienneté)Y Marginale
1 2 3 4 de X
X(salaire)
ni.

1500 87 57 11 3 158
2500 39 45 14 19 117
4000 15 36 47 25 123
7000 8 14 24 9 55

Marginale de Y
149 152 96 56 453=N
n.j

10/11/21 STAT F. NAOUI 117


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

2. 3. Distributions marginales et conditionnelles


Quelques Résultats:
1. nij est le nombre d’individus qui possèdent en même temps la
modalité xi du caractère X et la modalité yj du caractère Y. Elle
est dite fréquence (ou effectif) absolue conjointe. On en déduit la
fréquences relatives conjointe : fij = nij /n

2. n.. représente l’effectif total des unités statistiques,


k p k p
navec
.. :  n ij   n  n
i. .j N
i 1 j 1 i 1 j 1

10/11/21 STAT F. NAOUI 118


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4. ni. est égal au total des individus qui possèdent la modalité xi quelle que
soit la modalité de la variable Y p

Avec : ni .  n j 1
ij

5. n.j est égal au total des individus qui possèdent la modalité yj quelle que soit
la modalité de la variable X,
k

Avec : n. j  n
i 1
ij

6 Les fréquences relatives sont définies de la même manière que les


effectifs (ou fréquences absolues) :
k

f.j= n.j /n   f ij et
p
fi.= ni./n   f ij et fij = nij /n
j 1 i 1
k p k p

Avec :

i 1 j 1
f ij  f
i 1
i.  f
j 1
.j 1

10/11/21 STAT F. NAOUI 119


Titre III - Statistique descriptive à deux
dimensions: L’analyse de la relation entre deux
variables
 3) Distribution marginale et distribution
conditionnelle;

 Plusieurs distribution de fréquence à une variable


peuvent être retirées d’un tableau de contingence,
il s’agit des distributions marginales et des
distributions conditionnelles.

STAT F. NAOUI
10/11/21 120
Titre III - Statistique descriptive à deux dimensions:
Distribution marginale de X

Salaire X ni. fi.

A) Distribution marginale 1500 158 0,35


2500 117 0,26
Definition :
4000 123 0,27
 On appelle distribution
70000 55 0,12
marginale du caractère X,
Total 453 1
la distribution à une
dimension des individus de Distribution marginale de Y
la population qui Ancienneté Y n.j f.j
présentent une modalité 1 149 0,33
de X quelle que soit la 3 152 0,34
modalité de Y 5 96 0,21
8 56 0,12
Total 453 1
10/11/21 STAT F. NAOUI 121
Titre III - Statistique descriptive à deux dimensions :

B) Distribution conditionnelle


 Definition :
 On appelle distribution conditionnelle du
caractère X sous la condition Y=yj , la
distribution à une dimension de la
variable X pour les individus de la
population qui possèdent la modalité yj
de la variable Y.

10/11/21 STAT F. NAOUI 122


Titre III - Statistique descriptive à deux dimensions:
Remarques:

1. Il y aura autant de distributions conditionnelles qu’il y a de modalités de X et


de Y.

2. La distribution conditionnelle est considérée comme une distribution à une


seule variable (une modalité étant fixée) au même titre de la distribution
marginale.

3. Les fréquences simples sont égales au produit des fréquences marginales et


conditionnelles, tq. :

f ij  f i j  f . j  f ji  fi.
4. Les fréquences conditionnelles de X sachant Y=yj sont définies par :
fij = n ij /n. j
* Et les fréquences conditionnelles de Y sachant X=xi seront définies par :
fj i = n ij /ni.
10/11/21 STAT F. NAOUI 123
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

Exemple:
dans l’exemple des 453 employés donner la distribution
des salaires (X) sachant que l’ancienneté (Y) est de 4
ans ?
Solution:
Il s’agit de la distribution conditionnelle de X sachant que
Y=yj=4.
Celle-ci peut être représentée comme une distribution
marginale.

10/11/21 STAT F. NAOUI 124


Titre III - Statistique descriptive à deux dimensions:
L’analyse de la relation entre deux variables

Exemple: dans l’exemple


des 453 employés donner
Salaire X Eff. fi
la distribution des salaires
(X) sachant que
1500 03 5.36%
l’ancienneté (Y) est de 4
ans ? 2500 19 33.93%

Solution: Il s’agit de la 4000 25 44.64%


distribution conditionnelle
de X sachant que Y=yj=4. 7000 09 16.1%
Celle-ci peut être
représentée comme une Total 56 100%
distribution marginale.

10/11/21 STAT F. NAOUI 125


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4) La Réduction des données


Normalement, pour l’ensemble de ces distributions
marginales ou conditionnelles on peut déterminer les
différentes caractéristiques que se soient de tendance
générale ou de dispersion.
4.1. Moyennes et Variances marginales
Ce sont les Moyennes et Variances qui doivent être
déterminées sur les distributions marginales d’une
variable indépendamment de la seconde.

10/11/21 STAT F. NAOUI 126


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.1.1. Moyennes marginales


on parle ici des moyennes marg. des deux
variables X et Y. on note:

 La moyenne marg. De X:
k
1 k
x   f i.  xi   ni.  xi
i 1 n i 1
 La moyenne marg. De Y:
p
1 p
y   f. j  y j   n. j  y j
j 1 n j 1

10/11/21 STAT F. NAOUI 127


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.1.2. Variances marginales


on parle aussi des variances marg. des deux
variables X et Y, telles que :

 La variance marg. De X:
k

Var ( X )   f i. xi  x
i 1
 2 1 k

  ni. xi  x
n i 1
2

 La variance marg. De Y:
p

Var (Y )   f. j yj  y
j 1
 2 1 p

  n. j yj  y
n j 1
2

10/11/21 STAT F. NAOUI 128
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.2. Moyennes et Variances conditionnelles

Les Moyennes et Variances conditionnelles


seront déterminées sur les distributions
conditionnelles.

Ceci signifie qu’on aura des moyennes et


des variances différentes pour chaque
distribution conditionnelle de chaque
variable étant donné qu’une modalité de la
seconde variable est fixée.

10/11/21 STAT F. NAOUI 129


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.2.1. Moyennes conditionnelles


- On appelle moyenne cond. de la variable X la moyenne de X à
calculer sachant que Y prend une modalité yj.

- De même, On appellera moyenne cond. de la variable Y la


moyenne de Y à calculer sachant que X prend une modalité xi.
 La moyenne cond. De X:
k k
x j   fi xi 
j 1  nijxi
i 1 n . j i 1
 La moyenne cond. De Y:
p p
i
yi   f j  yj  1  nij yj
j 1 ni. j 1
10/11/21 STAT F. NAOUI 130
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.2.2. Variances conditionnelles


On note également :
 La variance cond. De X:

Vj(X)   f i . xi xj    nij xi xj 


k k
j 1 2 2

i 1 n.j i 1
 La variance cond. De Y:

   
p
1 k
Vi (Y )   f j . yj  yi 
i 2 2
 nij yj  yi
j 1 ni. j 1

10/11/21 STAT F. NAOUI 131


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.3. Relations entre les marg. Et les cond.


4.3.1. Relations entre les moyennes
Il s’agit de quelques relations susceptibles
d’exister entre les moyennes et les variances
marginales et conditionnelles.
On admet que :

 La somme des moyennes conditionnelles xj pondérée


par les n.j est égale à la moyennes marginale x :
p k
x   n. j x j et y   ni. y i
j 1 i 1

10/11/21 STAT F. NAOUI 132


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

4.3.2. Relations entre les variances


 Pour Les variances:
La variance marginale de X est égale à la somme de la moyenne
pondérée des variances conditionnelles et la variances pondérée des
moyennes conditionnelles

V (X ) 
1 p
n.. j 1

 .j jn  V ( X )  
1 p 
 .j j
n.. j 1 
n x  x
2

 
et
V (Y ) 
1 k
 i. i
n.. i 1
n V(Y )  
1 p 
 i. i
n.. j 1 
n y  y
2


 
10/11/21 STAT F. NAOUI 133
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

5. Relations entre les variables

Entre deux variables X et Y, deux types de relations sont


à envisager :

* la dépendance ou l’indépendance de X et Y;

* la liaison fonctionnelle appelée également la


régression linéaire.

10/11/21 STAT F. NAOUI 134


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

5.1. L’indépendance

Définition:
«deux variables statistiques sont dites indépendantes
lorsque toutes les fréquences conditionnelles sont égales
aux fréquences marginales»

On note alors que :

f  f.j
i

f  fi.
i
j
Ou bien j

10/11/21 STAT F. NAOUI 135


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

Exemple:

Y y1 y2 ni. fi.
X
X1 3 5 8 1/3
x2 6 10 16 2/3
n.j 9 15 24
f.j 3/8 5/8 1

10/11/21 STAT F. NAOUI 136


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

Cond. de X Cond. de Y
Y y1 y2 fi. Y y1 y2
X X

X1 f j 1
i 1
 f 1. f j 2
i 1
 f 1. f 1. X1 3/8 5/8
1/3 1/3 1/3 x2 3/8 5/8
x2 f j 1
i 2
 f 2. f j 2
i2
 f 2. f 2. f.j 3/8 5/8
2/3 2/3 2/3
Remarque:
L’indépendance est une liaison réciproque.
10/11/21 STAT F. NAOUI 137
Titre III - Statistique descriptive à deux dimensions:
L’analyse de la relation entre deux variables

 5.2. Relations entre les variables:


Covariance, corrélation et régression
 Dans la pratique, il existe des relations entre deux ou
plusieurs variables. Quatre notions peuvent caractériser la
relation entre deux variables.

 la notion de covariance : elle permet d’étudier le sens de la relation


 La notion de corrélation : elle permet de mesurer l’intensité de la
relation
 La notion de régression : elle permet d’ajuster un modèle
mathématique en fonction de la nature de la relation.
 Le diagramme de dispersion : il permet de caractériser la nature de
la relation
10/11/21 STAT F. NAOUI 138
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables
5.1 La Notion de covariance de Y et X
 Elle est notée et calculée comme suit :

 (nij  xi  x  yj  y )
p
1 k
cov( X , Y )  
n.. i j 1

p
1 k
 
n.. i 1
 (n
j 1
ij xi yi )  x y

Dans le cas où x = y alors la Cov(y,x) =².


Si la covariance est positive la relation entre X et Y est dite croissante. Les deux
variables évolueront dans le même sens.
Si la covariance est négative la relation sera décroissante. Les deux variables
évolueront dans des sens différents ( lorsque X augmente Y diminue et
inversement).
Si la covariance est nulle alors X et Y sont indépendantes.

10/11/21 STAT F. NAOUI 139


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

5.2 Le coefficient de corrélation r


 Il permet de mesurer l’intensité de la liaison linéaire entre
deux variables statistiques X et Y.  :

cov( x, y )
r 
x y

NB: Cette définition montre que le coefficient de


corrélation possède le même signe que la covariance et
qu’il est toujours compris entre -1 et 1

10/11/21 STAT F. NAOUI 140


Titre III - Statistique descriptive à deux dimensions:
L’analyse de la relation entre deux variables
 Interprétation du coefficient de corrélation : r
 r = 1 : corrélation linéaire positive parfaite. Tous les points se trouvent
sur une même droite croissante
 r = -1 : corrélation linéaire négative parfaite. Tous les points se
trouvent sur une même droite décroissante
 r = 0 : corrélation linéaire nulle. Il n’y aucune dépendance linéaire
entre les deux variables
  1  r  0 les deux variables varient en sens inverse, la relation

linéaire est faible ou forte selon que le coefficient de corrélation


linéaire est proche de 0 ou de 1

 0  r 1 les deux variables varient dans le même sens, la relation


linéaire est faible ou forte selon que le coefficient de corrélation
linéaire est proche de 0 ou de 1

10/11/21 STAT F. NAOUI 141


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

5.3 Le coefficient de détermination r²


 Noté r², le coefficient de détermination permet de mesurer la part

de la variation d’une variable expliquée par l’autre variable et


inversement.
cov ( y, x) 2
  Il est calculé comme suit : r² 
 ²y  ²x
Généralement, le coefficient de détermination doit
être toujours compris entre 0 et 1 soit 0< r² <1.

  - Si r² est très proche de 1 alors le pourcentage d’explication de Y en


fonction de X est important.
- Si r² est proche de 0 alors cette relation est faible et les chances
d’indépendance entre les deux variables seront fortes.

10/11/21 STAT F. NAOUI 142


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

Trois cas différents peuvent être particulièrement


rappelés:
 
·     R > 0  corrélation positive.
·     R < 0  corrélation négative.
·     R = 0  corrélation nulle

Remarque:
L’indépendance totale entre X et Y implique
nécessairement l’absence de corrélation. Par contre,
l’inverse n’est pas toujours vrai.

10/11/21 STAT F. NAOUI 143


Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables
5.4 La régression linéaire

5.4.1 définitions

  5.4.1.a) définition de la régression


D1: « La régression définit le fait de régresser une variable statistique Y (appelée
variable endogène) sur une autre variable X (appelée variable exogène)».

L’objectif en est de déterminer la part d’explication de X dans Y.

5.4.1.b) définitions de la linéarité


D2: « La linéarité signifie ici que la relation existante entre les deux variables est
linéaire c.à.d. définit par la relation suivante : Y=ax+b et tels que:
b : étant la constante.
a : désigne le poids de X sur Y ».

a et b représentent les deux paramètres à calculer au niveau de toutes les


distributions statistiques étudiées.
10/11/21 STAT F. NAOUI 144
Titre III - Statistique descriptive à deux dimensions: L’analyse de la
relation entre deux variables

5.4.2 Droite de régression linéaire


 

Appelée également droite d’ajustement, la droite de régression linéaire


désignée par y = ax+b permet d’ajuster l’ensemble des observations en
minimisant les écarts existants entre ces observations et les valeurs de
leurs moyennes arithmétiques.
 
La détermination de la DRL se fait par le calcul des deux paramètres a et
b tels que:

cov( x, y )
a 
 x² et b  y  ax
10/11/21 STAT F. NAOUI 145
Exercice
 Une entreprise agroalimentaire située à Marrakech semble être gênée par deux
préoccupations majeurs auxquelles elle vous demande de trouver une solution:
 - Existe-t il une relation entre son chiffre d’affaire et le nombre de personnel employé?
 -Mesurer l’intensité de la relation entre le chiffre d’affaire et le nombre de personnel employé.
 - Combien de personnes doit-t elle recruter pour réaliser un chiffre d’affaire de 34 000 dh, ou
de 50 000
 Pour répondre à ses interrogations, On met à votre disposition les informations
suivantes :
Chiffre d’affaire Effectif
(en 1000 dh) employé
Xi Yj
10 2
14 3
24 6
30 8
38 10
44 12
10/11/21 STAT F. NAOUI 146
Solution
 La réponse aux préoccupations de l’entreprise consiste à calculer :
cov(x,y), r, et étudier la régression linéaire (a=? et b=?)

Chiffre d’affaire Effectif


(en 1000 dh) employé (Xi)2 (yj)2 X i Yj
Xi Yj
10 2 100 4 20
14 3 196 9 42

24 6 576 36 144
30 8 900 64 240
38 10 1444 100 380
44 12 1936 144 528
160 41 5152 357 1354

10/11/21 STAT F. NAOUI 147


Résultats :
Après développement, on aura:

n
x  xi 160 26,67
n
1 y  1  yi  416,83
n i 1 6 n i 1 6
N
1
cov(y, x)  xi yi x y 1354  26,676,83 43,51
N i 1 6

cov( x, y )
r  1 Avec  x  12 ,14 et  y  3,58
 
x y

Ce qui donne donc :


43,51 43,51
a
cov( x, y )
 x²
= ²

147,38
 0,29
x²  x
b  y  ax = 6,83 – (0,29 * 26,67) = - 0,90
D’où : Y = 0,29 X +- 0,90
10/11/21 STAT F. NAOUI 148
Chapitre II – Les indices statistiques : Plan du
Chapitre

S1 : Les indices élémentaires : principes généraux


-

-Définition, propriétés et premiers calculs d’indices

S2 : Les indices synthétiques : principes généraux


-Les indices classiques : I/Prix ; I/Quantité ; I/Valeurs.
-Les indices arithmétiques et harmoniques

S3 : Les indices de LASPEYRES


-

-I/LAS des Prix - I/LAS des Quantités

S4 : Les indices de PAASCHE


-

-I/ PAASCHE des Prix - I/PAASCHE des Quantités

S5 : L’indices de FISCHER : L’indice de valeur


-

10/11/21 STAT F. NAOUI 149


Chapitre II – Les Indices statistiques :
Pourquoi étudier les indices statistiques?
 Pour étudier, pour comparer des phénomènes économique et sociaux , une même valeur à
plusieurs époques (Par exemple ; le prix du m² de terre à Marrakech pour différentes
années) ou à plusieurs endroits (Exemple: Les prix du m² par région pour l’année 2006, ou
l’année 2011), la seule donnée des chiffres n’est pas très parlante.

 En effet Pour l’étude des phénomènes économiques, on a souvent besoin de décrire les
variations de grandeurs simples (prix du blé, récolte de fruits et légumes, exportation
agroalimentaires (conserves d’olives), taux de natalité, etc.).Ces comparaisons dans le
temps et dans l’espace, se font généralement en effectuant le rapport des grandeurs
considérées : on parle d’indices statistiques élémentaires.

 IL est encore plus important d’être en mesure de suivre les évolutions de grandeurs
complexes(Exemples : le niveau général des prix, la production totale industrielle, les
exportations, etc.). Celles-ci peuvent être résumée par telles ou telles caractéristiques de
tendance centrale (les différents types de moyennes notamment) des indices élémentaires
qui leur correspondent : on parle alors d’indice synthétique.

 Donc, tout comme les paramètres étudiés pour les distributions à une ou deux variables, un
indice est une grandeur qui nous permet de résumer et d’éxprimer par un chiffre unique un
ensemble d’information. Un indice a pour objectif de permettre des comparaisons entre
grandeurs. Il peut s’agir de comparaisons dans le temps ou dans l’espace.
 L’intérêt d’un indice est alors de permettre la comparaison entre deux grandeurs ou les
valeurs d’une même grandeur à des moments différents.

10/11/21 STAT F. NAOUI 150


Chapitre II – Les Indices statistiques :
Pourquoi étudier les indices statistiques?
 Donc, tout comme les paramètres étudiés pour les distributions à une
ou deux variables,

 Un indice est une grandeur qui nous permet de


résumeret d’éxprimer par un chiffre unique un
ensemble d’information. Un indice a pour objectif de
permettre des comparaisons entre grandeurs. Il peut
s’agir de comparaisons dans le temps ou dans l’espace.

 L’intérêt d’un indice est alors de permettre la


comparaison entre deux grandeurs ou les valeurs d’une
même grandeur à des moments différents.

10/11/21 STAT F. NAOUI 151


Chapitre II – Les Indices statistiques :
S1 : Les indices élémentaires : principes généraux
-Définition, propriétés et premiers calculs d’indices

 Définition: a) Qu’est-ce qu’un indice


Considérons la variation dans le temps ou dans l’espace d’une grandeur simple X définie avec précision.
Cette grandeur prend les valeurs : x 0 ; x1 ; x2 ; ....... ; xt ; ...... 
aux dates (ou périodes) successives: 0, 1, 2,……….,t,…….

On appelle Indice élémentaire de la grandeur simple X à la date (ou période) t par rapport à la date (ou
période) 0, le rapport:

xt
t / 0 (d’où la multiplication
Généralement, ce rapport est exprimé enIpourcentage  100par 100).
La date (ou période ) 0 est la date de référence ou de basex
de l’indice.
0
La date (ou période ) t est la date courante.

10/11/21 STAT F. NAOUI 152


Chapitre II – Les Indices statistiques :
S1 : Les indices élémentaires : principes généraux
-Définition, propriétés et premiers calculs d’indices

 Définition : b) Quelques exemples


 Exemple 1:
Le prix de Kg de viande de bœuf a été de 43 Dh en moyenne en 1995 et de 65 Dh en janvier 2010.
Calculer et interpréter l’Indice élémentaire du prix de la viande de bœuf en janvier 2010, base 100 en 1995

 Exemple 2 :Soit X une grandeur mesurant les billets en circulation au Maroc, et si le montant de ces billets était de 15 018
millions de dirhams en 1995, et de 16 777 millions de dirhams en 2000, calculer et interpréter l’indice de monnaie fiduciaire
en 2000, base 100 en 1995.

 Exemple 3:
Si le prix du DH passe de 2,50 (Unité(s) de mesure) à 1,25Um entre les dates (t-1) et t, calculer et interpréter l’indice de
prix du dirhams en t, base 100 en (t-1).

10/11/21 STAT F. NAOUI 153


Chapitre II – Les Indices statistiques :
S1 : Les indices élémentaires : principes généraux
Définition, propriétés et premiers calculs d’indices

 Définition : C) Quelques Remarques


 - un indice élémentaire ne peut suivre l’évolution que d’une seule
variable : soit l’évolution du prix dans le temps, c’est alors un indice
temporel, soit l’évolution des différence de prix par département à
un moment donné, c’est alors un indice spatial.

 - Un indice se calcul à partir d’une donnée de référence qui sert de


base aux calculs. L’indice correspondant à cette donnée initiale est
100. Autrement dit l’indice à la date de base vaut toujours 100.

 - L’interprétation d’un indice simple (élémentaire) doit citer la


grandeur étudiée, les périodes concernées, le sens et la valeur de la
variation.

10/11/21 STAT F. NAOUI 154


Chapitre II – Les Indices statistiques :
S1 : Les indices élémentaires : principes généraux
Définition, propriétés et premiers calculs d’indices

 Propriétés des indices élémentaires


1/ Propriété d’identité : L’indice à la date de base
vaut toujours 100

I 0 / 0  1100  100%
Cette propriété est évidemment satisfaite par un indice
élémentaire puisque:
x
I   100  100%
0

x
0/0

10/11/21 STAT F. NAOUI 155


 Propriétés des indices élémentaires
2/ La circularité (ou transférabilité)
Un indice à la date t exprimé par rapport à une année de référence 0, peut être
décomposé en plusieurs indices élémentaires à des dates successives (ou à des
dates intermédiaires) de la façon suivante :

I t / 0  I t / t 1  I t 1/ t  2  ....  I 2 /1  I1/ 0


I 2010 / 2000  I 2010 / 09  I 09 / 08  ....  I 02 / 01  I 01/ 2000

Dès lors que nous observons des indices intermédiaires sur la période
considérée nous pouvons en déduire un indice global.
On dit alors que les indices élémentaires sont enchaînables. On forme alors une
chaîne d’indices.
10/11/21 STAT F. NAOUI 156
Chapitre II – Les Indices statistiques :
S1 : Les indices élémentaires : principes généraux
Définition, propriétés et premiers calculs d’indices

3. Cas particuliers:
-Utilité pour faire un changement de base :
Soit deux indices It/0 et I t'/0, exprimés en base 100 (année 0). On veut
exprimer l’indice à la date t par rapport à la date t’. Donc, on veut effectuer un
changement de base.
-Question : Comment procède-t-on ?

-Réponse : A l’aide de la formule générale de circularité :

It / 0  It /t'  It' / 0
Donc
It /t'  It / 0 / It' / 0
10/11/21 STAT F. NAOUI 157
Chapitre II – Les Indices statistiques :
S1 : Les indices élémentaires : principes généraux
Définition, propriétés et premiers calculs

 Propriétés des indices élémentaires


3/ La réversibilité
Quand on inverse le rôle de la base de référence et celle de la valeur
courante, l’indice élémentaire s’inverse entre les deux.
On note alors :

1
It / 0   100
I0/t
On déduit alors que la comparaison de deux grandeurs reste ainsi
valable que l’on descende ou que l’on remonte le cours du temps.

10/11/21 STAT F. NAOUI 158


Chapitre II – Les Indices statistiques :
S2 : Les indices synthétiques : principes généraux
A) Intérêt et définition.
1 : Intérêt
Les indices considérés jusqu’à présent étaient des indices élémentaires retraçant l’évolution d’une
seule grandeur parfaitement définie et homogène.

Mais le plus souvent on désire suivre les variations de grandeurs complexes : l’indice général des prix,
la production industrielle, le volume des importations, exportations, la dépense annuelle par ménage, etc.

Ces grandeurs complexes sont composées d’un nombre plus ou moins grand de grandeurs simple : par
exemple, le niveau général des prix est constitué des prix des divers aliments et boissons, du logement, de
l’équipement ménager, de l’habillement, des services médicaux, des transports, des distractions, etc.
L’évolution de chacune de ses grandeurs simples est décrite par un indice élémentaire.

L’opération de construction d’un indice synthétique relatif à la variation


d’une grandeur complexe consiste donc à résumer une série d’indice
élémentaires.

N B : Cette opération de construction d’un indice synthétique pose des problèmes analogues au
résumé d’une distribution statistique à une dimension par une caractéristique de tendance centrale.

10/11/21 STAT F. NAOUI 159


Chapitre II – Les Indices statistiques :
S2 : Les indices synthétiques : principes généraux
A) Intérêt et définition.
2 : Définition
Soit X une grandeur complexe constituée des éléments suivants:
x1 ; x2 ; ....... ; xi ; ...... xn 
-X est, par exemple, le niveau général des prix
-x  ; x , etc. représentent les prix des différents articles ou services offerts au public (divers
1 2
aliments et boissons, du logement, de l’équipement ménager, de l’habillement, des services
médicaux, des transports, des distractions, etc. ).
-Nous pouvons calculer les indices élémentaires des constituants x de X comme suit :
i

x
  100
i
I i
t

x
t /0
i
0

Mais ils sont insuffisants pour rendre compte de l’évolution du niveau général des prix :
certains augmentent, d’autres diminuent sans qu’il soit généralement possible de conclure à
leur examen. Il faut résumer, synthétiser par un seul indice, qu’on appellera indice
synthétique de la grandeur complexe X, les différents indices élémentaires, un peu
comme l’on résume une distribution statistique en calculant, par exemple, sa moyenne.

10/11/21 STAT F. NAOUI 160


Chapitre II – Les Indices statistiques :
S2 : Les indices synthétiques : principes généraux
A) Intérêt et définition.

Comment alors calculer un prix ‘synthétique’


moyen ?
Comment de la même manière, calculer une
quantité ‘synthétique moyenne’ ?

Solution:
La réponse doit être cherchée dans les indices
synthétiques notamment les classiques d’entre eux.

STAT F. NAOUI
10/11/21 161
S2 : Les indices synthétiques : principes généraux
B) Calculs des indices synthétiques.
I : Les principaux indices synthétiques
A : Indice de LASPEYRES
L’indice de LASPEYRES est la moyenne arithmétique des indices
élémentaires, pondérée par les coefficients ai0 de la date ou période
de référence.

x
  ( a  I )   ( ai
i
L i i ) t

x
t /0 0 t /0 0
i i
i
0

Dans l’indice de LASPEYRES, les coefficients de pondération sont


fixes : ce sont ceux de la période de base.

Avec  (a )  (a )  1
i
i
0
i
i
t

10/11/21 STAT F. NAOUI 162


S2 : Les indices synthétiques : principes généraux
B) Calculs des indices synthétiques.
I : Les principaux indices synthétiques
B : Indice de PAASCHE
L’indice de PAASCHE est la moyenne harmonique des indices élémentaires,
pondérée par les coefficients ait de la date ou période en cours (t).

ai t xi 0
Pt / 0  1/( )  1/  (ait )
i Ii t / 0 i xi t

Dans l’indice de PAASCHE, les coefficients de pondération sont ceux de la période


courante: (ils changent avec celle-ci).

Avec  ( a )   ( ai )  1
i
i
0
i
t

10/11/21 STAT F. NAOUI 163


S2 : Les indices synthétiques : principes généraux
B) Calculs des indices synthétiques.
I : Les principaux indices synthétiques

C : Indice de FISHER

L’indice de Fisher est la moyenne géométrique simple des indices de


Laspeyres et de Paasche.

F t /0
L .Pt /0 t /0

10/11/21 STAT F. NAOUI 164


B) Calculs des indices synthétiques.
II : Les indices de prix, de quantités et de valeur
A) INDICE DE PRIX

Indice de Laspeyres des prix Indice de Paasche des prix

 (q  p )
i i  (q  p )
i i

Lp  Pp 
0 t t t
i i

 (q  p )  (q  p )
t /o t /o
i i i i
0 0 t o
i i

10/11/21 STAT F. NAOUI 165


B) Calculs des indices synthétiques.
II : Les indices de prix, de quantités et de valeur

 (q  p ) i i
Dépense totale de la période de base évaluée au prix courant
Lp  
0 t
i

 (q  p )
t /o
i i Dépense totale de la période de base
0 0
i

 (q  p ) i i
Dépense totale de la période courante
Pp  
t t
i

 (q  p )
t /o
Dépense totale de la période courante
i i
t 0 évaluée au prix de l' année de base
i

10/11/21 STAT F. NAOUI 166


B) Calculs des indices synthétiques.
II : Les indices de prix, de quantités et de valeur
B) INDICE DES QUANTITES (OU VOLUMES)
Indice de Laspeyres des quantités Indice de Paasche des quantités

 (q  p )  ( qi  pi )
Pq 
i i
t o
i t t

Lq  i t /o
t /o
 (q  p )
i i  ( qi 0  pi t )
i
0 0
i

10/11/21 STAT F. NAOUI 167


B) Calculs des indices synthétiques.
II : Les indices de prix, de quantités et de valeur
C) INDICE DE VALEUR

 Un indice de valeur est le rapport de la somme des valeurs


(Prix . Quantité) relatives à la période courante à la somme
des valeurs de la période de base :

 (q  p ) i i


t t
V i

 (q  p )
t/o
i i
0 0
i

 A la différence des indices de prix et des quantités, il n’ya


qu’une seule formule d’indice de valeur.

10/11/21 STAT F. NAOUI 168


B) Calculs des indices synthétiques.
II : Les indices de prix, de quantités et de valeur
-Résumé-
Indice de Laspeyres des prix Indice de Paasche des prix

 (q  p ) i i
 (q  p )

0 t
Lp
i i


i t t
Pp i

 (q  p )
t/o

 (q  p )
t /o
i i
0 0 i i
i t o
i

 Indice de Laspeyres du volume  Indice de Paasche du volume

 (q  p )  (q  p ) i i


i i t t

Lq  i
t o
Pp i

 (q  p )
t /o

 (q  p )
t /o
i i
i i 0 t
0 0 i
i

 (q  p )i i


t t
 Indice de Valeur V i

 (q  p )
t /o
i i
0 0
i

10/11/21 STAT F. NAOUI 169


C) Propriétés des indices synthétiques.

Idée de départ:

Comme les indices élémentaires, les indices de Laspeyres et de Paasche


doivent satisfaire les propriétés des indices.
Ce qui n’est pas le cas notamment pour la propriété de réversibilité et
de circularité.
En effet, dans le cas de réversibilité l’indice de Laspeyres devient un
indice de Paasche et vice versa.

10/11/21 STAT F. NAOUI 170


 Réversibilité de l’Ip de Laspeyres

 (q1  p2 )
1 1
Lp 2 / 1   
Pp1/ 2
 (q 1  p1 )  (q 1  p1 )

 (q 1  p2 )

On constate ainsi que :


Lp2/1=1/Pp1/2
10/11/21 STAT F. NAOUI 171
 Réversibilité de l’Ip de Paasche

 (q 2  p2 )
1 1
Pp2 /1   
Lp1/ 2
 (q 2  p1 )  (q 2  p1 )

 (q 2  p2 )

On constate ainsi que :


Pp2/1=1/Lp1/2
10/11/21 STAT F. NAOUI 172
C’est ainsi que Fisher nous propose une autre formule qui satisfait à la propriété
de réversibilité.
L’indice de Fisher sera calculé comme une moyenne géométrique des indices de
Laspeyres et de Paasche, tel que:
Avec:

F2 /1  L2 /1  P2 /1

1 1 1
F1/ 2  L1/ 2  P1/ 2   
L2 /1 P2 /1 F2 /1
10/11/21 STAT F. NAOUI 173
Exemple:
Les données concernant trois produits sont données comme suit:

2008 2009 2010


Q P Q P Q P
A 200 10 230 12 120 8
B 480 35 230 40 800 23
C 345 23 345 23 567 45

1.Calculer les indices de prix de Laspeyres et de Paasche en 2010,


base 100 en 2008 ?.
2.En déduire l’indice de prix de Fisher?

10/11/21 STAT F. NAOUI 174


Solutions:
 Indice de prix de Laspeyres

 (q 08  p10 )
Lp10 / 08  i A
C

 (q
i A
08  p08 )

A
( q08  p10
A
)  ( q08
B
 p10
B
)  (q08
C
 p10
C
)
Lp10 / 08 
( q08  p08 )  (q08  p08 )  ( q08  p08 )
A A B B C C

Lp10 / 08  105,35
10/11/21 STAT F. NAOUI 175
 Indice de prix de Paasche
C

 (q 10  p10 )
Pp10 / 08  i A
C

 (q
i A
10  p08 )

A
( q10  p10
A
)  ( q10
B
 p10
B
)  ( q10
C
 p10
C
)
Pp10 / 08  A
( q10  p08
A
)  ( q10
B
 p08
B
)  ( q10
C
 p08
C
)

Pp10 / 08  106,24
10/11/21 STAT F. NAOUI 176
Thème n°2: LES INDICES STATISTIQUES
 Indice de prix de Fisher

F10 / 08  L10 / 08  P10 / 08

F10 / 08  105,35  106,24

F10 / 08  105,79

10/11/21 STAT F. NAOUI 177


Bon courage

et

Bonne chance

10/11/21 STAT F. NAOUI 178

Vous aimerez peut-être aussi