Vous êtes sur la page 1sur 148

Statistique descriptive

Licence des études fondamentales : Filière Sciences Economiques et


gestion
Tronc Commun National, Module N° 5, Semestre 1

Professeure : Khadija EL ISSAOUI


1
Objectifs du cours

Permettent à l’étudiant de développer l’ensemble des concepts de base et


méthodes nécessaires à la compréhension et à l’utilisation de la statistique
descriptive. Ce cours permet de se familiariser avec la méthode statistique
en général, en vue de décrire, de résumer et d’analyser une population ou
un ensemble de données. Les apprenants devront être capables de
maîtriser les concepts de base (terminologie) de la statistique descriptive,
ainsi que les notions essentielles sur les distributions statistiques (à un et
deux caractères), les indices et les séries chronologiques. L’étudiant devra
ainsi se familiariser avec les méthodes de traitement et d’analyse de
l’information chiffrée, étudier les phénomènes économiques, les expliquer,
les prévoir pour pouvoir prendre les décisions les plus appropriées, ce qui
constitue un atout pour l’insertion professionnelle.

K. EL ISSAOUI 2
Bibliographie

- GOLDFARB, Bernard, PARDOUX, Catherine, (2011) :


«Introduction à la méthode statistique : Economie,
gestion», 6e édition, Edition: Dunod.
- LECOUTRE, Jean-Pierre, (2012) : « Statistique et
probabilités : Cours et exercices corrigés », 5ème
édition, Edition : Dunod.
- LETHIELLEUX, Maurice, (2012) : « Exercices de
statistique et probabilités avec rappels de cours en 12
fiches », 2e édition, Edition : Dunod.
- BERTRAND, F.,MAUMY-BERTRAND, M., (2011) :
« Maxi fiches de Statistique pour les scientifiques »,
Edition : Dunod.
K. EL ISSAOUI 3
Sommaire

1) L’appréhension statistique
2) Les tableaux statistiques et représentation graphique
3) Les caractéristiques de position (ou valeur centrale)
4) Les caractéristiques de dispersion
5) Les caractéristiques de concentration
6) Les caractéristiques de formes
7) Les indices statistiques
8) Distribution statistique à 2 variables X et Y
4
K. EL ISSAOUI
Chapitre 1 / L’appréhension statistique

1) Définition de la Statistique descriptive


2) Population; Echantillon ; Individu
3) Comment recueillir les données statistiques ?
4) Variable; caractère
5) Modalité
6) Effectif
7) tableau (Tableau individus-caractères)

K. EL ISSAOUI 5
Chapitre 2 / Tableaux statistiques et représentation graphique

1) Tableau statistique ou Distribution statistique

2) Définition de la Fréquence

3) Effectif cumulé (croissant et décroissant)


Fréquence cumulée (croissante et décroissantes)

4) Les représentations graphiques

K. EL ISSAOUI 6
Chapitre 3 / Les indices de position ou de tendance centrale

1) Les conditions de Yule

2) Le mode

3) La médiane

4) Les moyennes

K. EL ISSAOUI 7
Chapitre 4 / Les caractéristiques de
dispersion

1)L’étendue
2)Les intervalles interquantiles
3)Ecart absolu moyen
4)Variance
5)écart-type
6)Les moments simples et centrés
8
K. EL ISSAOUI
Chapitre 5 / Les caractéristiques de
concentration

1) Courbe de concentration de Lorenz

2) Indice de Gini

3) Médiale

9
K. EL ISSAOUI
Chapitre 6 / Les caractéristiques de formes

1) L’asymétrie

2) L’aplatissement

K. EL ISSAOUI 10
Chapitre 7 / Les indices statistiques

1) Les indices élémentaires

2) Les indices synthétiques

K. EL ISSAOUI 11
Chapitre 8 /Distribution statistique à deux
variables X et Y

1) Tableau croisé ou tableau de contingence


2) Distribution marginale (distribution non
indépendante) et distribution
conditionnelle (distributions liées)
3) Etude de liaison entre deux variables :
régression, ajustement et corrélation
4) Méthode des moindres carrés ordinaire
5) Le coefficient de corrélation linéaire
K. EL ISSAOUI 12
Chapitre 1
L’appréhension statistique

K. EL ISSAOUI 13
1) Définition de la Statistique descriptive

La Statistique descriptive est un ensemble de


méthodes permettant de décrire et
d’analyser, de façon quantifiée, des
phénomènes repérés par des éléments
nombreux, de même nature, susceptible
d’être dénombrés et classés.

K. EL ISSAOUI 14
2) Comment recueillir les données statistiques ?

- Enquêtes exhaustives : est appelée recensement.


C’est lorsqu’on s’intéresse à l’ensemble des individus qui
composent la population étudiée

- Enquêtes partielles : est appelée enquête par


sondage. C’est lorsqu’on s’intéresse à une partie
représentative des individus qui composent la population
étudiée. Dans ce cas la représentativité joue un rôle
déterminant dans la constitution de l’échantillon.

K. EL ISSAOUI 15
3) Population; Echantillon ; Individu
- La population est l’ensemble des individus (ou éléments) observés. Par
exemple :
→ l’ensemble des marocains,
→ Les enfants moins de 10 ans,
→ les salariés d’une entreprise,
→ les étudiants d’une université,
→ les condamnés à une peine de justice,
→ les habitants de Rabat,
→ les secteurs industriels, etc.
- Les individus peuvent être :
→ des êtres humains : ensemble des marocains, étudiants d’une université,
salarié d’une entreprise, etc.
→ un ensemble d’objets : les voitures fabriquées par une entreprise, les
voitures achetées par les ménages marocains, etc.
→ un ensemble d’entités géographiques : les habitants de Rabat-salé, les
pays de l’Union européenne, etc.
- Lorsque la population devient trop grande pour être étudiée et analysée dans sa
totalité, on considère une partie de cette population (échantillon). Un
échantillon est un sous-ensemble de l’ensemble population
K. EL ISSAOUI 16
4) Variable ; caractère

Une variable
→ est un aspect particulier des individus auxquels on s’intéresse
→ représente les multiples facettes selon laquelle on peut étudier un
individu d’une population ou d’un échantillon
→ est une caractéristique qui peut varier d’un individus à un l’autre
→ porte le nom d’un caractère
→ peut être quantitative ou qualitative
Par exemple :
le chiffre d’affaires ; les exportations; les importations ; la valeur-ajoutée ;
les dépenses en R&D; l’âge ; le sexe ; le nombre d’enfants d’un salarié ; le
prix ou la marque d’un véhicule ; le mode d’hébergement ; la durée d’un
séjour de vacances; le lieu d’un accident de la route ; la période à laquelle
s’est produit l’accident
K. EL ISSAOUI 17
Variable; Caractère

18
K. EL ISSAOUI
a) Variable qualitative
- Variable nominale : les modalités d’une variable ne possèdent pas
d’une relation d’ordre
Variable statistique étudiée : situation matrimoniale des employés d’une
entreprise
Modalités
Célibataire
Marié
Veuf
Divorcé
- Variable ordinale (ou ordonnée) : les modalités d’une variable
possèdent une relation d’ordre
Variable statistique étudiée : mentions en licence de sciences
économiques
Modalités
Très bien
Bien
Assez bien
K. EL ISSAOUI Passable 19
b) Variable quantitative

Une variable est quantitative lorsque


l’ensemble de ses modalités est un
ensemble de nombres. Elle peut être
discrète ou continue.

K. EL ISSAOUI 20
Variable discrète

Une variable statistique est discrète


lorsqu’elle est mesurée par des nombres
isolés (la plupart du temps des nombres
entiers naturels appartenant à l’ensemble N :
0, 1, 2, 3, 4, etc...).
Par exemple :
le « nombre d’enfants » par ménage, le
nombre de pièces d’un appartement, le
nombre de salariés d’une entreprise

K. EL ISSAOUI 21
Variable continue

Une variable statistique est continue lorsqu’il est a


priori possible de « pousser » sa mesure à des
décimales. Les valeurs de la variable peuvent prendre
toutes les valeurs d’un intervalle réel appartenant à
l’ensemble R (nombre réel infini).
Par exemple :
Le revenu d’individus, le poids d’un individu, le chiffre
d’affaires des entreprises d’un secteur d’activité, le prix
de véhicules, etc.
Est « continue », une variable qui peut prendre un si
grand nombre de valeurs, qu’on est obligé de les
regrouper
K. EL ISSAOUI en classes. 22
Technique de regroupement en classes
- Le regroupement en classes se justifie par l’existence d’un
grand nombre de modalités ; la présentation des données
s’en trouve simplifiée.
- Les classes sont notées :
- L’intervalle est fermé à gauche et ouvert à droite : il inclut
toutes les valeurs de la variable supérieures ou égales à la
borne inférieure ei et strictement inférieures à la borne
supérieure ei+1
- La différence ei+1 − ei s’appelle l’amplitude de la classe ;
elle est notée ai
- Une amplitude peut être égales ou inégales
- La moyenne des extrémités de classe est appelée
centre de la classe et notée xi

23
K. EL ISSAOUI
Exemple :extrait de la base de données sur le
comportement des consommateurs de la région de Tanger

Numéro âge
1 25 Quelle est la nature du caractère
2 35 « âge » ?
3 26 Réaliser des classes correspondantes
4 38
aux modalités du caractère « âge »
5 34
6 33
7 41
8 64
9 52
10 39
11 34
12 27
13 31
14 38
15 64
16 66
17 71
18 70
19 76
20 25 24
K. EL ISSAOUI
5) Modalité
Une modalité
→ est les différentes situations possibles d’un caractère ou
→ une des réponses possibles à une question
→ les modalités de la variable étant à la fois
incompatibles : de manière à ce qu’un individu ne
puisse appartenir à plus d’une modalité à la fois (ex. un
individu ne peut pas avoir deux âges différents, etc.)
exhaustives : afin de prévoir toutes les situations
possibles, sans exception
sans ambigüité : pour ne pas faire d’erreur de
classement

K. EL ISSAOUI 25
Exemple des modalités

Variables/caractères Modalités
Sexe Homme et femme
Taille XS, S, M, XM, L, XL, XXL
Age Ensemble des âges des individus
observés
Marque Liste de toutes les marques observées
dans l’ensemble des véhicules étudiés.
Prix Ensemble de tous les prix constatés
Lieu d’accident Autoroutes, routes nationales, routes
départementales et autres routes

La modalité «autre» ou «indéterminé» permet de classer, sans


avoir à en préciser le détail et risquer d’en oublier.

26
K. EL ISSAOUI
6) Effectif
- L’effectif ni d’une modalité
→ correspond au nombre d’individus qui possèdent
cette modalité
→ est également appelé fréquence absolue
- L’effectif total N est la somme des effectifs ni

N est égale au nombre total d’individus de la population.

K. EL ISSAOUI 27
7) Tableau individus-caractères
Tableau individus-caractères (ou une base de données ou tableau de
données brutes)
- est un document sur lequel on inscrit l’ensemble des informations
utiles à l’étude d’un phénomène.
- est un recueil de données statistiques
- est un document où l’inscrit pour chaque individu d’une population ou
d’un échantillon les modalités de réponses à un ensemble de
caractères retenus pour l’étude.

Dans le cas de N
X
observations d’un seul
caractère nous pouvons Individu 1 X1
avoir le tableau individus- Individu 2 X2
caractères suivant :
… …
Individu N XN
28
K. EL ISSAOUI
Chapitre 2
Les tableaux statistiques et
représentation graphique
Les données statistiques brutes sont le plus souvent
inutilisables, et non interprétables. Il faut les « mettre
en ordre » d’où la nécessité de construire un tableau
statistique.
Un tableau statistique est une distribution statistique
ou série statistique
K. EL ISSAOUI 29
Exercice d’application
Extrait de la base de données ou tableau individus-
caractères
Type Nombre Nombre de
Numéro d'occupation d’enfants voitures
1 Locataire 3 0
2 Propriétaire 4 2
3 Locataire 3 1
4 Propriétaire 1 2
5 Locataire 3 2
6 Locataire 1 3
7 Proprétaire 3 1
8 Locataire 3 3
9 Proprétaire 1 2
10 Proprétaire 3 2
11 Propriétaire 3 2
12 Locataire 4 1
13 Proprétaire 4 1
14 Propriétaire 2 1
15 Proprétaire 2 1
16 Locataire 2 1
17 Propriétaire 2 1
18 Proprétaire 2 1
19 Locataire 1 0
K. EL ISSAOUI 30
20 Propriétaire 3 0
Question :

Quelle est la nature des caractères « type d’occupation du


logement», « nombre d’enfants », « nombre de voitures » ?
Définir la variable statistique associée à chacun des caractères

pour chacun de ces caractères définir sa nature et construire sa


distribution statistique sous forme de tableau.

K. EL ISSAOUI 31
1) Tableau statistique ou Distribution statistique

K. EL ISSAOUI 32
2) Définition de la Fréquence

La fréquence associée à une modalité indique la proportion


d’individus présentant cette modalité.

C’est un nombre compris entre 0 et 1, ou 0% et 100%

La fréquence est un réel positif inférieur à 1, car et ni <N

La somme des fréquence est égale à 1 ou 100%

K. EL ISSAOUI 33
3) Effectif cumulé (croissant et décroissant)
Fréquence cumulée (croissante et décroissantes)

- Effectif cumulé croissant est le nombre d’observations


qui correspond à la modalité inférieure ou égale xi
- Effectif cumulé décroissant est le nombre d’observations
correspondant à la modalité supérieure ou égal xi
- Fréquence cumulée croissante est la proportion
d’observation qui correspond à la modalité inférieure ou
égale xi
- Fréquence cumulée décroissante est la proportion
d’observation qui correspond à la modalité supérieure ou
égale xi

K. EL ISSAOUI 34
Effectif cumulé et fréquence cumulée

Effectif Fréquence
(modalités) Effectifs Fréquence cumulé cumulée

(X ) (ni) (fi) (Ni) (Fi)

X1 n1 f1 N1 F1=f1

X2 n2 f2 N2=n1+n2 F2=f1+f2

.. .. .. .. ..

.. .. .. .. ..

Xk nk fk Fk=1

K. EL ISSAOUI 35
Effectif cumulé croissant
Effectif cumulé décroissant
Exemple :
Population : 30 familles d’un même immeuble
Caractère : Revenu mensuel par famille en DH

Classes Effectifs
[3000- 4000[ 1
Quel est le nombre de
[4000- 5000[ 2
familles dont le revenu
[5000- 6000[ 4 mensuel est inférieur à 7000
[6000- 7000[ 7 DH?
[7000- 8000[ 4 Quel est le nombre de
familles dont le revenu
[8000- 9000[ 3
mensuel est supérieur (ou
[9000- 10 000[ 5 égal) à 8000 DH?
« plus de 10 000 4
Total 30
K. EL ISSAOUI 36
Statistique descriptive Université Mohammed V Rabat FSJES Agdal

L’effectif cumulé croissant est calculé en faisant la somme


des effectifs à partir de la 1ère classe.
L’effectif cumulé décroissant : la somme est effectuée en
partant de la dernière classe.
Classes Effectifs Effectifs Effectifs
cumulés cumulés La 5ème ligne du
  tableau , par exemple,
[3000- 4000[ 1 1 30 se lit :
[4000- 5000[ 2 3 29 4 familles ont un
[5000- 6000[ 4 7 27 revenu mensuel
compris entre 7000
[6000- 7000[ 7 14 23
et 8000 DH
[7000- 8000[ 4 18 16 18 familles ont un
[8000- 9000[ 3 21 12 revenu mensuel
[9000- 10 000[ 5 26 9 inférieur à 8000 DH
« plus de 10 000 4 30 4 16 familles ont un
revenu mensuel
Total 30
supérieur (ou égal) à
K. EL ISSAOUI 37
7000 DH
4) Les représentations graphiques

1)Représentations graphiques des caractères


qualitatifs

2)Représentation graphique des caractères


quantitatifs discrets

3)Représentation graphique des caractères


quantitatifs continus

K. EL ISSAOUI 38
Représentations graphiques des caractères qualitatifs

1) Diagramme à bandes (les tuyaux d’orgue)

2) Diagramme à secteurs circulaires

3) Diagramme en barre

K. EL ISSAOUI 39
Application : Une enquête sur la situation matrimoniale des
employés d’une entreprise permet d’établir le tableau
suivant :
Répartition de la situation matrimoniale des
employés d’une entreprise

Modalités Effectifs
Célibataires 172
Marié 270
Veuf 19
Divorcé 39

1)Quelle est la nature du caractère « situation matrimoniale » ?

2)Calculer l’effectif total et les fréquences de cette distribution

3)Donner plusieurs représentations graphiques de cette variable

K. EL ISSAOUI 40
1/ Diagramme à bandes (tuyaux d’orgue)

Effectifs
300

250

200

150

100

50
Situation
0 matrimoniale
Célibataires Marié Veuf Divorcé

Les graphiques en tuyaux d’orgue font apparaître des rectangles


de base constante, dont les hauteurs sont proportionnelles aux
effectifs ou aux fréquences
K. EL ISSAOUI 41
2 / Diagramme en secteurs

3, 7,8%
8%
34,4%

54%

Célibataires Marié Veuf Divorcé

Dans ce type de représentation, nous utilisons un disque (plus


communément appelé camembert). Chacune des modalités est
représentée par un secteur qui est proportionnel à l’effectif ou à
la fréquence.
L’angle au centreK.: ELαISSAOUI
= fi × 360° 42
3 / Diagramme en barre

Situation matri-
moniale

Divorcé

Veuf

Marié

Célibataires

Effectifs
0 50 100 150 200 250 300

K. EL ISSAOUI 43
Représentations graphiques de variables
statistiques discrètes

1) Le diagramme en bâtons

2) La courbe cumulative

K. EL ISSAOUI 44
Application : représentation graphique d’une variable
quantitative discrète
Une enquête sur le nombre d’enfants par ménage d’un
échantillon de 30 ménages interrogés

Nombre Ménage Fréquence


d’enfants s s
xi Effectifs
ni -Définir :
→la population étudiée
0 6 6/30 = →l’individu ou l’unité statistique
0,20
→Les modalités ou les valeurs de
1 9 9/30 =0,30 la variable
2 7 7/30 = -Quelle est la nature du caractère
0,23
« note »?
3 4 4/30 = -Donner plusieurs représentations
0,13
graphiques de cette variable
4 2 2/30 =
0,07
5 et plus 2 2/30 = K. EL ISSAOUI 45
1/ Le « diagramme en bâtons »

A chaque valeur xi de la variable, on trace un « bâton » (un segment


vertical) dont la longueur proportionnelle à l’effectif ou à la fréquence

K. EL ISSAOUI 46
2/ La « courbe cumulative »
Il s’agit de représenter les fréquences cumulées ou les effectifs cumulés. Le diagramme
cumulatif croissant d’une variable quantitative discrète est une fonction dite « en
escalier ». Cette fonction est par hypothèse continue à gauche.
On parle de la fonction de répartition ou fonction cumulative
C’est une fonction constante par intervalles, ainsi définie :

Nombre Ménage
d’enfants s
xi Effectifs
ni

0 6
1 9
2 7
3 4
4 2
5 et plus 2
K. EL ISSAOUI 47
Total 30
Effectif cumulé
30

25

20

15

10

5
Nombr Ménages Effectifs
e Effectifs cumulés 0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5
d’enfa ni 
Nombre d'enfants (xi)
nts
xi

0 6 6
1 9 15
2 7 22
3 4 26
4 2 28
5 et 2 30 K. EL ISSAOUI 48
plus
Nombre Ménage Effectifs Effectifs
d’enfant s cumulés cumulés
s Effectifs  
xi ni
0 6 6 30
1 9 15 24
2 7 22 15
3 4 26 8
4 2 28 4
5 et plus 2 30 2
Total 30
« Moins « Plus de »
- Il y a 15 ménages de l’échantillon qui ont moins de (ou
de »
Effectif inférieur) de 2 enfants (ou « au plus » ou « au maximum » 1
cumulé enfant)
croissan - 6 ménages de l’échantillon sont sans enfant
t
- Il y a 26 ménages de l’échantillon qui ont moins de (ou
inférieur) 4 enfants (ou « au plus » ou « au maximum » 3
Effectif Il y a 24 ménages de l’échantillon qui ont plus de (ou
enfants)
cumulé supérieur) 0 enfant (ou « au minimum » ou « au moins » 1
décroissa enfant) K. EL ISSAOUI 49
nt Il y a 8 ménages de l’échantillon qui ont plus de (ou supérieur)
Les représentations graphiques d’une variable
quantitative continue

1) Histogramme

2) Le polygone de fréquences

3) Courbe cumulative et fonction de répartition

K. EL ISSAOUI 50
1) Histogramme
En statistiques, un histogramme est un graphique permettant de
représenter la répartition d'une variable continue.
Distribution des salaires de la société OCP
Dépenses salariales (mille dirhams)

L’abscisse sert à représenter les bornes des classes de la variable considérée.


Le but de l'histogramme est de mettre graphiquement en évidence la répartition
des effectifs (ou des fréquences) des classes
K. EL ISSAOUIconsidérées. 51
Le cas des amplitudes sont inégales
Une compagnie de taxie s’intéresse au kilométrage effectué par ses
véhicules
Trajets en Nombre fi % ai Rapport hi =fi%/rapport
kilomètres de taxis des des amplitudes
xi ni amplitude
s
(ai/a)
[10 ; 20[ 9 13,85% 10 10/10 =1 13,85%
[20 ; 30[ 13 20,00% 10 10/10=1 20,00%
[30 ; 40[ 22 33,85% 10 10/10=1 33,85%
[40 ; 50[ 10 15,38% 10 10/10=1 15,38%
[50 ; 70[ 11 16,92% 20 20/10=2 16,92%/2=8,46

OnTotal 65 de fi Σaux
reporte les valeurs = 100%
amplitudes unités (ou amplitude de base)
Ici, l’amplitude unité = 10
On divise fi par le rapport des amplitudes quand elles ne sont pas égales à
l’amplitude unité
L’amplitude de la dernière classe est 20, donc on a divisé fi par 20/10 =2
K. EL ISSAOUI 52
16,92%/2=8,46
2) Polygone de fréquences

Le polygone des fréquences joint les milieux des sommets des


rectangles des classes d’amplitudes égales

K. EL ISSAOUI 53
3) Courbe cumulative et fonction de répartition
Il est intéressant de connaître le nombre d’observations inférieures ou supérieures à
une valeur donnée
La courbe cumulative est la représentation graphique de la Fonction de répartition,
qui traduit la proportion des individus de la population dont la variable statistique est
inférieure à x (fréquence cumulées croissante)
La courbe cumulative croissante joint les points de les bornes supérieures de la
classe. La courbe cumulative décroissante passe par les bornes inférieures de
classes.

Moins de

Plus de

K. EL ISSAOUI 54
Les courbes cumulatives croissantes et décroissantes

fréquence
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0 40000 60000 80000 100000 120000 150000 200000 300000 400000
classes
Fi croissante Fi décroissante

K. EL ISSAOUI 55
Chapitre 3

Les caractéristiques de valeur


centrale ou de position

Les caractéristiques sont des valeurs précises qui permettent de


synthétiser et de résumer les tableaux statistiques ou les graphes.

Ces caractéristiques facilitent les comparaison, procurent un gain de


« clarté » et de « commodité de manipulation »

K. EL ISSAOUI 56
1) Les conditions de Yule

Une caractéristique correcte doit remplir les conditions de Yule :


- être définie de manière objective,
- dépendre de toutes les observations : elle ne doit, en ce sens,
pas résumer une partie de la série.
- avoir une signification concrète facile à concevoir : pou être
comprise par n’importe quel utilisateur, même non spécialiste.
- être simple à calculer.
- être peu sensibles aux fluctuations d’échantillonnage : de
façon par exemple à ne pas obtenir des valeurs différentes si
on l’applique sur plusieurs échantillons de la même
population.
- se prêter aisément aux calculs algébriques : de façon à
pouvoir comparer plusieurs séries par exemple, etc.

K. EL ISSAOUI 57
2) Le Mode

- Le Mode Xm d’une distribution statistique est la valeur de la variable pour


laquelle l’effectif (ou la fréquence) est le (ou la) plus élevé(e) ; C’est la
valeur qui se rencontre le plus fréquement
- On l’appelle aussi « valeur dominante »
- La distribution statistique est unimodale lorsqu’elle possède un seul mode
- La série ou la distribution est bimodale lorsqu’elle possède deux modes
- La série ou la distribution statistique est multimodale lorsqu’elle possède
plusieurs modes
- Exemple : dans la série 5,6,7,7,8,8,8,8,9,10 ; la valeur « 8 » apparaît le
plus fréquemment ; le mode est donc 8.
- Les définitions du mode s’appliquent immédiatement dans le cas d’une
variable discrète ; dans le cas d’une variable continue groupée en classes,
les définitions sont appliquées à ces classes et on parle d’intervalle modal
ou de classe modale
K. EL ISSAOUI 58
Variable
Variable
discrète
continue

Intervalle
modal

K. EL ISSAOUI 59
a) Cas 1 : Amplitude égale

Classes Effectifs
[30- 40[ 1
[40- 50[ 2
[50- 60[ 7
[60- 70[ 4

Classe
modale
- En faisant l’hypothèse du centre de classe, on peut
admettre, que le mode égale à Mo = 55
- On peut déterminer graphiquement la valeur du mode (à
l’intérieur de la classe modale) par la méthode des
diagonales
K. EL ISSAOUI 60
b) Cas 2 : les amplitudes de classe sont inégales
Il faut « corriger » les effectifs ou les fréquences.
Graphiquement le mode se détermine par la courbe des fréquences ajustée sur
l’histogramme :
Le calcul de la détermination de la classe modale se fait très facilement en 3 étapes :
Rapport des amplitudes
a est l’amplitude unité
xi ni ai ai/a hi
Effectif
corrigé
[10 ; 20[ 10 10 1 10
[20 ; 30[ 40 10 1 40
[30 ; 50[ 220 20 2 220/2 =110
Valeur
[50 ; 90[ 240 40 4 240/4 =60 dominante
[90 ; 100[ 10 10 1 10
La classe modale est donc entre [30 ; 50[ correspondant à un effectif corrigé « hi » de
110 (et non pas [50 ; 90[, comme on aurait pu, à tort l’imaginer en n’effectuant pas les
corrections des effectifs)
K. EL ISSAOUI 61
3) La médiane

- La médiane est la valeur du caractère qui partage la série


en deux sous ensembles égaux.
- Elle suppose, pour sa détermination, que les individus de la
population soient rangés dans un certain ordre (croissant
ou décroissant).

Exemple : série : 12,28,6,3,32,15,21


série ordonnée : 3,6,12, 15, 21,28,32

« avant » Mé « après »

- Une façon d’ordonner une série est de calculer les


fréquences cumulées F(x) ou N(x)

K. EL ISSAOUI 62
a) Cas d’une variable discrète

Si le nombre d’observations est impair, la médiane


est toujours parfaitement déterminée :
série ordonnée : 3,6,12, 15, 21,28,32

Médiane

Si le nombre d’observations est pair, on ne peut


définir qu’un intervalle médian à l’intérieur duquel la
médiane n’est pas déterminée :
série ordonnée : 3,6,12, 15, 21,28,32,38


Intervalle médian

K. EL ISSAOUI 63
Exemple : Répartition du nombre d’enfants par ménage

Nombre Ménage fi F(x) N(x)


d’enfants s
xi Effectifs
ni
0 20 0,1 0,1 20
Me = 2 1 65 0,325 0,425 0,5 85
2 70 0,35 0,775 155
3 30 0,15 0,925 185
4 10 0,05 0,975 195
5 5 0,025 1 200
Total N = 200 1

K. EL ISSAOUI 64
b) Cas d’une variable continue

Le calcul se fait en deux étapes :


1) Détermination de la classe médiane
2) On repère 0,5 (=50%) dans la colonne F(x) ou
dans N(x), et on suit le sens des flèches.

K. EL ISSAOUI 65
Exemple : Répartition des ouvriers de l’entreprise E selon le
salaire mensuel xi en dirhams

xi ni fi F(x) N(x)
[1000 ; 1100[ 26 0,186 0,186 26
[1100 ; 1200[ 33 0,235 0,421 59
0,5
[1200 ; 1300[ 64 0,458 0,879 123
[1300 ; 1400[ 7 0,050 0,929 130
[1400 ; 1500[ 10 0,071 1 140
N =140 1

Classe
médian
e

K. EL ISSAOUI 66
Détermination de la médiane par interpolation linéaire

1) Méthode fondée sur le théorème de Thalès


2) Méthode d’utilisation de la formule :

Avec :
xi : extrémité inférieure de la classe médiane ;
ai : amplitude de la classe médiane ;
F(xi) : fréquence cumulée de la classe située avant la classe
médiane ;
F(xj) : fréquence cumulée de la classe médiane ;
fi : fréquence de la classe médiane ;
0,5 représente la valeur théorique de l’image de la médiane
par l’intermédiaire de la fréquence
K. EL ISSAOUI
cumulée 67
Détermination graphique de la
Fréquences médiane
cumulées
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1 Médiane
0
15 25 35 50 65 80
Classes
Fi croissante Fi décroissante d’âge
K. EL ISSAOUI 68
Application

On donne la série statistique suivante :


14,16,12,9,11,18,7,8,9,16,7,9,18
La médiane est égale à :
9 11 14 16 18 [9 ; 18[ [11 ; 18[ autre
réponse

K. EL ISSAOUI 69
c) Généralisation de la médiane : Les quantiles

La généralisation de la notion de médiane porte le


nom de quantile. Parmi les quantiles les plus
utilisés, nous trouverons les quartiles, les déciles et
les centiles.
- Les quartiles
- Les déciles
- Les centiles
Les quantiles : on cherche une valeur de la variable, partageant la
série non plus en deux sous-ensembles égaux (50% et 50%), mais en
quatre sous-ensembles égaux, ou en dix sous-ensemble égaux,
ou en cent sous ensemble égaux…On peut posser cette logique
très loin et définir autant de quantiles que l’on veut.
K. EL ISSAOUI 70
- Les quartiles
Les quartiles sont les valeurs d’une série ou d’une distribution statistique
rangées par ordre croissant (ou décroissant) qui partagent l’effectif total en
quatre parties égales. Il existe trois quartiles souvent notés Q1, Q2, Q3.

Si (xi, Fi) représente la distribution des fréquences cumulées d’une


variable statistique, alors les quartiles sont donnés par les équations
:

Le quartile Q2 d’une variable statistique est égale à la


médiane Mé.
Q3 – Q1 s’appelle l’intervalle interquartile ; il contient 50%
des observations K. EL ISSAOUI 71
- Les déciles

Les déciles sont les valeurs du caractère (xi) qui


partagent la série en dix sous-ensembles égaux. Ils
sont donc au nombre de 9.

Notation D1, D2, D3,…, D9

D9-D1 s’appelle l’intervalle interdécile ; il contient


80% des observations
K. EL ISSAOUI 72
- Les centiles

Les centiles sont les valeurs du caractère (xi) qui


partagent la série en cent sous-ensembles égaux.
Ils sont donc au nombre de 99.

Notation C1, C2, C3,…, D99

C99-C1 s’appelle l’intervalle intercentile ; il


contient 98% des observations
K. EL ISSAOUI 73
Application

-Quand les classes d’une série statistique sont d’amplitude


inégales, il faut obligatoirement corriger les effectifs ou les
fréquences pour calculer le premier quartile.
Vrai Faux

-Pour calculer la médiane d’une série statistique continue, on est


obligé de corriger les effectifs ou les fréquences, si les
amplitudes sont inégales
Vrai Faux

K. EL ISSAOUI 74
Soit la répartition suivante :
xi ni fi F(x)
[3 ; 4[ 12 0,024 0,024
[4 ; 6[ 30 0,061 0,085
[6; 8[ 120 0,246 0,331
[8 ; 9[ 210 0,431 0,762
[9 ; 10[ 90 0,184 0,946
[10 ; 12[ 25 0,051 1

Le premier quartile est égale à :


7,34 8,39 10,20 210
La médiane est égale à :
330 210 8,39 50%
K. EL ISSAOUI 75
4) Les moyennes
La moyenne arithmétique : soit x1, …xi, …xr les observations
numériques d’une variable statistique X et soit les effectifs
respectifs n1, …ni, …nr de ces r valeurs numériques, avec :

La moyenne arithmétique pondérée de la distribution (xi,ni)


est le nombre :

La moyenne arithmétique pondérée peut être calculée à partir des


fréquences :

K. EL ISSAOUI 76
La moyenne arithmétique simple d’une variable X est
obtenue en posant dans la définition de la moyenne
pondérée : ni = 1 avec i Alors, la distribution (xi,1)
a pour moyenne arithmétique le nombre :

K. EL ISSAOUI 77
soit x1, …xi, …xr les r observations numériques d’une variable
statistique X et soit les effectifs respectifs n1, …ni, …nr de ces
r valeurs numériques :
La moyenne géométrique G de la distribution (xi, ni) est
obtenue à partir de la moyenne arithmétique de la distribution
(yi, xi), en posant yi=logxi avec xi positif ; on a donc

Qui s’écrit également :

C’est la racine nième du produit des n valeurs positives du


caractères x K. EL ISSAOUI 78
La moyenne quadratique Q de la distribution (xi,
ni) est obtenue à partir de la moyenne arithmétique
de la distribution (yi, xi), en posant yi=xi2 ; on a
donc :

C’est la racine carrée de la moyenne arithmétique des carrés


des observations de la série.
K. EL ISSAOUI 79
La moyenne harmonique H de la distribution (xi, ni) est
obtenue à partir de la moyenne arithmétique de la
distribution (yi, xi), en posant yi= avec xi non nul :

C’est la valeur de la variable pour laquelle son inverse est la


moyenne arithmétique de l’inverse des valeurs de la variable
K. EL ISSAOUI 80
Les moyennes

- La moyenne géométrique est utilisée quand les


valeurs de la variable statistique sont liées de façon
multiplicative les unes aux autres (exemple calcul
de taux d’accroissement moyens, calcul de
moyennes de coefficients multiplicateurs)
- La moyenne harmonique est employée quand les
valeurs observées varient en sens contraire (prix et
quantité par exemple).
- La moyenne quadratique donne une importance accrue
aux valeurs aberrantes de la variable statistique.
Il existe une la relation d’ordre entre les moyennes :

K. EL ISSAOUI 81
Application 1
Lors d’un contrôle de connaissances, on fait subir
à huit étudiants un test noté sur 50 points. La
série des notes obtenues est la suivante :
25 43 35 20 32 30 35 24
Calculer et expliquer les résumés statistiques
suivants :
1. Mode, médiane.
2. Moyenne arithmétique, quadratique,
géométrique, harmonique
3. Variance et écart type. Donner le coefficient de
variation K. EL ISSAOUI 82
Chapitre 4
Les caractéristiques de dispersion

Elles servent à préciser la variabilité de la série,


c'est-à-dire à résumer l’éloignement de
l'ensemble des observations par rapport a leur
tendance centrale.

K. EL ISSAOUI 83
1) L’étendue

L’étendue est la différence entre la plus grande et la


plus petite des observations sur une variable
statistique quantitative. Soit la variable statistique
quantitative X : sa distribution est (x i, ni) avec i
L’étendue est le nombre : xr − x1 (les xi étant classés
par ordre croissant).
L’étendue est la mesure la plus simple de la
dispersion (ou variabilité ou étalement) des
observations faites sur une variable.

K. EL ISSAOUI 84
Exemple

Effectifs
Notes Effectifs cumulés Effectifs
0 1 1 Notes Effectifs cumulés
1 2 3 [0 ; 5 [ 10 10
2 2 5 [5 ; 8 [ 8 18
3 3 8 [8 ; 12[ 12 30
4 2 10
[12 ; 15 [ 11 41
5 3 13
6 2 15 [15 ; 20[ 9 50
7 3 18 Total 50
8 4 22
9 3 25 20 -0 = 20
10 2 27 20 est l’étendue de ces deux séries (discrète et
11 3 30 continue)
12 4 34
13 4 38
14 3 41
15 1 42
16 2 44
17 1 45
18 2 47
19 2 49
20 1 50 K. EL ISSAOUI 85
2) Les intervalles interquantiles

Soit une variable statistique X,


l’intervalle interquartile est la différence entre le
quartile d’ordre 3 et le quartile d’ordre 1.

Un quartile représente 25 % de la population


Les quartiles sont les valeurs du caractère qui partagent la série en quatre
sous-ensembles égaux. Ainsi, il y a trois quartiles : Q1 ; Q2 ; Q3. On
remarque que Q2 est la médiane.
L’intervalle interquartile est Q3 – Q1 comprend 50 % des personnes
interrogées et regroupés autour de la médiane.
K. EL ISSAOUI 86
3) Ecart absolu moyen

L’Ecart absolu moyen est la moyenne des


écarts en valeur absolue par rapport à la
moyenne :

K. EL ISSAOUI 87
4) Variance

La Variance est une mesure de dispersion ou de


variabilité. Elle permet de caractériser la dispersion
des valeurs par rapport à la moyenne. C’est la
moyenne des carrés des écarts à la moyenne :

K. EL ISSAOUI 88
5) Ecart type

L’Ecart type est la racine carrée de la


variance :

K. EL ISSAOUI 89
6) Les moments simples

On appelle moment non centré d’ordre ρ de la variable


statistique X, la quantité définie par :

Que l’on peut écrire de la façon suivante si l’on utilise


les fréquences :

Calculer les moments simples


-d’ordre 0 ;
-d’ordre 1 ;
K. EL ISSAOUI 90
-d’ordre 2
-Les moments simples d’ordre 0 est égale à 1. En effet :

-Les moments simples d’ordre 1 correspond à la moyenne


arithmétique :

-Les moments simples d’ordre 2 représente le carré de la


moyenne quadratique

K. EL ISSAOUI 91
Les moments centrés d’ordre ρ

On appelle moment centré (sur la moyenne arithmétique)


d’ordre ρ de la variable statistique X, la quantité définie
par :

Que l’on peut écrire de la façon suivante si l’on utilise


les fréquences :

Calculer les moments centrés :


- d’ordre 0 ;
- d’ordre 1 ;
K. EL ISSAOUI 92
- d’ordre 2
-Les moments centrés d’ordre 0 est égale à 1. En effet :

-Les moments centrés d’ordre 1 est égale à 0 :

-Les moments centrés d’ordre 2 correspond à la variance :

K. EL ISSAOUI 93
Chapitre 5
Les caractéristiques de
concentration
L’étude de la concentration d’une distribution permet
de mesurer les inégalités de répartition. Elle
s’applique particulièrement aux salaires, aux
revenus, aux patrimoines, mais aussi aux chiffres
d’affaires ou à l’emploi. Elles concernent
principalement des variables quantitatives continues
K. EL ISSAOUI 94
Les outils d’analyse de la concentration sont :

La courbe de concentration ou de Lorenz


La médiale
L’indice de Gini (le concept de concentration
est dû à l’économiste Corrado-Gini)

-La mesure de la concentration revient à comparer


pour tout i, i=1,…K,

K. EL ISSAOUI 95
1) La courbe de concentration ou de Lorenz

La courbe de concentration, appelée courbe de Gini-Lorenz, est


la courbe qui représentative des Fi(nx) en fonction de Fi(x)

La proportion des individus dont le


caractère est inférieur à i (F(xi)) :
fréquence cumulée croissante

La proportion de la masse globale du


caractère possédée par les individus
dont le caractère est inférieur à i

La courbe de concentration permet de déterminer les valeurs de


la médiane XM et de la médiane XML
K. EL ISSAOUI 96
La courbe de concentration est la représentions graphique d’une
courbe mettant en relation des valeurs de Fi(nx) et les valeurs
des Fi(x)
Fi(nx) Bissectrice

K. EL ISSAOUI 97
Méthode des trapèzes et le calcul de l’aire de concentration

L’aire de concentration se calcul en faisant la somme des aires


des trapèzes élémentaires :

Comme l’aire de concentration est à l’intérieur de l’aire du


triangle qui vaut (0,5), alors l’aire de concentration est égale à :

K. EL ISSAOUI 98
2) Indice de Gini
- Le coefficient de Gini est une mesure statistique de la
dispersion d'une distribution dans une population donnée,
développée par le statisticien italien Corrado Gini.

- Le coefficient de Gini est un nombre variant de 0 à 1, où 0


signifie l'égalité parfaite et 1 signifie l'inégalité totale. Ce
coefficient est très utilisé pour mesurer l'inégalité des revenus
dans un pays.

- L’indice de Gini est égal à deux fois l’aire de concentration :

K. EL ISSAOUI 99
3) Médiale

La médiale est la valeur du caractère qui partage la


somme des nixi en deux parties égales :

La médiale est supérieure à la médiane

Plus la valeur de ce ratio est grande,


plus un petit nombre d’individus
concentre une part importante de la
masse des valeurs globales : la
concentration est forte

K. EL ISSAOUI 100
Application
La répartition ci-dessous donne la répartition de 82 exploitations en fonction
de nombre d’hectares cultivés
Distribution de 82 exploitations agricoles
Nombre d’hectares Nombre
d’exploitation
De 0 à moins de 22 7
De 22 à moins de 44 15
De 44 à moins de 66 30
De 66 à moins de 88 25
De 88 à moins de 110 5

1) Calculer la médiane et la médiale de cette distribution


rangée en classes
2) Représenter graphiquement la courbe de concentration
3) Calculer par la méthode des trapèzes l’aire de
concentration. En déduire l’indice de Gini
K. EL ISSAOUI 101
Chapitre 6
Les caractéristiques de formes
Les différents indicateurs d’asymétrie et d’aplatissement
permettent en premier lieu la comparaison entre les
distributions statistiques.
- l’asymétrie d’une distribution peut être approchée par une
comparaison entre le mode, la médiane et la moyenne
arithmétique
- l’aplatissement peut être approché par l’étude des
observations aux alentours du mode : plus le nombre
d’individus ayant une valeur proche du mode de la
distribution est élevé, plus la courbe sera concentrée et plus
K. EL ISSAOUI 102
l’aplatissement sera faible
1) L’asymétrie
Pour mesurer l’asymétrie d’une distribution statistique, des
statisticiens (Yule, Fisher, Pearson, …) ont élaborés des
coefficients :
- Le coefficient d’asymétrie de Pearson :
CP =0 : la distribution est
symétrique
CP >0 : la distribution est
asymétrique
- Le coefficient d’asymétrie de Fisher :

Trois situations peuvent se présenter :


- La courbe est symétrique lorsque ces coefficients sont nuls
;
- La courbe est asymétrique à droite quand ces coefficients
sont positifs ;
- La courbe sera dissymétrique (ou asymétrique) à gauche
K. EL ISSAOUI 103 si
Selon Fisher, trois cas de figure peuvent se présenter
Le coefficient est d'autant plus grand que l'asymétrie est forte

Etalement à gauche (mode ≠ médiane ≠ moyenne


arithmétique)
CF1 < 0 Indice négatif

Symétrie (mode=médiane=moyenne
arithmétique)
CF1 = 0 Indice nul

Etalement à droite
CF1 > 0 Indice positif

K. EL ISSAOUI 104
2) L’aplatissement

Le coefficient d’aplatissement de Fisher :

- Si ce coefficient est nul, alors la courbe de la distribution étudiée est


normale ;
- S’il est positif, alors la courbe de la distribution étudiée est pointue ;
- S’il est négatif, alors la courbe de la distribution étudiée est aplatie

Le coefficient d’aplatissement de Pearson :

- Si CP2 = 3, alors la distribution étudiée est normale ou mésokurtique;


- Si CP2> 3, alors la distribution est dite moins aplatie que la normale ou
leptokurtique (aigü);
- Si CP2< 3, alors la courbe de la distribution étudiée est plus aplatie que
la normale ou platykurtique.
K. EL ISSAOUI 105
Selon Fisher, trois cas de figure peuvent se
présenter :

Distribution plus aplatie ; Faible concentration


Aplatissement élevé
CF2<0 Indice négatif

Bonne distribution ; Concentration


normale
Aplatissement normal
CF2=0 Indice nul

Distribution moins aplatie ; Concentration élevée


Aplatissement faible
CF2>0 Indice positif
K. EL ISSAOUI 106
Application : Une entreprise industrielle vend des machines-outils. On
s’intéresse au nombre de machines vendues en une journée. Pour cela on
définit la variable statistique X associée au caractère « nombre de machines
vendues dans la journée ». On observe les ventes sur 600 jours ouvrés et
dresse le tableau des ventes :
Distribution des ventes journalières
d’une entreprise
Nombre de Nombre de
machines vendues jours de ventes Calculer les caractéristiques de
dans la journée Effectif forme suivante :
xi n1
0 98 a) les coefficients
1 232 d’asymétrie de Fisher et de
2 119 Pearson ;

3 85 b) les coefficients
4 50 d’aplatissements de Fisher et
de Pearson
5 16
K. EL ISSAOUI 107
Chapitre 7
Les indices statistiques

K. EL ISSAOUI 108
1) Indices élémentaires
Un indice élémentaire est un nombre sans dimension résultant de
deux valeurs prises par une même grandeur simple, soit à deux
dates différentes, soit sur deux espaces différents.
On considère une grandeur économique V qui varie dans le
temps et qui prend les valeurs : V0, …,Vt,…VT aux date
Un indice élémentaire s’applique à une grandeur simple définie
par le rapport suivant :

Où t=0 est la date de référence ou situation de base et où t est la


date courante.
Les indices peuvent être également exprimés en pourcentage :

K. EL ISSAOUI 109
Propriétés des indices élémentaires
Les indices simples ou élémentaires possèdent des
propriétés :
- La circularité (ou transférabilité ou transitivité) :

Généralisation : on peut appliquer cette propriété de période


en période (de date en date). On dit que les indices
élémentaires sont enchaînables :

K. EL ISSAOUI 110
La réversibilité
La réversibilité : quand on inverse le rôle de la base et de la
période courante, l’indice élémentaire s’inverse à 104

K. EL ISSAOUI 111
Application
L’entreprise MegaNet désire connaître l’évolution de son chiffre d’affaires à
l’exportation depuis sa création en 2007. Le tableau ci-dessous donne le
chiffre d’affaires (CA) à l’exportation (en milliers de dirhams) de l’entreprise
au 31 décembre de chaque année :
Tableau : chiffre
d’affaires à 1)Calculer la série des indices simples base 1 en
l’exportation depuis 2007
2007 2)Calculer la série des indices simples base 100 en
2007
Année CA 3)Calculer la série des indices simples où la base est
2007 1040 à chaque fois l’année précédente
2008 965 4)Après avoir défini le taux de variation, calculer les
taux de variation du CA de l’entreprise MegaNet
2009 1543
pour chaque année
2010 2024 5)Après avoir défini le taux de variation global,
calculer le taux de variation global du CA de 2007 à
2010
6)Après avoir défini le taux de variation moyen,
calculer le taux de variation moyen du CA de 2007 à
K. EL ISSAOUI 112
2010
2) Les indices synthétiques
Un indice synthétique s’applique à une grandeur complexe. Un
indice synthétique doit résumer une série d’indices élémentaires.
Soit une grandeur complexe « G » constituée

On a donc une série de k indices élémentaires


Cette série doit être résumée numériquement par un indice
synthétique :

qui en est une valeur centrale

K. EL ISSAOUI 113
Valeur globale = prix *quantité

Pour un article i, le prix est noté p i et les quantités


achetées de ce même article sont notées q i. Les
valeurs globales à la date de base sont VGit0=pit0qit0 et
à la date courante sont VGit=pitqit
Les coefficients budgétaires de l’article i mesurent
la part de la valeur globale de cet article à la date t 0
(époque de base) et t (époque courante) :

K. EL ISSAOUI 114
L’indice de Laspeyres

L’indice de Laspeyres des prix LP se conçoit à quantités


fixes :
La date de référence est la date « 0 ». L’indice de
Laspeyres des prix s’écrit :

Si les prix ne varient pas, l’indice reste égale à 100


L’indice de Laspeyres des quantités L q se conçoit à prix
fixes et s’écrit :

K. EL ISSAOUI 115
Formules développées des indices de Laspeyres

Wit est un coefficient de pondération permettant de mesurer


l’importance relative de l’élément gi dans G à la date t

K. EL ISSAOUI 116
Formules développées de l’indice des prix de Laspeyres

K. EL ISSAOUI 117
Formule développée de l’indice de Laspeyres des quantités

K. EL ISSAOUI 118
L’indice de Paasche

l’indice de Paasche est définit en prenant comme date de


référence la date « actuelle » et non plus la date de départ
«0»
L’indice des prix de Paasche Pp

L’indice des quantités de Paasche Pq

K. EL ISSAOUI 119
Formules développées de Paasche

K. EL ISSAOUI 120
Formules développées de l’indice de Paasche des prix

K. EL ISSAOUI 121
Indice de Paasche des quantités

K. EL ISSAOUI 122
Indice de Fisher

L’indice de Fisher Ft/t0 est la moyenne géométrique


simple des indices de Laspeyres et de Paasche :

K. EL ISSAOUI 123
Formules développées de l’indice de Fisher des prix

K. EL ISSAOUI 124
Formules développées de l’indice de Fisher des quantités

K. EL ISSAOUI 125
Application

Depuis 2000, Monsieur Enaciri déjeune tous les premiers samedis du mois
d’avril dans un grand restaurant. Son menu est composé d’une salade
verte, d’une langouste fraîche, de pâtes fraîches, d’une portion de fromage,
d’une glace à la vanille et il boit une bouteille de coca-cola.
2000 2005 2010
Quantité Prix en Quantité Prix en Quantités Prix en
s en euros s en euros par en euros
gramme par kg gramme kg grammes par kg
s s
Salade verte 120 20 150 26 160 31

Langouste 300 200 200 300 180 600


fraîche
Pâtes 150 20 200 35 210 55
fraîches
Fromage de 50 10 60 17 80 35
chèvre
Glace à la 40 25 60 30 70 49
vanille K. EL ISSAOUI 126
Questions
1) calculer les indices élémentaires de prix de chacun des éléments du
repas de Monsieur Enaciri
2) En utilisant les propriétés des indices élémentaires, calculer pour
les éléments du repas de Monsieur Enaciri, les indices élémentaires
de prix I2005/2000 et I2000/2005
3) Calculer l’indice I2005/2010 pour coca-cola en utilisant I2005/2000 et I2000/2010
4) Calculer l’indice des prix du repas de Monsieur Enaciri, pour les
années 2005 (notée 1) et 2010 (notée 2) base 100 en 2000 (notée
0), en employant les constructions des indices de Laspeyres et de
Paasche.
5) Calculer l’indice des prix de Fisher pour tous les éléments du repas
de Monsieur Enaciri
6) Calculer les taux de croissance annuels des indices de prix de
Laspeyres (noté rL) de Paasche ( noté rp) et de Ficher (noté rF), du
repas de Monsieur Enaciri, entre 2000 et 2010

K. EL ISSAOUI 127
Chapitre 8
Distribution statistiques à deux
variables

K. EL ISSAOUI 128
Distribution statistique à deux variables

1) Tableau croisé ou tableau de contingence


2) Distribution marginale (distribution non
indépendante) et distribution conditionnelle
(distributions liées)
3) Etude de liaison entre deux variables :
régression, ajustement et corrélation
4) Méthode des moindres carrés ordinaire
5) Le coefficient de corrélation linéaire

K. EL ISSAOUI 129
1) Tableau de contingence

Le tableau à double entrée représentent les séries statistiques


à deux variables, prennent le nom de tableau de
contingence. Ce tableau permet de voir comment se
distribuent les effectifs de chaque modalité d’un caractère,
suivant les modalités de l’autre.

K. EL ISSAOUI 130
La lecture d’un tableau de contingence
Les modalités du caractère y apparaissent en ligne
Les modalités du caractère x apparaissent en colonne
Dans les marges, ainsi que pour toute somme, on remplace
l’indice qui varie par un point :
Exemple : « n1 » signifie que l’on a sommé les effectifs de la
première ligne. L’indice j a donc varié de 1 à q. On le remplace
par «»
nj représente l’effectif de la modalité yj pour l’ensemble des
modalités de x. L’indice « i » de x à varié de 1 à p ; on le
remplace par un point.
n est l’effectif total c’est-à-dire le nombre d’individus de la
population étudiée.

K. EL ISSAOUI 131
« n1 » = 230
« n1 » = 192
« n» = 541 K. EL ISSAOUI 132
2) Distribution marginale et conditionnelle
Application

(en dizaines de dirhams) »


Tableau : distribution des ménages

K. EL ISSAOUI 133
Courbe de régression de Y en X

Les courbes de régression ont pour


objet de « résumer » le nuage de
points, c’est-à-dire de représenter
sur le plan, l’allure de la distribution
à deux caractères.

K. EL ISSAOUI 134
Courbe de régression de Y en X

K. EL ISSAOUI 135
Décomposition de la variance

La variance totale (ou variance marginale) =


variance résiduelle + variance expliquée
 La variance résiduelle est : la part de la variance
marginale qui résulte de la dispersion des points
autour des courbes de régression respectives.
C’est la variance qui n’est pas expliquée par la
courbe de régression. Elle est égale à la
moyenne pondérée arithmétique des variances
conditionnelles
 La variance expliquée est la part de la variance
marginale expliquée par la variation des
moyennes conditionnelles. Elle est égale à la
variance pondérée des moyennes arithmétiques
conditionnelles K. EL ISSAOUI 136
3) Etude de liaison entre deux variables : régression,
ajustement et corrélation

Absence de liaison entre les Il existe une liaison linéaire


deux variables entre les deux variables

Nuage des points Nuage des points


sans liaison avec liaison
K. EL ISSAOUI 137
Absence de liaison linéaire entre Absence de liaison linéaire entre
les deux variables les deux variables

Le nuage de points a la forme Le nuage de points a une forme


d’une parabole. La liaison non en L. La liaison non linéaire
linéaire Nuage de points de forme L :
Nuage de points sous forme liaison non linéaire
K. EL ISSAOUI 138
parabolique : liaison non linéaire
K. EL ISSAOUI 139
Le cas simple

K. EL ISSAOUI 140
Le cas
pondéré

K. EL ISSAOUI 141
4)

K. EL ISSAOUI 142
Définition de la méthode des moindres
carrés ordinaire

K. EL ISSAOUI 143
K. EL ISSAOUI 144
5)

K. EL ISSAOUI 145
K. EL ISSAOUI 146
Le coefficient de corrélation
doit être subordonné à l’étude
graphique du nuage de
points. Ces trois graphiques
indiquent une absence de
liaison linéaire alors le
coefficient de corrélation est
K. EL ISSAOUI
égal à 0,7 147
Application : moindres
carrés

148

Vous aimerez peut-être aussi