Vous êtes sur la page 1sur 102

STATISTIQUE DESCRIPTIVE

Mohammed QMICHCHOU
UNIVERSITE IBN TOFAIL - FSJES KENITRA
STATISTIQUE DESCRIPTIVE 2015

AVERTISSEMENT

Ce document est conçu comme support de cours à partir de différents supports (livres
et manuels) et ressources (cours et tutoriaux) accessibles sur Internet.
Voir la bibliographie et la webographie.

Il ne possède ni la complétude ni l'exhaustivité d'un livre qu'il ne saurait remplacer.

La faculté des Sciences Juridiques, Economiques et Sociales de Kenitra n’est pas


responsable de son contenu.

MOHAMMED QMICHCHOU 1
STATISTIQUE DESCRIPTIVE 2015

TABLE DES MATIERES


AVERTISS EMENT ________________________________________________________________________________ 1

TABLE DES MATIER ES __________________________________________________________________________ 2

INTRODUCTION _________________________________________________________________________________ 4

1. STATISTIQUE DESCRIPTIVE UNI-VARIEE _________________________________________________ 6

1.1. EL EMENTS DE VOCAB ULAIRE __________________________________________________________ 6

1.2. TYPOLOGIE DES DONNEES ______________________________________________________________ 7

1.3. SYMBOLES ET NOTATIONS ______________________________________________________________ 9

1.3.1. NOTATION INDICEE ___________________________________________________________________ 9

1.3.2. NOTATION S YMBOLIQUE DE « SOMME » _____________________________________________ 9

1.3.3. NOTATION S YMBOLIQUE DE « PRODUIT » __________________________________________10

1.3.4. NOTATION S YMBOLIQUE DE « FACTORIELLE » ____________________________________10

1.3.5. LES EXPONENTIELLES _______________________________________________________________10

1.3.6. LOGARITHMES _______________________________________________________________________10

1.3.7. AUTRES NOTATIONS STANDARD ____________________________________________________11

1.4. REPRES ENTATION DES DONNEES S TATIS TIQUES _____________________________________11

1.4.1. LES TAB LEAUX STATISTIQUES ______________________________________________________11

1.4.2. REPRES ENTATIONS GRAPHIQUES DES DONNEES STATISTIQUES __________________13

1.4.2.1. VARIAB LES DISCRETES ______________________________________________________________14

1.4.2.1.1. VARIAB LES QUANTITATIVES DISCRET ES ________________________________________14

1.4.2.1.2. VARIAB LES QUALITATIVES _______________________________________________________18

1.4.2.2. VARIAB LES CONTINUES _____________________________________________________________18

1.4.3. REPRES ENTATION DES EFFECTIFS CUMULES ______________________________________19

1.5. CARACTERIS ER UNE S ERIE STATISTIQUE _____________________________________________23

1.5.1. PARAMETRES DE POS ITION _________________________________________________________23

1.5.1.1. LES MOYENNES ______________________________________________________________________23

1.5.1.1.1. LA MOYENN E ARITHMETIQUE ____________________________________________________23

1.5.1.1.2. LA MOYENN E GEOMETRIQUE_____________________________________________________24

1.5.1.1.3. LA MOYENN E QUADRATIQUE _____________________________________________________25

1.5.1.1.4. LA MOYENN E HARMONIQUE ______________________________________________________25

1.5.1.2. LE MODE______________________________________________________________________________27

1.5.1.3. LA MEDIANE __________________________________________________________________________28

1.5.1.4. LA MEDIAL E __________________________________________________________________________31

1.5.2. PARAMETRES DE DISPERS ION _______________________________________________________32

MOHAMMED QMICHCHOU 2
STATISTIQUE DESCRIPTIVE 2015

1.5.2.1. L’ET ENDUE (E)________________________________________________________________________33

1.5.2.2. L’ECART ABSOLU MOYEN (EA) ______________________________________________________33

1.5.2.3. L’ECART RELATIF MOYEN (ER) _____________________________________________________34

1.5.2.4. LA VARIANCE (VX) ___________________________________________________________________34

1.5.2.5. L’ECART TYPE (𝛔𝐱) ___________________________________________________________________35

1.5.2.6. ÉCART TYPE RELATIF _______________________________________________________________36

1.5.2.7. LES QUARTILES ______________________________________________________________________36

1.5.2.8. ÉCART INTERQUARTILE _____________________________________________________________37

1.5.2.9. BOITE DE DISPERS ION _______________________________________________________________37

1.5.2.10. LES DECIL ES _______________________________________________________________________38

1.5.3. ETUD E DE CONCENTRATION ________________________________________________________40

1.5.3.1. DEFINITION___________________________________________________________________________40

1.5.3.2. COURB E DE LORENZ _________________________________________________________________41

1.5.3.3. INDICE DE GINI _______________________________________________________________________42

SUJ ETS D’EXAMENS ____________________________________________________________________________44

2. STATISTIQUE DESCRIPTIVE B I-VARIEE __________________________________________________47

3. SERIES CHRONOLOGIQUES _______________________________________________________________67

SUJ ETS D’EXAMENS ____________________________________________________________________________92

BIB LIOGRAPHIE________________________________________________________________________________96

WEB OGRAPHIE_________________________________________________________________________________96

GLOSSAIRE DE LA STATISTIQUE DESCRIPTIVE ______________________________________________97

MOHAMMED QMICHCHOU 3
STATISTIQUE DESCRIPTIVE 2015

INTRODUCTION
Il n'existe pas de définition universelle et totalement aboutie de la statistique. Selon le
Larousse, c’est « la science des grands nombres regroupant l'ensemble de méthodes
mathématiques qui, à partir du recueil et de l'analyse de données réelles, permettent
l'élaboration de modèles probabilistes autorisant les prévisions ».
La Statistique est considérée comme « une discipline scientifique intermédiaire qui n'a
plus d'objet privilégié (l'Etat, la population, les entreprises, les particules de la
physique…) mais qui propose une méthode, utilisable par toutes les sciences de la
nature et de l'homme, de production et de traitement de l'informa tion à des fins de
connaissance et de décision ».

Le mot « statistique » désigne à la fois


un ensemble de données d'observation

et l'activité qui consiste dans leur recueil, leur traitement et leur


interprétation.

Elle est aussi définie comme étant une « méthode qui vise à la description quantitative
des ensembles nombreux ». Elle est un « ensemble de méthodes permettant de prendre
une bonne décision face à l’incertitude ».
Cette méthode permet de passer de la donnée à la connaissance. Elle porte sur le
traitement, l’analyse et la transmission.

1 • Identifier le problème

2 • Rassembler les données existantes

3 • Recueillir de nouvelles données

4 • Classer et synthétiser les données

5 • Présenter les données

6 • Analyser les données

7 • Interpréter correctement les résultats obtenus

La statistique est souvent divisée aujourd’hui en deux parties :


 La statistique descriptive, qui est un ensemble de méthodes permettant de
décrire les unités statistiques qui composent une population ;

MOHAMMED QMICHCHOU 4
STATISTIQUE DESCRIPTIVE 2015

 La statistique mathématique (ou inférentielle) dont l'objet est de formuler des


lois à partir de l'observation d'échantillons, c'est-à-dire de tirages limités
effectués au sein d’une population. La statistique mathématique intervient dans
les enquêtes et les sondages. Elle s'appuie sur la statistique descriptive, mais
aussi sur le calcul des probabilités.

Statistique

Descriptive Mathématique
S’intéresse à extrapoler des résultats issus
Tableaux, graphiques, statistiques d’échantillons en vue de caractériser une
population mère inconnue, de faire des
résumées, recherche des corrélations, ...
prévisions de comportements basées sur
le calcul de probabilités.

Qu’elle soit descriptive ou mathématique, la statistique est employée dans toutes les
sciences :

Sciences exactes : physique, biologie, médecine, …

Sciences humaines : sociologie, démographie, psychosociologie, …

Sciences sociales : économie, gestion, sciences politiques, …

L’utilité de la statistique est de :

Décrire les variables et les relations qu'elles entretiennent

Prévoir et éventuellement expliquer

Estimer la valeur des paramètres et prendre des décisions

En statistique, plusieurs types d’analyse des données sont possibles :

MOHAMMED QMICHCHOU 5
STATISTIQUE DESCRIPTIVE 2015

Analyses statistique
Uni-variée Bi-variée Multi-variée
On étudie ici la relation qui peut
On étudie la répart ition d'une
exister entre deu x variables S'intéresse à la distribution
population selon une variable (
(entre la taille et le poids, par conjointe de plusieurs variables.
la taille, le poids ...). exemple...).

La statistique descriptive est « un ensemble de méthodes permettant de décrire les


unités statistiques qui composent une population » ou un « ensemble des méthodes
permettant de décrire une population par le biais des individus qui la composent ».
La statistique descriptive s’intéresse donc à :

Décrire et caractériser un ensemble d’individus représente la plupart du temps


sous la forme de tableaux (tableaux de données) ;

Résumer et synthétiser ces tableaux par l’intermédiaire de graphiques et de


paramètres appropries (fréquences, distribution, moyenne, dispersion, etc.) ;

Rechercher des corrélations (liaisons statistiques) entre les éléments de ces


tableaux (variables et individus).

1. STATISTIQUE DESCRIPTIVE UNI-VARIEE


Comme toute science, la statistique a son vocabulaire, qu’il est primordial de définir de façon
rigoureuse afin d’indiquer le groupe sur lequel porte l’étude, les caractères ou variables relevés
sur chacun des individus et les différents types de caractères.

1.1.Eléments de vocabulaire
Elément de Signification
vocabulaire
Ensemble des techniques du statisticien pour décrire,
Statistique descriptive
numériquement, les populations.
Tout nombre, calculé à propos d’une population, et qui contribue
Statistique (ou à décrire un aspect de cette population, est une statistiq ue.
paramètre statistique) Fréquences, médianes, quartiles, déciles, moyennes, variances,
etc. sont des statistiques.

MOHAMMED QMICHCHOU 6
STATISTIQUE DESCRIPTIVE 2015

Ensemble des données d'une série statistique associées à un ou à


plusieurs caractères.
Distribution
Facon dont les individus d'une population se répartissent en
fonction d'une ou plusieurs modalités.
On appelle population, population statistique ou univers, un
ensemble d’éléments disposant de certaines caractéristiques plus
ou moins communes et constituant l’objet de l’étude statistique.
Population et individus
Les éléments de la population sont appelés individus statistiq ues
ou unités statistiques. La population constitue l’univers de
référence de l’étude.
Une variable est une information dont on recueille (ou observe ou
mesure) la valeur sur chaque individu. On parle de variable parce
Variable (ou
que la valeur de l’information n’est pas la même d’un individu à
caractère) statistique,
l’autre. Les modalités correspondent aux valeurs possibles de la
valeurs ou modalités
variable statistique. C’est à partir des valeurs observées que le
statisticien construit ses classements d’individus.
On appelle taille ou effectif le nombre total d’éléments de la
population. On note usuellement l’effectif total par N.
Effectif 𝑛

𝑁 = ∑ 𝑛𝑖
𝑖=1
Rapport d’un effectif particulier d’individus à la taille de la
Fréquence (ou population. (Excel confond parfois fréquence et effectif).
proportion) 𝑛 𝑛
𝑓𝑖 = 𝑖 = 𝑛 𝑖
𝑁 ∑𝑖 =1 𝑛𝑖
Recensement, Recueil des valeurs de la totalité des individus de la population.
Dénombrement Les valeurs recueillies sont les données.
Sondage, n- Un sondage est le recueil des valeurs d’une partie (l’échantillo n)
échantillon, base de d’effectif n (d’où l’expression n-échantillon) de la population
sondage, taux de (dite base de sondage). Le taux de sondage est le rapport n/N.
sondage
Sous-ensemble construit et représentatif d'une population donnée.
Echantillon Lorsque l'on parle d'échantillon on parle en général de population
mère, c'est-à-dire de la population dont est issu l'échantillon.
Il est fréquent qu'une population soit divisée en sous-ensembles
cohérents construits à partir de critères déterminés de façon à
réduire la taille des tableaux de données et à en faciliter la lecture,
Classe
l'analyse et l'interprétation. Cette division induit un regroupement
des individus et la formation de classes rassemblant chacune des
individus présentant des caractères similaires.

1.2.Typologie des données


On distingue trois propriétés fondamentales qui permettent de caractériser précisément la
donnée:

MOHAMMED QMICHCHOU 7
STATISTIQUE DESCRIPTIVE 2015

Le type L‘échelle de mesure La nature

nominale
qualitatif continue
ordinale
intervalle
quantitatif discrète
proportionnelle

Exemple
Sur une population de 100 voitures, on étudie la couleur de la carrosserie : c'est un caractère
qualitatif ; si on étudie leur puissance fiscale, c'est un caractère quantitatif discret ; si on étudie
la taille de leur conducteur, c'est un caractère quantitatif continu.

Exercice 1
Une étude portant sur une entreprise de la zone industrielle de Kenitra nous a permis de relever
les données suivantes :

Caractère Type Échelle Nature

Raison sociale
Effectif
Activité
Chiffre d’affaire
Capital
Forme juridique
Nationalité du dirigeant
Classement en export
Résultat

Exercice 2
Quelle est la nature des caractères ci-dessous ?
 Nombre d’actions vendues chaque jour à la bourse
 Rémunérations des enseignants d’un lycée
 Indicateur du moral des ménages
 Écart de rémunération entre hommes et femmes
 Les pays de l’Union européenne
 Les niveaux de formation des salariés
 Les formes de contrat de travail

MOHAMMED QMICHCHOU 8
STATISTIQUE DESCRIPTIVE 2015

 Taux de croissance du PIB


 Prix à la consommation
 Solde commercial
 Nombre de personnes par ménages

1.3.Symboles et notations
Ces symboles sont utilisés pour simplifier l'écriture de longues séries (par exemple en évitant
d'utiliser des pointillés). On utilise dans chacun de ces cas une variable dite variable muette qui
va prendre des valeurs dans un ensemble précis. Cette variable muette va alors permettre la
description d'un terme générique placé après le symbole.

1.3.1. Notation indicée


Les méthodes statistiques s'appliquent à des populations comportant un grand nombre
d'individus. Il est indispensable de pouvoir représenter symboliquement la valeur de la variable
étudiée correspondant à chacun des n individus de cette population.
On distingue par la valeur de la variable x relative à l'individu i. La lettre i est appelée indice.
Elle peut prendre n'importe laquelle des valeurs
1, 2, ..., i, ..., n
auxquelles correspondent les valeurs de la variable
x1, x2, x3,…, xi , …, xn

1.3.2. Notation symbolique de « Somme »


Pour symboliser la somme des valeurs xi de la variable x, on utilise la lettre S ou (Lettre
grecque : Sigma majuscule)
Par définition
𝒏

∑ 𝒙𝒊 = 𝒙𝟏 + 𝒙𝟐 + ⋯ + 𝒙𝒏
𝒊=𝟏

Propriétés
𝒏 𝒏 𝒏

∑(𝒙𝒊 + 𝒚𝒊 ) = ∑ 𝒙𝒊 + ∑ 𝒚𝒊
𝒊=𝟏 𝒊=𝟏 𝒊=𝟏

Soit « a » une constante


𝒏 𝒏

∑ 𝒂𝒙𝒊 = 𝒂 ∑ 𝒙𝒊
𝒊=𝟏 𝒊=𝟏

MOHAMMED QMICHCHOU 9
STATISTIQUE DESCRIPTIVE 2015

1.3.3. Notation symbolique de « Produit »


(Lettre grecque : Pi majuscule)
Par définition
𝒏

∏ 𝒙𝒊 = 𝒙𝟏 × 𝒙𝟐 × … × 𝒙𝒏
𝒊=𝟏

1.3.4. Notation symbolique de « Factorielle »


(Point d'exclamation)
C'est un cas particulier de produit :

𝒏! = ∏ 𝑲 = 𝟏 × 𝟐 × 𝟑 × … × 𝒏
𝟏≤𝑲≤𝒏

1.3.5. Les exponentielles


La fonction exponentielle de base « a » s'écrit :
𝒚 = 𝒂𝒙
Exponentielle dans l'ensemble des entiers positifs.
Lorsque l'exposant est un nombre entier positif n la définition est simple.
𝒚 = 𝒂𝒏 = 𝒂 × 𝒂 × … × 𝒂
(𝒏 𝒇𝒐𝒊𝒔)
Propriétés :
ap ×aq =ap+q
(ap )q =(aq)p =ap×q
Exponentielles dans l'ensemble des entiers relatifs.
Les entiers relatifs sont les nombres entiers positifs, négatifs ou nul. Pour conserver la première
propriété, on est conduit à poser par convention :
𝟏 𝟏
a0 =1, 𝒂−𝟏 = Et 𝒂−𝒏 =
𝒂 𝒂𝒏

1.3.6. Logarithmes
Pour « a » positif, la fonction exponentielle y=ax est monotone. À toute valeur de y correspond
une valeur et une seule de x. Cette fonction qui fait correspondre à chaque valeur de y une
valeur de x est la fonction inverse de la fonction exponentielle. On l'appelle fonction logarithme.
y=ax ⇒x= log a x
« x » est le logarithme dans la base « a » de « y ».

MOHAMMED QMICHCHOU 10
STATISTIQUE DESCRIPTIVE 2015

Seuls les nombres positifs ont un logarithme car, pour a > 0, y=ax est nécessairement positif.

1.3.7. Autres notations standard


Concept / Notion Formulation Lecture
/ Notation
Effectif total d'une
N Grand N
population
Effectif total d'un
n Petit n
échantillon
Moyenne de la variable x 𝑋̅ X barre
𝒏

Somme des x ∑ 𝒙𝒊 Somme des xi pour i = 1 jusqu'à n


𝒊=𝟏
𝒏

Produite des x ∏ 𝒙𝒊 Produit des xi pour i = 1 jusqu'à n


𝒊=𝟏
Fréquence absolue n Petit n
Fréquence relative f Petit f

1.4.Représentation des données statistiques


Les résultats d'une enquête statistique peuvent donner lieu à de nombreuses représentations
graphiques. Il peut s’agir de tableaux ou de graphiques.

1.4.1. Les tableaux statistiques


Soit une population P comprenant n individus pour chacun desquels on a fait une observation
concernant le caractère K. Celui-ci comporte les modalités : M 1,M 2 ,...M i ,...M k .
L'opération préliminaire de mise en ordre des observations va consister à classer chacun des n
individus dans les k sous-ensembles définis par les diverses modalités du caractère K. Pour
chaque modalité𝑴𝒊, on inscrira dans le tableau statistique le nombre d'éléments du sous-
ensemble correspondant. Ce nombre est l'effectif n i des individus présentant modalité 𝑀𝑖. Du
point de vue du caractère K, tous les individus présentant la modalité 𝑀𝑖 sont considérés comme
équivalents : on ne retient que leur nombre.
Fréquence
La fréquence de la modalité M i est définie par le rapport
𝑛𝑖 𝑛𝑖
𝑓𝑖 = = 𝑛
𝑁 ∑𝑖=1 𝑛𝑖
C'est la proportion des individus présentant la modalité 𝑀𝑖. Elle est souvent exprimée en
pourcentage. Elle permet de comparer les structures de population d'effectifs différents.

MOHAMMED QMICHCHOU 11
STATISTIQUE DESCRIPTIVE 2015

La somme des effectifs 𝑛𝑖 est égale à l'effectif total n de la population.


𝑛

𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑁 𝑂𝑢 ∑ 𝑛𝑖 = 𝑁
𝑖 =1
Il en résulte
n1 n 2 n n +n +…+nk
f1 +f2 +…+fk = + +…+ k = 1 2 =1
n n n n
𝑛

∑ 𝑓𝑖 = 1
𝑖=1
Un tableau statistique décrivant une population P suivant un caractère K se présente sous la
forme générale suivante :
Effectif de chaque
Caractère étudié
modalité
𝑀1 𝑛1
𝑀2 𝑛2


𝑀𝑖 𝑛2


𝑀𝑘 𝑛𝑘
Total N

Caractère étudié 𝑀1 𝑀2 … 𝑀𝑘 Total


Effectif de chaque modalité 𝑛1 𝑛2 … 𝑛𝑘 N
On prendra le soin de préciser :
- la population étudiée et l'unité statistique employée
- l'origine du renseignement.

Exercice 3
Soit la série donnant les notes observées par une classe de 22 élèves :
0, 4, 4, 12, 14, 14, 16, 20, 11, 10, 10, 8, 8, 7, 6, 5, 12, 13, 3, 3, 9, 9.
T.A.F :
1. Établir le tableau présentant la série de façon discrète, ainsi que les extensions de cumuls
ascendant et descendants.
2. Présenter la série de façon continue avec les extensions de cumuls.

Exercice 4
Soit la série suivante :
0, 1, 2, 4, 6, 7, 9, 7, 8, 0, 0, 0, 4, 6, 7, 9, 7, 8, 3, 5, 5, 7, 8, 8, 1, 2, 6.
T.A.F :
Présenter la série de deux façons différentes :
1. discrète.
2. Continue.

MOHAMMED QMICHCHOU 12
STATISTIQUE DESCRIPTIVE 2015

Exercice 5
Dans le tableau suivant figure la rémunération horaire d’une population d’ouvriers.
Rémunération Effectifs
[20-25[ 22
[25-30[ 44
[30-35[ 25
[35-55[ 16
[55-80[ 15
[80-100[ 8
Total
T.A.F :
1. Établir les extensions qui permettent une interprétation directe.
2. Interpréter la 3ème ligne des cumuls que vous calculerez.

Exercice 6
Une enquête sur le kilométrage de 2000 véhicules d’une entreprise de location nous donne les
résultats suivants (en milliers de Km). Cette entreprise cède tout véhicule qui atteint 30000 Km.
<5 >5 et <10 >10 et <15 >15 et <20 >20
322 640 740 198 100
T.A.F :
Présenter le tableau statistique faisant apparaître les fréquences relatives en % de la série ainsi
que les cumuls ascendants et descendants.

1.4.2. Représentations graphiques des données statistiques


Une règle générale distingue les représentations sans épaisseur (diagramme en bâtons) et les
représentations avec épaisseur :
 dans une représentation sans épaisseur, l'effectif (ou la fréquence) est proportionnel à la
hauteur,
 tandis que dès qu'une surface existe, l'effectif (ou la fréquence) est proportionnel à l'aire.
Les graphiques peuvent être représentés dans un repère orthonormé.

MOHAMMED QMICHCHOU 13
STATISTIQUE DESCRIPTIVE 2015

Les représentations graphiques varient en fonction du type de la variable :

Variable Cumuls

Quantitative Qualitative

Discrète Continue Nominale Ordinale

1.4.2.1. Variables discrètes


Une variable est dite discrète quand elle prendre un nombre fini ou dénombrable de valeurs. En
d'autres termes, le passage d'une modalité à une autre est « brutal », sans continuité, sans
glissement progressif. C'est typiquement le cas des variables qualitatives nominales et ordinales
pour lesquelles la transition entre modalités se réalise sans nuance, brusquement.

1.4.2.1.1. Variables quantitatives discrètes


Pour des variables quantitatives discrètes, on privilégie le diagramme en bâtons, mais on voit
apparaître parfois des représentations avec épaisseur.

MOHAMMED QMICHCHOU 14
STATISTIQUE DESCRIPTIVE 2015

 Diagramme figuratif : Les effectifs sont représentés par des images (silhouette s,
bâtiments, ...) rappelant la population étudiée. Ces images ont une taille proportionne lle
à l'effectif. Il existe alors un danger de mauvaise représentation ou de mauvaise
interprétation. Si un doublement de l'effectif correspond seulement à un allonge me nt
d'un facteur deux de l'image dans une seule direction, la règle des aires est respectée.
Mais si le doublement de l'effectif correspond à une doublement de la taille de l'ima ge,
l'œil humain perçoit en réalité une multiplication par 4 (facteur 2 en largeur et facteur
2 en hauteur). L'interprétation de la représentation graphique est alors faussée.

 Diagramme en rectangles ou à barres: Si les rectangles ont même base, les hauteurs
proportionnelles aux effectifs respectent la règle des aires.

Les graphiques en barres simples


On distingue cinq
Les graphiques en barres multiples
types de graphiques
Les graphiques en barres empilées
en barres :
Les graphiques en bandeaux
Les graphiques en bandeaux empilés

Dans le diagramme en barres, la largeur de la base des barres est identique pour toutes les
barres, la base de chacun des rectangles étant centrée sur les points représentés sur l’axe des
abscisses.

MOHAMMED QMICHCHOU 15
STATISTIQUE DESCRIPTIVE 2015

CA réalisé pas une équipe de commerciaux


250000
200000
150000
100000
50000
0
Ali Saida Najat Amine

Le diagramme en barres multiples présente plusieurs barres parallèles pour les valeurs
observées chez le même individu.

CA réalisé pas une équipe de commerciaux


160000
140000
120000
100000
80000
60000
40000
20000
0
Ali Saida Najat Amine

Ventes en 2011 Ventes en 2013

Le diagramme à barres empilées regroupe, dans chaque barre, les valeurs observées, à
différentes reprises, chez le même individu.

CA réalisé pas une équipe de commerciaux


300000
250000
200000
150000
100000
50000
0
Ali Saida Najat Amine

Ventes en 2011 Ventes en 2012

Le diagramme en bandeaux est semblable à un diagramme en barres, sauf que les effectifs
sont placés sur l’axe des abscisses.

MOHAMMED QMICHCHOU 16
STATISTIQUE DESCRIPTIVE 2015

CA réalisé pas une équipe de commerciaux

Amine

Najat

Saida

Ali

0 50000 100000 150000 200000 250000

Le diagramme en bandeaux empilées regroupe, dans chaque bandeau, les valeurs


observées, à différentes reprises, chez le même individu.

CA réalisé pas une équipe de commerciaux

Amine

Najat

Saida

Ali

0 50000 100000 150000 200000 250000 300000

Ventes en 2011 Ventes en 2013

 Ajout d'un polygone rejoignant les sommets du diagramme en bâtons. Cette tentative
de lissage de la représentation graphique ne respecte pas tout à fait la règle des aires
(l'aire sous le polygone ne correspond pas tout à fait à l'effectif ou la fréquence) mais a
le mérite de présenter une courbe se rapprochant de la courbe de densité de probabilité.

CA réalisé pas une équipe de commerciaux


250000

200000

150000

100000

50000

0
Ali Saida Najat Amine

CA 2011 Polygone

MOHAMMED QMICHCHOU 17
STATISTIQUE DESCRIPTIVE 2015

1.4.2.1.2. Variables qualitatives


Les données ou variables qualitatives contiennent des valeurs qui expriment une qualité, un
état, c'est-à-dire une condition, un statut unique et exclusif comme le sexe, la couleur ou bien
encore la catégorie socioprofessionnelle.
Les opérations arithmétiques que l'on peut réaliser sur ce type de variable sont relative me nt
réduites et se limitent au comptage des effectifs par modalité (fréquences absolues) et au calcul
de pourcentage (fréquences relatives) et le mode.
Pour des variables qualitatives, on utilise fréquemment les diagrammes circulaires dits « en
camembert », demi-circulaire ou rectangulaire. On trouve aussi des diagrammes figuratifs avec
le danger évoqué plus haut.

Pays visités par les stagiaires

11%
24% Grande-Bretagne
11% Italie
Espagne

21% Portugal

33% Autres

1.4.2.2. Variables continues


Une variable continue peut, à l'inverse de la variable discrète, prendre un nombre infini ou non
dénombrable de valeurs. Il n'y a, de ce fait, plus de modalité ou plutôt une infinité de modalités
car entre deux valeurs données toutes les nuances de transitions sont possibles. Le cas
« continu » ne concerne donc que les variables dites quantitatives pour lesquelles il peut y avoir
autant de modalités qu'il y a d'individus.
Dans ce cas on regrouper des valeurs proches les unes des autres. On appelle un tel groupement
de données une catégorie ou une classe.

Pour une classe 𝑎𝑖−1 , 𝑎𝑖 ou 𝑎𝑖−1 ,𝑎𝑖 ∶


𝑎𝑖−1et 𝑎𝑖 sont les bornes ou limites de la classe
𝑎𝑖−1 +𝑎𝑖
le centre de la classe vaut 2
l’amplitude ou l’étendue de la classe vaut (𝑎𝑖 -𝑎𝑖−1 )
l’effectif de la classe 𝑛𝑖 est égal à la somme des effectifs des valeurs
de la série statistique appartenant à la classe

MOHAMMED QMICHCHOU 18
STATISTIQUE DESCRIPTIVE 2015

On utilise l'histogramme en respectant la règle des aires. Pour éviter tout danger, il est
préférable de travailler avec des classes d'amplitude constante. Dans ce cas, les hauteurs des
rectangles sont proportionnelles aux effectifs (ou aux fréquences). Le cas des classes
d'amplitudes variables se révèle plus délicat et est traité dans statistiques élémenta ires
continues. On trouve aussi pour les variables continues la même tentative de lissage avec la
même réserve sur la règle des aires.

30

25
Nombre de salariés

20

15

10

Tranche de revenu

1.4.3. Représentation des effectifs cumulés


Pour les variables continues, on peut tracer le polygone des effectifs (ou fréquences) cumulés .
Ce polygone, permet de lire très rapidement l'effectif d'un intervalle de la forme [x1 , x] et, par
différence, l'effectif de tout intervalle. Elle permet aussi de lire très rapidement les quartiles et
les déciles. Cette représentation préfigure le tracé de la fonction de répartition en probabilité.
On voit apparaître parfois un polygone des effectifs cumulés pour des variables discrètes. En
toute rigueur, il faudrait tracer un diagramme en escalier.

100% 120%

90%
100%
80%

70%
80%
60%

50% 60%

40%
40%
30%

20%
20%
10%

0% 0%
1 2 3 4 5 6 7 8 9

Exercice 7
Soit la liste suivante des prénoms d’un groupe de stagiaires de la filière commerce suivis entre
parenthèses d’une indication du nombre de livres lus dans l’année (A = exceptionnel, B =

MOHAMMED QMICHCHOU 19
STATISTIQUE DESCRIPTIVE 2015

beaucoup, C = moyen, D = peu) : Ali (C), Jamila (C), Abdelhak (A), Said (B), Amina (A), Sara
(B), Driss (C), Ahmed (B), Bouchra (B), Ilham (C), Jaouad (D), Aziz (B), Meriem (A), Khadija
(C), Issam (C), Safae (C), Majid (C), Fatima (D), Hafida (C), Mohammed (C).
1. Définissez la distribution de ces étudiants suivant leur appétit de lecture (populatio n,
caractère, etc.).
2. Construisez le tableau représentatif de cette distribution.
3. Représentez cette distribution à l’aide des graphiques appropriés.

Exercice 8
Soit la représentation suivante :
xi 0 1 2 3 4 5 6 7 8
ni 15 15 30 30 45 30 30 15 15
T.A.F :
1. Représenter graphiquement cette série.
2. Présenter les colonnes des cumuls ascendants et descendants.

Exercice 9
Une enquête portant sur les pays visités par les élèves d’un établissement scolaire nous donne
la répartition suivante :
Pays Effectifs
Grande-Bretagne 27
Italie 37
Espagne 24
Portugal 13
Autres 12
Total
T.A.F :
1. Déterminer la nature du caractère étudié.
2. Représenter la distribution sur un graphique circulaire après avoir fait les extensions de
tableau nécessaires.

Exercice 10
Une entreprise vous demande d’étudier l’évolution des ventes d’un produit qu’elle souhaite
commercialiser sous une marque propre, mais existant déjà dans d’autres pays.
Pour ce faire, elle vous livre les résultats suivants :
Pays Ca (en millions d’€)
Grande-Bretagne 4.2
Suisse 1.2
Belgique 2.2
Espagne 3.4
Total
T.A.F :
Présenter ces données de manière à avoir une meilleure vue d’ensemble du phénomène.

Exercice 11

MOHAMMED QMICHCHOU 20
STATISTIQUE DESCRIPTIVE 2015

Effectuer sur un graphique semi-circulaire la représentation d’un vote de conseil munic ipa l
composé de 27 conseillers.
Résultats du vote :
 Pour la motion proposée -------------------- 15
 Contre la motion proposée ------------------ 10
 Abstentions ---------------------------------- 2

Exercice 12
Le revenu mensuel déclaré des employés d’une entreprise est réparti comme suit :
Revenu mensuel en € Effectifs
[2000-2200[ 12
[2200-2400[ 24
[2400-2600[ 10
[2600-2800[ 7
[2800-3000[ 4
Total
T.A.F :
Représenter sur un histogramme cette série statistique.

Exercice 13
Soit la série qui présente les ventes mensuelles (en milliers de DH) d’un commercial de matériel
informatique sur la ville de Kénitra.
Mois CA en 2011 CA en 2012
Janvier 3054 7105
Février 6138 7067
Mars 8684 6358
Avril 6889 7543
Mai 7209 8588
Juin 6115 4288
Juillet 4989 5166
Août 5904 6106
Septembre 7019 4559
Octobre 4797 5547
Novembre 3555 5100
Décembre 3509 7238
T.A.F :
Représenter graphiquement cette série statistique.

Exercice 14
On étudie la distribution selon la distance de « domicile familial – travail » des salariés d’une
entreprise. Après répartition par classes, on obtient le tableau suivant :
Distances (km) Effectifs
[1 ; 5[ 250
[5 ; 10[ 328
[10 ; 20[ 165
[20 ; 30[ 91
[30 ; 50[ 46

MOHAMMED QMICHCHOU 21
STATISTIQUE DESCRIPTIVE 2015

T.A.F :
1. Quelle proportion de salariés habite à moins de 20 km de l’entreprise ?
2. Tracer l’histogramme correspondant à cette série.
3. Déterminer la valeur de la médiane.
4. L’écart interquartiles est 10,45 et le troisième quartile est 14,97 (on ne demande pas de
calculer ces valeurs). Déterminer le premier quartile.
5. Calculer la moyenne correspondant à cette série. Donner la formule utilisée.
6. Calculer l’écart–type.

Exercice 15
Le top 10 des ventes de voitures personnelles en 2012 sur le marché Marocain est le suivant :
Marques Ventes
DACIA 22356
RENAULT 19145
PEUGEOT 11244
FORD 7351
HYUNDAI 6590
VOLKSWAGEN 5947
CITROEN 5770
TOYOTA 4726
KIA 4683
FIAT 4027
T.A.F :
1. Décrire la série statistique (population, échantillon éventuel, caractère observé :
modalités, quantitatif/qualitatif, discret/continu, ordinal/nominal).
2. Donner une représentation graphique adaptée à la situation observée.
3. Donner la distribution en fréquence.

Exercice 16
Entreprises artisanales selon le nombre de salariés au 1er janvier 2010, en %.
Nombre de salariés Pourcentage d’entreprises
0 salarié 48,50
1 salarié 12,90
2 à 3 salariés 16,38
4 à 5 salariés 8,17
6 à 10 salariés 8,41
11 à 15 salariés 2,58
16 à 19 salariés 0,94
20 salariés ou plus 1,71
TOTAL 100,00
T.A.F :
Transformez les données suivantes en diagramme circulaire.

MOHAMMED QMICHCHOU 22
STATISTIQUE DESCRIPTIVE 2015

1.5.Caractériser une série statistique


Décrire les caractéristiques d’une série statistique consiste à calculer des caractéristiques de
tendance centrale (de position ou de concentration), des caractéristiques de dispersion et à
étudier sa concentration.

Caractéristiques de

Position Dispersion

1.5.1. Paramètres de position


Caractéristiques de position
Moyenne Mode Médiane Médiale

1.5.1.1. Les moyennes


Moyenne
Arithmétique Géométrique Quadratique Harmonique
𝑋̅ G Q H

1.5.1.1.1. La moyenne arithmétique


La moyenne arithmétique ou moyenne empirique d'une série statistique est la moyenne
ordinaire, c'est-à-dire le rapport de la somme d’une distribution d’un caractère statistiq ue
quantitatif discret par le nombre de valeurs dans la distribution. Exemple : la note moyenne
d’une classe de stagiaires.

x x xi+⋯+ xn
Moyenne • X = 1+ 2+⋯+
n
arithmétique n
∑i=1 xi
non pondérée • X = n

∑ 𝑛
𝑛𝑖 𝑥𝑖
Moyenne • 𝑋̅ = ∑𝑖=1
𝑛 𝑛
arithmétique 𝑖=1 𝑖

pondérée • 𝑋̅ = ∑𝑛𝑖=1 𝑓𝑖 𝑥𝑖

MOHAMMED QMICHCHOU 23
STATISTIQUE DESCRIPTIVE 2015

Mode opératoire Excel :


Fonction MOYENNE

Renvoie la moyenne (arithmétique) des arguments. Par exemple, si la plage A1:A20 contient des
nombres, la formule =MOYENNE(A1:A20) renvoie la moyenne de ces nombres.
Syntaxe
MOYENNE(nombre1;[nombre2];...)
La syntaxe de la fonction MOYENNE comporte les arguments suivants :
 nombre1 Obligatoire. Premier nombre, référence de cellule ou plage dont vous voulez obtenir
la moyenne.
 nombre2; ... Facultatif. Nombres, références de cellules ou plages supplémentaires dont vous
voulez obtenir la moyenne (255 maximum).

1.5.1.1.2. La moyenne géométrique

Moyenne •G = n n x
i=1 i
géométrique n
1

non pondérée •G = i=1 xi n

Moyenne
𝑁 𝑘 𝑥 𝑛𝑖
géométrique •𝐺 = 𝑖=1 𝑖 (Avec 𝑁 = ∑𝑛𝑖=1 𝑛𝑖 )
pondérée

log G = moyenne arithmétique des log xi


Mode opératoire Excel :
Fonction MOYENNE.GEOMETRIQUE
Renvoie la moyenne géométrique de données positives. Par exemple, vous pouvez utiliser la fonction
MOYENNE.GEOMETRIQUE pour calculer un taux de croissance moyen à partir d'un intérêt composite
à taux variables.
Syntaxe
MOYENNE.GEOMETRIQUE(nombre1;nombre2;...)
nombre1;nombre2; ... représentent 1 à 30 arguments pour lesquels vous souhaitez calculer la
moyenne.
Notes
Les arguments doivent être des nombres ou des références de colonnes qui contiennent des
nombres.
Si un argument de référence de colonne contient du texte, des valeurs logiques ou des cellules vides,
ces valeurs ne sont pas prises en compte. En revanche, les arguments qui contiennent la valeur 0
sont pris en compte.
Si l'un des points de données ≤ 0, MOYENNE.GEOMETRIQUE renvoie la valeur d'erreur #NOMBRE!.

MOHAMMED QMICHCHOU 24
STATISTIQUE DESCRIPTIVE 2015

1.5.1.1.3. La moyenne quadratique

Moyenne
∑n
i=1 x i
2 2 ∑n xi 2
quadratique • Q2 =
n
⇒Q= i=1
n
non pondérée

Moyenne
∑𝑘
𝑖=1 𝑛𝑖 𝑥𝑖
2 2 ∑𝑘
𝑖=1 𝑛𝑖 𝑥𝑖
2
quadratique • 𝑄2 = ⇒𝑄=
∑𝑘
𝑖=1 𝑛𝑖 ∑𝑘
𝑖=1 𝑛𝑖
pondérée
Q2 = moyenne arithmétique des xi 2

1.5.1.1.4. La moyenne Harmonique

Moyenne 𝑛 𝑛
harmonique • H= 1 1 1 = 1
+ +⋯+
x1 x2 xn ∑n
i=1 xi
non pondérée

Moyenne n1+ n2+…+nk ∑k


i=1 ni
harmonique • H = n1 n n = ni
+ 2 +⋯+ k ∑k
x1 x2 xk i=1 xi
pondérée
1 1
= Moyenne arithmétique des
H xi
Mode opératoire Excel :
Fonction MOYENNE.HARMONIQUE
Renvoie la moyenne harmonique d’une série de données. La moyenne harmonique est l’inverse de la
moyenne arithmétique des inverses des observations.
Syntaxe
MOYENNE.HARMONIQUE (nombre1; nombre2; ...)
nombre1;nombre2;... représentent 1 à 30 arguments dont vous souhaitez calculer la moyenne.
Notes
Les arguments doivent être des nombres ou des références de colonnes contenant des nombres.
Si une référence de colonne utilisée comme argument contient du texte, des valeurs logiques ou est
vide, ces valeurs sont ignorées. En revanche, les arguments contenant la valeur 0 sont pris en
compte.
Si l’une des observations = 0, la fonction MOYENNE.HARMONIQUE renvoie la valeur d’erreur
#NOMBRE!
La moyenne harmonique est toujours inférieure à la moyenne géométrique, elle-même toujours
inférieure à la moyenne arithmétique.

MOHAMMED QMICHCHOU 25
STATISTIQUE DESCRIPTIVE 2015

Exercice 17
Soit la série suivante :
xi ni
[0-100[ 10
[100-200[ 20
[200-300[ 5
[300-600[ 7
[600-700[ 8
T.A.F :
Après avoir fait les extensions de tableaux nécessaires, calculer :
1. La moyenne arithmétique ;
2. La moyenne géométrique par les Log ;
3. La moyenne quadratique ;
4. La moyenne harmonique.

Exercice 18
On vous propose les deux séries suivantes :
4 6 7 4 2 6 4 1 0 2
1 2 3 6 6 0 0 1
T.A.F :
Donner les modes et les médianes des deux séries.

Exercice 19
Soit le tableau donnant la répartition de l’âge des enfants dans une population quelconque :
xi ni
[0-4[ 12
[4-8[ 10
[8-12[ 5
[12-18[ 4
Total
T.A.F :
1. Calculer les fréquences relatives de la série ;
2. Tracer le graphe de la série ;
3. Calculer les moyennes ;
4. Déterminer par le graphique et par le calcul :
a. Le mode ;
b. la médiane.

Exercice 20
On vous communique les résultats d’une étude portant sur la taille (en cm) de 12 enfants pris
au hasard dans une maternelle : 75, 78, 80, 85, 82, 84, 79, 78, 75, 80, 82, 75.
T.A.F :
1. Présenter le tableau statistique de la distribution.
2. Préciser les caractéristiques de cette série.
3. Calculer les caractéristiques centrales.

MOHAMMED QMICHCHOU 26
STATISTIQUE DESCRIPTIVE 2015

1.5.1.2. Le mode
Le mode correspond à la réalisation la plus fréquente. Le mode d'une série, ou dominante d'une
distribution, est la valeur de la variable (ou de l’unité statistique) qui revient le plus
fréquemment dans la série. C'est la valeur centrale de la classe qui a le plus grand effectif.
Le mode est l'indice le plus simple à déterminer puisqu'il suffit de lire un graphique ou de
regarder le tableau des effectifs.

Mode (Mo)

Cas d'une série discrète Cas d'une série continue

Série discrète :
Ex : Soit la série {8 ; 4 ; 4 ; 3 ; 4 ; 3 ; 8 ; 2 ; 5} La valeur la plus fréquente de cette série est 4.
Le mode est donc égal à 4. L'effectif associé à ce mode est 3.
Exemple : Soit la série présentant le nombre d’enfants des ménages habitant un quartier
résidentiel :
Nombre de d’enfants Nombre d’habitants
xi ni
0 36
1 133
2 274
3 128
4 41
5 27
Total 639
Le mode correspond, dans ce cas, à la valeur de la variable (2) qui correspond au plus grand
effectif (274).
Série continue :
Exemple ; Soit la série donnant le CA mensuel réalisé par les commerciaux d’une entreprise :
CA mensuel des clients Nombre de clients
xi ni
]0-4000[ 27
[4000-8000[ 183
[8000-12000[ 290
[12000-16000[ 148
[16000-20000[ 14
Total 662
Dans ce cas, on détermine :
 La classe modale : qui est la classe ([8000-12000[) qui correspond à l’effectif le plus
grand (290).

MOHAMMED QMICHCHOU 27
STATISTIQUE DESCRIPTIVE 2015

 Le mode qui se calcule selon la formule suivante :


12000+8000
o Soit le centre de la classe modale : M o = =10000
2
A
o Soit selon la formule suivante : Mo =b1,j + nj -nj+1
1+
nj -nj-1

Avec :
 j : Rang de la classe modale ;
 𝑏1,𝑗 : Borne inférieure de la classe modale ;
 A : Amplitude de la classe modale ;
 𝑛𝑗 : Effectif de la classe modale ;
 𝑛𝑗+1 : Effectif de la classe qui suit la classe modale ;
 𝑛𝑗−1 : Effectif de la classe qui précède la classe modale.
o Soit par le graphique :

Mode opératoire Excel :


Fonction MODE
Renvoie la valeur la plus fréquente ou la plus répétitive dans une matri ce ou une plage de données.
Comme la fonction MEDIANE, la fonction MODE est une mesure de position.
Syntaxe
MODE(nombre1; nombre2;... )

1.5.1.3. La médiane
La médiane est un paramètre d'une série statistique simple, et plus exactement un paramètre de
position, c'est le nombre qui permet de de partager une série numérique ordonnée en deux
parties de même nombre d'éléments. Ce paramètre est utile pour donner la répartition du
caractère étudié, car 50 % environ de la population étudiée a une modalité inférieure à
la médiane et 50 % une modalité supérieure à la médiane.

Médiane (Me )

Cas d'une série discrète Cas d'une série continue

MOHAMMED QMICHCHOU 28
STATISTIQUE DESCRIPTIVE 2015

En général, une médiane est, dans une série ordonnée, une valeur M e telle qu'il y ait autant de
valeurs supérieures ou égales à Me que de valeur inférieures ou égales à Me.
Exemple : {1 ; 3 ; 5 ; 7 ; 9} la médiane est 5.
Série discrète :
Le médiane d'une série statistique rangée dans l'ordre croissant (x1 , x2 , x3 , x4 , ....., xn ) est le
nombre Me = Q2 (parce qu'on l'appelle aussi deuxième quartile) défini de la façon suivante :
 Si n = 2p est pair, Me est le centre de l'intervalle [xp ; xp+1 ] ;
 Si n est impair, Me est le nombre xp où p = (n + 1)/2.
Notes Effectifs CC n = 50 est pair, il faut donc prendre le centre
0 1 1 de [9 ; 10]
1 2 3
2 2 5 Utilisons la colonne des effectifs cumulés
3 3 8 pour déterminer la médiane : il y a 50 notes,
4 2 10 la 25ème note est 9 et la 26ème : 10.
5 3 13
6 2 15
Voilà la répartition des notes pour
7 3 18
comprendre :
8 4 22
9 3 25
10 2 27
11 3 30
12 4 34
13 4 38 Dans le tableau il n'y a pas de valeur
14 3 41 partageant la série statistique en deux
15 1 42 groupe de même effectif, (l’effectif total est
16 2 44 pair) dans ce cas l'intervalle médian est
17 1 45 [9;10] et on prendre pour médiane le centre
18 2 47 de cet intervalle : 9,5
19 2 49
20 1 50
Total 50
 Série continue :
Si la variable est continue (regroupement par intervalle des résultats) le calcul de la médiane se
fait autrement :

Utilisons la colonne des effectifs cumulés pour déterminer la médiane : il y a 50 notes, 50 % de


l'effectif total c'est 25, la médiane est ici la note correspondant à l'effectif cumulé 25.
D'après la colonne "effectif cumulé" :
 18 personnes ont moins de 8
 30 personnes ont moins de 12
La médiane se trouve donc dans l'intervalle [8;12[, (appelée classe médiane), on va la
déterminer par interpolation linéaire.

MOHAMMED QMICHCHOU 29
STATISTIQUE DESCRIPTIVE 2015

Les points A, M, B sont alignés ce qui se traduit par les droites (AM) et (AB) ont même
coefficient directeur (ou on utilise le théorème de Thalès dans le triangle bleu) :
𝑀𝑒 − 8 12 − 8 𝑀 −8 4 4 14
= ⇒ 𝑒 = ⇒ 𝑀𝑒 − 8 = − 7 ⇒ 𝑀𝑒 = 8 + = 10,33
25 − 18 30 − 18 7 12 12 7
La médiane est environ 10,33 ; c'est-à-dire que 50 % environ des personnes ont eu moins de 10,33
et 50 % plus de 10,33.
300
CC
250

200

150

100

50
Me CD
0
10000 20000 30000 100000

100%
90%
CC
80%
70%
60%
50%
40%
30%
20%
10% Me
0%
1 2 3 4 5 6 7 8 9

MOHAMMED QMICHCHOU 30
STATISTIQUE DESCRIPTIVE 2015

Mode opératoire Excel :


Fonction MEDIANE
Renvoie la médiane des nombres donnés. La médiane est le nombre qui est au milieu d’une série de
nombres ; en d’autres termes, une moitié des nombres a des valeurs qui sont supérieures à la
médiane et l’autre moitié a des valeurs qui lui sont inférieures.
Syntaxe
MEDIANE (nombre1; nombre2; ...)
nombre1, nombre2, ... représentent les 1 à 30 nombres dont vous souhaitez obtenir la médiane.
Notes
Les arguments doivent être des nombres ou des références de colonnes contenant des nombres.
Si une référence de colonne utilisée comme argument contient du texte, des valeurs logiques ou est
vide, ces valeurs sont ignorées. En revanche, les arguments contenant la valeur 0 sont pris en
compte.
Sil les nombres de la série sont en nombre pair, MEDIANE calcule la moyenne des deux nombres du
milieu. Voir le deuxième exemple ci-dessous.

Exercice 21
Un commerçant décide à la fin de la journée de calculer le montant médian des chèques
encaissés.
Montant des chèques
Effectif ni ECC
(en DH)
[0 ; 20[ 25 25
[20 ; 40[ 40 65
[40 ; 60[ 36 101
[60 ; 100[ 5 106
Total 106
TAF :
1. Déterminer les caractéristiques de cette série statistique ;
2. Représenter cette série à l’aide du graphique adéquat ;
3. Déterminer :
3.1. La Moyenne
3.1.1. Arithmétique par les fréquences absolues et relatives ;
3.1.2. Géométrique avec et sans les Log ;
3.1.3. Quadratique ;
3.1.4. Harmonique ;
3.2. Le Mode ;
3.3. La Médiane par le calcul et par le graphique ;

1.5.1.4. La médiale
La médiale ne doit pas être confondue avec la médiane.
La médiale Ml se calcule de la même façon que la médiane mais à partir de la masse c'est-à-
dire à partir des nixi. Autrement dit, la médiale est la valeur de la variable qui coupe en deux
la masse∑𝑛𝑖=1 𝑛𝑖 𝑥 𝑖.

MOHAMMED QMICHCHOU 31
STATISTIQUE DESCRIPTIVE 2015

Exercice 22 : application de synthèse


On dispose de la série suivante présentant les CA réalisés (en DH) par une entreprise avec ses
clients pendant un mois d’activité :
CA mensuel (en DH) Nombre de clients
Xi Ni
]0-2000[ 13
[2000-4000[ 14
[4000-6000[ 25
[6000-8000[ 158
[8000-10000[ 185
[10000-12000[ 105
[12000-14000[ 97
[14000-16000[ 51
[16000-20000[ 14
20000 et plus 0
TAF :
1. Déterminer les caractéristiques de cette série statistique ;
2. Représenter cette série à l’aide du graphique adéquat ;
3. Déterminer :
a. La Moyenne
i. Arithmétique par les fréquences absolues et relatives ;
ii. Géométrique avec et sans les Log ;
iii. Quadratique ;
iv. Harmonique ;
b. Le Mode ;
c. La Médiane par le calcul et par le graphique ;
d. La Médiale.

1.5.2. Paramètres de dispersion


On appelle dispersion statistique, la tendance qu'ont les valeurs de la distribution d'un caractère
à s'étaler, à se disperser, de part et d'autre d'une valeur centrale.
On distingue la dispersion absolue (mesurée dans l'unité de mesure du caractère), et la
dispersion relative (mesurée par un nombre sans dimension).
Étendue
Caractéristiques de
dispersion Écart absolu moyen
Écart relatif moyen
Variance
Écart-type
Écart inter-quartiles, inter-déciles et inter-centiles

MOHAMMED QMICHCHOU 32
STATISTIQUE DESCRIPTIVE 2015

1.5.2.1. L’étendue (e)


L'étendue d'une série statistique (appelée aussi amplitude) est la différence entre sa valeur la
plus haute et sa valeur la plus basse. On dit d'un phénomène qu'il présente une « forte
dynamique » lorsque l'étendue (ou la dispersion) est grande.
Exemple : sur une semaine de janvier on relève les températures suivantes : -2 ; -4 ; -7 ; +2 ;
+6 ; -5 ; +1.
L'étendue est donc : étendue = valeur la plus haute - valeur la plus basse = (+6)-(-7)= 13
𝐄𝐭𝐞𝐧𝐝𝐮𝐞 = 𝐗 𝐌𝐚𝐱 − 𝐗 𝐌𝐢𝐧

10

n
o
m
b
5
r
e

52 57 62 67 72 77 82 87 poids (kg)

étendue

35 kg

1.5.2.2. L’écart absolu moyen (ea)


L'écart absolu moyen est la moyenne des écarts par rapport à la moyenne, toujours comptés
positifs.
Un écart 𝑒𝑖 représente la différence entre la valeur d’une observation 𝑥 𝑖 et la moyenne
arithmétique𝑥̅ .
𝐞𝐢=𝐱 𝐢 − 𝐱̅
Un écart absolu 𝑒𝑖𝑎est la valeur absolu de 𝑒𝑖 :
𝐞𝐢𝐚 = |𝐞𝐢 | = |𝐱 𝐢 − 𝐱̅|
L’écart absolu moyen est égal à la moyenne arithmétique des valeurs absolues des écarts𝑒𝑖.
Cas d’une série non pondérée :
∑𝐧𝐢=𝟏|𝐞𝐢 | ∑𝐧𝐢=𝟏|𝐱 𝐢 − 𝐱̅|
𝐞𝐚 = =
𝐧 𝐧
Cas d’une série pondérée :
∑𝐧𝐢=𝟏|𝐞𝐢 |𝒏𝒊 ∑𝐧𝐢=𝟏|𝐱 𝐢 − 𝐱̅|𝒏𝒊
𝐞𝐚 = =
∑𝒏𝒊=𝟏 𝒏𝒊 ∑𝒏𝒊=𝟏 𝒏𝒊
Mode opératoire Excel :
Fonction ECART.MOYEN

MOHAMMED QMICHCHOU 33
STATISTIQUE DESCRIPTIVE 2015

Renvoie la moyenne des écarts absolus des observations par rapport à leur moyenne
arithmétique. ECART.MOYEN mesure la dispersion dans un ensemble de données.
Syntaxe
AVEDEV (nombre1,nombre2, ...)
nombre1,nombre2, ... représentent 1 à 30 arguments pour lesquels vous recherchez la
moyenne des écarts par rapport à leur moyenne.
Notes
 Les arguments doivent être des nombres ou des références de colonnes contenant des
nombres.
 Si un argument est une référence de colonne qui contient du texte, des valeurs logiques ou
qui est vide, ces valeurs sont ignorées ou renvoient la valeur d’erreur #VALEUR! ; la valeur
zéro est cependant prise en compte.

1.5.2.3. L’écart relatif moyen (er)


L’écart relatif moyen se calcule à partir de l’écart absolu moyen.
𝐞𝐚
𝐞𝐫 =
𝐕𝐚𝐥𝐞𝐮𝐫 𝐜𝐞𝐧𝐭𝐫𝐚𝐥𝐞
Cette valeur centrale peut être :
𝐞𝐚
 La moyenne arithmétique : 𝐞𝐫 =
𝐱̅
𝐞𝐚
 La médiane :𝐞𝐫 =
𝐌𝐞

1.5.2.4. La variance (Vx)


L'utilisation des valeurs absolues est souvent une impasse en mathématique (parce que la
fonction valeur absolue n'est pas dérivable). Pour rendre positifs les écarts, un autre outil est à
notre disposition: la mise au carré. On ne va donc pas calculer la moyenne des écarts mais la
moyenne des écarts au carré. C'est ce qu'on appelle la variance.
La variance est une mesure de l'étalement équivalant au carré moyen de l'écart de chaque
nombre par rapport à la moyenne d'un ensemble de données.
Cas d’une série discrète non pondérée :
𝐧 𝐧
𝟏 𝟏
𝐕𝐱 = ∑(𝐱 𝐢 − 𝐱̅)𝟐 = ∑ 𝐱 𝐢 𝟐 − 𝐱̅ 𝟐
𝐧 𝐧
𝐢=𝟏 𝐢=𝟏
Cas d’une série discrète pondérée :
𝐧 𝐧
∑𝐧𝐢=𝟏 𝐧𝐢 (𝐱 𝐢 − 𝐱̅)𝟐
𝐕𝐱 = = ∑ 𝐟𝐢 (𝐱 𝐢 − 𝐱̅)𝟐 = ∑ 𝐟𝐢 𝐱 𝐢 𝟐 − 𝐱̅ 𝟐
∑𝐧𝐢=𝟏 𝐧𝐢
𝐢=𝟏 𝐢=𝟏
Cas d’une série continue :
𝐧 𝐧
∑𝐧𝐢=𝟏 𝐧𝐢 (𝐜𝐢 − 𝐱̅)𝟐
𝐕𝐱 = = ∑ 𝐟𝐢 (𝐜𝐢 − 𝐱̅)𝟐 = ∑ 𝐟𝐢 𝐜𝐢 𝟐 − 𝐱̅ 𝟐
∑𝐧𝐢=𝟏 𝐧𝐢
𝐢=𝟏 𝐢=𝟏

MOHAMMED QMICHCHOU 34
STATISTIQUE DESCRIPTIVE 2015

Mode opératoire Excel :


Fonction VARPA
Calcule la variance d'une population entière. Outre des nombres, le calcul peut comprendre du texte
et des valeurs logiques, telles que VRAI et FAUX.
Syntaxe
VARPA(valeur1;valeur2;...)
valeur1;valeur2;... représentent 1 à 30 arguments correspondant à une population.
Notes
La fonction VARPA part de l'hypothèse que les arguments représentent l'ensemble de la population.
Si vos données ne représentent qu'un échantillon de cette population, calculez la variance à l'aide de
la fonction VARA.
Les arguments contenant la valeur VRAI ont la valeur 1 ; les arguments contenant du texte ou la
valeur FAUX ont la valeur 0. Si le calcul ne doit inclure ni texte ni valeur logique, utilisez de
préférence la fonction VAR.P.

1.5.2.5. L’écart type (𝛔𝐱 )


De par la mise au carré des écarts, l'unité de la variance est le carré de celle du caractère (si le
caractère est en kg, sa moyenne est en kg mais sa variance est en kg2 ) d'où l'impossibilité
d'additionner la moyenne et la variance. On a donc défini l'écart-type noté σ. L'écart type (ou
L'écart quadratique moyen (EQM) est la racine de la variance (et donc son unité est la même
que celle de la moyenne.
𝛔𝐱 = √𝐕𝐱
L'écart-type est la mesure de dispersion la plus couramment utilisée en statistique lorsqu'on
emploie la moyenne pour calculer une tendance centrale. Il mesure donc la dispersion autour
de la moyenne.
En raison de ses liens étroits avec la moyenne, l'écart-type peut être grandement influencé si
cette dernière donne une mauvaise mesure de tendance centrale.
En statistique, plus particulièrement en théorie des sondages, ainsi qu'en métrologie, l'écart
type tente d'évaluer, à partir d'un échantillon soumis au hasard, la dispersion de la population
tout entière.
L'écart-type est aussi utile quand on compare la dispersion de deux ensembles de données
séparés qui ont approximativement la même moyenne. La dispersion des mesures autour de la
moyenne est plus étroite dans le cas d'un ensemble de données dont l'écart-type est plus petit.
Propriétés de l'écart-type
 On n'utilise l'écart-type que pour mesurer la dispersion autour de la moyenne d'un
ensemble de données.
 L'écart-type n'est jamais négatif.
 L'écart-type est sensible aux valeurs aberrantes. Une seule valeur aberrante peut
accroître l'écart-type et, par le fait même, déformer le portrait de la dispersion.
 Dans le cas des données ayant approximativement la même moyenne, plus la dispersion
est grande, plus l'écart-type est grand.

MOHAMMED QMICHCHOU 35
STATISTIQUE DESCRIPTIVE 2015

 L'écart-type est zéro si toutes les valeurs d'un ensemble de données sont les mêmes
(parce que chaque valeur est égale à la moyenne).
Mode opératoire Excel :
Fonction ECARTYPEP
Calcule l'écart-type sur la base de la population entière indiquée par les arguments. L'écart-type
mesure la dispersion des valeurs par rapport à la valeur moyenne (moyenne).
Syntaxe
ECARTYPEP(nombre1; nombre2;... )

1.5.2.6. Écart type relatif


Le coefficient de variation (CV) ou l'écart type relatif est le rapport de l'écart-type à la moyenne
𝛔𝐱
. Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne

est grande. Il est généralement exprimé en pourcentage. Sans unité, il permet la comparaison
de distributions de valeurs dont les échelles de mesure ne sont pas comparables.

1.5.2.7. Les quartiles


En statistique descriptive, un quartile est chacune des 3 valeurs qui divisent les données triées
en 4 parts égales, de sorte que chaque partie représente 1/4 de l'échantillon de population.
 Le quartile inférieur est la valeur du milieu du premier ensemble, dans lequel 25 % des
valeurs sont inférieures à Q 1 et 75 % lui sont supérieures. Le premier quartile prend la
notation Q 1 .
 Le quartile supérieur est la valeur du milieu du deuxième ensemble, dans lequel 75 %
des valeurs sont inférieures à Q 3 et 25 % lui sont supérieures. Le troisième quartile prend
donc la notation Q 3 .
 La médiane divise les données en deux ensembles égaux. Il convient de noter que la
médiane prend la notation Q 2 , c'est-à-dire le deuxième quartile.

Mode opératoire Excel :


Fonction QUARTILE
Renvoie le quartile d'une série de données. Les quartiles sont souvent utilisés pour les données
relatives aux ventes et aux enquêtes afin de séparer les populations en groupes. Par exemple, vous

MOHAMMED QMICHCHOU 36
STATISTIQUE DESCRIPTIVE 2015

pouvez utiliser la fonction QUARTILE pour déterminer les 25 % de revenus les plus élevés d'une
population.
Syntaxe
QUARTILE(matrice;quart)

1.5.2.8. Écart interquartile


L'écart interquartile est une autre étendue utilisée comme mesure de la dispersion. La différe nce
entre les quartiles supérieur et inférieur (Q 3 - Q1 ), qu'on appelle l'écart interquartile, indique
aussi la dispersion d'un ensemble de données. L'écart interquartile couvre 50 % d'un ensemble
de données et élimine l'influence des valeurs aberrantes, parce qu'on soustrait, en effet, le
quartile le plus élevé et le quartile le plus faible.
Écart interquartile = Quartile supérieur (Q3 ) - Quartile inférieur (Q1 )

1.5.2.9. Boîte de dispersion


Il est possible de résumer, sous la forme d'un graphique, l'information fournie par l'étendue,
ainsi que par les trois quartiles et les intervalles qui les séparent. Ce graphique porte le nom
de boîte à moustaches , ou encore de boîte à pattes ou diagramme en boîte (boxplot en
anglais).
 Un diagramme en boîte (ou diagramme à moustaches ou diagramme à pattes) est une
façon de représenter certains paramètres d'une série statistique.
 Sur un axe, on place le minimum et le maximum de la série, le premier quartile, le
troisième quartile et la médiane, puis on construit parallèlement à l'axe un rectangle
(une boîte) de longueur l'interquartile et de largeur arbitraire.

MOHAMMED QMICHCHOU 37
STATISTIQUE DESCRIPTIVE 2015

La superposition de boîtes à moustaches peut être utile pour comparer plusieurs séries associées
à un même caractère sur des populations différentes.
Exemple
Soit une variable statistique X dont le maximum est 55, le minimum 20, la médiane 38, le
premier quartile 32,5 et le troisième quartile 45, on construit alors le diagramme en boîte
suivant :

1.5.2.10. Les déciles


De la même manière, et dans le but de préciser et d'affiner encore l'analyse de la dispersion
d'une distribution, on peut faire appel aux notions de déciles et de centiles. Le principe demeure
le même que pour les quartiles à la différence que la population est ici divisée respective me nt
en 10 et 100 sous-populations d'égal effectifs.
10 % des effectifs de la population ont une valeur inférieure à D1 et 90 % une
Décile 1 ou D1
valeur supérieure.
20 % des effectifs de la population ont une valeur inférieure à D2 et 80 % une
Décile 2 ou D2
valeur supérieure.
30 % des effectifs de la population ont une valeur inférieure à D3 et 70 % une
Décile 3 ou D3
valeur supérieure.
40 % des effectifs de la population ont une valeur inférieure à D4 et 60 % une
Décile 4 ou D4
valeur supérieure.
50 % des effectifs de la population ont une valeur inférieure à Q1 et 50 % une
Décile 5 ou D5
valeur supérieure. D5 correspond à la médiane.
60 % des effectifs de la population ont une valeur inférieure à D6 et 40 % une
Décile 6 ou D6
valeur supérieure.
70 % des effectifs de la population ont une valeur inférieure à D7 et 30 % une
Décile 7 ou D7
valeur supérieure.
80 % des effectifs de la population ont une valeur inférieure à D8 et 20 % une
Décile 8 ou D8
valeur supérieure.
90 % des effectifs de la population ont une valeur inférieure à D9 et 10 % une
Décile 9 ou D9
valeur supérieure.

Exercice 23
Soit la série suivante :
0 1 0 2 4 7 8 8 6
T.A.F :

MOHAMMED QMICHCHOU 38
STATISTIQUE DESCRIPTIVE 2015

1. Calculer l’étendue de cette distribution.


2. Calculer l’écart absolu moyen et l’écart relatif moyen.

Exercice 24
Calculer pour la série suivante :
 L’étendue ;
 L’écart absolu moyen ;
 L’écart relatif moyen (par rapport à la moyenne) ;
 La variance ;
 l’écart type.
Xi ni
[100-200[ 2
[200-300[ 7
[300-400[ 10
[400-600[ 12
[600-700[ 9
Total

Exercice 25
Le relevé de l’âge des individus d’un groupe de personnes partant pour voyage organisé nous
livre les résultats suivants :
Classe d’âge Effectifs
Xi ni
[22-26[ 7
[26-28[ 12
[28-35[ 9
[35-40[ 6
[40-45[ 4
T.A.F :
1. Calculer la variance de la série.
2. Déduire l’écart type des âges des personnes du groupe.
3. L’écart type, dans ce cas, a-t-il une signification concrète ?

Exercice 26
Soit la série nous donnant le nombre d’individus par foyer dans un village :
Individus 1 2 3 4 5 6 7
Foyers 5 10 30 24 13 9 4
T.A.F :
Calculer pour cette série :
1. l’étendue.
2. L’écart absolu moyen.
3. l’écart relatif moyen.
4. L’écart type et la variance.

Exercice 27

MOHAMMED QMICHCHOU 39
STATISTIQUE DESCRIPTIVE 2015

Le CA d’un groupe d’entreprises se présente de la façon suivante :


CA (en milliers d’€) Entreprises
Xi ni
[0-3[ 20
[3-6[ 13
[6-9[ 15
[9-15[ 8
[15-20[ 4
>20 2
T.A.F :
1. Calculer l’écart absolu et relatif moyen.
2. Déterminer l’intervalle interquartile.
3. Représenter graphiquement les quartiles.

Exercice 28
Soit le nombre de visites effectuées par une infirmière durant une semaine :
Jours Lundi Mardi Mercredi Jeudi Vendredi
Visites 9 7 4 6 2
T.A.F :
1. Calculer les quartiles de la distribution.
2. Calculer l’écart type te la variance.

Exercice 29
Jamila a commencé à travailler dans un magasin d'informatique il y a un an. Son supervise ur
lui a demandé de tenir un dossier du nombre d'ordinateurs qu'elle a vendus chaque mois.
L'ensemble de données qui suit indique le nombre d'ordinateurs qu'elle a vendus mensuelle me nt
au cours des 12 derniers mois :
34, 47, 1, 15, 57, 24, 20, 11, 19, 50, 28, 37.
Utilisez les dossiers des ordinateurs vendus par Jamila pour trouver :
a. l'étendue
b. la médiane
c. les quartiles supérieur et inférieur
d. l'écart interquartile

1.5.3. Etude de concentration

1.5.3.1. Définition
La concentration d’une distribution mesure sa répartition « observée » par rapport à une
« norme » de répartition (la répartition à laquelle on s’attend). Donc il s’agit de comparer deux
séries de fréquences cumulées. Elle est souvent utilisée dans l’analyse des parts distributives
des salaires, des fortunes, des parts de marché des entreprises, etc…C’est aussi une mesure de
l’état des inégalités dans la distribution.
La courbe de concentration exige comme pour la médiale, la connaissance pour chaque classe
du nombre d’observations et de la somme des valeurs correspondantes.

MOHAMMED QMICHCHOU 40
STATISTIQUE DESCRIPTIVE 2015

1.5.3.2. Courbe de Lorenz


La courbe du statisticien américain Max Otto Lorenz décrit la répartition de la richesse dans la
population.
Comment la richesse, que ce soit celle qui s'accumule au fil du temps (le patrimoine) ou son
supplément réalisé chaque année (le revenu), est-elle partagée au sein d'une population
donnée ?
C'est à ce genre de question que voulait répondre l'économiste statisticien américain Max Otto
Lorenz au début du XXe siècle, quand il représenta de manière très intuitive la distribut ion des
richesses dans son pays à l'aide d'une courbe à laquelle il a laissé son nom.
L’idée de base du graphique de LORENZ est de représenter la plus ou moins grande dispersion
(plus ou moins grande concentration) d’une masse (de richesses, de revenus, de surfaces, etc.)
au sein d’une population par un graphique inscrit dans un carré : l’axe des abscisses et celui des
ordonnées varient de 1 à 100.
on porte les déciles (parts de 10 % de la population) ou les
En abscisse quintiles (parts de 20 %) classés par convention des plus pauvres
aux plus riches.
on porte le pourcentage cumulé du phénomène étudié (le revenu, le
ordonnée patrimoine) détenu par le décile correspondant.

Soit Fi la fréquence cumulée des observations et FQi le pourcentage cumulé de la somme des
valeurs. Alors, la courbe de concentration est obtenue en traçant le graphe de FQi (ordonnée)
en fonction de Fi (abscisse). On obtient alors la courbe suivante :

La courbe de Lorenz joint donc toujours le point (0,0) au point (1,1). Elle est située sous le
segment joignant ces deux points. Un point de la courbe doit être interprété de la façon suivante
: « les 30% les moins riches de la population possèdent 10% de la population totale ».
Le mode opératoire pour tracer la courbe de Lorenz est le suivant :

MOHAMMED QMICHCHOU 41
STATISTIQUE DESCRIPTIVE 2015

1ère étape 2ème étape 3ème étape 4ème étape

Tracer la bissectrice.
La bissectrice
Calculer des déciles, représente la
Classer les valeurs
c’est-à-dire les 9 répartition égalitaire :
obtenues pour chaque Tracer la courbe des
valeurs qui séparent la 20 % de la population
individu en ordre population en 10 répartitions.
détient 20 % des
croissant.
classes égales. revenus, 60 % en
détient 60 % des
revenus, etc.

La courbe de Lorenz est située en dessous de cette diagonale de référence. Plus la courbe est
éloignée de la diagonale, plus la répartition des revenus est inégalitaire.

1.5.3.3. Indice de Gini


L’indice de Gini a été élaboré par Gini en 1912 et entretient un lien strict avec la représentatio n
de l’inégalité des revenus à l’aide de la courbe de Lorenz. En particulier, il mesure le ratio entre
l’aire située entre la courbe de Lorenz et la droite d'équidistribution (et donc l’aire de
concentration) et l’aire de concentration maximale.
L'indice (ou coefficient) de Gini est un indicateur synthétique d'inégalités de salaires (de
revenus, de niveaux de vie...) :
 Il varie entre 0 et 1.
 Il est égal à 0 dans une situation d'égalité parfaite où tous les salaires, les revenus, les
niveaux de vie... seraient égaux.
 A l'autre extrême, il est égal à 1 dans une situation la plus inégalitaire possible, celle où
tous les salaires (les revenus, les niveaux de vie...) sauf un seraient nuls.
 Entre 0 et 1, l'inégalité est d'autant plus forte que l'indice de Gini est élevé.
Une baisse de l'indice de Gini observée entre deux dates indique une diminution globale des
inégalités. A l'inverse, une élévation de l'indice reflète une augmentation globale des inégalités.

MOHAMMED QMICHCHOU 42
STATISTIQUE DESCRIPTIVE 2015

𝐧 𝐧
𝟏
𝐆𝐢𝐧𝐢 = 𝟏 − ∑(𝐲𝐢 + 𝐲𝐢+𝟏 ) = 𝟏 − ∑(𝐱 𝐢 − 𝐱 𝐢−𝟏 )(𝐲𝐢 + 𝐲𝐢+𝟏 )
𝐍
𝐢+𝟏 𝐢+𝟏

Exercice 30
Nous disposons des données suivantes sur les salaires perçus par les employés d’une PME.
Salaires
Salariés
(en milliers de DH)
1 4
2 6
3 8
4 9
5 10
6 12
7 17
8 26
9 28
10 30
TA F :
1. Tracer et commenter la courbe de Lorenz.
2. Calculer et interpréter l’indice de Gini.

Exercice 31
Dans une entreprise de 100 personnes, on a relevé les salaires suivants :
Salaires 1000-1200 1200-1500 1500-2000 2000-3000 3000-5000 5000-10000
Nombre de salariés 50 20 10 8 7 5
Travail à faire :
1. Tracer et commenter la courbe de Lorenz.
2. Calculer et interpréter l’indice de Gini.

MOHAMMED QMICHCHOU 43
STATISTIQUE DESCRIPTIVE 2015

SUJETS D’EXAMENS
Examen session 2012-2013
Licence : Sciences Economiques et de Gestion Semestre : I
Module : Techniques Quantitatives de gestion Matière : Statistique Descriptive-I
Tous les groupes Barème : 20 PTS

L’examen se présente sous forme de 3 exercices :


Exercice 1:
On dispose de la série suivante concernant les salaires dans une entreprise :
Salaire en Dirham (xi) effectif (ni)
5100 4
5900 3
6000 5
8500 6
9000 2
13000 7
14200 1
20000 0
22000 8
Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère. (3PTS)
2. Calculer le mode et la moyenne du caractère étudié. (3PTS)
Exercice 2 :
Cadre dans une entreprise, votre directeur vous soumet la situation des profits estimés pour ses 80
chantiers de construction en cours d'exécution pour fins d'analyse.
Profits
Nombre de chantiers
(en milliers de DH)
[0 ; 10) 10
[10 ; 15) 10
[15 ; 20) 20
[20 ; 25) 18
[25 ; 30) 22
Total 80
Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère. (3PTS)
2. Calculer les effectifs cumulés croissants. (2 PTS)
3. Combien de chantiers réalisant un profit supérieur à 25 000 DH. (2PTS)
Exercice 3 :
Les ventes quotidiennes d’un journal ont été compilées pour les quatre mois se terminant au 31
mai 2012. Le tableau qui suit résume ces informations :
Ventes en 1000 DH Nombre de jours
[ 5 ; 10) 15
[ 10 ; 20) 17
[ 20 ; 30) 28
[ 30 ; 40) 44
[ 40 ; 50) 16
Total 120

MOHAMMED QMICHCHOU 44
STATISTIQUE DESCRIPTIVE 2015

Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère. (3PTS)
2. Calculez la moyenne, la variance et l’écart type du caractère X. (4PTS)

Examen de Rattrapage session 2013


Durée d’examen : 2h Professeur : Khalifa AHSINA
Licence : Sciences Economiques et de Gestion Semestre : I
Module : Techniques Quantitatives de gestion Matière : Statistique Descriptive -I
Tous les groupes Barème : 20 PTS

L’examen se présente sous forme de 3 exercices :


Exercice 1:
Soit la distribution des 200 employés d'une entreprise selon leur salaire annuel exprimé en kilo-
Dirhams :
Salaire annuel (k DH) Effectifs (ni)
[50,60[ 20
[60,70[ 60
[70,90[ 50
[90,100[ 40
[100,130[ 30
Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère.
2. Calculer la mode et la moyenne du caractère étudié.
Exercice 2 :
Dans un département, on a relevé la taille des exploitations agricoles. On a obtenu les résultats
suivants :
Taille (hectares) Nombre
0 - 10 30
10 - 30 80
30 - 50 60
50 - 100 20
100 - 200 10
Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère.
2. Calculer le mode et la moyenne du caractère étudié.
Exercice 3
On étudie la répartition des individus et des ventes d’un échantillon de 100 entreprises.
Ventes (en milliards de Dirhams) Nombre d’entreprises
[0-4[ 33
[4-6[ 50
[6-9[ 10
[9-11[ 5
[11-50[ 2
Total 100
Travail à faire :
1. Définir la population et le caractère étudié et indiquer le type de caractère.
2. Calculer les effectifs cumulés croissants.
3. Combien d’entreprises réalisant des ventes supérieures à 9 milliards DH.
NOTA BENE :

MOHAMMED QMICHCHOU 45
STATISTIQUE DESCRIPTIVE 2015

Il vous est demandé d’apporter un soin particulier à la présentation de votre copie (l’utilisation du
Blanco est strictement interdite).

Examen session 2013-2014


Exercice 1 (4 Points) :
Donnez la signification des concepts de statistique descriptive suivants :
Concept Signification
Population
Caractère
Modalités
Effectif
Exercice 2 (4 Points) :
1. Donnez les catégories de variables et spécifiez les types de chacune. (2 PTS)
2. Donnez quatre exemples de domaines d’application de la statistique descriptive. (2
PTS).
Exercice 3 (12 Points) :
Répartition du CA des entreprises dans une zone franche X
CA en million de Dhs Effectif (ni)
[5 - 10 [ 55
[10 - 15 [ 110
[15 - 35 [ 185
[35 -50 [ 54
[50 - 80 [ 47
Total 451
Source : Centre d’investissement A
1) Calculez la moyenne et le mode. (2PTS)
2) Calculez la médiane et le premier Quartile (Q 1 ) et donnez leur interprétation. (2 PTS)
3) Calculez la variance. (2 PTS)
4) Calculez l’écart type et le coefficient de variation (CV). (2 PTS)
5) Calculez l’indice de Gini et interprétez- le. (2 PTS)
6) Supposant que dans une zone franche Y, l’écart-type est de 19 millions de $ et la moye
nne est de 54,29 de millions $. Que peut-on déduire sur la dispersion des deux échantil
lons ? (2 PTS).

MOHAMMED QMICHCHOU 46
STATISTIQUE DESCRIPTIVE 2015

2. STATISTIQUE DESCRIPTIVE BI-VARIEE


Il est fréquent, lorsque l'on étudie et analyse un phénomène quel qu'il soit, que plusieurs
variables ou facteurs entrent en ligne pour sa compréhension, variables qui de par la
relation de cause à effet qu'elles entretiennent sont à même d'une part de permettre de
mieux comprendre le phénomène et d'autre part d'en dégager tendance et projection
compte tenu de la situation existante. C’est l’objet de l’analyse statistique bi-variée.
L’étude de la distribution de deux variables se poursuit par celle de leur liaiso n. L’étude
de la liaison entre les variables observées, appelée communément l’étude des
corrélations, dépend de leur nature. On envisagera les trois cas suivants :

Une variable
Deux variables quantitative et une Deux variables
quantitatives variable qualitatives
qualitative
Lorsque le domaine de variation d’une variable quantitative a été découpé en classes et
que les observations sont présentées dans un tableau à double entrée, alors cette variable
peut être traitée comme une variable qualitative et dans ce cas, on a plusieurs méthodes
pour l’étude de la liaison.

2.1. Analyse statistique bi-variée


Cet aspect de l'analyse statistique, qui décrit et étudie la relation pouvant exister entre
deux variables, permet de :

Faire un ajustement
Dégager des tendances Etudier la corrélation
(ou régression) linéaire

Les outils statistiques décrits ci-après ont un double objectif :


 D'une part résumer mathématiquement (par une équation) et graphiquement (par
une droite) la relation pouvant exister entre deux variables :
o Lorsqu'il s'agira d'une variable confrontée au temps ou à l'espace dans le
cadre d'une relation non immuable, on parlera de tendance.
o Par contre lorsqu'il s'agira de deux variables entretenant une relation de
cause à effet « immuable » on parlera davantage d'ajustement ou de
régression ;
 D'autre part qualifier et mesurer l'intensité de la relation (ou degré de liaison)
entre les variables étudiées via des outils appropries comme par exemple le
coefficient de corrélation ou les tests du Khi-2 lorsque l'on aura affaire a des
variables non quantitatives.

MOHAMMED QMICHCHOU 47
STATISTIQUE DESCRIPTIVE 2015

2.2. Représentation des séries statistiques doubles

Tableaux
Séries statistiques doubles
Graphiques

2.2.1. Tableaux statistiques


Lorsque les observations portent simultanément sur deux caractères, et lorsqu’elles sont
trop nombreuses pour qu’on les cite une à une, on les présente sous la forme d’un tableau
à double entrée (Tableau a 2 dimensions ou tableau bidimensionnel). On définit alors :

La distribution conjointe

Les distributions marginales

Les distributions conditionnelles

2.2.1.1. Distribution conjointe


On appelle série statistique double (ou série statistique à deux variables) « une série
statistique où deux caractères sont étudiés simultanément. On présente généralement
les résultats dans un tableau à double entrée ».
Désignons par X et Y les deux variables qui peuvent être qualitatives ou quantitatives,
et qui peuvent ne pas être de même nature.
 Les k modalités de X sont désignées par, x1, …, xi , … xk
 Les l modalités de Y sont désignées par, y1, …, yj, … yl
 La i ème modalité d’une variable désigne le centre de la i ème classe dans le cas d’une
variable quantitative continue.
La répartition des n observations, ou distribution conjointe, suivant les modalités de X
et Y se présente sous forme d’un tableau à double entrée, appelé tableau de contingence.
Modalités de Y
Y1 … Yj … Yl
Modalités de X
X1 n11 … n1j … n1l
… … … … … …
Xi ni1 … nij … nil
… … … … … …
Xk nk1 … nkj … nkl
Les cases de ce tableau contiennent les fréquences conjointes.

MOHAMMED QMICHCHOU 48
STATISTIQUE DESCRIPTIVE 2015

L’effectif 𝐧 𝐢𝐣 désigne le nombre de fois où la modalité 𝐱 𝐢 de la variable X et la modalité


𝐲𝐣 de la variable Y ont été observées simultanément.
Exemple 1 : Soit le tableau suivant donnant le « nombre » et le « montant » des achats
des clients d’une entreprise durant le dernier trimestre 2012.
Nombre des achats
1 2 3 4 5
Montant des achats
[0-1000[ 30 20 12 6 0
[1000-2000[ 20 14 9 3 1
[2000-3000 [ 13 11 7 1 2
[3000-5000[ 8 4 0 0 0
La sommation peut porter sur deux indices i et j. La notation symbolique
𝑛 𝑛

∑ 𝑥 𝑖 ∑ 𝑦𝑗
𝑖=1 𝑗 =1

Désigne la somme de (n x m) termes x ij contenus dans un tableau à n lignes et m colonnes.


ij j=1 … j … j=m Total
i=1 X11 … X1j … X1m X1.
… … … … … … …
i Xi1 … Xij … Xim Xi.
… … … … … … …
i=n Xn1 … Xnj … Xnm Xn.
Total X.1 … X.j … X.m X..
𝑛 𝑛 𝑚

𝑋 = ∑ 𝑥 𝑖. = ∑ (∑ 𝑥 𝑖𝑗 )
𝑖=1 𝑖 =1 𝑗=1

Ou
𝑚 𝑚 𝑛

𝑋 = ∑ 𝑥 .𝑗 = ∑ (∑ 𝑥 𝑖𝑗 )
𝑗=1 𝑗=1 𝑖=1

Pour effectuer la sommation, on peut intervertir l'ordre des deux signes 

2.2.1.2. Distribution marginale


La ligne et la colonne « Total » sont appelées marges du tableau. Elles correspondent à
l’étude d’un des deux caractères indépendamment de l’autre (distributions
marginales).
Modalités de Y

y1 … yj … yl Total

Modalités de X

MOHAMMED QMICHCHOU 49
STATISTIQUE DESCRIPTIVE 2015

x1 n11 … n1j … n1l n1.= ∑𝒍𝒋=𝟏 𝑛1j


… … … … … … …
xi ni1 … nij … nil ni.= ∑𝒍𝒋=𝟏 𝑛ij
… … … … … … …
xk nk1 … nkj … nkl Nk.= ∑𝒍𝒋=𝟏 𝑛kj
n.1= n.j= n.l = n..=
Total … … ∑𝒊=𝟏 ∑𝒍𝒋=𝟏 𝑛ij
𝒌
∑𝒌𝒊=𝟏 𝑛i1 ∑𝒌𝒊=𝟏 𝑛ij ∑𝒌𝒊=𝟏 𝑛il
Les fréquences situées dans les marges de ce tableau sont appelées fréquences
marginales. Elles correspondent à l’étude d’un des deux caractères indépendamment de
l’autre. Ainsi, la lecture du total par ligne ne permettra plus de déceler les modalités de
de la ou des variables figurant en colonnes et vice versa.
Nombre des achats
1 2 3 4 5 Total
Montant des achats
[0-1000[ 30 20 12 6 0 68
[1000-2000[ 20 14 9 3 1 47
[2000-3000 [ 13 11 7 1 2 34
[3000-5000[ 8 4 0 0 0 12
Total 71 49 28 10 3 161
L’effectif 𝐧 𝐢. est le nombre total d’observations de la modalité 𝐱 𝐢 de X, quelle que soit
la modalité de Y :
Modalités de X x1 … xi … x1
Total n1.= ∑𝒍𝒋=𝟏 𝑛1j … ni.= ∑𝒍𝒋=𝟏 𝑛ij … Nk.= ∑𝒍𝒋=𝟏 𝑛kj
𝒍

𝒏𝒊.= ∑ 𝒏𝐢𝐣
𝒋=𝟏
Montant des achats [0-1000[ [1000-2000[ [2000-3000 [ [3000-5000[
Nombre de clients 68 47 34 12
L’effectif 𝐧 .𝐣 est le nombre total d’observations de la modalité 𝐲𝐣 de Y, quelle que soit la
modalité de X :
Modalités de Y y1 … yj … yl
Total n.1= ∑𝒌𝒊=𝟏 𝑛i1 … n.j= ∑𝒌𝒊=𝟏 𝑛ij … n.l= ∑𝒌𝒊=𝟏 𝑛il
𝒌

𝒏 .𝒋= ∑ 𝒏𝐢𝐣
𝒊=𝟏
Nombre des achats 1 2 3 4 5
Nombre de clients 71 49 28 10 3
On a évidemment :
𝒍 𝒌

∑ 𝒏𝐢𝐣 = ∑ 𝒏𝐢𝐣 = 𝒏
𝒋=𝟏 𝒊=𝟏

MOHAMMED QMICHCHOU 50
STATISTIQUE DESCRIPTIVE 2015

La distribution conjointe peut aussi être définie par les fréquences :


𝒏𝒊𝒋
𝒇𝒊𝒋 =
𝒏
 Les k couples (xi , ni• ) forment la distribution marginale de la variable X.
 Les l couples (yj, n• j) forment la distribution marginale de la variable Y.
Les distributions marginales peuvent aussi être données sous forme de fréquences :
𝒏 𝒏.𝒋
𝒇𝒊. = 𝒊. 𝒇.𝒋 =
𝒏 𝒏
Disposant d’une distribution conjointe, on peut déduire les distributions marginales
qui permettent d’étudier séparément chaque variable en représentant graphiquement sa
distribution et s’il s’agit d’une variable quantitative, en calculant ses caractéristiques de
tendance centrale, de dispersion, de forme…

2.2.1.3. Distribution conditionnelle


La distribution de la variable Y, la variable X étant égale à 𝐱 𝐢, est appelée distribution
conditionnelle de Y pour (𝐗 = 𝐱 𝐢 ) :
Y/X=xi Y1 … Yj … Yl Total
Total ni1 … nij … nil ni.
Dans notre exemple :
Nombre des achats 1 2 3 4 5 Total
Nombre de clients
si Montant des achats 30 20 12 6 0 68
entre [0-1000[
Cette distribution des ni. observations, satisfaisant à la condition X=xi , est présentée sous
la forme de fréquences conditionnelles :
𝒏𝒊𝒋
𝒇𝒋/𝒊 = Avec ∑𝒍𝒋=𝟏 𝒇𝒋/𝒊 = 𝟏
𝒏𝒊.
Y/X=xi Y1 … Yj … Yl Total
Total f1/i … fj/i … fl/i 1
 La fréquence fj/i se lit « f indice j si i », c’est-à-dire fréquence de yj si X=xi .
 Il y a k distributions conditionnelles de Y pour X=xi (i = 1, …, k).
Nombre des achats 1 2 3 4 5 Total
Fréquence de clients
si Montant des achats 0,44 0,29 0,18 0,09 0 1
entre [0-1000[

Exercice 32
Une étude menée par un groupe de compagnies d’assurances auprès de 30000 assurés
pour le risque « véhicules à moteur » a permis de déterminer les proportions (en
pourcentage) d’assurés correspondant à la puissance fiscale, notée X, du véhicule assuré
et au kilométrage parcouru au cours de la dernière année, noté Y. Les résultats sont
reportés dans le tableau suivant :
Y (milliers de km)
<10 [10 ; 20[ [20 ; 30[ [30 ; 40[ ≥40
X (chevaux fiscaux)
<4 4,4 1,6

MOHAMMED QMICHCHOU 51
STATISTIQUE DESCRIPTIVE 2015

5–6 7,2 8,2 4,0 2,6


7–8 2,4 7,2 13,6 14,4 4,4
9 – 10 2,4 11,6 6,0
>10 4,4 5,6
Travail à faire :
1. Précisez la population, les caractères étudiés et leur nature.
1. Donnez la distribution du kilométrage parcouru. Comment s’appelle cette
distribution ? Calculez sa moyenne et son écart-type en supposant que tous les
assurés ont fait au moins 2000 km et au plus 50000 km.
2. Donnez la distribution, en pourcentage, du kilométrage parcouru par les
possesseurs d’une voiture d’une puissance fiscale d’au plus 6 CV. Quel est le
type de cette distribution ?

Exercice 33
Dans une entreprise, on étudie la répartition de 100 salariées femmes (cf. tableau 1) et
140 salariés hommes (cf. tableau 2) selon le salaire mensuel brut X exprimé en € et
l’ancienneté Y exprimée en années.
Tableau 1 – Salariées femmes
Y
X [0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28]

[1 200 ; 1 800[ 12 10 10 8
[1 800 ; 2 200[ 8 14 5 4 4
[2 200 ; 3 000[ 6 5 6 3
[3 000 ; 4 200] 2 3
Tableau 2 – Salariés hommes
Y
[0 ; 4[ [4 ; 8[ [8 ; 12[ [12 ; 20[ [20 ; 28]
X
[1 200 ; 1 800[ 10 6
[1 800 ; 2 200[ 4 9 18 8 8
[2 200 ; 3 000[ 4 8 16 12 4
[3 000 ; 4 200] 5 8 8 12
Travail à faire :
1. Définissez la population étudiée, l’unité statistique, les caractères étudiés et leur
nature.
2. Quel pourcentage de femmes gagnent moins de 2200 € parmi les femmes qui ont
moins de 8 ans d’ancienneté ?
3. Quel pourcentage de hommes gagnent plus de 2200 € parmi les hommes qui ont
plus de 8 ans d’ancienneté ?
4. Représentez le graphe des fréquences cumulées de la distribution marginale de
l’ancienneté des femmes.
5. Représentez le graphe des fréquences cumulées de la distribution marginale du
salaire mensuel brut des hommes.
6. Calculez la distribution (en pourcentage) de l’ancienneté des femmes gagnant au
moins 1800 €.

MOHAMMED QMICHCHOU 52
STATISTIQUE DESCRIPTIVE 2015

Exercice 34
Une entreprise a effectué un sondage auprès de sa clientèle pour connaître son
appréciation sur le service livraison. Les résultats ont été les suivants :
Pas du tout Plutôt pas Plutôt Très
satisfait satisfait satisfait satisfait
Clients de plus de 2 ans 10 50 245 195
d’ancienneté
Clients d’au plus 2 ans d’ancienneté 40 90 205 165
Travail à faire :
1. Calculez le pourcentage total de clients plutôt satisfaits ou très satisfaits.
2. Calculez le pourcentage de clients de plus de 2 ans d’ancienneté parmi les clients
plutôt satisfaits ou très satisfaits.
3. Donnez le tableau des profils en ligne.
4. Donnez le tableau de contingence obtenu en regroupant :
 d’une part les clients pas du tout satisfaits et plutôt pas satisfaits ;
 et d’autre part les clients plutôt satisfaits et très satisfaits.
5. Si les 2 caractères étaient indépendants, combien aurait-on de clients de plus de
2 ans d’ancienneté dans la catégorie plutôt satisfait ou très satisfait ?

2.2.2. Graphiques

Chronogramme

Graphiques des séries statistiques doubles Graphique à cordonnées polaires

Nuage de points

2.2.2.1. Chronogramme (courbe)


Diagramme statistique qui sert à représenter les valeurs prises par un caractère qui
évolue dans le temps. Un chronogramme prend généralement l'aspect d'un diagramme à
ligne brisée.

Chronogramme

Séquentiel

Parallèle

Graphique 1: Chronogramme parallèle

MOHAMMED QMICHCHOU 53
STATISTIQUE DESCRIPTIVE 2015

Source : www.hcp.ma

2.2.2.2. Graphique à cordonnées polaires


Très utiles et d'ailleurs très utilises pour identifier des profils, des comportements
(silhouettes) d'individus en fonction de leur comportement à l'égard de plusieurs
variables (au moins 4 mais au plus 12/14 pour des questions de lisibilité).
Le principe de ce type de graphique consiste à construire une figure comportant autant
d'axes que de variables ou modalités étudiées dans un cercle virtuel avec une origine
commune et un espacement égal à (360°) ⁄ (nombre de variables ) (d'ou le nom
polaire ou radar).
Chaque axe possède une unité de mesure et une graduation qui lui sont propres
relativement à la variable qu'il représente. Mais celles-ci doivent être identiques pour
tous les individus. D'une façon générale, il est tout de même préférable d'avoir la même
graduation pour l'ensemble des variables.
Graphique 2: Graphique en Radar des Importations et exportations du Maroc
Importations et exportations du Maroc (en M de MAD)
2000
400 000
2011 2001
300 000

2010 200 000 2002

100 000

2009 0 2003

2008 2004

2007 2005
IMPORTATIONS (y compris ATSP2006
) EXPORTATIONS (y compris les ATSP)

Source : DTFE, www.finances.gov.ma

2.2.2.3. Nuage de points


Les graphiques de dispersion ou nuage de points mettent les valeurs de 2 variables
dans un repère de coordonnées cartésiennes en 2 dimensions. On associe à chaque

MOHAMMED QMICHCHOU 54
STATISTIQUE DESCRIPTIVE 2015

couple (xi; yi) de la série statistique le point M i de coordonnées (xi ; yi). Le graphique
ainsi obtenu constitue un nuage de points. On ne figure donc plus ici des effectifs mais
des individus en fonctions des valeurs prises dans chacune des variables.
Ce type de graphique revêt une importance fondamentale en statistique descriptive car
il permet, entre autres choses, d'identifier et d'évaluer la relation entre deux variables et
d'opérer une analyse sur les individus (hiérarchisation, regroupement, etc.).
Graphique 3: Nuage de point des exportations de marchandises et de services d’un panel de pays
Exportations de marchandises et de services en 2011
160000000
Exportations de services en milliers US D

140000000 Espagne

120000000

100000000

80000000

60000000

40000000

20000000
Maroc Arabie Saoudite
0 Algérie
0 100000000 200000000 300000000 400000000
Exportations de marchandises en milliers USD

Source : www.trademap.org

Exercice 35
Soit le tableau suivant donnant, en M.DH, les exportations et le PIB du Maroc sur la
période 2000-2011.
Année 2000 2001 2002 2003 2004 2005
Exportations 78826 80667 86389 83887 87896 99265
PIB courant 393381 426402 445426 477021 505015 527679
Année 2006 2007 2008 2009 2010 2011
Exportations 111979 125517 155740 113020 149583 173977
PIB courant 577344 616254 688843 732449 764030 802607
Source : DTFE, www.finances.gov.ma
Travail à faire :
1. Représenter la série des exportations à l’aide d’un chronogramme.
2. Représenter la série du PIB à l’aide d’un graphique radar.
3. Représenter les exportations et le PIB sur deux nuages de points différents.

2.3. Relation entre deux variables


« L’analyse de régression est un outil qui permet d’étudier et de mesurer la relation
existant entre deux ou plusieurs variables ».
En se basant sur les données d’un échantillon, l’analyse de régression cherche à
déterminer une estimation d’une relation mathématique entre deux variables (ou plus).
Le but est d’estimer les valeurs d’une des variables à l’aide des valeurs de l’autre (ou
des autres).

MOHAMMED QMICHCHOU 55
STATISTIQUE DESCRIPTIVE 2015

La variable estimée est appelée variable dépendante, symbolisée généralement par Y.


Par contre, la ou les variables qui expliquent les variations de Y sont appelées variables
indépendantes. Elles sont symbolisées par X.
Selon que la variable dépendante dépend d’une ou de plusieurs variables indépendantes,
on parle de régression simple ou multiple. Si la relation entre les variables est linéaire,
on parle alors de régression linéaire.
Droite de tendance ou droite de régression matérialise la relation linéaire entre :
 respectivement une variable et le temps ;
 entre deux variables.
Cette matérialisation est double :
 d'abord sous une forme mathématique par l'intermédiaire d'une équation ;
 puis sous une forme graphique puisque l'équation déterminée peut être figurée
sur le graphique original.
Soient les n points du nuage représentant, dans un repère cartésien, la série des n valeurs
(xi, yi) des variables x et y.
Ajuster une droite d à ce nuage de points consiste à remplacer chaque point (xi, yi) par
un point de même abscisse et d'ordonnée 𝐲̂, les points (xi , 𝐲̂𝐢 ) étant alignés sur la droite
d.
Une fois l'équation de la droite d déterminée, on pourra l'utiliser pour faire :
 des interpolations (calculs de valeurs intermédiaires) ;
 des extrapolations (calculs de valeurs futures).
L'équation de la droite est trouvée à partir des valeurs existantes de la distribution
étudiée. Sa forme mathématique est relativement simple et s'écrit comme suit :

𝒚 = 𝒂𝒙 + 𝒃

Où :
y = Variable dépendante ou variable expliquée
x = Variable indépendante ou variable explicative
a = Pente de la droite de régression
b = Ordonnée à l’ origine de la droite de régression
 Cette relation suppose que y est une fonction de x, c'est-à-dire que la valeur de y
dépend de celle de x, ou bien encore que la valeur de y est expliquée par la valeur
de x.
 Ainsi, la façon dont évoluera la valeur de y dépendra, de manière plus ou moins
forte, de la façon dont évoluera celle de x.
 x est alors appelée variable explicative, sa variation expliquant tout ou partie de
la variation de y, elle-même appelée variable expliquée.
Il nous reste à décrire les deux dernières composantes de l'équation de la droite de
tendance et de la droite de régression à savoir a et b :
 a représente la pente de la droite (coefficient directeur en mathématique), c'est-
à-dire son inclinaison ou, en d'autres termes, l'ampleur de la variation de la
variable expliquée y quand la variable explicative x varie d’une unité. Plus la
variation de y sera importante pour la variation d'une unité de x, plus la pente

MOHAMMED QMICHCHOU 56
STATISTIQUE DESCRIPTIVE 2015

sera importante. A l'opposé, moins la variation de y sera importante pour la


variation d'une unité de x, moins la pente sera importante.
 Le sens de la pente, donc le signe du paramètre a, renseigne quant à lui sur le
type de liaison qui unie les deux variables :
o Si a est négatif, cela signifie que lorsque x augmente, y diminue. On parle
alors de relation inversement proportionnelle ;
o Si a est nulle, cela signifie que lorsque x augmente, y demeure constant,
ne varie pas ;
o Enfin si a est positif, cela signifie que lorsque x augmente, y augmente
également (mais pas nécessairement dans les mêmes proportions). On
parle alors de relation proportionnelle.

 b représente l'ordonnée à l’origine, c'est-à-dire l'endroit où la droite de régression


(ou de tendance) coupe l'axe des ordonnées (ou axe des y). b peut être positif,
négatif ou nul.
 Si 𝒃 = 𝟎 cela signifie que la droite de régression passe par l'origine. Ça peut être
le cas quelle que soit la valeur de a. Lorsque le cas se produit, l'équation de la
droite d'ajustement devient : 𝒚 = 𝒂𝒙

MOHAMMED QMICHCHOU 57
STATISTIQUE DESCRIPTIVE 2015

2.4. Ajustement et régression


Méthode graphique
Méthodes
d'ajustement linéaire Méthode des points extrêmes
Méthode de Mayer
Méthode des Moindres Carrés

2.4.1. La méthode graphique


La méthode graphique consiste à tracer, à l'œil, à l'aide d'une règle transparente, une
droite : 𝐲 = 𝐚𝐱 + 𝐛 s'ajustant le mieux possible sur le nuage de points.
2.4.2. La méthode des points extrêmes
Puisqu’il faut deux points pour tracer une droite, une idée simple consiste à faire passer
une droite par les deux points extrêmes de la série.

Cette méthode n’est cependant pas très satisfaisante. Elle porte son inconvénient déjà
dans son nom car elle ne tient compte que de des deux points extrêmes de la série
statistique.

MOHAMMED QMICHCHOU 58
STATISTIQUE DESCRIPTIVE 2015

2.4.3. La méthode de MAYER


Cette méthode consiste à :
• Fractionner le nuage de points en deux nuages partiels de même effectif (à un
près si l’effectif de la série est impair) : le premier nuage comprend les points
1 ayant les abscisses les plus petites, et l’autre, les plus grandes.

• Déterminer ensuite les points moyens G1 et G2 des deux nuages partiels.


2
• Tracer la droite de MAYER du nuage qui correspond à la droite (G1 G2 ).
3

Exemple :
Trimestre 1 2 3 4 5 6 7 8 9 10 11 12
CA 500 550 900 650 520 580 900 670 540 600 1000 700
Ici, la série comporte 12 périodes, on peut la couper en deux parties de poids égal : les
trimestres 1 à 6 et les trimestres 7 à 12.
Premier couple de coordonnées : Second couple de coordonnées :
A1 (x1 ; y1) A2 (x2 ; y2 )
 x1 = (1+2+3+4+5+6) / 6 = 3,5  x2 = (7+8+…+12) / 6 = 9,5
 y1 = (500+550+…+580) = 616,6  y2 = (900+…+700) = 735
On peut tracer la droite sur le nuage de points :

MOHAMMED QMICHCHOU 59
STATISTIQUE DESCRIPTIVE 2015

1200

1000

800

600

400

200 A1 A2

0
0 2 4 6 8 10 12 14

L’équation exacte de la droite de forme y = ax + b est obtenue par la résolution du


système d’équation à deux inconnues :
(1) 616,6 = 3,5a + b
(2) 735 = 9,5a + b
(2) - (1) 735 – 616,6 = (9,5a – 3,5a) +b –b, soit 6a = 118,4, soit a = 19,73.
La valeur de a appliquée à (1) ou (2) donne b = 547,5.
D’où y = 19,73x + 547,5

2.4.4. La méthode des Moindres Carrés Ordinaires (MCO)


Équation et tracé de la droite d'ajustement pour un nuage de points donné nécessitent la
découverte des deux paramètres fondamentaux que sont d'une part la pente a et d'autre
part l'ordonnée à l'origine b.
Rappelons que la droite telle qu'elle doit être mise en équation et tracée a pour objectif
de résumer un nuage de points, c'est-à-dire la relation entre deux variables et ce, de façon
qualitative (allure) et quantitative (intensité).
Cette représentativité impose que la droite passe impérativement au plus près de tous les
points du nuage. Cet ajustement, car il s'agit bien d'un ajustement, a logiquement donné
son nom à la droite (droite d'ajustement). Il est réalisé par l'intermédiaire de la méthode
dite des Moindres Carres Ordinaires (MCO).
La dénomination quelque peu rébarbative de la méthode découle directement de son
principe : en effet l'ajustement s'effectue en minimisant la somme du carré des écarts
entre la droite et les observations. En clair, cela signifie bien que la droite va passer au
plus près de tous les points.
Sur le plan graphique, le principe de la méthode MCO s'illustre de la façon suivante :
Soit un nuage de points matérialisant la relation entre la variable x et la variable y, les
points représentant les observations :

MOHAMMED QMICHCHOU 60
STATISTIQUE DESCRIPTIVE 2015

Nous allons chercher la meilleure droite au sens des moindres carrés, c’est-à-dire telle
que :

∑𝐧𝐢=𝟏| 𝐌𝐢 𝐏𝐢 |𝟐 ou ∑𝐧𝐢=𝟏| 𝐝𝐢 |𝟐 soit minimum.

Il s’agit de déterminer la droite « D » d’équation (𝒚 = 𝒂𝒙 + 𝒃) telle que :

𝐟(𝐚, 𝐛) = ∑𝐧𝐢=𝟏(𝐲𝐢 − (𝐚𝐱 𝐢 + 𝐛)) 𝟐 ou ∑𝐧𝐢=𝟏(𝐲𝐢 − 𝒚


̂𝒊 )𝟐 soit minimum.

𝒚𝒊 Étant la valeur estimée par l’équation 𝒚 = 𝒂𝒙 + 𝒃 pour la valeur 𝐱 𝐢


̂
Pour atteindre cet objectif et respecter ainsi le postulat de départ, il nous faut trouver les
paramètres a et b pour formaliser l'équation de la droite d'ajustement.

Cov(x, y) δxy
a= =
Var (x) δx
1 n
La pente de la droite ∑i=1(xi − x̅ )(yi − y̅) ∑n (x − x̅ )(y − y̅)
= n =
i=1 i i
d’ajustement 1 ∑n ( ∑n
xi − x̅)2 ̅ )2
i=1(xi − x
n i=1

∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
= 𝑛
∑𝑖=1 𝑥𝑖 2 − 𝑛𝑥̅ 2
L’ordonnée à l’origine b = y̅ − ax̅
La formalisation de la relation par l'intermédiaire d'une équation ne renseigne pas non
plus sur la qualité et l'intensité d'une supposée liaison entre deux variables. On peut en
effet déterminer une équation matérialisant une relation que l'on juge probable et logique
et qui cependant n'est pas ou peu marquée ou qui n'est pas systématique dans la réalité.
Nous sommes donc en présence de deux problèmes :
 d'une part un problème lie à l'identification de l'existence ou non d'une relation
de cause à effet entre deux variables que l'on souhaite confronter ;

MOHAMMED QMICHCHOU 61
STATISTIQUE DESCRIPTIVE 2015

 d'autre part, un problème lie à la mesure de la qualité et de l'intensité de la liaison


entre deux variables.
Pour ce faire, la statistique a développé des outils capables d'évaluer la qualité d'une
liaison entre variables :
o la covariance ;
o le coefficient de corrélation ;
o le coefficient de détermination.

2.5. Mesure de la qualité et de l'intensité d'une liaison entre deux variables


La qualité et l’intensité de liaison entre deux variables est mesurée à l’aide de :

Covariance

Coefficient de corrélation

Coefficient de détermination

Ces deux coefficients qualifient et mesurent la force de la relation mathématique et


statistique entre deux variables. L'obtention de coefficients jugés bons ne signifie pas
l'existence d'une relation réelle entre les variables.
2.5.1. Covariance
En en statistique, la covariance est un nombre permettant d'évaluer le sens de variation
de deux séries de données numériques et, ainsi, de qualifier l'indépendance de ces
variables.
𝐧
𝟏
𝐂𝐨𝐯 (𝐱, 𝐲) = ∑(𝐱 𝐢 − 𝐱̅) (𝐲𝐢 − 𝐲̅)
𝐧
𝐢=𝟏

Du résultat obtenu par cette mesure on en déduit que plus la covariance est faible et
plus les séries sont indépendantes et inversement plus elle est élevée et plus les séries
sont liées. Une covariance nulle correspondant à deux variables totalement
indépendantes mais la réciproque est fausse.

2.5.2. Coefficient de corrélation


Coefficient de corrélation et coefficient de détermination sont intimement liés, le second
n'étant ni plus ni moins que la carré du premier. Notés respectivement r et r2, on écrit :
𝟏 𝐧
𝐂𝐨𝐯 (𝐱, 𝐲) 𝛅𝐱𝐲 ∑ (𝐱 − 𝐱̅)(𝐲𝐢 − 𝐲̅)
𝐫= = = 𝐧 𝐢=𝟏 𝐢
√𝐕𝐚𝐫 (𝐱) √𝐕𝐚𝐫 (𝐱𝐲) 𝛅𝐱 𝛅𝐲 √𝟏 ∑𝐧 ( 𝟏
𝐢=𝟏 𝐱 𝐢 − 𝐱̅)𝟐 √ ∑𝐧𝐢=𝟏(𝐲𝐢 − 𝐲̅)𝟐
𝐧 𝐧

Le coefficient de corrélation est toujours compris entre -1 et 1 :

−𝟏 ≤ 𝐫 ≤ 𝟏

MOHAMMED QMICHCHOU 62
STATISTIQUE DESCRIPTIVE 2015

Sa valeur mesure la force de la liaison tandis que son signe renseigne sur le sens de la
corrélation :
 Lorsque (𝐫 = 𝟏), la relation entre les variables x et y est proportionnelle et
parfaite ;
 Lorsque (𝐫 = −𝟏), la relation entre les variables x et y est inversement
proportionnelle et parfaite ;
 Lorsque (𝐫 = 𝟎), la relation entre les variables x et y est statistiquement
inexistante.
 Entre ces bornes, tous les cas de figures sont possibles avec des degrés de liaison
variables.
Corrélation Négative Positive
Faible de −0,5 à 0 de 0 à 0.5
Forte de −1 à −0,5 de 0,5 à 1

2.5.3. Coefficient de détermination


Le coefficient de détermination r2 renseigne sur la force de la liaison statistique entre
deux variables. Il diffère assez peu du coefficient de corrélation r dont il est le carré.
Pour cette raison, il est toujours de signe positif et n'informe donc pas sur le sens de la
relation. C'est pourquoi on lui préfère le coefficient de corrélation.

𝟎 ≤ 𝒓𝟐 ≤ 𝟏
Ce coefficient est compris entre 0 et 1. Plus il est proche de 1 et plus la qualité globale
de la régression est bonne.

Exercice 36
L’observation des quantités offertes sur un marché de raisin de table et des prix de vente
a donné les résultats suivants :
Quantité X à la vente (tonnes) 100 120 84 78 87 80 110 95
Prix moyen Y par kg (euros) 1,60 1,40 1,95 2,10 1,75 2,25 1,50 1,80
Travail à faire :
1. Calculez et interpréter
a. La covariance de X et Y.
b. le coefficient de corrélation linéaire entre X et Y.
c. le coefficient de détermination linéaire entre X et Y.
2. Déterminez l’équation de la droite des moindres carrés de Y en X.
3. Estimer le prix moyen Y si la quantité X à la vente était de 90 tonnes.
Exercice 37 (D’après sujet d’examen)
Soit le tableau suivant qui concerne 19 sociétés sur 76 cotés à la bourse de Casablanca, et qui
affichent des taux de rendement supérieur à 5%.On veut savoir s'il existe une liaison entre les
dividendes et le cours de ces actions :
Sociétés côtés Dividende par action Cours à fin Mars 2010
(en DH) (en DH)
Afric Industries 29 279
Nexans 25 274
Microdata 55 675

MOHAMMED QMICHCHOU 63
STATISTIQUE DESCRIPTIVE 2015

Agma Lahlou Tazi 215 2770


S2M 19 258
Salafin 39,4 550
Maroc Telecom 9,3 136
Holcim 130 2000
Maghrebail 55 854
Lydec 23 360
Eqdom 110 1770
Brasserie du maroc 110 1800
Cosumar 100 1700
Promopharm 45 800
Branoma 100 1786
Daricouspate 30 538
Afriquia Gaz 84 1540
Autohall 3,5 68
SCE 15 292,1
Source : le journal « La vie économique » du Vendredi 13 Avril 2012
Travail à faire :
1. Calculer a et b.
2. Calculer le coefficient de corrélation linéaire simple.
3. Calculer le coefficient de détermination R2 , discuter la qualité du modèle.
4. Estimer le cours prévisionnel pour un dividende de 150 DH.

Exercice 38 (D’après sujet d’examen)


Soit une entreprise qui veut savoir s'il existe une liaison entre ses dépenses mensuelles de
publicité et son chiffre d'affaires mensuel. Elle étudie donc les chiffres mensuels sur un an qui
sont les suivants :
Mois Dépenses publicitaires Chiffre d'affaires
Janvier 10,56 210
Février 15,60 240
Mars 13,12 205
Avril 3,15 140
Mai 6,75 180
Juin 9,00 180
Juillet 4,50 120
Août 0,75 100
Septembre 1,26 120
Octobre 1,95 130
Novembre 11,73 230
Décembre 14,82 260
NB : Les chiffres sont en milliers de DH.
Travail à faire :
1. Calculer la covariance entre x et y.
2. Calculer le coefficient de corrélation linéaire simple et le coefficient de détermina tio n
R2 .
3. Estimer les paramètres a et b.
4. Estimer le CA prévisionnel pour une dépense de publicité de 6 000 DH.

Exercice 39 (D’après sujet d’examen)


Au cours des deux dernières années, le produit nettoyant « Arial » a été introduit
progressivement sur le marché dans 14 régions différentes. À chaque fois que le produit a été

MOHAMMED QMICHCHOU 64
STATISTIQUE DESCRIPTIVE 2015

introduit dans une région, une vaste campagne publicitaire a accompagné son lancement. La
société s’intéresse à analyser l’effet de ces campagnes publicitaires sur les ventes enregistrées
au cours de la première année. Les données observées pour les 14 régions sont dans tableau
suivant :
Région Pub (Millions de DH) Ventes (Millions de DH)
1 1,8 104
2 1,2 68
3 0,4 39
4 0,5 43
5 2,5 134
6 2,5 127
7 1,5 87
8 1,2 77
9 1,6 102
10 1 65
11 1,5 101
12 0,7 46
13 1 52
14 0,8 33
Travail à faire :
1. Calculer a et b.
2. Calculer le coefficient de corrélation linéaire simple.
3. Calculer le coefficient de détermination R2 , discuter la qualité du modèle.
4. Estimer les ventes pour une publicité de 4 Millions de dirhams.

Exercice 40 (D’après sujet d’examen)


Le tableau suivant fournit l’évolution de la consommation en fonction du revenu disponible des
ménages sur la période 1869-1918 aux Etats-Unis. (Etude réalisée par S.Kuznets, 1946).
Décennies Revenu Disponible (Yd) La consommation (C)
1869-1878 9,3 8,1
1879-1888 17,9 15,3
1889-1898 24,2 21,2
1899-1908 37,3 32,3
1909-1918 50,6 44,0
Yd : revenu disponible des ménages en milliards de dollars 1929
C : consommation des ménages en milliards de dollars de 1929
Travail à faire :
1. Calculer a et b.
2. Calculer le coefficient de corrélation linéaire simple.
3. Calculer le coefficient de détermination R2 , discuter la qualité du modèle.
4. Estimer la consommation pour un revenu de 150 Milliards de dollars.

Exercice 41 (D’après sujet d’examen)


On veut tester la relation entre le chômage (X) et l’indice du PIB. Vous avez les statistiques du
Canada de 1997 à 2009 :
Années Chômage Indice de PIB
1997 9.11 1.20
1998 8.29 -0.43
1999 7.58 1.75
2000 6.83 4.13

MOHAMMED QMICHCHOU 65
STATISTIQUE DESCRIPTIVE 2015

2001 7.22 1.12


2002 7.66 1.09
2003 7.59 3.28
2004 7.19 3.19
2005 6.76 3.31
2006 6.30 2.67
2007 6.01 3.19
2008 6.14 4.04
2009 8.27 -2.11
Travail à faire :
1. Calculer la covariance entre x et y.
2. Calculer le coefficient de corrélation linéaire simple et le coefficient de détermina tio n
R2 .
3. Estimer les paramètres a et b.

MOHAMMED QMICHCHOU 66
STATISTIQUE DESCRIPTIVE 2015

3. SERIES CHRONOLOGIQUES
« Mon intérêt réside dans le futur car je me prépare à y passer le reste de ma vie ».
C.F. Kettering

3.1. Généralités sur les séries temporelles


On appelle série chronologique « une suite (yt) d’observations chiffrées d’un même
phénomène, ordonnées dans le temps » ou encore « ensemble de valeurs successivement
prises par une variable statistique au cours du temps ».
Une série chronologique, aussi appelée série temporelle ou chronique, est une série
statistique bidimensionnelle (t, yt).
Les dates d’observations sont généralement ordonnées de manière régulière dans le
temps, on manipule des séries :
 Journalières (cours d’une action en bourse) ;
 Mensuelles (consommation mensuelle d’électricité) ;
 Trimestrielles (nombre trimestriel de chômeurs) ;
 Annuelles (chiffre annuel des bénéfices des exportations).
Une série chronologique est présentée soit sous la forme :
 d’un tableau à deux colonnes, contenant np lignes :
t Yt
1 Y1
2 Y2
. .
. .
np Ynp
 d’un tableau à deux lignes, contenant np colonnes :
t 1 2 . . np
Yt Y1 Y2 . . Ynp
 soit sous la forme d’un tableau contenant p colonnes et n lignes : une colonne
par mois et une ligne par année :
Mois
1 2 … j … p
1 y11 y12 … y1j … y1p
2 y21 y22 … y2j … y2p
… … … … … … …
Année
i yi1 yi2 … yij … yip
… … … … … … …
n yn1 yn2 … ynj … ynp
L’étude de ces séries intéresse tous ceux qui désirent décrire, expliquer, contrôler,
prévoir des phénomènes évoluant au cours du temps.
L´étude d’un processus aléatoire à partir d’une série chronologique a, généralement,
deux objectifs :
 Interpréter l’évolution d’une variable au cours du temps ;
 Prévoir son évolution future

MOHAMMED QMICHCHOU 67
STATISTIQUE DESCRIPTIVE 2015

3.2. Décomposition d’une série chronologique

1- Choix du modèle de décomposition

2- Détermination de la tendance (trend)

3- Détermination de la composante saisonnière

4- Dessaisonalisation (Série corrigée des variations saisonnières (CVS))

5- Détermination des influences résiduelles

3.2.1. Choix du modèle de décomposition

3.2.1.1. Composantes d’une chronique


Il faut alors analyser ces composantes, en les dissociant les unes des autres, c’est-à-dire
en considérant une série comme résultant de la combinaison de différentes composantes,
tel que chacune d’elles ait une évolution simple.
 le mouvement de tendance générale ou trend (noté ft ) indiquant l’évolution
générale du phénomène étudié ;

 les mouvements saisonniers ou variations saisonnières (notés st ) sont des


variations se reproduisant périodiquement à des moments bien déterminés
(exemple : vente de bois de chauffage avant l’hiver, etc.) ;

MOHAMMED QMICHCHOU 68
STATISTIQUE DESCRIPTIVE 2015

 les mouvements cycliques sur une grande période autour du trend. Ces
mouvements peuvent être périodiques (exemple : récession et expansion
économique, etc.) ;

 les mouvements accidentels ou résiduels (notés e t ) sont dus à des facteurs


exceptionnels pour a plupart imprévisibles (grève, risque de guerre, etc.).

3.2.1.2. Modèle de décomposition


La décomposition d’une série chronologique possédant un mouvement saisonnier peut
s’effectuer selon trois types de modèles :

Additif yt =ft +s t +et

Modèle Multiplicatif yt =ft ·s t ·et


avec t= 1,… ,T

Mixte yt =ft ·s t +et

Pour choisir un modèle :


 la méthode la bande consiste à faire un graphique représentant la série
chronologique, puis on trace une droite passant respectivement par les minima
et par les maxima de chaque saison.

MOHAMMED QMICHCHOU 69
STATISTIQUE DESCRIPTIVE 2015

o Si ces deux droites sont parallèles, nous sommes en présence d’un


modèle additif ;
o Dans le cas contraire, on choisit un modèle multiplicatif ou mixte (si le
mouvement saisonnier présente des amplitudes proportionnelles à la
tendance).
Exemple :
Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim
Période
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
CA en milliers
120 181 71 119 128 190 73 124 140 196 84 133 145 206 96 142
de DH

CA en milliers de DH
250

200

150

100

50

0
Trim 1

Trim 3

Trim 1

Trim 2

Trim 4

Trim 2

Trim 4

Trim 2

Trim 3
Trim 2

Trim 4

Trim 3

Trim 1

Trim 3

Trim 1

Trim 4
 la méthode Analytique (méthode du tableau de Buys et Ballot) consiste à
calculer les moyennes et écarts-types pour chacune des périodes considérées et
on calcule la droite des moindres carrés :
o Si l’écart type est indépendant de la moyenne (𝐚 = 𝟎), c’est un modèle
additif ;
o Si l’écart type est fonction de la moyenne (𝐚 ≠ 𝟎), le modèle est
multiplicatif.
Exemple : soit la série chronologique “Nouvelles immatriculations de voitures
particulières, commerciales et utilitaires neuves selon le mois :
Année
2008 2009 2010 2011 2012
Janvier 2006 2247 2433 3127 3016
Février 3224 3862 3723 4437 4671
Mars 3789 3586 4325 5478 5218
Avril 4153 4047 4493 4384 4746
Mai 3100 2838 3399 3552 4814
Juin 2527 2727 3083 3678 3545
Mois 3015 2730 3247 3611 3341
Juillet
Août 1504 1648 1928 2260 2439
Septembre 1847 2007 2377 2699 2637
Octobre 2314 2450 2831 3071 3085
Novembre 1673 1966 2388 2510 2737
Décembre 1602 1695 2126 2182 2055

MOHAMMED QMICHCHOU 70
STATISTIQUE DESCRIPTIVE 2015

6000

5000

4000

3000

2000

1000

0
13
16

25
28

37
40

49
52
55
10

19
22

31
34

43
46

58
1
4
7

Moyenne 2562,83 2650,25 3029,42 3415,75 3525,33


Ecart-Type 888,52 817,09 839,37 988,71 1068,93
1100,00
1050,00
y = 0,2037x + 301,89
1000,00
950,00
900,00
850,00
800,00

 La méthode du profil : On utilise le graphique des courbes superposées


o Si les différentes courbes sont à peu près parallèles : le modèle est additif.
o Sinon (les pics et les creux s’accentuent) : le modèle est multiplicatif.
6000

5000

4000

3000

2000

1000

2008 2009 2010 2011 2012

MOHAMMED QMICHCHOU 71
STATISTIQUE DESCRIPTIVE 2015

3.2.2. Etude de tendance


Afin de pouvoir estimer la tendance, c’est-à-dire le mouvement d’un phénomène
observé sur un grand intervalle de temps, il faut disposer d’une série statistique sur une
longue période.
Exemple : le tableau ci-dessous contient des mesures d’un phénomène relevées à 9
instants différents.
Période t1 t2 t3 t4 t5 t6 t7 t8 t9
Valeur 4 6 5 3 7 5 4 3 6
L’étude d’une série chronologique {xt, t= 1,…, T} consiste à dissocier les différents
mouvements qui la composent et à les analyser. Une représentation graphique s’impose
en début d’analyse de toute chronique afin de faire apparaître les éléments
fondamentaux et avoir une vue globale du phénomène étudié.

Série temporelle
8
7
6
5
Valeur

4
3
2
1
0
t1 t2 t3 t4 t5 t6 t7 t8 t9
Période

3.2.2.1. Méthode des moyennes mobiles


Afin d’éliminer ou d’amortir les mouvements cycliques, saisonniers et accidentels, on
utilise la technique des moyennes mobiles. On procède ainsi en quelque sorte au lissage
de la courbe.
Le principe de cette méthode est de construire une nouvelle série obtenue en calculant
des moyennes arithmétiques successives de longueur p fixe à partir des données
originales. Chacune de ces moyennes obtenues correspondra au « milieu » de la période
pour laquelle la moyenne arithmétique vient d’être calculée.
Cette méthode consiste à définir une série de moyennes qui sont ;
 calculées sur un certain nombre d'observations consécutives (l'ordre) ;
 décalées d'une unité de temps à chaque nouveau calcul (mobiles).
Temps (t) Variable (yt) Moyennes mobiles d'ordre 3 Moyennes mobiles d'ordre 4
1 y1
2 y2 (y1 + y2 + y3 )/3
3 y3 (y2 + y3 + y4 )/3 (y1 /2 + y2 + y3 + y4 + y5 /2)/4
4 y4 (y3 + y4 + y5 )/3 (y2 /2 + y3 + y4 + y5 + y6 /2)/4
5 y5 (y4 + y5 + y6 )/3 (y3 /2 + y4 + y5 + y6 + y7 /2)/4
6 y6 (y5 + y6 + y7)/3
7 y7

MOHAMMED QMICHCHOU 72
STATISTIQUE DESCRIPTIVE 2015

Exemple : Si nous calculons les moyennes mobiles d’ordre 3, nous obtenons les
valeurs suivantes :
Période t1 t2 t3 t4 t5 t6 t7 t8 t9
Valeur 4 6 5 3 7 5 4 3 6
Moyennes mobiles d’ordre 3 5,00 4,67 5,00 5,00 5,33 4,00 4,33
Moyennes mobiles d’ordre 5 123,80 137,80 116,20 126,80 131,00 144,60
Moyennes mobiles d’ordre 4 123,8 125,9 127,3 128,1 130,3 132,5
En représentant graphiquement ces résultats, nous remarquons bien la tendance au
« lissage » de la représentation originale avec l’utilisation de la technique des moyennes
mobiles.
230
210
190
170
150
130
110
90
70
50
Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim Trim
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

CA (Yt) en milliers de DH Moyenne mobile d'ordre 3


Moyenne mobile d'ordre 5 Moyenne mobile d'ordre 4

Le choix de l’ordre :
 Ordre adapté à la périodicité des variations saisonnières ;
 Cependant, plus l'ordre est élevé :
o plus le lissage est violent ;
o plus on perd de valeurs.

3.2.2.2. Méthode analytique


Les logiciels spécialisés (SPSS…), mais aussi les tableurs (Excel …), proposent des
fonctions analytiques pour ajuster la tendance, l’ajustement se faisant par la méthode
des moindres carrés (méthode qui minimise les écarts quadratiques entre modèle et
observations).

Valeur
8

6
y = -0,0167x + 4,8611
4

2
t1 t2 t3 t4 t5 t6 t7 t8 t9

Valeur Linear (Valeur)

MOHAMMED QMICHCHOU 73
STATISTIQUE DESCRIPTIVE 2015

3.2.3. Etude de la variation saisonnière


Le mouvement saisonnier correspond à des variations s'effectuant régulièrement au
cours de la semaine, du mois, du trimestre, de l'année. Il est dû aux saisons, à des
habitudes sociologiques, etc.
Exemple 1 : Tendance avec moindres carrés et schéma Additif avec moindres carrés :
Soit le tableau donnant les ventes au Maroc d’essence aviation (en milliers de tonnes) :
Trim 1 Trim 2 Trim 3 Trim 4
2005 3,6 7 7,6 3,7
2006 3,6 6,7 7,4 3,9
2007 3,7 6,4 7,1 4,1
2008 3,6 5,7 7,1 3,7
 Pour chaque date (t), on dispose :
o d'une valeur observée (yt)
o de la valeur (estimée) du trend (ft)
t yt ft
1 3,6 5,49 8
2 7 5,47
7
3 7,6 5,44
4 3,7 5,42 6
5 3,6 5,39
6 6,7 5,37 5
7 7,4 5,34
4
8 3,9 5,32
9 3,7 5,29 3
10 6,4 5,27
y = -0,0246x + 5,515
11 7,1 5,24 2
12 4,1 5,22
13 3,6 5,20 1
14 5,7 5,17 0
15 7,1 5,15 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
16 3,7 5,12
ft = -0,0246 t + 5,515
 La composante saisonnière (st) se détermine à partir de ces deux valeurs selon
le :
o modèle additif : 𝐬𝐭 = 𝐲𝐭 − 𝐟𝐭
o modèle multiplicatif : 𝐬𝐭 = 𝐲𝐭 /𝐟𝐭
t yt ft st
1 3,6 5,49 -1,89
2 7 5,47 1,53
3 7,6 5,44 2,16
4 3,7 5,42 -1,72
5 3,6 5,39 -1,79
6 6,7 5,37 1,33
7 7,4 5,34 2,06
8 3,9 5,32 -1,42
9 3,7 5,29 -1,59
10 6,4 5,27 1,13
11 7,1 5,24 1,86
12 4,1 5,22 -1,12

MOHAMMED QMICHCHOU 74
STATISTIQUE DESCRIPTIVE 2015

13 3,6 5,20 -1,60


14 5,7 5,17 0,53
15 7,1 5,15 1,95
16 3,7 5,12 -1,42
 On calcule ensuite le coefficient saisonnier relatif à la période considérée (12 CS
avec des données mensuelles, 4 CS avec données trimestrielles) qui correspond
à la moyenne de la série des (st) qui se rapportent à un même moment de chaque
année (même mois, même trimestre…) :
𝟏
o modèle additif : 𝐜𝐬𝐣 = ∑𝐧𝐢+𝟏(𝐲𝐢𝐣 − 𝐬𝐢𝐣 )
𝐧
𝟏
o modèle multiplicatif : 𝐜𝐬𝐣 = ∑𝐧𝐢+𝟏(𝐲𝐢𝐣 /𝐬𝐢𝐣 )
𝐧
2005 2006 2007 2008 Moyenne
Trim 1 -1,89 -1,79 -1,59 -1,60 -1,72
Trim 2 1,53 1,33 1,13 0,53 1,13
Trim 3 2,16 2,06 1,86 1,95 2,01
Trim 4 -1,72 -1,42 -1,12 -1,42 -1,42
 Puis on calcule les coefficients saisonnier corrigés (définitifs) (s’j):
o Si, dans le modèle additif : ∑ 𝐬𝐢 ≠ 𝟎, 𝑎𝑙𝑜𝑟𝑠 𝒔′𝒋 = 𝒔𝒋 − 𝒔̅𝒋
o Si, dans le modèle multiplicatif, ∑ 𝐬𝐣 ≠ 𝐧𝐨𝐦𝐛𝐫𝐞 𝐝𝐞 𝐩é𝐫𝐢𝐨𝐝𝐞𝐬 alors,
𝐬′𝐣 = 𝒔𝒋 /𝒔̅𝒋
t yt ft st sj s'j
1 3,6 5,49 -1,89 -1,72 -1,72
2 7 5,47 1,53 1,13 1,13
3 7,6 5,44 2,16 2,01 2,01
4 3,7 5,42 -1,72 -1,42 -1,42
5 3,6 5,39 -1,79 -1,72 -1,72
6 6,7 5,37 1,33 1,13 1,13
7 7,4 5,34 2,06 2,01 2,01
8 3,9 5,32 -1,42 -1,42 -1,42
9 3,7 5,29 -1,59 -1,72 -1,72
10 6,4 5,27 1,13 1,13 1,13
11 7,1 5,24 1,86 2,01 2,01
12 4,1 5,22 -1,12 -1,42 -1,42
13 3,6 5,20 -1,60 -1,72 -1,72
14 5,7 5,17 0,53 1,13 1,13
15 7,1 5,15 1,95 2,01 2,01
16 3,7 5,12 -1,42 -1,42 -1,42
Somme 0,01 0,00
Moyenne 0,0004
 On appelle série désaisonnalisée ou série Corrigée des Variations
Saisonnières notée série CVS, la série chronologique yt à laquelle on a enlevé
les variations saisonnières.
o Dans le cas du modèle additif : Dt = Yt – Sj
o Dans le cas du modèle multiplicatif : Dt = Yt / Sj

MOHAMMED QMICHCHOU 75
STATISTIQUE DESCRIPTIVE 2015

t yt ft st sj s'j CVS
1 3,6 5,49 -1,89 -1,72 -1,72 5,32
2 7 5,47 1,53 1,13 1,13 5,87
3 7,6 5,44 2,16 2,01 2,01 5,59
4 3,7 5,42 -1,72 -1,42 -1,42 5,12
5 3,6 5,39 -1,79 -1,72 -1,72 5,32
6 6,7 5,37 1,33 1,13 1,13 5,57
7 7,4 5,34 2,06 2,01 2,01 5,39
8 3,9 5,32 -1,42 -1,42 -1,42 5,32
9 3,7 5,29 -1,59 -1,72 -1,72 5,42
10 6,4 5,27 1,13 1,13 1,13 5,27
11 7,1 5,24 1,86 2,01 2,01 5,09
12 4,1 5,22 -1,12 -1,42 -1,42 5,52
13 3,6 5,20 -1,60 -1,72 -1,72 5,32
14 5,7 5,17 0,53 1,13 1,13 4,57
15 7,1 5,15 1,95 2,01 2,01 5,09
16 3,7 5,12 -1,42 -1,42 -1,42 5,12

8
7,5
7
6,5
6
5,5
5
4,5
4
3,5
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Yt CVS

 La série ajustée représente l’évolution qu’aurait subi la grandeur observée, si les


variations saisonnières avaient été parfaitement périodiques (s’étaient répétées à
l’identique d’une année sur l’autre) et s’il n’y avait pas eu de variations
accidentelles.
La série ajustée, notée 𝒚̂𝒕 , est obtenue en recomposant les deux composantes estimées :
la tendance et les variations saisonnières selon le modèle qui a été choisi.
o Dans le cas du modèle additif : 𝒚 ̂𝒕 = ft + Sj
o Dans le cas du modèle multiplicatif : 𝒚 ̂ 𝒕 = ft * Sj
t yt ft st sj s'j CVS 𝐲̂𝐭
1 3,6 5,49 -1,89 -1,72 -1,72 5,32 3,77
2 7 5,47 1,53 1,13 1,13 5,87 6,60
3 7,6 5,44 2,16 2,01 2,01 5,59 7,45
4 3,7 5,42 -1,72 -1,42 -1,42 5,12 4,00
5 3,6 5,39 -1,79 -1,72 -1,72 5,32 3,67
6 6,7 5,37 1,33 1,13 1,13 5,57 6,50

MOHAMMED QMICHCHOU 76
STATISTIQUE DESCRIPTIVE 2015

7 7,4 5,34 2,06 2,01 2,01 5,39 7,35


8 3,9 5,32 -1,42 -1,42 -1,42 5,32 3,90
9 3,7 5,29 -1,59 -1,72 -1,72 5,42 3,58
10 6,4 5,27 1,13 1,13 1,13 5,27 6,40
11 7,1 5,24 1,86 2,01 2,01 5,09 7,25
12 4,1 5,22 -1,12 -1,42 -1,42 5,52 3,80
13 3,6 5,20 -1,60 -1,72 -1,72 5,32 3,48
14 5,7 5,17 0,53 1,13 1,13 4,57 6,30
15 7,1 5,15 1,95 2,01 2,01 5,09 7,15
16 3,7 5,12 -1,42 -1,42 -1,42 5,12 3,70
8

3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Yt Yt estimée

3.2.4. Etude de la variation résiduelle


Les irrégularités ou mouvement résiduel regroupe tout ce qui n’a pas été pris en compte
par la tendance et le facteur saisonnier. Elle est la résultante de fluctuations irrégulières
et imprévisibles dues à des facteurs perturbateurs non permanents ; ces fluctuations sont
supposées de faible amplitude et de moyenne nulle sur un petit nombre d’observations
consécutives.
Les variations accidentelles ou résiduelles sont obtenues par la différence entre la série
yt et sa série ajustée 𝐲̂𝐭 .
o Dans le cas du modèle additif : et= yt – 𝒚 ̂𝒕
o Dans le cas du modèle multiplicatif : et= yt / 𝒚 ̂𝒕
t yt ft st sj s'j CVS 𝐲̂𝐭 et
1 3,6 5,49 -1,89 -1,72 -1,72 5,32 3,77 -0,17
2 7 5,47 1,53 1,13 1,13 5,87 6,60 0,40
3 7,6 5,44 2,16 2,01 2,01 5,59 7,45 0,15
4 3,7 5,42 -1,72 -1,42 -1,42 5,12 4,00 -0,30
5 3,6 5,39 -1,79 -1,72 -1,72 5,32 3,67 -0,07
6 6,7 5,37 1,33 1,13 1,13 5,57 6,50 0,20
7 7,4 5,34 2,06 2,01 2,01 5,39 7,35 0,05
8 3,9 5,32 -1,42 -1,42 -1,42 5,32 3,90 0,00
9 3,7 5,29 -1,59 -1,72 -1,72 5,42 3,58 0,12
10 6,4 5,27 1,13 1,13 1,13 5,27 6,40 0,00
11 7,1 5,24 1,86 2,01 2,01 5,09 7,25 -0,15
12 4,1 5,22 -1,12 -1,42 -1,42 5,52 3,80 0,30
13 3,6 5,20 -1,60 -1,72 -1,72 5,32 3,48 0,12
14 5,7 5,17 0,53 1,13 1,13 4,57 6,30 -0,60
15 7,1 5,15 1,95 2,01 2,01 5,09 7,15 -0,05

MOHAMMED QMICHCHOU 77
STATISTIQUE DESCRIPTIVE 2015

16 3,7 5,12 -1,42 -1,42 -1,42 5,12 3,70 0,00


Exemple 2 : Tendance avec moyennes mobile et schéma Multiplicatif avec moyennes
mobiles :
Soit le tableau donnant les ventes au Maroc d’essence aviation (en milliers de tonnes) :
Trim 1 Trim 2 Trim 3 Trim 4
2005 3,6 7 7,6 3,7
2006 3,6 6,7 7,4 3,9
2007 3,7 6,4 7,1 4,1
2008 3,6 5,7 7,1 3,7

t yt ft st sj s'j CVS 𝐲̂𝐭 et


1 3,6 0,69 0,69 5,19
2 7 1,19 1,20 5,84
3 7,6 5,48 1,39 1,36 1,37 5,54 7,51 1,01
4 3,7 5,44 0,68 0,73 0,73 5,04 3,99 0,93
5 3,6 5,38 0,67 0,69 0,69 5,19 3,73 0,97
6 6,7 5,38 1,25 1,19 1,20 5,59 6,45 1,04
7 7,4 5,41 1,37 1,36 1,37 5,39 7,43 1,00
8 3,9 5,39 0,72 0,73 0,73 5,31 3,96 0,99
9 3,7 5,31 0,70 0,69 0,69 5,33 3,69 1,00
10 6,4 5,30 1,21 1,19 1,20 5,34 6,36 1,01
11 7,1 5,31 1,34 1,36 1,37 5,17 7,29 0,97
12 4,1 5,21 0,79 0,73 0,73 5,58 3,83 1,07
13 3,6 5,13 0,70 0,69 0,69 5,19 3,56 1,01
14 5,7 5,08 1,12 1,19 1,20 4,75 6,09 0,94
15 7,1 1,36 1,37 5,17
16 3,7 0,73 0,73 5,04
Somme 15,90 16,00
Moyenne 0,99

2005 2006 2007 2008 Moyenne


Trim 1 0,67 0,70 0,70 0,69
Trim 2 1,25 1,21 1,12 1,19
Trim 3 1,39 1,37 1,34 1,36
Trim 4 0,68 0,72 0,79 0,73

3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Yt Ft CVS Yt estimée

MOHAMMED QMICHCHOU 78
STATISTIQUE DESCRIPTIVE 2015

3.3. Prévision statistique


La prévision peut être définie comme étant « une appréciation sur les valeurs futures
d’une variable quantitative ».
Nous partons d’une série d’observations à travers le temps portant sur une variable y
quelconque, de l’instant 1 jusqu’à l’instant T ; il s’agit d’une série chronologique. Nous
cherchons à prévoir la valeur qui sera atteinte par y à un instant futur T+h, ou encore à
l’horizon h.
Pour avoir une prévision pour la date t il suffit :
o de calculer la tendance à la date t : ft à l’aide de l’expression de la tendance
en fonction de t ;
o puis d’additionner ft et le coefficient saisonnier du mois en question si le
modèle est additif, ou de multiplier ft et le coefficient saisonnier du mois
si le modèle est multiplicatif.
𝐲̂𝐭 = 𝒇𝒕 + 𝒔′𝒋
𝐲̂𝐭 = 𝒇𝒕. 𝒔′𝒋
Cela se ramène à poursuivre le calcul de la série ajustée pour les mois suivants.
On fait des prévisions en supposant que la tendance va suivre la même évolution et que
les variations saisonnières seront identiques. On obtient ainsi une estimation de
l’évolution de la grandeur observée sans tenir compte des variations accidentelles.
t yt ft s'j 𝐲̂𝐭
1 3,6 5,49 -1,72 3,77
2 7 5,47 1,13 6,60
3 7,6 5,44 2,01 7,45
4 3,7 5,42 -1,42 4,00
5 3,6 5,39 -1,72 3,67
6 6,7 5,37 1,13 6,50
7 7,4 5,34 2,01 7,35
8 3,9 5,32 -1,42 3,90
9 3,7 5,29 -1,72 3,58
10 6,4 5,27 1,13 6,40
11 7,1 5,24 2,01 7,25
12 4,1 5,22 -1,42 3,80
13 3,6 5,20 -1,72 3,48
14 5,7 5,17 1,13 6,30
15 7,1 5,15 2,01 7,15
16 3,7 5,12 -1,42 3,70
17 5,10 -1,72 3,38
18 5,07 1,13 6,20
19 5,05 2,01 7,05
20 5,02 -1,42 3,60

MOHAMMED QMICHCHOU 79
STATISTIQUE DESCRIPTIVE 2015

8
7,5
7
6,5
6
5,5
5
4,5
4
3,5
3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Yt Yt estimée

3.4. Progressions et indices statistiques


L'utilisation et l'analyse de séries chronologiques, c'est-à-dire de séries qui figurent
l'évolution d'une variable statistique au cours du temps, s'appuient sur deux outils
principaux :
 d'une part la progression
 et d'autre l'indice.
Ces deux outils mesurent les variations d'une variable entre deux dates ou plus selon un
pas de temps régulier ou non.

3.4.1. Progressions
La progression mesure le sens et l'intensité du changement intervenu sur une variable
numérique V a différents temps t. Au temps t la variable s'écrit par convention Vt (V
indice t).
 Lorsque t = 0 la variable s'écrit V0,
 quand t = 1 elle s'écrit V1,
 lorsque t = n on a Vn .
A chaque temps t la variable V est caractérisée par une valeur différente.

3.4.1.1. Variation absolue


La variation absolue correspond à la différence de valeurs de la variable V entre deux
dates, deux temps t0 et tn . Elle s'écrit :
∆𝐕 = 𝐕𝐧 − 𝐕𝟎

3.4.1.2. Taux de croissance


La variation absolue correspond à la variation absolue et mesure l'évolution brute et le
sens de variation d'une quantité sans indication de son intensité par rapport à une
situation de référence V0.
La mesure de cette intensité, en plus du sens de variation (positif ou négatif), se réalise
par l'intermédiaire d'un taux, c'est-à-dire d'un rapport d'une différence sur une quantité
de référence le tout exprime en pourcentage. Ce taux s'écrit :

MOHAMMED QMICHCHOU 80
STATISTIQUE DESCRIPTIVE 2015

∆𝐕 𝐕𝟏 − 𝐕𝟎
𝐠𝐭 = =
𝐕𝟎 𝐕𝟎

3.4.1.3. Taux de croissance moyen


Le taux de croissance annuel moyen est la moyenne géométrique des taux de croissance
(pourcentages de variation).
𝟏
𝐕𝐭 𝐭
𝒈=( ) −𝟏
𝐕𝟎
𝒕 𝑽𝒕
𝒈=√ −𝟏
𝑽𝟎

3.4.2. Indices
L'indice d'une grandeur est 1 « le rapport entre la valeur de cette grandeur au cours d'une
période courante et sa valeur au cours d'une période de base ». Il mesure la variation
relative de la valeur entre la période de base et la période courante. Souvent, on multiplie
le rapport par 100 ; on dit : indice base 100 à telle période.
Les indices permettent de calculer et de comparer facilement les évolutions de plusieurs
grandeurs entre deux périodes données. L'indice est avant toute chose un résumé
d'informations.
Il faut distinguer les indices élémentaires des indices synthétiques :
 les indices élémentaires décrivent le changement relatif d’une seule variable ;
 les indices synthétiques ou indices composés permettent de décrire par un
nombre unique la comparaison de l’ensemble des valeurs que prennent plusieurs
variables dans une certaine situation par rapport à l’ensemble des valeurs des
mêmes variables dans une situation de référence.

Un indice peut être :


élémentaire complexe ou synthétique
Résume l’évolution de plusieurs grandeurs
Renseigne sur l’évolution temporelle ou comme plusieurs prix, plusieurs quantités,
spatiale d’une seule valeur. plusieurs valeurs (prix x quantités), etc.

3.4.2.1. Indices élémentaires


Un indice élémentaire est « un rapport entre deux valeurs d'une même grandeur dans
deux situations différentes dont une est appelée « base » et adoptée comme valeur de
référence, et l'autre situation « courante » ». Si on note I1/0 l'indice se rapportant à une
grandeur simple g dans la situation 1 par rapport à la situation 0, on a :
𝐠𝟏
𝐈𝟏/𝟎 =
𝐠𝟎

1 www.insee.fr

MOHAMMED QMICHCHOU 81
STATISTIQUE DESCRIPTIVE 2015

𝐠𝟏
𝐈𝟏/𝟎 = × 𝟏𝟎𝟎
𝐠𝟎
La situation de base, ou de référence (g0 ), est toujours placée au dénominateur, le
numérateur (g1) étant occupé par la situation dite courante.
Indice élémentaire Formule
𝐏𝟏
des prix 𝐈(𝐏)𝟏/𝟎 =
𝐏𝟎
𝐐𝟏
des quantités 𝐈(𝐐)𝟏/𝟎 =
𝐐𝟎
𝐕𝟏 𝐏𝟏 𝐐𝟏
de valeur (ou de dépense) 𝐈(𝐕)𝟏/𝟎 = = = 𝐈(𝐏)𝟏/𝟎 × 𝐈(𝐐)𝟏/𝟎
𝐕𝟎 𝐏𝟎 𝐐𝟎
La détermination d'un indice peut ne pas se limiter à la comparaison des mesures d'une
seule grandeur. On peut envisager de suivre l'évolution simultanée de plusieurs
grandeurs et de calculer un indice synthétique ou composé.

3.4.2.2. Indices synthétiques


Un indice synthétique « mesure la variation de la valeur d'une grandeur complexe
définie comme l'agrégation d'un ensemble de grandeurs élémentaires ».
Soit trois produits A, B et C dont on a mesuré les prix unitaires aux dates t0 et t1. Il a été
incorporé des coefficients de pondération, les consommations n'étant pas les mêmes
entre les deux dates.
Prix unitaire
Produit Pondération
t0 t1
A 2 3 5
B 3 4 3
C 5 8 2
10

Première méthode Indice des moyennes arithmétiques pondérées


Le principe est de calculer le rapport :
- du prix total des quantités consommées à la date t1 ,
- au prix total des quantités consommées à la date t0 .
( 3 × 5) + ( 4 × 3) + ( 8 × 2)
I1/0 = × 100 ≈ 148
( 2 × 5) + ( 3 × 3) + ( 5 × 2)
Les prix ont augmenté de 48 % entre t0 et t1 .
Le total des coefficients étant 10, l'indice obtenu peut s'écrire
𝐦𝐨𝐲𝐞𝐧𝐧𝐞 𝐚𝐫𝐢𝐭𝐡𝐦é𝐭𝐢𝐪𝐮𝐞 𝐩𝐨𝐧𝐝é𝐫é𝐞 à 𝐭 𝟏
𝐈𝟏/𝟎 = × 𝟏𝟎𝟎
𝐦𝐨𝐲𝐞𝐧𝐧𝐞 𝐚𝐫𝐢𝐭𝐡𝐦é𝐭𝐢𝐪𝐮𝐞 𝐩𝐨𝐧𝐝é𝐫é𝐞 à 𝐭 𝟎
𝟒𝟑⁄
𝐈𝟏/𝟎 = 𝟏𝟎 × 𝟏𝟎𝟎
𝟐𝟗⁄
𝟏𝟎
Désignons P0 les prix à la date t0
P1 les prix à la date t1
Q les coefficients de pondération
∑ 𝐏𝟏 𝐐
𝐈𝟏/𝟎 = × 𝟏𝟎𝟎
∑ 𝐏𝟎 𝐐

MOHAMMED QMICHCHOU 82
STATISTIQUE DESCRIPTIVE 2015

Deuxième méthode Moyenne arithmétique pondérée des indices simples


Le principe est de déterminer d'abord l'indice simple de chaque denrée puis de faire la moyenne
arithmétique pondérée des indices simples obtenus.
A = I1/0 = 3/2 x 100
B = I1/0 = 4/3 x 100
C = I1/0 = 8/5 x 100
L'indice synthétique est égal à
300 400 800
( 2 × 5) + ( 3 × 3) + ( 5 × 2)
I1/0 = = 147
5+ 3+2
Les prix ont augmenté de 47 % entre t0 et t1 .
𝐏
∑( 𝟏 × 𝟏𝟎𝟎 × 𝐐)
𝐏𝟎
𝐈𝟏/𝟎 =
∑𝐐
Trois économistes, LASPEYRES, PAASCHE2 et FISHER, ont proposé des indices
synthétiques différents pour mesurer l’évolution des composants prix et quantité.

3.4.2.3. L'indice de LASPEYRES


L'indice de LASPEYRES permet de mesurer deux évolutions :
 l'évolution des prix des biens composant le panier (on parlera alors d'indice d'évolutio n
des prix de LASPEYRES) ;
 l'évolution des quantités des biens composant ce même panier (on parlera alors d'indice
d'évolution des quantités de LASPEYRES).
Une application courante est le calcul de l'Indice des prix à la consommation. Selon le HCP,
« L'indice des prix à la consommation (base 100 : 2006) mesure la variation relative des prix
à la consommation d’un panier fixe de produits consommés par les ménages marocains ».

www.hcp.ma

2
Étienne Laspeyres (économiste et statisticien allemand d’origine française) et Hermann Paasche (statisticien allemand)
proposèrent ces formules respectivement en 1864 et 1874.

MOHAMMED QMICHCHOU 83
STATISTIQUE DESCRIPTIVE 2015

Exemple : Examinons le panier d’une ménagère au temps t 0 et t 1 . Il contient quatre produits


dont le prix unitaire et les quantités achetées figurent dans le tableau qui suit :
t0 t1
P0 Q0 P1 Q1
Produit 1 3,88 7 4,13 8
Produit 2 7,50 4 8,42 3
Produit 3 12,45 3 11,71 5
Produit 4 4,40 12 4,89 9

3.4.2.3.1. Indice de LASPEYRES des prix


Cet indice mesure l'évolution des prix des biens composant un panier entre deux dates 0 et t. en
prenant comme référence la valeur du panier au temps initial t = 0 et en supposant que les
quantités des biens du panier n'ont pas varié entre les deux dates.
Moyenne arithmétique des indices élémentaires des prix, base 100, pondérés par des
coefficients de pondération relatifs à la date de référence t0 .
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒄𝒐𝒖𝒓𝒂𝒏𝒕𝒆 𝒂𝒗𝒆𝒄 𝒍𝒆𝒔 𝒒𝒖𝒂𝒏𝒕𝒊𝒕é𝒔 𝒅𝒆 𝒓é𝒇é𝒓𝒆𝒏𝒄𝒆
𝑳(𝑷)𝟏/𝟎 =
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒅𝒆 𝒓é𝒇é𝒓𝒆𝒏𝒄𝒆

∑𝒏𝒋=𝟏 𝑷𝒋,𝟏 𝑸𝒋,𝟎


𝑳(𝑷)𝟏/𝟎 = 𝒏 × 𝟏𝟎𝟎
∑𝒋=𝟏 𝑷𝒋,𝟎 𝑸𝒋,𝟎

Produit P1 .Q0 P0 .Q0


𝟏𝟓𝟔,𝟒
1 28,91 27,16 𝐋(𝐏)𝟏/𝟎 = 𝟏𝟒𝟕,𝟑𝟏 × 𝟏𝟎𝟎 =106,17
2 33,68 30 Soit une progression de la valeur du panier
3 35,13 37,35 de cette ménagère de 6,17 % selon les prix
4 58,68 52,8 entre t0 et t1 .
Total 156,4 147,31

3.4.2.3.2. Indice de LASPEYRES des quantités


Cet indice mesure l'évolution des quantités des biens composant un panier entre deux dates 0
et t en prenant comme référence la valeur du panier au temps initial t = 0 et en supposant que
les prix des biens du panier n'ont pas change entre les deux dates.
Moyenne arithmétique des indices élémentaires des quantités, base 100, pondérés par des
coefficients de pondération relatifs à la date de référence t0 .
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒄𝒐𝒖𝒓𝒂𝒏𝒕𝒆 𝒂𝒗𝒆𝒄 𝒍𝒆𝒔 𝒑𝒓𝒊𝒙 𝒅𝒆 𝒓é𝒇é𝒓𝒆𝒏𝒄𝒆
𝑳(𝑸)𝟏/𝟎 =
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒅𝒆 𝒓é𝒇é𝒓𝒆𝒏𝒄𝒆

∑𝒏𝒋=𝟏 𝑷𝒋,𝟎 𝑸𝒋,𝟏


𝑳(𝑸)𝟏/𝟎 = × 𝟏𝟎𝟎
∑𝒏𝒋=𝟏 𝑷𝒋,𝟎 𝑸𝒋,𝟎

Produit P0 .Q1 P0 .Q0 𝟏𝟓𝟓,𝟑𝟗


𝐋(𝐐)𝟏/𝟎 = 𝟏𝟒𝟕,𝟑𝟏 × 𝟏𝟎𝟎 =105,49
1 31,04 27,16
2 22,5 30 Soit une progression de la valeur du panier
de cette ménagère de 5,49 % selon les
3 62,25 37,35
quantités entre t0 et t1 .
4 39,6 52,8

MOHAMMED QMICHCHOU 84
STATISTIQUE DESCRIPTIVE 2015

Total 155,39 147,31

3.4.2.4. L'indice de PAASCHE


L’indice de PAASCHE des prix ou des quantités est la moyenne harmonique des indices
élémentaires (de prix et de quantités) pondérée par les structures de valeurs de la période
courante.

3.4.2.4.1. Indice de PAASCHE des prix


Moyenne harmonique des indices élémentaires des prix, base 100, pondérés par des coefficie nts
de pondération relatifs à la date courante t1.
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒄𝒐𝒖𝒓𝒂𝒏𝒕𝒆
𝑷(𝑷)𝟏/𝟎 =
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒅𝒆 𝒓é𝒇é𝒓𝒆𝒏𝒄𝒆 𝒂𝒗𝒆𝒄 𝒍𝒆𝒔 𝒒𝒖𝒂𝒏𝒕𝒊𝒕é𝒔 𝒄𝒐𝒖𝒓𝒂𝒏𝒕𝒆𝒔

∑𝒏𝒋=𝟏 𝑷𝒋,𝟏 𝑸𝒋,𝟏


𝑷(𝑷)𝟏/𝟎 = × 𝟏𝟎𝟎
∑𝒏𝒋=𝟏 𝑷𝒋,𝟎 𝑸𝒋,𝟏

Produit P1 .Q1 P0 .Q1


𝟏𝟔𝟎,𝟖𝟔
1 33,04 31,04 𝐏(𝐏)𝟏/𝟎 = 𝟏𝟓𝟓,𝟑𝟗 × 𝟏𝟎𝟎 =103,52
2 25,26 22,5 Soit une progression de la valeur du panier
3 58,55 62,25 de cette ménagère de 3,52 % selon les prix
4 44,01 39,6 entre t0 et t1 .
Total 160,86 155,39

3.4.2.4.2. Indice de PAASCHE des quantités


Moyenne harmonique des indices élémentaires des quantités, base 100, pondérés par des
coefficients de pondération relatifs à la date courante t1.
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒄𝒐𝒖𝒓𝒂𝒏𝒕𝒆
𝑷(𝑸)𝟏/𝟎 =
𝑫é𝒑𝒆𝒏𝒔𝒆 à 𝒍𝒂 𝒅𝒂𝒕𝒆 𝒅𝒆 𝒓é𝒇é𝒓𝒆𝒏𝒄𝒆 𝒂𝒗𝒆𝒄 𝒍𝒆𝒔 𝒑𝒓𝒊𝒙 𝒄𝒐𝒖𝒓𝒂𝒏𝒕𝒔

∑𝒏𝒋=𝟏 𝑷𝒋,𝟏 𝑸𝒋,𝟏


𝑷(𝑸)𝟏/𝟎 = × 𝟏𝟎𝟎
∑𝒏𝒋=𝟏 𝑷𝒋,𝟏 𝑸𝒋,𝟎

Produit P1 .Q1 P1 .Q0


𝟏𝟔𝟎,𝟖𝟔
1 33,04 28,91 𝑷(𝑸)𝟏/𝟎 = × 𝟏𝟎𝟎 =102,85
𝟏𝟓𝟔,𝟒
2 25,26 33,68 Soit une progression de la valeur du panier
3 58,55 35,13 de cette ménagère de 2,85 % selon les
4 44,01 58,68 quantités entre t0 et t1 .
Total 160,86 156,4

3.4.2.5. L'indice de FISHER


L’indice de FISHER est un indice synthétique permettant de mesurer les changements du coût
de la vie. Il représente la moyenne géométrique de deux indices :
 l’indice de LASPEYRES ;
 l’indice de PAASCHE.
Indice de Fisher = √Indice de Laspeyres × Indice de Paasche

MOHAMMED QMICHCHOU 85
STATISTIQUE DESCRIPTIVE 2015

𝐅 = √𝐋 × 𝐏
On peut aussi le calculer soit en prix soit en quantités.
𝐅(𝐏) = √𝐋(𝐏) × 𝐏(𝐏)
𝐅(𝐐) = √𝐋(𝐐) × 𝐏(𝐐)
Indice Des prix Des quantités
LASPEYRES 105,49 105,49
PAASCHE 103,52 102,85
FISHER 104,50 104,16
L’indice de FISHER, la moyenne géométrique des deux indices de LASPEYRES et de
PAASCHE, se veut donc un indice idéal représentant un compromis entre ces deux indices.

MOHAMMED QMICHCHOU 86
STATISTIQUE DESCRIPTIVE 2015

Exercice 42
1. Construire une série chronologique X, composée de 16 points et définie par :
xt = 2 . t + 100
Où t représente le temps, avec t variant de 1 à 16.
2. Calculer les moyennes mobiles centrées de longueur 3 et de longueur 4 sur la
série X, qui seront notées respectivement M 3(X) et M4 (X).
3. Comparer la série X aux deux moyennes mobiles M 3(X) et M4 (X). Commenter
les résultats.
4. Construire une nouvelle série chronologique Y composée également de 16 points
et définie par :
yt = 3 t + 200
Où t représente le temps, avec t variant de 1 à 16.
5. Calculer les moyennes mobiles centrées de longueur 3 et longueur 4 sur la série
Y, qui seront notées respectivement M 3 (Y) et M4 (Y).
6. Calculer la somme Z des deux séries chronologiques X et Y. Calculer les
moyennes mobiles de longueur 3 et longueur 4 sur Z, qui seront notées
respectivement M3 (Z) et M4 (Z).
7. Calculer les sommes M3 (X) + M3 (Y) et M4 (X) + M4 (Y). Comparer ces résultats
à ceux de la question 5. Que peut-on constater ?

Exercice 43
Le tableau ci-dessous donne le chiffre d'affaires trimestriel de l'entreprise TrucNet sur la période
2008 à 2011.

Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4


2008 120 181 71 119
2009 128 190 73 124
2010 140 196 84 133
2011 145 206 96 142
Travail à faire :
1. Tracer la série chronologique X.
2. Quel modèle peut-on appliquer sur la série chronologique X ? Justifier votre choix.
3. Après avoir justifié la longueur de la moyenne mobile à employer, calculer la série Y
des moyennes mobiles et représenter les deux courbes sur un même graphique.

Exercice 44
La compagnie aérienne régionale AirHub désire connaître la structure du trafic aérien d'une de
ses lignes. Pour cela elle vous donne la série mensuelle du nombre de passagers entre 2008 et
2012.

janvier février mars avril mai juin juillet août septembre octobre novembre décembre
2008 713 630 940 1040 720 1 260 812 380 870 1 120 1 200 910
2009 800 700 1 030 1 280 840 1 520 1 010 510 1 060 1 280 1 350 1 000
2010 900 820 1 190 1 450 880 1 730 1 034 590 1 203 1 500 1 550 1 140
2011 1 092 1 000 1 380 1 700 960 1 950 1 203 660 1 282 1 600 1 700 1 160
2012 1 070 1 030 1 440 1 720 1 060 2 200 1 190 730 1 278 1 760 1 940 1 320
Travail à faire :
1. Tracer la série chronologique X.

MOHAMMED QMICHCHOU 87
STATISTIQUE DESCRIPTIVE 2015

2. A l'aide du tableau de Buys-Ballot, montrer que la série possède une composante


saisonnière qui augmente au cours du temps. En déduire le type de modèle qu'il faut lui
appliquer.
3. Après avoir justifié la longueur de la moyenne mobile à employer, calculer la série Y
des moyennes mobiles.

Exercice 45
Le tableau suivant donne la série chronologique bimestrielle du transport des voyageurs sur le
réseau Air France International (en milliards de passagers-km) de 2008 à 2011.
Janv.-Fév Mars-Avril Mai-Juin Juil.-Août Sept.-Oct. Nov.-Déc.
2008 13,3 15,1 14,8 16,3 14,8 14,2
2009 13,8 14,2 14,1 17 15,2 14,8
2010 14,4 16 16,2 18,5 16,2 15,3
2011 15,4 16,8 17,4 19,9 17,9 17,4
Travail à faire :
1. On choisit de modéliser cette chronique par un schéma additif. Justifiez ce choix.
2. Déterminez la tendance de cette chronique par la suite des moyennes mobiles de
longueur adaptée, et représentez-la sur le même graphique que la série initiale.
3. Calculez les coefficients saisonniers.
4. Calculez la série corrigée des variations saisonniè res. Ajustez cette chronique par une
droite en utilisant la méthode des moindres carrés.
5. Au vu des résultats, quelles prévisions pouvait-on faire fin 2005 pour janvier-févr ier,
mars-avril et mai-juin 2012.

Exercice 46
Voici pour ses trois premiers mois d’ouverture, le nombre de places yt vendues par semaine par
le cinéma PARADISO (t désignant le numéro de la semaine varie de 1 à 12) :
t 1 2 3 4 5 6 7 8 9 10 11 12
Yt 3428 3295 3376 3195 3573 3334 3434 3300 3703 3411 3545 3327
Travail à faire :
1. Représentez cette chronique graphiquement. A-t-elle une composante saisonnière ? Si
oui, de quelle période ?
2. Calculez la suite des moyennes mobiles de longueur appropriée pour évaluer la tendance
de la série chronologique. Représentez cette suite sur le graphique précédent.
3. On choisit un modèle multiplicatif. Évaluez les coefficients saisonniers.
4. Calculez la série corrigée des variations saisonnières (série CVS) et représentez-la sur
le graphique précédent. Calculez la série des résidus.
5. Ajustez la série CVS par une droite en utilisant la méthode des moindres carrés.
Représentez cette droite sur le graphique précédent.
6. Donnez une prévision pour le nombre de places vendues pendant les deux premières
semaines du quatrième mois.

MOHAMMED QMICHCHOU 88
STATISTIQUE DESCRIPTIVE 2015

Exercice 47 (D’après sujet d’examen)


Le chiffre d’affaires trimestriel de l’entreprise de ventes par correspondance « Les Trois
Redoutes » est donné dans le tableau ci-dessous, avec comme base 100 celui de l’année 1990
(le calcul de l’indice est effectué en francs constants).
1er trimestre 2e trimestre 3 e trimestre 4 e trimestre
1997 90,53 94,73 104,94 110,28
1998 92,46 96,18 103,49 114,17
1999 86,09 99,6 103,97 111,46
2000 90,27 96,35 106,06 116,49
2001 91,83 97,75 103,76 115,61
Travail à faire :
1. Représenter graphiquement cette série chronologique et déterminer sa saisonnalité ;
2. En utilisant le modèle empirique additif :
a. Calculer la Tendance ;
b. Calculer les coefficients saisonniers ;
c. Calculer l’aléa ;
d. Déterminer la série Corrigée des Variations Saisonnières.

Exercice 48 (D’après sujet d’examen)


On a noté les volumes de ventes trimestrielles d'une entreprise de fabrication de tubes
fluorescents (en milliers de tubes) :
Trimestres
Années
T1 T2 T3 T4
1990 86 123 160 108
1991 103 137 200 124
1992 100 167 196 140
Travail à faire :
1. Représenter graphiquement cette série chronologique et déterminer sa saisonnalité ;
2. En utilisant le modèle empirique additif :
a. Calculer les coefficients saisonniers ;
b. Déterminer la série ajustée ;
c. Déterminer la série Corrigée des Variations Saisonnières.

Exercice 49 (D’après sujet d’examen)


La société « VETMAR » commercialise par correspondance et par l’intermédiaire de magasins
d’exposition des vêtements, des accessoires. Elle envisage d’étendre son réseau dans la région
Centre, et étudie auparavant le nombre trimestriel de mariages pour évaluer le marché à venir.
1er trim. 2e trim. 3e trim. 4e trim.
2008 1357 3818 4814 2255
2009 1342 3672 4634 2086
2010 1315 3765 4220 1745
2011 1160 3605 4211 1641
Travail à faire :
1. Représenter graphiquement cette série chronologique et déterminer sa saisonnalité ;
2. En utilisant le modèle empirique additif :

MOHAMMED QMICHCHOU 89
STATISTIQUE DESCRIPTIVE 2015

a. Calculer la Tendance ;
b. Calculer les coefficients saisonniers ;
c. Calculer l’aléa ;
d. Déterminer la série Corrigée des Variations Saisonnières.

Exercice 50 (D’après sujet d’examen)


La société « Le Premier Jour » commercialise par correspondance et par l’intermédiaire de
magasins d’exposition des vêtements, des accessoires et des services (photographies, repas, bals
…) pour cérémonies (mariages, naissances …). Elle envisage d’étendre son réseau dans la
région Centre, et étudie auparavant le nombre trimestriel de mariages pour évaluer le marché à
venir.
1er trim. 2e trim. 3e trim. 4e trim.
1982 1357 3818 4814 2255
1983 1342 3672 4634 2086
1984 1315 3765 4220 1745
Travail à faire :
1. Représenter graphiquement cette série chronologique et déterminer sa saisonnalité ;
2. En utilisant le modèle empirique additif :
a. Calculer la Tendance ;
b. Calculer les coefficients saisonniers ;
c. Calculer l’aléa ;
d. Déterminer la série Corrigée des Variations Saisonnières.

Exercice 51 (D’après sujet d’examen)


On dispose des ventes trimestrielles des 4 dernières années d'un magasin de vêtements :
Années Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
2003 3200 3250 3640 3100
2004 3150 3350 3100 3250
2005 3250 3450 3500 3250
2006 3150 3450 3350 3250
Travail à faire :
1. Représenter graphiquement cette série chronologique et déterminer sa saisonnalité ;
2. En utilisant le modèle empirique additif :
a. Calculer les coefficients saisonniers ;
b. Déterminer la série ajustée ;
c. Déterminer la série Corrigée des Variations Saisonnières.

Exercice 52 (D’après sujet d’examen)


Soit 3 biens dont il faut calculer l’indice des prix agrégé :
Blé Mais Sucre
Dates prix Quantité prix quantité prix quantité
2009 15 50 5 40 2 20
2010 20 55 8 35 3 25
2011 25 58 10 30 4 28
Travail à faire :

MOHAMMED QMICHCHOU 90
STATISTIQUE DESCRIPTIVE 2015

1. Calculez l’indice des prix de Laspeyres en 2010 base 100 en 2009. Interprétez.
2. A prix constant (base 2009), quelle est l’augmentation des quantités entre 2009 et 2010 ?
Quel indice connu avez-vous calculé ?
3. Calculez l’indic²e des quantités de Paasche en 2010 base 100 en 2010. Interprétez.
4. A quantités constantes (base 2010), quelle est l’augmentation du prix des biens entre
2009 et 2010 ? Quel indice connu avez-vous calculé ?

Exercice 53 (D’après sujet d’examen)


Le tableau suivant recense les prix moyens des chambres d’hôtels en 2009 et 2010, selon leur
catégorie et le nombre de nuitées annuelles,
Catégorie Prix 2009 Prix 2010 Nuitées en 2009 Nuitées en 2010
0 & 1étoile 70 80 1678 2000
2 étoiles 120 130 4500 5000
3 étoiles 320 350 4980 5400
4 étoiles & luxe 560 750 3200 3800
Travail à faire :
1. Calculez l’indice des prix de Laspeyres en 2010 base 100 en 2009, Interprétez.
2. A prix constant (base 2009), quelle est l’augmentation des nuitées entre 2009 et 2010 ?
Quel indice connu avez-vous calculé ?
3. Calculez l’indice des quantités de Paasche en 2010 base 100 en 2010, Interprétez.
4. A nuitées constantes (base 2010), quelle est l’augmentation du prix des chambres entre
2009 et 2010 ? Quel indice connu avez-vous calculé ?

MOHAMMED QMICHCHOU 91
STATISTIQUE DESCRIPTIVE 2015

SUJETS D’EXAMENS
Année : 2012-2013
Licence fondamentale : SEG
Semestre : II
Session : Normale
Date : Mardi 28/05/2013
Matière : Statistique descriptive
Durée : 2 Heures
Professeur : QMICHCHOU Mohammed

Très important : consignes d’examen


 Prendre, sans arrondi, 4 chiffres après la virgule pour les calculs intermédiaires et 2
chiffres après la virgule pour les résultats ;
 Tous les calculs justificatifs doivent figurer sur la copie ;
 Pour tout calcul, suivre la démarche suivante : rappel de la formule, application numérique,
résultats et commentaire ;
 2 points seront accordés en fonction de l’organisation, la lisibilité et la propreté de la copie.
Nous disposons de la série suivante donnant l’évolution trimestrielle, sur la période 2011-2012,
du nombre de nouveaux clients et du chiffre d’affaires d’une entreprise commercialisant des
solutions de sécurité informatique.
Trimestre Nouveaux clients Chiffre d'affaires
1 120 230000
2 340 428000
3 290 370000
4 80 190000
5 135 260000
6 360 540000
7 320 400000
8 110 210000
Travail à faire :
1. Existe-t-il une corrélation entre le nombre de nouveaux clients et le chiffre d’affaires ?
justifier votre réponse. (2 Pts)
2. Calculer le coefficient de détermination R2 et conclure s’il est possible d’estimer la
variable chiffre d’affaire à partir du nombre de nouveaux clients. (2 Pts)
3. Donner l’expression de l’équation de la droite de régression par la méthode des
moindres carrés après en avoir calculé les paramètres « a » et « b ». (2 Pts)
4. Quel sera le chiffre d’affaires de cette entreprise si le nombre de ses nouveaux clients
était de 300 ? (2 Pts)
5. Montrer que la variable chiffre d’affaire a une composante saisonnière ? (2 Pts)
6. Quels types de graphiques est-il possible d’utiliser pour représenter cette chronique ? (2
Pts)
7. Quels modèles peuvent être utilisés pour décomposer une chronique ? Comment choisir
un modèle ? (2 Pts)
8. Selon quel modèle faut-il décomposer de cette chronique ? justifier votre choix. (2 Pts)
9. Faire tous les calculs nécessaires en vue de déterminer le chiffre d’affaires prévisio nne l
pour les 2 premiers trimestres de l’année 2013. (2 Pts)

MOHAMMED QMICHCHOU 92
STATISTIQUE DESCRIPTIVE 2015

Année : 2012-2013
Licence fondamentale : SEG
Semestre : II
Session : Rattrapage
Date : Vendredi 21/06/2013
Matière : Statistique descriptive
Durée : 1h30mn
Professeur : QMICHCHOU Mohammed

Très important : consignes d’examen


 Prendre, sans arrondi, 4 chiffres après la virgule pour les calculs intermédiaires et 2
chiffres après la virgule pour les résultats ;
 Tous les calculs justificatifs doivent figurer sur la copie.

Nous disposons des 2 tableaux suivants donnant les prix et les quantités à la vente de 4 produits
observés à 3 dates différentes :
Tableau 1: Prix Tableau 2: Quantités

T0 T1 T2 T0 T1 T2
P1 120 125 135 P1 230 210 200
P2 80 90 70 P2 170 180 190
P3 15 12 18 P3 500 500 500
P4 35 40 42 P4 340 320 250
Travail à faire :
Rappeler la signification et l’utilité des indices statistiques. (2 Pts)
Donner les formules de calcul des paramètres statistiques suivants : (2 Pts)
Paramètre Formule
Variation absolue
Taux de croissance (en
%)
Taux de croissance
moyen
Indice élémentaire
Présenter, dans un tableau unique, la distribution des prix et quantités des 4 produits en T1.
Qu’appelle-t-on cette distribution ? (2 Pts)
Déduire la distribution des valeurs des 4 produits en T1. (2 Pts)
Calculer et interpréter, dans le tableau suivant, les indices de LASPEYRES, PAASCHE et
FISHER des prix et des quantités. (12 Pts)
Application
Indice Formule Résultat Commentaire
numérique
𝐿(𝑃)T1⁄
T0
𝑃(𝑃)T1⁄
T0
𝐹(𝑃)T1⁄
T0
𝐿(𝑄)T2⁄
T1
𝑃(𝑄)T2⁄
T1
𝐹(𝑄)T2⁄
T1

MOHAMMED QMICHCHOU 93
STATISTIQUE DESCRIPTIVE 2015

Année : 2013-2014
Licence fondamentale : SEG
Semestre : II
Session : Normale
Date : Mardi 28/05/2013
Matière : Statistique descriptive
Durée : 2 Heures
Professeurs : QMICHCHOU M., EL HARAOUI I.

Exercice 1 (4 Points) :
Donnez la signification des concepts de statistique descriptive suivants :
Concept Signification
Population
Caractère
Modalités
Effectif
Exercice 2 (4 Points) :
1. Donnez les catégories de variables et spécifiez les types de chacune. (2 PTS)
2. Donnez quatre exemples de domaines d’application de la statistique descriptive. (2
PTS).
Exercice 3 (12 Points) :
Répartition du CA des entreprises dans une zone franche X
CA en million de Dhs Effectif (ni)
[5 - 10[ 55
[10 - 15[ 110
[15 - 35[ 185
[35 -50[ 54
[50 - 80[ 47
Total 451

Source : Centre d’investissement A


1) Calculez la moyenne et le mode. (2PTS)
2) Calculez la médiane et le premier Quartile (Q 1 ) et donnez leur interprétation. (2 PTS)
3) Calculez la variance. (2 PTS)
4) Calculez l’écart type et le coefficient de variation (CV). (2 PTS)
5) Calculez l’indice de Gini et interprétez- le. (2 PTS)
6) Supposant que dans une zone franche Y, l’écart-type est de 19 millions de $ et la moye
nne est de 54,29 de millions $. Que peut-on déduire sur la dispersion des deux échantil
lons ? (2 PTS).

MOHAMMED QMICHCHOU 94
STATISTIQUE DESCRIPTIVE 2015

Année : 2013-2014
Licence fondamentale : SEG
Semestre : II
Session : Rattrapage
Date : Mardi 28/05/2013
Matière : Statistique descriptive
Durée : 1h30mn
Professeurs : QMICHCHOU M., EL HARAOUI I.

Exercice 1 (14 Points) :


Nous disposons de la répartition du Chiffre d’Affaires trimestriel d’une entreprise en milliers
de Dirhams et son évolution pendant quatre ans :

Année 1e r trimestre 2ème trimestre 3ème trimestre 4ème trimestre


2010 58 55 54 57
2011 64 60 60 63
2012 70 67 65 69
2013 76 73 72 75

Source : département finance et comptabilité


1) Quel est le modèle de décomposition de cette série chronologique ? Justifiez votre choix.
2) Déterminez la tendance en utilisant la méthode des Moindres Carrés en estimant « a » et
« b » dans l’équation de régression.
3) Calculez la corrélation entre les deux variables et donnez son interprétation.
4) Déduisez le coefficient de détermination et interprétez-le.
5) Déterminez la série Corrigée des Variations Saisonnières CVS.
6) Déterminez la série ajustée.
7) Estimez la prévision du Chiffre d’Affaires du 3ème trimestre de l’année 2016.
Exercice 2 (6 Points) :
Nous disposons de la répartition des prix et des quantités consommées pour quatre produits
comme illustrée dans le tableau ci-dessous :

2012 2013
Année/Produit
P2012 Q2012 P2013 Q2013
A 18 10 25 6
B 15 6 19 4
C 12 4 13 3
D 7 2 9 2

Source : Département marketing


1) Calculez les Indices des prix et des quantités de Laspeyres.
2) Calculez les Indices des prix et des quantités de Paasche.
3) Calculez les Indices des prix et des quantités de Fisher et comparez-les avec les indices de
Laspeyres et de Paasche.

MOHAMMED QMICHCHOU 95
STATISTIQUE DESCRIPTIVE 2015

BIBLIOGRAPHIE

 Marie-Hélène de Sède-Marceau, « Introduction à la statistique descriptive »,


2011, CTU-Master AGPS.
 Bernard Goldfarb et Catherine Pardoux, « Introduction à la méthode statistique :
Manuel et exercices corrigés », 6 e édition, Dunod, 2011.
 Didier Müller, « statistiques », 2012, www.nymphomath.ch

WEBOGRAPHIE

 www.er.uqam.ca/nobel/r30574/PSY1300
 www.apprendre-en-ligne.net/MADIMU2/STATI/COMPLET.PDF
 www.nymphomath.ch
 www.ebsi.umontreal.ca
 http://tice.inpl-nancy.fr/modules/unit-stat/
 www.hcp.ma
 www.insee.fr

MOHAMMED QMICHCHOU 96
STATISTIQUE DESCRIPTIVE 2015

GLOSSAIRE DE LA STATISTIQUE DESCRIPTIVE

Amplitude d'une classe (ou d'un intervalle) : C'est la longueur de l'intervalle.

Boîte à moustaches (boxplot) : Graphique résumant l'information fournie par l'étendue, ainsi
que par les trois quartiles et les intervalles qui les séparent.

Caractère qualitatif : Une variable statistique est qualitative si ses valeurs, ou modalités,
s'expriment de façon littérale ou par un codage sur lequel les opérations arithmétiques telles que
moyenne, somme, ..., n'ont pas de sens.

Caractère quantitatif : Une variable statistique est quantitative si ses valeurs sont des nombres
sur lesquels des opérations arithmétiques telles que somme, moyenne, ... ont un sens.

Caractère statistique (ou variables statistiques) : C'est ce qui est observé ou mesuré sur les
individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative.

Centiles : Les centiles C1, C2, ..., C99 divisent une série statistique en 100 parties d'effectifs égaux.

Classe modale : C'est la classe correspondant au maximum de l'histogramme, dans le cas d'une
distribution continue unimodale.

Classes : Intervalles de valeurs d'une variable continue, l'ensemble des classes formant une
partition de l'ensemble des valeurs possibles de la variable. Par exemple, si tous les salaires des
employés d'une entreprise se situent entre 750 et moins de 3 000 MAD, on peut construire (par
exemple) les classes : [750 - 900 [, [900 - 1 500 [, [1 500 - 2 250 [, [2 250 - 3 000 [, Chaque valeur
observée de la variable doit appartenir à une classe et une seule.

Coefficient de variation : Ecart-type divisé par la moyenne arithmétique. Cette mesure relative de
dispersion s'exprime généralement en %.

Déciles : Quantiles d'ordre 1/10, 2/10, ..., 9/10 ; ces 9 quantiles partitionnent la série statistique
ordonnée en 10 groupes contenant chacun (environ) 10% des observations.

Diagramme circulaire (ou à secteurs circulaires, ou en camembert) : Diagramme permettant


de représenter la distribution d'une variable qualitative : les modalités sont représentées par des
portions de disque proportionnelles à leur effectif, ou à leur fréquence.

Diagramme en barres (ou en tuyaux d'orgue) : Diagramme représentant la distribution d'une


variable qualitative : les modalités sont placées en abscisse, formant des bases de rectangles égales
et équidistantes, et les effectifs (ou fréquences) en ordonnée, suivant une échelle arithmétique.

Diagramme en bâtons : Diagramme représentant la distribution d'une variable quantitative


discrète : les valeurs sont placées en abscisse, les effectifs (ou fréquences) en ordonnée, au moyen
de segments verticaux.

Diagramme en boîte (ou boîte à moustaches) : Il s'agit d'un diagramme permettant de


positionner les quartiles Q1 , Q2 , Q3 , au moyen de rectangles de largeur arbitraire, prolongés par
des "moustaches" de part et d'autre, de longueur au plus égale à une fois et demie Q3 - Q1

MOHAMMED QMICHCHOU 97
STATISTIQUE DESCRIPTIVE 2015

Dispersion : Un paramètre statistique est dit de dispersion s'il s'agit d'un nombre clé résumant la
plus ou moins grande disparité des observations, leur plus ou moins grande variabilité de part et
d'autre de la tendance centrale : étendue, écart-type sont des paramètres de dispersion.

Distribution (ou répartition) des individus selon une ou deux variables : Tableau (croisé s'il
y a deux variables) des valeurs d’une (ou deux) variables avec les effectifs correspondants.

Distribution conditionnelle : La distribution conditionnelle d'une variable Y, pour X fixé, (X égal


à xi , modalité ou valeur, ou X appartenant à une classe donnée) est la distribution statistique des
valeurs de Y, en se limitant aux individus pour lesquels X est égal à xi (ou appartient à une classe
donnée).

Distribution groupée (D.G.1) : Une distribution groupée se construit à partir d'une série
statistique en regroupant les observations de la série dans un certain nombre de classes et en
associant à chaque classe son effectif, c'est-à-dire le nombre d'observations de la série qu'elle
contient. Distribution observée (D.O.1) : Une distribution observée se construit à partir d'une série
statistique en faisant la liste des valeurs distinctes qui apparaissent dans la série statistique et en
associant à chaque valeur distincte son effectif, c'est-à-dire le nombre de fois que la valeur apparaît
dans la série.

Distribution marginale : Distribution d'une variable statistique, obtenue dans la marge d'un
tableau de contingence, en ajoutant les effectifs, ligne par ligne, ou colonne par colonne.

Distribution : Ensemble des valeurs, modalités ou classes d'une variable statistique, et des effectifs
ou fréquences associées.

Données brutes (Données statistiques brutes) : Ensemble de mesures ou d'observations


concernant l'état ou l'évolution d'un phénomène. Ce sont les valeurs prises par une ou plusieurs
variables sur un certain nombre d'individus.

Données statistiques : Séries de mesures, d'observations, d'une ou plusieurs variables statistiques


sur un ensemble d'individus.

Ecart interdécile : Longueur de l'intervalle interdécile ; différence entre le 9e et le 1er décile.

Ecart interquartile : Longueur de l'intervalle interquartile ; différence entre le 3e et le 1er quartile.

Ecart médian absolu : Moyenne des valeurs absolues des différences entre les observations et
leur médiane.

Ecart moyen absolu : Moyenne des valeurs absolues des différences entre les observations et leur
moyenne arithmétique.

Ecart-type (standard deviation) : Racine carrée de la variance.

Effectif total : C'est le nombre d'observations, d'une série statistique brute, nombre d'individus de
la population étudiée.

Effectif : Nombre d’individus, d’une population ou d’une partie quelconque de cette population.

MOHAMMED QMICHCHOU 98
STATISTIQUE DESCRIPTIVE 2015

Etendue : Différence entre la plus grande et la plus petite des observations d'une série statistique.
C'est un paramètre de dispersion.

Fréquence (ou proportion) : Rapport d’un effectif particulier d’individus à la taille de la


population.

Histogramme : Graphique permettant de représenter une distribution continue regroupée en


classes : rectangles juxtaposés dont les bases sont les classes, et les surfaces sont proportionnelles
aux effectifs (ou fréquences) associés.

Individu (ou unités statistiques) : Les individus sont les éléments de la population statistique
étudiée. Pour chaque individu, on dispose d'une ou plusieurs observations.

Intervalle interdécile : Intervalle dont les bornes sont le 1er et le 9 e décile.

Intervalle interquartile : Intervalle dont les bornes sont le 1er et le 3 e quartile.

Médiane : Valeur typique qui se situe au milieu des observations rangées par ordre croissant ; il
s'agit du quantile d'ordre 1/2.

Mesure de dispersion : Valeur quantifiant globalement l'importance des écarts entre les
observations ou encore leur dispersion autour d'une valeur centrale.

Mesure de forme : Valeur quantifiant une certaine caractéristique de forme (asymétrie,


aplatissement) d'un diagramme en bâtons ou d'un histogramme.

Mesure de position : Valeur typique quantifiant une certaine caractéristique de localisation


(position) des observations sur l'échelle de mesure.

Mesure de tendance centrale : Valeur "centrale" parmi les observations.

Modalité : Les modalités d'une variable sont les différentes valeurs que peut prendre celle-ci.

Mode : Valeur ou modalité observée à laquelle est associé l'effectif le plus élevé.

Moyenne (arithmétique) : La moyenne (arithmétique) de n observations est la somme de ces


observations divisée par le nombre n d'observations.

Moyenne pondérée : Moyenne calculée en attribuant un poids différent à chaque observation de


la série statistique.

Moyenne tronquée : Moyenne calculée après avoir éliminé de la série statistique la plus petite et
la plus grande observations.

Paramètres statistiques : Ce sont quelques nombres permettant de résumer numériquement les


traits principaux d'une distribution statistique.

Percentiles : Quantiles d'ordre 1/100, 2/100, ..., 99/100 ; ces 99 quantiles partitionnent la série
statistique ordonnée en 100 groupes contenant chacun (environ) 1% des observations.

MOHAMMED QMICHCHOU 99
STATISTIQUE DESCRIPTIVE 2015

Population statistique : Une population statistique est l'ensemble sur lequel on effectue des
observations.

Quantile : Le quantile d'ordre p (0<p<1) est une valeur partitionnant la série statistique ordonnée
en deux groupes, le premier contenant les (environ) np plus petites observations, le second
contenant les (environ) n(1-p) plus grandes observations.

Quartiles : Quantiles d'ordre 1/4, 1/2 et 3/4 ; ces 3 quantiles partitionnent la série statistique
ordonnée en 4 groupes contenant chacun (environ) 25% des observations.

Recensement : Recueil des valeurs de la totalité des individus de la population. Les valeurs
recueillies sont les données.

Série statistique (ou distribution observée) : Ensemble des modalités, valeurs, ou classes d'une
variable, avec les effectifs observés correspondants.

Série statistique : Une série statistique est obtenue par l'observation d'une variable
chez n individus (ou éléments, unités...) ; elle correspond à la liste des valeurs ou modalités prises
par la variable chez chacun des n individus.

Sondage, n-échantillon, base de sondage, taux de sondage : Un sondage est le recueil des
valeurs d’une partie (l’échantillon) d’effectif n (d’où l’expression n-échantillon) de la population
(dite base de sondage ). Le taux de sondage est le rapport n/N.

Statistique (ou paramètre statistique) : Tout nombre, calculé à propos d’une population, et qui
contribue à décrire un aspect de cette population, est une statistique. Fréquences, mé dianes,
quartiles, déciles, moyennes, variances, etc. sont des statistiques.

Statistique descriptive bivariée : La Statistique descriptive bivariée consiste en la description de


deux variables mesurées simultanément sur les mêmes individus. Elle permet de mettre en évidence
le type de lien existant éventuellement entre ces variables.

Statistique descriptive univariée : La Statistique descriptive univariée consiste en la description


de chacun des caractères statistiques, un par un, et non des liens éventuels existant entre eux.

Statistique descriptive : Branche des mathématiques appliquées basée sur l'observation


d'événements expérimentaux à partir desquels on cherche à établir des hypothèses qui permettront
de prédire des événements dans des situations analogues.

Statistique inférentielle : Partie de la statistique qui, contrairement à la statistique descriptive, ne


se contente pas de décrire des observations, mais extrapole les constatations faites à un ensemble
plus vaste, permet de tester des hypothèses sur cet ensemble, et de prendre des décisions le
concernant.

Tendance centrale : Un paramètre statistique est dit de tendance centrale s'il s'agit d'un nombre
clé autour duquel les observations sont réparties : mode, médiane, moyenne sont des paramètres
de tendance centrale.

Unimodale : Une distribution est unimodale si elle présente un maximum marqué, correspondant
à une valeur appelée mode.

MOHAMMED QMICHCHOU 100


STATISTIQUE DESCRIPTIVE 2015

Unité statistique (ou individu(s)) : Les individus sont les éléments de la population statistique
étudiée.

Valeur typique : Valeur quantifiant une certaine caractéristique (de position, de dispersion ou de
forme) d'une série statistique ou d'une distribution observée (D.O.1 ou D.G.1).

Valeur : Nombre attribué à une grandeur ou à une variable mathématique.

Variable (ou caractère) statistique, valeurs : Une variable est une information dont on recueille
(ou observe ou mesure) la valeur sur chaque individu. On parle de variable parce que la valeur de
l’information n’est pas la même d’un individu à l’autre. C’est à partir des valeurs observées que le
statisticien construit ses classements d’individus.

Variable continue : C'est une variable quantitative pouvant prendre par nature une infinité de
valeurs, généralement tout un intervalle réel.

Variable d’intérêt, variable explicative : Une variable est dite explicative si elle influence une
autre variable, dite d’intérêt c’est-à-dire qui fait l’objet de l’étude statistique. Une variable explicative
peut servir à stratifier la population.

Variable dichotomique : C'est une variable qualitative qui ne peut prendre que 2 modalités : OUI
ou NON ; masculin ou féminin ; bon ou mauvais, etc ...

Variable discrète : C'est une variable quantitative pouvant prendre par nature un nombre fini (ou
dénombrable) de valeurs.

Variable qualitative (ou caractère qualitatif) : Une variable statistique est qualitative si ses
valeurs, ou modalités, s'expriment de façon littérale ou par un codage sur lequel les opérations
arithmétiques telles que moyenne, somme, ..., n'ont pas de sens.

Variable qualitative nominale : C'est une variable qualitative dont les modalités ne sont pas
ordonnées.

Variable qualitative ordinale : C'est une variable qualitative dont les modalités sont naturellement
ordonnées selon un ordre total : on peut dire que selon un certain sens la modalité A est moins
forte que la B, qui est moins forte que la C, etc...

Variable quantitative (ou caractère quantitatif) : Une variable statistique est quantitative si ses
valeurs sont des nombres sur lesquels des opérations arithmétiques telles que somme, moyenne, ...
ont un sens.

Variable statistique (ou caractère statistique) : C'est ce qui est observé ou mesuré sur les
individus d'une population statistique. Il peut s'agir d'une variable qualitative ou quantitative.

Variance corrigée : Somme des carrés des différences entre les observations et leur moyenne
arithmétique, divisée par n-1 (au lieu d'être divisée par n, le nombre d'observations, comme pour
la variance « classique »).

Variance : Moyenne des carrés des différences entre les observations et leur moyenne
arithmétique.

MOHAMMED QMICHCHOU 101

Vous aimerez peut-être aussi