Vous êtes sur la page 1sur 109

FSJES S ALÉ UM 5 R ABAT

DÉPAR TEMENT DE SCIENCES ÉCONOMIQUES ET DE GESTION

F ILIÈRE DE LA LICENCE DES ÉTUDES FONDAMENTALES

S CIENCES ÉCONOMIQUES DE GESTION


G ROUPES C & D
G ROUPE M ANAGEMENT

ÉLÉMENTS DE COURS

STATISTIQUE DESCRIPTIVE

** SEMESTRE ¶ **

@ P R . S OUSSI N OUFAIL O UTMANE

Sep 2019
Objectifs du module

Ce module se propose de fournir aux étudiants l’essentiel des connaissances qui leur
permettront de mieux comprendre les concepts et les outils de la statistique descrip-
tive. Le cours proposé est un document d’initiation dont l’objectif principal est l’assi-
milation des différentes techniques de base de la statistique ainsi que l’interprétation
des résultats qui en découlent.

Ce document s’adresse essentiellement aux étudiants du premier semestre de la li-


cence des études fondamentales. Le contenu est accessible sans formation scienti-
fique particulière, par exemple à des bacheliers littéraires ou de formation écono-
mique, pour cela les fondements mathématiques des théories exposées ne sont pas
développés. Nous avons pensé que ce support est destiné surtout à des utilisateurs
de l’outil statistique et non pas à des théoriciens.

Ce support correspond à un cursus particulier, mais il aborde les questions de base


qui constituent le socle de la plupart des programmes de statistiques qui s’adressent
à des non-mathématiciens.

La présentation de ce cours est faite de façon synthétique afin d’illustrer l’ensemble


des connaissances et techniques que devrait l’étudiant maîtrisé en sciences écono-
miques et de gestion. Le cours se compose des chapitres suivants :

1. Notions de base de la statistique descriptive


2. Distribution statistique à un seul caractère
3. Distribution statistique à deux caractères (distribution groupée, contingence)
4. Distribution statistique à deux caractères (distribution non groupée, corréla-
tion)
5. Séries chronologiques
6. Indices

i
Table des matières

1 Notions de base de la statistique descriptive 1


1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Bref historique de la statistique . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2.1 Domaine d’application de la statistique descriptive . . . . 2
1.1.2.2 Statistique descriptive et statistique mathématique . . . . 3
1.1.2.3 Apport de la statistique à l’économie et la gestion . . . . . 3
1.2 Vocabulaires statistiques et traitement des données . . . . . . . . . . . . 3
1.2.1 Terminologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Critère de classification des variables . . . . . . . . . . . . . . . . . 4
1.2.3 Modes de regroupement des unités statistiques . . . . . . . . . . . 5

2 Distribution statistique à un seul caractère 8


2.1 Tableaux statistiques et présentations graphiques . . . . . . . . . . . . . 8
2.1.1 Présentation et forme générales des tableaux . . . . . . . . . . . . 8
2.1.1.1 Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.1.2 Formes du tableau statistique . . . . . . . . . . . . . . . . 10
2.1.2 Représentations graphiques des données . . . . . . . . . . . . . . . 13
2.1.3 Cas d’une variable qualitative : . . . . . . . . . . . . . . . . . . . . . 14
2.1.3.1 Tuyaux d’orgue . . . . . . . . . . . . . . . . . . . . . . . . . 14
o
2.1.3.2 Secteurs à 360 . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.4 Cas d’un caractère quantitatif . . . . . . . . . . . . . . . . . . . . . 15
2.1.4.1 Série isolée . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.1.4.2 Série groupée . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2 Caractéristiques de tendance centrale (Paramètres de position) . . . . . . 21
2.2.1 Mode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.1.2 Détermination du mode . . . . . . . . . . . . . . . . . . . . 21
2.2.2 Médiane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.2.2 Détermination de la médiane . . . . . . . . . . . . . . . . . 23
2.2.3 Moyennes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3.1 Moyenne arithmétique (x) . . . . . . . . . . . . . . . . . . . 25
2.2.3.2 Moyenne géométrique G . . . . . . . . . . . . . . . . . . . . 26
2.2.3.3 Moyenne harmonique (H) . . . . . . . . . . . . . . . . . . . 28
2.2.3.4 Moyenne quadratique (Q) . . . . . . . . . . . . . . . . . . . 29

ii
Table des matières

2.2.4 Quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.1 Intervalle de variation (étendue) . . . . . . . . . . . . . . . . . . . . 32
2.3.2 Intervalles inter-quantiles . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Boîte à moustache . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.4 Variance, écart-type et coefficient de variation . . . . . . . . . . . . 35
2.3.4.1 Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.4.2 Propriètés de la variance . . . . . . . . . . . . . . . . . . . 36
2.3.4.3 Ecart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.4.4 Coefficient de variation . . . . . . . . . . . . . . . . . . . . 37
2.4 Paramètres de forme et d’aplatissement . . . . . . . . . . . . . . . . . . . 38
2.4.1 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.2 Coefficient d’asymétrie de Fisher (skewness) . . . . . . . . . . . . . 38
2.4.3 Paramétre d’aplatissement (kurtosis) . . . . . . . . . . . . . . . . . 39
2.5 Paramètres de concentration . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5.1 Détermination algébrique de la concentration . . . . . . . . . . . . 41
2.5.1.1 Médiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5.1.2 Mesure de la concentration . . . . . . . . . . . . . . . . . . 42
2.5.2 Détermination graphique de la concentration . . . . . . . . . . . . 43
2.5.2.1 Courbe de Lorenz . . . . . . . . . . . . . . . . . . . . . . . 43

3 Distribution statistique à deux caractères (avec observations groupées) 45


3.1 Tableaux de contingence . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.2 Construction du tableau de contingence . . . . . . . . . . . . . . . 45
3.1.2.1 En effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.2.2 En fréquences . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 Distributions marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2.2 Paramètres des distributions marginales . . . . . . . . . . . . . . . 47
3.2.2.1 Moyennes marginales . . . . . . . . . . . . . . . . . . . . . 47
3.2.2.2 Variances marginales . . . . . . . . . . . . . . . . . . . . . 48
3.2.2.3 Écarts types des distributions marginales . . . . . . . . . 49
3.3 Distributions conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.2 Paramètres des distributions conditionnelles . . . . . . . . . . . . 51
3.3.2.1 Moyennes conditionnelles . . . . . . . . . . . . . . . . . . . 51
3.3.2.2 Variances conditionnelles . . . . . . . . . . . . . . . . . . . 52
3.3.2.3 Écarts types des distributions conditionnelles . . . . . . . 52

4 Distribution statistique à deux caractères (avec observations non groupées) 54


4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

iii
Table des matières

4.2 Analyse de la régression linéaire . . . . . . . . . . . . . . . . . . . . . . . . 54


4.2.1 Nuage des points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2.2 Ajustement à une fonction linéaire affine . . . . . . . . . . . . . . . 55
4.2.3 Méthode des moindres carrés . . . . . . . . . . . . . . . . . . . . . 56
4.3 Analyse de la corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3.1 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3.2 Coefficient de corrélation linéaire . . . . . . . . . . . . . . . . . . . 59

5 Distribution statistique à deux caractères (Analyse des séries chronologiques) 60


5.1 Définition et présentation des composantes d’une chronique . . . . . . . 60
5.1.1 Objectif et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.1.2 Analyse graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.1.3 Composantes de la série chronologique . . . . . . . . . . . . . . . . 61
5.1.3.1 Présentation des composantes et schémas d’une chronique 61
5.1.3.2 Étude des composantes de la série temporelle . . . . . . . 62
5.2 Estimation et élimination de la tendance et de la saisonnalité . . . . . . 62
5.2.1 Cas où la tendance prend la forme d’une droite . . . . . . . . . . . 62
5.2.2 Cas où la tendance prend la forme d’une courbe (Moyenne mobile) 66

6 Indices 69
6.1 Présentation et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.1.1 Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.1.2 Définition d’un indice . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.2 Indices élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.2.2 Propriétés des indices élémentaires . . . . . . . . . . . . . . . . . . 71
6.2.2.1 Circularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.2.2.2 Transitivité . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.2.2.3 Réversibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3 Indices synthétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.2 Logique de la construction des indices composites . . . . . . . . . 73
6.3.3 Indice de Laspeyres . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.3.3.1 Laspeyres des prix . . . . . . . . . . . . . . . . . . . . . . . 74
6.3.3.2 Laspeyres des quantités . . . . . . . . . . . . . . . . . . . . 75
6.3.4 Indice de Paasche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3.4.1 Paasche des prix . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3.4.2 Paasche des quantités . . . . . . . . . . . . . . . . . . . . . 76
6.3.4.3 Comparaison des indices de Laspeyres et de Paasche . . 76
6.3.5 Indice de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3.5.1 Fischer des prix . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3.5.2 Fischer des quantités . . . . . . . . . . . . . . . . . . . . . 77

iv
Table des matières

7 Travaux Dirigés 78
7.1 Série du TD N°1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7.2 Série du TD N°2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.3 Série du TD N°3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.4 Série du TD N°4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.5 Série du TD N°5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.6 Série du TD N°6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

8 Receuil des examens 92

9 REFERENCES BIBLIOGRAPHIQUES 103

v
1 Notions de base de la statistique
descriptive

1.1 Introduction

1.1.1 Bref historique de la statistique

Bien que le nom de statistique soit relativement récent – on attribue en général l’ori-
gine du nom au 18e siècle de l’allemand Staatskunde – cette activité semble exister
dès la naissance des premières structures sociales. D’ailleurs, les premiers textes
écrits retrouvés étaient des recensements du bétail, des informations sur son cours
et des contrats divers. On a ainsi une trace de recensements en Chine au 23e siècle
av. J.-C. ou en Égypte au 18e siècle av. J.-C. Ce système de recueil de données se
poursuit jusqu’au 17e siècle.
Ce n’est qu’au 18e siècle que l’on voit apparaître le rôle prévisionnel des statistiques
avec la construction des premières tables de mortalité.

1.1.2 Introduction

La statistique est une méthode scientifique qui désigne l’ensemble des méthodes ma-
thématiques relatives à la collecte, à l’organisation, à la présentation, à l’utilisation, au
résumer et à l’analyse de données numériques (d’une enquête, d’une étude ou d’une
expérience). Aussi bien, ces opérations permettent de tirer des conclusions logiques
et de prendre des décisions dans les situations d’incertitude qu’on rencontre dans le
domaine économique, dans celui des affaires ou dans d’autres sciences sociales.

Définition de la statistique descriptive


— La statistique est un ensemble de méthodes permettant de décrire et d’analy-
ser, quantitativement, des phénomènes contenant des éléments nombreux, de
même nature, susceptibles d’être dénombrés et classés (Bernard Py, 2009).
— C’est une méthode d’analyse numérique des ensembles comportant un grand
nombre d’éléments. (B. Grais, 2000)
— La statistique a pour objet l’étude, à l’aide de traitements mathématiques, de
nombreux faits correspondant à l’observation d’un phénomène, dans le but de
rendre compte de la réalité, d’essayer de l’expliquer et d’aider à la prise de
décision. (J. Hubler, 1996).

1
1 Notions de base de la statistique descriptive

En résumé, la statistique (est une science) désigne l’ensemble des méthodes scien-
tifiques qui permettent d’analyser quantitativement un ensemble d’informations
cohérent.

1.1.2.1 Domaine d’application de la statistique descriptive

Donnons quelques exemples d’utilisation de la statistique dans divers domaines.


— Sciences économiques et sociales, et en économétrie : études des comportements
micro et macroéconomique, prévisions économétriques, analyse de la consom-
mation des ménages, études de marché.
— Marketing : le sondage d’opinion devient un outil pour la décision ou l’investis-
sement.
— Assurance et finance : fixation des primes d’assurance et franchises, études
quantitatives de marchés, gestion de portefeuille, évaluation d’actifs financiers,
— Démographie : le recensement permet de faire une photographie à un instant
donné d’une population et permettra par la suite des sondages dans des échan-
tillons représentatifs.
— Biologie, médecine : essais thérapeutiques, épidémiologie, dynamique des po-
pulations.
— Sciences de la terre : prévisions météorologiques, exploration pétrolière.
— Sciences humaines : enquêtes d’opinion, sondages, études de populations, études
sociales.
— Sciences de l’ingénieur : contrôle de qualité, statistique des procédés, sûreté de
fonctionnement, maîtrise des risques industriels, évaluation des performances
des systèmes complexes.
— Sciences de l’information et de la communication : traitement des images et des
signaux, reconnaissance des formes et de la parole, analyse exploratoire des
grandes bases de données, analyse des réseaux de communication.

Attention :
1. Il ne faut pas confondre la statistique qui est la science qui vient d’être définie
et une statistique qui est un ensemble de données chiffrées sur un sujet précis.
2. Les premières statistiques correctement élaborées ont été celles des recense-
ments démographiques. Ainsi, le vocabulaire statistique est essentiellement ce-
lui de la démographie.
3. Les ensembles étudiés sont appelés population. Les éléments de la population
sont appelés individus ou unités statistiques.
4. La population peut être étudiée selon un ou plusieurs caractères.

2
1 Notions de base de la statistique descriptive

1.1.2.2 Statistique descriptive et statistique mathématique

On distingue entre la STATISTIQUE DESCRIPTIVE et la STATISTIQUE INDUCTIVE. La pre-


mière résume, récapitule, analyse un ensemble de données. La seconde conclut sur
le tout après examen d’une partie. Le tout est alors appelé population et une partie
est appelée un échantillon. La différence entre les deux se considère si les données
ne sont plus considérées comme une information complète. En effet, pour induire des
informations sur la population inconnue il faut introduire la notion de loi (théorie) de
probabilité.

La statistique, avec ces deux branches, est à la base de toute recherche scientifique.
En effet, l’instrument statistique est indispensable pour le chercheur en économie
et en gestion afin d’effectuer ces recherches et ces calculs économiques, et ce pour
dégager les lois économiques et pour en faire des prévisions temporelles.
Statistique descriptive Statistique mathématique
(inférentielle)
Décrire numériquement un ensemble : Utiliser des données d’un sous-ensemble
Collecter, traiter et présenter les résultats (ex. un sondage) pour en induire les
d’un ensemble d’informations. caractéristiques de l’ensemble global
(moyenne, proportion, variance, etc.)

1.1.2.3 Apport de la statistique à l’économie et la gestion

— Elle permet de mettre en évidence l’existence d’interdépendance entre différents


phénomènes économiques.
— Elle permet de tester la validité d’une hypothèse théorique.
— La statistique permet aux entrepreneurs de mieux contrôler la gestion de leurs
entreprises.
— Elle permet également au pouvoir public de mieux définir ses politiques écono-
miques, fiscales, monétaires et d’emploi.

1.2 Vocabulaires statistiques et traitement des données

1.2.1 Terminologie

— On appelle POPULATION l’ensemble de tous les individus concernés par une


étude statistique.
— On appelle ÉCHANTILLON toute partie, ou sous-ensemble de la population.
— On appelle INDIVIDU / UNITÉ STATISTIQUE chaque élément de la population.
— La TAILLE représente le nombre d’individus d’un échantillon ou d’une popu-
lation. Elle est notée n dans le cas d’un échantillon et N dans le cas d’une
population.
— Le CARACTÈRE est l’aspect particulier que l’on désire étudier.

3
1 Notions de base de la statistique descriptive

— On appelle MODALITÉS les différentes possibilités que peut présenter un carac-


tère.
— Si on regarde ou l’on mesure la présence de ce caractère, on appelle alors ce
caractère une VARIABLE STATISTIQUE.

Illustration

Exemple
— Si l’on veut étudier l’âge des étudiants de la faculté des sciences juridiques éco-
nomiques et sociales de salé, la population considérée est celle des étudiants.
— Pour établir une étude sur l’âge des étudiants de la faculté, on peut prélever au
hasard un certain nombre d’étudiants - un échantillon- (par exemple, les ins-
crits en S1 à la filière d’économie et de gestion) parmi tous les autres étudiants
de la faculté.
— Les unités statistiques sont repérées par les noms et prénoms des étudiants.
— Le critère étudié de cette population est l’âge des étudiants.
— On peut imaginer plusieurs critères à étudier comme le sexe, le poids, la taille,
la filière d’attache, les matières choisies.
— Les modalités du caractère « âge des étudiants » peuvent être : 17, 18, 19, 20 et
21.
— Le caractère « sexe » peut être présenté en deux modalités : masculin et féminin.

1.2.2 Critère de classification des variables

Parmi ces caractères, l’on distingue entre :


1. Le caractère qualitatif : lorsque ses modalités ne s’expriment pas par un nombre
et l’on distingue entre :
a) Les modalités qui sont susceptibles d’être classées et hiérarchisées sont ap-
pelées modalités ordinales
b) Les modalités nominales d’un caractère qualitatif sont par contre celles qui
ne peuvent pas être classées ou hiérarchisées.
2. Le caractère quantitatif : lorsque ses modalités sont numériques et l’on dis-
tingue entre :
a) Le caractère quantitatif discret : L’ensemble des valeurs que peut prendre le
caractère est fini ou dénombrable. Le plus souvent, ces valeurs sont entières.
b) Le caractère quantitatif continu : Le caractère peut prendre théoriquement
n’importe quelle valeur dans un intervalle donné de nombres réels.

4
1 Notions de base de la statistique descriptive

Exemple
— Si l’on reprend notre exemple qui porte sur la population des étudiants de la
faculté des sciences juridiques économiques et sociales de Salé, et parmi tous
les critères quand l’on peut imaginer, certains sont quantitatifs comme l’âge, le
poids, la taille, nombre de frères et de sœurs, nombre de modules validés, etc.
— Cela nous permet d’effectuer des calculs numériques sur ces variables : poids
moyen, taille maximale, taille minimale, etc.
— Aussi on distingue entre une variable discrète comme nombre de frères et sœurs,
nombre de modules validés. Les valeurs ainsi observées sont des valeurs iso-
lées. Et entre une variable continue comme l’âge, le poids, la taille dont les
valeurs sont continues dans le temps.
— D’autres sont qualitatifs, c’est le sexe par exemple dans ce cas il n’y pas moyen
de calculer le sexe moyen, car cette notion n’a pas de sens et ne peut pas être
calculée. Aussi on distingue parmi ces variables qualitatives celles qui sont ordi-
nales telles qu’une prestation excellente est meilleure qu’une prestation bonne,
((a) nulle, (b) médiocre, (c) moyenne, (d) assez bonne, (e) très bonne, (f) excellente)
etc. et celles qui sont nominales par exemple si l’on demande aux étudiants ce
qu’évoque pour eux la présence à un cours. Plus précisément, ils doivent cocher
une des cases suivantes : ((a) inévitable, (b) volontaire, (c) pas la peine).

1.2.3 Modes de regroupement des unités statistiques

Série statistique et tableau statistique


— Est l’ensemble des différentes données associées à un certain nombre d’indivi-
dus / unités statistiques. Appelée aussi distribution statistique.
— Il est naturel de distinguer entre deux sortes de distributions dont la présenta-
tion et le calcul des paramètres diffèrent selon la nature de la série observée.
On appelle :

5
1 Notions de base de la statistique descriptive

— Série de données dont les valeurs non groupée sont quantitatives discrètes,
c’est-à-dire, dont les valeurs sont isolées dans le temps.
— Distribution groupée dont les valeurs sont présentées sous forme de moda-
lités quantitatives continues dans un tableau appelé tableau statistique.

Exemple : La série suivante résulte d’une courte enquête auprès de quelques étu-
diants (n = 13) de la faculté pour connaître leurs âges : (quel est votre âge ?)

1 2 3 4 5 6 7 8 9 10 11 12 13

Age 18 21 19 19 17 22 27 18 18 17 20 20 23

— Ce sont des valeurs isolées dans le temps.


— Cette même distribution peut être présentée sous forme d’un tableau statistique
groupé ou continu selon par exemple trois modalités :

Modalités Effectifs

Entre 16 et 18 2

Entre 18 et 21 7

Plus de 21 4

6
1 Notions de base de la statistique descriptive

Résumé
1. La statistique descriptive est un ensemble de méthodes permettant de décrire
les unités statistiques qui composent une population
2. La statistique mathématique s’appuie sur la statistique descriptive, ainsi que
sur les probabilités pour formuler des lois à partir de l’observation d’échan-
tillons.
3. L’économétrie est l’application de la statistique (descriptive et mathématique) à
la mesure et à l’étude chiffrée des grandeurs économiques.
4. En statistique, la population désigne un ensemble d’unités statistiques. Les
unités statistiques sont les entités abstraites qui représentent des personnes,
des populations d’animaux ou des objets.
5. On parle d’échantillon d’une population statistique pour désigner le prélève-
ment, au hasard ou selon une méthode qui permet d’assurer la représentativité
par rapport à la population totale, d’un petit nombre d’unités statistiques au
sein de la population.
6. Par ailleurs, il est fréquent aussi que l’on divise une population en sous-ensembles
au moyen de certains critères (ou dimensions ou encore caractéristiques).
7. On distingue deux sortes de critères : les critères quantitatifs et les critères
qualitatifs. Les critères quantitatifs sont les critères qui sont représentés par
des nombres et à condition que les opérations arithmétiques effectuées sur ces
nombres aient un sens. C’est la raison pour laquelle on les appelle aussi parfois
des variables.
8. Les critères qualitatifs sont tous les critères qui ne sont pas représentés de
façon numérique. Pour les distinguer des variables, on les appelle des «carac-
tères». Les caractères prennent des modalités.
9. Les unités statistiques d’une population peuvent être représentées sous forme
d’une série simple ou regroupées. Lorsqu’elles sont regroupées, on les appelle
des distributions continues.

7
2 Distribution statistique à un seul caractère

2.1 Tableaux statistiques et présentations graphiques

Définition
— Un tableau statistique est une représentation chiffrée d’un caractère ou plu-
sieurs caractères (variables), chacun est caractérisé par une ou plusieurs mo-
dalités (valeurs).
— C’est un moyen souvent indispensable, en tout cas très utile, de classification
et de présentation des unités d’une population statistique.
— Un tableau doit fournir des renseignements clairs, précis, facilement compré-
hensibles. En général, on doit respecter quatre règles primordiales de présenta-
tion : le titre, les intitulés des lignes et des colonnes, l’unité utilisée et la source
des données.

2.1.1 Présentation et forme générales des tableaux

2.1.1.1 Présentation

Avant même d’être présentées sous forme de tableau, les données sont parfois pré-
sentées sous forme de séries brutes ou de vecteurs. Cette présentation est utile pour
certains calculs, mais on utilise bien plus fréquemment les tableaux pour présenter
les caractéristiques des unités d’une population statistique.

Cas des observations isolées : Le tableau brut se présente sous la forme suivante :

Individus Variable
1 x1
2 x2
... ...
n xn

Remarque : Il se peut que la variable en question peut-être continue comme l’âge


par exemple. Ce qui est important c’est la manière dont les observations ont été pré-
levées et non la nature de la variable elle-même.

8
2 Distribution statistique à un seul caractère

Cas des observations groupées : Lorsque le nombre d’individus observé étant en gé-
néral important, le tableau précédant ne permet pas d’analyser l’information obtenue.

Modalités Effectif
m1 n1
m2 n2
... ...
mk nn

Il est donc nécessaire de créer un tableau plus synthétique où les observations iden-
tiques (possédant la même modalité) ont été regroupées. Ce tableau est appelé : le
tableau statistique pour les observations groupées.

Application : Nous étudions une population des étudiants (nouvellement inscrits


en S1 ) de la FSJES Salé, selon le caractère modalité « filière d’origine », les modalités
retenues sont « filière de Sciences économiques et de gestion » et « filière de droit arabe
» et filière de droit français ». Leurs effectifs respectifs sont : 5000, 7000, 800.

Travail à faire : présenter cette série dans un tableau statistique.

Exemple illustratif : (la taille des étudiants) On dispose d’un échantillon de 20 ré-
ponses d’étudiants à la question « quelle est votre taille ?». Bien qu’il s’agisse d’une va-
riable quantitative continue, les données sont présentées par taille et non par groupe
de tailles. On a donc le tableau de la série brute (observée individuellement) ou distri-
bution non groupée :

n° 1 2 3 4 5 6 7 8 9 10

Taille 158 177 181 190 163 158 165 164 166 169

n° 11 12 13 14 15 16 17 18 19 20

Taille 173 175 174 180 164 166 172 163 188 150

Par ailleurs, le tableau ci-dessous représente les données par groupe de tailles (dis-
tribution groupée) :

Modalités de X Effectif ni
[150, 160[ 3
[160, 170[ 8
[170, 180[ 5
[180, 190] 4
Total 20

9
2 Distribution statistique à un seul caractère

2.1.1.2 Formes du tableau statistique

La forme générale d’un tableau à une seule dimension est la suivante :

Modalités Effectif
m1 n1
Chaque modalité peut correspondre à zéro m2 n2
une ou plusieurs unités statistiques ... ...
(individus) constituant l’échantillon mk nn
concerné

Définition d’une classe et d’une amplitude On appelle classe un groupement de va-


leurs du caractère selon des intervalles qui peuvent être égaux ou inégaux. Pour
chaque classe, on peut définir :
— Une limite inférieure LimInf
— Une limite supérieure : LimSup
— Un intervalle de classe (étendue de la classe)

a = amplitude = LimSup − LimInf (2.1)

— Un centre de classe
Limsup + LimInf
Cci = (2.2)
2

Remarque
— Il peut avoir des cas où la dernière classe n’a pas d’étendue. Il convient gé-
néralement de prendre comme intrevalle de cette classe, celui de la classe qui
prècède.
— Il arrive aussi que la première classe considérée n’ait pas d’étendue. Dans ce
cas on prendra celle de la classe qui suit.

Exemple illustratif : (la taille des étudiants) La deuxième classe (ou encore la deuxième
modalité) représente les données par groupe de tailles est égale à :[160, 170[. Signifie
que cette classe comptabilise les étudiants qui ont une taille entre160 et170 cm, en
incluant ceux qui ont une taille égale à160 cm et excluant ceux qui ont une taille égale
à170 cm.
L’amplitude de la deuxième classe[160, 170[ est égale à :

a = amplitude = LimSup − LimInf = 170 − 160 = 10cm

Le centre de la classe[160, 170[ est :

Limsup + LimInf 170 + 160


Cc2 = = = 165cm
2 2

10
2 Distribution statistique à un seul caractère

Définition de « effectif = effectif absolu » On appelle effectif / effectif absolu de la


modalité mi , le nombre ni d’individus ayant appartenir à cette modalité. En effet,
l’effectif d’une modalité correspond au nombre de fois que cette modalité apparaît
dans la série statistique.

Modalités Effectif Fréquence Effectif cumulé


n1
m1 n1 n n1
n2
m2 n2 n n1 +n1

nk
mk nk n n

Cette dernière présentation s’avère souvent peu commode et l’on préfère de ce fait
la présentation sous forme de pourcentages et/ou de cumuls. (voir les définitions
ci-dessous)

Exemple : Le tableau suivnant présente les 35 unités statistiques sous forme d’un
regroupement par trois classes. Les chiffres sont cependant « bruts », car aucun calcul
de pourcentages et/ou de cumuls n’a été effectué sur les 35 unités statistiques.

Modalités de X Effectif ni
[10, 20[ 13
[20, 40[ 12
[40, 50[ 10
Total 35

Définition de « fréquence = effectif relatif » La fréquence représente la proportion


(pourcentage) des individus présentant la même valeur ou la même modalité d’un
caractère dans la population totale.

Si ni représente l’effectif de la valeur ou de la modalité i, et n représente la population


totale, la fréquence relative, notée fi , se calcule comme suit :

ni
fi = n ∀i = 1, 2, 3, ..k (2.3)

La fréquence d’une modalité est le rapport de l’effectif absolu d’une classe (de moda-
lités ou de valeurs) à l’effectif total. Il est préféré d’exprimer cette fréquence en % :

pi = fi × 100 (2.4)

Exemple illustratif : (la taille des étudiants) Partant du tableau des tailles des étu-
diants regroupées, ajoutons une colonne dans laquelle les chiffres bruts sont présen-
tés en proportion.

11
2 Distribution statistique à un seul caractère

Modalité de X Effectif ni Effectif relatif fi


3
[150, 160[ 3 20 = 0, 15
8
[160, 170[ 8 20 = 0, 40
5
[170, 180[ 5 20 = 0, 25
4
[180, 190] 4 20 = 0, 20
20
Total 20 20 = 1

Définition de « effectif cumulé et fréquence cumulée »


— Comme les classes sont souvent ordonnées de manière croissante, il peut être
intéressant de savoir quel effectif de la population se trouve dans la classe
considérée ou dans une classe inférieure.
— On obtient les effectifs (ou les fréquences) cumulés de deux manières : Nous
additionnons l’effectif (ou fréquence) d’une classe (valeur) déterminée
— Soit avec ceux des classes (valeurs) antérieures,
— Soit avec ceux des classes (valeurs) postérieures.
Dans le premier cas, on parlera de cumul ascendant ou croissant (%), dans le second
cas, de cumul descendant ou décroissant (&)
— L’effectif cumulé croissant (Ni %) d’une valeur d’un caractère est le nombre
d’unités statistiques ayant une valeur qui lui est inférieure ou égale.
— La fréquence cumulée croissant (Fi %)d’une valeur d’un caractère est la fré-
quence des unités statistiques ayant une valeur qui lui est inférieure ou égale.
— L’effectif cumulé décroissant (Ni &) d’une valeur d’un caractère est le nombre
d’unités statistiques ayant une valeur qui lui est supérieure ou égale.
— La fréquence cumulée décroissante (Fi &) d’une valeur d’un caractère est la
fréquence des unités statistiques ayant une valeur qui lui est supérieure ou
égale.
L’objet du calcul des effectifs cumulés et les fréquences cumulées croissant ou dé-
croissant est de déterminer « Quel effectif ou quelle fréquence de la population a une
valeur du caractère au plus égale ou au moins égale à ... ».

Exemple illustratif : (taille des étudiants)

Modalité de X Effectif ni Effectif relatif fi (Ni %) (Fi %) (Ni &) (Fi &)
3 3
[150, 160[ 3 20 = 0, 15 3 20 = 0, 15 20 1
8 11 3
[160, 170[ 8 20 = 0, 40 3+8 20 = 0, 55 20 − 3 1− 20 = 0, 85
5 16
[170, 180[ 5 20 = 0, 25 11 + 5 20 = 0, 80 9 0, 85 − 0, 40 = 0, 45
4 20
[180, 190] 4 20 = 0, 20 16 + 4 20 = 1 4 0, 45 − 0, 25 = 0, 2
20
Total 20 20 = 1 − − − −

16 4
N2 %= N2 % +n2 = 3 + 8 = 11 F4 %= F3 % +f4 = 20 +20 = 1
Calculs : 3 17
N3 &= N2 & −n2 = 17 + 8 = 9 F2 &= F1 & −f1 = 1 − 20 = 20 = 0, 85

12
2 Distribution statistique à un seul caractère

Interprétation du tableau :
— L’effectif cumulé croissant de la classe 2 : [160, 170[ est de 11, ce qui signifie qu’il
y a 11 étudiants qui ont « AU PLUS » une taille de 170 cm. (c’est à dire une taille
SRICTEMENT INFÉRIEURE à 170 cm) (ou encore, il y a 11 étudiants qui ont une
taille comprise entre[150, 170[)
— L’effectif cumulé décroissant de la classe 3 : [170, 180[ est de 9, ce qui signifie
qu’il y a 9 étudiants qui ont « AU MOINS » une taille de 170 cm. (c’est à dire une
taille SUPÉRIEURE OU ÉGALE à 170 cm) (ou encore, il y a 9 étudiants qui ont une
taille comprise entre[170, 190])
— La fréquence cumulée croissante de la classe [160, 170[ est de 0, 55, ce qui signifie
que 55% des étudiants ont « AU PLUS » une taille de 170 cm.
— La fréquence cumulée décroissante de la classe [170, 180[ est 0, 45, ce qui signifie
que 45% des étudiants ont « AU MOINS » une taille de 180 cm.

Remarque :
1. Le tableau est un outil statistique plus intéressant que le graphique. Néan-
moins, pour des études précises, le tableau est souvent nécessaire et même
parfois plus utile que le graphique.
2. Si l’on dispose d’un tableau, on peut faire un graphique. Inversement, si l’on
dispose seulement d’un graphique, on ne peut pas revenir au tableau initial (ou
très rarement). Le graphique est ainsi très utilisé par ceux qui veulent conser-
ver le monopole d’une base de données tout en présentant publiquement son
contenu.

2.1.2 Représentations graphiques des données

L’idée de représenter visuellement des nombres traduisant eux-mêmes des propriétés


quantitatives ou qualitatives de populations statistiques et les relations éventuelles
entre ces nombres et entre ces propriétés, est assez récente dans l’histoire de l’huma-
nité. En effet, c’est vers les années1750 − 1800 que l’idée de représenter visuellement
des données statistiques ou des séries temporelles est apparue, donc bien après l’in-
vention du tracé des fonctions mathématiques dans un repère de coordonnées carté-
siennes, jusque-là proposées sous forme de tableaux.

L’intérêt d’un graphique c’est de synthétiser des informations statistiques d’une ma-
nière imagée, c’est à dire globale. Il est parfois indispensable de recourir à la présen-
tation graphique des données.

Typologie des tableaux statistiques

13
2 Distribution statistique à un seul caractère

2.1.3 Cas d’une variable qualitative :

A chaque modalité i est associé un effectif absolu ni . De nombreuses représentations


graphiques plus ou moins informatives peuvent être utilisées. Cependant les 2 plus
classiques sont : les tuyaux d’orgue (ou diagramme en barre ou diagramme à bandes)
et les diagrammes à secteurs (ou camemberts).

2.1.3.1 Tuyaux d’orgue

Définition
— Les effectifs d’une variable qualitative peuvent être représentés soit par des
diagrammes en secteurs soit par des diagrammes en bandes.
— Le plus élémentaire est de porter les valeurs du caractère en abscisse et les
effectifs en ordonnée (ou l’inverse), on obtient alors un diagramme en tuyaux
d’orgue (ou diagramme à bandes).
— La longueur du tuyau est proportionnelle à l’effectif de la modalité.

Exemple : Effectifs des lauréats de FSJES Salé

Dernier diplôme obtenu Effectif 250

Pas de flèches

Droit privé 40 200

Droit public 110


Les effectifs des étudiants

150
Sciences Economiques 90 L'ordre dans lequel sont
présentés les Tyaux n'a
pas d'importance
Sciences de Gestion 200 100

Management 120
50
Total 560 Pas de
flèches

0
Droit privé Droit public Sciences Sciences de Management
2.1.3.2 Secteurs à 360o Economiques
Filières dispensées
Gestion

Définition Les diagrammes en secteurs (camemberts) sont utiles lorsque l’on veut
représenter la relation entre une partie et un tout. Ils permettent de visualiser des

14
2 Distribution statistique à un seul caractère

parts relatives, dans des surfaces ou secteurs de cercles, que l’on peut différencier
par des couleurs. On distingue les secteurs à 360o , et ceux à 180o ,.

Exemple : (Etat matrimonial de 20 personnes)

Etat civil ni fi Angle Divorcé


10%

Célibataire 9 0, 45 0, 45 × 360o = 162o Veuf


10%

Marié 7 0, 35 0, 35 × 360o = 126o


Célibataire

Veuf 2 0, 10 0, 1 × 360o = 36p 45%

Divorcé 2 0, 10 0, 1 × 360o = 36o


Total 20 360o Marié
35%

Remarque
1. Pour les secteurs à 180o , il suffit d’appliquer la formule suivante

Angleo = fi × 180o (2.5)

2. Pour les secteurs à 360o , il suffit d’appliquer la formule suivante

Angleo = fi × 360o (2.6)

Travail à faire individuellement La répartition des candidats convoqués pour partici-


per au Test d’Admissibilité à la Formation en Management (Licence d’Excellence) à
la faculté des sciences juridiques économiques et de gestion Salé, selon la série du
baccalauréat se présente comme suit :
Série du Bac Nombre de candidats
Sciences économiques 250
Sciences mathématiques 200
TAF : Représentez cette Sciences expérimentales 400
distribution en Tuyaux d’orgues T.G.A 50
et en Diagramme circulaire. T.G.C 100
Total 1000

2.1.4 Cas d’un caractère quantitatif

Définition
— Avant toute tentative de représentation, il y a lieu de distinguer entre variable
discrète et variable classée (regroupements en classes).
— Deux types de graphiques sont intéressants de représenter :

15
2 Distribution statistique à un seul caractère

— Les diagrammes différentiels qui mettent en évidence les différences d’effec-


tifs (ou de fréquences) entre les différentes modalités ou classes.
— Les diagrammes cumulatifs qui permettent de répondre aux questions du
style « combien d’individus ont pris une valeur inférieure (ou supérieure) à
‘’tant” ? ».

2.1.4.1 Série isolée

Diagramme différentiel : le diagramme en bâtons

Définition
— Les valeurs discrètes xi prises par les variables sont placées sur l’axe des abs-
cisses, et les effectifs (ou les fréquences) sur l’axe des ordonnées. La hauteur
du bâton est proportionnelle à l’effectif.
— Aussi les axes sont fléchés (différence avec les tuyaux d’orgue)

Exemple : (Etat matrimonial de 20 personnes) La répartition de 20 personnes selon


l’Etat matrimonial est présentée comme suite :

7
Nombre d’enfants Nombre de famille 6
6

0 6 5
5
Nombre de famille

1 4 4
4

2 5 3

2
3 2 2

1
4 1 1

Total 18 0
0 1 2 3 4
Nombre d'enfants

Remarques :

1. Ce diagramme en bâtons peut être représenté en termes de fréquence.


2. Pour tracer le polygone, on joint les points milieu du sommet des rectangles
adjacents par un segment de droite.
3. Le polygone est fermé aux deux bouts en le prolongeant sur l’axe horizontal.

16
2 Distribution statistique à un seul caractère

NOMBRE DE FAMILLE
5

0
0 1 2 3 4
NOMBRE D'ENFANTS

Diagrammes cumulatifs : croissants et décroissants

Définition
— Les ogives permettent de visualiser l’évolution des effectifs (fréquences) cumulés
croissants ou décroissants.
— Aussi les axes sont fléchés

100%

90% Ogives
80%

70%

60%

50%

40%

30%

20%

10%

0%
0 1 2 3 4

Remarques
1. Les deux courbes sont symétriques par rapport à un axe horizontal d’ordonnée
n 1
2 pour les effectifs, 2 pour les fréquences.
2. On utilise l’effectif (fréquence) cumulé croissant et décroissant pour répondre
aux ?
3. Respectivement : Quel est le nombre (%) d’individus dont la valeur du caractère
est inférieure ou égale à x ?
4. Quel est le nombre (%) d’individus dont la valeur du caractère est strictement
supérieure à x ?

17
2 Distribution statistique à un seul caractère

Exemple Représentez graphiquement la distribution des 50 étudiants en fonction


du nombre de personnes par ménage suivante :

Nombre de personnes par ménage xi Nombre d’étudiants ni


3 5
4 15
6 15
7 10
8 5
Total 50

Se souvenir :
1. Le treme (au plus x) équivalent à ( x) donc utiliser N (x) ou F (x) croissants
2. Le treme (plus que x) équivalent à (  x) donc utiliser N (x) ou F (x) décroissant
— Exemple : le treme (au plus 6) équivalent à (  6) donc on pourra lire la
fréquence cumulée croissante en 6, c-à-d F (6) = 0, 9

1
0,9
0,8
0,7
0,6
0,5 Fic
0,4 FiD
0,3
0,2
0,1
0
3 4 6 7 8

2.1.4.2 Série groupée

Diagramme différentiel : Histogramme

Définition C’est un ensemble de rectangles contigus, chaque rectangle est asso-


cié à chaque classe ayant une surface proportionnelle à l’effectif (fréquence) de cette
classe.

Il convient de distinguer entre : histogramme de fréquence et l’histogramme d’effectifs.

Attention
— Il y a lieu de regarder si les classes sont d’amplitudes égales ou inégales.

18
2 Distribution statistique à un seul caractère

— Le cas des classes d’amplitudes égales ne pose aucune difficulté car il suffit de
reporter en ordonnée l’effectif (la fréquence).
— Dans le cas d’amplitudes inégales on reporte en ordonnée la densité di (effectif
divisé par l’amplitude de la classe). Ou encore di (fréquence divisé par l’ampli-
tude de la classe).
— Donc il y a 4 types d’histogrammes à étudier

Exemple illustratif (la taille des étudiants)

9 Historgamme avec amplitudes égales


Modalité de X Effectif ni Effectif relatif fi 8
8

[150, 160[ 3 0, 15 7

6
[160, 170[ 8 0, 40 5
5

4
[170, 180[ 5 0, 25 4
3
3
[180, 190] 4 0, 20 2

Total 20 1 1

0
[150, 160[ [160, 170[ [170, 180[ [180, 190]

— Supposons que l’on regroupe nos données en classes d’amplitudes inégales,


Il faut dans ce cas effectuer une correction pour tenir compte des différences
d’amplitude. Comme suit :

Xi ni fi ai di Histogramme avec amplitudes inégales

0,15 0,04
[150, 160[ 3 0, 15 10 10 = 0, 015
0,4
[160, 170[ 8 0, 40 10 10 = 0, 04
0,45
[170, 190] 9 0, 45 20 20 = 0, 022 0,02

Total 20 1 − −

0
[150, 160[ [160, 170[ [170, 190[

Diagrammes cumulatifs : Fonctions de répartition

Définitions A la différence du cas discret, l’information contenue dans l’effectif


d’une classe est limitée au nombre d’individus qui ont une valeur supérieure ou égale
à la borne de gauche de la classe et inférieure (strictement) à la borne de gauche de
la classe suivante ; on ne connaît pas quelle est la valeur précise de chaque individu
de la classe.
Pour tracer toute la fonction, on fait l’hypothèse d’homogénéité :
— Dans chaque classe, les individus sont donc séparés l’un de l’autre par un écart
de valeur égal à l’amplitude de la classe divisée par le nombre d’individus.

19
2 Distribution statistique à un seul caractère

— Graphiquement, l’hypothèse d’équi-répartition situe les points de l’intervalle sur


les segments de droite joignant les points-bornes.

100%

90%

80%

70%

60%

50%

40%

30%

20%

10%

0%
0 1 2 3 4

Exemple illustratif (la taille des étudiants) On obtiendrait sur le même graphique
les deux fonctions de répartition croissante et décroissante.

1
0,9 FiC
0,8 FiD

0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
150 160 170 180 190

D’autres types de diagrammes


— Le pictogramme, dessin généralement en couleur, conçu par un infographiste,
qui essaie de traduire des données quantitatives, (informations d’ordre com-
mercial).
— Le cartogramme, pour localiser géographiquement des valeurs ou des modalités
relatives à une variable.
— Le diagramme de GANTT, qui est un outil de gestion de projets. Il sert à visua-
liser dans le temps les différentes étapes qui composent un projet.

D’autres types de graphes


— Parmi les 73 représentations graphiques de base proposées par le logiciel EX-
CEL on distinguera plus particulièrement les graphiques usuels suivants : gra-
phique en barres, horizontales ou verticales, simples, multiples ou tronçonnées,
les courbes, les aires délimitées par des courbes, les nuages de points et les
secteurs à 360 ou 180 degrés, concentriques ou non. La pyramide des âges, le
programme en spirale et le chronogramme sont des représentations graphiques
souvent rencontrées en statistique.

20
2 Distribution statistique à un seul caractère

2.2 Caractéristiques de tendance centrale (Paramètres de


position)

Définition
— Les caractéristiques de tendance centrale essayent de donner la valeur la plus
représentative d’un ensemble de valeurs numériques.
— Les paramètres statistiques ont pour but de résumer, à partir de quelques
nombres clés, l’essentiel de l’information relative à l’observation d’une variable
quantitative.
— On définira plusieurs sortes de paramètres :
— Certains, comme la moyenne, seront dits de tendance centrale car ils re-
présentent une valeur numérique autour de laquelle les observations sont
réparties.
— D’autres, par exemple, seront dits de dispersion car ils permettent de résu-
mer le plus ou moins grand étalement des observations de part et d’autre de
la tendance centrale.

2.2.1 Mode

2.2.1.1 Définition

— C’est la valeur la plus fréquente = La valeur dont la fréquence est la plus élevée.
— Le mode est noté :Mo

2.2.1.2 Détermination du mode

Cas des valeurs discrètes (isolées, non groupées)


1. On utilise la définition
2. Graphiquement, c’est la valeur du caractère correspondant au bâton le plus
haut.

Exemple : Soit la série : {8, 4, 4, 3, 4, 3, 8, 2, 5}.


La série pocède un seule mode, visiblement c’est la valeur qui se répéte Mo = 4. Dans
ce cas le chiffre 4 est répété 3 fois. par concéquent, l’effectif associé à ce mode est 3.

Cas des valeurs continues (classées, groupées)


1. On définit la classe modale comme la classe correspondant à la fréquence la
plus élevée ni .
2. Pour calculer le mode, il faut appliquer la formule suivante :

d1
Mo = xinf
i + ai × (2.7)
d1 + d2

21
2 Distribution statistique à un seul caractère

avec xinf
i est la borne inférieure de la classe modale
ai est l’amplitude de classe
d1 est la différence :
d1 = ni − ni−1 (2.8)

d2 est la différence :
d2 = ni − ni+1 (2.9)

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées)

n° 1 2 3 4 5 6 7 8 9 10

Taille 158 177 181 190 163 158 165 164 166 169

n° 11 12 13 14 15 16 17 18 19 20

Taille 173 175 174 180 164 166 172 163 188 150

Algébriquement
Dans ce cas nous avons une distribution avec 4 modes L’effectif associé à ces
modes est de 2.
Mo1 = 158, Mo2 = 163, Mo3 = 164 et Mo4 = 166
Remarque :
Il peut exister une distribution :
— uni-modale
— bimodale
— tri-modale . . ..
Graphiquement

2
ni

0
150 158 163 164 165 166 169 172 173 174 175 177 180 181 188 190

22
2 Distribution statistique à un seul caractère

Cas des valeurs continues (classées, groupées)

9
Xi ni fi Amplétude
8
[150, 160[ 3 0, 15
7
Classe modale [160, 170[ 8 0, 40 6
𝑑2
𝑑1
[170, 180[ 5 0, 25 5

4
[180, 190] 4 0, 20
3
Total 20 1
2
La classe modale
1

0
[150, 160[ [160, 170[ [170, 180[ [180, 190]
Calcul

d1 8−3
Mo = xinf
i + ai × = 160 + 10 × = 166, 25
d1 + d2 5 + (8 − 5)

2.2.2 Médiane

2.2.2.1 Définition

— Est l’observation placée au milieu d’une série classée par ordre croissant ou
décroissant.
— La médiane est notée Me .

2.2.2.2 Détermination de la médiane

Cas des valeurs discrètes (isolées, non groupées) Il faut suivre les étapes suivantes :
1. Classement croissant ou décroissant de la série : calcul d’une fonction cumu-
lée : c’est-à-dire Ni %, Ni &ou Fi %, Fi &
2. Chercher le rang : la valeur de la variable correspondant à une fonction cumulée
n
égale à 2 pour les effectifs cumulés Ni , et 0,5 pour les fréquences cumulés Fi .
Mais si :
n+1
a) n est impair, Me = 2 . Exemple : Soit la série suivante 75, 62, 57, 12, 18. la
médiane est égale au 3éme terme ( 5+1
2 = 3), donc Me = 57

b) n est pair, Me = moyenne de l’intervalle médian x2r ; xr+1


 
2 . Exemple : Soit la
série suivante : 12, 25, 32, 44, 52, 69. Intervalle Médian est [32; 44] ,On prend le
centre donc Me = 38

Cas des valeurs continues (classées, groupées) Il faut suivre les étapes suivantes :

Classement croissant ou décroissant de la série : calcul d’une fonction cumulée.


n
1. On repère le rang de la médiane Rang = 2

23
2 Distribution statistique à un seul caractère

2. On repère la classe de Me (trouver la classe ou appartient le iéme individu, pour


cela on classe les individus par ordre croissant, puis le calcul par interpolation
linéaire.

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées)


— Etape 1 : Tri croissant

Rang 1 2 3 4 5 6 7 8 9 10 11 12

Taille (tri %) 150 158 158 163 163 164 164 165 166 166 169 172

Rang 13 14 15 16 17 18 19 20

Taille (tri %) 173 174 175 177 180 181 188 190

— Etape 2 : La rechreche du l’observation qui correspond au rang représen-


tatif de50 % des observations. Dans notre cas n = 20 (pair), on obtient le
rang n2 ; n+1
 
2 qui correspond à l’intervalle médian {166; 169}
— Etape 3 : Détermination de la médiane par le calcul du centre de la classe :

166 + 169
Me = = 167, 5
2

Graphiquement

Fic
Car n est pair

0,5

0
150 158 163 164 165 166 169 172 173 174 175 177 180 181 188 190

Cas des valeurs continues (classées, groupées)


Xi ni fi Fi %
[150, 160[ 3 0, 15 0, 15
Classe médiane ⇒ [160, 170[ 8 0, 40 0, 55 ⇐Rang = 0, 5
[170, 180[ 5 0, 25 0, 80
[180, 190] 4 0, 20 1
Total 20 1 −

24
2 Distribution statistique à un seul caractère

— étape 1 : Tri des fréquences (classer les effetcifs retatifs par ordre croissant)
c.à.d. calcul de Fi %
— étape 2 : On détermine la classe médiane[160, 170[
— étape 3 : On applique la méthode de l’extrapolation linéaire pour déterminer la
Me

160 𝑀𝑒 170

0,15 0,5 0,55

On applique la formule :

Me − 160 0, 5 − 0, 15
= ⇐⇒ Me ≈ 168, 75
170 − 160 0, 55 − 0, 15

Graphiquement

FiC

0,5

0
150 160 170 180 190

2.2.3 Moyennes

2.2.3.1 Moyenne arithmétique (x)

Cas des valeurs discrètes (isolées, non groupées)

Définition
— Le mot « moyenne » a pour origine le latin «médius», mot signifiant «qui est au
milieu».
— La moyenne arithmétique d’une série ou moyenne arithmétique simple se cal-
cule par une formule qui est donnée par l’expression :
Pn
i=1 xi
x= (2.10)
n

25
2 Distribution statistique à un seul caractère

Avec n le nombre des unités statistiques i et xi est la variable statistique de iéme


individu

Cas des valeurs continues (classées, groupées)

Définition
— La moyenne arithmétique d’une distribution continue ou moyenne arithmétique
pondérée se calcule par une formule qui est donnée par l’expression :
Pk k
ni × xci X
x = i=1 = fi × xci (2.11)
n
i=1

Avec ni l’effectif absolu, fi l’effectif relatif, xci centre de la classe i, k nombre total des
classes.

Remarque x est la plus rencontrée dans les études économiques, dans le calcul
du : revenu moyen, chiffre d’affaires moyen, âge moyen, taille moyenne. . .

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées) On applique la formule (2.10) :

P20
i=1 xi x1 + x2 + ... + x20 158 + 177 + ... + 150
x= = =
n 20 20

x = 169, 8

Cas des valeurs continues (classées, groupées) On applique la formule (2.11) :

P4
i=1 ni × xci (n1 × xc1 ) + (n2 × xc2 ) + .. + (n4 × xc4 )
x= =
n n

(3 × 155) + (8 × 165) + (5 × 175) + (4 × 185)


x=
20

x = 170

2.2.3.2 Moyenne géométrique G

Cas des valeurs discrètes (isolées, non groupées)

26
2 Distribution statistique à un seul caractère

Définition
— Si xi sont les observations positives d’une variable quantitative, la moyenne
géométrique simple est égale
v à:
u n
uY √
G= t n
xi = n x1 × x2 × .... × xn (2.12)
i=1

Exemple Soit la série de chiffres {8, 5, 9, 13, 25}. La moyenne géométrique de cette
série est égale à :
v
u 5
uY √ √ √
5
5
G=t xi = 5 x1 × x2 × .... × xn = 5 8 × 5 × 9 × 13 × 25 = 11700
i=1

G ≈ 10, 32

Cas des valeurs continues (classées, groupées)

Définition Si (xi , ni ) sont les couples d’une distribution et les xi étant tous positives,
la moyenne géométrique pondérée est égale à :

v
u k q
uY
n
G= t xni i = n xn1 1 × xn2 2 × .... × xnk k (2.13)
i=1

— La moyenne géométrique est applicable à des mesures de grandeurs dont la


croissance est géométrique ou exponentielle.
— C’est un instrument permettant de calculer des taux moyens, notamment des
taux moyens annuels. Son utilisation n’a un sens que si les valeurs ont un
caractère multiplicatif.

Exemple Soit le tableau de la distribution classée suivant :

xi ni
25 10
8 16
4 25
12 20

— Pour calculer la moyenne géométrique pondérée, on peut passer par les loga-
rithmes népériens (ln) :
v
u 4
uY p
G = t xni i =
71 71
2510 × 816 × 425 × 1220
i=1

27
2 Distribution statistique à un seul caractère

1 149, 815
lnG = × (10 × ln25 + 16 × ln8 + 25 × ln4 + 20 × ln12) = ≈ 2, 1100704
71 71
donc
G = e2,11 ≈ 8, 2488

2.2.3.3 Moyenne harmonique (H)

Cas des valeurs discrètes (isolées, non groupées)

Définition
— Soit la série {x1 , x2 , .., xn }. La moyenne harmonique simple de cette série est
égale à :
n
H = Pn 1 (2.14)
i=1 xi

Exemple Soit la série de chiffres {8, 5, 9, 13, 25}. La moyenne harmonique de cette
série est égale à :

5 5 5
H = P5 1
= 1 1 1 1 1 =
i=1 xi 8 + 5 + +9 13 + 25
0, 553034

H ≈ 9, 04

Cas des valeurs continues (classées, groupées)

Définition
— Si (xi , ni ) sont les couples d’une distribution, la moyenne harmonique pondérée
est égale à :
n
H = Pk ni
(2.15)
i=1 xi

— Elle intervient lorsqu’on demande une moyenne de valeurs où ils existent des
liens de proportionnalité inverse, se présentant sous forme de quotient de deux
x
variables y (km/h, km/litre, dh/m²...).

Exemple Soit le tableau de la distribution classée suivant :

xi ni
25 10
8 16
4 25
12 20

28
2 Distribution statistique à un seul caractère

la moyenne harmonique pondérée est égale à :

71 71 71
H = P4 = 10 16 =
ni
i=1 xi 25 + 8 + 25
4 +
20
12
10, 1337

H = 6, 882

2.2.3.4 Moyenne quadratique (Q)

Cas des valeurs discrètes (isolées, non groupées)

Définition Soit la série {x1 , x2 , .., xn }. La moyenne quadratique simple de cette série
est égale à :

v
u n
u1 X
Q=t x2i (2.16)
n
i=1

Exemple Soit la série de chiffres {−4, −2, 0, 2, 4}. On calcule :x = 0

La moyenne quadratique de cette série est égale à :

v
u n r r
u1 X
2 (−4)2 + (−2)2 + 22 + 42 40
Q= t xi = =
5 5 5
i=1

Q = 2, 8284

Cas des valeurs continues (classées, groupées)

Définition
— Si (xi , ni ) sont les couples d’une distribution, la moyenne quadratique pondérée
est égale à : v
u k
u1 X
Q=t (ni × x2i ) (2.17)
n
i=1

— Une moyenne qui trouve des applications lorsque l’on a affaire à des phéno-
mènes présentant un caractère sinusoïdal avec alternance de valeurs positives
et de valeurs négatives. Elle est, de ce fait, très utilisée en électricité.

29
2 Distribution statistique à un seul caractère

Exemple Soit le tableau de la distribution classée suivant :

xi ni ni ×x2i
25 10 6250
8 16 1024
4 25 400
12 20 2880
Somme 71 10554

r
10554
Q= ≈ 12, 1921
71

2.2.4 Quantiles

Définitions
— Font partie des caractéristiques de position
— Il y a :
— 1 médiane Me qui sépare les observations en 2 groupes d’effectifs égaux
— 3 quartiles Q1 , Q2 , Q3 qui séparent les observations en 4 groupes d’effectifs
égaux.
— 9 déciles D1 , D2 , ..., D9 qui séparent les observations en 10 groupes d’effectifs
égaux.
— 99 centiles C1 , C2 , ..., C99 qui séparent les observations en 100 groupes d’ef-
fectifs égaux.
— La détermination de ces caractéristiques est identique à celle de la médiane.
— Les quartiles sont obtenus lorsque l’on a cumulé 25, 50, 75 % de la population
— Les déciles sont obtenus lorsque l’on a cumulé 10, 20, ...., 90 % de la population
— Les centiles sont obtenus lorsque l’on a cumulé 1, 2, ...., 99 % de la population

Remarque La notion de déciles et de centiles n’a de sens que s’il y a beaucoup


d’observations et donc essentiellement pour une variable classée.

Exemple illustratif (la taille des étudiants) : Les quartiles

Cas des valeurs discrètes (isolées, non groupées) La détermination des quartiles
Q1 , Q2 , Q3 est identique de celle de la Me
— Etape 1 : Tri croissant

Rang 1 2 3 4 5 6 7 8 9 10 11 12

Taille (tri %) 150 158 158 163 163 164 164 165 166 166 169 172

30
2 Distribution statistique à un seul caractère

Rang 13 14 15 16 17 18 19 20

Taille (tri %) 173 174 175 177 180 181 188 190

— Etape 2 : La rechreche des observations qui correspondent respectivements aux


rangs 25, 50 et 75
n 20
— C-à-d : pour Q1 il faut rechercher le rang 4 = 4 = 5. C’est la 5ème valeur de
la série (aprés ordre croissant). à partir de la lecture du tableau ci dessus
Q1 = 163. Celà veut dire qu’au moins un quart (25 %) des tailles des étudiants
sont  Q1 .
— Pour Q2 c’est la médiane (50 %). Donc Q2 = Me = 167, 5. Celà veut dire qu’au
moins la moitier (50 %) des tailles des étudiants sont  Q2 , (ou  Q2 ).
3n 3×20
— Pour Q3 il faut rechercher le rang 4 = 4 = 15. C’est la 15ème valeur de la
série (aprés ordre croissant). à partir de la lecture du tableau ci dessus Q3 =
175. Celà veut dire qu’au moins trois quart (75 %) des tailles des étudiants
sont  Q3 .

Cas des valeurs continues (classées, groupées) La détermination des quartiles


Q1 , Q2 , Q3 est identique de celle de la Me

Graphiquement

1
FiC

0,75

0,5

0,25

0 𝑸𝟐 = 𝑴𝒆
150 160 𝑸𝟏 170 𝑸𝟑 180 190

— Calcul de Q1 par interpolation linéaire :

160 𝑄2 170

0,15 0,25 0,55

Q1 − 160 0, 25 − 0, 15
=
170 − 160 0, 55 − 0, 15

31
2 Distribution statistique à un seul caractère

Q1 = 162, 5

— Calcul de Q3 par interpolation linéaire

𝑄3 180
170

0,55 0,75 0,80

Q3 − 160 0, 75 − 0, 55
=
170 − 160 0, 80 − 0, 55

Q3 = 178

2.3 Paramètres de dispersion

Définition
— La mesure des écarts des observations autours des coefficients de tendance
centrale se fait par l’intermédiaire de nombreux paramètres de dispersion :
— Minimum et maximum
— Intervalle de variation (étendue de la série)
— Intervalles inter quantiles
— Variance
— Écart type
— Coefficient de variation
— Écart moyen et la boite à moustache
— Les indicateurs de tendance centrale sont utiles pour caractériser une distribu-
tion statistique, ils restent insuffisants. Ils ne donnent aucune indication sur
la manière dont sont groupées ces informations.

2.3.1 Intervalle de variation (étendue)

Définitions
— Maximum d’une série statistique à caractère quantitatif : est la valeur maximale
que peut prendre le caractère. Noté : M ax(xi )
— Minimum d’une série statistique à caractère quantitatif : est la valeur minimale
que peut prendre le caractère. Noté : M in(xi )

32
2 Distribution statistique à un seul caractère

— L’intervalle de variation (IV ) ou l’étendue de la série est simplement une façon


de résumer le minimum et le maximum de la série en un seul chiffre.
IV = M ax(xi ) − M in(xi ) (2.18)

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées) M in(xi ) = 150 et M ax(xi ) = 190

IV = 150 − 190 = 40

Cas des valeurs continues (classées, groupées) M in(xi ) = 155 et M ax(xi ) = 185
avec xi = Centre de classe

IV = 155 − 185 = 30

2.3.2 Intervalles inter-quantiles

Définition (L’écart-interquartile)
— C’est la différence entre le troisième quartile et le premier quartile.
— L’intervalle-interquartile sert à apprécier la dispersion de la série.
— Les valeurs de l’intervalle entre Q1 et Q3 délimitent une plage représentant en-
viron 50 % des valeurs de la série autour de la médiane.

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées) Nous avons :Q1 = 163 et Q3 = 175.
Donc :

IIQ = 175 − 163 = 12

— 12cm représente l’écart des tailles de 50 % des étudiants autours de la taille


médiane.

33
2 Distribution statistique à un seul caractère

Cas des valeurs continues (classées, groupées) Nous avons :Q1 = 162, 5 et Q1 =
178. Donc :

IIQ = 178 − 162, 5 = 15, 5

2.3.3 Boîte à moustache

Définition La boîte à moustache « box plot », est un graphique qui résume la disper-
sion d’une série à partir de 5 valeurs : la valeur minimale M in(x) et la valeur maximale
M ax(x), l’intervalle interquartile (Q1 et Q3 ) et la médiane Me .

𝑄1 𝑀𝑒 𝑄1
𝑀𝑖𝑛(𝑥) 𝑀𝑖𝑛(𝑥)

Remarque

Distribution Étalée vers la gauche Symétrique Étalée vers la droite


Médiane est à gauche du est proche du est à droite du centre
centre de la boîte centre de la boîte de la boîte
Les Si la moustache de sont à peu près de Si la moustache de
moustaches gauche est plus la même longueur droite est plus longue
longue que la que la moustache de
moustache de droite gauche

— La boîte à moustache permet aussi de comparer des séries statistiques (distri-


butions).

Exemple illustratif (la taille des étudiants)


190 190

185

178
175
1er Quartile
Minimum
170 168,75
167,5 Médiane
Maximum
163 162,5 3eme Quartile

155

150
150

140
La taille (cas discret) La taille (cas continue)

34
2 Distribution statistique à un seul caractère

2.3.4 Variance, écart-type et coefficient de variation

2.3.4.1 Variance

Définition La variance est un indicateur de la dispersion d’une série par rapport à


sa moyenne.

Cas des valeurs discrètes (isolées, non groupées)


n
1X
var(x) = σx2 = (xi − x)2 (2.19)
n
i=1

n
1X 2
var(x) = xi − x2 (2.20)
n
i=1

Avec : n le nombre des unités statistiques i. Et xi variable statistique de iéme individu

Exemple illustratif (la taille des étudiants)


— Nous allons utiliser la formule (2.20) (en fonction des données)
n
1X 2 1
var(x) = xi − x2 = (1582 + 1772 + ... + 1502 ) − 169, 82
n 20
i=1

var(x) = 98, 16

Cas des valeurs continues (classées, groupées)

k
1X
var(x) = σx2 = ni × (xi − x)2 (2.21)
n
i=1

n
1X
var(x) = ni × x2i − x2 (2.22)
n
i=1

Avec : ni l’effectif absolu xi centre de la classe i. Et k nombre total des classes

Exemple illustratif (la taille des étudiants)


— Nous allons utiliser la deuxième formule (2.22) :
n
1X 1 
ni × x2i − x2 = 1552 × 3 + 1652 × 8 + 1752 × 5 + (1585 × 4) − 1702
   
var(x) =
n 20
i=1

var(x) = 95

35
2 Distribution statistique à un seul caractère

Remarque
— On voit donc sur cet exemple que plus la variance est grande, plus la série est
dispersée autour de la moyenne.
— Cas où la variance est égale à zéro, signifie que chaque terme quadratique de la
série est nul et donc la série est constante (xi = x).
— Une autre formule pour calculer la variance :

var(x) = x2 − x2 (2.23)

2.3.4.2 Propriètés de la variance

— Soit a un nombre réel :

var(x + a) = var(x) (2.24)

var(a × x) = a2 var(x) (2.25)

2.3.4.3 Ecart-type

Définition L’écart-type est égal à la racine carrée de la variance :

Cas des valeurs discrètes (isolées, non groupées)


v
u n
p u1 X
σx = (var(x) = t (xi − x)2 (2.26)
n
i=1

v
u n
p u1 X
σx = var(x) = t x2i − x2 (2.27)
n
i=1

Avec : n le nombre des unités statistiques i. Et xi variable statistique de iéme individu

Exemple illustratif (la taille des étudiants)


— La variance est égale à : var(x) = 98, 16 donc :
p p
σx = var(x) = 98, 16 = 9, 91

— La taille des étudiants s’écarte de 9, 96 cm par rapport à la moyenne.

Cas des valeurs continues (classées, groupées)


v
u k
p u1 X
σx = var(x) = t ni × (xi − x)2 (2.28)
n
i=1

36
2 Distribution statistique à un seul caractère

v
u n
u1 X
σx = t ni × x2i − x2 (2.29)
n
i=1

Avec : ni l’effectif absolu xi centre de la classe i. Et k nombre total des classes

Exemple illustratif (la taille des étudiants)


— La variance est égale à : var(x) = 95 donc :
p √
σx = var(x) = 95 = 9, 75

— La taille des étudiants s’écarte de 9, 75 cm par rapport à la moyenne.

De façon générale :
— Si σx est faible, cela signifie que les valeurs sont assez concentrées autour de
x.
— Si σx est élevé, cela veut dire au contraire que les valeurs sont plus dispersées
autour de x.

Limite de l’écart type :


— Il est exprimé dans l’unité de la variable dont il mesure la dispersion des va-
leurs.

2.3.4.4 Coefficient de variation

Définition
— D’où l’idée de calculer le coefficient de variation qui est égal à l’écart-type divisé
par la moyenne, c’est-à-dire :
σx
CV = (2.30)
x
— On l’utilise pour comparer des séries statistiques : par exemple comparer la
taille des étudiants de l’année universitaire 2016-2017 avec celle de 2015-2016.
on peut conclure que la distribution de la taille s’est réduite par exemple.

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées)

σx 9, 91
CV = = ⇒ CV = 0, 0583
x 169, 8

Cas des valeurs continues (classées, groupées)

σx 9, 75
CV = = ⇒ CV = 0, 0573
x 170

37
2 Distribution statistique à un seul caractère

2.4 Paramètres de forme et d’aplatissement

2.4.1 Moments

Définitions
1. On appelle moment simple (à l’origine) d’ordrer ∈ N le paramètre :

n
1X r
mr = xi (2.31)
n
i=1

2. On appelle moment centré d’ordrer ∈ N le paramètre :

n
1X
Mr = (xi − x)r (2.32)
n
i=1

3. Les moments généralisent la plupart des paramétres. On a en particulier :


— m1 = x
— M1 = 0
1 Pn 2
— m2 = n i=1 xi
n
1
− x)2 = var(xi )
P
— M2 = n i=1 (xi
— Nous verrons dans ce qui suit, que des moments d’ordres supérieurs (r =
3, 4) sont utilisés pour mesurer la symétrie et l’aplatissement.

2.4.2 Coefficient d’asymétrie de Fisher (skewness)

Définition
— Le coefficient d’asymétrie de Fisher est basé sur la détérmination préalable de
M3 : Le moment centré d’ordre trois qui est défini par :

n
1X
M3 = (xi − x)3 (2.33)
n
i=1

— Pour une distribution symétrique, M3 = 0


— Pour une distribution dissymétrique à gauche M3  0
— Pour une distribution dissymétrique à droite M3 ≺ 0
— On voit donc que le signe de M3 permet d’objectiver l’existence d’une asymétrie
de la distribution observée. Mais la valeur de M3 ne permet pas de quantifier
l’importance de l’asymétrie. Aussi L’interprétation de la valeur de M3 est délicate
puisque l’unité de mesure est cubique. la solution est donc de proposer un
coefficient qui a le même signe que M3 et sans unité de mesure. C’est ainsi que
Fisher a introduit le coefficient d’asymétrie qui porte son nom.
— Le coefficient de Fisher peut prendre des valeurs positives, négatives ou nulles.
L’asymétrie se mesure au moyen de la relation suivante :

M3
g1 = (2.34)
(σx )3

38
2 Distribution statistique à un seul caractère

— Il en résulte que puisque l’écart-type est toujours positif, son cube l’est
aussi ; ceci implique que g1 a bien le même signe que M3 .Ce coefficient
est bien un nombre sans unité (sans dimension).

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées) Considérons la distribution de


tailles (n = 20) ci-dessous, avec les tailles mesurées en centimètres :

158 177 181 190 163 158 165 164 166 169
173 175 174 180 164 166 172 163 188 150

x= 169, 8 cm
var(x) = 98, 16 cm2
σx = 9, 91 cm
M3 = 254 cm3
g1 = 0, 261 (asymétrie à gauche)

Cas des valeurs continues (classées, groupées) Considérons la distribution de


tailles (n = 20) ci-dessous, avec les tailles mesurées en centimètres :

xi ni ni xi (xi − x) ni (xi − x)2 ni (xi − x)3

[150, 160[ 3 465 −15 675 −10125

[160, 170[ 8 1320 −5 200 −1000

[170, 180[ 5 875 5 125 625

[180, 190] 4 740 15 900 13500

Total 20 3400 0 1900 3000

x= 170 cm
var(x) = 95 cm2
σx = 9, 75 cm
M3 = 150 cm3
g1 = 0, 162 (asymétrie à gauche)

2.4.3 Paramétre d’aplatissement (kurtosis)

On peut aussi caractériser l’aplatissement d’une distribution par le coefficient de


Pearson (β2 ) ou celui de Fisher (g2 ), tous deux basés sur le moment centré d’ordre
4 (M4 ).

39
2 Distribution statistique à un seul caractère

Définition
— Le coefficient d’aplatissement est basé sur la détérmination préalable de M4 :
Le moment centré d’ordre quatre qui est défini par :

n
1X
M4 = (xi − x)4 (2.35)
n
i=1

— L’aplatissement est mesuré par le coefficient d’aplatissement de Pearson


M4
β2 = (2.36)
(σx )4
— L’aplatissement est mesuré par le coefficient d’aplatissement de Fisher

M4
g2 = −3 (2.37)
(σx )4
— Une courbe mésokurtique si g2 ≈ 0
— Une courbe leptokurtique si g2  0. Elle est plus pointue et possède des
queues plus longues.
— Une courbe platykurtique si g2 ≺ 0. Elle est plus arrondie et possède des
queues plus courtes.

Exemple illustratif (la taille des étudiants)

Cas des valeurs discrètes (isolées, non groupées) A partir de la distribution de


tailles (n = 20) ci-dessus, les calculs donnent :
M4 = 25329, 64 cm4
g2 = −0, 37112 (Courbe platykurtique)

Cas des valeurs continues (classées, groupées) A partir de la distribution de tailles


(n = 20) ci-dessus, les calculs donnent :
M4 = 25329, 64 cm4
g2 = −0, 9917 (Courbe platykurtique)

2.5 Paramètres de concentration

Définition
— La concentration n’a de sens que pour des données positives et a des variables
ou des caractères dont l’addition a un sens : des patrimoines, des surfaces, des
chiffres d’affaires, etc. Des variables telles que l’âge, la taille ou le poids, n’a pas
nécessairement de signification.
— Il existe deux méthodes pour mesurer la concentration : par le calcul algébrique
ou par les méthodes graphiques. Avant de les étudier, il faut d’abord introduire
la notion de médiale.

40
2 Distribution statistique à un seul caractère

2.5.1 Détermination algébrique de la concentration

2.5.1.1 Médiale

— La médiale s’applique aux valeurs de la variable multipliées par leurs effectifs


respectifs ni xi . C’est la valeur du caractère qui partage l’effectif cumulé des ni xi
en deux parties égales.

Cas des valeurs discrètes (isolées, non groupées)


— La médiale est la plus petite valeur du caractère dont la masse relative cumu-
lée croissante est inférieure ou égale à 50 %.

Exemple illustratif (Salaire) Voici les rémunérations de dix-sept individus classés


par ordre croissant de salaire en dirham.

Salaire Cumul Salaire Cumul


A HMED 1200 1200 N OUFEL 1600 12380
K ARIM 1220 2420 M ERIEM 1800 14180
H AJAR 1250 3670 S OUKAINA 1900 16080
⇐ 17170
H AMID 1300 4970 S ARA 2150 18230
F ATIMA 1350 6320 A MINA 2310 20540
S OUAD 1450 7770 A DAM 2600 23140
I BRAHIM 1450 9220 T AHER 3000 26140
M OHAMED 1560 10780 Y OUSSEF 3400 29540
S AAD 4800 34340

Calcul de la médiale : Si l’on coupe la masse des salaires en deux, c’est-à-dire :

34340
= 17170
2

On constate que le salaire médial se trouve quant à elle entre S OUKAINA et S ARA (soit
environ 2250 dirhams, par interpolation).

1900 + 2150
= 2025
2

Signifie que 50 % de la masse salariale est versée aux salariés gagnants moins de 2025
dirhams.

Cas des valeurs continues (classées, groupées)

41
2 Distribution statistique à un seul caractère

Calcul de la médiale : On applique la formule suivante par interpolation linéaire :

 Pk 
ni xi
i=1
− Ni Xi
Ml = X inf + a  2  (2.38)
ni xi

X inf est la borne inférieur de la classe médiale. xi est le centre de la classe médiale.
Ni Xi est l’effectif cumulé de strictement inférieur a ni xi et a est l’amplitude de la classe
médiale.

Exemple illustratif (Salaire annuel)


Salaire annuel (en milliers de dh) Nombre d’ouvriers Centre xi ni xi Ni xi
[10; 15[ 9 12, 5 112, 5 112, 5
[15; 20[ 25 17, 5 437, 5 550
[20; 25[ 32 22, 5 720 1270 ⇐
[25; 30[ 16 27, 5 440 1710
P
82
P
Ni xi
— Etape 1 : Détermination de la classe médiale à partir du calcul du rang : 2 =
1710
2 = 855 donc la classe médiale est [20; 25[.
— Etape 2 : Interpolation
 Plinéaire 
k
i=1 ni xi
− N X
Ml = X inf + a  2 i i
 = 20 + 5 × 855 − 550 = 23, 46
ni xi 440

2.5.1.2 Mesure de la concentration

Définition ∆M sert à mesurer la différence entre Ml et Me :

∆M = Ml − Me (2.39)

— Si ∆M = 0 Cela veut dire que Ml = Me . Donc c’est une distribution égalitaire


avec un concentration nulle.
— Si ∆M 6= 0 Cela veut dire que Ml 6= Me . Donc il y a concentration On calcule le
rapport :
∆M Ml − Me
= (2.40)
IV M ax(xi ) − M in(xi )
∆M
— Si IV ≺ IV =⇒ La concentration est faible
∆M
— Si IV  IV =⇒ La concentration est faible

Exemple illustratif (Salaire annuel)

∆M = Ml − Me = 23, 46 − 21, 09 = 2, 37

42
2 Distribution statistique à un seul caractère

∆M Ml − M e 2, 37
= = = 0, 11 ≺ 20
IV M ax(xi ) − M in(xi ) 30 − 10

Donc la concentration est faible.

2.5.2 Détermination graphique de la concentration

2.5.2.1 Courbe de Lorenz

Définition C’est une courbe qui sert à représenter visuellement la façon dont se
répartit une masse (salariale, revenus, ect.) au sein d’une population pour faire des
comparaisons :
— La courbe de Lorenz permet de représenter graphiquement une dispersion.
— C’est un indicateur particulier parmi les indicateurs qui ont été développés pour
mesurer les inégalités
— Se faire une idée du caractère le plus ou moins égalitaire de la répartition de
cette masse au sein de la population Comparer ainsi de différentes populations
entre elles.
— Comparer la distribution d’une masse au sein d’une population en deux ou
plusieurs points du temps afin de savoir si l’inégalité augmente ou diminue.
— C’est la courbe obtenue en mettant en abscisses les fréquences cumulées en %,
et en ordonnées ni xi cumulés en %.

Mise en oeuvre

43
2 Distribution statistique à un seul caractère

— 1ère étape : classer les valeurs obtenues pour chaque individu en ordre crois-
sant.
— 2ème étape : calculer des déciles, c’est-à-dire les 9 valeurs qui séparent la po-
pulation en 10 classes égales.
— 3ème étape : tracer la courbe des répartitions.
— 4ème étape : tracer la bissectrice. La bissectrice représente la répartition égali-
taire : 20 % de la population détient 20 % des revenus, 60 % en détient 60 %
des revenus, etc.

En abscisse est porté le pourcentage cumulé croissant de la population.


En ordonnée est indiqué le pourcentage cumulé croissant de la donnée étudiée.
La courbe de Lorenz est située en dessous de cette diagonale de référence. Plus la
courbe est éloignée de la diagonale, plus la répartition des revenus est inégali-
taire.

44
3 Distribution statistique à deux caractères
(avec observations groupées)

3.1 Tableaux de contingence

3.1.1 Définition

— C’est une distribution ou l’observation s’effectue selon 2 caractères.

Exemple illustratif (la taille et le poids des étudiants)


— Soient les caractères statistiques : «la taille des étudiants» et «le poids des étu-
diants»
— Le tableau de contingence croise les modalités de deux variables X et Y relatives
à une même population.
— Les modalités d’une variable sont présentées en ligne (X) et les modalités de
l’autre variable (Y ) sont présentées en colonne

3.1.2 Construction du tableau de contingence

3.1.2.1 En effectifs

Soit le jeu de données suivant :

n° 1 2 3 4 5 6 7 8 9 10

Taille 158 177 181 190 163 158 165 164 166 169

Poids 55 80 72 77 53 58 74 64 72 74

n° 11 12 13 14 15 16 17 18 19 20

Taille 173 175 174 180 164 166 172 163 188 150

Poids 64 72 74 64 55 65 61 50 73 48

— Le tableau de contingence est :

45
3 Distribution statistique à deux caractères (avec observations groupées)

j=1 j=2 j=3


[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 1 2 0 3
i=2 [160, 170[ 2 3 3 8
i=3 [170, 180[ 0 2 3 5
i=4 [180, 190] 0 1 3 4
Total 3 8 9 20

— Ce sont des effectifs absolus notés nij


— Lecture

n11 = 1 n12 = 2 n31 = 0 n23 =?


n21 =? n22 =? n32 =? n.. =?
n42 =? n32 =? n43 =? N =?

3.1.2.2 En fréquences

j=1 j=2 j=3


[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 0, 05 0, 01 0 0, 15
i=2 [160, 170[ 0, 1 0, 15 0, 15 0, 4
i=3 [170, 180[ 0 0, 1 0, 15 0, 25
i=4 [180, 190] 0 0, 05 0, 15 0, 2
Total 0, 15 0, 4 0, 45 1

— Ce sont des effectifs relatifs notés fij


— Lecture

f11 = 0, 05 f12 = 0, 1 f13 = 0


f21 =? f22 =? f23 =? f.. =?
f42 =? f32 =? f43 =? f31 =?

3.2 Distributions marginales

3.2.1 Définition

— Ce sont les distributions relatives à la seule variable X ou Y .


— Il y des distributions marginales selon le nombre de variables pris en considé-
ration.

46
3 Distribution statistique à deux caractères (avec observations groupées)

Exemple illustratif (la taille et le poids des étudiants)


— Il y a deux distributions marginales

Distribution Marginale des Xi


j=1 j=2 j=3
[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 1 2 0 n1. = 3
i=2 [160, 170[ 2 3 3 n2. = 8
i=3 [170, 180[ 0 2 3 n3. = 5
i=4 [180, 190] 0 1 3 n4. = 4
Total n.1 = 3 n.2 = 8 n.3 = 9 20

Distribution Marginale des Yj

Effectif nj fj Effectif ni fi
[45, 55[ 3 0, 15 [150, 160[ 3 0, 15
[55, 65[ 8 0, 4 [160, 170[ 8 0, 4
[65, 80[ 9 0, 45 [170, 180[ 5 0, 25
P
20 1 [180, 190] 4 0, 2
P
20 1

— Lecture

f.1 = 0, 05 f1. = 0, 15
f.2 =? f2. =?
f.3 =? f4. =?

3.2.2 Paramètres des distributions marginales

3.2.2.1 Moyennes marginales

— On peut calculer les moyennes de ces distributions marginales

1. Calculons la moyenne de la distribution marginale des Yj : à partir du tableau de


contingence, on peut extraire le tableau des catégories des poids des étudiants
suivant :
Catégories des poids des étudiants

Modalités de Yj Effectif nj fj

[45, 55[ 3 0, 15

[55, 65[ 8 0, 4

[65, 80[ 9 0, 45
P
20 1

47
3 Distribution statistique à deux caractères (avec observations groupées)

— La moyenne marginale du poids est égale à :


Pp p
j=1 n.j × yj
X
y= = f.j × yj (3.1)
n..
j=1

Donc :

50 × 3 + 60 × 8 + 72, 5 × 9
y= = 64, 125
20
— Le poids des étudiants est égal en moyenne 64, 125 kg
2. Calculons la moyenne de la distribution marginale des Xi : à partir du tableau
de contingence, on peut extraire le tableau des catégories de la taille des étu-
diants suivant :
Catégories de la taille des étudiants

Modalités de Xi Effectif ni fi

[150, 160[ 3 0, 15

[160, 170[ 8 0, 4

[170, 180[ 5 0, 25

[180, 190] 4 0, 2
P
20 1

— La moyenne marginale de la taille est égale à :


Pk k
i=1 ni. × xi
X
x= = fi. × xi (3.2)
n..
j=1

Donc :

155 × 3 + 165 × 8 + 175 × 5 + 185 × 4


x= = 170
20
— La taille des étudiants est égale en moyenne 170 cm.

3.2.2.2 Variances marginales

1. Calculons la variance de la distribution marginale des Yj : à partir du tableau


de contingence de la catégories du poids des étudiant ci dessus, la variance
marginale du poids est égale à :
Pp
j=1 n.j × yj2
var(y) = − y2 (3.3)
n..
Application :

502 × 3 + 602 × 8 + 72, 52 × 9


var(y) = − 64, 1252 = 68, 296
20

48
3 Distribution statistique à deux caractères (avec observations groupées)

2. Calculons la variance de la distribution marginale des Xi : à partir du tableau de


contingence on peut extraire le tableau des catégories de la taille des étudiants,
la variance marginale de la taille est :

Pk
i=1 ni. × x2i
var(x) = − x2 (3.4)
n..
Application :

1552 × 3 + 1652 × 8 + 1752 × 5 + 1852 × 4


var(y) = − 1702 = 95
20

3.2.2.3 Écarts types des distributions marginales

1. Calculons l’écart type de la distribution marginale des Yj :

p
σy = var(y) (3.5)

p
σy = 68, 296 = 8.26

Signifie que les poids des étudiants s’écartent de 8, 26 kg par rapport à la


moyenne.
2. Calculons l’écart type de la distribution marginale des Xi :

p
σx = var(x) (3.6)


σx = 170 = 13, 038

Signifie que les tailles des étudiants s’écartent de 13, 038 cm par rapport à la
moyenne.

3.3 Distributions conditionnelles

3.3.1 Définition

— On appelle distribution Conditionnelle la distribution ou l’on a posé une condi-


tion.
— Il y a i + j distributions conditionnelles.
— Avec i est le nombre de modalités de Xi et j est le nombre de modalités de Yj .

Exemple illustratif (la taille et le poids des étudiants)


— Il y a i + j = 4 + 3 = 7 distributions conditionnelles.

49
3 Distribution statistique à deux caractères (avec observations groupées)

— Avec i = 4 est le nombre de modalités de Xi et j = 3 est le nombre de modalités


de Yj .

1. Exemple : Distribution par catégories de taille dont le poids est dans l’intervalle
[55, 65[, c’est-à-dire la taille pour un poids j = 2 . Notée : Distribution Condi-
tionnelle des Xi /Yj=2
j=1 j=2 j=3
[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 1 n12 = 2 0 3
i=2 [160, 170[ 2 n22 = 3 3 8
i=3 [170, 180[ 0 n32 = 2 3 5
i=4 [180, 190] 0 n42 = 1 3 4
Total 3 n.2 = 8 9 20

— On peut extraire le tableau suivant pour simplifier

Catégories de la taille des étudiants


pour un poids compris entre 55 et 65 kg

Modalités de Xi Effectif ni2 fi2

[150, 160[ 2 0, 15

[160, 170[ 3 0, 4

[170, 180[ 2 0, 25

[180, 190] 1 0, 2
P
8 1

— Lecture

f12 = ? f22 = 0, 15 f32 =? f42 =? f.3 =? f.1 =?

2. Exemple : Distribution par catégories de poids dont la taille est dans l’intervalle
[170, 180[, c’est-à-dire la distribution du poids pour une taille i = 3 . Notée :
Distribution conditionnelle des Yj /Xi=3
j=1 j=2 j=3
[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 1 2 0 3
i=2 [160, 170[ 2 3 3 8
i=3 [170, 180[ n31 = 0 n32 = 2 n33 = 3 n3. = 5
i=4 [180, 190] 0 1 3 4
Total 3 8 9 20

— On peut extraire le tableau suivant pour simplifier

50
3 Distribution statistique à deux caractères (avec observations groupées)

Catégories du poids des étudiants pour


une taille comprise entre 170 et 180 cm

Modalités de Yj Effectif n3j f3j

[45, 55[ 0 0

[55, 65[ 2 0, 4

[65, 80[ 3 0, 6
P
5 1

— Lecture
f31 = ? f32 = ? f33 =? f13 =? f3. =?
n31 = ? n32 = ? n33 =? n13 =? n3. =?

3.3.2 Paramètres des distributions conditionnelles

3.3.2.1 Moyennes conditionnelles

On peut calculer les moyennes conditionnelles de ces distributions.


1. La Moyenne conditionnelle du poids pour i = 3 des Yj /Xi=3 est notée y 3 :
Pp p
j=1 n3j × yj X
y3 = = f3j × yj (3.7)
n3.
j=1

Application :
Pp
j=1 n3j × yj 50 × 0 + 60 × 2 + 72, 5 × 3
y3 = = = 67, 5
n3. 5
Le poids moyen des étudiants pour une taille comprise entre 170 et 180 cm est
de 67, 5 kg.
2. La Moyenne conditionnelle de la taille pour j = 2 des Xi /Yj=2 est notée x2 :

Pk k
i=1 ni2 × xi X
x2 = = fi2 × xi (3.8)
n.2
j=1

Application :

155 × 2 + 165 × 3 + 175 × 2 + 185 × 1


x2 = = 167, 5
8
La taille moyenne des étudiants pour un poids compris entre 55 et 65 kg est de
167, 5 cm.

51
3 Distribution statistique à deux caractères (avec observations groupées)

3.3.2.2 Variances conditionnelles

On peut calculer les variances de ces distributions conditionnelles.


1. La Variance conditionnelle du poids pour i = 3 (c’est à dire pour une taille com-
prise entre [170, 180[) des Yj /Xi=3 est notée var(y 3 ) :
Pp
j=1 n3j × yj2
var(y3 ) = − y 23 (3.9)
n3.
Application :
Pp
j=1 n3j × yj2 502 × 0 + 602 × 2 + 72, 52 × 3
var(y3 ) = − y 23 = − 67, 52 = 37, 5
n3. 5
La variance conditionnelle du poids des étudiants pour une taille comprise entre
170 et 180 cm est de 37, 5.
2. La Variance conditionnelle de la taille pour j = 2 (c’est à dire pour un poids
compris entre [55, 65[) des Xi /Yj=2 est notée var(x2 ) :

Pk
i=1 ni2 × x2i
var(x2 ) = − x22 (3.10)
n.2
Application :

1552 × 2 + 1652 × 3 + 1752 × 2 + 1852 × 1


var(x2 ) = = 93, 75
8
La variance conditionnelle de la taille des étudiants pour un poids compris entre
55 et 65 kg est de 93, 75.

3.3.2.3 Écarts types des distributions conditionnelles

On peut calculer les écarts types de ces distributions conditionnelles


1. Écart type de la distribution conditionnelle du poids pour i = 3 des Yj /Xi=3 est
notée (σy3 ) :
sP
p
p j=1 n3j × yj2
σ y3 = var(y3 ) = − y 23 (3.11)
n3.

Application :

p p
σy3 = var(y3 ) = 37, 5 = 6, 123

Signifie que les poids des étudiants dont la taille est comprise entre 170 et 180
cm s’écartent de 6, 123 kg par rapport au poids moyen de cette catégorie à savoir
67, 5 cm.

52
3 Distribution statistique à deux caractères (avec observations groupées)

2. Écart type de la distribution conditionnelle de la taille pour j = 2 des Xi /Yj=2


est notée (σx2 ) : :
s
Pk
p
i=1 ni2 × x2i
σx2 = var(x2 ) = − x22 (3.12)
n.2

Application :

p p
σx2 = var(x2 ) = 93, 75 = 9, 682

Signifie que les tailles des étudiants dont le poids est compris entre 55 et 65 kg
s’écartent de 9, 682 cm par rapport à la taille moyenne de cette catégorie à savoir
167, 5 cm.

Remarque
— La variance marginale est donc égale à la somme de la moyenne des variances
conditionnelles et de la variance des moyennes conditionnelles.

53
4 Distribution statistique à deux caractères
(avec observations non groupées)

4.1 Introduction

Présentation
— Dans ce chapitre, on va étudier les relations, lorsqu’elles existent, entre deux
distributions statistiques dont les valeurs sont observées isolément.
— Par exemple la relation entre deux variables : publicité et vente, ou entre le
revenu et les dépenses.
— On peut s’intéresser à une liaison éventuelle entre les deux variables.
— La régression fournit une expression de cette liaison sous la forme d’une fonc-
tion mathématique.
— La corrélation renseigne sur l’intensité de cette liaison.

4.2 Analyse de la régression linéaire

4.2.1 Nuage des points

Définition
— Considérons deux caractères numériques x et y. Si à partir d’une étude menée
sur un échantillon de taille n on obtient les valeurs xi et yi .
— La représentation graphique dans le plan de l’ensemble des points de coordonnées(xi , yi )
pour i = 1; 2; . . . .n s’appelle nuage statistique.

Exemple illustratif : la taille et le poids des étudiants


— Soit le jeu de données suivant :

n° 1 2 3 4 5 6 7 8 9 10
Taille 158 177 181 190 163 158 165 164 166 169
Poids 55 80 72 77 53 58 74 64 72 74

n° 11 12 13 14 15 16 17 18 19 20
Taille 173 175 174 180 164 166 172 163 188 150
Poids 64 72 74 64 55 65 61 50 73 48

54
4 Distribution statistique à deux caractères (avec observations non groupées)

— La présentation graphique du nuage de points est :

85

80

75

70

65

60

55

50

45
Le Poids

40
140 150 160 170 180 190 200
La Taille

— Cette représentation graphique du nuage de points permet :


— D’apprécier l’existence ou non d’une éventuelle liaison.
— De déterminer la forme de la liaison.

4.2.2 Ajustement à une fonction linéaire affine

Définition
— A partir de ce nuage de points, il faut chercher à exprimer la relation entre les
deux variables à l’aide d’une équation mathématique.
— On pourrait le faire de plus d’une façon, mais on va se limiter ici à la plus
simple, c’est-à-dire l’équation linéaire de la forme affine.
y = ax + b (4.1)

• On appelle régression linéaire, c’est justement l’ajustement d’une droite au nuage


statistique(xi , yi )

Exemple illustratif : la taille et le poids des étudiants

85

80

75

70

65

60

55

50

45
Le Poids

40
140 150 160 170 180 190 200
La Taille

55
4 Distribution statistique à deux caractères (avec observations non groupées)

4.2.3 Méthode des moindres carrés

Définition
— Le problème consiste donc à trouver une droite d’équation y = ax+b qui traduit,
avec le plus de fidélité, le lien entre x et y.
— Pour cela nous allons utiliser une technique appelée : la méthode des moindres
carrés.
— Qui consiste à minimiser la somme des carrés des distances Di verticales entre
la droite et chacun des points (xi , yi ).
— Tout calcul fait, on trouve les P
paramètres de la droite de régression a et b :
n
xi yi − n × xy
a = Pi=1n 2 2 (4.2)
i=1 xi − n × x

b=y−a×x (4.3)

Où x et y sont respectivement les moyennes arithmétiques de x et de y

Exemple illustratif : la taille et le poids des étudiants


No Taille xi Poids yi xi yi x2i No Taille xi Poids yi xi yi x2i

1 158 55 8690 24964 11 173 64 11072 29929

2 177 80 14160 31329 12 175 72 12600 30625

3 181 72 13032 32761 13 174 74 12876 30276

4 190 77 14630 36100 14 180 64 11520 32400

5 163 53 8639 26569 15 164 55 9020 26896

6 158 58 9164 24964 16 166 65 10790 27556

7 165 74 12210 27225 17 172 61 10492 29584

8 164 64 10496 26896 18 163 50 8150 26569

9 166 72 11952 27556 19 188 73 13724 35344

10 169 74 12506 28561 20 150 48 7200 22500


P
x = 169, 8 y = 65, 25 3396 1305 222923 578604

Calculs

56
4 Distribution statistique à deux caractères (avec observations non groupées)

Pn
xi yi − n × xy
a = Pi=1
n 2 2 b=y−a×x
i=1 xi − n × x

222923 − 20 × 169, 5 × 65, 25 b = 65, 25 − 0, 6795 × 169, 8


a=
578604 − 20 × 169, 52

1334 b = −50, 1295


a= = 0, 6795
1963, 5

4.3 Analyse de la corrélation

4.3.1 Covariance

Définition
— La covariance de Pearson entre deux variables aléatoires est un nombre per-
mettant de quantifier leurs écarts conjoints par rapport à leurs moyennes res-
pectives.
— La covariance est une extension de la notion de variance.
n
1X
cov(x, y) = (xi − x)(yi − y) (4.4)
n
i=1
" n #
1X
cov(x, y) = xi yi − xy (4.5)
n
i=1

Propriétés
— La covariance est un indice synthétique
— cov(x, y)  0 ⇐⇒ x et y varient dans le même sens.
— cov(x, y) ≺ 0 ⇐⇒ x et y varient dans le sens opposé.
— cov(x, y) = cov(y, x) ⇐⇒ x et y jouent le même rôle dans la formule de la cova-
riance.
— cov(x, x) = var(x)

Exemple illustratif : la taille et le poids des étudiants

57
4 Distribution statistique à deux caractères (avec observations non groupées)

No Taille xi Poids yi x i yi x2i xi − x yi − y (xi − x) (yi − y)

1 158 55 8690 24964 −11, 8 −10, 25 120, 95

2 177 80 14160 31329 7, 2 14, 75 106, 2

3 181 72 13032 32761 11, 2 6, 75 75, 6

4 190 77 14630 36100 20, 2 11, 75 237, 35

5 163 53 8639 26569 −6, 8 −12.25 83, 3

6 158 58 9164 24964 −11, 8 −7, 25 85, 55

7 165 74 12210 27225 −4, 8 8, 75 −42

8 164 64 10496 26896 −5, 8 −1, 25 7, 25

9 166 72 11952 27556 −3, 8 6, 75 −25, 65

10 169 74 12506 28561 −0, 8 8, 75 −7

11 173 64 11072 29929 3, 2 −1, 25 −4

12 175 72 12600 30625 5, 2 6, 75 35, 1

13 174 74 12876 30276 4, 2 8, 75 36, 75

14 180 64 11520 32400 10, 2 −1, 25 −12, 75

15 164 55 9020 26896 −5, 8 −10, 25 59, 45

16 166 65 10790 27556 −3, 8 −0, 25 0, 95

17 172 61 10492 29584 2, 2 −4, 25 −9, 35

18 163 50 8150 26569 −6, 8 −15, 25 103, 7

19 188 73 13724 35344 18, 2 7, 75 141, 05

20 150 48 7200 22500 −19, 8 −17, 25 341, 55


P
3396 1305 222923 578604 − − 1334

x = 169, 8 y = 65, 25

Calcul de la covariance

1. D’après la formule (3.4) :


n
1X 1334
cov(x, y) = (xi − x)(yi − y) = = 66, 7
n 20
i=1

1. D’après la formule (3.5) :


 
222923
cov(x, y) = − 169, 8 × 65, 25 = 66, 7
20
1. Les deux variables : La taille et le poids des étudiants, varient dans le même
sens.

58
4 Distribution statistique à deux caractères (avec observations non groupées)

2. La covariance dépend des unités de mesure dans lesquelles sont exprimées les
variables considérées.
3. On peut lier la notion de la variance et celle de la covariance (inégalité de Auchy
Schwarz)
[cov(x, y)]2  var(x) × var(y) (4.6)

4.3.2 Coefficient de corrélation linéaire

Définition
— Le coefficient de corrélation linéaire de Pearson mesure l’intensité de la relation
linéaire entre deux variables
cov(x, y)
corr(x, y) = rxy = (4.7)
σx σy

Il est égale à la covariance des variables centrées et réduite respectivement par les
écarts types de ces variables

 
x i − x yi − y
corr(x, y) = rxy = cov , (4.8)
σx σy

Propriétés
— Le coefficient de corrélation a le même signe que la covariance ; il est nul quand
la covariance est nulle.
— Il est dangereux d’interpréter le coefficient de corrélation comme un pourcen-
tage.
— Ce coefficient est toujours compris entre 1 et −1
— |r| = 1 ⇐⇒ relation fonctionnelle linéaire.
— r = 0 ⇐⇒ indépendance linéaire.
— 0 ≺ |r| ≺ 1 ⇐⇒ dépendance linéaire autant plus forte que est r est grand.
— |r| prend le signe de la pente de la droite de régression.

Exemple illustratif : la taille et le poids des étudiants

cov(x, y) 66, 7
corr(x, y) = rxy = = = 0, 72
σx σy 9, 91 × 9, 35

— Il y a donc une grande dépendance linéaire forte positive.

59
5 Distribution statistique à deux caractères
(Analyse des séries chronologiques)

— Pour commencer nous allons présenter un exemple illustratif qui va nous ac-
compagner durant le chapitre suivant.
— Soit la série chronologique (temporelle) qui correspond aux variations des ventes
enregistrées pendant la période 2006 − 2009, les données sont trimestrielles (en
Milliers de Dh) sont présentées dans le tableau suivant :

2006 2006 2006 2006

Trimestre 1 30 32 33 35

Trimestre 2 11 12 13 14

Trimestre 3 12 13 15 17

Trimestre 4 36 37 39 41

5.1 Définition et présentation des composantes d’une chronique

5.1.1 Objectif et définition

But L’étude des séries chronologiques sert à faire de la prévision à court, moyen et
long terme. Il existe des méthodes prévisionnelles quantitatives et qualitatives. Les
méthodes quantitatives se subdivisent en deux catégories. Il y a les méthodes d’extra-
polation qui produisent des prévisions sur le principe d’une corrélation de la variable
étudiée avec le temps et les méthodes explicatives qui reposent sur les corrélations
entre la variable étudiée et différentes variables explicatives.

Définition
— Une série temporelle est une suite d’observations d’une quantité répétée dans
le temps.
— On énonce en général l’hypothèse que les intervalles de temps sont équidis-
tants.

60
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

5.1.2 Analyse graphique

Comme il a été précédemment présenté on va commencer par l’analyse graphique à


partir de l’observation du diagramme de dispersion de la série chronologique.
On note une série temporelle de la manière suivante : (Yt )1tn;n=16 ou : y1 , y2 , ..yt , ....yT

45

40

35

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

— Une fois le dessin est établi, il parait bien que cette une fonction compliquée à
étudier et a en ressortir avec des prévisions en utilisant les méthodes usuelles
déjà étudiées.
— Donc lorsqu’on est d’habitude en face d’un problème, on essaie de le décompo-
ser en plusieurs composantes en en étudié chacune d’elles.

5.1.3 Composantes de la série chronologique

5.1.3.1 Présentation des composantes et schémas d’une chronique

Pour notre série chronologique il existe principalement quatre composantes fonda-


mentales :
1. La composante tendancielle ou tendance (Trend) : Cette composante porte sur
les changements de croissance ou de décroissance tout au long de la série.
2. La composante cyclique : cet aspect de la série fait référence à la présence
d’une certaine récurrence et peut s’observer généralement sur des intervalles
de plusieurs années (nous n’étudierons pas cette question).
3. La composante saisonnière (saison) : il s’agit de la présence ou non d’un effet
périodique qui se rapporte à une année (trimestres, semestres etc.)
4. La composante aléatoire (erreur) : cette caractéristique d’une série chronolo-
gique constitue la partie non expliquée par la tendance, le cycle ou la saisonna-
lité. Des évènements rares qui peuvent difficilement être prédits sont souvent à
l’origine de ces fluctuations.
A partir de ces quatre 1 composantes il faut maintenant déterminer le modèle statis-
tique (ou le schéma) adéquat ; en effet, il existe une multitude de modèles statistiques,
il suffit de connaitre les différentes opérations arithmétiques. Par exemple :
1. Généralement on retient trois composantes (trend, saison, perturbation).

61
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

— Le modèle multiplicatif : Yt = St × Ct + εt
— Le modèle multiplicatif deuxième type : Yt = St × Ct × εt
— Le modèle additif : Yt = St + Ct + εt
— Le modèle mixte.
— Le modèle linéaire, Le modèle polynomiale, le modèle exponentiel, etc.
— Il y a des modèles plus compliqués détecter à l’aide des logiciels spécialisé
comme Eviews, Stata, etc.
Avec :
— St représente la composante saisonnière
— Ct relative au Trend
— εt représente la composante aléatoire.
Pour notre exemple nous avons choisi le modèle ou le schéma multiplicatif, car à par-
tir de la représentation graphique de la série chronologique, on peut remarquer que le
deux droites délimitant les maxima et les minima se croisent (dans le cas du modèle
additif les limites supérieur et inférieur de la série seront des droites parallèles).

La troisième étape de notre analyse est d’étudier chaque composante.

5.1.3.2 Étude des composantes de la série temporelle

Question importante : comment on obtient cette tendance ?

La tendance est un lieu géométrique simple qui peut être une droite ou une courbe.
Et on est toujours en présence d’une période qui peut être un mois, un trimestre, un
semestre, etc. Donc une périodique qui se réfère à une année. La détection du Trend
se fait en utilisant la :

Première méthode : On constate à partir de l’analyse graphique que la série chro-


nologique est oscille autour d’une droite, on conclut donc que le trend est une droite.

Deuxième méthode : On constate sur le dessin que les pics des maxima et des
minima peuvent s’ajuster sur une droite : donc le trend est une droite.

L’interprétation de cette tendance est très importance, elle nous renseigne si la série
évolue, et présente un indicateur solide pour la prise de décision.

5.2 Estimation et élimination de la tendance et de la saisonnalité

5.2.1 Cas où la tendance prend la forme d’une droite

Maintenant, quant à la détermination de la tendance (sous hypothèse que le trend


est une droite), on devra la calculer par la méthode des moindres carrés ordinaires

62
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

(MCO). Nous allons calculer les paramètres de la droite linéaire du trend qui prend la
forme suivante :

Ct = ati + b + εt (5.1)

— Pour cela nous calculons les paramètres du modèle de régression simple par
les formules suivantes :
cov(t, Ct )
a= (5.2)
var(t)

b=C −a×t (5.3)

Notre équation estimée prend la forme de :

Ct = ati + b (5.4)

D’où : (voir un cours sur la régression Simple pour plus de précision)

Ct = 0, 4647ti + 20, 425

On s’attend, en ce qui concerne la représentation graphique, que cette droite passe


par le milieu, car cette la droite qui ajuste au mieux les différentes observations des
ventes. Et puisque la pente est positive la tendance est haussière.

Donc nous pouvons construire notre tableau et le graphique associé.

Yt Ct Yt Ct Yt Ct Yt Ct

30 20, 8897059 32 22, 7485294 33 24, 6073529 35 26, 4661765

11 21, 3544118 12 23, 2132353 13 25, 0720588 14 26, 9308824

12 21, 8191176 13 23, 6779412 15 25, 5367647 17 27, 3955882

36 22, 2838235 37 24, 1426471 39 26, 0014706 41 27, 8602941

45

40

35

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

63
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

Nous allons poursuivre la même démarche que pour la recherche de la tendance,


c’est-à-dire nous avions deux paramètres inconnus à calculer à savoir la pente et
l’ordonnée à l’origine. Maintenant pour la recherche des composantes saisonnières
associées aux données trimestrielles, comme c’est le cas de notre exemple il s’agit de
quatre saisons en référence à une année. On les appelle, les coefficients saisonniers
et ils sont obtenus grâce à la formule suivante :

1 X yt
si = (5.5)
card(Ti ) Ct

Pour les coefficients saisonniers nous avons quatre coefficients saisonniers :

 n o



Ti = 1; 5; 9; 13

 n o
T2 =

2; 6; 10; 14
n o (5.6)


T3 = 3; 7; 11; 15

 n o

T4 =

4; 8; 12; 16

Donc nous avons :

St = s i ; t ∈ Ti (5.7)

Par exemple pour le calcul du coefficient saisonnier relatif à la deuxième saison :

1 X yt
S2 = s2 =
card(T2 ) Ct

 
1 y2 y6 y10 y14
S2 = s2 = + + +
4 C2 C6 C10 C14

Avec :
C2 = 0, 4647×(2) + 20, 425

yt Yt Ct yt Yt Ct
2006 1 30 20, 8897059 C1 2008 9 33 24, 6073529
2 11 21, 3544118 C2 10 13 25, 0720588 C10
3 12 21, 8191176 11 15 25, 5367647
4 36 22, 2838235 12 39 26, 0014706
2007 5 32 22, 7485294 2009 13 35 26, 4661765
6 12 23, 2132353 C6 14 14 26, 9308824 C14
7 13 23, 6779412 15 17 27, 3955882
8 37 24, 1426471 16 41 27, 8602941

 
21 11 12 13 14
S2 = s = + + +
4 21, 354 23, 213 25, 072 26, 931

64
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

S2 = s2 = 0, 52

On déduit que :

s2 = S2 = S6 = S10 = S14 = 0, 52

De la même manière nous pouvons calculer les autres coefficients saisonniers et le


résultat est le suivant :

s1 = S1 = S5 = S9 = S13 = 1, 38

s3 = S3 = S7 = S11 = S15 = 0, 58

s4 = S4 = S8 = S12 = S16 = 1, 53

La détermination de la variable « vente » corrigée des variations saisonnières s’effectue


à partir de la relation suivante :

Yt (5.8)
Ycvs,t = St ; 1≤t≤n

Par exemple pour t = 14, nous avons :

Yt 14
Ycvs,t = = = 27, 05
St 0, 52

La troisième composante est la composante aléatoire :

εt = Yt − St × Ct (5.9)

Le calcul de cette composante est simple et automatique d’après la formule ci-dessus,


calculons par exemple l’erreur relative à la période 14.

ε14 = Y14 − S14 × C14

ε14 = 14 − 0, 52 × 26, 931 = 0, 06

Ci-dessous le tableau des données qui récapitule les différents calculs de la série des
vente corrigée des variations saisonnières. Notée Ycvs,t

Tableau des données

65
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

yt Yt Ct St εt Ycvs,t
2006 1 30 20, 8897059 1, 38 1, 24 21, 7932045
2 11 21, 3544118 0, 52 −0, 05 21, 2517546
3 12 21, 8191176 0, 58 −0, 58 20, 8068107
4 36 22, 2838235 1, 53 1, 91 23, 5308615
2007 5 32 22, 7485294 1, 38 0, 68 23, 2460848
6 12 23, 2132353 0, 52 −0, 02 23, 1837323
7 13 23, 6779412 0, 58 −0, 66 22, 5407116
8 37 24, 1426471 1, 53 0, 06 24, 1844965
2008 9 33 24, 6073529 1, 38 −0, 87 23, 972525
10 13 25, 0720588 0, 52 0, 02 25, 11571
11 15 25, 5367647 0, 58 0, 27 26, 0085134
12 39 26, 0014706 1, 53 −0, 78 25, 4917666
2009 13 35 26, 4661765 1, 38 −1, 43 25, 4254053
14 14 26, 9308824 0, 52 0, 06 27, 0476877
15 17 27, 3955882 0, 58 1, 20 29, 4763152
16 41 27, 8602941 1, 53 −1, 62 26, 7990367

Nous pouvons maintenant passer à la représentation graphique de la série brute, son


trend et la série corrigée des variations saisonnières :

45 Yt Ct Yt cvs

40

35

30

25

20

15

10

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Ce graphique montre naturellement les variations (à la baisse respectivement à la


hausse) des ventes enregistrées dont la courbe est verte par rapport à la droite de
la tendance ; Cependant les ventes enregistrent une hausse lorsque la courbe verte
dépasse la droite du trend indépendamment des variations saisonnières, et respec-
tivement enregistrent une baisse lorsque cette courbe est au-dessous de la droite
du trend. Cette analyse permet bien évidement de voir l’évolution stricte des ventes
indépendamment de l’évolution saisonnière.
Nous allons nous intéresser maintenant à une autre forme que peut prendre le Trend.

5.2.2 Cas où la tendance prend la forme d’une courbe (Moyenne mobile)

Définition

66
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

— Nous proposant la méthode des moyennes mobiles (courbe de la moyenne mo-


bile = Moving Average ) qui est une méthode de lissage (Smooth).
— Une moyenne mobile est un outil intéressant pour lisser une série temporelle
et donc pour enlever une composante saisonnière. On utilise de préférence des
moyennes mobiles non-pondérées d’ordre égal à la période, par exemple d’ordre
7 pour des données journalières, d’ordre 12 pour des données mensuelles. Par
exemple, pour enlever la composante saisonnière due au jour de la semaine, on
peut appliquer une moyenne mobile non-pondérée d’ordre 7.
— Nous allons sans tarder appliquer cette méthode et nous allons distinguer deux
cas de figure possible ; cas où la périodicité est d’ordre impaire (m = 3 par
exemple), et c’est le plus simple ; et le cas où l’ordre est paire (m = 4 par
exemple) ; Pour les composantes saisonnières d’une période paire, il n’existe pas
de moyennes mobiles centrées non-pondérées. Il existe deux types de moyenne
mobile centrée pondérée.

Exemple pratique Prenons comme exemple les données suivantes enregistrées dans
le tableau qui suit, qui illustrent l’évolution des variations de l’indice des prix d’une
marchandise de1980 jusqu’à 1987.

1980 1981 1982 1983 1984 1985 1986 1987

Trimestre 1 295 324, 7 372, 9 354 333, 7 323, 2 304, 3 312, 5

Trimestre 2 317, 5 323, 7 380, 9 345, 7 323, 9 342, 9 285, 9 336, 1

Trimestre 3 314, 9 322, 5 353 319, 5 312, 8 300, 2 292, 3 295, 5

Trimestre 4 321, 4 332, 9 348, 9 317, 6 310, 2 309, 8 298, 7 318, 4

— Nous avons des observations périodiques faisant référence au trimestre, donc


nous avons quatre trimestres m = 4 (qui représente un chiffre paire).
— La période est paire et égale à m (m = 4 pour des données trimestrielles), on
utilise une moyenne mobile d’ordre impair accordant un demi-poids aux deux
extrémités :

67
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)

Ip MM MMC Ip MM MMC

1980 1 295 1984 17 333, 7 322, 0 322, 8


295+317,5+314,9+321,4
2 317, 5 312, 2 = 4
18 323, 9 320, 2 321, 1

3 314, 9 319, 6 315, 9 19 312, 8 317, 5 318, 8

4 321, 4 321, 2 320, 4 20 310, 2 322, 3 319, 9


321,2+323,1
1981 5 324, 7 323, 1 322, 1 = 2
1985 21 323, 2 319, 1 320, 7

6 323, 7 326, 0 324, 5 22 342, 9 319, 0 319, 1

7 322, 5 338, 0 332, 0 23 300, 2 314, 3 316, 7

8 332, 9 352, 3 345, 2 24 309, 8 300, 1 307, 2

1982 9 372, 9 359, 9 356, 1 1986 25 304, 3 298, 1 299, 1


10 380, 9 363, 9 361, 9 26 285, 9 295, 3 296, 7
11 353 359, 2 361, 6 27 292, 3 297, 4 296, 3
12 348, 9 350, 4 354, 8 28 298, 7 309, 9 303, 6
1983 13 354 342, 0 346, 2 1987 29 312, 5 310, 7 310, 3
14 345, 7 334, 2 338, 1 30 336, 1 315, 6 313, 2
15 319, 5 329, 1 331, 7 31 295, 5
16 317, 6 323, 7 326, 4 32 318, 4

— Chaque trimestre est affecté du même poids, mais cette méthode est moins
avantageuse car la moyenne mobile est plus étendue. Donc, plus de données
qui seront « perdues » aux deux extrémités de la série.
— Le graphique de la série brute et la série corrigée des variations saisonnières
par la Méthode des Moyennes mobiles d’ordre pair :

390

370
IP
MM
350

330

310

290

270

250
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Donc il est clair que dans le cas où la périodicité est impaire le calcul de la moyenne
mobile non pondérée se fait de manière naturelle.

68
6 Indices

6.1 Présentation et définition

6.1.1 Présentation

— Nous avons vu que la séries statistique peut être résumée par ses paramètres
de position, de dispersion et de concertation.
— Mais si on dispose de plusieurs séries de grandeurs « élémentaires » (en général
des séries de prix ou des séries de quantités de biens), comment fait-on pour
les résumer en une seule grandeur « synthétique » ?

Exemple : Prix en dirhams (et par kg)


Prix des produits en dirhams (par kg) 2010 2011 2012 2013 2014 2015 2016

Oranges (par Kg) 4 4, 3 4, 5 4, 7 4, 9 5 5, 4

Pains (unité) 3000 3200 2800 2750 2900 3000 3100

Electricité (en KW par heure) 3 3, 5 2, 2 3, 2 3, 4 4 4, 9

Questions
— Calculer le prix moyen « agrégé » pour ces trois biens ?
— Est-ce que l’on peut observer son évolution ?

Pour répondre à ces questions on fera usage des indices :


— Il existe des indicateurs dits « simples » (appelés aussi indices élémentaires) qui
sont un moyen synthétique permettant de faciliter la lecture de l’évolution des
séries dans l’espace et le temps.
— A partir de l’exploitation de ces indicateurs, on peut montrer qu’on peut obtenir
des indicateurs (appelés indices synthétiques) qui peuvent décrire l’évolution
d’une grandeur agrégée à partir de grandeurs simples.

6.1.2 Définition d’un indice

— Un indice est une mesure de la variation d’une grandeur comparée à une valeur
de référence égale à 100 et appelée «base».
— Un indice nous permet de réaliser et faciliter des comparaisons.

69
6 Indices

Attention : Un indice, c’est un rapport positif ou nul

Exemple En décembre 2010, l’Indice des prix à la consommation de l ’HCP, base 100
en 1998, s’établissait ainsi :

Indice des prix à la consommation, Décembre Décembre Décembre


IPC (base 100 en 1998) 2007 2008 2010

Ensemble des ménages 117, 70 119, 17 118, 88

Lecture
— Les prix ont augmenté de17, 70 % entre1998 et 2007 (en 9 ans)
— Les prix ont augmenté de 19, 17 % entre1998 et 2008 (en 10 ans)
— Les prix ont augmenté de 119, 17−117, 7 = 1, 47 % entre décembre2007et novembre2008
(en1an)
— Les prix ont évolué de 118, 88−119, 17 = −0, 29 % (diminution) entre novembre2008et
décembre2009 (en2ans)

6.2 Indices élémentaires

6.2.1 Définition

— Un indice élémentaire est un rapport entre deux valeurs d’une série à deux
dates ou deux espaces différents.
— Il est représenté par :
Xt
It/0 = (6.1)
X0

Avec : Xt valeur observée à une date donnée ou dans un espace donné ;

et X0 valeur de référence (à la date 0 ou dans un espace 0).


— En général, l’indice élémentaire relatif au temps s’écrie :
Xt
It/0 = × 100 (6.2)
X0
— L’indice est exprimé en pourcentage (d’où la multiplication par 100)

Exemple : Le PIB par habitant


Entre 2 dates : 1995 Entre deux régions marocaines :
et 2000 Rabat-salé et Tadla Azilal

I2000/1995 = 120 IRb−Salé/T a−Az = 130


— En 2000, le PIB par habitant était de20 % plus élevé qu’en1995 ;
— En capitale (Rabat - Salé), le PIB par tête est de 30 % plus élevé qu’en Tadla
azilal.

70
6 Indices

6.2.2 Propriétés des indices élémentaires

6.2.2.1 Circularité

— Un indice à la date t exprimé par rapport à une année de référence t0 , peut


être décomposé en plusieurs indices élémentaires à des dates successives de la
façon suivante :
It/t−1 It−1/t−2 It−2/t−3 It0 +1/t0
 
It/t0 = 100 × × × × .... × (6.3)
100 100 100 100

Démonstration
 
Xt Xt Xt−1 Xt−2 Xt0 +1
I t/t0 = × 100 = 100 × × × × .... ×
Xt0 Xt−1 Xt−2 Xt−3 Xt0

et
Xt It/t−1
=
Xt−1 100

It/t−1 It−1/t−2 It−2/t−3 It0 +1/t0


 
It/t0 = 100 × × × × .... ×
100 100 100 100
— Donc, dès lors que nous observons des indices intermédiaires sur la période
considérée nous pouvons en déduire un indice global. On dit alors que les in-
dices élémentaires sont enchaînables.

6.2.2.2 Transitivité

— Soit deux indices It/0 et It0 /0 , exprimés en base 0 (année 0). On veut exprimer
l’indice à la date t par rapport à la date t0 . Donc, on veut effectuer un change-
ment de base. Comment procède-t-on ?
— A l’aide de la formule générale :
1
It/0 = It/t0 × It0 /0 ×
100

It/0
It/t0 = 100 × (6.4)
It0 /0

Exemple

Année PIB/habitant (base 100 en 1980)

1980 100
1990 130
2000 145

71
6 Indices

— Quel est l’indice en 2000, base 100 en 1990 ?


I2000/1980 145
I2000/1990 = 100 × = 100 × = 111, 5
I1990/1980 130

6.2.2.3 Réversibilité

— Quand l’on inverse le rôle de la base de référence et celle de la valeur courante,


l’indice élémentaire s’inverse à 104 près :
104
I0/t = (6.5)
It/0

Démonstration

104
   
X0 Xt
I0/t × It/0 = × 100 × × 100 = 104 =⇒ I0/t =
Xt X0 It/0

Exemple
— Le revenu moyen des habitants de Salé exprimé en indice par rapport à celui
des habitants de Rabat est de 125 en 1990.
— Quel est celui des habitants de Rabat exprimé par rapport à ceux de Salé ?
104 104
IRb/Salé = = = 80
ISalé/Rb 125

6.3 Indices synthétiques

6.3.1 Définition

— Un indice synthétique est une grandeur composite qui résume un ensemble


d’indices simples basés sur des grandeurs hétérogènes (i.e. ne pouvant pas être
additionnées).
— Un indice synthétique s’intéresse à la variation de plusieurs indices élémen-
taires en même temps.
— Ils sont en quelque sorte, des moyennes d’indices élémentaires.
— Les plus courants sont : l’indice de Laspeyres et l’indice de Paasche.
— Ils résument l’évolution de plusieurs grandeurs : plusieurs prix, plusieurs quan-
tités, plusieurs valeurs (prix & quantités), etc.

Exemple : L’indice des prix à la production agrégé


— La production d’une économie est composée de plusieurs biens.
— Ainsi, un indice des prix à la production de toute une économie (indice agrégé)
sera une grandeur composite représentant les prix moyens de ces biens ou
plutôt leur évolution moyenne.
— Comment alors calculer un prix « synthétique » moyen ?

72
6 Indices

— Comment de la même manière, calculer une quantité « synthétique moyenne


», sans ajouter des kilos d’un bien (ex. café) avec des tonnes d’un autre bien
(ex. acier) ?

6.3.2 Logique de la construction des indices composites

— Dans les statistiques, on observe des évolutions de prix, de quantités et des


recettes de ventes pour beaucoup de biens.
— Un moyen simple alors de calculer l’indice des prix synthétiques de ces biens
est de faire la moyenne pondérée des indices élémentaires.
— Il s’écrit :
P i i
pq
It/0 (pq) = P i it ti × 100 (6.6)
i p 0 q0

— Le problème de cet indice, c’est que l’on ne peut pas attribuer la cause de
l’évolution :
— Est-ce que c’est à cause des prix ?
— Ou à cause des quantités ?

Définition
— Indice synthétique des prix P i i
pq
It/0 (p) = P i it 0i × 100 (6.7)
i p 0 q0

— Indice synthétique des quantités


P i i
p q
It/0 (q) = P i i0 it × 100 (6.8)
i p0 q0

Exemple Le tableau suivant affiche les prix et les quantités de différents biens (B1 ,
B2 et B3 ) selon deux dates différentes date 0 et date 2.

Prix B1 B2 B3 Quantités B1 B2 B3

0 0, 07 10 35 0 30 0, 5 0, 15
Dates Dates
2 0, 14 20 50 2 20 0, 4 0, 11

1. Calculer l’indice d’évolution de la valeur.


2. Calculer l’indice synthétique des prix.
3. Calculer l’indice synthétique des quantités.

Solution

73
6 Indices

Indice de valeurs P i i
p q
I2/0 (pq) = Pi i2 2i × 100
i 0 q0
p

B1 B2 B3
0,14×20 20×0,4 50×0,11
0,07×30 × 100 10×0,5 ×100 35×0,15 × 100
= 133 = 160 = 104, 7

Indice des prix P i i


p q
I2/0 (p) = Pi i2 0i × 100
i p0 q0

B1 B2 B3
0,14×30 20×0,5 50×0,15
0,07×30 × 100 10×0,5 × 100 35×0,15 × 100
= 200 = 200 = 142, 85

Indice des quantités P i i


p q
I2/0 (q) = Pi 0i 2i × 100
i p 0 q0

B1 B2 B3
0,07×20 10×0,4 35×0,11
0,07×30 × 100 10×0,5 × 100 35×0,15 × 100
= 66, 66 = 80 = 73, 33

6.3.3 Indice de Laspeyres

6.3.3.1 Laspeyres des prix

Définition
— Quand l’on fait la moyenne arithmétique pondérée des indices élémentaires, on
obtient un indice qui exprime une évolution moyenne des prix élémentaires.
— C’est un indice « moyen » des prix. Il accorde un poids à la date 0 de référence,
ne doit contenir que la variation des prix et non pas celle des quantités :
wi = pi0 × q0i ∀i; i = 1, 2, . . ., n (6.9)

D’où on distingue entre l’indice « synthétique » des prix et celui de Laspeyres des prix :

 i  i
P pt P i i × pt
i w i × p i p
i 0 × q 0 pi
Lt/0 (p) = Lpt/0 = P i i 0 × 100 = P i i 0 × 100
i p0 q0 i p0 q0

P i i
pq
Lt/0 (p) = Lpt/0 = P i it 0i × 100 (6.10)
i p 0 q0

74
6 Indices

Remarque
— Seuls les prix varient dans cette relation.
— L’indice de Laspeyres se réduit à un indice élémentaire quand il existe seule-
ment un seul bien.

6.3.3.2 Laspeyres des quantités

De la même façon, on peut obtenir un indice de Laspeyres des quantités puisqu’il


s’agit de la moyenne pondérée des indices de quantités :

 i  i
P qt P i i × qt
i w i × q i p
i 0 × q 0 qi
Lt/0 (q) = Lqt/0 = P i i 0 × 100 = P i i 0 × 100
i p0 q0 i p 0 q0

P i i
p q
Lt/0 (q) = Lqt/0 = P i i0 it × 100 (6.11)
i p 0 q0

— Ici, l’idée serait de ne faire varier que les quantités élémentaires pour obtenir
un indice des quantités synthétiques.
— Pour cela, les prix sont exprimés par rapport à la date de référence uniquement.

6.3.4 Indice de Paasche

— On peut aussi procéder à une moyenne harmonique des indices élémentaires


pour définir un autre indice synthétique.
— L’indice de Paasche désigne la moyenne harmonique des indices de prix, pon-
dérés par les poids à la date t.
— Notons que les poids peuvent s’écrire :

wi = pit × qti ∀i; i = 1, 2, . . ., n (6.12)

6.3.4.1 Paasche des prix

— D’où on définit l’indice de Paasche des prix qui correspond aux poids qui va-
rient :

wi = pi0 × qti ∀i; i = 1, 2, . . ., n (6.13)

 i P i i  pit 
P pt
i w i × p i i p0 qt × pi0
p
Pt/0 (p) = Pt/0 = P i i 0 × 100 = P i i × 100
i p 0 qt i p 0 qt

P i i
p pq
Pt/0 (p) = Pt/0 = i it ti × 100
P
i p 0 qt

75
6 Indices

6.3.4.2 Paasche des quantités

— Et l’indice de Paasche des quantités qui correspond aux poids :


wi = pit × q0i ∀i; i = 1, 2, . . ., n (6.14)

 i P i i  qti 
P qt
i w i × q i i pt q0 × q0i
q
Pt/0 (q) = Pt/0 = P i i 0 × 100 = P i i × 100
i p t q0 i pt q0

P i i
q pq
Pt/0 (q) = Pt/0 = P i it it × 100
i p t q0

L’indice de Paasche se différencie par rapport à celui de Laspeyres est que le « poids »
de chaque prix doit être observé à la date t.

6.3.4.3 Comparaison des indices de Laspeyres et de Paasche

Exemple Soient 3 biens (blé, ris, et le sucre) dont-il faut calculer l’indice des prix
agrégé, et l’indice des quantités agrégé

Blé Ris Sucre

Dates Prix (pt ) Qantités (qt ) Prix (pt ) Qantités (qt ) Prix (pt ) Qantités (qt )

2000 15 50 5 40 2 20

2001 20 55 8 35 3 25

2002 25 58 10 30 4 28

TAF :
1. Calculer l’indice de Laspeyres des prix entre la date 2000 et date 2001.
2. Calculer l’indice de Laspeyres des quantités.
3. Calculer l’indice de Paasche des prix.
4. Calculer l’indice de Paasche des quantités.

Remarque
— Laspeyres est économe en données : seuls les « poids » à la date de référence
sont demandés.
— Laspeyres est plus stable dans le temps que Paasche.
— Paasche ne bénéficie pas de cet avantage car les « poids » varient dans le temps.
— Paasche a tendance à sous-estimer, celui de Laspeyres a tendance à sur-estimer.
— L’indice de Paasche est une moyenne harmonique alors que celui de Laspeyres
est une moyenne arithmétique. (H ≺ x). donc :

Pt/0 ≺ Lt/0 (6.15)

76
6 Indices

6.3.5 Indice de Fisher

Fisher (1922) établit alors un indice composite (i.e. indice de Fisher) qui est une
moyenne géométrique des indices de Laspeyres et Paasche.

6.3.5.1 Fischer des prix

 1
p
= Lpt/0 × Pt/0
p 2
Ft/0 (6.16)

6.3.5.2 Fischer des quantités

 1
q
Lqt/0 q 2
Ft/0 = × Pt/0 (6.17)

Comme il s’agit d’une moyenne géométrique alors :

Pt/0 ≺ Ft/0 ≺ Lt/0 (6.18)

Exemple En utilisant les données précédentes, calculer les indices de Fischer.

77
7 Travaux Dirigés

7.1 Série du TD N°1

Introduction à la statistique descriptive & les représentations


graphiques

Exercice 1

Terminologie des tableaux statistiques : Les caractères suivants sont qualitatifs quan-
titatifs

Qualitatif Quantitatif
Les caractères
Ordinal Nominal Discret continu

Sexe ~ ~ ~ ~
Notes des étudiants d’un module ~ ~ ~ ~
Satisfaction classée : nulle, médiocre, moyenne, . . . ~ ~ ~ ~
Nombre des utilisateurs d’internet à la FSJES salé ~ ~ ~ ~
Tour de ceinture d’une personne ~ ~ ~ ~
Code postal de l’habitation d’un foyer marocain ~ ~ ~ ~
Superficie d’une exploitation agricole ~ ~ ~ ~
Groupe sanguin d’un individu ~ ~ ~ ~

Exercice 2

Soit le tableau suivant donnant la répartition des entrées des touristes au Maroc par
nationalité en 2010.

78
7 Travaux Dirigés

Touristes Nombre d’entrée

Européens 1340700

Arabes 493274

Nord-Américains (Canada + États-Unis) 83295

Autres 61151

Marocains, résidents à l’étranger 862791

TOTAL 2841211

1. Quelle est la population étudiée ?


2. Quel est le caractère étudié ? Quelle est sa nature ?
3. Quelles sont les différentes modalités du caractère étudié ?
4. Calculer les fréquences relatives en % .
5. Donner deux représentations graphiques : en secteurs puis en bâtons de cette
distribution.

Exercice 3

1. Les classes suivantes sont-elles bien définies ?


Vrai Faux

[−∞; 0[ [0; 100[ [100; 300[ [300; 600[ [600; +∞[ ~ ~


Moins de4 Entre4et8 Entre 8 et 12 Entre12 et14 Plus de14 ~ ~
X1 1≺X1 2≺X5 5 ≺ X  10 X  10 ~ ~
[1, 5; 2, 5[ [3; 4, 5[ [5; 5, 5[ [6; 6, 5[ [7; 7, 5[ ~ ~
Moins de4 Entre5et8 Entre9et12 Entre13et14 Plus de14 ~ ~
a−b−c d−e f −g−h ~ ~
2. La fréquence d’une classe s’obtient en divisant l’effectif de la classe par :
L’effectif total ~
Le nombre de classes ~
L’amplitude de la classe ~
3. Le caractère quantitatif discret X admet le tableau de distribution suivant
Valeurs 1 2 3 4 5 Total

fréquences en % 10, 5 22, 3 30, 4 23, 6 13, 2 100


4. Quelle est la fréquence cumulée croissante pour x = 3
~ ~ ~ ~
67, 20% 63, 20% 32, 80% 30, 40%

79
7 Travaux Dirigés

Exercice 4

750 participants ont terminé la course d’une épreuve de 15 km. On vous donne ci-
dessous la répartition des coureurs selon le temps qu’ils ont mi s pour achever le
parcours.

Temps en minutes (mn) [45; 55[ [55; 65[ [65; 75[ [75; 85[ [85; 95[ [95; 105[

Nombre de participants 64 172 262 227 20 5

1. Déterminer les fréquences relatives en pourcentages.


2. Représenter graphiquement cette série, puis le polygone des fréquences.
3. Calculer les fréquences (en %) cumulées croissantes et décroissantes.
4. Quel est le pourcentage des participants qui ont complété l’épreuve en moins
de 1, 25 heure ?
5. Quel est le pourcentage des participants qui ont eu besoin d’au moins 1, 25
heure pour terminer le parcours ?

Exercice 5

Une enquête sur le nombre de pièces par appartement dans un quartier a donné les
résultats suivants : 30 immeubles de 5 étages, de 4 appartements de 2 pièces par étage,
20 immeubles de 6 étages, de 3 appartements de 3 pièces par étage, 60 immeubles de
4 étages, de 3 appartements de 4 pièces par étage, 20 immeubles de 3 étages, de 2
appartements de 5 pièces par étage, 10 immeubles de 3 étages, de 2 appartements
de 6 pièces par étage, Tous les immeubles ont un rez-de-chaussée de 2 appartements
d’une pièce.
1. Préciser le caractère étudié, sa nature et le nombre de ses modalités.
2. Dresser le tableau contenant les effectifs et les fréquences relatives.
3. Représenter graphiquement les effectifs cumulés de cette série.
4. Quel est le nombre d’appartements possédant au plus 3 pièces ? Pas moins de
2 pièces ?

Exercice 6

En 2010, la répartition des entreprises industrielles au Maroc suivant le CA se pré-


sentait comme suit :

80
7 Travaux Dirigés

Chiffre d’affaires (CA) (en 1000 dh) Nombre d’entreprises

[0–2000[ 2657

[2000–5000[ 770

[5000–10000[ 567

[10000–20000[ 448

[20000–40000[ 758

Total 5200

1. Calculer et représenter
a) Les fréquences relatives.
b) A partir des fréquences relatives, représenter graphiquement cette série.
2. Calculer
a) Calculer les fréquences cumulées croissantes et décroissantes.
b) Déterminer :
i. Le pourcentage des entreprises dont le CA est inférieur à 5 millions de
dh.
ii. Le pourcentage des entreprises dont le CA est supérieur ou égale à 2
millions de dh et inférieur à 10 millions de dh.
c) Représenter le diagramme cumulatif (croissant et décroissant)

Exercice 7

Afin d’établir la durée de vie des ampoules électriques produites par une machine, on
a prélevé au hasard 500 ampoules parmi toutes celles produites par cette machine.

La table suivante donne les résultats obtenus :

Durée de vie (en heures) Nombre d’ampoules Effectifs cumulés croissants

[300; 500[ 75

[500; 700[ 150

[700; 1100[ 475

[1100; 1300[

1. Cette distribution est-elle celle d’une population ou d’un échantillon ? Identifier


cette population ou cet échantillon.
2. Quel est le caractère étudié ? Quel est son type ?

81
7 Travaux Dirigés

3. Compléter la table ci-dessus en y indiquant les effectifs ni , les fréquences relativesfi ,


les effectifs cumulés croissants Ni %, les effectifs cumulés décroissants Ni &,
les pourcentages cumulés croissants Pi % et les pourcentages cumulés décrois-
sants Pi & .
4. Interpréter un nombre de chaque colonne de la table précédente.
5. Tracer sur un même graphique l’histogramme et le polygone d’effectifs.
6. Déterminer graphiquement le nombre d’ampoules ayant une durée de vie infé-
rieure à 900 heures.

82
7 Travaux Dirigés

7.2 Série du TD N°2

Paramètres de position, de dispersion et de concentration

Exercice 1

Le recensement des exploitations agricoles susceptibles de faire l’objet d’une expro-


priation a permis d’établir le tableau suivant :

Surfaces en hectares [10–20[ [20–30[ [30–40[ [40–50[ [50–60[ [60–70[ [70–80[

Nombre d’exploitations 10 5 18 3 1 2 1

Déterminer les caractéristiques suivantes :


1. Le mode
2. La médiane
3. La moyenne arithmétique

Exercice 2

Les résultats d’un devoir sont les suivants :

Note 6 7 8 9 10 11 12 13 14 15 17

Effectif 1 2 1 3 4 3 5 2 1 2 1

1. Construire le graphique des effectifs correspondant à cette situation ;


2. Calculer le mode, la médiane et la moyenne ;
3. Calculer le premier quartile et le troisième quartile de cette série.

Exercice 3

Les montants des commandes reçues au cours du mois sont les suivants

Montant Nb de commandes Montant Nb. de commandes

[0–60[ 140 [300–360[ 270

[60–120[ 180 [360–420[ 200

[120–180[ 260 [420–480[ 150

[180–240[ 320 [480–540[ 100

[240–300[ 300 [540–600[ 80

83
7 Travaux Dirigés

1. Représenter par un graphique cette statistique.


2. Déterminer graphiquement la valeur du mode de cette série. Puis, retrouver
cette valeur à l’aide d’un calcul.
3. Calculer la médiane, le montant moyen d’une commande.
4. Calculer le premier quartile et le troisième quartile de cette série.

Exercice 4

La répartition des salaires d’une entreprise se présente ainsi :

Salaires ai Cc ni Ni % n i × Cc fi en % Fi %en %

[800–1200[ 30

[1200–1600[ 276

[1600–2000[ 1000

[2000–2600[ 663

[2600–3200[ 576

[3200–4000[ 300

[4000–5000[ 150

[5000–6000[ 35

[6000–8000[ 12

1. Compléter le tableau suivant et tracer le polygone de fréquences cumulées crois-


sants.
2. Calculer la médiane et la moyenne.
3. Calculer le mode de cette série.

Exercice 5

Les tailles en centimètres des élèves d’un établissement scolaire provincial sont rele-
vées et consignées dans le tableau ci-après :

Tailles (en cm) Nb d’élèves Tailles (en cm) Nb d’élèves

125–135 13 165–175 70

135 − 145 23 175–185 24

145–155 30 185–195 9

155–165 97 195–205 4

84
7 Travaux Dirigés

1. Construire l’histogramme de cette série statistique.


2. Construire le polygone des effectifs cumulés croissants.
3. Calculer la taille modale et la taille médiane de cette série statistique.
4. Vérifier les valeurs de la taille modale et la taille médiane graphiquement, et
expliquer comment procéder à les déterminer ?
5. Calculer la moyenne arithmétique puis la moyenne quadratique de cette distri-
bution.
6. Déterminer les quartiles Q1 , Q2 et Q3 de cette série statistique.

Exercice 6

Complétez le tableau suivant pour calculer la variance

Modalités de Xi xi ni n i xi ni x2i

40

50 5000

87 5220 313200

12740 664000

Exercice 7

Calculez :
— Le coefficient d’aplatissement et d’asymétrie
— Le coefficient de variation des données suivantes :
xi ni

70 91

80 189

90 70

Exercice 8

Dans un diagramme de concentration on porte généralement en ordonnées les valeurs


des fréquences cumulées des valeurs globales. Comment s’écrivent ces valeurs

85
7 Travaux Dirigés

7.3 Série du TD N°3

Distribution statistique à deux caractères (avec observations


groupées)

Exercice 1

Soit le tableau de contingence suivant d’un groupe de 50 personnes réparties par


groupe d’âge (x) et par sexe (y), tous âgés de45 ans au plus.

H F

[0–18[ 10 10

[18–45[ 10 10

1. Déchiffrer les notations ci-dessous :


n11 =? n12 =? n21 =? n22 =? n.1 =? n.2 =? n1. =? n2. =? n.. =?
f11 =? f12 =? f21 =? f22 =? f.1 =? f.2 =? f1. =? f2. =? f.. =?
2. Calculer la moyenne marginale de x
3. Calculer la moyenne marginale de y
4. Calculer la variance marginale de x
5. Calculer la variance marginales de y

Exercice 2

Une étude menée par un groupe de compagnies d’assurances auprès de 30000 assurés
pour le risque « véhicules à moteur » a permis de déterminer les proportions (en pour-
centage) d’assurés correspondant à la puissance fiscale , notée X, du véhicule assuré
et au kilométrage parcouru au cours de la dernière année, noté Y . Les résultats sont
reportés dans le tableau suivant :

≺ 10 [10–20[ [20–30[ [30–40[  40

≺4 4, 4 1, 6

5−6 7, 2 8, 2 4, 0 2, 6

7−8 2, 4 7, 2 13, 6 14, 4 4, 4

9 − 10 2, 4 11, 6 6, 0

 10 4, 4 5, 6

1. Précisez la population étudiée, les caractères étudiés et leur nature


2. Donnez la distribution du kilométrage parcouru.

86
7 Travaux Dirigés

a) Comment s’appelle cette distribution ?


b) Calculez sa moyenne et son écart-type en supposant que tous les assurés
ont fait au moins 2000 km et au plus 50000 km.
c) Déterminez la médiane.
3. Donnez la distribution, en pourcentage, du kilométrage parcouru par les pos-
sesseurs d’une voiture d’une puissance fiscale d’au plus 6 CV. Quel est le type
de cette distribution ?
4. Calculez sa moyenne et son écart-type.

Exercice 3

Soit le tableau suivant qui illustre la répartition d’un ensemble de consommateurs


selon leurs revenus et leurs dépenses de consommation

Revenu /Dep. Cons 25 30 35 40 Total

20 4 2 1 0 7

25 5 1 0 0 6

30 3 2 1 1 7

Total 12 5 20 1 20

Appelonsx, le caractère inscrit en première colonne, et y, celui inscrit en première


ligne. (x représente donc les revenus, et y, les dépenses de consommation).
1. Donner la nature de ces caractères (continu ou discret).
2. Comment appelle-t-on ce type de tableau
3. Donner les fréquences partielles
4. Calculer les moyennes des x et de y
5. Calculer la variance de x et de y et en déduire les écarts types respectifs

87
7 Travaux Dirigés

7.4 Série du TD N°4

Distribution statistique à deux caractères (avec observations non


groupées)

Exercice 1

Une entreprise veut mener une étude pour connaître la relation entre les dépenses
hebdomadaires en publicité et le volume des ventes qu’elle réalise. On a recueilli au
cours des dix dernières semaines les données suivantes :

X Coût pib en 103 Dh 4 2 2, 5 2 3 5 1 5, 5 3, 5 4, 5

Y Ventes en 103 Dh 49, 5 41 43 39 46 53 38 54 48, 5 51, 5

1. Trouver l’équation de la droite de régression des moindres carrés


2. Estimer le volume des ventes si la semaine prochaine on compte dépenser 3500
DH en publicité.

Exercice 2

Soit le tableau suivant :

1 2 3 4 5

xi 10 12 14 16 18

yi 957 939 971 1006 1012

1. Donner la nature de ces caractères (continu ou discret).


2. Comment appelle-t-on ce type de tableau
3. Calculer les moyennes et les variances respectives
4. Donner une interprétation aux résultats précédents
5. Présenter les formules des paramètres de la régression par la méthode des
moindres carrées ordinaires
6. Calculer la pente a de l’équation de régression y = ax + b
7. Calculer l’ordonnée à l’origine et donner une interprétation de cette droite de
régression

88
7 Travaux Dirigés

7.5 Série du TD N°5

Distribution statistique à deux caractères (avec observations non


groupées)

Exercice 1

On considère la série chronologique bimestrielle du transport des voyageurs sur un


réseau (en milliards de passagers-km) de 2002 à 2005.

Janv. – Fév Mars- Avril Mai - Juin Juillet - Aout Sept.-Oct Nov.-Déc

2002 13, 3 15, 1 14, 8 16, 3 14, 8 14, 2

2003 13, 8 14, 2 14, 1 17 15, 2 14, 8

2004 14, 4 16 16, 2 18, 5 16, 2 15, 3

2005 15, 4 16, 8 17, 4 19, 9 17, 9 17, 4

1. On choisit de modéliser cette chronique par un schéma additif. Justifiez ce


choix.
2. Déterminez la tendance de cette chronique par la suite des moyennes mobiles
de longueur adaptée, et représentez-la sur le même graphique que la série ini-
tiale.
3. Calculez les coefficients saisonniers.
4. Calculez la série corrigée des variations saisonnières. Ajustez cette chronique
par une droite en utilisant la méthode des moindres carrés
5. Au vu des résultats, quelles prévisions pouvait-on faire fin 2005 pour janvier
février, mars-avril et mai-juin 2006 ?

Exercice 2

Le tableau ci-dessous donne les valeurs des indices trimestriels (base 2000) de la pro-
duction industrielle des boissons pour les années 2002 à 2005 :

1er trim 2e trim 3e trim 4e trim

2002 194, 2 105, 3 103, 5 127, 5

2003 198, 3 103, 8 115, 7 125, 5

2004 100, 9 110, 7 106, 6 126, 3

2005 198, 7 109, 8 110, 8 129, 4

89
7 Travaux Dirigés

1. Commentez l’évolution de cette série chronologique en utilisant sa représenta-


tion graphique. Justifiez le recours à un schéma de composition additif.
2. Déterminez la tendance de cette chronique par la suite des moyennes mobiles
de longueur adaptée, et représentez-la sur le même graphique que la série ini-
tiale.
3. Calculez les coefficients saisonniers et la série corrigée des variations saison-
nières.

90
7 Travaux Dirigés

7.6 Série du TD N°6

Indices

Exercice 1

Le prix de la tomate au Maroc a été de 1, 5 dh en moyenne en 1980 et de 2, 3 dh en 1995.


— Calculez l’indice élémentaire du prix de la tomate en 1995, base 100 en 1980
— Interprétez le.

Exercice 2

On savait que le prix du sucre dans un pays X a augmenté de 2, 5% entre 1960 et 1975
et de 7, 5% entre 1960 et 1995.
— Déterminez l’indice élémentaire du prix du sucre en 1995 base 100 en 1975, pour
le pays en question.

Exercice 3

Les données concernant l’évolution des prix et des quantités de plusieurs articles
entre les périodes 1995 et 1985 :

Articles / Prix Prix 85 Prix 95 Quantités 85 Quantités 85

A 36 40 6 7

B 12 15 20 20

C 40 45 13 11

D 15 13 15 15

E 42 50 9 18

F 5 8 25 25

G 30 40 10 9

H 8 10 30 30

1. Calculez les différents indices synthétiques des prix


2. Calculez les différents indices synthétiques des quantités
3. Calculez les différents indices synthétiques des valeurs

91
8 Receuil des examens

Examen de statistique descriptive (Groupes C & D) Session de Rattrapage, 2016-2017.

Examen de statistique descriptive (Groupes C & D) Session Ordinaire, 2016-2017.

Examen de statistique descriptive (Groupes Management) Session Ordinaire, 2017-


2018.

Examen de statistique descriptive (Groupes Magagement) Session Ordinaire, 2017-


2018.

Examen de statistique descriptive (Groupes C & D, Management) Session Ordinaire,


2018-2019.

92
8 Receuil des examens

UNIVERSITE MOHAMMED V RABAT


Variante A
FACULTE DES SCIENCES JURIDIQUES ECONOMIQUESET SOCIALES SALE
FILIERE : SEG - S1 - ANNÉE UNIVERSITAIRE : 2016/2017
EXAMEN de Statistique Descriptive – C&D - SESSION DE RATTRAPAGE
Consignes de réponse : VARIANTE
Durée de l’épreuve : 1h30
Identifiez-vous par le code APOGEE.
Votre NOM, et votre PRENOM doivent être écrits en lettres majuscules ; une lettre par case
Cochez seulement là où les réponses sont correctes. Nombre de pages : 2 A
Exercice 1
Trois produits A, B, et C ont varié en quantité et en prix entre 𝒕𝟎 𝒕𝟒
𝑡0 et 𝑡4 de la manière indiquée ci-dessous : Produits
Prix Quantités Prix Quantités
A 3,5 15 10,3 16
B 12,2 5 23,8 5
C 4,4 12 7,60 11

Q1. En prenant pour année de base 𝑡0 l’indice des prix de C. Les prix des trois produits pondérés par les quantités
Laspeyres égale à : courantes ont augmenté de 0,7%.
𝑝 𝑝
A. 𝐿4⁄ = 220,9% B. 𝐿4⁄ = 220.7% D. Les prix des trois produits pondérés par les quantités
0 0 courantes ont baissé de 0,7%.
𝑝 𝑝
C. 𝐿4⁄ = 219,3% D. 𝐿4⁄ = 222,1%
0 0 Q4. L’indice des quantités de Paasche pour 𝑡4 égale à :
𝑞 𝑞
Q2. L’indice des quantités de Laspeyres indique que entre 𝑡0 A. 𝑃4⁄ = 170,7% B. 𝑃4⁄ = 107,7%
0 0
et 𝑡4 : 𝑞 𝑞
C. 𝑃4⁄ = 270,7% D. 𝑃4⁄ = 100,7%
A. Les quantités des trois produits pondérées par les prix 0 0
courants ont augmenté de 99,5%. Q5. L’indice des volumes est égale à :
B. Les prix des trois produits pondérés par les quantités de base A. 𝐼4𝑣⁄ = 120,9% B. 𝐼4𝑣⁄ = 210,9%
0 0
ont augmenté de 99,5%. C. 𝐼4𝑣⁄ = 220,9% D. 𝐼4𝑣⁄ = 202,9%
C. Les quantités des trois produits pondérées par les prix 0 0

courants ont baissé de 0.5%. Q6. . L’indice de Fisher des prix pour 𝑡4 est :
𝑝 𝑝
D. Les quantités des trois produits pondérées par les prix de A. 𝐹4⁄ = 220,7 B. 𝐹4⁄ = 210,7
0 0
base ont baissé de 0,5%. 𝑝 𝑝
C. 𝐹4⁄ = 120,7 D. 𝐹4⁄ = 202,7
Q3. L’indice des prix de Paasche pour 𝑡4 indique que : 0 0

A. Les prix des trois produits pondérés par les quantités de base Q7. L’indice de Fisher des quantités pour 𝑡4 est :
𝑞 𝑞
ont baissé de 22,1%. A. 𝐹4⁄ = 200,1 B. 𝐹4⁄ = 300,1
0 0
B. Les prix des trois produits pondérés par les quantités 𝑞 𝑞
C. 𝐹4⁄ = 201,0 D. 𝐹4⁄ = 100,1
courantes ont augmenté de 22,1%. 0 0

Exercice 2
Les étudiants d’une formation continue sont répartis selon leurs âges, les Âge Effectifs
données sont présentées dans le tableau suivant : [20 ; 25 [ 38
[25 ; 30 [ 69
[30 ; 35 [ 55
[35 ; 40 [ 24
[40 ; 45[ 12
+ de 45 2

Q8. La population de cette distribution est : Q13. Si l’on veut présenter cette distribution par un
A. Les 200 étudiants B. Les formateurs histogramme des effectifs relatifs, il faut :
C. Les formations continues D. Autre A. Vérifier les amplitudes B. Tracer les rectangles contigus
Q9. L’individu de cette population est : C. Calculer les fréquences D. Faire les trois étapes
A. L’âge B. L’étudiant Q14. La lecture du tableau nous permet de dire que :
C. La formation continue D. Autre A. 𝑛4 = 40 B. 𝑎4 = 5
Q10. Le caractère étudié est : C. 𝑛6 = 45 D. 𝑎6 = 2
A. La formation continue B. L’étudiant Q15. Le calcul des fréquences permet de dire que :
C. L’âge des étudiants D. Autre A. 𝑓4 = 24 B. 𝑓2 = 27,5%
Q11. La variable étudiée est de nature : C. 𝑓6 = 1 D. 𝑓4 = 0,12
A. Qualitative ordinale B. Quantitative continue Q16. L’effectif cumulé croissant de la troisième classe est :
C. Quantitative discrète D. Autre A. 162 B. 186
Q12. Le terme «données classées» signifie que les C. 107 D. 200
observations : Q17. Le pourcentage des étudiants âgés de > 30 ans :
A. Identiques ont été regroupées pour la même modalité. A. 53,5% B. 81%
B. Sont nécessairement qualitatives. C. 46,5% D. 19%
C. Ont été regroupées dans une seule classe. Q18. Pour déterminer la classe modale de cette distribution :
D. La variable est observée pour chaque individu de la A. On utilise la définition B. On utilise les étapes A et C
population. C. On calcule le Rang D. Autre
1

93
8 Receuil des examens

Q19. L’âge modal sera de l’ordre de : Q22. L’écart type sera de l’ordre de :
Variante A
A. 25 B. 28,4 A. 6,11 B. 8,56
C. 30 D. 27,5 C. 5,81 D. Autres
Q20. L’âge moyen sera de l’ordre de : Q23. La concentration est dite faible si :
A. 30,23 B. 30,32 ∆𝑀 ∆𝑀
A. < 𝐼𝑉 B. < 𝑀𝑒
𝐼𝑉 𝐼𝑉
C. 30,00 D. 23,30 ∆𝑀 𝑀𝑙 −𝑀𝑒
Q21. La variance sera de l’ordre de : C. < 𝑀𝑙 D. =0
𝐼𝑉 𝑀𝑎𝑥−𝑀𝑖𝑛
A. 37,80 B. 33,70
C. 73,3 D. Autre

Exercice 3
Soit le tableau de contingence suivant : 𝒙 𝒚 1 4
2 4 10
8 4 12

Q24. D’après la lecture de ce tableau : Q27. La moyenne conditionnelle de 𝑥 quand 𝑦 = 4 est :


A. 𝑛12 = 10; 𝑛1. = 8 B. 𝑛11 = 4; 𝑛22 = 14 A. 𝑥̅1 = 5 B. 𝑦̅1 = 9
C. 𝑛21 = 4; 𝑛2. = 16 D. 𝑛.. = 30; 𝑛.2 = 16 C. 𝑥̅2 = 5,27 D. 𝑦̅2 = 8,93
Q25. Les moyennes marginales sont : Q28. L’écart type conditionnel de 𝑦 quand 𝑥 = 8 est :
A. 𝑥̅ = 2,5 ;𝑦̅ = 2,3 B. 𝑥̅ = 5,2 ; 𝑦̅ = 3,2 A. 𝜎𝑦1 = √1,299 B. 𝜎𝑦2 = 1,299
C. 𝑥̅ = 2,3 ; 𝑦̅ = 2,5 D. 𝑥̅ = 3,2 ; 𝑦̅ = 5,2 C. 𝜎𝑥1 = 1,299 D. 𝜎𝑥2 = √1,299
Q26. La variance marginale de 𝑦 est :
A. 𝑉𝑎𝑟(𝑦) = 8,96 B. 𝑉𝑎𝑟(𝑦) = 2,5²
C. 𝑉𝑎𝑟(𝑦) = 1,76 D. 𝑉𝑎𝑟(𝑦) = 7,76

Exercice 4
Pour un produit donné, on vous demande d’étudier les ventes (𝑌) et les dépenses publicitaires (𝑋) enregistrées pendant la période
2014-2016, les données sont trimestrielles (en Milliers de DH), ci-dessous quelques données utiles et le graphique des ventes :
249,6
∑ 𝑌𝑡 = 1811 ∑ 𝑋𝑡 = 50 ∑ 𝑋𝑡 𝑌𝑡 = 9079,2 230,4
236,8

204,8 211,2
∑(𝑋𝑡 − 𝑋̅)(𝑌𝑡 − 𝑌̅) = 1533,36 ∑ 𝑋𝑡 ² = 247,42 192,0

∑ 𝑇𝑡 ² = 650 ∑ 𝑌𝑡 ² = 334650,9
96,0
𝑇 = 12 ∑ 𝑇𝑡 𝑌𝑡 = 12228,7 70,4 76,8 76,8 83,1 83,1

𝑌2 = 70,4 𝑌6 = 76,8 𝑌10 = 83,1 Trim.1 Trim.2 Trim.3 Trim.4 Trim.1 Trim.2 Trim.3 Trim.4 Trim.1 Trim.2 Trim.3 Trim.4
𝐶2 = 136,53 𝐶6 = 149,32 𝐶10 = 162,11 2014 2015 2016

Q29. L’équation mathématique utilisée pour décrire la Q36. Si l’on étudie seulement l’évolution des ventes (𝑌),
relation linéaire entre 𝑋 et 𝑌 est : l’analyse du diagramme de dispersion de la série nous
A. 𝑌 = 103 𝑎𝑋 + 𝑏 B. 𝑌 = 𝑎𝑋 + 𝑏 renseigne que le modèle adéquat est additif, et il s’écrit :
C. 103 𝑌 = 𝑎𝑋 + 𝑏 D. Autre. A. 𝑌𝑡 = 𝑆𝑡 + 𝐶𝑡 + 𝜉𝑡 B. 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 × 𝜉𝑡
Q30. La méthode des moindres carrés ordinaires consiste à : C. 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 + 𝜉𝑡 D. 𝑌𝑡 = 𝑆𝑡 ÷ 𝐶𝑡 × 𝜉𝑡
A. Minimiser la somme des erreurs. Q37. Supposons que le Trend 𝐶𝑡 de cette chronique est une
B. Minimiser la somme des carrées des erreurs. droite, l’équation mathématique utilisée dans ce cas est :
C. Maximiser les ventes et les dépenses. A. 𝐶𝑡 = 𝑎′𝑇𝑡 + 𝑏′ B. 𝐶𝑡 = 𝑎′𝑋𝑡 + 𝑏′
D. Minimiser la somme des valeurs absolues des erreurs C. 𝐶𝑡 = 𝑎′𝑌𝑡 + 𝑏′ D. 𝐶𝑡 = 𝑎′𝑆𝑡 + 𝑏′
Q31. La valeur de la pente est Q38. La valeur de la pente est
A. 𝑎 = 22,39 B. 𝑎 = −22,39 A. 𝑎′ = 2,197 B. 𝑎′ = −2,197
C. 𝑎 = 39,22 D. 𝑎 = −39,22 C. 𝑎′ = 3,197 D. 𝑎′ = −3,197
Q32. La valeur de l’ordonnée à l’origine est : Q39. La valeur de l’ordonnée à l’origine est :
A. 𝑏 = −12,54 B. 𝑏 = 12,54 A. 𝑏′ = 130,134 B. 𝑏′ = −130,134
C. 𝑏 = 21,54 D. 𝑏 = −21,54 C. 𝑏′ = 131,134 D. 𝑏′ = −131,134
Q33. La covariance entre 𝑌 et 𝑋 est de Q40. Le coefficient saisonnier relatif à la deuxième saison :
A. 107,78 B. 127,78 A. 𝑆2 = 1,51 B. 𝑆2 = 0,61
C. 117,78 D. 137,78 C. 𝑠 2 = 0,51 D. 𝑠 2 = 0,41
Q34. Le coefficient de corrélation linéaire est de : ./.
A. 0,99 B. 99% Bonne chance à tous..
C. 0,95 D. 95%
Q35. Ce résultat signifie que l’intensité de la relation est :
A. Forte B. Indépendante
C. Positive D. Forte et positive

94
8 Receuil des examens

UNIVERSITE MOHAMMED V RABAT


Variante B
FACULTE DES SCIENCES JURIDIQUES ECONOMIQUESET SOCIALES SALE
FILIERE : SEG - S1 - ANNÉE UNIVERSITAIRE : 2016/2017
EXAMEN de Statistique descriptive – S1 - SESSION ORDINAIRE
Consignes de réponse : VARIANTE
Durée de l’épreuve : 1h30
Identifiez-vous par le code APOGEE.
Votre NOM, et votre PRENOM doivent être écrits en lettres majuscules ; une lettre par case
Cochez seulement là où les réponses correctes. Nombre de pages : 2 B
Exercice 1
Vous disposez d’un panier de produits dont on connait les prix et quantités à deux dates 0 et t.
Q1. L’indice du revenu moyen en 1990 vaut 𝐼𝑅𝑎𝑏𝑎𝑡/𝑆𝑎𝑙é = 𝑝 ∑ 𝑝𝑖 𝑞 𝑖 𝑝 ∑ 𝑝𝑖 𝑞 𝑖
A. 𝐿𝑡⁄ = ∑ 𝑖 𝑡𝑖 0𝑖 × 100 B. 𝐿𝑡⁄ = ∑𝑖 0𝑖 0𝑖 × 100
125 donc : 0 𝑖 𝑝0 𝑞0 0 𝑖 𝑝𝑡 𝑞0
𝑝 ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 𝑝 ∑𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖
A. 𝐼𝑆𝑎𝑙é/𝑅𝑎𝑏𝑎𝑡 = 100 B. 𝐼𝑆𝑎𝑙é/𝑅𝑎𝑏𝑎𝑡 = 125 C. 𝐿𝑡⁄ = ∑ 𝑖 𝑖 × 100 D. 𝐿𝑡⁄ = ∑ 𝑖 𝑖 × 100
0 𝑖 𝑝0 𝑞𝑡 0 𝑖 𝑝0 𝑞0
C. 𝐼𝑆𝑎𝑙é/𝑅𝑎𝑏𝑎𝑡 = 80 D. 𝐼𝑆𝑎𝑙é/𝑅𝑎𝑏𝑎𝑡 = 1990
Q5. L’indice de Paasche des quantités à la date t base 100 à la
Q2. Le prix de la tomate au Maroc a été de 1,5 dh en date 0 se calcule par la formule :
moyenne en 1980 et de 2,3 dh en 1995. Son indice 𝑞 ∑ 𝑝𝑖 𝑞 𝑖 𝑞 ∑ 𝑝𝑖 𝑞 𝑖
élémentaire en 1995, base 100 en 1980 A. 𝑃𝑡⁄ = ∑ 𝑖 𝑖𝑡 𝑡𝑖 × 100 B. 𝑃𝑡⁄ = ∑𝑖 0𝑖 0𝑖 × 100
0 𝑖 𝑝0 𝑞0 0 𝑖 𝑝𝑡 𝑞0
correspond indique que : 𝑞 ∑𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖 𝑞 ∑𝑖 𝑝0𝑖 𝑞𝑡𝑖
A. Le prix de la tomate au Maroc a augmenté de 53.33% C. 𝑃 𝑡⁄ = ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖
× 100 D. 𝑃 𝑡⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖
× 100
0 0
entre 1980 et 1995. Q6. L’indice de Fisher des prix à la date t base 100 à la date
B. Le prix de la tomate au Maroc a augmenté de 65.22% 0 se détermine par :
entre 1995 et 1980. 𝑝 𝑝 𝑝
1⁄
2 𝑝 𝑝 𝑝
1⁄
2
C. Le prix de la tomate au Maroc a baissé de 65.22% entre A. 𝐹𝑡⁄ = (𝐿𝑡⁄ + 𝑃0⁄ ) B. 𝐹𝑡⁄ = (𝐿𝑡⁄ × 𝑃𝑡⁄ )
0 0 𝑡 0 0 0
1995 et 1980. 1⁄
2
1⁄
2
𝑝 𝑝 𝑝 𝑝 𝑝 𝑝
D. Le prix de la tomate au Maroc a baissé de 53.33% entre C. 𝐹𝑡⁄ = (𝐿𝑡⁄ + 𝑃𝑡⁄ ) D. 𝐹𝑡⁄ = (𝐿𝑡⁄ × 𝑃0⁄ )
0 0 0 0 0 𝑡
1980 et 1995 Q7. Pour calculer l’indice des volumes globaux (ici
Q3. L’indice d’une valeur 𝑉 à la date t, base 100 à la date 0, recettes) on utilise la formule :
se calcule par la formule : ∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
𝑉 𝑉 A. 𝐼𝑡⁄ (𝑝𝑞) = ∑ 𝑖 𝑖𝑡 𝑡𝑖 × 100 B. 𝐼𝑡⁄ (𝑝𝑞) = ∑ 𝑖 0𝑖 𝑡𝑖 × 100
A. 0⁄𝑉 B. 𝑡⁄𝑉 0 𝑖 𝑝0 𝑞0 0 𝑖 𝑝0 𝑞0
𝑡 0 ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 ∑𝑖 𝑝0𝑖 𝑞0𝑖
𝑉𝑡 𝑉0 C. 𝐼 𝑡⁄ (𝑝𝑞) = × 100 D. 𝐼 𝑡⁄ (𝑝𝑞) = × 100
C. ( ⁄𝑉 ) × 100 D. ( ⁄𝑉 ) × 100 0 ∑𝑖 𝑝0𝑖 𝑞0𝑖 0 ∑𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖
0 𝑡
Q4. L’indice de Laspeyres des prix à la date t base 100 à la
date 0 se calcule par la formule :

Exercice 2
Un groupe financier marocain regroupe 5 entreprises de tailles différentes opérantes dans différents secteurs. Les parts du
chiffre d’affaires (CA) pour chacune d’entre elles sont : 30%, 30%, 20%, 15%, et 5%.

Q8. La population étudiée est : Q12. Le terme «données individuellement observées»


A. Les groupes financiers B. Les 5 entreprises signifie que les observations :
C. Le CA global D. Taille des entreprises A. Sont nécessairement quantitatives.
Q9. L’individu de cette population est : B. Sont nécessairement qualitatives.
A. Les actionnaires B. Le groupe financier C. Ont été regroupées par classes ou groupe de modalités.
C. Les 5 entreprises D. L’entreprise du secteur D. La variable est observée pour chaque individu de la population.
Q10. La variable étudiée est : Q13. L’outil adapté pour représenter cette distribution est le :
A. Une entreprise B. Les parts du CA A. Diagramme en bâtons B. Tuyau d’orgues
C. Le CA global D. Les secteurs C. Camembert D. Histogramme
Q11. La variable étudiée est de nature : Q14. Si l’on veut présenter cette distribution par un diagramme
A. Qualitative ordinale B. Quantitative discrète en secteur à 360°, l’angle associé à la troisième entreprise est :
C. Quantitative continue D. Qualitative nominale A. 72° B. 108°
C. 54° D. 36°
Exercice 3
Le tableau suivant donne la distribution des notes des Note sur 20 Nombre d’étudiants
étudiants d'un examen de statistique : [08 ; 10 [ 120
[10 ; 12 [ 360
[12 ; 14 [ 290
[14 ; 16 [ 140
[16 ; 18] 90

Q15. Le nombre total des étudiants est : Q16. La fréquence du nombre des étudiants dont la note
A. 1000 B. 1200 comprise entre [12 ; 14 [ :
C. 1100 D. 900 A. 0.36 B. 0.14
C. 0.29 D. 0.12
1

95
8 Receuil des examens

Q17. L’effectif cumulé croissant de la dernière classe est : A. 12,44 B. 10,72


Variante B
A. 1000 B. 1200 C. 12,14 D. 13,86
C. 1100 D. 910 Q24. Le deuxième quartile sera de l’ordre de :
Q18. Le pourcentage des étudiants qui ont une note ≥ 10/ A. 12,44 B. 10,72
20 : C. 12,14 D. 11,55
A. 52% B. 36% Q25. L’intervalle interquartile sera de l’ordre de :
C. 88% D. 12% A. 3,04 B. 3,14
Q19. Peut-on dire que cette distribution à : C. 3,24 D. 3,34
A. Uni modale B. Trois modes
Q26. La variance sera de l’ordre de :
C. Bimodale D. Autre
A. 5,406 B. 5,604
Q20. La note modale sera de l’ordre de :
C. 5,046 D. 5,064
A. 10,55 et 11,55 B. 10,55
Q27. L’écart type sera de l’ordre de :
C. 11,55 D. Autre
A. 2,325 B. 2,367
Q21. La note moyenne sera de l’ordre de :
C. 2,246 D. 2.25
A. 10,44 B. 11,44
Q28. Le coefficient de variation est :
C. 13,44 D. 12,44
A. 0,1869 B. 0,1809
Q22. La moyenne géométrique relative à cette distribution
C. 0.1903 D. 0,1806
prend la forme suivante :
Q29. La concentration est dite faible si :
5 1000 ∆𝑀 ∆𝑀
A. 𝐺 = √∏5𝑖=1 𝑥𝑖 B. 𝐺 = √∏5𝑖=1 𝑓𝑖 A. < 𝐼𝑉 B. < 𝑀𝑒
𝐼𝑉 𝐼𝑉
∆𝑀 𝑀𝑙 −𝑀𝑒
15 1000 𝑛 C. < 𝑀𝑙 D. =0
C. 𝐺 = √∏5𝑖=1 𝑥𝑖 D. 𝐺 = √∏5𝑖=1 𝑥𝑖 𝑖 𝐼𝑉 𝑀𝑎𝑥−𝑀𝑖𝑛
5
Q23. Le premier quartile sera de l’ordre de :
Exercice 4
Le Ministère des transports et de la logistique est pré occupé récemment Dépenses en Nombre de clients transportés
par le renouvellement du parc des Taxis en proposant des avantages très carburant (100dh) 0-10 10-30 30-50
0-1 6 20 0
encourageants. Pour disposer des informations, une étude a été menée 1-2 4 20 50
auprès d’un groupe de 100 conducteurs de taxi selon leurs dépenses en carburant et le nombre de clients transportés par jour.

Q30. D’après la lecture du tableau : Q32. La moyenne marginale des dépenses en carburant est :
A. Le nombre de clients transportés est une variable continue. A. 132 dh B. 121 dh
B. Le montant des dépenses en carburant est une variable C. 123 dh D. 124 dh
discrète. Q33. L’écart type marginale des dépenses en carburant
C. Les fréquences conjointes représentent une distribution est :
individuellement observée. A. 0.43836 dh B. 43,8634 dh
D. Le nombre de clients transportés est une variable discrète. C. 0.19245 dh D. 0.91241 dh
Q31. La distribution conditionnelle des dépenses sous la Q34. L’écart type marginale du nombre de clients
condition 10-30 pour le nombre des personnes transportés est de :
transportées est définie par : A. 17,25257 B. 12,25770
A. 𝑛12 = 20 ; 𝑛22 = 20 B. 𝑛11 = 6; 𝑛22 = 4 C. 19,25770 D. 150,2500
C. 𝑛13 = 0; 𝑛23 = 50 D. 𝑛21 = 20; 𝑛22 = 20
Exercice 5
Dans le but d’apprécier l’importance de la part de la production destinée à l’exportation (𝑥𝑖 )vers les pays de l’Afrique, une étude a
été menée auprès des entreprises du secteur industriel durant les dix derniers mois. Le tableau ci-après présente les résultats de
l’observation (en 100.000 d’unités).
Mois janv. févr. mars avr. Mai Juin Juil. Août Sept. Oct.
Volume de la production : 𝒚𝒊 1 2 2 3 3 4 5 6 6 8
La part destinée à l’export : 𝒙𝒊 1 1 2 2 3 3 4 4 5 5

Q35. La production moyenne est de : C. 0,54545 D. 0.49387


A. 105 B. 2 × 105 Q39. Les valeurs des paramètres définissant l’équation de
C. 3 × 105 D. 4 × 105 la droite d’ajustement (𝑦𝑖 = 𝑎𝑥𝑖 + 𝑏) sont de :
Q36. La variance marginale (× 1010 ) de la part destinée à 𝑎 = 1,4 𝑎 = 0.63636
A. { B. {
l’exportation est de l’ordre de : 𝑏 = −0,2 𝑏 = 0,45454
A. 1,40 B. 2,00 𝑏 = 0,45454 𝑎 = 0,2
C. { D. {
C. 3,00 D. 4,40 𝑎 = 0,63636 𝑏 = −1,4
Q37. La covariance (× 1010 ) entre la production et la part Q40. Si l’on suppose que la production totale au mois de
destinée à l’exportation est de : novembre s’élèvera à 10, alors, la part (× 105 ) qui
A. 14,80 B. 12,00 sera consacrée à l’exportation sera :
C. 2,80 D. 4,24 A. 14,2112 B. 4,50001
Q38. Le coefficient de corrélation linéaire est de : C. 6,81818 D. 13,8000
A. 0,94388 B. 0,45456 ./.
Bonne chance à tous..

96
8 Receuil des examens

UNIVERSITÉ MOHAMMED V RABAT


Variante A
FACULTÉ DES SCIENCES JURIDIQUES ÉCONOMIQUES ET SOCIALES SALE
FILIÈRE : MANAGEMENT - S1 - ANNÉE UNIVERSITAIRE : 2017/2018
EXAMEN DE STATISTIQUE DESCRIPTIVE - SESSION ORDINAIRE-LE 08-01-18
Consignes de réponse : VARIANTE
Durée de l’épreuve : 1h30
Identifiez-vous par le code APOGEE.
Votre NOM et votre PRÉNOM, doivent être écrits en lettres majuscules ; une lettre par case
Cochez seulement là où les réponses sont correctes. Nombre de pages : 2
A
Exercice 1
Un groupe 90 de salariés parmi un ensemble de 3 000 employés opérants dans Salaire mensuel (*1000dh) Employés (%)
10 banques commerciales a été observé selon le salaire mensuel. 2 -- 3 11,11
3 -- 4 22,22
Le tableau suivant présente la répartition des salaires en milliers de dirhams. 4 -- 5 38,89
5 -- 7 27,78

Q1. La population étudiée est : C. 4742,22 D. Autre


A. 90 Salariés B. 3 000 Salariés
Q13. Le troisième quartile sera de l’ordre de :
C. 100 Employés D. 10 Banques commerciales
A. 5000 B. 5200
Q2. L’échantillon étudié est : C. 5400 D. Autre
A. 90 Salariés B. 3 000 Salariés
Q14. La médiane sera de l’ordre de :
C. 100 Employés D. 7 000 Dirhams
A. 4842,57 B. 4428,57
Q3. L’individu de cette population est : C. 4482,57 D. Autre
A. La banque commerciale B. Le dirham
Q15. Le premier quartile sera de l’ordre de :
C. Le salaire individuel D. L’employé
A. 4625 B. 5625
Q4. La variable étudiée est : C. 3625 D. Autre
A. Le dirham B. La banque
Q16. L’intervalle de variation sera de l’ordre de :
C. Le salarié D. Le salaire
A. 3500 B. 4000
Q5. La variable étudiée est de nature : C. 5000 D. Autre
A. Qualitative ordinale B. Quantitative discrète
C. Quantitative continue D. Qualitative nominale Q17. L’intervalle interquartile sera de l’ordre de :
A. 2575 B. 3575
Q6. L’outil adapté pour représenter cette distribution est le :
A. Diagramme en bâtons B. Tuyau d’orgue C. 1575 D. Autre
C. Histogramme D. Autre
Q18. La boîte à moustache est un graphique qui :
Q7. Si l’on veut présenter cette distribution par un diagramme A. Résume la tendance centrale d’une série.
en secteur à 180°, l’angle associé à la troisième classe est : B. Résume la dispersion d’une série.
A. 50 B. 40° C. Ne donne pas d’information sur la symétrie d’une série.
C. 70° D. Autre D. Ne permet pas de comparer plusieurs distributions.
Q8. La fréquence des employés, dont le salaire est compris Q19. L’écart type (*1000 dh) sera de l’ordre de :
entre 3000 dh et 4000 dh : A. 1,1362 B. 3,1362
A. 0,222 B. 0,111 C. 2,1362 D. Autre
C. 0,277 D. Autre
Q20. Le coefficient de variation est :
Q9. La fréquence des employés, dont le salaire est inférieur à A. 1,3575 B. 2,3575
4000 dh est : C. 3,9362 D. Autre
A. 0,111 B. 0,333
C. 0,888 D. Autre Q21. Il y a concentration si :
A. ∆𝑀 = 𝐼𝑉 B. ∆𝑀 = 𝑀𝑒
Q10. La fréquence des employés qui ont un salaire supérieur à C. ∆𝑀 ≤ 𝑁𝑖 𝑋𝑖 D. 𝑀𝑙 − 𝑀𝑒 ≠ 0
4000 dh :
A. 0,666 B. 0,888 Q22. La classe médiale est la :
C. 0,722 D. Autre A. Troisième classe B. Quatrième classe
C. Deuxième classe D. Dernière classe
Q11. Le salaire modal est égal à :
A. 4500 B. 4600 Q23. Le coefficient d’asymétrie est basé sur la détermination
C. 4700 D. Autre préalable du moment centré :
A. 𝑀2 B. 𝑀4
Q12. Le salaire moyen sera de l’ordre de : C. 𝑀3 D. 𝑀1
A. 4472,22 B. 4274,22

97
8 Receuil des examens

Variante A
Exercice 2
Le tableau suivant illustre la répartition d’un ensemble de consommateurs Dépense de consommation
selon leurs revenus 𝑋𝑖 et leurs dépenses de consommation quotidiennes 𝑌𝑗 Revenu 50 120 150
100 4 3 3
en dirham. 200 2 4 4

Q24. La distribution marginale du revenu est définie par : Q27. La moyenne marginale du revenu est :
A. 𝑛1. = 10; 𝑛2. = 10 B. 𝑛12 = 4 ; 𝑛22 = 2 A. 150 dh B. 160 dh
C. 𝑛1. = 6; 𝑛2. = 7 D. Autre C. 170 dh D. Autre
Q25. La distribution conditionnelle de 𝑋𝑖 /𝑌𝑗=3 est : Q28. La valeur de la moyenne conditionnelle 𝑦̅1 est :
A. 𝑛21 = 2 ; 𝑛22 = 4 B. 𝑛13 = 3; 𝑛23 = 4 A. 101 dh B. 95 dh
D. Autre C. 110 dh D. Autre
C. 𝑛.1 = 6; 𝑛.2 = 7; 𝑛.3 = 7
Q26. La moyenne marginale des dépenses est : Q29. La valeur de la moyenne conditionnelle 𝑥̅1 est :
A. 129,5 dh B. 109,5 dh A. 144,444 B. 155,555
C. 119,5 dh D. Autre C. 133,333 D. Autre

Exercice 3
Vous disposez d’un panier de produits dont on connait les prix et quantités à deux dates 0 et t.
Q30. L’indice du revenu moyen entre 2010 et 2016 vaut 80 Q32. L’indice de Laspeyres des prix à la date t base 100 à la
donc, l’indice du revenu moyen entre 2016 et 2010 égale à : date 0 se calcule par la formule :
A. 𝐼2016/2010 = 80 B. 𝐼2016/2010 = 95 ∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
A. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖 × 100 B. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 × 100
0 𝑖 𝑡 0 0
C. 𝐼2016/2010 = 125 D. Autre 𝑖 0 0

𝑝 ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 𝑝 ∑𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖


Q31. Un indice synthétique est une grandeur : C. 𝐿𝑡⁄ =∑ 𝑖 𝑖 × 100 D. 𝐿𝑡⁄ =∑ 𝑖 𝑖 × 100
0 𝑖 𝑝0 𝑞𝑡 0 𝑖 𝑝0 𝑞0
A. Simple de l’évolution d’une seule grandeur.
B. Composite résumant un ensemble d’indices simples. Q33. L’indice de Paasche des quantités à la date t base 100 à la
C. Qui s’intéresse à la variation d’un indice élémentaire. date 0 se calcule par la formule :
∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
D. Est la somme de plusieurs indices élémentaires. A. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝𝑖𝑡𝑞𝑡𝑖 × 100 B. 𝑃𝑡𝑞⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖 × 100
0 𝑖 0 0 0 𝑖 𝑡 0

∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
C. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝0𝑖 𝑞𝑡𝑖 × 100 D. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖 × 100
0 𝑖 0 0 0 𝑖 𝑡 0

Exercice 4
Le tableau suivant donne l’évolution de la demande mondiale du pétrole brut (PB) du premier trimestre 2014 (1Q2014) jusqu’au
dernier trimestre de l’année 2015 (4Q2015) en millions de barils par jour. Dans l’objectif de modéliser cette série, un étudiant « A »
a supposé que trend est une courbe, et l’étudiant « B » a supposé que le trend est une droite : 𝑪𝒕 = 𝒂 × 𝒕 + 𝒃
𝒕𝒊 1Q2014 2Q2014 3Q2014 4Q2014 1Q2015 2Q2015 3Q2015 4Q2015 Source :
opec.org (publication, mars 2015)
Demande mondiale 90,1 90,1 91,8 92,7 91,4 91,3 93,1 93,8

Q34. L’étudiant « A », a utilisé la technique de la moyenne Q38. Les paramètres de la droite du trend sont :
mobile (MM) de longueur (périodicité) :
𝑎 = 0,453 𝑎 = 89,746
A. MM(4) B. MM(5) A. { B. {
𝑏 = 89,746 𝑏 = −0,453
C. MM(6) D. Autre
𝑎 = −0,453 𝑎 = 89,746
Q35. La langueur de cette série l’oblige à calculer la : C. { D. {
𝑏 = −89,746 𝑏 = 0,453
A. MM pondérée B. Coefficients saisonniers
C. MM non-pondérée D. Autre Q39. En adoptant un schéma multiplicatif, le coefficient
saisonnier du cinquième trimestre est :
Q36. Le calcul de la moyenne mobile pour le 3Q2014 donne : A. 0,4980 B. 0,5042
A. 91,337 B. 91,175 C. 0,5023 D. Autre
C. 91,500 D. Autre
Q40. La série de la demande mondiale du PB, corrigée des
Q37. Par contre l’étudiant « B » a choisi le de calculer les variations saisonnières pour le trimètre 2 en 2014 vaut :
paramètres de la droite du Trend, pour cela le calcul de la A. 181,90 B. 281,90
covariance donne : C. 81,90 D. Autre
A. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 3,7214 B. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 2,7214
./.
C. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 4,7214 D. Autre Bonne chance à tous..

98
8 Receuil des examens

UNIVERSITÉ MOHAMMED V RABAT


Variante B
FACULTÉ DES SCIENCES JURIDIQUES ÉCONOMIQUES ET SOCIALES SALE
FILIÈRE : MANAGEMENT - S1 - ANNÉE UNIVERSITAIRE : 2017/2018
EXAMEN DE STATISTIQUE DESCRIPTIVE - SESSION ORDINAIRE-LE 08-01-18
Consignes de réponse : VARIANTE
Durée de l’épreuve : 1h30
Identifiez-vous par le code APOGEE.
Votre NOM et votre PRÉNOM, doivent être écrits en lettres majuscules ; une lettre par case
Cochez seulement là où les réponses sont correctes. Nombre de pages : 2
B
Exercice 1
Un groupe 75 de salariés parmi un ensemble de 5 000 employés opérants dans Salaire mensuel (*1000dh) Employés (%)
5 banques commerciales a été observé selon le salaire mensuel. 2 -- 3 13,33
3 -- 4 20.00
Le tableau suivant présente la répartition des salaires en milliers de dirhams. 4 -- 5 40,00
5 -- 7 26,67

Q1. La population étudiée est : C. 4433,33 D. Autre


A. 75 Salariés B. 100 Employés
Q13. Le troisième quartile sera de l’ordre de :
C. 5 000 Salariés D. 5 Banques commerciales
A. 6125 B. 5125
Q2. L’échantillon étudié est : C. 7125 D. Autre
A. 75 Salariés B. 5 000 Salariés
Q14. La médiane sera de l’ordre de :
C. 100 Employés D. 7 000 Dirhams
A. 4416,67 B. 6416,67
Q3. L’individu de cette population est : C. 5416,67 D. Autre
A. La banque commerciale B. L’employé
Q15. Le premier quartile sera de l’ordre de :
C. Le salaire individuel D. Le dirham
A. 2583 B. 4583
Q4. La variable étudiée est : C. 3583 D. Autre
A. Le groupe B. La banque
Q16. L’intervalle de variation sera de l’ordre de :
C. Le salarié D. Le salaire
A. 3500 B. 4000
Q5. La variable étudiée est de nature : C. 5000 D. Autre
A. Qualitative ordinale B. Quantitative discrète
C. Quantitative continue D. Qualitative nominale Q17. L’intervalle interquartile sera de l’ordre de :
A. 1542 B. 2542
Q6. L’outil adapté pour représenter cette distribution est le : C. 3542 D. Autre
A. Diagramme en bâtons B. Histogramme
C. Tuyau d’orgue D. Autre Q18. La boîte à moustache est un graphique qui :
Q7. Si l’on veut présenter cette distribution par un diagramme A. Résume la tendance centrale d’une série.
en secteur à 180°, l’angle associé à la troisième classe est : B. Résume la dispersion d’une série.
A. 40° B. 36° C. Ne donne pas d’information sur la symétrie d’une série.
C. 72° D. Autre D. Ne permet pas de comparer plusieurs distributions.

Q8. La fréquence des employés, dont le salaire est compris Q19. L’écart type (*1000 dh) sera de l’ordre de :
entre 3000 dh et 4000 dh : A. 0,1527 B. 1,1527
A. 0,2 B. 0,3 C. 2,1527 D. Autre
C. 0,4 D. Autre Q20. Le coefficient de variation est :
Q9. La fréquence des employés, dont le salaire est inférieur à A. 1,8457 B. 2,8457
4000 dh est : C. 3,8457 D. Autre
A. 0,666 B. 0,333 Q21. Il y a concentration si :
C. 0,866 D. Autre A. ∆𝑀 = 𝐼𝑉 B. ∆𝑀 = 𝑀𝑒
Q10. La fréquence des employés qui ont un salaire supérieur à C. ∆𝑀 ≤ 𝑁𝑖 𝑋𝑖 D. 𝑀𝑙 − 𝑀𝑒 ≠ 0
4000 dh : Q21. La classe médiale est la :
A. 0,666 B. 0,733 A. Troisième classe B. Deuxième classe
C. 0,333 D. Autre C. Quatrième classe D. Dernière classe
Q11. Le salaire modal est égal à : Q23. Le coefficient d’aplatissement est basé sur la
A. 4500 B. 4700 détermination préalable du moment centré :
C. 4600 D. Autre A. 𝑀2 B. 𝑀4
Q12. Le salaire moyen sera de l’ordre de : C. 𝑀3 D. 𝑀1
A. 4343,33 B. 4334,33

99
8 Receuil des examens

Variante B
Exercice 2
Le tableau suivant illustre la répartition d’un ensemble de consommateurs Dépense de consommation
selon leurs revenus 𝑋𝑖 et leurs dépenses de consommation quotidiennes 𝑌𝑗 Revenu 50 100 150
200 4 2 3
en dirham. 300 2 4 5

Q24. La distribution marginale du revenu est définie par : Q27. La moyenne marginale du revenu est :
A. 𝑛12 = 4 ; 𝑛22 = 2 B. 𝑛1. = 9; 𝑛2. = 11 A. 200 dh B. 210 dh
C. 𝑛1. = 6; 𝑛2. = 8 D. Autre C. 220 dh D. Autre
Q25. La distribution conditionnelle de 𝑋𝑖 /𝑌𝑗=2 est : Q28. La valeur de la moyenne conditionnelle 𝑥̅3 est :
A. 𝑛21 = 2 ; 𝑛22 = 4 B. 𝑛1. = 6; 𝑛2. = 11 A. 225 dh B. 250 dh
C. 275 dh D. Autre
C. 𝑛12 = 2; 𝑛22 = 4 D. Autre
Q26. La moyenne marginale des dépenses est : Q29. La valeur de la moyenne conditionnelle 𝑦̅1 est :
A. 100 dh B. 105 dh A. 94,444 B. 95,444
C. 150 dh D. Autre C. 96,444 D. Autre

Exercice 3
Vous disposez d’un panier de produits dont on connait les prix et quantités à deux dates 0 et t.
Q30. L’indice du revenu moyen entre 2010 et 2016 vaut 125 Q32. L’indice de Laspeyres des prix à la date t base 100 à la
donc l’indice du revenu moyen entre 2016 et 2010 égale à : date 0 se calcule par la formule :
A. 𝐼2016/2010 = 75 B. 𝐼2016/2010 = 85 ∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
A. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 × 100 B. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖 × 100
0 0 𝑖 𝑡 0
C. 𝐼2016/2010 = 80 D. Autre 𝑖 0 0

𝑝 ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 𝑝 ∑𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖


Q31. Un indice synthétique est une grandeur : C. 𝐿𝑡⁄ =∑ 𝑖 𝑖 × 100 D. 𝐿𝑡⁄ =∑ 𝑖 𝑖 × 100
0 𝑖 𝑝0 𝑞𝑡 0 𝑖 𝑝0 𝑞0
A. Simple qui trace l’évolution d’une seule grandeur.
B. Qui s’intéresse à la variation d’un indice élémentaire. Q33. L’indice de Paasche des quantités à la date t base 100 à la
C. Composite résumant un ensemble d’indices simples. date 0 se calcule par la formule :
∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
D. Est la somme de plusieurs indices élémentaires. A. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝𝑖𝑡𝑞𝑡𝑖 × 100 B. 𝑃𝑡𝑞⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖 × 100
0 𝑖 0 0 0 𝑖 𝑡 0

∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
C. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖 × 100 D. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝0𝑖 𝑞𝑡𝑖 × 100
0 𝑖 𝑡 0 0 𝑖 0 0

Exercice 4
Le tableau suivant donne l’évolution de l’offre mondiale du pétrole brut (BP) du premier trimestre 2014 (1Q2014) jusqu’au dernier
trimestre de l’année 2015 (4Q2015) en millions de barils par jour. Dans l’objectif de modéliser cette série, un étudiant « A » a
supposé que trend est une courbe, et un autre étudiant « B » a supposé que le trend est une droite : 𝑪𝒕 = 𝒂 × 𝒕 + 𝒃
𝒕𝒊 1Q2014 2Q2014 3Q2014 4Q2014 1Q2015 2Q2015 3Q2015 4Q2015 Source :
opec.org (publication, mars 2015)
Offre mondiale 91,2 91,5 92,4 93,6 92,2 93,5 93,4 93,1

Q34. L’étudiant « A », a utilisé la technique de la moyenne Q38. Les paramètres de la droite du trend sont :
mobile (MM) de longueur :
𝑎 = 91,289 𝑎 = 91,289
A. MM(2) B. MM(3) A. { B. {
𝑏 = 0,294 𝑏 = −0,294
C. MM(4) D. Autre
𝑎 = −0,294 𝑎 = 0,294
Q35. La langueur de cette série l’oblige à calculer la : C. {
𝑏 = −91,289
D. {
𝑏 = 91,289
A. MM non-pondérée B. Coefficients saisonniers
C. MM pondérée D. Autre Q35. En adoptant un schéma multiplicatif, le coefficient
saisonnier du cinquième trimestre est :
Q36. Le calcul de la moyenne mobile pour le 3Q2014 donne : A. 0,4974 B. 0,5172
A. 91,3 B. 92,3 C. 0,5016 D. Autre
C. 95,3 D. Autre
Q35. La série de l’offre mondiale du PB, corrigée des
Q37. Par contre l’étudiant « B », a choisi le de calculer les variations saisonnières pour le trimètre 2 en 2014 vaut :
paramètres de la droite du Trend, pour cela le calcul de la A. 186,93 B. 182,93
covariance donne : C. 183,93 D. Autre
A. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 1,7642 B. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 3,7642 ./.
Bonne chance à tous..
C. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 2,7642 D. Autre

100
8 Receuil des examens

UNIVERSITÉ MOHAMMED V RABAT


FACULTÉ DES SCIENCES JURIDIQUES ÉCONOMIQUES ET SOCIALES SALE
FILIÈRE : SEG - S1 - ANNÉE UNIVERSITAIRE : 2018/2019
EXAMEN DE STATISTIQUE DESCRIPTIVE - C&D&Manag - SESSION ORDINAIRE-LE 12-01-19
Consignes de réponse : Prof. Soussi Noufail Outmane
Durée de l’épreuve : 1h30
Identifiez-vous par le code APOGEE et par votre Nom et Prénom.
**Calculatrice autorisée*******Documents non autorisés**
12012019131
Cochez seulement là, où (une seule) la réponse est correcte. Nombre de pages : 3

Exercice 1
En 2018, une administration territoriale a mené une étude sur l’âge de Age de l’épouse au mariage Nb. de familles Cumulé
l’épouse au mariage. Elle concerne 100 familles qui se répartissent dans [16 – 18[ 25
[18 – 20[ 45
douze régions du royaume. Le tableau à-côté partage la répartition des [20 – 24[ 80
effectifs cumulés du nombre de familles selon l’âge de l’épouse au mariage. [24 – 30] 100

Q1. L’échantillon étudié est constitué de : Q8. L’âge modal est égal à :
A. 30 épouses B. 250 familles A. 21 B. 20
C. 100 familles D. 12 régions C. 22 D. 23
E. 100 épouses F. Autre E. 24 F. Autre
Q2. L’individu de cette population est : Q9. L’âge moyen est égal à :
A. L’épouse B. La famille A. 20,15 B. 20,57
C. L’âge D. La région C. 20,75 D. 21
E. le mariage F. Autre E. 21,15 F. Autre
Q3. La variable étudiée est : Q10. Le deuxième quartile sera de l’ordre de :
A. L’épouse au mariage B. L’âge de l’épouse A. 20,15 B. 20,57
C. Le couple marié D. Le nombre de famille C. 20,75 D. 21
E. L’âge du couple F. Autre E. 21,50 F. Autre
Q4. L’outil adapté pour représenter cette distribution est le : Q11. L’écart type sera de l’ordre de :
A. Diagramme en bâtons B. Tuyau d’orgue A. 1,5 B. 2,5
C. Histogramme D. Nuage de points C. 3,5 D. 4,5
E. Courbe F. Autre E. 5,5 F. Autre
Q5. L’effectif total est : Q12. La classe médiale est égale à :
A. 30 B. 100 A. [16 – 30] B. [18 – 20[
C. 250 D. 3000 C. [24 – 30] D. [20 – 24[
E. 80 F. Autre
E. [16 – 18[ F. Autre
Q6. La fréquence des personnes, dont l’âge est compris entre
18 ans et 24 ans : Q13. Il y a concentration si :
A. 0,55 B. 0,35 A. ∆𝑀 = 𝐼𝑉 B. ∆𝑀 = 𝑀𝑒
C. 0,80 D. 0,45 C. ∆𝑀 ≤ 𝑁𝑖 𝑋𝑖 D. 𝑀𝑙 − 𝑀𝑒 ≠ 0
𝑁𝑋
E. 0,125 F. Autre E. ∆𝑀 ≤ 𝑖2 𝑖 F. Autre
Q7. La fréquence des personnes, dont l’âge est inférieur à 24 Q14. Le coefficient de symétrie est égal à
ans est : A. -0,028 B. -2,039
A. 0,55 B. 0,80 C. 0,471 D. -1,028
C. 0,45 D. 0,35 E. 2,028 F. Autre
E. 0,20 F. Autre

Exercice 2
Un jeune stagiaire a croisé l’âge de l’épouse au mariage avec Age de l’épouse
celui du mari. Le tableau de contingence suivant donne la Age de l’époux [16-18[ [18-20[ [20-24[ [24-30]
[15-20[ 0,2 0,1 0 0
répartition conjointe des fréquences des âges de l’époux et de [20-25[ 0,05 0,1 0,3 0,05
l’épouse au mariage. [25-30] 0 0 0,05 0,15

Q15. La distribution marginale des effectifs de l’âge de Q17. La moyenne marginale de l’âge de l’époux 𝑋̅ vaut :
l’époux est : A. 21 B. 21,15
A. 𝑛1. = 3; 𝑛2. = 5; 𝑛3. = 2 B. 𝑛1. = 15; 𝑛2. = 20; 𝑛3. = 25 C. 21,50 D. 21,75
C. 𝑛1. = 5; 𝑛2. = 10; 𝑛3. = 20 D. 𝑛1. = 30; 𝑛2. = 50; 𝑛3. = 20 E. 22 F. Autre
E. 𝑛1. = 10; 𝑛2. = 15; 𝑛3. = 20 F. Autre
Q18. La moyenne conditionnelle 𝑋̅2 est égale à :
Q16. La distribution conditionnelle des fréquences de 𝑋𝑖 /𝑌𝑗=3 : A. 15 B. 20
A. 𝑓13 = 0,2; 𝑓23 = 0,05; 𝑓33 = 0 B. 𝑓31 = 0; 𝑓32 = 0,05; 𝑓33 = 0,15 C. 25 D. 30
C. 𝑓13 = 0; 𝑓23 = 0,05; 𝑓33 = 0,15 D. 𝑓13 = 0; 𝑓23 = 0,3; 𝑓33 = 0,05 E. 35 F. Autre
E. 𝑓31 = 0,1; 𝑓32 = 0,1; 𝑓33 = 0 F. Autre
Q19. La moyenne conditionnelle 𝑌̅2 est égale à:
A. 20 B. 21
C. 20,4 D. 21,4
E. 22 F. Autre
p. 1

101
8 Receuil des examens

Q20. La valeur de l’écart-type conditionnel 𝜎𝑋 2 égale à : Q21. La valeur de la variance conditionnelle 𝑉𝑎𝑟(𝑌2 ) est :
A. 2,5 B. 3,25 A. 6,44 B. 5,44
C. 4,75 D. 6,25 C. 4,44 D. 3,44
E. 5,5 F. Autre E. 2,44 F. Autre

Exercice 3
Deux produits A et B sont observés en termes de prix et de 2010 2018
Produits
quantités entre 2010 et 2018 de la manière suivante : Prix Quantités Prix Quantités
En prenant l’année 2010 comme base, répondez aux questions A 1 10 2 16
ci-après : B 5 3 4 10

Q22. L’indice des valeurs base 2010 vaut à : A. 𝐿𝑄18/10 = 100 B. 𝐿𝑄18/10 = 101
𝑣 𝑣
A. 𝐼18/10 = 100 B. 𝐼18/10 = 125
𝑣 𝑣
C. 𝐿𝑄18/10 = 102 D. 𝐿𝑄18/10 = 103
C. 𝐼18/10 = 160 D. 𝐼18/10 = 62,5
𝑣 E. 𝐿𝑄18/10 = 104 F. Autre
E. 𝐼18/10 = 128 F. Autre
Q26. L’indice de Paasche des quantités base 2010 vaut à :
Q23. L’indice des valeurs base 2018 vaut à : 𝑄 𝑄
𝑣
A. 𝐼10/18 = 100 𝑣
B. 𝐼10/18 = 125 A. 𝑃18/10 = 100 B. 𝑃18/10 = 125
𝑄 𝑃
𝑣
C. 𝐼10/18 = 160 𝑣
D. 𝐼10/18 = 62,5 C. 𝑃18/10 = 160 D. 𝑃18/10 = 128
𝑣 𝑄 F. Autre
E. 𝐼10/18 = 128 F. Autre E. 𝑃18/10 = 80
Q24. L’indice de Laspeyres des prix base 2010 vaut à : Q27. L’indice de Fisher des quantités base 2010 vaut à :
A. 𝐿𝑃18/10 = 125 B. 𝐿𝑃18/10 = 126 𝑄
A. 𝐹18/10 = 100 𝑄
B. 𝐹18/10 = 112,36
𝑃
C. 𝐿18/10 = 127 D. 𝐿𝑃18/10 = 128 𝑄
C. 𝐹18/10 = 127,75 𝑄
D. 𝐹18/10 = 114,02
E. 𝐿𝑃18/10 = 129 F. Autre 𝑄 F. Autre
E. 𝐹18/10 = 132,16
Q25. L’indice de Laspeyres des quantités base 2010 vaut à : .

Exercice 4
Le tableau suivant présente entre 2016 et 2018, l’évolution des indices de prix la consommation (IPC) et de l’évolution des
indices des smic (SMIC). Ces indices sont en base 100 en 2014 T1.
2016 T1 2016 T2 2016 T3 2017 T1 2017 T2 2017 T3 2018 T1 2018 T2 2018 T3 Source : Données
IPC 102,3 102,0 105,2 106,0 107,3 109,4 112,2 113,8 115,0 fictives
SMIG 101,6 103,6 104,9 108,2 108,2 109,8 112,4 114,1 116,5

Q28. Soit la relation linéaire 𝑆𝑀𝐼𝐶𝑡 = 𝑎 + 𝑏 × 𝐼𝑃𝐶𝑡 alors : Q35. Retenant un schéma multiplicatif pour la série IPC alors :
A. 𝑎 = −1,111 B. 𝑎 = −3,333 C. A. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 + 𝑆𝑡 + 𝜉𝑡 B. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 × 𝑆𝑡
D. 𝑎 = −2,222 E. 𝑎 = −4,444 F.C. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 × 𝑆𝑡 + 𝜉𝑡 D. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 + 𝑆𝑡
G. 𝑎 = −0,123 H. Autre I. E. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 × 𝑆𝑡 × 𝑆𝑀𝐼𝐺 F. Autre
Q29. Et la pente vaut : Q36. Si 𝐶𝑡 est une droite alors la pente vaut:
A. 0,016 B. 1,016 A. -1,726 B. 1,795
C. 2,016 D. 3,016 C. 1,726 D. -1,795
E. 4,016 F. Autre E. 0,726 F. Autre
Q30. La covariance entre IPC et SMIG est de Q37. Si 𝐶𝑡 est une droite alors l’ordonnée à l’origine vaut:
A. 20,3 B. 21,8 A. 90,5 B. 95,5
C. 20,5 D. 21,2 C. 99,5 D. 105,5
E. 20,7 F. Autre E. 115,5 F. Autre
Q31. Le coefficient de corrélation linéaire est de : Q38. Par conséquent 𝐶1 vaut
A. 0,98 B. 0,75 A. 101,2 B. 103,0
C. 0,89 D. 0,95 C. 104,7 D. 106,4
E. 0,85 F. Autre E. 108,1 F. Autre
Q32. La moyenne mobile du SMIG associée au 2017 T1 est : Q39. Si 𝐶𝑡 est une droite, le coefficient saisonnier 𝑆8 vaut :
A. 105,6 B. 103,4 A. 𝑠1 = 0,975 B. 𝑠1 = 1,996
C. 108,7 D. 107,1 C. 𝑠 2 = 0,996 D. 𝑠 2 = −1,996
E. Calcul impossible F. Autre E. 𝑠 3 = 1,996 F. 𝑠 3 = −0,996
Q33. La moyenne mobile de l’IPC associée au 2016 T2 est : Q40. La composante aléatoire 𝜉8 vaut :
A. 103,4 B. 105,6 A. 0,965 B. 1,965
C. 103,2 D. 104,4 C. 2,965 D. 3,965
E. Calcul impossible F. Autre E. 4,965 F. Autre
./.
Q34. La langueur de cette série oblige de calculer la :
Bonne chance
A. Un coefficient saisonnier B. 2 coefficients saisonniers
C. 3 coefficients saisonniers D. 4 coefficients saisonniers
E. 8 coefficients saisonniers F. Autre

p. 2

102
9 REFERENCES BIBLIOGRAPHIQUES

1. Assez simple, un excellent petit livre


A NDRÉ V ESSEREAU, La statistique. PUF Collection "Que sais-je ?"
2. Assez Mathématique
JEAN -P IERRE L ECOUTRE (2ème edition, 2002) : Statistiques et probabilités, ma-
nuel et exercices corrigés. Editions Dunod
3. Assez simple, un excellent manuel avec exerxices
B RIGITTE E SCOCOFIER, J ÉRÔME P AGÉS (1997), Initiation aux traitements sta-
tistiques, Presses Universitaires de Rennes.
4. Manuel et exercices corrigés
B ERNARD G OLDFARB ET C ATHERINE P ARDOUX ( 6éme édition 2011), Introduc-
tion à la méthode statistique, Editions Dunod.
5. Manuel et exercices corrigés
F ABRICE M AZEROLLE (2005), Statistique descriptive, Mémentos LMD, 2diteur
Gualino.
6. Cours
A BDENBI E L M ARZOUKI (2013), Statistique Descriptive, cours FSJES Agdal.
7. Cours et exercices
Y OUCEF E LMEDDAH, Notions essentielles de statistique, cours.
8. Exercices corrigés
P IERRE B AILLY ET C HRISTINE C ARRÈRE, Statistiques descriptives Exercices, Col-
lection « Libres Cours Économie »

103

Vous aimerez peut-être aussi