Académique Documents
Professionnel Documents
Culture Documents
ÉLÉMENTS DE COURS
STATISTIQUE DESCRIPTIVE
** SEMESTRE ¶ **
Sep 2019
Objectifs du module
Ce module se propose de fournir aux étudiants l’essentiel des connaissances qui leur
permettront de mieux comprendre les concepts et les outils de la statistique descrip-
tive. Le cours proposé est un document d’initiation dont l’objectif principal est l’assi-
milation des différentes techniques de base de la statistique ainsi que l’interprétation
des résultats qui en découlent.
i
Table des matières
ii
Table des matières
2.2.4 Quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.1 Intervalle de variation (étendue) . . . . . . . . . . . . . . . . . . . . 32
2.3.2 Intervalles inter-quantiles . . . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Boîte à moustache . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.4 Variance, écart-type et coefficient de variation . . . . . . . . . . . . 35
2.3.4.1 Variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3.4.2 Propriètés de la variance . . . . . . . . . . . . . . . . . . . 36
2.3.4.3 Ecart-type . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3.4.4 Coefficient de variation . . . . . . . . . . . . . . . . . . . . 37
2.4 Paramètres de forme et d’aplatissement . . . . . . . . . . . . . . . . . . . 38
2.4.1 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.4.2 Coefficient d’asymétrie de Fisher (skewness) . . . . . . . . . . . . . 38
2.4.3 Paramétre d’aplatissement (kurtosis) . . . . . . . . . . . . . . . . . 39
2.5 Paramètres de concentration . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5.1 Détermination algébrique de la concentration . . . . . . . . . . . . 41
2.5.1.1 Médiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5.1.2 Mesure de la concentration . . . . . . . . . . . . . . . . . . 42
2.5.2 Détermination graphique de la concentration . . . . . . . . . . . . 43
2.5.2.1 Courbe de Lorenz . . . . . . . . . . . . . . . . . . . . . . . 43
iii
Table des matières
6 Indices 69
6.1 Présentation et définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.1.1 Présentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.1.2 Définition d’un indice . . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.2 Indices élémentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.2.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.2.2 Propriétés des indices élémentaires . . . . . . . . . . . . . . . . . . 71
6.2.2.1 Circularité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.2.2.2 Transitivité . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.2.2.3 Réversibilité . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3 Indices synthétiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.2 Logique de la construction des indices composites . . . . . . . . . 73
6.3.3 Indice de Laspeyres . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.3.3.1 Laspeyres des prix . . . . . . . . . . . . . . . . . . . . . . . 74
6.3.3.2 Laspeyres des quantités . . . . . . . . . . . . . . . . . . . . 75
6.3.4 Indice de Paasche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3.4.1 Paasche des prix . . . . . . . . . . . . . . . . . . . . . . . . 75
6.3.4.2 Paasche des quantités . . . . . . . . . . . . . . . . . . . . . 76
6.3.4.3 Comparaison des indices de Laspeyres et de Paasche . . 76
6.3.5 Indice de Fisher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3.5.1 Fischer des prix . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3.5.2 Fischer des quantités . . . . . . . . . . . . . . . . . . . . . 77
iv
Table des matières
7 Travaux Dirigés 78
7.1 Série du TD N°1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
7.2 Série du TD N°2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7.3 Série du TD N°3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
7.4 Série du TD N°4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
7.5 Série du TD N°5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
7.6 Série du TD N°6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
v
1 Notions de base de la statistique
descriptive
1.1 Introduction
Bien que le nom de statistique soit relativement récent – on attribue en général l’ori-
gine du nom au 18e siècle de l’allemand Staatskunde – cette activité semble exister
dès la naissance des premières structures sociales. D’ailleurs, les premiers textes
écrits retrouvés étaient des recensements du bétail, des informations sur son cours
et des contrats divers. On a ainsi une trace de recensements en Chine au 23e siècle
av. J.-C. ou en Égypte au 18e siècle av. J.-C. Ce système de recueil de données se
poursuit jusqu’au 17e siècle.
Ce n’est qu’au 18e siècle que l’on voit apparaître le rôle prévisionnel des statistiques
avec la construction des premières tables de mortalité.
1.1.2 Introduction
La statistique est une méthode scientifique qui désigne l’ensemble des méthodes ma-
thématiques relatives à la collecte, à l’organisation, à la présentation, à l’utilisation, au
résumer et à l’analyse de données numériques (d’une enquête, d’une étude ou d’une
expérience). Aussi bien, ces opérations permettent de tirer des conclusions logiques
et de prendre des décisions dans les situations d’incertitude qu’on rencontre dans le
domaine économique, dans celui des affaires ou dans d’autres sciences sociales.
1
1 Notions de base de la statistique descriptive
En résumé, la statistique (est une science) désigne l’ensemble des méthodes scien-
tifiques qui permettent d’analyser quantitativement un ensemble d’informations
cohérent.
Attention :
1. Il ne faut pas confondre la statistique qui est la science qui vient d’être définie
et une statistique qui est un ensemble de données chiffrées sur un sujet précis.
2. Les premières statistiques correctement élaborées ont été celles des recense-
ments démographiques. Ainsi, le vocabulaire statistique est essentiellement ce-
lui de la démographie.
3. Les ensembles étudiés sont appelés population. Les éléments de la population
sont appelés individus ou unités statistiques.
4. La population peut être étudiée selon un ou plusieurs caractères.
2
1 Notions de base de la statistique descriptive
La statistique, avec ces deux branches, est à la base de toute recherche scientifique.
En effet, l’instrument statistique est indispensable pour le chercheur en économie
et en gestion afin d’effectuer ces recherches et ces calculs économiques, et ce pour
dégager les lois économiques et pour en faire des prévisions temporelles.
Statistique descriptive Statistique mathématique
(inférentielle)
Décrire numériquement un ensemble : Utiliser des données d’un sous-ensemble
Collecter, traiter et présenter les résultats (ex. un sondage) pour en induire les
d’un ensemble d’informations. caractéristiques de l’ensemble global
(moyenne, proportion, variance, etc.)
1.2.1 Terminologie
3
1 Notions de base de la statistique descriptive
Illustration
Exemple
— Si l’on veut étudier l’âge des étudiants de la faculté des sciences juridiques éco-
nomiques et sociales de salé, la population considérée est celle des étudiants.
— Pour établir une étude sur l’âge des étudiants de la faculté, on peut prélever au
hasard un certain nombre d’étudiants - un échantillon- (par exemple, les ins-
crits en S1 à la filière d’économie et de gestion) parmi tous les autres étudiants
de la faculté.
— Les unités statistiques sont repérées par les noms et prénoms des étudiants.
— Le critère étudié de cette population est l’âge des étudiants.
— On peut imaginer plusieurs critères à étudier comme le sexe, le poids, la taille,
la filière d’attache, les matières choisies.
— Les modalités du caractère « âge des étudiants » peuvent être : 17, 18, 19, 20 et
21.
— Le caractère « sexe » peut être présenté en deux modalités : masculin et féminin.
4
1 Notions de base de la statistique descriptive
Exemple
— Si l’on reprend notre exemple qui porte sur la population des étudiants de la
faculté des sciences juridiques économiques et sociales de Salé, et parmi tous
les critères quand l’on peut imaginer, certains sont quantitatifs comme l’âge, le
poids, la taille, nombre de frères et de sœurs, nombre de modules validés, etc.
— Cela nous permet d’effectuer des calculs numériques sur ces variables : poids
moyen, taille maximale, taille minimale, etc.
— Aussi on distingue entre une variable discrète comme nombre de frères et sœurs,
nombre de modules validés. Les valeurs ainsi observées sont des valeurs iso-
lées. Et entre une variable continue comme l’âge, le poids, la taille dont les
valeurs sont continues dans le temps.
— D’autres sont qualitatifs, c’est le sexe par exemple dans ce cas il n’y pas moyen
de calculer le sexe moyen, car cette notion n’a pas de sens et ne peut pas être
calculée. Aussi on distingue parmi ces variables qualitatives celles qui sont ordi-
nales telles qu’une prestation excellente est meilleure qu’une prestation bonne,
((a) nulle, (b) médiocre, (c) moyenne, (d) assez bonne, (e) très bonne, (f) excellente)
etc. et celles qui sont nominales par exemple si l’on demande aux étudiants ce
qu’évoque pour eux la présence à un cours. Plus précisément, ils doivent cocher
une des cases suivantes : ((a) inévitable, (b) volontaire, (c) pas la peine).
5
1 Notions de base de la statistique descriptive
— Série de données dont les valeurs non groupée sont quantitatives discrètes,
c’est-à-dire, dont les valeurs sont isolées dans le temps.
— Distribution groupée dont les valeurs sont présentées sous forme de moda-
lités quantitatives continues dans un tableau appelé tableau statistique.
Exemple : La série suivante résulte d’une courte enquête auprès de quelques étu-
diants (n = 13) de la faculté pour connaître leurs âges : (quel est votre âge ?)
1 2 3 4 5 6 7 8 9 10 11 12 13
Age 18 21 19 19 17 22 27 18 18 17 20 20 23
Modalités Effectifs
Entre 16 et 18 2
Entre 18 et 21 7
Plus de 21 4
6
1 Notions de base de la statistique descriptive
Résumé
1. La statistique descriptive est un ensemble de méthodes permettant de décrire
les unités statistiques qui composent une population
2. La statistique mathématique s’appuie sur la statistique descriptive, ainsi que
sur les probabilités pour formuler des lois à partir de l’observation d’échan-
tillons.
3. L’économétrie est l’application de la statistique (descriptive et mathématique) à
la mesure et à l’étude chiffrée des grandeurs économiques.
4. En statistique, la population désigne un ensemble d’unités statistiques. Les
unités statistiques sont les entités abstraites qui représentent des personnes,
des populations d’animaux ou des objets.
5. On parle d’échantillon d’une population statistique pour désigner le prélève-
ment, au hasard ou selon une méthode qui permet d’assurer la représentativité
par rapport à la population totale, d’un petit nombre d’unités statistiques au
sein de la population.
6. Par ailleurs, il est fréquent aussi que l’on divise une population en sous-ensembles
au moyen de certains critères (ou dimensions ou encore caractéristiques).
7. On distingue deux sortes de critères : les critères quantitatifs et les critères
qualitatifs. Les critères quantitatifs sont les critères qui sont représentés par
des nombres et à condition que les opérations arithmétiques effectuées sur ces
nombres aient un sens. C’est la raison pour laquelle on les appelle aussi parfois
des variables.
8. Les critères qualitatifs sont tous les critères qui ne sont pas représentés de
façon numérique. Pour les distinguer des variables, on les appelle des «carac-
tères». Les caractères prennent des modalités.
9. Les unités statistiques d’une population peuvent être représentées sous forme
d’une série simple ou regroupées. Lorsqu’elles sont regroupées, on les appelle
des distributions continues.
7
2 Distribution statistique à un seul caractère
Définition
— Un tableau statistique est une représentation chiffrée d’un caractère ou plu-
sieurs caractères (variables), chacun est caractérisé par une ou plusieurs mo-
dalités (valeurs).
— C’est un moyen souvent indispensable, en tout cas très utile, de classification
et de présentation des unités d’une population statistique.
— Un tableau doit fournir des renseignements clairs, précis, facilement compré-
hensibles. En général, on doit respecter quatre règles primordiales de présenta-
tion : le titre, les intitulés des lignes et des colonnes, l’unité utilisée et la source
des données.
2.1.1.1 Présentation
Avant même d’être présentées sous forme de tableau, les données sont parfois pré-
sentées sous forme de séries brutes ou de vecteurs. Cette présentation est utile pour
certains calculs, mais on utilise bien plus fréquemment les tableaux pour présenter
les caractéristiques des unités d’une population statistique.
Cas des observations isolées : Le tableau brut se présente sous la forme suivante :
Individus Variable
1 x1
2 x2
... ...
n xn
8
2 Distribution statistique à un seul caractère
Cas des observations groupées : Lorsque le nombre d’individus observé étant en gé-
néral important, le tableau précédant ne permet pas d’analyser l’information obtenue.
Modalités Effectif
m1 n1
m2 n2
... ...
mk nn
Il est donc nécessaire de créer un tableau plus synthétique où les observations iden-
tiques (possédant la même modalité) ont été regroupées. Ce tableau est appelé : le
tableau statistique pour les observations groupées.
Exemple illustratif : (la taille des étudiants) On dispose d’un échantillon de 20 ré-
ponses d’étudiants à la question « quelle est votre taille ?». Bien qu’il s’agisse d’une va-
riable quantitative continue, les données sont présentées par taille et non par groupe
de tailles. On a donc le tableau de la série brute (observée individuellement) ou distri-
bution non groupée :
n° 1 2 3 4 5 6 7 8 9 10
Taille 158 177 181 190 163 158 165 164 166 169
n° 11 12 13 14 15 16 17 18 19 20
Taille 173 175 174 180 164 166 172 163 188 150
Par ailleurs, le tableau ci-dessous représente les données par groupe de tailles (dis-
tribution groupée) :
Modalités de X Effectif ni
[150, 160[ 3
[160, 170[ 8
[170, 180[ 5
[180, 190] 4
Total 20
9
2 Distribution statistique à un seul caractère
Modalités Effectif
m1 n1
Chaque modalité peut correspondre à zéro m2 n2
une ou plusieurs unités statistiques ... ...
(individus) constituant l’échantillon mk nn
concerné
— Un centre de classe
Limsup + LimInf
Cci = (2.2)
2
Remarque
— Il peut avoir des cas où la dernière classe n’a pas d’étendue. Il convient gé-
néralement de prendre comme intrevalle de cette classe, celui de la classe qui
prècède.
— Il arrive aussi que la première classe considérée n’ait pas d’étendue. Dans ce
cas on prendra celle de la classe qui suit.
Exemple illustratif : (la taille des étudiants) La deuxième classe (ou encore la deuxième
modalité) représente les données par groupe de tailles est égale à :[160, 170[. Signifie
que cette classe comptabilise les étudiants qui ont une taille entre160 et170 cm, en
incluant ceux qui ont une taille égale à160 cm et excluant ceux qui ont une taille égale
à170 cm.
L’amplitude de la deuxième classe[160, 170[ est égale à :
10
2 Distribution statistique à un seul caractère
nk
mk nk n n
Cette dernière présentation s’avère souvent peu commode et l’on préfère de ce fait
la présentation sous forme de pourcentages et/ou de cumuls. (voir les définitions
ci-dessous)
Exemple : Le tableau suivnant présente les 35 unités statistiques sous forme d’un
regroupement par trois classes. Les chiffres sont cependant « bruts », car aucun calcul
de pourcentages et/ou de cumuls n’a été effectué sur les 35 unités statistiques.
Modalités de X Effectif ni
[10, 20[ 13
[20, 40[ 12
[40, 50[ 10
Total 35
ni
fi = n ∀i = 1, 2, 3, ..k (2.3)
La fréquence d’une modalité est le rapport de l’effectif absolu d’une classe (de moda-
lités ou de valeurs) à l’effectif total. Il est préféré d’exprimer cette fréquence en % :
pi = fi × 100 (2.4)
Exemple illustratif : (la taille des étudiants) Partant du tableau des tailles des étu-
diants regroupées, ajoutons une colonne dans laquelle les chiffres bruts sont présen-
tés en proportion.
11
2 Distribution statistique à un seul caractère
Modalité de X Effectif ni Effectif relatif fi (Ni %) (Fi %) (Ni &) (Fi &)
3 3
[150, 160[ 3 20 = 0, 15 3 20 = 0, 15 20 1
8 11 3
[160, 170[ 8 20 = 0, 40 3+8 20 = 0, 55 20 − 3 1− 20 = 0, 85
5 16
[170, 180[ 5 20 = 0, 25 11 + 5 20 = 0, 80 9 0, 85 − 0, 40 = 0, 45
4 20
[180, 190] 4 20 = 0, 20 16 + 4 20 = 1 4 0, 45 − 0, 25 = 0, 2
20
Total 20 20 = 1 − − − −
16 4
N2 %= N2 % +n2 = 3 + 8 = 11 F4 %= F3 % +f4 = 20 +20 = 1
Calculs : 3 17
N3 &= N2 & −n2 = 17 + 8 = 9 F2 &= F1 & −f1 = 1 − 20 = 20 = 0, 85
12
2 Distribution statistique à un seul caractère
Interprétation du tableau :
— L’effectif cumulé croissant de la classe 2 : [160, 170[ est de 11, ce qui signifie qu’il
y a 11 étudiants qui ont « AU PLUS » une taille de 170 cm. (c’est à dire une taille
SRICTEMENT INFÉRIEURE à 170 cm) (ou encore, il y a 11 étudiants qui ont une
taille comprise entre[150, 170[)
— L’effectif cumulé décroissant de la classe 3 : [170, 180[ est de 9, ce qui signifie
qu’il y a 9 étudiants qui ont « AU MOINS » une taille de 170 cm. (c’est à dire une
taille SUPÉRIEURE OU ÉGALE à 170 cm) (ou encore, il y a 9 étudiants qui ont une
taille comprise entre[170, 190])
— La fréquence cumulée croissante de la classe [160, 170[ est de 0, 55, ce qui signifie
que 55% des étudiants ont « AU PLUS » une taille de 170 cm.
— La fréquence cumulée décroissante de la classe [170, 180[ est 0, 45, ce qui signifie
que 45% des étudiants ont « AU MOINS » une taille de 180 cm.
Remarque :
1. Le tableau est un outil statistique plus intéressant que le graphique. Néan-
moins, pour des études précises, le tableau est souvent nécessaire et même
parfois plus utile que le graphique.
2. Si l’on dispose d’un tableau, on peut faire un graphique. Inversement, si l’on
dispose seulement d’un graphique, on ne peut pas revenir au tableau initial (ou
très rarement). Le graphique est ainsi très utilisé par ceux qui veulent conser-
ver le monopole d’une base de données tout en présentant publiquement son
contenu.
L’intérêt d’un graphique c’est de synthétiser des informations statistiques d’une ma-
nière imagée, c’est à dire globale. Il est parfois indispensable de recourir à la présen-
tation graphique des données.
13
2 Distribution statistique à un seul caractère
Définition
— Les effectifs d’une variable qualitative peuvent être représentés soit par des
diagrammes en secteurs soit par des diagrammes en bandes.
— Le plus élémentaire est de porter les valeurs du caractère en abscisse et les
effectifs en ordonnée (ou l’inverse), on obtient alors un diagramme en tuyaux
d’orgue (ou diagramme à bandes).
— La longueur du tuyau est proportionnelle à l’effectif de la modalité.
Pas de flèches
150
Sciences Economiques 90 L'ordre dans lequel sont
présentés les Tyaux n'a
pas d'importance
Sciences de Gestion 200 100
Management 120
50
Total 560 Pas de
flèches
0
Droit privé Droit public Sciences Sciences de Management
2.1.3.2 Secteurs à 360o Economiques
Filières dispensées
Gestion
Définition Les diagrammes en secteurs (camemberts) sont utiles lorsque l’on veut
représenter la relation entre une partie et un tout. Ils permettent de visualiser des
14
2 Distribution statistique à un seul caractère
parts relatives, dans des surfaces ou secteurs de cercles, que l’on peut différencier
par des couleurs. On distingue les secteurs à 360o , et ceux à 180o ,.
Remarque
1. Pour les secteurs à 180o , il suffit d’appliquer la formule suivante
Définition
— Avant toute tentative de représentation, il y a lieu de distinguer entre variable
discrète et variable classée (regroupements en classes).
— Deux types de graphiques sont intéressants de représenter :
15
2 Distribution statistique à un seul caractère
Définition
— Les valeurs discrètes xi prises par les variables sont placées sur l’axe des abs-
cisses, et les effectifs (ou les fréquences) sur l’axe des ordonnées. La hauteur
du bâton est proportionnelle à l’effectif.
— Aussi les axes sont fléchés (différence avec les tuyaux d’orgue)
7
Nombre d’enfants Nombre de famille 6
6
0 6 5
5
Nombre de famille
1 4 4
4
2 5 3
2
3 2 2
1
4 1 1
Total 18 0
0 1 2 3 4
Nombre d'enfants
Remarques :
16
2 Distribution statistique à un seul caractère
NOMBRE DE FAMILLE
5
0
0 1 2 3 4
NOMBRE D'ENFANTS
Définition
— Les ogives permettent de visualiser l’évolution des effectifs (fréquences) cumulés
croissants ou décroissants.
— Aussi les axes sont fléchés
100%
90% Ogives
80%
70%
60%
50%
40%
30%
20%
10%
0%
0 1 2 3 4
Remarques
1. Les deux courbes sont symétriques par rapport à un axe horizontal d’ordonnée
n 1
2 pour les effectifs, 2 pour les fréquences.
2. On utilise l’effectif (fréquence) cumulé croissant et décroissant pour répondre
aux ?
3. Respectivement : Quel est le nombre (%) d’individus dont la valeur du caractère
est inférieure ou égale à x ?
4. Quel est le nombre (%) d’individus dont la valeur du caractère est strictement
supérieure à x ?
17
2 Distribution statistique à un seul caractère
Se souvenir :
1. Le treme (au plus x) équivalent à ( x) donc utiliser N (x) ou F (x) croissants
2. Le treme (plus que x) équivalent à ( x) donc utiliser N (x) ou F (x) décroissant
— Exemple : le treme (au plus 6) équivalent à ( 6) donc on pourra lire la
fréquence cumulée croissante en 6, c-à-d F (6) = 0, 9
1
0,9
0,8
0,7
0,6
0,5 Fic
0,4 FiD
0,3
0,2
0,1
0
3 4 6 7 8
Attention
— Il y a lieu de regarder si les classes sont d’amplitudes égales ou inégales.
18
2 Distribution statistique à un seul caractère
— Le cas des classes d’amplitudes égales ne pose aucune difficulté car il suffit de
reporter en ordonnée l’effectif (la fréquence).
— Dans le cas d’amplitudes inégales on reporte en ordonnée la densité di (effectif
divisé par l’amplitude de la classe). Ou encore di (fréquence divisé par l’ampli-
tude de la classe).
— Donc il y a 4 types d’histogrammes à étudier
[150, 160[ 3 0, 15 7
6
[160, 170[ 8 0, 40 5
5
4
[170, 180[ 5 0, 25 4
3
3
[180, 190] 4 0, 20 2
Total 20 1 1
0
[150, 160[ [160, 170[ [170, 180[ [180, 190]
0,15 0,04
[150, 160[ 3 0, 15 10 10 = 0, 015
0,4
[160, 170[ 8 0, 40 10 10 = 0, 04
0,45
[170, 190] 9 0, 45 20 20 = 0, 022 0,02
Total 20 1 − −
0
[150, 160[ [160, 170[ [170, 190[
19
2 Distribution statistique à un seul caractère
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
0 1 2 3 4
Exemple illustratif (la taille des étudiants) On obtiendrait sur le même graphique
les deux fonctions de répartition croissante et décroissante.
1
0,9 FiC
0,8 FiD
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
150 160 170 180 190
20
2 Distribution statistique à un seul caractère
Définition
— Les caractéristiques de tendance centrale essayent de donner la valeur la plus
représentative d’un ensemble de valeurs numériques.
— Les paramètres statistiques ont pour but de résumer, à partir de quelques
nombres clés, l’essentiel de l’information relative à l’observation d’une variable
quantitative.
— On définira plusieurs sortes de paramètres :
— Certains, comme la moyenne, seront dits de tendance centrale car ils re-
présentent une valeur numérique autour de laquelle les observations sont
réparties.
— D’autres, par exemple, seront dits de dispersion car ils permettent de résu-
mer le plus ou moins grand étalement des observations de part et d’autre de
la tendance centrale.
2.2.1 Mode
2.2.1.1 Définition
— C’est la valeur la plus fréquente = La valeur dont la fréquence est la plus élevée.
— Le mode est noté :Mo
d1
Mo = xinf
i + ai × (2.7)
d1 + d2
21
2 Distribution statistique à un seul caractère
avec xinf
i est la borne inférieure de la classe modale
ai est l’amplitude de classe
d1 est la différence :
d1 = ni − ni−1 (2.8)
d2 est la différence :
d2 = ni − ni+1 (2.9)
n° 1 2 3 4 5 6 7 8 9 10
Taille 158 177 181 190 163 158 165 164 166 169
n° 11 12 13 14 15 16 17 18 19 20
Taille 173 175 174 180 164 166 172 163 188 150
Algébriquement
Dans ce cas nous avons une distribution avec 4 modes L’effectif associé à ces
modes est de 2.
Mo1 = 158, Mo2 = 163, Mo3 = 164 et Mo4 = 166
Remarque :
Il peut exister une distribution :
— uni-modale
— bimodale
— tri-modale . . ..
Graphiquement
2
ni
0
150 158 163 164 165 166 169 172 173 174 175 177 180 181 188 190
22
2 Distribution statistique à un seul caractère
9
Xi ni fi Amplétude
8
[150, 160[ 3 0, 15
7
Classe modale [160, 170[ 8 0, 40 6
𝑑2
𝑑1
[170, 180[ 5 0, 25 5
4
[180, 190] 4 0, 20
3
Total 20 1
2
La classe modale
1
0
[150, 160[ [160, 170[ [170, 180[ [180, 190]
Calcul
d1 8−3
Mo = xinf
i + ai × = 160 + 10 × = 166, 25
d1 + d2 5 + (8 − 5)
2.2.2 Médiane
2.2.2.1 Définition
— Est l’observation placée au milieu d’une série classée par ordre croissant ou
décroissant.
— La médiane est notée Me .
Cas des valeurs discrètes (isolées, non groupées) Il faut suivre les étapes suivantes :
1. Classement croissant ou décroissant de la série : calcul d’une fonction cumu-
lée : c’est-à-dire Ni %, Ni &ou Fi %, Fi &
2. Chercher le rang : la valeur de la variable correspondant à une fonction cumulée
n
égale à 2 pour les effectifs cumulés Ni , et 0,5 pour les fréquences cumulés Fi .
Mais si :
n+1
a) n est impair, Me = 2 . Exemple : Soit la série suivante 75, 62, 57, 12, 18. la
médiane est égale au 3éme terme ( 5+1
2 = 3), donc Me = 57
Cas des valeurs continues (classées, groupées) Il faut suivre les étapes suivantes :
23
2 Distribution statistique à un seul caractère
Rang 1 2 3 4 5 6 7 8 9 10 11 12
Taille (tri %) 150 158 158 163 163 164 164 165 166 166 169 172
Rang 13 14 15 16 17 18 19 20
Taille (tri %) 173 174 175 177 180 181 188 190
166 + 169
Me = = 167, 5
2
Graphiquement
Fic
Car n est pair
0,5
0
150 158 163 164 165 166 169 172 173 174 175 177 180 181 188 190
24
2 Distribution statistique à un seul caractère
— étape 1 : Tri des fréquences (classer les effetcifs retatifs par ordre croissant)
c.à.d. calcul de Fi %
— étape 2 : On détermine la classe médiane[160, 170[
— étape 3 : On applique la méthode de l’extrapolation linéaire pour déterminer la
Me
160 𝑀𝑒 170
On applique la formule :
Me − 160 0, 5 − 0, 15
= ⇐⇒ Me ≈ 168, 75
170 − 160 0, 55 − 0, 15
Graphiquement
FiC
0,5
0
150 160 170 180 190
2.2.3 Moyennes
Définition
— Le mot « moyenne » a pour origine le latin «médius», mot signifiant «qui est au
milieu».
— La moyenne arithmétique d’une série ou moyenne arithmétique simple se cal-
cule par une formule qui est donnée par l’expression :
Pn
i=1 xi
x= (2.10)
n
25
2 Distribution statistique à un seul caractère
Définition
— La moyenne arithmétique d’une distribution continue ou moyenne arithmétique
pondérée se calcule par une formule qui est donnée par l’expression :
Pk k
ni × xci X
x = i=1 = fi × xci (2.11)
n
i=1
Avec ni l’effectif absolu, fi l’effectif relatif, xci centre de la classe i, k nombre total des
classes.
Remarque x est la plus rencontrée dans les études économiques, dans le calcul
du : revenu moyen, chiffre d’affaires moyen, âge moyen, taille moyenne. . .
Cas des valeurs discrètes (isolées, non groupées) On applique la formule (2.10) :
P20
i=1 xi x1 + x2 + ... + x20 158 + 177 + ... + 150
x= = =
n 20 20
x = 169, 8
P4
i=1 ni × xci (n1 × xc1 ) + (n2 × xc2 ) + .. + (n4 × xc4 )
x= =
n n
x = 170
26
2 Distribution statistique à un seul caractère
Définition
— Si xi sont les observations positives d’une variable quantitative, la moyenne
géométrique simple est égale
v à:
u n
uY √
G= t n
xi = n x1 × x2 × .... × xn (2.12)
i=1
Exemple Soit la série de chiffres {8, 5, 9, 13, 25}. La moyenne géométrique de cette
série est égale à :
v
u 5
uY √ √ √
5
5
G=t xi = 5 x1 × x2 × .... × xn = 5 8 × 5 × 9 × 13 × 25 = 11700
i=1
G ≈ 10, 32
Définition Si (xi , ni ) sont les couples d’une distribution et les xi étant tous positives,
la moyenne géométrique pondérée est égale à :
v
u k q
uY
n
G= t xni i = n xn1 1 × xn2 2 × .... × xnk k (2.13)
i=1
xi ni
25 10
8 16
4 25
12 20
— Pour calculer la moyenne géométrique pondérée, on peut passer par les loga-
rithmes népériens (ln) :
v
u 4
uY p
G = t xni i =
71 71
2510 × 816 × 425 × 1220
i=1
27
2 Distribution statistique à un seul caractère
1 149, 815
lnG = × (10 × ln25 + 16 × ln8 + 25 × ln4 + 20 × ln12) = ≈ 2, 1100704
71 71
donc
G = e2,11 ≈ 8, 2488
Définition
— Soit la série {x1 , x2 , .., xn }. La moyenne harmonique simple de cette série est
égale à :
n
H = Pn 1 (2.14)
i=1 xi
Exemple Soit la série de chiffres {8, 5, 9, 13, 25}. La moyenne harmonique de cette
série est égale à :
5 5 5
H = P5 1
= 1 1 1 1 1 =
i=1 xi 8 + 5 + +9 13 + 25
0, 553034
H ≈ 9, 04
Définition
— Si (xi , ni ) sont les couples d’une distribution, la moyenne harmonique pondérée
est égale à :
n
H = Pk ni
(2.15)
i=1 xi
— Elle intervient lorsqu’on demande une moyenne de valeurs où ils existent des
liens de proportionnalité inverse, se présentant sous forme de quotient de deux
x
variables y (km/h, km/litre, dh/m²...).
xi ni
25 10
8 16
4 25
12 20
28
2 Distribution statistique à un seul caractère
71 71 71
H = P4 = 10 16 =
ni
i=1 xi 25 + 8 + 25
4 +
20
12
10, 1337
H = 6, 882
Définition Soit la série {x1 , x2 , .., xn }. La moyenne quadratique simple de cette série
est égale à :
v
u n
u1 X
Q=t x2i (2.16)
n
i=1
v
u n r r
u1 X
2 (−4)2 + (−2)2 + 22 + 42 40
Q= t xi = =
5 5 5
i=1
Q = 2, 8284
Définition
— Si (xi , ni ) sont les couples d’une distribution, la moyenne quadratique pondérée
est égale à : v
u k
u1 X
Q=t (ni × x2i ) (2.17)
n
i=1
— Une moyenne qui trouve des applications lorsque l’on a affaire à des phéno-
mènes présentant un caractère sinusoïdal avec alternance de valeurs positives
et de valeurs négatives. Elle est, de ce fait, très utilisée en électricité.
29
2 Distribution statistique à un seul caractère
xi ni ni ×x2i
25 10 6250
8 16 1024
4 25 400
12 20 2880
Somme 71 10554
r
10554
Q= ≈ 12, 1921
71
2.2.4 Quantiles
Définitions
— Font partie des caractéristiques de position
— Il y a :
— 1 médiane Me qui sépare les observations en 2 groupes d’effectifs égaux
— 3 quartiles Q1 , Q2 , Q3 qui séparent les observations en 4 groupes d’effectifs
égaux.
— 9 déciles D1 , D2 , ..., D9 qui séparent les observations en 10 groupes d’effectifs
égaux.
— 99 centiles C1 , C2 , ..., C99 qui séparent les observations en 100 groupes d’ef-
fectifs égaux.
— La détermination de ces caractéristiques est identique à celle de la médiane.
— Les quartiles sont obtenus lorsque l’on a cumulé 25, 50, 75 % de la population
— Les déciles sont obtenus lorsque l’on a cumulé 10, 20, ...., 90 % de la population
— Les centiles sont obtenus lorsque l’on a cumulé 1, 2, ...., 99 % de la population
Cas des valeurs discrètes (isolées, non groupées) La détermination des quartiles
Q1 , Q2 , Q3 est identique de celle de la Me
— Etape 1 : Tri croissant
Rang 1 2 3 4 5 6 7 8 9 10 11 12
Taille (tri %) 150 158 158 163 163 164 164 165 166 166 169 172
30
2 Distribution statistique à un seul caractère
Rang 13 14 15 16 17 18 19 20
Taille (tri %) 173 174 175 177 180 181 188 190
Graphiquement
1
FiC
0,75
0,5
0,25
0 𝑸𝟐 = 𝑴𝒆
150 160 𝑸𝟏 170 𝑸𝟑 180 190
160 𝑄2 170
Q1 − 160 0, 25 − 0, 15
=
170 − 160 0, 55 − 0, 15
31
2 Distribution statistique à un seul caractère
Q1 = 162, 5
𝑄3 180
170
Q3 − 160 0, 75 − 0, 55
=
170 − 160 0, 80 − 0, 55
Q3 = 178
Définition
— La mesure des écarts des observations autours des coefficients de tendance
centrale se fait par l’intermédiaire de nombreux paramètres de dispersion :
— Minimum et maximum
— Intervalle de variation (étendue de la série)
— Intervalles inter quantiles
— Variance
— Écart type
— Coefficient de variation
— Écart moyen et la boite à moustache
— Les indicateurs de tendance centrale sont utiles pour caractériser une distribu-
tion statistique, ils restent insuffisants. Ils ne donnent aucune indication sur
la manière dont sont groupées ces informations.
Définitions
— Maximum d’une série statistique à caractère quantitatif : est la valeur maximale
que peut prendre le caractère. Noté : M ax(xi )
— Minimum d’une série statistique à caractère quantitatif : est la valeur minimale
que peut prendre le caractère. Noté : M in(xi )
32
2 Distribution statistique à un seul caractère
Cas des valeurs discrètes (isolées, non groupées) M in(xi ) = 150 et M ax(xi ) = 190
IV = 150 − 190 = 40
Cas des valeurs continues (classées, groupées) M in(xi ) = 155 et M ax(xi ) = 185
avec xi = Centre de classe
IV = 155 − 185 = 30
Définition (L’écart-interquartile)
— C’est la différence entre le troisième quartile et le premier quartile.
— L’intervalle-interquartile sert à apprécier la dispersion de la série.
— Les valeurs de l’intervalle entre Q1 et Q3 délimitent une plage représentant en-
viron 50 % des valeurs de la série autour de la médiane.
Cas des valeurs discrètes (isolées, non groupées) Nous avons :Q1 = 163 et Q3 = 175.
Donc :
33
2 Distribution statistique à un seul caractère
Cas des valeurs continues (classées, groupées) Nous avons :Q1 = 162, 5 et Q1 =
178. Donc :
Définition La boîte à moustache « box plot », est un graphique qui résume la disper-
sion d’une série à partir de 5 valeurs : la valeur minimale M in(x) et la valeur maximale
M ax(x), l’intervalle interquartile (Q1 et Q3 ) et la médiane Me .
𝑄1 𝑀𝑒 𝑄1
𝑀𝑖𝑛(𝑥) 𝑀𝑖𝑛(𝑥)
Remarque
185
178
175
1er Quartile
Minimum
170 168,75
167,5 Médiane
Maximum
163 162,5 3eme Quartile
155
150
150
140
La taille (cas discret) La taille (cas continue)
34
2 Distribution statistique à un seul caractère
2.3.4.1 Variance
n
1X 2
var(x) = xi − x2 (2.20)
n
i=1
var(x) = 98, 16
k
1X
var(x) = σx2 = ni × (xi − x)2 (2.21)
n
i=1
n
1X
var(x) = ni × x2i − x2 (2.22)
n
i=1
var(x) = 95
35
2 Distribution statistique à un seul caractère
Remarque
— On voit donc sur cet exemple que plus la variance est grande, plus la série est
dispersée autour de la moyenne.
— Cas où la variance est égale à zéro, signifie que chaque terme quadratique de la
série est nul et donc la série est constante (xi = x).
— Une autre formule pour calculer la variance :
var(x) = x2 − x2 (2.23)
2.3.4.3 Ecart-type
v
u n
p u1 X
σx = var(x) = t x2i − x2 (2.27)
n
i=1
36
2 Distribution statistique à un seul caractère
v
u n
u1 X
σx = t ni × x2i − x2 (2.29)
n
i=1
De façon générale :
— Si σx est faible, cela signifie que les valeurs sont assez concentrées autour de
x.
— Si σx est élevé, cela veut dire au contraire que les valeurs sont plus dispersées
autour de x.
Définition
— D’où l’idée de calculer le coefficient de variation qui est égal à l’écart-type divisé
par la moyenne, c’est-à-dire :
σx
CV = (2.30)
x
— On l’utilise pour comparer des séries statistiques : par exemple comparer la
taille des étudiants de l’année universitaire 2016-2017 avec celle de 2015-2016.
on peut conclure que la distribution de la taille s’est réduite par exemple.
σx 9, 91
CV = = ⇒ CV = 0, 0583
x 169, 8
σx 9, 75
CV = = ⇒ CV = 0, 0573
x 170
37
2 Distribution statistique à un seul caractère
2.4.1 Moments
Définitions
1. On appelle moment simple (à l’origine) d’ordrer ∈ N le paramètre :
n
1X r
mr = xi (2.31)
n
i=1
n
1X
Mr = (xi − x)r (2.32)
n
i=1
Définition
— Le coefficient d’asymétrie de Fisher est basé sur la détérmination préalable de
M3 : Le moment centré d’ordre trois qui est défini par :
n
1X
M3 = (xi − x)3 (2.33)
n
i=1
M3
g1 = (2.34)
(σx )3
38
2 Distribution statistique à un seul caractère
— Il en résulte que puisque l’écart-type est toujours positif, son cube l’est
aussi ; ceci implique que g1 a bien le même signe que M3 .Ce coefficient
est bien un nombre sans unité (sans dimension).
158 177 181 190 163 158 165 164 166 169
173 175 174 180 164 166 172 163 188 150
x= 169, 8 cm
var(x) = 98, 16 cm2
σx = 9, 91 cm
M3 = 254 cm3
g1 = 0, 261 (asymétrie à gauche)
x= 170 cm
var(x) = 95 cm2
σx = 9, 75 cm
M3 = 150 cm3
g1 = 0, 162 (asymétrie à gauche)
39
2 Distribution statistique à un seul caractère
Définition
— Le coefficient d’aplatissement est basé sur la détérmination préalable de M4 :
Le moment centré d’ordre quatre qui est défini par :
n
1X
M4 = (xi − x)4 (2.35)
n
i=1
M4
g2 = −3 (2.37)
(σx )4
— Une courbe mésokurtique si g2 ≈ 0
— Une courbe leptokurtique si g2 0. Elle est plus pointue et possède des
queues plus longues.
— Une courbe platykurtique si g2 ≺ 0. Elle est plus arrondie et possède des
queues plus courtes.
Définition
— La concentration n’a de sens que pour des données positives et a des variables
ou des caractères dont l’addition a un sens : des patrimoines, des surfaces, des
chiffres d’affaires, etc. Des variables telles que l’âge, la taille ou le poids, n’a pas
nécessairement de signification.
— Il existe deux méthodes pour mesurer la concentration : par le calcul algébrique
ou par les méthodes graphiques. Avant de les étudier, il faut d’abord introduire
la notion de médiale.
40
2 Distribution statistique à un seul caractère
2.5.1.1 Médiale
34340
= 17170
2
On constate que le salaire médial se trouve quant à elle entre S OUKAINA et S ARA (soit
environ 2250 dirhams, par interpolation).
1900 + 2150
= 2025
2
Signifie que 50 % de la masse salariale est versée aux salariés gagnants moins de 2025
dirhams.
41
2 Distribution statistique à un seul caractère
Pk
ni xi
i=1
− Ni Xi
Ml = X inf + a 2 (2.38)
ni xi
X inf est la borne inférieur de la classe médiale. xi est le centre de la classe médiale.
Ni Xi est l’effectif cumulé de strictement inférieur a ni xi et a est l’amplitude de la classe
médiale.
∆M = Ml − Me (2.39)
∆M = Ml − Me = 23, 46 − 21, 09 = 2, 37
42
2 Distribution statistique à un seul caractère
∆M Ml − M e 2, 37
= = = 0, 11 ≺ 20
IV M ax(xi ) − M in(xi ) 30 − 10
Définition C’est une courbe qui sert à représenter visuellement la façon dont se
répartit une masse (salariale, revenus, ect.) au sein d’une population pour faire des
comparaisons :
— La courbe de Lorenz permet de représenter graphiquement une dispersion.
— C’est un indicateur particulier parmi les indicateurs qui ont été développés pour
mesurer les inégalités
— Se faire une idée du caractère le plus ou moins égalitaire de la répartition de
cette masse au sein de la population Comparer ainsi de différentes populations
entre elles.
— Comparer la distribution d’une masse au sein d’une population en deux ou
plusieurs points du temps afin de savoir si l’inégalité augmente ou diminue.
— C’est la courbe obtenue en mettant en abscisses les fréquences cumulées en %,
et en ordonnées ni xi cumulés en %.
Mise en oeuvre
43
2 Distribution statistique à un seul caractère
— 1ère étape : classer les valeurs obtenues pour chaque individu en ordre crois-
sant.
— 2ème étape : calculer des déciles, c’est-à-dire les 9 valeurs qui séparent la po-
pulation en 10 classes égales.
— 3ème étape : tracer la courbe des répartitions.
— 4ème étape : tracer la bissectrice. La bissectrice représente la répartition égali-
taire : 20 % de la population détient 20 % des revenus, 60 % en détient 60 %
des revenus, etc.
44
3 Distribution statistique à deux caractères
(avec observations groupées)
3.1.1 Définition
3.1.2.1 En effectifs
n° 1 2 3 4 5 6 7 8 9 10
Taille 158 177 181 190 163 158 165 164 166 169
Poids 55 80 72 77 53 58 74 64 72 74
n° 11 12 13 14 15 16 17 18 19 20
Taille 173 175 174 180 164 166 172 163 188 150
Poids 64 72 74 64 55 65 61 50 73 48
45
3 Distribution statistique à deux caractères (avec observations groupées)
3.1.2.2 En fréquences
3.2.1 Définition
46
3 Distribution statistique à deux caractères (avec observations groupées)
Effectif nj fj Effectif ni fi
[45, 55[ 3 0, 15 [150, 160[ 3 0, 15
[55, 65[ 8 0, 4 [160, 170[ 8 0, 4
[65, 80[ 9 0, 45 [170, 180[ 5 0, 25
P
20 1 [180, 190] 4 0, 2
P
20 1
— Lecture
f.1 = 0, 05 f1. = 0, 15
f.2 =? f2. =?
f.3 =? f4. =?
Modalités de Yj Effectif nj fj
[45, 55[ 3 0, 15
[55, 65[ 8 0, 4
[65, 80[ 9 0, 45
P
20 1
47
3 Distribution statistique à deux caractères (avec observations groupées)
Donc :
50 × 3 + 60 × 8 + 72, 5 × 9
y= = 64, 125
20
— Le poids des étudiants est égal en moyenne 64, 125 kg
2. Calculons la moyenne de la distribution marginale des Xi : à partir du tableau
de contingence, on peut extraire le tableau des catégories de la taille des étu-
diants suivant :
Catégories de la taille des étudiants
Modalités de Xi Effectif ni fi
[150, 160[ 3 0, 15
[160, 170[ 8 0, 4
[170, 180[ 5 0, 25
[180, 190] 4 0, 2
P
20 1
Donc :
48
3 Distribution statistique à deux caractères (avec observations groupées)
Pk
i=1 ni. × x2i
var(x) = − x2 (3.4)
n..
Application :
p
σy = var(y) (3.5)
p
σy = 68, 296 = 8.26
p
σx = var(x) (3.6)
√
σx = 170 = 13, 038
Signifie que les tailles des étudiants s’écartent de 13, 038 cm par rapport à la
moyenne.
3.3.1 Définition
49
3 Distribution statistique à deux caractères (avec observations groupées)
1. Exemple : Distribution par catégories de taille dont le poids est dans l’intervalle
[55, 65[, c’est-à-dire la taille pour un poids j = 2 . Notée : Distribution Condi-
tionnelle des Xi /Yj=2
j=1 j=2 j=3
[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 1 n12 = 2 0 3
i=2 [160, 170[ 2 n22 = 3 3 8
i=3 [170, 180[ 0 n32 = 2 3 5
i=4 [180, 190] 0 n42 = 1 3 4
Total 3 n.2 = 8 9 20
[150, 160[ 2 0, 15
[160, 170[ 3 0, 4
[170, 180[ 2 0, 25
[180, 190] 1 0, 2
P
8 1
— Lecture
2. Exemple : Distribution par catégories de poids dont la taille est dans l’intervalle
[170, 180[, c’est-à-dire la distribution du poids pour une taille i = 3 . Notée :
Distribution conditionnelle des Yj /Xi=3
j=1 j=2 j=3
[45, 55[ [55, 65[ [65, 80[ Total
i=1 [150, 160[ 1 2 0 3
i=2 [160, 170[ 2 3 3 8
i=3 [170, 180[ n31 = 0 n32 = 2 n33 = 3 n3. = 5
i=4 [180, 190] 0 1 3 4
Total 3 8 9 20
50
3 Distribution statistique à deux caractères (avec observations groupées)
[45, 55[ 0 0
[55, 65[ 2 0, 4
[65, 80[ 3 0, 6
P
5 1
— Lecture
f31 = ? f32 = ? f33 =? f13 =? f3. =?
n31 = ? n32 = ? n33 =? n13 =? n3. =?
Application :
Pp
j=1 n3j × yj 50 × 0 + 60 × 2 + 72, 5 × 3
y3 = = = 67, 5
n3. 5
Le poids moyen des étudiants pour une taille comprise entre 170 et 180 cm est
de 67, 5 kg.
2. La Moyenne conditionnelle de la taille pour j = 2 des Xi /Yj=2 est notée x2 :
Pk k
i=1 ni2 × xi X
x2 = = fi2 × xi (3.8)
n.2
j=1
Application :
51
3 Distribution statistique à deux caractères (avec observations groupées)
Pk
i=1 ni2 × x2i
var(x2 ) = − x22 (3.10)
n.2
Application :
Application :
p p
σy3 = var(y3 ) = 37, 5 = 6, 123
Signifie que les poids des étudiants dont la taille est comprise entre 170 et 180
cm s’écartent de 6, 123 kg par rapport au poids moyen de cette catégorie à savoir
67, 5 cm.
52
3 Distribution statistique à deux caractères (avec observations groupées)
Application :
p p
σx2 = var(x2 ) = 93, 75 = 9, 682
Signifie que les tailles des étudiants dont le poids est compris entre 55 et 65 kg
s’écartent de 9, 682 cm par rapport à la taille moyenne de cette catégorie à savoir
167, 5 cm.
Remarque
— La variance marginale est donc égale à la somme de la moyenne des variances
conditionnelles et de la variance des moyennes conditionnelles.
53
4 Distribution statistique à deux caractères
(avec observations non groupées)
4.1 Introduction
Présentation
— Dans ce chapitre, on va étudier les relations, lorsqu’elles existent, entre deux
distributions statistiques dont les valeurs sont observées isolément.
— Par exemple la relation entre deux variables : publicité et vente, ou entre le
revenu et les dépenses.
— On peut s’intéresser à une liaison éventuelle entre les deux variables.
— La régression fournit une expression de cette liaison sous la forme d’une fonc-
tion mathématique.
— La corrélation renseigne sur l’intensité de cette liaison.
Définition
— Considérons deux caractères numériques x et y. Si à partir d’une étude menée
sur un échantillon de taille n on obtient les valeurs xi et yi .
— La représentation graphique dans le plan de l’ensemble des points de coordonnées(xi , yi )
pour i = 1; 2; . . . .n s’appelle nuage statistique.
n° 1 2 3 4 5 6 7 8 9 10
Taille 158 177 181 190 163 158 165 164 166 169
Poids 55 80 72 77 53 58 74 64 72 74
n° 11 12 13 14 15 16 17 18 19 20
Taille 173 175 174 180 164 166 172 163 188 150
Poids 64 72 74 64 55 65 61 50 73 48
54
4 Distribution statistique à deux caractères (avec observations non groupées)
85
80
75
70
65
60
55
50
45
Le Poids
40
140 150 160 170 180 190 200
La Taille
Définition
— A partir de ce nuage de points, il faut chercher à exprimer la relation entre les
deux variables à l’aide d’une équation mathématique.
— On pourrait le faire de plus d’une façon, mais on va se limiter ici à la plus
simple, c’est-à-dire l’équation linéaire de la forme affine.
y = ax + b (4.1)
85
80
75
70
65
60
55
50
45
Le Poids
40
140 150 160 170 180 190 200
La Taille
55
4 Distribution statistique à deux caractères (avec observations non groupées)
Définition
— Le problème consiste donc à trouver une droite d’équation y = ax+b qui traduit,
avec le plus de fidélité, le lien entre x et y.
— Pour cela nous allons utiliser une technique appelée : la méthode des moindres
carrés.
— Qui consiste à minimiser la somme des carrés des distances Di verticales entre
la droite et chacun des points (xi , yi ).
— Tout calcul fait, on trouve les P
paramètres de la droite de régression a et b :
n
xi yi − n × xy
a = Pi=1n 2 2 (4.2)
i=1 xi − n × x
b=y−a×x (4.3)
Calculs
56
4 Distribution statistique à deux caractères (avec observations non groupées)
Pn
xi yi − n × xy
a = Pi=1
n 2 2 b=y−a×x
i=1 xi − n × x
4.3.1 Covariance
Définition
— La covariance de Pearson entre deux variables aléatoires est un nombre per-
mettant de quantifier leurs écarts conjoints par rapport à leurs moyennes res-
pectives.
— La covariance est une extension de la notion de variance.
n
1X
cov(x, y) = (xi − x)(yi − y) (4.4)
n
i=1
" n #
1X
cov(x, y) = xi yi − xy (4.5)
n
i=1
Propriétés
— La covariance est un indice synthétique
— cov(x, y) 0 ⇐⇒ x et y varient dans le même sens.
— cov(x, y) ≺ 0 ⇐⇒ x et y varient dans le sens opposé.
— cov(x, y) = cov(y, x) ⇐⇒ x et y jouent le même rôle dans la formule de la cova-
riance.
— cov(x, x) = var(x)
57
4 Distribution statistique à deux caractères (avec observations non groupées)
x = 169, 8 y = 65, 25
Calcul de la covariance
58
4 Distribution statistique à deux caractères (avec observations non groupées)
2. La covariance dépend des unités de mesure dans lesquelles sont exprimées les
variables considérées.
3. On peut lier la notion de la variance et celle de la covariance (inégalité de Auchy
Schwarz)
[cov(x, y)]2 var(x) × var(y) (4.6)
Définition
— Le coefficient de corrélation linéaire de Pearson mesure l’intensité de la relation
linéaire entre deux variables
cov(x, y)
corr(x, y) = rxy = (4.7)
σx σy
Il est égale à la covariance des variables centrées et réduite respectivement par les
écarts types de ces variables
x i − x yi − y
corr(x, y) = rxy = cov , (4.8)
σx σy
Propriétés
— Le coefficient de corrélation a le même signe que la covariance ; il est nul quand
la covariance est nulle.
— Il est dangereux d’interpréter le coefficient de corrélation comme un pourcen-
tage.
— Ce coefficient est toujours compris entre 1 et −1
— |r| = 1 ⇐⇒ relation fonctionnelle linéaire.
— r = 0 ⇐⇒ indépendance linéaire.
— 0 ≺ |r| ≺ 1 ⇐⇒ dépendance linéaire autant plus forte que est r est grand.
— |r| prend le signe de la pente de la droite de régression.
cov(x, y) 66, 7
corr(x, y) = rxy = = = 0, 72
σx σy 9, 91 × 9, 35
59
5 Distribution statistique à deux caractères
(Analyse des séries chronologiques)
— Pour commencer nous allons présenter un exemple illustratif qui va nous ac-
compagner durant le chapitre suivant.
— Soit la série chronologique (temporelle) qui correspond aux variations des ventes
enregistrées pendant la période 2006 − 2009, les données sont trimestrielles (en
Milliers de Dh) sont présentées dans le tableau suivant :
Trimestre 1 30 32 33 35
Trimestre 2 11 12 13 14
Trimestre 3 12 13 15 17
Trimestre 4 36 37 39 41
But L’étude des séries chronologiques sert à faire de la prévision à court, moyen et
long terme. Il existe des méthodes prévisionnelles quantitatives et qualitatives. Les
méthodes quantitatives se subdivisent en deux catégories. Il y a les méthodes d’extra-
polation qui produisent des prévisions sur le principe d’une corrélation de la variable
étudiée avec le temps et les méthodes explicatives qui reposent sur les corrélations
entre la variable étudiée et différentes variables explicatives.
Définition
— Une série temporelle est une suite d’observations d’une quantité répétée dans
le temps.
— On énonce en général l’hypothèse que les intervalles de temps sont équidis-
tants.
60
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
45
40
35
30
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
— Une fois le dessin est établi, il parait bien que cette une fonction compliquée à
étudier et a en ressortir avec des prévisions en utilisant les méthodes usuelles
déjà étudiées.
— Donc lorsqu’on est d’habitude en face d’un problème, on essaie de le décompo-
ser en plusieurs composantes en en étudié chacune d’elles.
61
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
— Le modèle multiplicatif : Yt = St × Ct + εt
— Le modèle multiplicatif deuxième type : Yt = St × Ct × εt
— Le modèle additif : Yt = St + Ct + εt
— Le modèle mixte.
— Le modèle linéaire, Le modèle polynomiale, le modèle exponentiel, etc.
— Il y a des modèles plus compliqués détecter à l’aide des logiciels spécialisé
comme Eviews, Stata, etc.
Avec :
— St représente la composante saisonnière
— Ct relative au Trend
— εt représente la composante aléatoire.
Pour notre exemple nous avons choisi le modèle ou le schéma multiplicatif, car à par-
tir de la représentation graphique de la série chronologique, on peut remarquer que le
deux droites délimitant les maxima et les minima se croisent (dans le cas du modèle
additif les limites supérieur et inférieur de la série seront des droites parallèles).
La tendance est un lieu géométrique simple qui peut être une droite ou une courbe.
Et on est toujours en présence d’une période qui peut être un mois, un trimestre, un
semestre, etc. Donc une périodique qui se réfère à une année. La détection du Trend
se fait en utilisant la :
Deuxième méthode : On constate sur le dessin que les pics des maxima et des
minima peuvent s’ajuster sur une droite : donc le trend est une droite.
L’interprétation de cette tendance est très importance, elle nous renseigne si la série
évolue, et présente un indicateur solide pour la prise de décision.
62
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
(MCO). Nous allons calculer les paramètres de la droite linéaire du trend qui prend la
forme suivante :
Ct = ati + b + εt (5.1)
— Pour cela nous calculons les paramètres du modèle de régression simple par
les formules suivantes :
cov(t, Ct )
a= (5.2)
var(t)
Ct = ati + b (5.4)
Yt Ct Yt Ct Yt Ct Yt Ct
45
40
35
30
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
63
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
1 X yt
si = (5.5)
card(Ti ) Ct
n o
Ti = 1; 5; 9; 13
n o
T2 =
2; 6; 10; 14
n o (5.6)
T3 = 3; 7; 11; 15
n o
T4 =
4; 8; 12; 16
St = s i ; t ∈ Ti (5.7)
1 X yt
S2 = s2 =
card(T2 ) Ct
1 y2 y6 y10 y14
S2 = s2 = + + +
4 C2 C6 C10 C14
Avec :
C2 = 0, 4647×(2) + 20, 425
yt Yt Ct yt Yt Ct
2006 1 30 20, 8897059 C1 2008 9 33 24, 6073529
2 11 21, 3544118 C2 10 13 25, 0720588 C10
3 12 21, 8191176 11 15 25, 5367647
4 36 22, 2838235 12 39 26, 0014706
2007 5 32 22, 7485294 2009 13 35 26, 4661765
6 12 23, 2132353 C6 14 14 26, 9308824 C14
7 13 23, 6779412 15 17 27, 3955882
8 37 24, 1426471 16 41 27, 8602941
21 11 12 13 14
S2 = s = + + +
4 21, 354 23, 213 25, 072 26, 931
64
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
S2 = s2 = 0, 52
On déduit que :
s2 = S2 = S6 = S10 = S14 = 0, 52
s1 = S1 = S5 = S9 = S13 = 1, 38
s3 = S3 = S7 = S11 = S15 = 0, 58
s4 = S4 = S8 = S12 = S16 = 1, 53
Yt (5.8)
Ycvs,t = St ; 1≤t≤n
Yt 14
Ycvs,t = = = 27, 05
St 0, 52
εt = Yt − St × Ct (5.9)
Ci-dessous le tableau des données qui récapitule les différents calculs de la série des
vente corrigée des variations saisonnières. Notée Ycvs,t
65
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
yt Yt Ct St εt Ycvs,t
2006 1 30 20, 8897059 1, 38 1, 24 21, 7932045
2 11 21, 3544118 0, 52 −0, 05 21, 2517546
3 12 21, 8191176 0, 58 −0, 58 20, 8068107
4 36 22, 2838235 1, 53 1, 91 23, 5308615
2007 5 32 22, 7485294 1, 38 0, 68 23, 2460848
6 12 23, 2132353 0, 52 −0, 02 23, 1837323
7 13 23, 6779412 0, 58 −0, 66 22, 5407116
8 37 24, 1426471 1, 53 0, 06 24, 1844965
2008 9 33 24, 6073529 1, 38 −0, 87 23, 972525
10 13 25, 0720588 0, 52 0, 02 25, 11571
11 15 25, 5367647 0, 58 0, 27 26, 0085134
12 39 26, 0014706 1, 53 −0, 78 25, 4917666
2009 13 35 26, 4661765 1, 38 −1, 43 25, 4254053
14 14 26, 9308824 0, 52 0, 06 27, 0476877
15 17 27, 3955882 0, 58 1, 20 29, 4763152
16 41 27, 8602941 1, 53 −1, 62 26, 7990367
45 Yt Ct Yt cvs
40
35
30
25
20
15
10
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Définition
66
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
Exemple pratique Prenons comme exemple les données suivantes enregistrées dans
le tableau qui suit, qui illustrent l’évolution des variations de l’indice des prix d’une
marchandise de1980 jusqu’à 1987.
67
5 Distribution statistique à deux caractères (Analyse des séries chronologiques)
Ip MM MMC Ip MM MMC
— Chaque trimestre est affecté du même poids, mais cette méthode est moins
avantageuse car la moyenne mobile est plus étendue. Donc, plus de données
qui seront « perdues » aux deux extrémités de la série.
— Le graphique de la série brute et la série corrigée des variations saisonnières
par la Méthode des Moyennes mobiles d’ordre pair :
390
370
IP
MM
350
330
310
290
270
250
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32
Donc il est clair que dans le cas où la périodicité est impaire le calcul de la moyenne
mobile non pondérée se fait de manière naturelle.
68
6 Indices
6.1.1 Présentation
— Nous avons vu que la séries statistique peut être résumée par ses paramètres
de position, de dispersion et de concertation.
— Mais si on dispose de plusieurs séries de grandeurs « élémentaires » (en général
des séries de prix ou des séries de quantités de biens), comment fait-on pour
les résumer en une seule grandeur « synthétique » ?
Questions
— Calculer le prix moyen « agrégé » pour ces trois biens ?
— Est-ce que l’on peut observer son évolution ?
— Un indice est une mesure de la variation d’une grandeur comparée à une valeur
de référence égale à 100 et appelée «base».
— Un indice nous permet de réaliser et faciliter des comparaisons.
69
6 Indices
Exemple En décembre 2010, l’Indice des prix à la consommation de l ’HCP, base 100
en 1998, s’établissait ainsi :
Lecture
— Les prix ont augmenté de17, 70 % entre1998 et 2007 (en 9 ans)
— Les prix ont augmenté de 19, 17 % entre1998 et 2008 (en 10 ans)
— Les prix ont augmenté de 119, 17−117, 7 = 1, 47 % entre décembre2007et novembre2008
(en1an)
— Les prix ont évolué de 118, 88−119, 17 = −0, 29 % (diminution) entre novembre2008et
décembre2009 (en2ans)
6.2.1 Définition
— Un indice élémentaire est un rapport entre deux valeurs d’une série à deux
dates ou deux espaces différents.
— Il est représenté par :
Xt
It/0 = (6.1)
X0
70
6 Indices
6.2.2.1 Circularité
Démonstration
Xt Xt Xt−1 Xt−2 Xt0 +1
I t/t0 = × 100 = 100 × × × × .... ×
Xt0 Xt−1 Xt−2 Xt−3 Xt0
et
Xt It/t−1
=
Xt−1 100
6.2.2.2 Transitivité
— Soit deux indices It/0 et It0 /0 , exprimés en base 0 (année 0). On veut exprimer
l’indice à la date t par rapport à la date t0 . Donc, on veut effectuer un change-
ment de base. Comment procède-t-on ?
— A l’aide de la formule générale :
1
It/0 = It/t0 × It0 /0 ×
100
It/0
It/t0 = 100 × (6.4)
It0 /0
Exemple
1980 100
1990 130
2000 145
71
6 Indices
6.2.2.3 Réversibilité
Démonstration
104
X0 Xt
I0/t × It/0 = × 100 × × 100 = 104 =⇒ I0/t =
Xt X0 It/0
Exemple
— Le revenu moyen des habitants de Salé exprimé en indice par rapport à celui
des habitants de Rabat est de 125 en 1990.
— Quel est celui des habitants de Rabat exprimé par rapport à ceux de Salé ?
104 104
IRb/Salé = = = 80
ISalé/Rb 125
6.3.1 Définition
72
6 Indices
— Le problème de cet indice, c’est que l’on ne peut pas attribuer la cause de
l’évolution :
— Est-ce que c’est à cause des prix ?
— Ou à cause des quantités ?
Définition
— Indice synthétique des prix P i i
pq
It/0 (p) = P i it 0i × 100 (6.7)
i p 0 q0
Exemple Le tableau suivant affiche les prix et les quantités de différents biens (B1 ,
B2 et B3 ) selon deux dates différentes date 0 et date 2.
Prix B1 B2 B3 Quantités B1 B2 B3
0 0, 07 10 35 0 30 0, 5 0, 15
Dates Dates
2 0, 14 20 50 2 20 0, 4 0, 11
Solution
73
6 Indices
Indice de valeurs P i i
p q
I2/0 (pq) = Pi i2 2i × 100
i 0 q0
p
B1 B2 B3
0,14×20 20×0,4 50×0,11
0,07×30 × 100 10×0,5 ×100 35×0,15 × 100
= 133 = 160 = 104, 7
B1 B2 B3
0,14×30 20×0,5 50×0,15
0,07×30 × 100 10×0,5 × 100 35×0,15 × 100
= 200 = 200 = 142, 85
B1 B2 B3
0,07×20 10×0,4 35×0,11
0,07×30 × 100 10×0,5 × 100 35×0,15 × 100
= 66, 66 = 80 = 73, 33
Définition
— Quand l’on fait la moyenne arithmétique pondérée des indices élémentaires, on
obtient un indice qui exprime une évolution moyenne des prix élémentaires.
— C’est un indice « moyen » des prix. Il accorde un poids à la date 0 de référence,
ne doit contenir que la variation des prix et non pas celle des quantités :
wi = pi0 × q0i ∀i; i = 1, 2, . . ., n (6.9)
D’où on distingue entre l’indice « synthétique » des prix et celui de Laspeyres des prix :
i i
P pt P i i × pt
i w i × p i p
i 0 × q 0 pi
Lt/0 (p) = Lpt/0 = P i i 0 × 100 = P i i 0 × 100
i p0 q0 i p0 q0
P i i
pq
Lt/0 (p) = Lpt/0 = P i it 0i × 100 (6.10)
i p 0 q0
74
6 Indices
Remarque
— Seuls les prix varient dans cette relation.
— L’indice de Laspeyres se réduit à un indice élémentaire quand il existe seule-
ment un seul bien.
i i
P qt P i i × qt
i w i × q i p
i 0 × q 0 qi
Lt/0 (q) = Lqt/0 = P i i 0 × 100 = P i i 0 × 100
i p0 q0 i p 0 q0
P i i
p q
Lt/0 (q) = Lqt/0 = P i i0 it × 100 (6.11)
i p 0 q0
— Ici, l’idée serait de ne faire varier que les quantités élémentaires pour obtenir
un indice des quantités synthétiques.
— Pour cela, les prix sont exprimés par rapport à la date de référence uniquement.
— D’où on définit l’indice de Paasche des prix qui correspond aux poids qui va-
rient :
i P i i pit
P pt
i w i × p i i p0 qt × pi0
p
Pt/0 (p) = Pt/0 = P i i 0 × 100 = P i i × 100
i p 0 qt i p 0 qt
P i i
p pq
Pt/0 (p) = Pt/0 = i it ti × 100
P
i p 0 qt
75
6 Indices
i P i i qti
P qt
i w i × q i i pt q0 × q0i
q
Pt/0 (q) = Pt/0 = P i i 0 × 100 = P i i × 100
i p t q0 i pt q0
P i i
q pq
Pt/0 (q) = Pt/0 = P i it it × 100
i p t q0
L’indice de Paasche se différencie par rapport à celui de Laspeyres est que le « poids »
de chaque prix doit être observé à la date t.
Exemple Soient 3 biens (blé, ris, et le sucre) dont-il faut calculer l’indice des prix
agrégé, et l’indice des quantités agrégé
Dates Prix (pt ) Qantités (qt ) Prix (pt ) Qantités (qt ) Prix (pt ) Qantités (qt )
2000 15 50 5 40 2 20
2001 20 55 8 35 3 25
2002 25 58 10 30 4 28
TAF :
1. Calculer l’indice de Laspeyres des prix entre la date 2000 et date 2001.
2. Calculer l’indice de Laspeyres des quantités.
3. Calculer l’indice de Paasche des prix.
4. Calculer l’indice de Paasche des quantités.
Remarque
— Laspeyres est économe en données : seuls les « poids » à la date de référence
sont demandés.
— Laspeyres est plus stable dans le temps que Paasche.
— Paasche ne bénéficie pas de cet avantage car les « poids » varient dans le temps.
— Paasche a tendance à sous-estimer, celui de Laspeyres a tendance à sur-estimer.
— L’indice de Paasche est une moyenne harmonique alors que celui de Laspeyres
est une moyenne arithmétique. (H ≺ x). donc :
76
6 Indices
Fisher (1922) établit alors un indice composite (i.e. indice de Fisher) qui est une
moyenne géométrique des indices de Laspeyres et Paasche.
1
p
= Lpt/0 × Pt/0
p 2
Ft/0 (6.16)
1
q
Lqt/0 q 2
Ft/0 = × Pt/0 (6.17)
77
7 Travaux Dirigés
Exercice 1
Terminologie des tableaux statistiques : Les caractères suivants sont qualitatifs quan-
titatifs
Qualitatif Quantitatif
Les caractères
Ordinal Nominal Discret continu
Sexe ~ ~ ~ ~
Notes des étudiants d’un module ~ ~ ~ ~
Satisfaction classée : nulle, médiocre, moyenne, . . . ~ ~ ~ ~
Nombre des utilisateurs d’internet à la FSJES salé ~ ~ ~ ~
Tour de ceinture d’une personne ~ ~ ~ ~
Code postal de l’habitation d’un foyer marocain ~ ~ ~ ~
Superficie d’une exploitation agricole ~ ~ ~ ~
Groupe sanguin d’un individu ~ ~ ~ ~
Exercice 2
Soit le tableau suivant donnant la répartition des entrées des touristes au Maroc par
nationalité en 2010.
78
7 Travaux Dirigés
Européens 1340700
Arabes 493274
Autres 61151
TOTAL 2841211
Exercice 3
79
7 Travaux Dirigés
Exercice 4
750 participants ont terminé la course d’une épreuve de 15 km. On vous donne ci-
dessous la répartition des coureurs selon le temps qu’ils ont mi s pour achever le
parcours.
Temps en minutes (mn) [45; 55[ [55; 65[ [65; 75[ [75; 85[ [85; 95[ [95; 105[
Exercice 5
Une enquête sur le nombre de pièces par appartement dans un quartier a donné les
résultats suivants : 30 immeubles de 5 étages, de 4 appartements de 2 pièces par étage,
20 immeubles de 6 étages, de 3 appartements de 3 pièces par étage, 60 immeubles de
4 étages, de 3 appartements de 4 pièces par étage, 20 immeubles de 3 étages, de 2
appartements de 5 pièces par étage, 10 immeubles de 3 étages, de 2 appartements
de 6 pièces par étage, Tous les immeubles ont un rez-de-chaussée de 2 appartements
d’une pièce.
1. Préciser le caractère étudié, sa nature et le nombre de ses modalités.
2. Dresser le tableau contenant les effectifs et les fréquences relatives.
3. Représenter graphiquement les effectifs cumulés de cette série.
4. Quel est le nombre d’appartements possédant au plus 3 pièces ? Pas moins de
2 pièces ?
Exercice 6
80
7 Travaux Dirigés
[0–2000[ 2657
[2000–5000[ 770
[5000–10000[ 567
[10000–20000[ 448
[20000–40000[ 758
Total 5200
1. Calculer et représenter
a) Les fréquences relatives.
b) A partir des fréquences relatives, représenter graphiquement cette série.
2. Calculer
a) Calculer les fréquences cumulées croissantes et décroissantes.
b) Déterminer :
i. Le pourcentage des entreprises dont le CA est inférieur à 5 millions de
dh.
ii. Le pourcentage des entreprises dont le CA est supérieur ou égale à 2
millions de dh et inférieur à 10 millions de dh.
c) Représenter le diagramme cumulatif (croissant et décroissant)
Exercice 7
Afin d’établir la durée de vie des ampoules électriques produites par une machine, on
a prélevé au hasard 500 ampoules parmi toutes celles produites par cette machine.
[300; 500[ 75
[1100; 1300[
81
7 Travaux Dirigés
82
7 Travaux Dirigés
Exercice 1
Nombre d’exploitations 10 5 18 3 1 2 1
Exercice 2
Note 6 7 8 9 10 11 12 13 14 15 17
Effectif 1 2 1 3 4 3 5 2 1 2 1
Exercice 3
Les montants des commandes reçues au cours du mois sont les suivants
83
7 Travaux Dirigés
Exercice 4
Salaires ai Cc ni Ni % n i × Cc fi en % Fi %en %
[800–1200[ 30
[1200–1600[ 276
[1600–2000[ 1000
[2000–2600[ 663
[2600–3200[ 576
[3200–4000[ 300
[4000–5000[ 150
[5000–6000[ 35
[6000–8000[ 12
Exercice 5
Les tailles en centimètres des élèves d’un établissement scolaire provincial sont rele-
vées et consignées dans le tableau ci-après :
125–135 13 165–175 70
145–155 30 185–195 9
155–165 97 195–205 4
84
7 Travaux Dirigés
Exercice 6
Modalités de Xi xi ni n i xi ni x2i
40
50 5000
87 5220 313200
12740 664000
Exercice 7
Calculez :
— Le coefficient d’aplatissement et d’asymétrie
— Le coefficient de variation des données suivantes :
xi ni
70 91
80 189
90 70
Exercice 8
85
7 Travaux Dirigés
Exercice 1
H F
[0–18[ 10 10
[18–45[ 10 10
Exercice 2
Une étude menée par un groupe de compagnies d’assurances auprès de 30000 assurés
pour le risque « véhicules à moteur » a permis de déterminer les proportions (en pour-
centage) d’assurés correspondant à la puissance fiscale , notée X, du véhicule assuré
et au kilométrage parcouru au cours de la dernière année, noté Y . Les résultats sont
reportés dans le tableau suivant :
≺4 4, 4 1, 6
5−6 7, 2 8, 2 4, 0 2, 6
9 − 10 2, 4 11, 6 6, 0
10 4, 4 5, 6
86
7 Travaux Dirigés
Exercice 3
20 4 2 1 0 7
25 5 1 0 0 6
30 3 2 1 1 7
Total 12 5 20 1 20
87
7 Travaux Dirigés
Exercice 1
Une entreprise veut mener une étude pour connaître la relation entre les dépenses
hebdomadaires en publicité et le volume des ventes qu’elle réalise. On a recueilli au
cours des dix dernières semaines les données suivantes :
Exercice 2
1 2 3 4 5
xi 10 12 14 16 18
88
7 Travaux Dirigés
Exercice 1
Janv. – Fév Mars- Avril Mai - Juin Juillet - Aout Sept.-Oct Nov.-Déc
Exercice 2
Le tableau ci-dessous donne les valeurs des indices trimestriels (base 2000) de la pro-
duction industrielle des boissons pour les années 2002 à 2005 :
89
7 Travaux Dirigés
90
7 Travaux Dirigés
Indices
Exercice 1
Exercice 2
On savait que le prix du sucre dans un pays X a augmenté de 2, 5% entre 1960 et 1975
et de 7, 5% entre 1960 et 1995.
— Déterminez l’indice élémentaire du prix du sucre en 1995 base 100 en 1975, pour
le pays en question.
Exercice 3
Les données concernant l’évolution des prix et des quantités de plusieurs articles
entre les périodes 1995 et 1985 :
A 36 40 6 7
B 12 15 20 20
C 40 45 13 11
D 15 13 15 15
E 42 50 9 18
F 5 8 25 25
G 30 40 10 9
H 8 10 30 30
91
8 Receuil des examens
92
8 Receuil des examens
Q1. En prenant pour année de base 𝑡0 l’indice des prix de C. Les prix des trois produits pondérés par les quantités
Laspeyres égale à : courantes ont augmenté de 0,7%.
𝑝 𝑝
A. 𝐿4⁄ = 220,9% B. 𝐿4⁄ = 220.7% D. Les prix des trois produits pondérés par les quantités
0 0 courantes ont baissé de 0,7%.
𝑝 𝑝
C. 𝐿4⁄ = 219,3% D. 𝐿4⁄ = 222,1%
0 0 Q4. L’indice des quantités de Paasche pour 𝑡4 égale à :
𝑞 𝑞
Q2. L’indice des quantités de Laspeyres indique que entre 𝑡0 A. 𝑃4⁄ = 170,7% B. 𝑃4⁄ = 107,7%
0 0
et 𝑡4 : 𝑞 𝑞
C. 𝑃4⁄ = 270,7% D. 𝑃4⁄ = 100,7%
A. Les quantités des trois produits pondérées par les prix 0 0
courants ont augmenté de 99,5%. Q5. L’indice des volumes est égale à :
B. Les prix des trois produits pondérés par les quantités de base A. 𝐼4𝑣⁄ = 120,9% B. 𝐼4𝑣⁄ = 210,9%
0 0
ont augmenté de 99,5%. C. 𝐼4𝑣⁄ = 220,9% D. 𝐼4𝑣⁄ = 202,9%
C. Les quantités des trois produits pondérées par les prix 0 0
courants ont baissé de 0.5%. Q6. . L’indice de Fisher des prix pour 𝑡4 est :
𝑝 𝑝
D. Les quantités des trois produits pondérées par les prix de A. 𝐹4⁄ = 220,7 B. 𝐹4⁄ = 210,7
0 0
base ont baissé de 0,5%. 𝑝 𝑝
C. 𝐹4⁄ = 120,7 D. 𝐹4⁄ = 202,7
Q3. L’indice des prix de Paasche pour 𝑡4 indique que : 0 0
A. Les prix des trois produits pondérés par les quantités de base Q7. L’indice de Fisher des quantités pour 𝑡4 est :
𝑞 𝑞
ont baissé de 22,1%. A. 𝐹4⁄ = 200,1 B. 𝐹4⁄ = 300,1
0 0
B. Les prix des trois produits pondérés par les quantités 𝑞 𝑞
C. 𝐹4⁄ = 201,0 D. 𝐹4⁄ = 100,1
courantes ont augmenté de 22,1%. 0 0
Exercice 2
Les étudiants d’une formation continue sont répartis selon leurs âges, les Âge Effectifs
données sont présentées dans le tableau suivant : [20 ; 25 [ 38
[25 ; 30 [ 69
[30 ; 35 [ 55
[35 ; 40 [ 24
[40 ; 45[ 12
+ de 45 2
Q8. La population de cette distribution est : Q13. Si l’on veut présenter cette distribution par un
A. Les 200 étudiants B. Les formateurs histogramme des effectifs relatifs, il faut :
C. Les formations continues D. Autre A. Vérifier les amplitudes B. Tracer les rectangles contigus
Q9. L’individu de cette population est : C. Calculer les fréquences D. Faire les trois étapes
A. L’âge B. L’étudiant Q14. La lecture du tableau nous permet de dire que :
C. La formation continue D. Autre A. 𝑛4 = 40 B. 𝑎4 = 5
Q10. Le caractère étudié est : C. 𝑛6 = 45 D. 𝑎6 = 2
A. La formation continue B. L’étudiant Q15. Le calcul des fréquences permet de dire que :
C. L’âge des étudiants D. Autre A. 𝑓4 = 24 B. 𝑓2 = 27,5%
Q11. La variable étudiée est de nature : C. 𝑓6 = 1 D. 𝑓4 = 0,12
A. Qualitative ordinale B. Quantitative continue Q16. L’effectif cumulé croissant de la troisième classe est :
C. Quantitative discrète D. Autre A. 162 B. 186
Q12. Le terme «données classées» signifie que les C. 107 D. 200
observations : Q17. Le pourcentage des étudiants âgés de > 30 ans :
A. Identiques ont été regroupées pour la même modalité. A. 53,5% B. 81%
B. Sont nécessairement qualitatives. C. 46,5% D. 19%
C. Ont été regroupées dans une seule classe. Q18. Pour déterminer la classe modale de cette distribution :
D. La variable est observée pour chaque individu de la A. On utilise la définition B. On utilise les étapes A et C
population. C. On calcule le Rang D. Autre
1
93
8 Receuil des examens
Q19. L’âge modal sera de l’ordre de : Q22. L’écart type sera de l’ordre de :
Variante A
A. 25 B. 28,4 A. 6,11 B. 8,56
C. 30 D. 27,5 C. 5,81 D. Autres
Q20. L’âge moyen sera de l’ordre de : Q23. La concentration est dite faible si :
A. 30,23 B. 30,32 ∆𝑀 ∆𝑀
A. < 𝐼𝑉 B. < 𝑀𝑒
𝐼𝑉 𝐼𝑉
C. 30,00 D. 23,30 ∆𝑀 𝑀𝑙 −𝑀𝑒
Q21. La variance sera de l’ordre de : C. < 𝑀𝑙 D. =0
𝐼𝑉 𝑀𝑎𝑥−𝑀𝑖𝑛
A. 37,80 B. 33,70
C. 73,3 D. Autre
Exercice 3
Soit le tableau de contingence suivant : 𝒙 𝒚 1 4
2 4 10
8 4 12
Exercice 4
Pour un produit donné, on vous demande d’étudier les ventes (𝑌) et les dépenses publicitaires (𝑋) enregistrées pendant la période
2014-2016, les données sont trimestrielles (en Milliers de DH), ci-dessous quelques données utiles et le graphique des ventes :
249,6
∑ 𝑌𝑡 = 1811 ∑ 𝑋𝑡 = 50 ∑ 𝑋𝑡 𝑌𝑡 = 9079,2 230,4
236,8
204,8 211,2
∑(𝑋𝑡 − 𝑋̅)(𝑌𝑡 − 𝑌̅) = 1533,36 ∑ 𝑋𝑡 ² = 247,42 192,0
∑ 𝑇𝑡 ² = 650 ∑ 𝑌𝑡 ² = 334650,9
96,0
𝑇 = 12 ∑ 𝑇𝑡 𝑌𝑡 = 12228,7 70,4 76,8 76,8 83,1 83,1
𝑌2 = 70,4 𝑌6 = 76,8 𝑌10 = 83,1 Trim.1 Trim.2 Trim.3 Trim.4 Trim.1 Trim.2 Trim.3 Trim.4 Trim.1 Trim.2 Trim.3 Trim.4
𝐶2 = 136,53 𝐶6 = 149,32 𝐶10 = 162,11 2014 2015 2016
Q29. L’équation mathématique utilisée pour décrire la Q36. Si l’on étudie seulement l’évolution des ventes (𝑌),
relation linéaire entre 𝑋 et 𝑌 est : l’analyse du diagramme de dispersion de la série nous
A. 𝑌 = 103 𝑎𝑋 + 𝑏 B. 𝑌 = 𝑎𝑋 + 𝑏 renseigne que le modèle adéquat est additif, et il s’écrit :
C. 103 𝑌 = 𝑎𝑋 + 𝑏 D. Autre. A. 𝑌𝑡 = 𝑆𝑡 + 𝐶𝑡 + 𝜉𝑡 B. 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 × 𝜉𝑡
Q30. La méthode des moindres carrés ordinaires consiste à : C. 𝑌𝑡 = 𝑆𝑡 × 𝐶𝑡 + 𝜉𝑡 D. 𝑌𝑡 = 𝑆𝑡 ÷ 𝐶𝑡 × 𝜉𝑡
A. Minimiser la somme des erreurs. Q37. Supposons que le Trend 𝐶𝑡 de cette chronique est une
B. Minimiser la somme des carrées des erreurs. droite, l’équation mathématique utilisée dans ce cas est :
C. Maximiser les ventes et les dépenses. A. 𝐶𝑡 = 𝑎′𝑇𝑡 + 𝑏′ B. 𝐶𝑡 = 𝑎′𝑋𝑡 + 𝑏′
D. Minimiser la somme des valeurs absolues des erreurs C. 𝐶𝑡 = 𝑎′𝑌𝑡 + 𝑏′ D. 𝐶𝑡 = 𝑎′𝑆𝑡 + 𝑏′
Q31. La valeur de la pente est Q38. La valeur de la pente est
A. 𝑎 = 22,39 B. 𝑎 = −22,39 A. 𝑎′ = 2,197 B. 𝑎′ = −2,197
C. 𝑎 = 39,22 D. 𝑎 = −39,22 C. 𝑎′ = 3,197 D. 𝑎′ = −3,197
Q32. La valeur de l’ordonnée à l’origine est : Q39. La valeur de l’ordonnée à l’origine est :
A. 𝑏 = −12,54 B. 𝑏 = 12,54 A. 𝑏′ = 130,134 B. 𝑏′ = −130,134
C. 𝑏 = 21,54 D. 𝑏 = −21,54 C. 𝑏′ = 131,134 D. 𝑏′ = −131,134
Q33. La covariance entre 𝑌 et 𝑋 est de Q40. Le coefficient saisonnier relatif à la deuxième saison :
A. 107,78 B. 127,78 A. 𝑆2 = 1,51 B. 𝑆2 = 0,61
C. 117,78 D. 137,78 C. 𝑠 2 = 0,51 D. 𝑠 2 = 0,41
Q34. Le coefficient de corrélation linéaire est de : ./.
A. 0,99 B. 99% Bonne chance à tous..
C. 0,95 D. 95%
Q35. Ce résultat signifie que l’intensité de la relation est :
A. Forte B. Indépendante
C. Positive D. Forte et positive
94
8 Receuil des examens
Exercice 2
Un groupe financier marocain regroupe 5 entreprises de tailles différentes opérantes dans différents secteurs. Les parts du
chiffre d’affaires (CA) pour chacune d’entre elles sont : 30%, 30%, 20%, 15%, et 5%.
Q15. Le nombre total des étudiants est : Q16. La fréquence du nombre des étudiants dont la note
A. 1000 B. 1200 comprise entre [12 ; 14 [ :
C. 1100 D. 900 A. 0.36 B. 0.14
C. 0.29 D. 0.12
1
95
8 Receuil des examens
Q30. D’après la lecture du tableau : Q32. La moyenne marginale des dépenses en carburant est :
A. Le nombre de clients transportés est une variable continue. A. 132 dh B. 121 dh
B. Le montant des dépenses en carburant est une variable C. 123 dh D. 124 dh
discrète. Q33. L’écart type marginale des dépenses en carburant
C. Les fréquences conjointes représentent une distribution est :
individuellement observée. A. 0.43836 dh B. 43,8634 dh
D. Le nombre de clients transportés est une variable discrète. C. 0.19245 dh D. 0.91241 dh
Q31. La distribution conditionnelle des dépenses sous la Q34. L’écart type marginale du nombre de clients
condition 10-30 pour le nombre des personnes transportés est de :
transportées est définie par : A. 17,25257 B. 12,25770
A. 𝑛12 = 20 ; 𝑛22 = 20 B. 𝑛11 = 6; 𝑛22 = 4 C. 19,25770 D. 150,2500
C. 𝑛13 = 0; 𝑛23 = 50 D. 𝑛21 = 20; 𝑛22 = 20
Exercice 5
Dans le but d’apprécier l’importance de la part de la production destinée à l’exportation (𝑥𝑖 )vers les pays de l’Afrique, une étude a
été menée auprès des entreprises du secteur industriel durant les dix derniers mois. Le tableau ci-après présente les résultats de
l’observation (en 100.000 d’unités).
Mois janv. févr. mars avr. Mai Juin Juil. Août Sept. Oct.
Volume de la production : 𝒚𝒊 1 2 2 3 3 4 5 6 6 8
La part destinée à l’export : 𝒙𝒊 1 1 2 2 3 3 4 4 5 5
96
8 Receuil des examens
97
8 Receuil des examens
Variante A
Exercice 2
Le tableau suivant illustre la répartition d’un ensemble de consommateurs Dépense de consommation
selon leurs revenus 𝑋𝑖 et leurs dépenses de consommation quotidiennes 𝑌𝑗 Revenu 50 120 150
100 4 3 3
en dirham. 200 2 4 4
Q24. La distribution marginale du revenu est définie par : Q27. La moyenne marginale du revenu est :
A. 𝑛1. = 10; 𝑛2. = 10 B. 𝑛12 = 4 ; 𝑛22 = 2 A. 150 dh B. 160 dh
C. 𝑛1. = 6; 𝑛2. = 7 D. Autre C. 170 dh D. Autre
Q25. La distribution conditionnelle de 𝑋𝑖 /𝑌𝑗=3 est : Q28. La valeur de la moyenne conditionnelle 𝑦̅1 est :
A. 𝑛21 = 2 ; 𝑛22 = 4 B. 𝑛13 = 3; 𝑛23 = 4 A. 101 dh B. 95 dh
D. Autre C. 110 dh D. Autre
C. 𝑛.1 = 6; 𝑛.2 = 7; 𝑛.3 = 7
Q26. La moyenne marginale des dépenses est : Q29. La valeur de la moyenne conditionnelle 𝑥̅1 est :
A. 129,5 dh B. 109,5 dh A. 144,444 B. 155,555
C. 119,5 dh D. Autre C. 133,333 D. Autre
Exercice 3
Vous disposez d’un panier de produits dont on connait les prix et quantités à deux dates 0 et t.
Q30. L’indice du revenu moyen entre 2010 et 2016 vaut 80 Q32. L’indice de Laspeyres des prix à la date t base 100 à la
donc, l’indice du revenu moyen entre 2016 et 2010 égale à : date 0 se calcule par la formule :
A. 𝐼2016/2010 = 80 B. 𝐼2016/2010 = 95 ∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
A. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖 × 100 B. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 × 100
0 𝑖 𝑡 0 0
C. 𝐼2016/2010 = 125 D. Autre 𝑖 0 0
∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
C. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝0𝑖 𝑞𝑡𝑖 × 100 D. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖 × 100
0 𝑖 0 0 0 𝑖 𝑡 0
Exercice 4
Le tableau suivant donne l’évolution de la demande mondiale du pétrole brut (PB) du premier trimestre 2014 (1Q2014) jusqu’au
dernier trimestre de l’année 2015 (4Q2015) en millions de barils par jour. Dans l’objectif de modéliser cette série, un étudiant « A »
a supposé que trend est une courbe, et l’étudiant « B » a supposé que le trend est une droite : 𝑪𝒕 = 𝒂 × 𝒕 + 𝒃
𝒕𝒊 1Q2014 2Q2014 3Q2014 4Q2014 1Q2015 2Q2015 3Q2015 4Q2015 Source :
opec.org (publication, mars 2015)
Demande mondiale 90,1 90,1 91,8 92,7 91,4 91,3 93,1 93,8
Q34. L’étudiant « A », a utilisé la technique de la moyenne Q38. Les paramètres de la droite du trend sont :
mobile (MM) de longueur (périodicité) :
𝑎 = 0,453 𝑎 = 89,746
A. MM(4) B. MM(5) A. { B. {
𝑏 = 89,746 𝑏 = −0,453
C. MM(6) D. Autre
𝑎 = −0,453 𝑎 = 89,746
Q35. La langueur de cette série l’oblige à calculer la : C. { D. {
𝑏 = −89,746 𝑏 = 0,453
A. MM pondérée B. Coefficients saisonniers
C. MM non-pondérée D. Autre Q39. En adoptant un schéma multiplicatif, le coefficient
saisonnier du cinquième trimestre est :
Q36. Le calcul de la moyenne mobile pour le 3Q2014 donne : A. 0,4980 B. 0,5042
A. 91,337 B. 91,175 C. 0,5023 D. Autre
C. 91,500 D. Autre
Q40. La série de la demande mondiale du PB, corrigée des
Q37. Par contre l’étudiant « B » a choisi le de calculer les variations saisonnières pour le trimètre 2 en 2014 vaut :
paramètres de la droite du Trend, pour cela le calcul de la A. 181,90 B. 281,90
covariance donne : C. 81,90 D. Autre
A. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 3,7214 B. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 2,7214
./.
C. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 4,7214 D. Autre Bonne chance à tous..
98
8 Receuil des examens
Q8. La fréquence des employés, dont le salaire est compris Q19. L’écart type (*1000 dh) sera de l’ordre de :
entre 3000 dh et 4000 dh : A. 0,1527 B. 1,1527
A. 0,2 B. 0,3 C. 2,1527 D. Autre
C. 0,4 D. Autre Q20. Le coefficient de variation est :
Q9. La fréquence des employés, dont le salaire est inférieur à A. 1,8457 B. 2,8457
4000 dh est : C. 3,8457 D. Autre
A. 0,666 B. 0,333 Q21. Il y a concentration si :
C. 0,866 D. Autre A. ∆𝑀 = 𝐼𝑉 B. ∆𝑀 = 𝑀𝑒
Q10. La fréquence des employés qui ont un salaire supérieur à C. ∆𝑀 ≤ 𝑁𝑖 𝑋𝑖 D. 𝑀𝑙 − 𝑀𝑒 ≠ 0
4000 dh : Q21. La classe médiale est la :
A. 0,666 B. 0,733 A. Troisième classe B. Deuxième classe
C. 0,333 D. Autre C. Quatrième classe D. Dernière classe
Q11. Le salaire modal est égal à : Q23. Le coefficient d’aplatissement est basé sur la
A. 4500 B. 4700 détermination préalable du moment centré :
C. 4600 D. Autre A. 𝑀2 B. 𝑀4
Q12. Le salaire moyen sera de l’ordre de : C. 𝑀3 D. 𝑀1
A. 4343,33 B. 4334,33
99
8 Receuil des examens
Variante B
Exercice 2
Le tableau suivant illustre la répartition d’un ensemble de consommateurs Dépense de consommation
selon leurs revenus 𝑋𝑖 et leurs dépenses de consommation quotidiennes 𝑌𝑗 Revenu 50 100 150
200 4 2 3
en dirham. 300 2 4 5
Q24. La distribution marginale du revenu est définie par : Q27. La moyenne marginale du revenu est :
A. 𝑛12 = 4 ; 𝑛22 = 2 B. 𝑛1. = 9; 𝑛2. = 11 A. 200 dh B. 210 dh
C. 𝑛1. = 6; 𝑛2. = 8 D. Autre C. 220 dh D. Autre
Q25. La distribution conditionnelle de 𝑋𝑖 /𝑌𝑗=2 est : Q28. La valeur de la moyenne conditionnelle 𝑥̅3 est :
A. 𝑛21 = 2 ; 𝑛22 = 4 B. 𝑛1. = 6; 𝑛2. = 11 A. 225 dh B. 250 dh
C. 275 dh D. Autre
C. 𝑛12 = 2; 𝑛22 = 4 D. Autre
Q26. La moyenne marginale des dépenses est : Q29. La valeur de la moyenne conditionnelle 𝑦̅1 est :
A. 100 dh B. 105 dh A. 94,444 B. 95,444
C. 150 dh D. Autre C. 96,444 D. Autre
Exercice 3
Vous disposez d’un panier de produits dont on connait les prix et quantités à deux dates 0 et t.
Q30. L’indice du revenu moyen entre 2010 et 2016 vaut 125 Q32. L’indice de Laspeyres des prix à la date t base 100 à la
donc l’indice du revenu moyen entre 2016 et 2010 égale à : date 0 se calcule par la formule :
A. 𝐼2016/2010 = 75 B. 𝐼2016/2010 = 85 ∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
A. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝𝑡𝑖 𝑞0𝑖 × 100 B. 𝐿𝑝𝑡⁄ = ∑𝑖 𝑝0𝑖 𝑞0𝑖 × 100
0 0 𝑖 𝑡 0
C. 𝐼2016/2010 = 80 D. Autre 𝑖 0 0
∑ 𝑝𝑖 𝑞 𝑖 ∑ 𝑝𝑖 𝑞 𝑖
C. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝𝑡𝑖 𝑞𝑡𝑖 × 100 D. 𝑃𝑡𝑞⁄ = ∑ 𝑖 𝑝0𝑖 𝑞𝑡𝑖 × 100
0 𝑖 𝑡 0 0 𝑖 0 0
Exercice 4
Le tableau suivant donne l’évolution de l’offre mondiale du pétrole brut (BP) du premier trimestre 2014 (1Q2014) jusqu’au dernier
trimestre de l’année 2015 (4Q2015) en millions de barils par jour. Dans l’objectif de modéliser cette série, un étudiant « A » a
supposé que trend est une courbe, et un autre étudiant « B » a supposé que le trend est une droite : 𝑪𝒕 = 𝒂 × 𝒕 + 𝒃
𝒕𝒊 1Q2014 2Q2014 3Q2014 4Q2014 1Q2015 2Q2015 3Q2015 4Q2015 Source :
opec.org (publication, mars 2015)
Offre mondiale 91,2 91,5 92,4 93,6 92,2 93,5 93,4 93,1
Q34. L’étudiant « A », a utilisé la technique de la moyenne Q38. Les paramètres de la droite du trend sont :
mobile (MM) de longueur :
𝑎 = 91,289 𝑎 = 91,289
A. MM(2) B. MM(3) A. { B. {
𝑏 = 0,294 𝑏 = −0,294
C. MM(4) D. Autre
𝑎 = −0,294 𝑎 = 0,294
Q35. La langueur de cette série l’oblige à calculer la : C. {
𝑏 = −91,289
D. {
𝑏 = 91,289
A. MM non-pondérée B. Coefficients saisonniers
C. MM pondérée D. Autre Q35. En adoptant un schéma multiplicatif, le coefficient
saisonnier du cinquième trimestre est :
Q36. Le calcul de la moyenne mobile pour le 3Q2014 donne : A. 0,4974 B. 0,5172
A. 91,3 B. 92,3 C. 0,5016 D. Autre
C. 95,3 D. Autre
Q35. La série de l’offre mondiale du PB, corrigée des
Q37. Par contre l’étudiant « B », a choisi le de calculer les variations saisonnières pour le trimètre 2 en 2014 vaut :
paramètres de la droite du Trend, pour cela le calcul de la A. 186,93 B. 182,93
covariance donne : C. 183,93 D. Autre
A. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 1,7642 B. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 3,7642 ./.
Bonne chance à tous..
C. 𝐶𝑜𝑣(𝑡, 𝐶𝑡 ) = 2,7642 D. Autre
100
8 Receuil des examens
Exercice 1
En 2018, une administration territoriale a mené une étude sur l’âge de Age de l’épouse au mariage Nb. de familles Cumulé
l’épouse au mariage. Elle concerne 100 familles qui se répartissent dans [16 – 18[ 25
[18 – 20[ 45
douze régions du royaume. Le tableau à-côté partage la répartition des [20 – 24[ 80
effectifs cumulés du nombre de familles selon l’âge de l’épouse au mariage. [24 – 30] 100
Q1. L’échantillon étudié est constitué de : Q8. L’âge modal est égal à :
A. 30 épouses B. 250 familles A. 21 B. 20
C. 100 familles D. 12 régions C. 22 D. 23
E. 100 épouses F. Autre E. 24 F. Autre
Q2. L’individu de cette population est : Q9. L’âge moyen est égal à :
A. L’épouse B. La famille A. 20,15 B. 20,57
C. L’âge D. La région C. 20,75 D. 21
E. le mariage F. Autre E. 21,15 F. Autre
Q3. La variable étudiée est : Q10. Le deuxième quartile sera de l’ordre de :
A. L’épouse au mariage B. L’âge de l’épouse A. 20,15 B. 20,57
C. Le couple marié D. Le nombre de famille C. 20,75 D. 21
E. L’âge du couple F. Autre E. 21,50 F. Autre
Q4. L’outil adapté pour représenter cette distribution est le : Q11. L’écart type sera de l’ordre de :
A. Diagramme en bâtons B. Tuyau d’orgue A. 1,5 B. 2,5
C. Histogramme D. Nuage de points C. 3,5 D. 4,5
E. Courbe F. Autre E. 5,5 F. Autre
Q5. L’effectif total est : Q12. La classe médiale est égale à :
A. 30 B. 100 A. [16 – 30] B. [18 – 20[
C. 250 D. 3000 C. [24 – 30] D. [20 – 24[
E. 80 F. Autre
E. [16 – 18[ F. Autre
Q6. La fréquence des personnes, dont l’âge est compris entre
18 ans et 24 ans : Q13. Il y a concentration si :
A. 0,55 B. 0,35 A. ∆𝑀 = 𝐼𝑉 B. ∆𝑀 = 𝑀𝑒
C. 0,80 D. 0,45 C. ∆𝑀 ≤ 𝑁𝑖 𝑋𝑖 D. 𝑀𝑙 − 𝑀𝑒 ≠ 0
𝑁𝑋
E. 0,125 F. Autre E. ∆𝑀 ≤ 𝑖2 𝑖 F. Autre
Q7. La fréquence des personnes, dont l’âge est inférieur à 24 Q14. Le coefficient de symétrie est égal à
ans est : A. -0,028 B. -2,039
A. 0,55 B. 0,80 C. 0,471 D. -1,028
C. 0,45 D. 0,35 E. 2,028 F. Autre
E. 0,20 F. Autre
Exercice 2
Un jeune stagiaire a croisé l’âge de l’épouse au mariage avec Age de l’épouse
celui du mari. Le tableau de contingence suivant donne la Age de l’époux [16-18[ [18-20[ [20-24[ [24-30]
[15-20[ 0,2 0,1 0 0
répartition conjointe des fréquences des âges de l’époux et de [20-25[ 0,05 0,1 0,3 0,05
l’épouse au mariage. [25-30] 0 0 0,05 0,15
Q15. La distribution marginale des effectifs de l’âge de Q17. La moyenne marginale de l’âge de l’époux 𝑋̅ vaut :
l’époux est : A. 21 B. 21,15
A. 𝑛1. = 3; 𝑛2. = 5; 𝑛3. = 2 B. 𝑛1. = 15; 𝑛2. = 20; 𝑛3. = 25 C. 21,50 D. 21,75
C. 𝑛1. = 5; 𝑛2. = 10; 𝑛3. = 20 D. 𝑛1. = 30; 𝑛2. = 50; 𝑛3. = 20 E. 22 F. Autre
E. 𝑛1. = 10; 𝑛2. = 15; 𝑛3. = 20 F. Autre
Q18. La moyenne conditionnelle 𝑋̅2 est égale à :
Q16. La distribution conditionnelle des fréquences de 𝑋𝑖 /𝑌𝑗=3 : A. 15 B. 20
A. 𝑓13 = 0,2; 𝑓23 = 0,05; 𝑓33 = 0 B. 𝑓31 = 0; 𝑓32 = 0,05; 𝑓33 = 0,15 C. 25 D. 30
C. 𝑓13 = 0; 𝑓23 = 0,05; 𝑓33 = 0,15 D. 𝑓13 = 0; 𝑓23 = 0,3; 𝑓33 = 0,05 E. 35 F. Autre
E. 𝑓31 = 0,1; 𝑓32 = 0,1; 𝑓33 = 0 F. Autre
Q19. La moyenne conditionnelle 𝑌̅2 est égale à:
A. 20 B. 21
C. 20,4 D. 21,4
E. 22 F. Autre
p. 1
101
8 Receuil des examens
Q20. La valeur de l’écart-type conditionnel 𝜎𝑋 2 égale à : Q21. La valeur de la variance conditionnelle 𝑉𝑎𝑟(𝑌2 ) est :
A. 2,5 B. 3,25 A. 6,44 B. 5,44
C. 4,75 D. 6,25 C. 4,44 D. 3,44
E. 5,5 F. Autre E. 2,44 F. Autre
Exercice 3
Deux produits A et B sont observés en termes de prix et de 2010 2018
Produits
quantités entre 2010 et 2018 de la manière suivante : Prix Quantités Prix Quantités
En prenant l’année 2010 comme base, répondez aux questions A 1 10 2 16
ci-après : B 5 3 4 10
Q22. L’indice des valeurs base 2010 vaut à : A. 𝐿𝑄18/10 = 100 B. 𝐿𝑄18/10 = 101
𝑣 𝑣
A. 𝐼18/10 = 100 B. 𝐼18/10 = 125
𝑣 𝑣
C. 𝐿𝑄18/10 = 102 D. 𝐿𝑄18/10 = 103
C. 𝐼18/10 = 160 D. 𝐼18/10 = 62,5
𝑣 E. 𝐿𝑄18/10 = 104 F. Autre
E. 𝐼18/10 = 128 F. Autre
Q26. L’indice de Paasche des quantités base 2010 vaut à :
Q23. L’indice des valeurs base 2018 vaut à : 𝑄 𝑄
𝑣
A. 𝐼10/18 = 100 𝑣
B. 𝐼10/18 = 125 A. 𝑃18/10 = 100 B. 𝑃18/10 = 125
𝑄 𝑃
𝑣
C. 𝐼10/18 = 160 𝑣
D. 𝐼10/18 = 62,5 C. 𝑃18/10 = 160 D. 𝑃18/10 = 128
𝑣 𝑄 F. Autre
E. 𝐼10/18 = 128 F. Autre E. 𝑃18/10 = 80
Q24. L’indice de Laspeyres des prix base 2010 vaut à : Q27. L’indice de Fisher des quantités base 2010 vaut à :
A. 𝐿𝑃18/10 = 125 B. 𝐿𝑃18/10 = 126 𝑄
A. 𝐹18/10 = 100 𝑄
B. 𝐹18/10 = 112,36
𝑃
C. 𝐿18/10 = 127 D. 𝐿𝑃18/10 = 128 𝑄
C. 𝐹18/10 = 127,75 𝑄
D. 𝐹18/10 = 114,02
E. 𝐿𝑃18/10 = 129 F. Autre 𝑄 F. Autre
E. 𝐹18/10 = 132,16
Q25. L’indice de Laspeyres des quantités base 2010 vaut à : .
Exercice 4
Le tableau suivant présente entre 2016 et 2018, l’évolution des indices de prix la consommation (IPC) et de l’évolution des
indices des smic (SMIC). Ces indices sont en base 100 en 2014 T1.
2016 T1 2016 T2 2016 T3 2017 T1 2017 T2 2017 T3 2018 T1 2018 T2 2018 T3 Source : Données
IPC 102,3 102,0 105,2 106,0 107,3 109,4 112,2 113,8 115,0 fictives
SMIG 101,6 103,6 104,9 108,2 108,2 109,8 112,4 114,1 116,5
Q28. Soit la relation linéaire 𝑆𝑀𝐼𝐶𝑡 = 𝑎 + 𝑏 × 𝐼𝑃𝐶𝑡 alors : Q35. Retenant un schéma multiplicatif pour la série IPC alors :
A. 𝑎 = −1,111 B. 𝑎 = −3,333 C. A. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 + 𝑆𝑡 + 𝜉𝑡 B. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 × 𝑆𝑡
D. 𝑎 = −2,222 E. 𝑎 = −4,444 F.C. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 × 𝑆𝑡 + 𝜉𝑡 D. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 + 𝑆𝑡
G. 𝑎 = −0,123 H. Autre I. E. 𝐼𝑃𝐶𝑡 = 𝐶𝑡 × 𝑆𝑡 × 𝑆𝑀𝐼𝐺 F. Autre
Q29. Et la pente vaut : Q36. Si 𝐶𝑡 est une droite alors la pente vaut:
A. 0,016 B. 1,016 A. -1,726 B. 1,795
C. 2,016 D. 3,016 C. 1,726 D. -1,795
E. 4,016 F. Autre E. 0,726 F. Autre
Q30. La covariance entre IPC et SMIG est de Q37. Si 𝐶𝑡 est une droite alors l’ordonnée à l’origine vaut:
A. 20,3 B. 21,8 A. 90,5 B. 95,5
C. 20,5 D. 21,2 C. 99,5 D. 105,5
E. 20,7 F. Autre E. 115,5 F. Autre
Q31. Le coefficient de corrélation linéaire est de : Q38. Par conséquent 𝐶1 vaut
A. 0,98 B. 0,75 A. 101,2 B. 103,0
C. 0,89 D. 0,95 C. 104,7 D. 106,4
E. 0,85 F. Autre E. 108,1 F. Autre
Q32. La moyenne mobile du SMIG associée au 2017 T1 est : Q39. Si 𝐶𝑡 est une droite, le coefficient saisonnier 𝑆8 vaut :
A. 105,6 B. 103,4 A. 𝑠1 = 0,975 B. 𝑠1 = 1,996
C. 108,7 D. 107,1 C. 𝑠 2 = 0,996 D. 𝑠 2 = −1,996
E. Calcul impossible F. Autre E. 𝑠 3 = 1,996 F. 𝑠 3 = −0,996
Q33. La moyenne mobile de l’IPC associée au 2016 T2 est : Q40. La composante aléatoire 𝜉8 vaut :
A. 103,4 B. 105,6 A. 0,965 B. 1,965
C. 103,2 D. 104,4 C. 2,965 D. 3,965
E. Calcul impossible F. Autre E. 4,965 F. Autre
./.
Q34. La langueur de cette série oblige de calculer la :
Bonne chance
A. Un coefficient saisonnier B. 2 coefficients saisonniers
C. 3 coefficients saisonniers D. 4 coefficients saisonniers
E. 8 coefficients saisonniers F. Autre
p. 2
102
9 REFERENCES BIBLIOGRAPHIQUES
103