Vous êtes sur la page 1sur 55

Support de cours 

: statistiques probabilités

1ère Partie Les concepts de base de la statistique descriptive

1.1 Définition : La statistique est l’ensemble des méthodes et techniques ayant


pour objet de collecter , de rassembler , de traiter , d’analyser et d’interpréter des
données numériques relatives à un ensemble d’objets , d’individus ou
d’éléments qui permettent de tirer des conclusions , d’aider à la bonne décision
et /ou de faire des prévisions .
La statistique est considérée aujourd’hui comme un outil fiable qui peut
fournir des renseignements et une interprétation dans tous les domaines :
économiques , politiques , sociologiques , biologiques , physiques etc.
1.2 Vocabulaire statistique :
Population : L’ensemble des objets de même nature que l’on soumet à une
étude statistique s’appelle : la population ou l’ensemble statistique ou
l’univers .
Individu : Chaque élément de la population est appelé individu ou unité
statistique .
Le nombre d’unités statistiques formant la population est appelé : Effectif .
Exemples : Une population de touristes  : l’individu est un touriste .
Une population d’entreprises : l’individu est l’entreprise .
Enquête : L’ensemble des opérations ayant pour but de collecter de façon
organisée des informations relatives à une population après avoir fixé les
objectifs de l’étude statistique s’appelle : Enquête .
Si cette dernière porte sur l’ensemble des individus de la population ; il s’agit
d’un recensement.
Si au contraire, l’enquête ne porte que sur une partie ou sur quelques
éléments de la population il s’agit d’un sondage .
Le recensement ou enquête exhaustive .
Il s’agit d’enquête complète portant sur toutes les unités statistiques de la
population étudiée .
Exemple : Le recensement de la population d’un pays .
Le principe du recensement est simple mais il demande du temps . Son
exécution est lourde et elle peut être onéreuse.
Généralement, les recensements permettent également d’obtenir un nombre
important d’informations et de renseignements sur les tendances et
évolutions.
Le sondage ou enquête partielle.
Le sondage conduit à n’observer qu’une partie de la population statistique
constituant un échantillon.
L’étude de cet échantillon fournira des informations qui pourront être
étendues, quoique avec prudence à la population complète.
Le problème capital de cette méthode est celui de l’obtention d’un
échantillon le plus représentatif possible de la population.

Page 1 sur 55
Support de cours : statistiques probabilités

Différentes méthodes sont à la base du choix de l’échantillon.


Les deux principales sont :
Le sondage au hasard : Détermination de l’échantillon par tirage au sort,
afin que chaque ait la même probabilité d’être choisi.
Le sondage par choix raisonné ou méthode des quotas.
Les différentes catégories de la population sont représentées
proportionnellement dans l’échantillon. On essaie ainsi d’obtenir une image
fidèle.
Les instruments de l’enquête : Le questionnaire et les enquêteurs.
Le questionnaire : lorsque les unités statistiques sur lesquelles portent les
observations sont des personnes, elles sont soumises à un questionnaire.
Le questionnaire est un document renfermant l’ensemble des questions
auxquelles les individus concernés sont priés de répondre.
Un questionnaire doit présenter un certain nombre de qualités :
- Il doit être adapté au niveau des personnes consultées
- Il doit être complet.
- Les questions posées doivent être simples et appeler des réponses
précises et courtes : oui ou non par exemple.
Les enquêteurs :
L’enquêteur doit faire preuve d’impartialité, de conscience professionnelle.
L’exécution d’une enquête est généralement faite selon les procédés
suivants :
- Enquête par : interview - correspondance téléphone inter net
Le dépouillement des observations :
C’est l’ensemble des opérations permettant le passage des documents de base
(questionnaires) aux données chiffrées relatives au problème posé.
L’objectif du dépouillement est la présentation des résultats de l’enquête d’une
manière compréhensible permettant une analyse et une interprétation fiables
sous formes de tableaux statistiques et de représentations graphiques.
Chapitre 2 : Les différents types de caractères et de variables statistiques
2.1 Les différents types de caractères.
Définition : Toute propriété commune aux individus d’une population
s’appelle : un caractère.
Le caractère se présente chez tous les individus de la population étudiée mais
avec une intensité ou une nature éventuellement différente.
Exemple : La population des employés d’une entreprise.
Chaque employé peut être caractérisé par son âge, son niveau d’étude, son
origine, son poids ou le nombre d’enfants à charge.
La modalité : C’est une particularité qui accompagne un fait.
Chaque caractère pouvant présenter plusieurs modalités.
Exemples :
- Le caractère nationalité peut avoir comme modalités :
Marocaine – française – guinéenne – malienne – sénégalaise …

Page 2 sur 55
Support de cours : statistiques probabilités

- Le caractère marque de voiture peut avoir comme modalités :


Peugeot – Renault – Fiat – BMW – Audi – Honda …
- Le caractère nombre d’enfants à charges peuvent avoir comme modalités :
Aucun enfant – 1 enfant – 2 enfants – 3 enfants et plus.
Un caractère peut être soit qualitatif soit quantitatif.
2.1.1 Caractère qualitatif :
Un caractère est dit qualitatif lorsqu’il n’est ni mesurable ni repérable.
Exemples : La profession – la nationalité – la situation familiale …
2.1.2 Caractère quantitatif :
Un caractère est dit quantitatif lorsqu’il est mesurable ou repérable.
Exemples : L’âge – le poids – le revenu annuel – la température.
2.2 Les variables statistiques :
Une variable statistique est une application définie sur la population étudiée
et à valeurs dans un ensemble déterminé.
Le caractère quantitatif lui correspond une variable statistique qui est la
mesure du caractère. Celle – ci peut être soit discrète soit continue.
2.2.1 La variable statistique discrète :
Une variable statistique est dite discrète lorsqu’elle ne peut prendre que des
valeurs entières.
Exemples - Le nombre d’enfants dans une famille : 0 ; 1 ; 2 ; 3 ; 4 …
- Le nombre de pièces d’un logement : 1 ; 2 ; 3 ; 4 ; 5 …
2.2.2 La variable statistique continue :
Une variable statistique est continue lorsqu’elle peut prendre pour valeur
numérique tout réel d’un intervalle de l’ensemble IR.
Exemples – Le chiffre d’affaires : 174587425.85 dh
– Le salaire : 6032.63 dh
– Le poids : 65.5 kg …

Chapitre 3 Les séries statistiques à une dimension

Page 3 sur 55
Support de cours : statistiques probabilités

et leur représentation graphiques

3.1 Les séries statistiques à une dimension (ou à une variable).


Une variable statistique est une simple énumération des observations :
x1 ; x2 ; x3 ; x4 … xi …xn .
Après dépouillement des observations d’une enquête relative à une
population selon un caractère donné , on présente les résultats sous forme de
tableaux statistiques puis on les représente graphiquement .
Tableau statistique à une entrée .
Le tableau statistique le plus simple est celui ou figureront deux colonnes
réservées respectivement :
- La première aux valeurs du caractère , désigné par xi .
- La deuxième aux effectifs correspondants , désignés par ni .
Exemple 1 .On a enquêté 20 employés d’une entreprise dont on veut étudier
leur situation familiale .
Le caractère situation familiale peut prendre les modalités suivantes :
Célibataire : C  ; Marié : M  ; Veuf : V  ; Divorcé : D
Les résultats bruts sont les suivants :
M–M–M–M–C–C–C–D–D–C
C –C–D–V–V–M–M–M–M–C.
L’unité statistique : un employé .
La population : l’ensemble des 20 employés .
Le caractère : situation familiale .
Type de caractère : qualitatif .
Modalités : célibataire – marié – veuf – divorcé .
Les résultats peuvent être consignés dans le tableau suivant sous forme simple et
claire .

Variable statistique (xi) Effectif (ni)


(Situation familiale) (nombre d’employés)
C 7
M 8
V 2
D 3
Total  i = 20
n
Exemple 2 . Soit un échantillon de 50 familles , les résultats d’une enquête
concernant le nombre d’enfants par famille sont les suivants :
5–4–6–3–2–0–1–6–4–3
1–0–1–5–4–6–3–2–6–6
5–4–3–6–5–1–1–3–0–2
3–0–4–6–5–2–1–0–1–5
4–3–3–2–6–5–1–0–6–1

Page 4 sur 55
Support de cours : statistiques probabilités

L’unité statistique  : une famille .


La population : l’ensemble des 50 familles.
Le caractère étudié  : nombre d’enfants par famille .
Le type de caractère  : quantitatif .
Les modalités : 0–1–2–3–4–5–6.
La variable statistique : discrète .

Dans les résultats bruts les différentes valeurs prises par la variable statistique
sont : 0 – 1 – 2 – 3 – 4 – 5 – 6 .
On présente les résultats dans un tableau statistique comme le cas d’un caractère
qualitatif .

Variable statistique (xi) Effectif (ni)


(nombre d’enfants) (nombre de familles)
0 6
1 9
2 5
3 8
4 6
5 7
6 9
Total  ni = 50

Exemple 3 .On a pesé 20 élèves d’une classe.


Les résultats xi sont les suivants : unité le kilogramme.

77,45 – 62,20 – 67,82 – 71,28 – 74,47


81,29 – 78,54 – 63,22 – 59,47 – 61,33
56,41 – 63,23 – 63,28 – 71,66 – 68,72
54,93 – 71,44 – 74,31 – 77,82 – 67,41.

L’unité statistique : un élève


La population : l’ensemble des 20 élèves
Le caractère étudié : le poids de l’élève en kg
Le type de caractère : quantitatif
La variable statistique  : continue .
Premier travail à faire : On cherche le domaine de variation de la variable,
c’est à dire la différence entre la plus grande valeur et la plus petite valeur prises
par la variable appelée : Etendue .
Dans ce cas : 81,29 – 54,93 = 26,36.
Comme le nombre d’observations distinctes est grand , il est presque impossible
de présenter les données sous forme d’une série statistique .

Page 5 sur 55
Support de cours : statistiques probabilités

2ème travail à faire : On partage le domaine de variation en classes d’amplitudes


égales de préférence . Chaque classe possède une borne supérieure et une borne
inférieure .La différence entre les bornes supérieure et inférieure est appelée :
amplitude de la classe .
On appelle effectif d’une classe le nombre de valeurs ni comprises dans cette
classe .
Le choix du nombre de classes varie avec le nombre d’observations .
En règle générale , il est recommandé de ne pas dépasser 20 classes .
Prenons pour amplitude 5 kg par exemple dans ce cas :
La deuxième colonne du tableau statistique sera réservée au nombre
d’observations appartenant à la classe .
Les résultats seront présentés comme suit :
Classes Effectif (ni)
[54,93 – 59,93[ 3
[59,93 – 64,93[ 5
[64,93 – 69,93[ 3
[69,93 – 74,93[ 5
[74,93 – 79,93[ 3
[79,93 – 84,93[ 1
Total  ni = 20

On appelle le centre de la classe de rang (i) noté xi : la moitié de la somme de


ses bornes inférieure et supérieure .
borne inf  borne sup
xi = 2
54,93  59,93
Exemples : x1 = 2
= 57,43
59,93  64,93
x2 = 2
= 62,43 …
Dans cette distribution on peut dire que :
Deux élèves ont un poids supérieur ou égal à 54,93 kg mais inférieur à 59,93 kg.
Cinq élèves ont un poids supérieur ou égal à 59,93 kg mais inférieur à 64,93 kg.
Un élève a un poids supérieur ou égal à 79,93 kg mais inférieur à 84,93 kg.
L’effectif ni est appelé aussi : fréquence absolue .
L’effectif total n : On appelle effectif total la somme des effectifs ni .
n =  n i = n1 + n2 + n3 + …
La fréquence fi : On appelle fréquence fi appelée aussi fréquence relative le
rapport de l’effectif ni , attaché à la valeur xi du caractère à l’effectif total n .
ni ni n1 n2
fi = = Exemples : f 1 = ; f2 = …
 ni n n n
n  n  n  ...
Remarque :  f i = 1 2 3 = n = i n
=1
n n n
Effectifs cumulés :

Page 6 sur 55
Support de cours : statistiques probabilités

Les effectifs cumulés croissants (ECC) est l’opération qui consiste à établir une
nouvelle série en additionnant successivement les effectifs de la série initiale du
haut du tableau vers le bas .
Les effectifs cumulés décroissants (ECD) est l’opération qui consiste à établir
une nouvelle série en additionnant successivement les effectifs de la série
initiale du bas vers le haut .
Exemple : Soit la distribution statistique suivante , à une date donnée ,des
employés d’une entreprise selon leur âge .

Classes Effectifs
(années) (ni)
[20 – 25[ 9
[25 – 30[ 27
[30 – 35[ 36
[35 – 40[ 45
[40 – 45[ 18
[45 – 50[ 9
[50 – 55[ 3
[55 – 60[ 3
Total 150

Dressons un tableau indiquant :


- les centres des classes (xi);
- les fréquences fi ;
- les fréquences fi (%) ;
- les effectifs cumulés croissants (ECC) ;
- les fréquences cumulées croissantes (%) ;
- les effectifs cumulés décroissants (ECD) ;
- les fréquences cumulées décroissantes (%) .

Colonne 0 Colonne 1 Colonne 2 Colonne 3 Colonne 4 Colonne 5 Colonne 6 Colonne 7 Colonne 8


Classes Centres Effectifs Fréquences Fréquences Effectifs Fréquences Effectifs Fréquences
(Années) des classes (ni) (fi) (fi) (%) cumulés cumulées cumulés cumulées
(xi) croissants croissantes décroissants décroissantes
(ECC) (%) (ECD) (%)
[20 – 25[ 22,5 9 0,06 6 9 6 150 100
[25 – 30[ 27,5 27 0,18 18 36 24 141 94
[30 – 35[ 32,5 36 0,24 24 72 48 114 76
[35 – 40[ 37,5 45 0,30 30 117 78 78 52
[40 – 45[ 42,5 18 0,12 12 135 90 33 22
[45 – 50[ 47,5 9 0,06 6 144 96 15 10
[50 – 55[ 52,5 3 0,02 2 147 98 6 4
[55 – 60[ 57,5 3 0,02 2 150 100 3 2
Totaux - 150 1 100 - - - -

Page 7 sur 55
Support de cours : statistiques probabilités

Les effectifs cumulés croissants ou décroissants permettent de répondre aux


deux types de questions suivantes :
- Quel est le nombre d’employés ayant moins de 35 ans ?
- Quel est le nombre d’employés ayant au moins 35 ans ?
Indications concernant les colonnes du tableau :
- La colonne 1 : les centres des classes (xi) .
20  25
La 1ère valeur : 57,5 = 2
25  30
La 2ème valeur : 27,5 = 2
55  60
La 8ème valeur : 57,5 = 2
- La colonne 2 : l’effectif total n
n =  ni = 9 + 27 + 36 + 45 + 18 + 9 + 3 + 3 = 150
ni
- La colonne 3 : les fréquences fi =
n
9
La 1ère valeur : 0,06 = 150
27
La 2ème valeur : 0,18 = 150

27
La 8ème valeur : 0,02 = 150
- La colonne 4 : les fréquences en pourcentage : fi (%) = fi 100.
9
La 1ère valeur : 6 =  100
150
27
La 2ème valeur : 18 = 150  100

3
La 8ème valeur : 2 =  100
150
- La colonne 5 : les effectifs cumulés croissants (ECC) :

La 1ère valeur : la 1ère valeur de la colonne 2 des effectifs .


La 2ème valeur : la somme des 2 premières valeurs de la colonne 2.
La 3ème valeur : la somme des 3 premières valeurs de la colonne 2.

La 8ème valeur : l’effectif total n .
- La colonne 6 : comme la colonne 5, la colonne 4 remplace la colonne 2
le dernier cumul étant égal à 100 .
- La colonne 7 : les effectifs cumulés décroissants (ECD).
la 8ème valeur : la 8ème valeur de la colonne 2
la 7ème valeur : la somme de la 8ème et la 7ème valeur de la colonne 2

la 1ère valeur : l’effectif total n .

Page 8 sur 55
Support de cours : statistiques probabilités

Autrement dit :
la 1ère valeur  : l’effectif total n
la 2ème valeur : l’effectif total n moins la 1ère valeur de la colonne 2
la 3ème valeur : la 2ème de la colonne 7 moins la 2ème de la colonne 2

la 8ème valeur : la 7ème de la colonne 7 moins la 7ème de la colonne 2.
- La colonne 8 : les fréquences cumulées décroissantes .
Même chose que la colonne 7, la colonne 4 remplace la colonne 2.

Interprétation:
La colonne 4 : la 1ère valeur 6 ; veut dire que 6% des employés ont un
âge supérieur ou égal à 20 ans mais inférieur à 25 ans .
la 2ème valeur 18 : veut dire que 18% des employés ont
un âge supérieur ou égal à 25 ans mais inférieur à 30 ans.

ère
La colonne 5 : la 1 valeur : veut dire que 9 employés ont moins de 25 ans
la 2ème valeur : veut dire que 36 employés ont moins de 30 ans

La colonne 6 : la 1ère valeur : veut dire que 6% des employés ont moins de 25.
la 2ème valeur : veut dire que 24% ont moins de 30 ans .

La colonne 7 : la 1ère valeur : 150 employés ont au moins 20 ans .
la 2ème valeur : 141 employés ont au moins 25 ans .

3.2 Les représentations graphiques .
3.2.1 Généralités : Les tableaux statistiques présentent les informations
rassemblées . Ils permettent déjà une première analyse des populations étudiées .
Mais les chiffres restent peu parlant dans un tableau statistique .Il serait
intéressant de traduire les informations par un graphique qui permettra de
visualiser les faits de déceler des tendances et suggère même une certaine
interprétation .
Un graphique doit comporter les éléments suivants :
- Un titre indiquant la nature du phénomène représenté
- Des indications ( légendes , échelles …).
Le mode de représentation graphique d’une distribution statistique dépend de la
nature du caractère observé et du but de l’étude .
On a vu qu’un caractère peut être soit qualitatif soit quantitatif .

3.2.2 Représentations graphiques d’une distribution à caractère qualitatif .


Selon la variable observée , il existe de nombreuses représentations d’une série à
caractère qualitatif qui peuvent être utilisées .

Page 9 sur 55
Support de cours : statistiques probabilités

Cependant les deux plus employés sont :


- Diagramme en tuyaux d’orgue .
- Diagramme circulaire .
3.2.2.1 Diagramme en tuyaux d’orgue :
Appelé aussi diagramme en barre ou diagramme à bandes .
Dans ce diagramme :
- Les modalités sont placées sur une droite horizontale (attention ne pas orienter
cette droite car les modalités ne sont pas mesurables et il n y a pas d’ordre entre
elles) .
- Les effectifs ni (ou les fréquences fi ) sont placés sur un axe vertical .
La hauteur du tuyau est proportionnelle à l’effectif ni (ou la fréquence fi) .
Exemple : Une enquête à un temps donné a concerné 250 touristes visitant la
ville de Marrakech selon leur nationalité .Les résultats sont comme suit :
Nationalité Effectifs (ni) Fréquence (%)
Allemande 55 22
Italienne 30 12
Française 40 16
Américaine 35 14
Belge 45 18
Autres 45 18
Totaux 250 100

Diagrammes en tuyaux d’orgue des effectifs et des fréquences (%)  :


Touristes visitant marrakech selon leur nationalité
60 25
50 20 Effectifs (ni)
%fréquence

40
15
effectif

30 Fréquence (%)
10
20
10 5
0 0

de e se ne e s Nationalité
an nn ai ai lg tre
lie ç i c Be u
le
m
Ita an ér A
Al Fr Am

3.2.2.2 Diagramme circulaire :


Appelé aussi diagramme sectoriel ou à secteurs ou camembert .
Dans ce diagramme l’effectif total n est représenté par un disque plan .
A chaque modalité on fait correspondre un secteur du disque .
L’angle au centre et donc la surface , de chaque secteur est proportionnel à
l’effectif (ni) ou à la fréquence (fi) .
La totalité des 360o correspond à l’effectif total n.
Si ni est la l’effectif de la modalité i à représenter il est traduit par un angle i

Page 10 sur 55
Support de cours : statistiques probabilités

tel que :
360  ni
i = = 360.fi
n
En effet n correspond à 360o
360  ni
ni correspond à i =
n

Autres Allemande
18% 22%

Belge Italienne
18% 12%

Américaine Française
14% 16%

Exemple : Une enquête sur la situation familiale des employés d’une entreprise a
concerné un échantillon de 72 personnes. Les résultats obtenus sont comme suit
Situation Effectifs Fréquences Angles
familiale (ni) (fi)(%) (i)
Célibataires 18 25 90o
Mariés 36 50 180o
Divorcés 12 16,66 60o
Veufs 6 8,33 30o

Totaux 72 100 360o


 
Etablir le diagramme circulaire des effectifs :

Si fi (%) est la fréquence de la modalité à représenter elle sera traduite par un


angle i tel que :
360
i = 100
 fi
Ainsi sur l’exemple précédent : 1 = 90o  ; 2 = 180o  ; 3 = 60o …
3.2.3 Représentations graphiques d’une distribution à caractère quantitatif

Page 11 sur 55
Support de cours : statistiques probabilités

Selon que la variable correspondante au caractère quantitatif est discrète ou


continue, la représentation graphique sera différente .
3.2.3.1 Variable discrète :
Les valeurs entières xi prises par les modalités sont placées sur l’axe des
abscisses et les effectifs ni (ou les fréquences fi) correspondants sur l’axe des
ordonnées. La hauteur du bâton est proportionnelle à l’effectif ou à la fréquence.
L’ensemble des bâtons s’appelle un diagramme en bâtons .
Le polygone des effectifs est obtenu en joignant les sommets des bâtons des
bâtons par des segments .
Exemple : En vue de promouvoir la qualité de ses services , une agence de
voyage a procédé au recensement des hôtels pouvant accueillir sa clientèle dans
les grandes villes marocaines à une période donnée .
Les résultats sont consignés dans le tableau suivant :

Nombre d’étoiles Nombre d’hôtels


( Modalités xi) (Effectifs ni )
1 100
2 120
3 60
4 80
5 40
Total 400

Représentations graphiques
a) Diagramme en bâtons des effectifs.
Nombre d’hôtels (Effectifs ni ) par étoile

150
Effectifs

100

50

0
1 2 3 4 5
Nombre d'étoiles

b) Diagramme en bâton des fréquences.

Nombre d’étoiles Nombre d’hôtels Fréquences


( modalités xi) (effectifs ni ) fi (%)
1 100 25
2 120 30
3 60 15
4 80 20

Page 12 sur 55
Support de cours : statistiques probabilités

5 40 10
Total 400 100

Fréquence des hotêles par étoile

40
% Fréquence

30
20
10
0
1 2 3 4 5
Nombre des étoiles

3.2.3.1.2 Les diagrammes cumulatifs :

Reprenons la série statistique précédente et calculons et représentons


graphiquement les effectifs cumulés croissants et les fréquences cumulées
croissantes.

Nombre d’étoiles Nombre d’hôtels Fréquences Effectifs cumulés Fréquences cumulées


( Modalités xi) (Effectifs ni ) fi (%) croissants (ECC) croissantes
1 100 25 100 25
2 120 30 220 55
3 60 15 280 70
4 80 20 360 90
5 40 10 400 100
Total 400 100 - -

Diagramme en escaliers des effectifs cumulés croissants (ECC)

Page 13 sur 55
Support de cours : statistiques probabilités

500

Effectifs cumulés
400

croissants
300
200
100
0
1 2 3 4 5 6
Nombre des étoiles

Diagramme en escaliers des fréquences cumulées croissantes .

120

100
Fréquence cumulé

80
croissant

60
40
20
0
1 2 3 4 5
Nombre des étoiles

Remarque : On peut représenter de même les diagrammes en escaliers des


effectifs cumulés décroissants (ECD) ou les fréquences cumulées décroissantes .
- On utilise les effectifs (fréquences) cumulés croissants pour répondre
aux questions du style : Quel est le nombre (%) d’individus dont la
valeur du caractère est inférieure à x ?
- On utilise les effectifs (fréquences) cumulés décroissants pour répondre
aux questions du style : Quel est le nombre (%) d’individus dont la
valeur du caractère est supérieure ou égale à x ?

3.2.3.2 Caractère quantitatif continu :


L’histogramme est la représentation appropriée du caractère quantitatif continu .
C’est un ensemble de rectangles juxtaposés. Chaque rectangle associé à chaque
classe ayant une surface proportionnelle à l’effectif (fréquence) de cette classe.

Page 14 sur 55
Support de cours : statistiques probabilités

Remarque : Avant toute construction d’histogramme , il y a lieu de voir si les


classes sont d’amplitudes égales ou inégales .
Deux cas peuvent se présenter :
3.2.3.2.1 Cas de classes de mêmes amplitudes .
La représentation se fait par des rectangles ayant pour base l’amplitude
commune des classes et une hauteur proportionnelle à l’effectif (fréquence)
correspondant à chaque classe .
Exemple : Les salaires horaires en dirhams des cent employés d’une entreprise
sont résumés dans le tableau suivant :
Classes Effectifs Fréquences
(salaires) (ni) (fi)
[10 – 12[ 4 0,04
[12 – 14[ 6 0,06
[14 – 16[ 10 0,10
[16 – 18[ 20 0,20
[18 – 20[ 30 0,30
[20 – 22[ 15 0,15
[22 – 24[ 10 0,10
[24 – 26[ 5 0,05
Totaux 100 1

Histogramme des effectifs

Page 15 sur 55
Support de cours : statistiques probabilités

Histogramme des fréquences

Remarque : En joignant par des segments les milieux des bases supérieures des
rectangles constituant l’histogramme , on obtient le polygone des effectifs ou le
polygone des fréquences .

3.2.3.2.2 Cas de classes d’amplitudes différentes :

Si les classes n’ont pas les mêmes amplitudes, il est nécessaire de rectifier la
hauteur des rectangles de telle sorte que la surface du rectangle soit
proportionnelle à l’effectif (ou fréquence) correspondant .
Pour rectifier la hauteur d’un rectangle on choisit une amplitude unitaire,
généralement la plus fréquente.
Si une classe est d’amplitude k fois l’amplitude unitaire choisie alors
on divise par k l’effectif correspondant à cette classe .
Autrement dit, soit a  l’amplitude unitaire choisie.
Pour une classe i , si son amplitude est ai = k.a , alors l’effectif rectifié
correspondant sera ni/k .
Cette remarque met l’accent sur le fait que, en matière de représentation à l’aide
d’un histogramme, c’est la surface des rectangles et non la hauteur qui est
proportionnelle aux effectifs.

Page 16 sur 55
Support de cours : statistiques probabilités

La construction de l’histogramme se fait par des rectangles ayant pour bases les
amplitudes des classes et des hauteurs proportionnelles aux effectifs rectifiés.
Exemple : Le tableau suivant résume la répartition de 26 magasins d’une chaîne
d’alimentation selon leur volume de vente quotidien moyen en milliers de DH .
Classes Effectifs Amplitudes Effectifs
(milliers dh) (ni) (ai) rectifiés
[40 – 80[ 4 40 4
[80 – 120[ 6 40 6
[120 – 140[ 4 20 8
[140 – 180[ 6 40 6
[180 – 220[ 4 40 4
[220 – 300[ 2 80 1

Si on choisit comme amplitude unitaire a = 40 puisque c’est l’amplitude


fréquente les effectifs rectifiés seront comme indiqués dans le tableau.
Histogramme des effectifs

Remarque : On tracera de même l’histogramme des fréquences.


Courbes des effectifs cumulés croissants et décroissants :
a) la courbe des effectifs cumulés croissants :
Elle est obtenue en joignant par des segments de droite les coordonnées des
points ayant pour abscisses les bornes supérieures des classes et pour
ordonnées les effectifs cumulés croissants correspondants aux classes .
b) La courbe des effectifs cumulés décroissants :
Elle est obtenue en joignant par des segments de droite les coordonnées des
points ayant pour abscisses les bornes inférieures des classes et pour ordonnées
les effectifs cumulés décroissants correspondants aux classes .
Exemple : Soit la série statistique suivante :

Page 17 sur 55
Support de cours : statistiques probabilités

Classes Effectifs Effectifs cumulés Effectifs cumulés


(ni) croissants (ECC) décroissants (ECD)
[60 – 80[ 3 3 100
[80 – 100[ 6 9 97
[100 – 110[ 12 21 91
[110 – 120[ 15 36 79
[120 – 130[ 26 62 64
[130 – 140[ 18 80 38
[140 – 150[ 10 90 20
[150 – 170[ 8 98 10
[170 – 190[ 2 100 2
Total 100 - -

3.2.4 Représentations sous formes de graphiques non cartésiens .

3.2.4.1 Graphiques à coordonnées polaires.

Dans un graphique à coordonnées polaires un point M est repéré par son


argument  (mesure algébrique de l’angle polaire) et par son module  = OM
évalué sur l’axe porté par la demi-droite (OM) .
 (têta) et  (rho) sont les coordonnées polaires du point M.
Ce type de graphique est utilisé pour représenter des séries statistiques à
observations mensuelles, trimestrielles ou annuelles.
Exemple : Le tableau suivant résume l’évolution mensuelle du chiffre d’affaires
en milliers de dirhams d’une entreprise au cours de deux années consécutives .

Page 18 sur 55
Support de cours : statistiques probabilités

Mois J F M A M J J A S O N D
An 1 28 22 27 32 35 32 29 18 29 39 47 45
An 2 31 29 33 33 37 35 31 20 35 41 49 52

Diagramme polaire .
Principe :

3.2.4.2 Graphique à coordonnées semi logarithmiques .

De tels graphiques sont construits à partir d’axes perpendiculaires dont l’un


porte une échelle logarithmique , l’autre une échelle arithmétique .
Exemple : Le chiffre d’affaires mensuelle d’une entreprise exprimé en milliers de dirhams a évolué de la manière
suivante durant les 12 premiers mois de sa création .
Mois 1 2 3 4 5 6 7 8 9 10 11 12
CA(103) 31,6 63 125,9 252 502 1122 2015 4025 7950 19960 3 1622 70820

Il est visible que le graphique simple à échelle arithmétique sera difficile à


représenter à cause de la disproportion entre les valeurs du chiffre d’affaires .
Dans ce cas le recours à une échelle semi logarithmique est une solution
rationnelle pour la représentation d’une telle série .
On calcule alors les logarithmes décimaux des différents chiffres d’affaires .
Exemple : Mois 1 log CA = Log 31600 = 4,499
Mois 1 2 3 4 5 6 7 8 9 10 11 12
CA(103) 31,6 63 125,9 252 502 1122 2015 4025 7950 19960 3 1622 70820
log(CA) 4,499 4,80 5,10 5,40 5,70 6,05 6,30 6,60 6,90 7,30 7,50 7,85

On place sur l’axe des abscisses les mois : Graduation arithmétique ;


sur l’axe des ordonnées les logarithmes des chiffres d’affaires correspondants .
C’est ce qu’on appelle coordonnées semi logarithmiques

Graphique à coordonnées polaires :

Chapitre 4 : Les caractéristiques d’une distribution statistique.

Page 19 sur 55
Support de cours : statistiques probabilités

4.1 Les caractéristiques de position ou de tendance centrale .


Généralités : Synthétiser l’information contenue dans un tableau par un
graphique est la première étape réalisée en statistique. Par la suite, on cherche à
synthétiser encore plus l’information en la réduisant à une seule valeur
numérique. Les caractéristiques de tendance centrale essayent de donner la plus
représentative d’un ensemble de valeurs numériques .
Remarque : Les paramètres définis par la suite n’ont de sens que pour les
variables quantitatives .
4.1.1 Les moyennes :
Les moyennes en tant qu’outils statistiques et en particulier, la moyenne
arithmétique est fréquemment utilisée dans les analyses couvrant tous les
domaines de la vie économique, sociale, politique…
4.1.1.1 La moyenne arithmétique simple :
La moyenne arithmétique simple d’une série d’observations s’obtient en divisant
la somme de toutes les observations par le nombre total de ces observations .
Elle se note : x (se lit x barre).
a) Cas d’une série statistique de n observations.
Soit x1 ; x2 ; x3 ; … ; xn
La moyenne arithmétique simple :

x =
x = i x1  x 2  x3  ...  x n
n i n

Exemple : Etant donné les observations suivantes :


2 – 7 – 3 – 8 – 4 – 12 .
La moyenne arithmétique simple est :

2  7  3  8  4  12 36
x = 6
= 6
=6
b) Cas d’une variable statistique discrète .
La moyenne arithmétique simple est :
x =
 n .x =
i i

n i

n1 .x1  n 2 .x 2  n3 .x3 ...


n1  n 2  n3 ...

Page 20 sur 55
Support de cours : statistiques probabilités

Exemple : On relevé le nombre d’enfants dans 850 ménages ayant au moins un


enfant. On obtenu la série statistique suivante à valeurs isolées.
Nombre d’enfants Effectifs ni.xi
(xi) (ni)
1 282 282
2 273 546
3 148 444
4 70 280
5 35 175
6 42 252
Totaux 850 1979

La moyenne arithmétique simple est : x =


 n .x = 1979 = 2.33
i i

n i850
On dit que chaque ménage a en moyenne 2 à 3 enfants .

c) Cas d’une variable continue groupée par classe .

La moyenne arithmétique simple est :

x =
 n .x i i

n i

xi : centre de la classe i


ni : effectif correspondant à la classe i .

Exemple : Les poids (en kg) de 20 joueurs d’une équipe de foot bal sont répartis
selon les classes du tableau suivant :
Classes Centres des Effectifs ni.xi
(en kg) classes (xi) (ni)
[71,5 – 76,5[ 74 2 148
[76,5 – 81,5[ 79 2 158
[81,5 – 86,5[ 84 4 336
[86,5 – 91,5[ 89 6 534
[91,5 – 96,5[ 94 4 376
[96,5 – 101,5[ 99 2 198
Totaux - 20 1750

La moyenne arithmétique simple est : x =


 n .x = 1750 = 87,5
i i

n 20 i

On dit que chaque joueur a en moyenne un poids de 87,5 kg .

Page 21 sur 55
Support de cours : statistiques probabilités

4.1.1.2 La moyenne arithmétique pondérée .

La moyenne arithmétique pondérée intervient dans le cas ou les observations


n’auraient pas la même importance .
A chaque observation i est associé un coefficient de pondération i indiquant
son poids parmi les autres .
x =
  .x i i

 i

i : le poids affecté à l’observation i


xi : la variable .
Exemple : Etant donné cinq copies (xi)d’un même étudiant notées sur 20 :
(12 – 8 – 17 – 12 – 13),
sachant que leurs coefficients (i) respectifs sont :
(2 – 3 – 1 – 3 – 2).
La moyenne arithmétique pondérée est :

x =
 .x = 12  2  8  3  17  1  12  3  13  2 = 127 = 11,54
i i

 i 2  3 1 3  2 11
On dit que l’étudiant a une note moyenne x = 11,54 .

4.1.1.3 La moyenne géométrique :


La moyenne géométrique est utilisée pour donner une tendance centrale lorsque
l’on cherche à établir une moyenne dans un phénomène multiplicatif .
Exemple : Soit la série statistique suivante :
Valeurs de la Effectifs
variable (xi) (ni)
x1 n1
x2 n2
x3 n3
. .
. .
. .
xk nk
Total n

On appelle moyenne géométrique :

G=

Page 22 sur 55
Support de cours : statistiques probabilités

n
x1n1 .x 2n2 .x3n3 ...x knk

Le calcul d’une moyenne géométrique est long et pénible .


On aura alors l’avantage d’écrire la formule qui donne G sous forme
logarithmique :
1 1
En effet G peut s’écrire : G = ( x1n .x 2n .x3n ...x kn ) n  lnG = ln ( x1n .x 2n .x3n
1 2 3 k 1 2 3
...x knk ) n

1 n n n n 1 n3 nk
lnG = n
ln ( x1 .x 2 .x3 ...x k ) =
1 2 3 k

n
(ln x1n + ln x 2n + ln x3 + …+ ln x k )
1 2

1 1
lnG = n
(n1.lnx1 + n2.lnx2 + n3.lnx3 + …+ nk.lnxk) = n
 ni . ln xi =
 n . ln x
i i

n i

Ce qui peut s’énoncer que :


Le logarithme de la moyenne géométrique est égal à la moyenne arithmétique
des logarithmes des valeurs de la variable :

lnG =
 n . ln x
i i

n i

Exemple : Soit la distribution statistique suivante :


Variable Effectifs lnxi ni.lnxi
(xi) (ni)
15 2 2,708 5,416
13 3 2,565 7,695
9 2 2,197 4,394
11 2 2,398 4,796
12 1 2,485 2,485
Totaux 10 - 24,785

La moyenne géométrique G est elle que :

lnG =
 n . ln x = i i 24,786
= 2,4786
n i 10

 G = 11,92

Page 23 sur 55
Support de cours : statistiques probabilités

Le calcul d’une moyenne géométrique présente toujours un intérêt et a une


signification lorsque les valeurs observées de la variable , mise en ordre
croissant ou décroissant sont en proportion géométrique .
4.1.1.4 La moyenne harmonique

La moyenne harmonique que l’on désigne par la lettre H est égale à l’inverse de
la moyenne arithmétique des inverses des valeurs de la variable :

H
n i

n
x i

Le calcul d’une moyenne harmonique sera intéressant chaque fois que l’on peut
donner un sens aux membres inverses des valeurs de la variable statistique (coût
moyen , vitesse moyenne …)
Exemple : Un automobiliste a parcouru une distance de 100 km avec trois
vitesses différentes comme suit :
Vitesses (km/h) Distance (km) ni
(h)
(xi) (ni) xi
80 10 0,125
100 30 0,300
120 60 0,500
Totaux 100 0,925

La moyenne harmonique :
n i
100
H= n = = 108,108 km/h
x i
0,925
i

on dit que l’automobiliste a parcouru la distance de 100 km à une vitesse


moyenne harmonique de 108,108 km/h .

4.1.2 Le mode :

Le mode ou dominante est la valeur particulière de la variable pour laquelle


l’effectif est le plus élevé .
Remarque : Une série statistique peut présenter deux ou plusieurs modes .

Page 24 sur 55
Support de cours : statistiques probabilités

Elle est alors bi - modale ou multi modales .


4.1.2.1 Cas d’une variable discrète :
Le mode est facile à calculer, il correspond à une valeur bien déterminée de la
série statistique .
Exemple : Lors d’un sondage d’un échantillon de 1000 ménages sur le nombre
de pièces de leurs logements la répartition a été comme suit :

Nombre Effectifs
de pièces (xi) (ni)
1 127
2 273
3 296
4 166
5 et plus 138

La variable qui correspond à l’effectif le plus élevé 296 est x = 3 pièces .


On dit que le 3 pièces est le mode ou la valeur dominante .
On dit aussi que ce type de logement est le plus fréquent .

4.1.2.2 Cas d’une variable continue


4.1.2.2.1 Classes de même amplitude .
On parle de classe modale qui est la classe qui correspond à l’effectif le plus
élevé .
Certains auteurs préconisent par simplicité de prendre pour valeur du mode le
centre de la classe modale .Cependant il préférable de tenir compte des classes
voisines de la classe modale de la manière suivante :
Le mode est alors l’abscisse qui correspond à l’intersection des segments AB
et CD.

Détermination graphique du mode

xxxxx

On démontre que l’expression analytique du mode est la suivante :

d1
Mo = L1 + d  d (L2 – L1)
1 2

Page 25 sur 55
Support de cours : statistiques probabilités

L1 : borne inférieure de la classe modale .


L2 : borne supérieure de la classe modale .
d1 : la différence des effectifs de la classe modale et la classe précédente .
d2 : la différence des effectifs de la classe modale et la classe suivante .

Démonstration : Soit m = Mo – L1 a = L2 – L1

d 2 OE d 2  OE a m am
  D’autre part on a :  
a m am d 1 d1  OE OE
On tire a – m des 2 expressions :

d 2  OE OE
a–m = .a  .a  d1(d2 – OE) = d2.OE  d1.d2 = OE(d1 +d2)
d2 d1
d1 .d 2 OE d1 .d 2 d1
 OE = or m = .a  .a  .a
d1  d 2 d2 (d 1  d 2 ).d 2 d1  d 2
et puisque m = Mo – L1 et a = L2 – L1

d1
donc Mo = L1 + d  d (L2 – L1)
1 2

Exemple : Soit la série statistique suivante :


Classes Effectifs
[10 – 20[ 20
[20 – 30[ 30
[30 – 40[ 40
[40 – 50[ 10
Total 100
a) Déterminons graphiquement le mode Mo :
Traçons l’histogramme de cette série :

b) Appliquons la formule théorique du mode Mo :

d1
Mo = L1 + d  d (L2 – L1)
1 2

La classe qui correspond à l’effectif le plus élevé est [30 – 40[ .


C’est la classe modale . Donc L1 = 30 ; L2 = 40 et L2 – L1 = 10

Page 26 sur 55
Support de cours : statistiques probabilités

d1 = 40 – 30 = 10 ; d2 = 40 – 10 = 30
10
Soit Mo = 30 +  10 = 32,5
10  30
4.1.2.2.2 Classes d’amplitudes différentes .
Même démarche que précédemment à condition de rectifier les effectifs pour
le traçage de l’histogramme correspondant .
Conclusions : La détermination du mode est immédiate .Sa signification est
évidente car il est intéressant de connaître la valeur de la variable qui revient le
plus souvent au cours des observations .
Lorsque la série statistique présente plusieurs modes, le mode perd alors toute
signification. Il est rejeté comme mesure de tendance centrale .

4.1.3 La médiane

La médiane Me d’une série statistique est la valeur de la variable qui partage la


série tel que le nombre des observations qui lui inférieures soit égal au nombre
des valeurs des observations qui lui sont supérieures .
4.1.3.1 Cas d’une variable discrète
Pour déterminer la médiane Me il faut :
1) Ranger en ordre croissant ou décroissant les variables de la série statistique .
2) Examiner la parité de la série :
- Si le nombre n d’observations est impair (n = 2p + 1), alors la médiane
correspond à la (p + 1)e observation .
Me = xp+1
- Si le nombre n d’observations est pair (n = 2p), il existe un intervalle
médian [xp – xp+1[ .On prend généralement la moyenne arithmétique de
la pe et la (p+1)e observation .
x p  x p 1
Me =
2
Exemples : Les données suivantes représentent les notes de 11 élèves lors d’un
examen : 7 – 9 – 8 – 14 – 16 – 8 –14 – 16 – 13 – 7 – 12 .
Pour déterminer la médiane de cette série on doit d’abord la ranger en ordre .
Classons ces notes par ordre croissant :
7 – 7 – 8 – 8 – 9 – 12 – 13 – 14 – 14 – 16 – 16 .
Le nombre d’observations étant égal à 11 donc impair : 11 = 2p + 1  p = 5
et la médiane correspond à la (5 + 1)e soit la 6e observation .
Sur la série Me = 12.
Cela veut dire que 5 élèves ont une note inférieure à la médiane Me = 12 et 5
élèves ont une note supérieure à la médiane à Me = 12.
Si l’effectif des élèves était pair et égal à 12 par exemple , soit :
7 – 9 – 8 – 14 – 16 – 8 – 14 – 16 – 13 – 7 – 12 – 10 .
On classe ces notes par ordre croissant :
7 – 7 – 8 – 8 – 9 – 10 – 12 – 13 – 14 – 14 – 16 – 16 .

Page 27 sur 55
Support de cours : statistiques probabilités

Le nombre d’observations étant pair : n = 2p  p = 6 , donc la médiane


correspond à la moyenne arithmétique de la 6e et la 7e observation .
10  11
Soit Me = 2
= 10,5 .
On conclut que le nombre d’élèves ayant une note inférieure à la médiane est
égal au nombre d’élèves ayant une note supérieure à la médiane Me = 10,5 .
Remarque : Si les notes se présentaient après classement comme suit :
6 – 7 – 7 – 8 – 9 – 10 – 10 – 10 – 10 – 10 – 13 – 14 .
Ici pas de médiane ; en effet l’équipartition de la série n’est pas plus réalisée du
fait que 5 notes sont inférieures à 10 et 2 notes seulement lui sont supérieures .
On peut conclure que , lorsque la variable statistique est discrète , il n’y a pas en
général de valeur médiane .

4.1.3.2 Cas d’une variable continue .

Lorsque les données sont groupées par classes, deux manières pour déterminer
la médiane sont possibles .
- Détermination graphique
- Détermination par le calcul
4.1.3.2.1 Détermination graphique de la médiane :
A partir du tableau statistique élaboré on trace la courbe des effectifs cumulés
croissants (ECC) qui est obtenue en joignant par des segments de droites les
coordonnées des points ayant pour abscisses les bornes supérieures des classes
et pour ordonnées les effectifs cumulés correspondants .
Sur cette courbe on peut déterminer graphiquement la médiane Me qui a
pour valeur l’abscisse du point d’ordonnée la moitié de l’effectif total (n/2).
Exemple : Un sondage a été effectué auprès de 68 personnes sur le temps qu’ils
ont passé devant la télévision un soir . Les résultats sont groupés comme suit :
Classes Effectifs
(mn) (ni)
[0 – 15[ 14
[15 – 30[ 10
[30 – 60[ 16
[60 – 120[ 20
[120 – 180[ 8
Total 68

On dresse un tableau sur lequel sont représentées les colonnes des effectifs
cumulés croissants et décroissants .
Classes Effectifs Effectifs cumulés Effectifs cumulés
(mn) (ni) croissants (ECC) décroissants (ECD)
[0 – 15[ 14 14 68
[15 – 30[ 10 24 54

Page 28 sur 55
Support de cours : statistiques probabilités

[30 – 60[ 16 40 44
[60 – 120[ 20 60 28
[120 – 180[ 8 68 8
Total 68 - -

On trace la courbe des effectifs cumulés croissants (ECC) .

Remarque : On peut déterminer graphiquement la médiane aussi à partir de la


courbe des effectifs cumulés décroissants (ECD) de la même manière que ci
dessus .
Conséquence : L’intersection des deux courbes des effectifs cumulés croissants
et décroissants a pour abscisse la valeur de la médiane Me de la série .
4.1.3.2.2 Détermination de la médiane par le calcul .

Après avoir identifié la classe médiane de la série statistique qui correspond au


premier effectif cumulé croissant supérieur à la moitié de l’effectif total (n/2) .
C’est cette classe médiane qui contiendra la valeur de la médiane qui peut être
donnée par une interpolation linéaire .
Si la classe médiane est la ke classe , c’est à dire de rang k, alors ses bornes
seront [Lk-1 – Lk[ et l’effectif cumulé croissant sera Nk .

n
 N k 1 N k  N k 1
On remarque que : 2 = L L (Triangles semblables)
Me  L K 1 k k 1

Donc :

n
 N k 1
Me = Lk-1 + 2 ( Lk  Lk 1 )
N k  N k 1
Avec :
- Me  : Médiane ,
- Lk-1 : Borne inférieure de la classe médiane de rang k.
- Lk  : Borne supérieure de la classe médiane de rang k.
- n : Effectif total .
- Nk  : Effectif cumulé croissant correspondant à la classe médiane .
- Nk-1 : Effectif cumulé croissant précédent Nk .

Application : Reprenons l’exemple précédent .


L’effectif total n = 68 donc la moitié de l’effectif total est : n/2 = 68/2 = 34
Identification de la classe médiane .

Page 29 sur 55
Support de cours : statistiques probabilités

Dans la colonne des effectifs cumulés croissants on cherche le premier effectif


cumulé croissant supérieur à n/2 (34) .C’est 40.
Il correspond à la classe [30 – 60[qui est la classe médiane .
cette classe médiane est de rang k = 3 .
Donc L3 = 60  ; L2 = 30  ; N3 = 40  ; N2 = 24 .

n 68
 N K 1  N2
Me = Lk-1 + 2 ( Lk  LK 1 ) = L2 + 2 ( L3  L2 )
N k  N k 1 N3  N 2
34  24
Me = 30 + (60  30) = 30 + 18,75 = 48, 75.
40  24
On remarque que cette valeur de la médiane est la même que celle trouvée ci
dessus graphiquement ( Me = 49).

4.1.4 Les quantiles :

Ce sont des caractéristiques de position .


Pour une série statistique de n observations :
La médiane Me sépare les observations en deux groupes d’effectifs égaux .
Il y a trois quartiles Q1 ,Q2 et Q3 qui séparent les observations en quatre
groupes d’effectifs égaux .
Il y a neuf déciles D1, D2, D3…D9 qui séparent les observations en dix groupes
d’effectifs égaux .
Il y a 99 centiles C1, C2, C3 …C99 qui séparent les observations en cent groupes
d’effectifs égaux .
La détermination de ces caractéristiques est identique à celle de la médiane
graphiquement ou par le calcul .
Les quartiles Q1, Q2, Q3 sont obtenus lorsqu’on a cumulé n/4 ; 2n/4 ; 3n/4.
Les déciles D1, D2 … D9 sont obtenus lorsqu’on a cumulé n/10; 2n/10 … 9n/10.
Les centiles C1, C2…C99 sont obtenus lorsqu’on a cumulé n/100, 2n/100 …

On appelle :
 Intervalle inter quartile :
IIq = Q3 – Q1 
Il contient 50% des observations .
 Intervalle inter décile :
IId = D9 – D1
Il contient 80% des observations.
 Intervalle inter centile :
IIc = C99 – C1
Il contient 98% des observations .
Remarques :

Page 30 sur 55
Support de cours : statistiques probabilités

1) Les intervalles inter quartiles, inter déciles, inter centiles présentent un grand
intérêt et sont les plus utilisés dans les analyses de la statistique descriptive .
2) La notion de déciles et de centiles n’a de sens que s’il y a beaucoup
d’observations et donc essentiellement pour une variable classée .
4.1.4.1 Détermination graphique des quartiles :

On procède de la même manière que pour la détermination graphique de la


médiane.
Exemple : Le relevé des retards cumulés en minutes de 120 employés d’une
entreprise pour un mois de travail a donné les résultats suivants :

Classes Effectifs
(mn) (ni)
[100 – 120[ 24
[120 – 140[ 48
[140 – 160[ 30
[160 – 180[ 12
[180 – 200[ 6
Total 120
On dresse un tableau sur lequel est représentée la colonne des effectifs
cumulés croissants (ECC) .
Classes Effectifs ECC
(mn) (ni)
[100 – 120[ 24 24
[120 – 140[ 48 72
[140 – 160[ 30 102
[160 – 180[ 12 114
[180 – 200[ 6 120
Total 120 -

Traçons la courbe des effectifs cumulés croissants .

Remarque :
De la même manière on détermine les déciles et les centiles graphiquement .

4.1.4.2 Détermination des quantiles par le calcul

Par analogie à la médiane :

n
 N k 1
Me = Lk-1 + 2 ( Lk  Lk 1 )
N k  N k 1

Page 31 sur 55
Support de cours : statistiques probabilités

L’intervalle [Lk-1 - Lk[ contient la médiane Me


On détermine les quantiles ainsi ,
- Les quartiles :

n
 N k 1
Q1 = Lk-1 + 4 ( Lk  Lk 1 )
N k  N k 1

L’intervalle [Lk-1 - Lk[ contient le quartile Q1.

n
 N k 1
Q2 = Lk-1 + 2 ( Lk  Lk 1 )
N k  N k 1

L’intervalle [Lk-1 – LK[ contient le quartile Q2 qui est confondu avec Me.

3n
 N k 1
Q3 = Lk-1 + 4 ( Lk  Lk 1 )
N k  N k 1

L’intervalle [Lk-1 – Lk[ contient le quartile Q3 .


- Les déciles

n
 N k 1
D1 = Lk-1 + 10 ( Lk  Lk 1 )
N k  N k 1

L’intervalle [LK-1 – LK[ contient le décile D1 .


.
.
.
9n
 N k 1
D9 = Lk-1 + 10 ( Lk  Lk 1 )
N k  N k 1

- Les centiles

n
 N k 1
C1 = Lk-1 + 100 ( Lk  Lk 1 )
N k  N k 1

L’intervalle [LK-1 – LK[contient le centile C1 etc …

Page 32 sur 55
Support de cours : statistiques probabilités

4.2 Les caractéristiques de dispersion .


Position du problème :
Deux séries statistiques peuvent avoir même moyenne et être assez différentes
l'une de l'autre .
Exemple :
La série 1 comporte les valeurs : 4 - 4,5 - 5 - 5,5 - 6 .
La série 2 comporte les valeurs : 1 - 2 - 5 - 8 - 9 .

La moyenne arithmétique simple est : x =


x i

n i

4  4,5  5  5,5  6 25
Pour la première série : x = 5
= 5
=5
1 2  5  8  9 25
Pour la deuxième série : x = 5
= 5 =5
Ces deux séries ont même moyenne mais les valeurs de la deuxième série sont
plus éloignés de la moyenne x = 5.
On dit que les valeurs de la deuxième série sont plus dispersées.
La connaissance de la valeur centrale ne suffit pas pour traduire numériquement
cette différence des deux séries précédentes , c'est à dire la manière dont se
répartissent les valeurs de la variable les unes par rapport aux autres ou par
rapport à leur valeur moyenne .
Y - a - t - il des procédés pour mesurer ces dispersions ?
Mesure de dispersion basée sur les écarts par rapport à la moyenne .

4.2.1 L'écart moyen .


On appelle écart par rapport à la moyenne : ei = xi - x .
On appelle écart moyen ou moyenne des écarts :
em =
n ei i

n i

Calculons l'écart moyen pour chacune des deux séries précédentes :


Pour la série 1:
(4  5)  (4,5  5)  (5  5)  (5,5  5)  (6  5)
em = =0
5
Pour la série 2 :

Page 33 sur 55
Support de cours : statistiques probabilités

(1  5)  (2  5)  (5  5)  (8  5)  (9  5)
em = =0
5
On remarque que l'écart moyen est nul pour les deux séries.
Il ne peut apporter aucune information pour la mesure de la dispersion.

L'écart moyen est toujours nul .


En effet :
em =
 n e =  n ( x  x) =  (n x  n x) =  n x   n x
i i i i i i i i i i

n i n n n i i i

=
 n x  x  n = x - x = 0.
i i i

n n
i i

4.2.2 L'écart absolu moyen .

eam =
n e i i

n i

4  5  4,5  5  5  5  5,5  5  6  5 3
Pour la série 1 : eam = = 5
= 0,6
5
1 5  2  5  5  5  8  5  9  5 14
Pour la série 2 : eam = = 5
= 2,8
5

Ainsi on peut dire que les valeurs de la série 1 s'écartent en moyenne de la


valeur moyenne x = 5 de 0,6. Alors que les valeurs de la série 2 s'écartent en
moyenne de la valeur moyenne x = 5 de 2,8 .
Conclusion : L'écart absolu moyen est une bonne mesure de l'étalement des
valeurs donc de la dispersion des observations des séries statistiques.
Mais le calcul avec des valeurs absolues sont peu pratiques.
Les paramètres de mesure de la dispersion les plus utilisés sont :
la variance et l'écart type.
4.2.3. La variance
La variance est la moyenne arithmétique des carrés des écarts des valeurs de la
variable à leur moyenne arithmétique .
Si les xi désignent les observations d'une variable discrète ou les centres des
classes d'une variable continue la variance notée V est :

V=
 n ( x  x) i i
2

n i

Calculons la variance de chacune des séries précédentes :

Page 34 sur 55
Support de cours : statistiques probabilités

Pour la série 1 :
( 4  5) 2  (4,5  5) 2  (5  5) 2  (5,5  5) 2  (6  5) 2 2,5
V= = 5
= 0,5.
5
Pour la série 2 :
(1  5) 2  (2  5) 2  (5  5) 2  (8  5) 2  (9  5) 2 50
V= = 5
= 10.
5

Mais ces résultats expriment le carré de l'unité.


Pour retrouver un nombre s'exprimant avec la même unité que les termes des
séries, on définit ainsi une nouvelle caractéristique de dispersion appelée :
Ecart type dont l'importance est primordiale dans l'analyse statistique.

4.2.4 L'écart type :


L'écart type noté  est la racine carrée de la variance :  = v =
 n ( x  x)
i i
2

n i

Il mesure la dispersion autour de la moyenne.


Ainsi pour la série 1  = 0,5 = 0,707.
pour la série 2  = 10 = 3,16.
On peut conclure que les valeurs de la série 1 sont moins dispersées que celles
de la série 2.
Remarque : La variance et l'écart type ne peuvent comparer la dispersion de
deux ou plusieurs séries statistiques que si elles sont de même nature, c'est à dire
elles ont les mêmes unités.

Formule développée de la variance :

V=
n xi i
2

x
2

n i

En effet
  =   n 2x x   n x
2 2
n ( x  x) i
2 2
ni ( x i  2 x i x  x )
i nx
2

V= = i i

i i i

n  ni i n i n n
i i

=
n x i i
2

 2x
n x i i
x
2 n  n x
i i i
2

 2 x.x  x
2

n x i i
2

x
2

n i n i n n
i i n i

4.2.5 Le coefficient de variation :

Le coefficient de variation ou de dispersion est le rapport de l'écart type  à la


moyenne arithmétique x .

Cv = x

Page 35 sur 55
Support de cours : statistiques probabilités

C'est un nombre sans dimension, indépendant donc des unités dans lesquelles
sont exprimées les données .
Il permet de comparer les dispersions des séries statistiques exprimées dans des
unités différentes.
Exemples : Salaires en dirhams et salaires en dollars.
Le poids en kg et la taille en cm pour une population .

Calculons le coefficient de variation pour les séries précédentes :


0,707
Pour la série 1 : Cv = 5
= 0,14.
3,16
Pour la série 2 : Cv = 5
= 0,63.
On peut ainsi conclure que la série 1 est mois dispersée que la série 2.
D'une manière générale:
Une série est fortement dispersée quand son Cv est proche de 1.
Une série est faiblement dispersée quand son Cv est proche de 0.

Page 36 sur 55
Support de cours : statistiques probabilités

CHAPITRE 5 LA CONCENTRATION

5.1 Généralités
Les paramètres : moyenne, médiane, quantiles et écart type ne répondent
que d'une façon incomplète à un type de question que l'on est souvent
amené à se poser en gestion et en économie lors d'une analyse statistique :
La répartition de la masse globale est - elle équitablement répartie sur la
population ou au contraire elle est concentrée sur un petit nombre
d'individus ?
Une telle question n'a de signification que si l'addition des produits des
valeurs de la variable xi par le nombre d'individus (ni) correspondant a elle
même un sens. Autrement dit il faut que les produits (ni.xi) soient
susceptibles d'addition et aient une signification .
Exemple: Des individus classés selon la fortune, le salaire, le revenu, le
chiffre d'affaires, la surface exploitée, la production . . .
Par contre des individus classés selon leur âge, la taille ne présente pas à
priori un intérêt particulier.
On sent alors le besoin de définir une caractéristique qui permet d'étudier
la disparité des masses globales entre les individus d'une série statistique.
Cette caractéristique est la concentration.
5.2 Exemple :
Considérons une entreprise dans laquelle une étude statistique a donné la
distribution des salaires horaires en dirhams de 120 employés.
Classes Effectifs
[0 - 10[ 48
[10 - 20[ 36
[20 - 30[ 24
[30 - 40[ 12
Total 120

5.2.1 Construction de la courbe de concentration.


La courbe de concentration ou de la courbe de GINI ou courbe de
LORENZ se construit sur un graphique cartésien à partir des fréquences
cumulées croissantes exprimées en (%).

Page 37 sur 55
Support de cours : statistiques probabilités

En abscisses : seront portées les fréquences cumulées croissantes en


(%)des effectifs ni : (colonne 6).
En ordonnées : seront portées les fréquences cumulées croissantes en (%)
des produits ni.xi : (colonne 8).

Pour cela on dresse le tableau suivant :

Colonne Colonne Colonne Colonne Colonne Colonne Colonne Colonne


1 2 3 4 5 6 7 8
Classes Effectifs Centres ni.xi fi = fi cum Fi = Fi cum
(ni) (xi) ni (%) ni x i (%)
 ni  ni x i
[0 - 10[ 48 5 240 0,40 40 0,1333 13,33
[10 - 20[ 36 15 540 0,30 70 0,30 43,33
[20 - 30[ 24 25 600 0,20 90 0,3333 76,66
[30 - 40[ 12 35 420 0,10 100 0,2333 100
Totaux 120 --- 1800 1,00 --- 1,00 ---

Les deux axes seront gradués de 0 à 100.


On représente les points de coordonnées :
(0 , 0) ; (40 , 13.33) ; (70 , 43.33) ; (90 , 76.33) et (100 , 100).
Courbe de concentration :
graphe ****

Interprétation de la courbe de concentration.


Si la répartition de la masse globale salariale de l'entreprise était uniforme ou
assez égalitaire , la courbe de concentration se rapproche de la diagonale OI, ce
qui correspond à une faible concentration.
Si au contraire la masse globale salariale était concentrée entre un petit nombre
d'employés alors la courbe de concentration s'éloigne de la diagonale OI et se
rapproche des côtés de l'angle droit en A , ce qui correspond à une forte
concentration.
5.2.2 Le coefficient de concentration ou indice de GINI.

5.2.2.1 La surface de concentration S.


On appelle surface de concentration S la surface située entre la courbe de
concentration et la diagonale OI .
Cette surface est toujours comprise entre 0 et 5000.

Page 38 sur 55
Support de cours : statistiques probabilités

4.2.2.2 Le coefficient de concentration Cc .


On appelle coefficient de concentration Cc, le rapport de la surface de
100  100
concentration S à la surface S' du triangle OAI (S' =  5000 ).
2
S
Cc = 5000
Lorsque Cc se rapproche de 0 alors il ya une faible concentration .
Lorsque Cc se rapproche de 1 alors il ya une forte concentration.
D'une façon générale le coefficient de concentration Cc sera d'autant plus proche
de 1 que la série sera plus concentrée : donc inégalitaire .
Calcul de la surface de concentration S.
On remarque que : S + S' = 5000  S = 5000 - S' .
Il suffit de calculer S' qui est la surface complémentaire de S par rapport à la
surface du triangle OAI .
Dans l'exemple précédent :
S' = surface du triangle (1) + les surfaces des trapèzes (2) , (3 )et (4).
On rappelle que :
B H
La surface d'un triangle de base B et de hauteur H est : 2
La surface d'un trapèze de petite base PB , de grande base GB et de hauteur H
( PB  GB)  H
est : .
2
5.2.2.3 Application .
Calculons le coefficient de concentration de la série précédente :
Pour cela calculons la surface S'.
S' = S1 + S2 + S3 +S4

40  13.33
S1 : Surface du triangle (1) . S1 = 2
= 266,6
(13.33  43.33)  (70  40)
S2 : Surface du trapèze (2) . S2 = = 850.
2
(43.33  76.66)  (90  70)
S3 : Surface du trapèze (3) . S3 = = 1200.
2
(76.66  100)  (100  90)
S4 : Surface du trapèze (4) . S4 = = 883,3.
2
Donc S' = 266.6 + 850 + 1200 + 883, 3 = 3200

S 5000  S  S 3200
Le coefficient de concentration Cc =   1  1  0,36
5000 5000 5000 5000
On peut conclure qu'il s'agit d'une concentration moyenne.

Page 39 sur 55
Support de cours : statistiques probabilités

5.3 La médiale .
On désigne par valeur globale de la variable le produit de la variable xi par
l'effectif correspondant ni, c'est à dire : nixi.
Par définition, la médiale notée Mle est la valeur de la variable pour
laquelle le cumul des valeurs globales représentent 50% du cumul total
(masse globale).
La médiale comme la médiane peut être déterminée de deux manières:
Graphiquement et par interpolation linéaire .
5.3.1 Détermination graphique de la médiale.
Sur une courbe de concentration ayant pour axe d'abscisses Ox et pour axe
d'ordonnées Oy et grâce à un axe Oz auxiliaire descendant réservé aux classes
de la série statistique, on représente la courbe des fréquences cumulées
croissantes en (%) ayant pour axe des ordonnées l'axe des abscisses de la courbe
de concentration et pour axe des abscisses l'axe Oz.
A l'ordonnée 50 prise sur l'axe Oy de la courbe de concentration correspond sur
l'axe Ox une abscisse xm . Cette abscisse devient une ordonnée sur la courbe des
fréquences cumulées croissantes en ( %) qui correspond à une abscisse sur Oz,
cette abscisse est la médiale : Mle.
Remarque : A l'ordonnée 50 sur l'axe Ox correspond la médiane Me de la série
sur l'axe auxiliaire Oz.
Graphe ****
5.3.2 Détermination de la médiale par le calcul .

Pour la médiane on a vu que :

n
(  N k 1 )
Me = Lk 1 + 2 ( LK  Lk 1 )
( N K  N k 1 )

De même la médiale est :


100
(  N k 1 )
Mle = Lk 1 + 2 ( LK  Lk 1 )
( N K  N k 1 )

Page 40 sur 55
Support de cours : statistiques probabilités

[Lk-1 - Lk[ étant la classe médiale c'est à dire la classe correspondant au


premier cumul croissant en (%) des valeurs globales (nixi) supérieur à 50% .
Nk : Le cumul croissant en (%) des (nixi) correspondant à la classe [Lk-1 - Lk[.
Nk-1 : Le cumul précédent Nk .
Remarque : La médiane est toujours inférieure à la médiale, ce qui se vérifie
dans tous les cas puisque les 50% des individus (ni) appartenant aux faibles
classes auront une part dans la masse globale nécessairement inférieure à 50%.

Page 41 sur 55
Support de cours : statistiques probabilités

CHAPITRE 6 Les séries chronologiques

6.1 Définition : Une série chronologique ou chronique est une suite


d'observations d'une variable statistique ayant été faites à intervalles de temps
constants (jours, semaines, mois, trimestres, semestres, années …).
Mathématiquement on peut définir une série chronologique comme un ensemble
de valeurs prises par une fonction y =f(t) .
Exemples :
- Le volume du commerce extérieur d'un pays évalué mois par mois
pendant une décennie .
- Le nombre de voyageurs transportés mensuellement par un organisme
de transport (ONCF, CTM…).
- Les ventes bimestrielles en quantité d'une entreprise .
6.2 Les composantes d'une série chronologique :
La succession des observations d'un phénomène économique au cours du temps
résulte traditionnellement de la superposition de quatre composantes ou
mouvements suivants :
1) Une composante T de longue durée (quelques années) que l'on appelle la
tendance ou Trend qui traduit l'allure d'ensemble du phénomène. C'est le plus
souvent une fonction régulière ( affine par exemple ).
2) Une composante S de courte durée correspondant aux fluctuations annuelles
que l'on appelle composante saisonnière (fermeture de l'usine l'été, conditions
météorologiques (ski)…).
3) Une composante C intermédiaire entre les deux précédentes que l'on appelle
composante cyclique (intervalle de prospérité, intervalle de récession …).
4) Une composante A accidentelle souvent imprévisible dite aléatoire (pannes,
séismes, guerres, sécheresse …).
Remarque : Il y a deux manières de combiner ces quatre composantes :
a) Selon un modèle additif .
Y = T + C + S + A.
On utilise ce modèle lorsque la dispersion (écart type) des valeurs de la
variable t ne varie que très peu d'une année à l'autre .
On pense en effet que les variations successives sont constantes .
b) Selon un modèle multiplicatif.
On utilise ce modèle lorsque la dispersion suit la tendance. Les variations
successives sont constantes en pourcentage .
6.3 Analyse d'une série chronologique .
6.3.1 Généralités :
L'analyse d'une série chronologique nécessite des instruments spécifiques
permettant de corriger les variations saisonnières de l'effet perturbateur des
fluctuations, c'est à dire la désaisonnaliser après sa représentation graphique .

Page 42 sur 55
Support de cours : statistiques probabilités

Parmi les principales méthodes pour désaisonnaliser une série chronologique, la


plus utilisée est celle dite des rapports à la tendance générale ou au trend.
Cette méthode est basée sur les étapes suivantes :
1) La première étape consiste à déterminer le Trend.
2) La deuxième étape consiste à faire le rapport de chacune des valeurs
observées de la série initiale à la valeur calculée à partir du Trend à la même
date .
3) La troisième étape consiste à synthétiser l'ensemble des coefficients en une
seule série des coefficients saisonniers par calcul de la moyenne arithmétique
ou la médiane des coefficients saisonniers qui s'utilisent pour éliminer les
variations saisonnières de la série initiale.
6.3.2 Exemple:
Soit la série chronologique suivante représentant le nombre de voyageurs (en
centaines de milliers) transportés mensuellement par une compagnie autonome
de transport au cours de trois années consécutives .
Tableau des relevées :
J F M A M J J A S O N D
An 1 2 3 4 5 4 5 6 1 4 4 3 4
An 2 4 5 6 4 7 8 7 2 6 9 10 12
An 3 8 10 11 13 13 13 14 7 12 13 14 15

1) Construction de la courbe chronologique .


La représentation graphique de la courbe doit être faite sur du papier millimétré .
L'axe des abscisses est réservé au temps t (t: désigne le rang du mois considéré).
Dans cette exemple t varie de 1 pour le mois de janvier de l'an 1 à 36 pour le
mois de décembre de l'an 3.
Sur l'axe des ordonnées on porte le nombre de voyageurs transportés
correspondant à chaque mois. On obtient ainsi 36 points, que l'on joint par des
segments de droite : c'est la courbe chronologique .
Sur cet exemple on va déterminer la tendance générale ou Trend puis mettre en
évidence l'influence saisonnière en essayant de la mesurer puis l'éliminer.
2) Détermination du Trend .
La représentation graphique de la série suggérant un Trend linéaire .
Le Trend peut être déterminé par plusieurs procédés. Cependant on se limitera
à l'ajustement linéaire par la méthode des moindres carrés(voir principe de la
méthode en annexe n ***)
On remplace les n points de la courbe chronologiques par une droite d'équation
y = at + b dont la pente a est donnée comme suit :
t y
i i  t y
a =
t  t t
2
i

Cette droite passe par le point moyen M( t , y ), c'est à dire y = a t + b Soit:


b= y -a

Page 43 sur 55
Support de cours : statistiques probabilités

t
On dresse alors un tableau de calcul contenant ti ; yi; ti2; tiyi comme suit:
ti yi ti 2 tiyi
1 2 1 2
2 3 4 6
3 4 9 12
4 5 16 20
5 4 25 20
6 5 36 30
7 6 49 42
8 1 64 8
9 4 81 36
10 4 100 40
11 3 121 33
12 4 144 48
13 4 169 52
14 5 196 70
15 6 225 90
16 4 256 64
17 7 289 119
18 8 324 144
19 7 361 133
20 2 400 40
21 6 441 126
22 9 484 198
23 10 529 230
24 12 576 288
25 8 625 200
26 10 676 260
27 11 729 297
28 13 784 364
29 13 841 377
30 13 900 390
31 14 961 434
32 7 1024 224
33 12 1089 396
34 13 1156 442
35 14 1225 490
36 15 1296 540
 t i  66  y i  268  t i 2  16206  t i yi  626
6 5

Page 44 sur 55
Support de cours : statistiques probabilités

On rappelle les formules suivantes afin d'éviter de calculer chaque terme:


i n
n(n  1)
- t
i 1
i  1  2  3  ...  n 
2
;
i n
1
-  t i  1  2  3  ...  n  n(n  1)(2n  1) ;
2 2 2 2

i 1 6
pour notre exemple :
i  36
36  37
ti 1
i 
2
 666
i 36
1
t 2
i  36  37  73  16206.
i 1 6
On tire alors du tableau :
i 36 i  36

t =  ti 666 ; y = y i
268
i 1
  18,5 i 1
  7,44
36 36 36 36

le coefficient a =
t y i i  t  yi

6265  18,5  268 1307
  0,336 .
t  t  ti 16206  18,5  666 3885
2
i

et b = y  at = 7,44 - 0,336  18,5 = 1,224


donc la tendance générale (Trend) peut être traduite par la droite d'équation :

y = 0,336.t + 1,224
On trace alors cette droite sur le graphique de la courbe chronologique .
Cette droite est le Trend de la série chronologique (cf graphique).
3) Etude de l'influence saisonnière .
a) L'objectif est de rechercher pour chacun des douze mois de l'année un
coefficient saisonnier qui sera propre au mois en question.
Pour cela, on utilise la méthode des rapports au Trend .
On détermine d'abord les valeurs prises par le Trend y = 0,336 + 1,224 aux
différents mois (t variant de 1 à 36 ).
Exemples : Mois de rang 1 ; y = 0,336  1 + 1,224 = 1,56.
Mois de rang 2 ; y = 0,336  2 + 1,224 = 1,896  1,90
Mois de rang 3 ; y = 0,336  3 + 1,224 = 2,232  2,23 etc …
Les résultats trouvés sont consignés dans le tableau suivant :

J F M A M J J A S O N D
An 1 1,56 1,90 2,23 2,57 2,90 3,24 3,58 3,90 4,25 4,58 4,92 5,26
An 2 5,60 5,93 6,24 6,60 6,94 7,27 7,61 7,94 8,28 8,62 8,95 9,29
An 3 9,62 9,96 10,3 10,63 10,97 11,30 11,64 11,98 12,31 12,65 12,98 13,32

Page 45 sur 55
Support de cours : statistiques probabilités

b) Détermination des coefficients par la méthode des rapports au Trend.


Pour chacun des 36 mois de la série, on fait le rapport entre les valeurs des
données de la série initiale et les valeurs calculées à l'aide du Trend
correspondantes.
2
Exemples - Le mois de rang 1: c1 = 1,56  1,28

3
- Le mois de rang 2 : c2 =  1,58
1,9

4
- Le mois de rang 13 : c13=  0,71
5,60

15
- Le mois de rang 36 : c36 =  1,13 .
13,32
On obtient alors le tableau des coefficients relatifs à chaque mois de chaque
année .
J F M A M J J A S O N D
An 1 1,28 1,58 1,79 1,94 1,38 1,54 1,68 0,26 0,94 0,72 0,61 0,76
An 2 0,71 0,84 0,96 0,60 1,00 1,10 0,92 0,25 0,72 1,04 1,11 1,29
An 3 0,83 1,00 1,07 1,22 1,18 1,15 1,20 0,58 0,97 1,03 1,08 1,27
total 2,82 3,42 3,82 3,76 3,56 3,79 3,80 2,75 2,63 2,79 2,80 3,32

Enfin on synthétise les coefficients obtenus en coefficients saisonniers par


utilisation de la moyenne ou de la médiane des rapports de chaque mois.
Dans notre cas on va prendre la moyenne arithmétique simple des trois
coefficients relatifs aux mêmes mois des trois années.
Exemple :
Pour le mois de janvier le coefficient saisonnier sera : Cs =  c  2,82  0,94
3 3
3,42
Pour le mois de février le coefficient saisonnier sera : Cs =  1,14
3

3,32
Pour le mois de décembre le coefficient saisonnier sera : Cs =  1,11 .
3
Les coefficients saisonniers sont résumés dans le tableau suivant :
J F M A M J J A S O N D
Cs 0,94 1,14 1,27 1,25 1,19 1,26 1,27 0,92 0,88 0,93 0,93 1,11

Page 46 sur 55
Support de cours : statistiques probabilités

3) Elimination de l'influence saisonnière : Désaisonnalisation


L'élimination de l'influence saisonnière se fera par division des nombres du
tableau initial par le coefficient saisonnier du mois correspondant .
Ainsi les 3 nombres des mois de janvier des trois ans seront divisés par le
coefficient saisonnier calculé ci dessus propre à janvier qui est Cs = 0,94.
De même les 3 nombres des mois de février seront divisés par le coefficient
saisonnier propre à février qui est Cs = 1,14 etc …
Les calculs ont conduit au tableau suivant :

J F M A M J J A S O N D
An 1 2,13 2,63 3,15 4,00 3,36 3,97 4,72 1,09 5,54 4,30 3,22 3,60
An 2 4,25 4,38 4,72 3,20 5,88 6,35 5,51 2,17 6,82 9,68 10,75 10,81
An 3 8,51 8,77 8,66 10,40 10,92 10,32 11,02 7,60 13,63 14,77 15,05 13,51

On obtient ainsi la série désaisonnalisée .


Dans la pratique on représente cette série graphiquement.
La courbe correspondante est une courbe dont les pics sont beaucoup mois aigus
que dans le cas de la série initiale .
6.4 Essai de prévision à partir du Trend et des coefficients saisonniers .

La prévision qui peut être faite est fondée :


- D'une part sur l'hypothèse que les années à venir connaîtront la même
tendance générale que les trois années passées.
- D'autre part sur un calcul correct des coefficients saisonniers .
Supposons qu'on désire prévoir le nombre de voyageurs qui seront transportés
pendant le mois de novembre de l'an 4, premier an à venir après les trois ans
passés .
On utilise d'abord le Trend sous la forme : y = 0,336.t + 1,224
Le mois de novembre en question est de rang 47 à partir du premier mois de la
série. En effet 36 + 11 = 47.
On fait t = 47 dans le Trend soit y = 0,336  47 + 1,224 = 17,02.
On affecte ce résultat du coefficient saisonnier propre au mois de novembre qui
est 0,93. Donc 17,02  0,93 = 15,83 .
On peut alors estimer qu'il sera transporté 15,83 centaines de milliers de
voyageurs soit 15,83  100 000 = 1 583 000 voyageurs environ pendant le mois
novembre de la 4ème année .

Page 47 sur 55
Support de cours : statistiques probabilités

CHAPITRE 7 LES INDICES

7.1Généralités : Dans le domaine économique on se trouve en présence de


grandeurs pour lesquelles on a d'autant plus de difficultés à saisir leur
évolution dans le temps ou dans l'espace ou à la fois dans le temps et dans
l'espace .
Exemples :
- Qu'est ce qu'un niveau de vie ?
- Comment évolue un pouvoir d'achat ?
Il faut alors des instruments de mesure qui peuvent donner des renseignements
et une image dynamique de ces phénomènes .
Ces instruments sont appelés les indices .
7.2 Définition :
Un indice est un nombre sans dimension permettant de suivre l'évolution et de
comparer les valeurs d'une même grandeur susceptible de varier dans différentes
situations (temps ; espace ; catégorie socioprofessionnelle …).
Les grandeurs peuvent être soit :
- Simples alors l'indice est dit simple ou élémentaire .
- Complexes alors l'indice est dit synthétique .
7.3 Les indices simples :
7.3.1 Calcul de l'indice simple .
L'indice étant sans dimension, la connaissance d'une seule valeur n'a donc pas de
signification en soi ; par contre la comparaison de plusieurs valeurs apporte une
information .
On fixe une situation de base comme référence 0.
La valeur de la grandeur X observée dans cette situation de base sera notée X0 .
La même grandeur prenant la valeur Xt dans la situation t.
On peut définir l'indice simple (dit élémentaire) de la grandeur X dans la
situation t relativement à la situation de référence 0, le rapport :

Xt
It/0 = X
0

Pour des raisons de simple commodité pratique de l'expression de l'indice, le


résultat de ce rapport est généralement multiplié par 100, soit :

Xt
It/0 = X .100
0

L'interprétation d'un indice simple doit citer la grandeur étudiée, les situations
concernées, la valeur et le sens de variation.

Page 48 sur 55
Support de cours : statistiques probabilités

Si It/0  100 , soit a = It/0 - 100 .


On dit que la grandeur X a connu une augmentation de a % entre la situationde
référence 0 et la situation t.
Si It/0  100, soit d = 100 - It/0 .
On dit que la grandeur X a connu une diminution de d % entre la situation de
référence 0 et la situation t.
Remarque : Dans la définition précédente on a employé le terme général de
situations; le plus souvent il s'agit d'époques .
t sera donc l'époque d'observation ou de calcul de l'indice et 0 l'époque de base.
Exemple : Supposons qu'à une date donnée 0, le prix d'une certaine marchandise
soit P0 = 4 dh l'unité . Supposons qu'à une date ultérieure le prix de cette même
marchandise soit Pt = 5,20 dh l'unité .
On cherche l'indice simple du prix de la marchandise étudiée à la date t calculée
sur la base 100 à la date de référence 0.

Pt 5,20
It/0 = P  100 = 4  100  130 .
0

On remarque que It/0 100 donc a = 130 - 100 = 30.


On dit que la marchandise étudiée a connu une augmentation de son prix
unitaire de 30 % entre la date de référence 0 et la date d'observation t.
Ainsi on peut dire qu'on dépense 130 dh à la date t pour acquérir la même
marchandise qui coûtait 100 dh à la date de base 0.
7.3.2 Propriétés des indices simples
Trois propriétés essentielles caractérisent les indices simples .
a) L'identité : Il y a identité lorsque la valeur de l'indice est égale à 100.
Xt
It/0 = X  100  100
0

Cela signifie que Xt = X0 c'est à dire que la grandeur X étudiée n'a pas enregistré
de variation à la date t par rapport à la date de référence 0.
Exemple : Un journal vendu à 2,50 dh à la date de référence 0 (an 1999) est
toujours vendu à 2,50 dh à la date d'observation t (an 2004).
2,50
It/0 = 2,50  100  100 .
b) La réversibilité : Il y a réversibilité lorsque le produit de l'indice d'une
grandeur à la date t calculée sur la base 100 à la date de référence 0 par
l'indice de la même grandeur à la date 0 calculée sur la base 100 à la date t
est égal à 104.
It/0  I0/t = 104
En effet :
Xt X0
It/0 = X  100 et I0/t = X  100 d'où It/0 I0/t =10000
0 t

Ce qui montre qu'un indice simple est réversible .


c) La transférabilité ou la circularité d'un indice

Page 49 sur 55
Support de cours : statistiques probabilités

Considérons les mesures X0 , Xt et Xt' d'une grandeur aux dates 0, t et t'.


Soit les trois indices simples suivants :
X X X
It/0 = X  100 ; It'/0 = X  100 ; It'/t = X  100
t t' t'

0 0 t
1
On dit qu'un indice simple est transférable si : It'/0 = I  It/0
100 t'/t
.
X t' X t' Xt
Autrement dit X  X  X .
0 t 0

Ce qui montre qu'un indice simple est transférable .


Exemple : Soit le prix du litre du gasoil au Maroc aux dates suivantes :
Juillet 1996 (date 0) P0 = 4 dh.
Octobre 1996 (date t) Pt = 4,32 dh.
Février 1997 (date t') Pt' = 5,40 dh.
Calculons les indices simples :

P 4,32
It/0 = P  100  4  100  108
t

P 5,40
It'/0 = P  100  4  100  135
t'

P 5,40
It'/t = P  100  4,32  100  125 .
t'

t
1
On vérifie aisément que It'/0 = I  It/0
100 t'/t
1
Soit 135 = 100
(125  108) .

7.4 Les indices synthétiques :

7.4.1 Généralités : La recherche d'un indice peut ne pas être limitée à la


comparaison des mesures d'une seule grandeur aux époques de référence 0
et d'observation t.
On peut en effet envisager de caractériser avec un indice l'évolution de plusieurs
grandeurs et de calculer non plus un indice simple mais un indice synthétique .
On distingue deux types d'indices synthétiques :
- Les indices synthétiques simples qui représentent une moyenne
arithmétique simple d'indices élémentaires.
- Les indices synthétiques pondérés qui représentent une moyenne
pondérée d'indices simples .
7.4.2 Principe de construction des indices synthétiques .
Construire un indice synthétique , c'est résumer en une seule valeur un grand
nombre d'observations de plusieurs grandeurs.
La construction d'un indice synthétique nécessite :

Page 50 sur 55
Support de cours : statistiques probabilités

a) Le choix du nombre d'éléments à retenir, c'est à dire l'échantillon d'éléments


jugé représentatif.
b) La nature des éléments à retenir :
Il convient de retenir des éléments remplissant les deux conditions suivantes :
- Chaque élément retenu devant être en rapport aussi faible que possible
avec les autres éléments également retenus.
- Chaque élément retenu devant être en rapport aussi fort que possible
avec les autres éléments non retenus susceptibles de figurer dans
l'échantillon.
c) Mode de calcul :
Le statisticien doit d'abord justifier le choix entre le calcul de l'indice des
moyennes ou la moyenne des indices.
Exemple : A partir d'une enquête statistique, on a obtenu les prix d'un kg de
viande, d'un litre d'huile, d'un kg de sucre et d'un kg de beurre au cours des
périodes 0 et t .
1 kg de viande 1L d'huile 1 kg de sucre 1 kg de beurre
Prix P0 (dh) 50 6 4 20
Prix Pt (dh) 70 9 5 30

On va calculer l'indice des moyennes arithmétiques des prix et la moyenne


arithmétique des indices des prix de chaque produit .
1) L'indice des moyennes des prix :
On calcule les moyennes arithmétiques des prix P0 et Pt .
50  6  4  20 80
P0    20
4 4
70  9  5  30 114
Pt    28,5
4 4
Pt 28,5
L'indice des moyennes des prix est : It/0 =  100   100  142,5
P0 20
2) La moyenne des indices :
Cherchons d'abord pour chaque produit la valeur de l'indice élémentaire des prix
à la période t calculée sur la base 100 à la période de référence 0.
70
Indice des prix de la viande (1 kg) : It/0 =  100  140
50
9
Indice des prix de l'huile (1 litre) : It/0 = 6  100  150
5
Indice des prix du sucre (1 kg) : It/0 = 4  100  125
30
Indice des prix du beurre (1 kg) : It/0 = 20  100  150
La moyenne arithmétique des indices des prix entre les périodes 0 et t est :
140  150  125  150
It/0 =  141,25
4

Page 51 sur 55
Support de cours : statistiques probabilités

On remarque que la moyenne arithmétique des indices des prix (141,25) est
différente de l'indice des moyennes arithmétique des prix (142,5).
Pour justifier le choix on élimine celui qui change avec le changement des unités
des produits .
Reprenons le tableau précédent dans lequel remplaçons par exemple l'unité le
litre de l'huile par le mètre cube (1000 litres) et le kg du sucre par la tonne soit
(1000 kg), on aura le tableau suivant :

1 kg de viande 1m3 d'huile 1 tonne sucre 1 kg de beurre


Prix P0 (dh) 50 6000 4000 20
Prix Pt (dh) 70 9000 5000 30

Reprenons les mêmes calculs que précédemment et calculons l'indice des


moyennes arithmétiques des prix :
On calcule d'abord les nouvelles moyennes arithmétiques des prix P0 et Pt .
50  6000  4000  20 10070
P0 =   2517,5
4 4
70  9000  5000  30 14100
Pt =   3525
4 4
P 3525
D'où l'indice des moyennes : It/0 = Pt  100  2517,5  100  140
0

On remarque que l'indice des moyennes a changé avec le changement des unités
(140 142,5).
Calculons maintenant la moyenne arithmétique des indices des prix de chacun
des quatre produits.
70
Indice des prix de la viande (1 kg) : It/0 =  100  140
50
9000
Indice des prix de l'huile (1m3) : It/0 =  100  150
6000
5000
Indice des prix du sucre (1 t) : It/0 =  100  130
4000
30
Indice des prix du beurre (1 kg) : It/0 =  100  150
20
D'où la moyenne arithmétique des indices des prix est :
140  150  125  150
I t/0 =  141,25
4
On remarque que la moyenne arithmétique des indices des prix est insensible
aux changements des unités .
En conclusion l'indice des moyennes n'est pratiquement jamais utilisé puisque
l'utilisation d'unités différentes (multiples ou sous multiples des unités) conduit à
un indice différent, ce qui est tout à fait illogique du point de vue économique.
Conséquence : Le mode de calcul le plus approprié est la moyenne arithmétique
des indices.

Page 52 sur 55
Support de cours : statistiques probabilités

7.5 Principaux types d'indices:


Les formules d'indices sont nombreuses, cependant dans la pratique, elles se
réduisent à un petit nombre de types dont les principaux sont ceux de
LASPEYRES et de PAASCHE qui portent essentiellement sur les prix et les
quantités .
7.5.1 Les indices de LASPEYRES.

On notera :
- Pi.o et Qi.o respectivement le prix et la quantité du ième produit à l'époque
de référence 0.
- Pi.t et Qi.t respectivement le prix et la quantité du ième produit à l'époque
d'observation t.

7.5.1.1 L'indice des prix de LASPEYRES.

Lp =
P i .t  Qi.0
 100 =
P i .0  Qi.0
100  P 
  i .t ( Pi.0  Qi .0 ) 
 Pi.0  Qi 0  Pi .0 

On dit que le coefficient de pondération de l'indice des prix est : Pi.o  Qi.o .
Remarques :
1) Si Lp  100 : soit a = Lp 100, on dit que les prix ont augmenté de a % entre
la période de référence 0 et la période d'observation t.
2) Si Lp  100 : soit d = 100  Lp , on dit que les prix ont diminué de d % entre
la période de référence 0 et la période d'observation t.

7.5.1.2 L'indice des quantités de LASPEYRES .

Lq =
Q it  Pi 0
 100 =
Q i0  Pi 0
100  Q 
  i .t (Qi .0  Pi .0 ) 
 Qi.0  Pi.0  Qi.0 

On dit de même que le coefficient de pondération de l'indice des quantités est :


Qi.o  Pi.o
Remarques :
1) Si Lq  100 , soit a = Lq  100, on dit que les quantités ont augmenté entre la
période de référence 0 et la période d'observation t.
2) Si Lq  100 , soit d = 100  Lq , on dit que les quantités ont diminué de d %
entre la période de référence 0 et la période d'observation t.

Page 53 sur 55
Support de cours : statistiques probabilités

4.5.2 Les indices de PAASCHE


7.5.1.3 Indice de LASPEYRES des valeurs globales

Lvg =
Q i .t  Pi.t
 100
Q i .0  Pi.0

7.5.2 Les indices de PAASCHE


7.5.2.1 Indice de PAASCHE des prix

Pp 
P i .t  Qi.t
 100
P i .0  Qi.t

Remarques :
1) Si Pp  100, soit a = Pp  100; on dit que les prix ont augmenté de a % entre
l'époque de référence 0 et l'époque d'observation t.
2) Si Pp  100, soit d = 100  Pp ; on dit que les prix ont diminué de d % entre
l'époque de référence 0 et la période d'observation t.

7.5.2.2 Indice de PAASCHE des quantités

Pq =
Q i .t  Pi.t
 100
Q i .0  Pi.t
Remarque :
1) Si Pq  100, soit a = Pq  100 ; on dit que les quantités ont augmenté de a %
entre l'époque de référence 0 et l'époque d'observation t.
2) Si Pq  100 , soit d = 100  Pq ; on dit que les quantités ont diminué de d %
entre l'époque de référence 0 et l'époque d'observation t .
7.5.2.3 Indice de PAASCHE des valeurs globales

Pvg =
Q i .t  Pi.t
 100
Q i .0  Pi.0
7.5.3 Les indices de FISHER
L'indice de FISHER est la moyenne géométrique des deux indices de
LASPEYRES et de PAASCHE . Il compris entre ces deux indices et vient
pallier à leurs carences .
F = L P
7.5.3.1 Indice de LASPEYRES des prix

Fp = L  P p p

7.5.3.2 Indice de FISHER des quantités

Page 54 sur 55
Support de cours : statistiques probabilités

Fq = Lq  Pq

Exemple

Page 55 sur 55

Vous aimerez peut-être aussi