Vous êtes sur la page 1sur 52

COURS DE STATISTIQUES DESCRIPTIVES DESTINES AUX PREMIERES ANNEES DE LICENCE

KESSE NOEL DIOMANDE

INEC DALOA 2020

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 1


Chapitre 1

LES DISTRIBUTIONS A UN CARACTERE


I. GENERALITES : VOCABULAIRE

Qu’est-ce que la Statistique ?


La statistique est une science qui en globe un ensemble de méthodes et de
théories appliquées à l’analyse de phénomènes et de données dont le
comportement ne peut être décrit avec exactitude, mais plutôt être analysé
dans un contexte d’incertitude. Le but ultime de ces méthodes et modèles est
d’arriver à des conclusions pratiques pour éventuellement proposer des
recommandations et des mesures correctives s’il y a lieu ou encore pour mieux
comprendre ces phénomènes et éventuellement en prévoir le comportement.
La statistique est l’ensemble des instruments et de recherches mathématiques
permettant de déterminer les caractéristiques d’un ensemble de données
(généralement vaste).
On désigne aussi sous le vocable statistique un nombre calculé à partir
d’observation (en usant de méthodes statistiques). Les statistiques sont de
ce fait, le produit des analyses reposant sur l’usage de la statistique.

1. Population

On appelle population un ensemble d'éléments soumis à une étude statistique.


C’est l’ensemble de références sur lequel porte les observations. Il peut
s’agir d’un ensemble de personnes, d’animaux ou de choses.
Prenons comme ensemble d’étude statistique, les machines à dactylographier
stockées dans une salle. L’ensemble des machines à dactylographier de cette
salle est une population : c’est ici la population cible
2. Individu

Un individu est un élément de la population. C’est l’unité de la population


statistique.
Une machine de la salle à dactylographier est un individu.

3. Caractère

Un caractère est une information dont on recueille (ou observe ou mesure) la


valeur sur chaque individu. C’est en quelque sorte l’objet d’étude sur la
population.
Sur les machines à dactylographier de la salle on peut étudier : la marque,
le nombre de touches, la durée de vie… qui sont des exemples de caractères.
Le caractère est aussi appelé variable parce que la valeur de l’information
n’est pas la même d’un individu à l’autre.
4. Modalité

Une modalité est une valeur du caractère.


Par rapport à un caractère donné, une modalité est la situation dans laquelle
se trouve un individu. Une machine de la salle peut porter la marque IBM. Si
le caractère étudié est la marque, alors IBM est une modalité de ce caractère.
La modalité est généralement notée xi .
5. Effectif d’une modalité

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 2


L’effectif d’une modalité est le nombre de fois qu’apparait cette modalité.
Si trois machines et trois seulement de la salle portent la marque IBM, alors
l’effectif de la modalité IBM est 3 machines.
L’effectif est aussi appelé fréquence absolue.
6. Effectif total

L’effectif « N » d’une population est le nombre total d’individus de cette


population. Pour notre exemple, c’est le nombre total de machines dans la
salle.
Si n1 , n2 , n3 , …, nk sont les effectifs des différentes modalités d’un
caractère étudié sur une population, alors N = n1 + n2 + n3 + …+ nk .
k
On écrit plus simplement : N = n
i1
i

7. Fréquence relative d’une modalité

C’est le rapport de l’effectif ni de la modalité i par l’effectif total N.


ni
Elle est notée fi : fi =
N
On montre que f1 + f2 + f3 +…+ fk = 1
NB : la fréquence relative peut être donnée en pourcentage.
ni
Dans ce cas : fi = ×100 et f1 + f2 + f3 + … + fk = 100.
N
8. Caractère qualitatif

Un caractère est dit qualitatif lorsque ses modalités ne sont pas


quantifiables (mesurables).
Le caractère « marque » par exemple est un caractère qualitatif parce que ses
modalités (IBM, Samsung, HP…) ne sont pas mesurables.
9. Caractère quantitatif

Un caractère quantitatif est un caractère dont chaque modalité est une valeur
mesurable.
Les caractères nombre de touches et durée de vie sont des caractères
quantitatifs.
Un caractère quantitatif peut être discret ou continu.
10. Caractère quantitatif discret ou variable discrète

Une variable discrète est une variable dont les modalités ne peuvent prendre
que des valeurs bien déterminées ou isolées.
Le caractère nombre de touches est un caractère discret. En effet le nombre
de touches d’une machine est un nombre bien déterminé : 30 touches, 20
touches, 45 touches….
11. Variable continue

C’est une variable dont les valeurs des modalités décrivent un intervalle
deℝ. En d’autres terme, les modalités d’un caractère quantitatif continu sont
susceptibles de prendre toutes les valeurs d’un intervalle deℝ.
Le caractère « durée de vie » d’une machine à dactylographier est une variable
continue.
Quand l’intervalle des modalités est trop grand, on le découpe en plusieurs
petits intervalles appelés classes. Le regroupement d’une série statistique
en classe n’est pas unique. Il peut différencier d’un statisticien à l’autre.
12. Classe

Une classe statistique est un intervalle de modalités.


Pour l’exemple du caractère « durée de vie », on peut avoir la classe « de 2
à 4 ans ». Dans un tableau statistique, on choisira très souvent
d’écrire[2; 4[ou]2; 4].

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 3


De même qu’on parle d’effectif d’une modalité, on parle aussi d’effectif
d’une classe qui en fait n’est rien d’autre que le nombre d’individus dont
les modalités sont contenues dans cette classe. On calcul alors la
fréquence relative d’une classe de la même manière qu’en 7).
13. Centre de classe

Le centre ci d’une classe [bi ; bi+1 [ ou ]bi ; bi+1 ] ou]bi ; bi+1 [ d’origine bi et
d’extrémité bi+1 où i est un entier naturel est la demi-somme des bornes :
b i + b i+1
ci =
2
14. Amplitude

L’amplitude ai d’une classe d’origine bi et d’extrémité bi+1 est la


différence entre la borne supérieure et la borne inférieure: ai =bi+1 -bi
15. Enquête

Par rapport à un caractère donné, une enquête est une collecte


d’informations. L’enquête peut être exhaustive ou partielle.
16. Recensement

Un recensement est une enquête qui porte sur tous les individus de la
population. On l’appelle aussi enquête exhaustive.
17. Sondage

Le sondage ou enquête partielle porte sur un échantillon ou une portion de


la population.
18. Dépouillement

Le dépouillement d’une enquête sur une population est une opération de


décompte des individus en fonction des modalités ou des classes.
Exemple de dépouillement
On a interrogé 20 élèves d’une classe de BT secrétariat du CBCG de Cocody
au sujet du nombre de cours auxquels chacun a pu assister avant les congés
de Noël 2012. Les résultats obtenus sont les suivants :
2 ;2 ;1 ;3 ;5 ;1 ;5 ;3 ;4 ;4 ;2 ;7 ;3 ;5 ;5 ;8 ;9 ;5 ;5 ;10.
Tableau de dépouillement

Effectif d’élèves
Nombre de cours (xi) Dépouillement
(ni)
2 3

1 2

3 3

5 6

4 2

7 1

8 1

9 1

10 1

19. Tableau statistique

Un tableau statistique est un tableau récapitulatif de d’une enquête. On


distingue deux types de tableaux :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 4


Tableau à simple entrée
Répartition de 20 élèves d’une classe de BT secrétariat du CBCG de Cocody
selon le nombre de cours auxquels chacun a pu assister avant les congés de
Noël 2012.
Modalités 1 2 3 4 5 6 7 8 9 10 Total
Effectifs 2 3 3 2 6 0 1 1 1 1 20

Tableau à double entrée


Répartition de 60 élèves selon le sexe et le nombre de stylos que possède
chaque individu.

Sexe
Masculin Féminin Total
Nombre de stylos
1 6 3 09

2 7 5 12

3 9 7 16

4 13 10 23

Total 35 25 60

II. SERIES STATISTIQUES A UNE VARIABLE


1. Tableaux statistiques
Exemple 1 : Cas d’une variable discrète :
Tableau donnant la répartition de 40 ouvriers de la société D. A. D. selon
le nombre d’enfants scolarisés.
Nombre Effectifs cumulés Fréquences cumulées
Effectifs
d’enfants Fréquences
i n (nombre
scolarisé i
fi (en %) Croissants Décroissant Croissantes Décroissantes
d’ouvriers)
xi
1 0 3 7,5 3 40 7,5 100

2 1 5 12,5 8 37 20 92,5

3 2 16 40 24 32 60 80

4 3 8 20 32 16 80 40

5 4 6 15 38 8 95 20

6 5 2 5 40 2 100 5

Total 40 100
Interprétation de quelques éléments du tableau.
Questions :
Quelle est la proportion d’ouvriers ayant moins de 3 enfants scolarisés ?
Quelle est la proportion d’ouvriers ayant au plus 1 enfant scolarisé ?
Quelle est la proportion d’ouvriers ayant au moins 4 enfants scolarisés ?
Quelle est la proportion d’ouvriers ayant plus de 3 enfants scolarisés ?
Combien d’ouvriers scolarisent plus de 2 enfants ? Au plus 2 enfants ?
Combien d’ouvriers scolarisent 5 enfants ?
Réponses :
La proportion d’ouvriers ayant moins de 3 enfants scolarisés est de 60%.
La proportion d’ouvriers ayant au plus 1 enfant scolarisé est de 20%.
La proportion d’ouvriers ayant au moins 4 enfants scolarisés est de 95%.
La proportion d’ouvriers ayant plus de 3 enfants scolarisés est de 20%.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 5


16 ouvriers scolarisent plus de 3 enfants. 24 ouvriers scolarisent au plus
2 enfants.
2 ouvriers scolarisent 5 enfants.

Exemple 2 : cas d’une variable continue


La répartition de candidats à un test de présélection suivant le total des
points obtenus.
Centr Effectifs cumulés Fréquences cumulées(%)
Total
e de Effectif
i obten Croissant Décroissan Croissante Décroissant
class s ni
u s t s es
e ci
1 [20; 30[ 25 27 27 160 16,875 100,000

2 [30; 40[ 35 43 70 133 43,750 83,125

3 [40; 50[ 45 38 108 90 67,500 56,250

4 [50; 60[ 55 28 136 52 85,000 32,500

5 [60; 70[ 65 21 157 24 98,125 15,000

6 [70; 80[ 75 3 160 3 100,000 1,875

Total 160

Questions
Quel est le nombre de candidats dont le total des points obtenu est :
a) Moins de 40 ?
b) Au moins 60 ?
c) Entre 50 et 60 ?
Réponses :
a) 70 candidats ont moins de 40 points au total.
b) 24 candidats ont obtenu au moins 60 points.
c) 28 candidats ont obtenu un total de points entre 50 et 60.
Exercice
80 employés d’une agence de tourisme, répartis suivant le nombre d’enfants
à charge sont soumis à la fin de l’année à une rétribution de prime à
raisons de 2 500F par enfants à charge.
Le tableau incomplet de la répartition se présente comme suit :

Nombre Fréquence Fréquence


Effectifs Fréquence
i d’enfants à cumulées cumulées
(ni) (fi)
charge décroissantes croissantes
1 0

2 1 0,1875 0,95

3 2 29

4 3 0,225

5 4 10

6 5 0,0375

7 6 0,0125

Questions :
1) Complétez le tableau.
2) Quel est le nombre d’employés ayant :
a- 0 enfant à charge ?

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 6


b- Moins de 4 enfants à charge ?
c- Au moins 3 enfants à charge ?
3) Quel est le montant global des primes perçues par les employés ayant :
a- Entre 2 et 5 enfants inclus
b- Au plus 2 enfants ?
c- Plus de 4 enfants ?
Réponses :
1) Utiliser le tableau précédent.
2) le nombre d’employés ayant :
a-
b-
c-
3) le montant global des primes perçues par les employés ayant :
a-
b-
c-
2. Représentations graphiques
Un graphique est une synthèse visuelle de toutes les informations
recueillies dans un tableau statistique. Quoique moins précis qu’un tableau
de valeurs statistiques, le graphique offre une vue d’ensemble de la
répartition spatiale ou chronologique de la population.
Suivant la nature du caractère étudié, on utilise différents modes de
représentation.
a) Diagramme à bandes

Le diagramme à bande est utilisé pour les caractères qualitatifs. Il se


construit de la façon suivante :
 On construit deux axes perpendiculaires (abscisse et ordonnée)
 Sur l’axe des abscisses on place les différentes modalités
 Sur l’axe des ordonnées on place les effectifs ni ou les fréquences
relatives fi .
 On associe à chaque modalité une bande verticale dont la hauteur est
proportionnelle à l’effectif de la modalité.
Exemple
Dans un magasin est stockées 50 machines à dactylographier. La répartition
de ces machines selon leur marque est consignée dans le tableau suivant :
Effectifs DIAGAMME A BANDES
Marques Effectif 40.00 %
IBM 10 40
Perfect 5
35
Samsung 15
KORES 20 30
30.00 %
Total 50
25

20.00 %
20

15

10.00 %
10

0
KORES
IBM

Perfect

Samsung

-5

-10

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 7


b) Diagramme à secteurs

Le diagramme circulaire ou à secteur est aussi utilisé pour les caractères


qualitatifs. Il se construit de la façon suivante :
L’effectif total est représenté par un cercle ou par un demi-cercle. Chaque
modalité est représentée par un secteur circulaire que l’on peut
différencier par des couleurs ou des nuances différentes et dont la surface
est proportionnelle à l’effectif correspondant. Ainsi, l’angle au centre θi
associé à la modalité i est égal au produit de la fréquence fi par 360°
ou 180°.
n n
θi =360fi ⟺θi =360 i ou bien dans le cas d’un demi-cercle θi =180fi ⟺θi =180 i.
N N

DIAGRAMME CIRCULAIRE

IBM
Perfct
Samsung
KORES

c) Diagramme en bande

Le diagramme en bande se construit de la façon suivante :


On construit une barre verticale de hauteur H. Chaque modalité est
représentée par une portion de la barre dont la surface est proportionnelle
à l’effectif .
100%

80% KORES
Samsung
60%
Perfect
40%
IBM
20%

0%
DIAGRAMME EN
BARRE

d) Diagramme en bâtons

Le diagramme en bâtons est utilisé pour les caractères quantitatifs


discrets.
On marque sur l’axe des abscisses les modalités et sur l’axe des ordonnées,
les effectifs ou fréquences. En chaque point de coordonnées (xi ; ni ) ou(xi ; fi ),
obtenu, on construit un segment (bâton) parallèle à l’axe des ordonnées
jusqu’à l’axe des abscisses. On obtient ainsi un diagramme en bâtons.

Exemple :
Soit la distribution statistique suivante :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 8


Modalités xi 0 1 2 3 4 5 6 Total

Effectifs ni 4 9 8 6 8 3 2 40

Représentons cette série par un diagramme à bâtons


y DIAGRAMME A BATONS

10

-1 0 1 2 3 4 5 6 7 x

3. Paramètres de position
Les paramètres de position permettent de voir les modalités autour
desquelles sont regroupés les individus. Ils sont souvent appelés
caractéristiques de tendance centrale.
a) Le mode
 Définition
Le mode m o (ou dominante) d’une série statistique est la valeur du
caractère qui a l’effectif (ou la fréquence) maximal(e).
Il peut exister plusieurs modes dans une même série.
Lorsque la variable est continue, on définie la classe modale comme étant
la classe dont l’effectif (ou l’effectif corrigé en cas d’amplitude
inégales) est le plus élevé. On admet alors que le mode est le centre de
cette classe.
 Détermination
 Cas d’une variable discrète
Un mode se lit aisément dans le tableau des valeurs (ou sur le diagramme à
bâtons)
Exemple : cas de la répartition de 80 employés d’une agence de tourisme
selon le nombre d’enfants à charge.
Nombre d’enfants à charge 0 1 2 3 4 5 6
Effectifs d’employés 4 15 29 18 10 3 1

Ici, l’effectif le plus élevé est 29. Il correspond à la modalité 2 enfants


à charge. Donc le mode de cette série est 2 enfants à charge.
Exercice
Soit le graphique suivant donnant la distribution de 128 étudiants selon la
note obtenue à l’issu d’un devoir commun de statistiques.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 9


effectfs
20 DIAGRAMME EN BÂTONS
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1

-3 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 modalités
-1
-2

Quel est le mode cette distribution ?

 Cas d’une variable continue


Exemple 1 : Tableau de distribution de 25 élèves selon la taille.

Taille en mètre [1,40 ; 1,50[ [1,50 ; 1,60[ [1,60 ; 1,70[ [1,70 ; 1,80[ Total
Effectifs 3 7 10 5 25

On remarque ici que toutes les classes ont la même amplitude a  0,1 m .
La classe ayant l’effectif le plus élevé est la classe [1,60 ; 1,70[ . Le mode
1,60 + 1,70
mo est donc : mo  soit mo  1, 65 m
2
Exemple 2 : Tableau de distribution de 184 véhicules endommagés suivant la
distance parcourue.

Classe
(distance 80 ; 85 85 ; 90 90 ;100 100 ;110 110 ;125 125 ;150 150 ; 200 Tota
l
en 103 Km)
Effectifs 10 14 60 44 20 28 8 184
(ni)

Amplitudes 5 5 10 10 15 25 50
(ai)
Intervalles 1 1 2 2 3 5 10
unitaires
(UI)
Effectifs 10 14 30 22 6,6 5,6 0,8
corrigés
ni
n ,i 
UI
ni n a
NB : l’effectif corrigé ni est donné par : n ,i  = i  5 où UI = i
UI a i 5

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 10


Ici les classes n’ont pas les mêmes amplitudes. La classe ayant l’effectif
corrigé le plus élevé 30, est la classe 90 ;100 . Le mode est donc
mo = 95 000 km .
b) La moyenne arithmétique
 Définition
Considérons une série statistique de modalités x1, x 2 , x3 , ... , x p dont les
effectifs respectifs sont : n1 , n 2 , n 3 , ... , n p .
La moyenne arithmétique de cette série est le nombre réel noté X tel que :
p
n1x1 + n 2 x 2 +........+ n p x p
X = 1  nixi
n1 + n 2 +........+ n p N i 1

NB : Lorsque l’on ne fait pas mention des effectifs dans un exercice, on


suppose que n1 = n 2 = n3 = ...... = n p = 1 . Dans ce cas si la population totale est
p
x1 + x 2 +........+ x p
N, on calcule X en faisant : X = 1  xi
n1 + n 2 +........+ n p N i 1
 Détermination
Cas de la répartition de 80 employés d’une agence selon le nombre d’enfants
à charge.
La moyenne arithmétique de la série correspondante est :
7
X  1  ni xi  X  1  4  0  15  1  29  2  18  3  10  4  3  5  1 6   X  2,35
80 i 1 80
A noter : Lorsque les modalités sont regroupées en classes, on calcule la
moyenne en utilisant les centres de classe.
Exercices :
 Les notes obtenues par 128 élèves à un devoir sont consignées dans le
tableau suivant :
Modalités 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Total
Effectifs 2 6 6 9 12 18 17 17 14 12 7 5 2 1 128

Calculer la note moyenne des élèves ayant participé au devoir.


 Calculer la moyenne correspondante à la série donnant la répartition de
184 véhicules endommagés selon la distance parcourue.
 Même exercice pour le tableau donnant la répartition de 25 élèves selon
la taille.
Interprétation de la moyenne
La moyenne est la valeur qu’auraient toute les observations (ou modalités)
si elles étaient égales. Elle correspond à un partage du total des
modalités en parties égales.
Pour l’exercice a) précédent, une moyenne de 9,36 signifie si tous les
élèves avaient eu la même note, cette note serait 9,36.
c) La médiane
 Définition
Soit une série statistique dont les modalités sont rangées en ordre
croissant ou décroissant.
On appelle médiane de cette série la modalité qui la partage en deux
parties de même effectif.
 Détermination.
 Cas d’un caractère continu

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 11


On détermine à l’aide des effectifs (ou fréquences) cumulé(e)s croissant(e)
ou décroissant(e) la classe contenant la médiane. Par la suite on calcule
la médiane par interpolation linéaire.
Exemple : cas de la distribution de 184 véhicules endommagés suivant la
distance parcourue.

Classe
(distance 80 ; 85 85 ; 90 90 ;100 100 ;110 110 ;125 125 ;150 150 ; 200 Total
en 103 Km)
Effectifs 10 14 60 44 20 28 8 184
Effectifs
cumulé 10 24 84 128 148 176 184
croissants

N  184  N  92 . 92 est compris entre 84 et 128. On suppose alors que


2
la médiane est contenue dans la classe correspondante à l’effectif cumulé
128. Soit 100 ;110 on admet que F(100)  84 et F(110)  128 .

binf Med bsup


Ni Nf
N/2
N N
M ed  binf i
= 2
bsup  binf N f  Ni
N N
b  binf  + binf
i
M ed = 2
N f  Ni sup

Application numérique

Med  92  84 110  100  100  Med  101,82 103 km


128  84
Remarque :
La détermination de la médiane se fait aussi à l’aide des polygones des
effectifs (ou des fréquences) cumulé (e)s croissant(e)s ou décroissant(e)s.

C’est l’abscisse du point d’ordonnées


N en effectif cumulé (ou 50 % en
2
fréquence cumulée) en considérant chaque polygone. C’est aussi le point
d’intersection des deux polygones.
En guise d’exemple de déterminer graphiquement la médiane de la série
relative à la distribution de 184 véhicules endommagés suivant la distance
parcoure.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 12


effctifs cumulés

200

180

160

140

120

100

80

60

40

20

0
55 65 75 85 95 105 115 125 135 145 155 165 175 185 195 distances parcourues
D1 Q1 Med Q3 D9
-20
 Cas d’une variable discrète

On suppose que les modalités sont rangé par ordre croissant (ou
décroissant).
Cas (m1) : Si l’effectif total N est impair, alors la médiane est la

 
ème
N 1 modalité.
2
Exemple : La médiane de cet ensemble de 9 modalités {2 ; 3 ; 4 ; 6 ; 8 ;

2
éme
9 ; 11 ; 14 ; 15} est 8. Car 8 est la
9 1 (c'est-à-dire la 5ème)

modalité.
Cas (m2) : Si l’effectif total N est pair, alors la médiane est entre la

   
ème ème
N et la
N 1 modalité.
2 2
Lorsque les modalités son pondérées par des effectifs, on attribue la
médiane à la modalité correspondante à l’effectif cumulé croissant le plus

proche de
N mais supérieur à
N.
2 2
Exemple : cas de la répartition de 80 employés d’une agence de tourisme
selon le nombre d’enfants à charge.

Nombre d’enfants à 0 1 2 3 4 5 6 Total


charge
Effectifs d’employés 4 15 29 18 10 3 1 80
Effectifs cumulés 4 19 48 66 76 79 80
croissants
N  80  40 soit19  N  48 . On prendra la modalité correspondante à
2 2 2
l’effectif cumulé 48 comme médiane. Soit Med = 2 enfants à charge .

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 13


NB : Si
N coïncide avec un effectif cumulé, alors on retrouve dans le
2
cas (m2).
Interprétation de la médiane
Exemple de la distribution de 184 véhicules endommagés suivant la distance
parcourue.
M ed  101,82 103 km le nombre de véhicules ayant parcouru moins de
3
101,82 10 km est égal au nombre de véhicules ayant parcouru au moins

101,82 103 km .
d) Les quantiles
On parle de quantiles lorsqu’une série statistique est partagée en k
parties de même effectif.
 Lorsque k  4 , les quantiles sont appelés quartiles.
Les quartiles sont justement les trois valeurs de la série qui partagent
les observations rangées par valeur croissante ou décroissantes, en quatre
groupes de même effectif.
On les note généralement Q1 , Q 2 , et Q3 . Se sont les modalités qui

correspondent respectivement à
N , 2N et 3N .
4 4 4
 Lorsque k  10 , les quantiles sont appelés déciles
Les déciles sont les neuf valeurs de la série qui partagent les
observations rangées par valeur croissante ou décroissantes, en dix groupes
de même effectif.
On les note généralement D1 , D2 , D3 , D9 et sont les modalités qui

correspondent respectivement à
N , 2N , 3N ,....., 9N .
10 10 10 10
 Lorsque k  100 , les quantiles sont appelés centiles.
Les centiles sont les 99 valeurs de la série qui partagent les observations
rangées par valeur croissante ou décroissantes, en cent groupes de même
effectif.
On les note généralement C1 , C2 , C3 ,......, C99 . Se sont les modalités qui

correspondent respectivement à
N , 2N , 3N ,......., 99N .
100 100 100 100
NB : les quantiles se déterminent de la même manière que la médiane.
Exercice :
Pour la série donnant la répartition de 128 élèves selon les notes…
déterminer les quartiles et les déciles puis interpréter ces paramètres.
4. Paramètres de dispersion
Les paramètres de position d’une série (mode, moyenne, médiane, quantiles)
donnent une idée sommaire de la distribution des observations, mais ils ne
suffisent pas à la caractériser.
Pour avoir une parfaite connaissance de cette distribution, il faut voir
comment les valeurs de la série sont réparties autour des paramètres de
position. Ce sont des paramètres de dispersion qui permettent une telle
connaissance.
a. L’étendue
On appelle étendue d’une série statistique, la différence entre la plus grande
et la plus petite valeur que peut prendre le caractère. Elle est généralement
notée e
Exemple 1:
Cas de la répartition de 80 employés d’une agence de tourisme selon le
nombre d’enfants à charge (Série1).

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 14


Nombre d’enfants à
0 1 2 3 4 5 6 Total
charge
Effectifs d’employés 4 15 29 18 10 3 1 80

L’étendue de cette série est : e = 6-0 ⇒e = 6. Soit 6 enfants à charge.


Exemple 2 :
Tableau de distribution de 25 élèves selon la taille (Série 2).
Taille en mètre [1,40 ; 1,50[ [1,50 ; 1,60[ [1,60 ; 1,70[ [1,70 ; 1,80[ Total

Effectifs 3 7 10 5 25

L’étendue de cette série est : e = 1,80 − 1,40 = 0,40. Soit 0,40 m.


b. L’écart absolu moyen
On appelle écart absolu moyen d’une série statistique, la moyenne des valeurs
absolues des écarts à la moyenne arithmétique ̅ X; On le note em.
On considère la série dont les observations (ou les centres de classe)
xi = {x1 , x2 , x3 , … , xk } ont pour effectifs ni = {n1 , n2 , n3 , … , nk }. L’écart absolu
moyen de cette série est alors :
k
em = 1 å ni xi - X N est l’effectif total.
Ni= 1
k
ni
em = å fi xi - X Avec fi =
N
i= 1
Interprétation :
Plus l’écart absolu moyen est élevé, plus la série est dispersée.
Exemple 1 :
̅ = 2,35)
Calcul de l’écart absolu moyen de la série1 (X
xi 0 1 2 3 4 5 6 Total

ni 4 15 29 18 10 3 1 80

|xi − ̅
X| 2,35 1,35 0,35 0,65 1,65 2,65 3,65

ni |xi − ̅
X| 9,4 20,25 10,15 11,7 16,5 7,95 3,65 76,6
7
1 1
em 1 = ∑ ni |xi − ̅
X| = (76,6) = 0,995 avec ̅
X = 2,35
80 80
i=1
Exemple 2 :

Calcul de l’écart absolu moyen de la série 2

Taille en mètre [1,40 ; 1,50[ [1,50 ; 1,60[ [1,60 ; 1,70[ [1,70 ; 1,80[ Total
Centre de classe 1,45 1,55 1,65 1,75
𝐱𝐢
Effectifs 𝐧𝐢 3 7 10 5 25
𝐧𝐢 𝐱 𝐢 4,35 10,85 16,50 8,75 40,45
𝐧𝐢 |𝐱 𝐢 − 𝐗̅| 0,504 0,476 0,320 0,660 1.96
1
̅
X = (40,45) ⇒ ̅ X = 1, 618
25
1
em 2 = (1,96) ⇒ em 2 = 0, 0784. Soit environ 0,08 m.
25
c. La Variance :
La variance est la moyenne arithmétique des carrés des écarts des valeurs
de la variable à leur moyenne arithmétique.
Pour une série dont les observations (ou les centres de classe)
xi = {x1 , x2 , x3 , … , xk } Ont pour effectifs ni = {n1 , n2 , n3 , … , nk } La variance est :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 15


2 2

   
k k
V(X)  1  n i x i  X ou V(X)   f i x i  X
N i 1 i 1
On démontre la formule de Kœnigs suivante:

1  k k
 
V(X)    n x   X V(X)    f i x i 2   X
2 2 2
i i Ou
N 
i 1 i 1  
Exemple1 :
̅ = 2, 35)
Calcul de la variance de la série 1 (X
𝐱𝐢 0 1 2 3 4 5 6 Total

𝐧𝐢 4 15 29 18 10 3 1 80
̅)𝟐
(𝐱 𝐢 − 𝐗 5,5225 1,8225 0,1225 0,4225 2,7225 7,0225 13,3225
̅)𝟐
𝐧𝐢 (𝐱 𝐢 − 𝐗 22,09 27,3375 3,5525 7,605 27,225 21,0675 13,3225 122,2

𝐧𝐢 𝐱 𝐢 𝟐 0 15 116 162 160 75 36 564

1 1
̅)2 = (122,2) = 1, 5275 avec X
V(X) = ∑ ni (xi − X ̅ = 2,35.
80 80
Ou selon la formule de Kœnigs :

1
2 1
V(X) = ( ∑ ni xi 2 ) − X = (564) − 2,352 = 1,5275.
80 80
Exemple2 :

Calcul de la variance de la série 2 ̅ = 1, 618)


(X

Taille en mètre [1,40 ; 1,50[ [1,50 ; 1,60[ [1,60 ; 1,70[ [1,70 ; 1,80[ Total
Centre de
1,45 1,55 1,65 1,75
classe 𝐱 𝐢
Effectifs 𝐧𝐢 3 7 10 5 25

𝐧𝐢 𝐱 𝐢 6,3075 16,8175 27,225 15,3125 65,6625

1
̅2 . Soit V(X)= ( 1 ∙65, 6625) -1,6182 ⟹ V(X)=0, 008576.
V(X)= ( ∑ ni xi ) -X
25 25
d. L’écart type
L’écart type est la racine carrée de la variance. Il est noté σx pour la
variable X et on a :  X  V(X)
Interprétation :
Plus l’écart type est élevé, plus la série est dispersée.
Exemple
L’écart type de la série 2 est :  X  0,008576 . Soit  X  0,0926
e. Ecart Interquartile
L’écart interquartile est la différence entre les deux quantiles extrêmes
d’une série.
Ainsi l’écart interquartile est la différence entre le 3ème quartile et le 1er
quartile.
Il vaut : Q3  Q1 . Il mesure l’amplitude de l’intervalle [Q 3 ; Q1[ qui
contient 50% des informations.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 16


Plus Q3  Q1 est petite, moins les valeurs de la série sont dispersées (plus
les valeurs de la série sont concentrées) ; plus Q3  Q1 est grand, plus les
valeurs de la série sont dispersées.
Exemple
Pour la série 2, admettons que le premier quartile est Q1 = 1,55 et le troisième
est Q 3 = 1,69. L’intervalle interquartile est alors : Q 3 − Q1 = 1,69 − 1,55, soit
0,14 m.
( les valeur de la série sont moins dispersées car l’écart interquartile est
beaucoup plus faible que l’étendue qui est 0,40 m)
NB : on peut comparer l’écart interquartile et la moitié de l’étendue. En
effet

Q 3 − Q1 <
e nous fait pensée à une série moins dispersée.
2
f. Coefficient de Variation
Considérons la moyenne arithmétique x et l’écart type σx d’une population
statistique.
On appelle coefficient de variation notée CV, le rapport de l’écart type σx
𝛔
par la moyenne arithmétique x : 𝐂𝐯 = ̅𝐗
𝐗
L’intérêt du coefficient de variation réside dans la possibilité de
comparaison de deux séries statistiques énoncées dans des unités de mesure
différentes.
Exemple
Le coefficient de variation de la série 2 est : CV 
0, 0926
= 0, 0572 .
1, 618
En général les paramètres de dispersion trouvent leur importance dans la
comparaison de plusieurs séries.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 17


Chapitre 2
LES DISTRIBUTIONS A DEUX CARACTERES
Définition :
P est une population de N individus, sur laquelle sont définis deux
caractères X et Y.Sur chaque individu i de P on observe une modalité xi du
caractère X et une modalité yi du caractère Y. On appelle série statistique

double de caractères (X ; Y) l’ensemble des couples de modalités ( x i ; yi ).


I. NUAGE DE POINTS
1. Définition

Considérons une population statistique à n


éléments pour laquelle on se
propose d’étudier simultanément deux caractères X et Y.

Population n 1er 2ème 3ème … ième … nème

Caractère X x1 x2 x3 … xi … xn
Caractère Y y1 y2 y3 … yi … yn

Dans le plan muni d’un repère orthogonal (O, I, J) , on associe à chaque

couple (x i ; yi ) un point Mi de coordonnées (x i ; yi ) représentant le ième


individu de la population.
On appelle nuage de points, l’ensemble des n points Mi dont les

coordonnées (x i ; yi ) sont des mesures correspondantes des deux variables


statistiques X et Y.
2. Représentation

La représentation graphique d’un nuage de points se fait comme dans


l’exemple suivant :
Exemple :
Soit la série statistique suivant :

X 2 6 8 10 12 14

Y 1 4 4 6 10 12

Représenter le nuage de points associé à cette série

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 18


y
12

10

0 2 4 6 8 10 12 14 x

3. Point Moyen
On appelle point moyen d’un nuage de n points de coordonnées (x i ; yi ) , le
n n
point G(X ;Y) tel que X  1  x i et Y  1  yi
ni1 ni1
Exemple : déterminer les coordonnées du point moyen associé à la série
précédente. Le placer dans le même repère que le nuage de points.
Eléments de réponse : X  8,667 et Y  6,167
II. AJUSTEMENT AFFINE PAR LA METHODE DE MAYER
1. Principe de la méthode de Mayer
On suppose que les modalités x i sont rangées dans l’ordre croissant.

Soit n l'effectif total de la population.



 cas d’un effectif pair n = 2p, p 
On désigne par E1 l’ensemble des p premiers points et par G1 son point
moyen.

On désigne par E2 l’ensemble des p derniers points et par G 2 son point


moyen

 cas d’un effectif impair n = 2p+1, p 
L’un des sous-nuages comportera un point de plus que l'autre.
2. Équation de la droite de Mayer

Dans les deux cas, la droite de Mayer est la droite (G1G2) d’équation

réduite y = ax+b

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 19


yG2 - yG1
Avec a = et b = yG1 - a xG1
x G2 - x G1
Application
On a interrogé 4 élèves au sujet de leur argent de poche X (en FCFA) par
jour et de leur temps de navigation Y(en minutes) sur Internet, par
semaine. Les informations obtenues sont consignées dans le tableau suivant:

xi 600 800 1000 1200

yi 120 280 540 660

 Partager cette série en deux sous-séries.


 Soit G1 le point moyen associé à la sous-série (S1 ) et G2 le point moyen
associé à la sous-série (S2 ) . Calculez les coordonnées de G1 et de G 2 , et
déterminez par la méthode de Mayer, l'équation de la droite d'ajustement
du nuage de points associé à la série étudiée.
Eléments de réponse :G1 (700 ; 200), G2 (1100 ; 600), y = x - 500 .
III. AJUSTEMENT PAR LA METHODE DES MOINDRES CARRES
1. Définition

L’ajustement par la méthode des moindres carrés est l’ajustement obtenu en


minimisant la somme des carrés des écarts entre les valeurs calculées d’une
variable et ses valeurs observées.
2. Coefficient de corrélation linéaire
Il n'est pas toujours facile de dire qu'un ajustement linéaire est justifié
ou non en observant tout simplement un nuage de points. D'ailleurs notre
vue peut nous tromper si nous n'avons pas d'élément scientifique pour
confirmer ce que nous constatons sur le graphique. D’où l’utilité et
l’importance du coefficient de corrélation linéaire.
 La covariance :
Soit une série statistique à deux variables (X,Y) .
On considère le cas où l'effectif de chaque couple de modalité (xi ; yi ) est
égal à 1.
X est la moyenne des xi et Y celle des yi .
La covariance de la série (X,Y) est le nombre réel noté Cov(X,Y) tel que

n
1 x y  XY  n 
Cov(X , Y)  1  (x i  X)(y i  Y)  Cov(X,Y)   i i 
ni=1  n i 1 
 Le coefficient de corrélation linéaire

Le coefficient de corrélation linéaire d'une série statistique à deux


Cov(X,Y)
variables (X,Y) est le nombre réel noté r défini par r
v(X)  v(Y)
On démontre que : 1  r  1
Interprétation

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 20


Si r   1;  0,87  0,87; 1  0,87  r  1, on dit qu’il y a une
forte corrélation linéaire entre les deux variable. On dit alors qu’un
ajustement linéaire est justifié.
Si r  0,87;  0,50 0,5; 0,87  0,50  r  0,87 , on dit qu’il y a
une faible corrélation linéaire entre les deux variables.
Si r  0,60; 0 0; 0,60  0  r  0,6 , on dit qu’il y a une très
faible corrélation linéaire entre les deux variables. Dans ce cas, un
ajustement linéaire est dépourvu de sens.
En particulier, si r  1ou r = -1, on dit qu’il y a une parfaite corrélation
linéaire entre les deux variables.
Si r  0 , on dit qu’il n’y a pas de corrélation linéaire entre les deux
variables.

Attention !
Il n’y a pas de corrélation linéaire ne signifie pas que les deux variables
ne sont pas liées : les deux variables peuvent être liées d’un lien de
nature autre que linéaire.
Exemple

xi 4 5 6 7 8

yi 5 2 1 2 5

y = (x - 6)2 +1
3. Equation des droites de régression
a) Droite de régression de Y en X
Elle se note (DY/X) et l’une de ses équations peut s'écrire sous la forme:
Cov(X ,Y)
y = ax+b avec a= et b = Y - aX .
v(X)
b) Droite de régression de X en Y
Elle se note (DX/Y) et l’une de ses équations peut s'écrire sous la forme:
Cov(X,Y)
x = ay + b avec a  et b = X - a Y .
v(Y)
Application (voir exo 2 sur la fiche)

N.B: L'équation y = ax + b donne une estimation de Y lorsque X est donné


ou connu.
Exemple d’estimation de y pour x = ...
Exemple :
Il a été relevé chez huit planteurs de coton, la superficie X (en ha) et la
production Y (en tonnes) dans le tableau ci-dessous :
xi 2 4 6 8 10 12 14 16

yi 10 15 12 20 22 30 32 35

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 21


a) Représenter dans un repère orthonormé  O, I, J  le nuage de points de la
série statistique double (X ,Y) . On prendra :
En abscisses 1 cm pour 1 ha et en ordonnées 1 cm pour 2 tonnes.
b) Calculer le coefficient de corrélation linéaire. Un ajustement linéaire
pourrait-il être justifié ?
c) Déterminer l’équation de la droite de régression de y en x. Quel serait
le niveau de la production pour un champ de coton d’une superficie de 20
hectares ?
d) Déterminer l’équation de la droite de régression de x en y puis estimer
la superficie d’un champ de coton qui permettrait d’avoir une production
de 40 tonnes.

Elément de réponse :
r = 0,97 et y =1,88x + 5,07

TRAVAUX DIRIGES
Séries statistiques à une variable
Exercice 1
On donne la distribution de 25 élèves d’une classe selon le nombre de leurs
frères et sœurs.
Nombre de frères et sœurs 0 1 2 3 4 5
2 5 x 4 3 1
Nombre d’élèves ( n i )

1. Quelle est la population étudiée ?


2. Quel est le caractère étudié et quelle est sa nature ?
3. Calculer x.
4. Reproduire le tableau en le complétant avec les effectifs cumulés
croissants.
5. Quel est le nombre d’élèves ayant au moins 3 frères et sœurs ?
6. Quel est le nombre d’élèves ayant moins de 3 frères et sœurs ?
7. Combien de frères et sœurs a la majorité des élèves ?
8. Déterminer la médiane de la série étudiée.
Exercice 2
Dans une entreprise on a demandé à chacun des 35 ouvriers quelle était la
durée du trajet de son domicile à son service. Ces durées arrondies aux
multiples de 5 supérieurs, sont :
45 60 90 90 60 100 100 105 100 60
75 60 60 100 90 75 85 105 110 6 0
30 70 75 90 60 90 100 35 75 100
110 125 120 100 90.
1. Ranger ces durées par ordre croissant.
2. Faire un dépouillement en constituant des classes statistiques
d’amplitude constante égale à 15 minutes.
3. Dresser le tableau statistique comportant la colonne:
- des classes
- des centres de classe
- des effectifs
- des fréquences relatives en valeurs décimales
- des fréquences relatives cumulées croissantes et décroissantes en
pourcentages.
4. Donner la classe modale.
5. Déterminer la moyenne, puis la variance.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 22


6. Déterminer la classe médiane.
7. Quel est le pourcentage d’ouvriers faisant :
a. Moins d’une heure de trajet
b. Au moins une heure 30 minutes de trajet.
Exercice 3
Dans une localité donnée, 50 habitations ont été recensées suivant le nombre
de pièces de chacune d’elles. Le résultat du recensement se présente comme
suit :
5 ; 3 ; 4 ; 3 ; 2 ; 1 ; 3 ; 3 ; 3 ; 2 ; 4 ; 3 ; 2 ; 3 ; 1 ; 4 ;
5 ; 1 ; 3 ; 4 ; 3 ; 2 ; 3 ; 2 ; 3 ; 4 ; 2 ; 3 ; 4 ; 3 ; 2 ; 3 ; 1 ;
5 ; 2 ; 3 ; 2 ; 3 ; 5 ; 3 ; 2 ; 3 ; 4 ; 2 ; 3 ; 4 ; 3 ; 1 ; 2 ; 3.
1. a- Quelle est la population étudiée ?
b- Quel est le caractère étudié ; préciser la nature de ce caractère
(qualitatif, quantitatif discret, quantitatif continu)
c- Déterminer les modalités de ce caractère.
2. Elaborer un tableau de dépouillement.
En déduire un tableau statistique comportant les fréquences cumulées
croissantes et cumulées décroissantes en pourcentage
3. Quel est le pourcentage d’habitations ayant :
a-trois pièces ?
b- moins de quatre pièces ?
c- au moins trois pièces ?
4. Si une société immobilière souhaite construire des habitations à louer
dans cette localité, quel type d’habitations réaliserait-elle ? Pourquoi ?
5. Calculer la moyenne, la variance de cette série statistique.
6. Déterminer le mode et la médiane
Exercice 4
Le tableau ci-dessous présente un extrait des résultats de notes obtenues
par des élèves à une interrogation :

Effectifs Effectifs
Fréquence en
Note sur 10 Effectifs cumulés cumulés
%
croissants décroissants
[2 ; 4[ 3
[4 ; 5[ 9
[5 ; 8[ 14
[8 ; 10[ 20
Total

1. Reproduire et compléter le tableau ci-dessus.


2. Calculer la note médiane
3. a) Construire sur le même graphique les polygones des effectifs cumulés
croissants et décroissants.
b) En déduire graphiquement la valeur de la médiane.
Echelle : Abscisses : 1cm → 1
Ordonnées : 1cm → 2 élèves

Séries statistiques à deux variables


Exercice 1
Chaque mois, le comptable d’une société de la place fait le bilan de ses
dépenses xi
Effectuée, ainsi que celui des bénéfices yi réalisés. Au terme de huit

mois d’activités, Voici le tableau qu’il a réalisé en exprimant x i et yi en


millions de francs.

Numéro du mois 1 2 3 4 5 6 7 8

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 23


4,5 6,6 5,4 7,8 10,2 9 8,5 10,8
Dépenses x i (en million de
F)
1,2 3 1,8 3,4 5 4,5 4,2 6
Bénéfice yi (en million de
F)

1. Représenter le nuage de points associé à cette série statistique double


 x i , yi  , dans un Repère orthonormé (O, I, J). (Unité graphique : 1cm pour
un million de francs sur l’axe des abscisses et 2cm pour 1million de
francs sur l’axe des ordonnées).
2. Calculer le coefficient de corrélation linéaire entre les deux variables
de la série.
Que peut-on en déduire ?
3. Déterminer l’équation de la droite de Mayer relative à cette série.
4. Estimer le bénéfice si les dépenses s’élèvent à 15 000 000 F.
5. Quel pourrait être le niveau des dépenses si l’entreprise veut avoir un
bénéfice de 10 000 000 F?
Exercice 2:
Un professeur d’anglais a relevé les moyennes xi en français et les
moyennes yi en mathématiques de 9 de ses élèves. Voici le tableau qu’il a
obtenu.

xi 4 6 8 9 10 11 12 14 16

yi 6 8 9 10 10 12 13 14 15

1. a) Représenter le nuage de points associé à cette série statistique double,


dans le plan muni d’un repère orthonormé (O, I, J). (Unités graphiques : 0,5
cm sur chaque axe)
b) Calculer les coordonnées du point moyen M et le placer dans le repère
(O, I, J).
2- a) En utilisant la méthode de MAYER, déterminer une équation de la
droite d’ajustement linéaire (D) du nuage de points construit précédemment.
Tracer (D).
b) Quelle moyenne obtiendrait au deuxième semestre un élève qui, au
premier semestre a obtenu la moyenne 18 ?
3) Etait-ce judicieux de procéder à un ajustement linéaire ?
4) Donner l’équation de la droite de régression de y en x.
Exercice 4
A la fin du premier semestre de l’année académique 2005 – 2006, il a été
relevé pour 5 élèves d’une classe de première année en transit transport, le
nombre d’absence X et la moyenne Y en mathématique. Les résultats obtenus
sont consignés dans le tableau suivant :

xi 0 5 6 14 15

yi 17 14 12 9 8

Déterminer l’équation de la droite d’ajustement (par la méthode de Mayer)


de cette série et estimer la moyenne en maths d’un élève qui aurait 20 h
d’absence.
Exercice 5

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 24


Le tableau suivant donne pour six mois de l’année 2004, les montants xi des
frais de publicité de l’entreprise de presse « BON JOURNAL » et les
montants yi de ses chiffres d’affaires, exprimés en millions de francs.
moi Jan Fév Mar Avr Ma Jui Juil Aoû Sept Oct Nov Déc
s . . s . i n . t . . . .
5,
xi 5,8 4 6,4 4,6
2
7
11
yi 127 102 137 116
7
142

1. Représenter le nuage de points associé à cette série.

Echelle : Abscisses : 2,5 cm pour 1 million à partir de 4 millions


Ordonnées : 2,5 cm pour 10 millions à partir de 100 millions.
2. Est-il possible d’envisager un ajustement linéaire ? Pourquoi ?
3. Calculer le coefficient de corrélation linéaire pour confirmer votre
réponse en 2)
4. Déterminer l’équation de la droite de régression de y en x.
5. En supposant que les frais de publicité augmente chaque mois de
500 000 F à partir du mois de juin, et que les chiffres d’affaires
évoluent suivant l’équation de la droite de régression de y en x,
compléter le tableau en déterminant :
a. les frais de publicité des six derniers mois,
b. les chiffres d’affaires prévisionnels de ces mois.
6) Etablir l’équation de la droite de régression de x en y.
À quelle date « BON JOURNAL » pourrait-il atteindre 223,51 millions de
chiffre d’Affaires ?
NB : On donnera les résultats des calculs au 1000ème près.

Chapitre 8: LES INDICES STATISTIQUES


I. INTRODUCTION :
Supposons que nous suivions l’évolution, au fil des années, du prix d’une
bouteille de sucrerie vendue dans une cave coopérative donnée. Le 20
novembre de chaque année, la connaissance du prix nous permet, dès la 2ème
année, d’établir une comparaison, la 1ère année étant prise comme année de
base ou année de référence.
Par exemple:P20-11-90 = 275F
P20-11-91 = 285F
P20-11-92 = 270F
P20-11-91 285
Le rapport = = 1,04 définit un indice statistique, dans la
P20-11-90 275
pratique multiplié par 100 pour en faciliter la lecture et l’utilisation,
P1
soit I 1 = ×100 = 104 , indice du prix de la bouteille de sucrerie à
0 P0
l’époque 1 (20-11-91) par rapport à l’époque 0 (20-11-90), époque de base
ou de référence.
Dire que « la bouteille de sucrerie est à l’indice 104», c’est constater
une augmentation de prix de 4% par rapport à l’année de base.
P2 270
De même, l’indice I 2 = ×100 = = 98 indique, en 1992, une diminution de
0 P0 275
prix de 2% par rapport au prix de 1990 (remarquons que l’indice d’une

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 25


Pi
période déterminée par rapport à la même période I i = ×100 = 100 est
i Pi
toujours égal à 100; l’indice de base est donc 100).
270
L’indice I92 = ×100 = 95 constate une baisse de prix de 5% par rapport à
91 285
l’année 1991 prise comme année de référence base 100.
De tels indices, se rapportant à un seul élément, sont des indices simples
(ou indices particuliers ou indices élémentaires).
La grandeur mesurable n’est pas obligatoirement un prix : on peut comparer
des quantités ou des volumes d’un même produit (manufacturé, exporté,
importé,…..).
Si plus ambitieux, nous souhaitons étudier la variation, à chaque rentrée
scolaire, du coût total des fournitures pour un écolier d’une classe
déterminée, la construction d’un indice devient laborieuse.
En effet, il est nécessaire de préciser la nature des fournitures dont
cette catégorie d’écoliers a besoin (cahiers, crayons,……faut-il tenir
compte des vêtements, des chaussures ?....), et leur quantité respective,
tâche d’autant plus complexe et délicate que la pondération de chaque
élément varie d’un enfant à l’autre.
Après avoir défini chaque élément constitutif et sa pondération, nous
pourrons établir un indice à chaque rentrée scolaire. Un tel indice est
appelé indice synthétique.

II. INDICES SIMPLES


La définition d’un indice n’offre aucune difficulté : c’est un nombre
unique qui caractérise la variation relative d’une grandeur mesurable
simple (prix, quantité, volume, etc.) entre deux périodes déterminées
(période de référence et période actuelle, dite période courante) ou bien,
au moment, au même moment, en deux lieux différents. Ce nombre est obtenu
en multipliant par 100 le rapport des valeurs à deux époques (ou en deux
places) différentes dont une est choisie comme base.
Pn
In = ×100
0 P0
Indice simple In de la grandeur à la date n, calculé sur la base 100 à la
0
date 0 (date de base).

1. Choix de la période de base


On choisit généralement l’année ou le mois.
Mais il peut arriver que l’on prenne comme base non pas une année, mais une
période de plusieurs années afin de réaliser un équilibre entre années très
disparates (par exemple, la construction d’indices agricoles doit tenir
compte du fait qu’une année aux récoltes abondantes peut être suivie d’une
année catastrophique). Dans ce cas, toutefois exceptionnel, la base n’est
plus constituée par l’ensemble des observations à une époque donnée, mais
une moyenne des observations sur une période donnée.
Application 1
Les prix moyens de vente au détail d’un produit pendant les années 1987-
1992 sont les suivants :
Année 1987 1988 1989 1990 1991 1992
Prix moyen 5260 5420 4750 5040 5330 5410
au détail
(en francs
par Kg)

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 26


Année 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972
s
Produ 340239 263336 339914 299110 35748350181
399650 325873 634315 421942
ction 5
a) 1987 étant l’année de référence, nous obtenons les indices simples
suivants :
Année 1987 1988 1989 1990 1991 1992
Indice
simple (base
100 en 1987)

b) 1989 étant l’année de référence, nous obtenons les indices simples


suivants :
Année 1987 1988 1989 1990 1991 1992
Indice
simple (base
100 en 1989)

c) les années 1988 à1990 constituent la période de référence, nous obtenons


les indices simples suivants :

Année 1987 1988 1989 1990 1991 1992


Indice
simple (base
1988 à 1990)

Notons que la moyenne arithmétique des indices correspondant à la période


de référence

1988 à 1990 est……………………………………………….= 100, comme pour toute période de base.


2. Propriétés des indices simples
a. Réversibilité
Considérons les indices simples I 1 , I 0 .
0 1

I1 1 I1 I0
0 0 1
Un indice est réversible si : = ou × =1
100 I0 100 100
1
100
b. Transférabilité
Considérons les indices simples I 1 , I 2 , I 2 .
0 0 1

I2 I2 I1 I1
0 1 0 0
Un indice est transférable si : = × ou I 2 = I 2 ×
100 100 100 0 1 100
Application 2
L’évolution de la production de cognac (en hectolitres d’alcool pur) de
1963 à 1972 est résumée par le tableau suivant :

Calculer l’indice simple de quantité correspondant à chacune des années de


la période 1963-1972, en prenant successivement comme période de
référence :
a) 1963
b) 1968
c) La période 1966 et 1967, soit deux années.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 27


SOLUTION :
a) ………………………………………………………………………………………………………………………………………………………………………………………………
….
Années 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972

Indice
simple
(base
100 en
…….. )

b) ………………………………………………………………………………………………………………………………………………………………………………………………
….
Années 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972

Indice
simple
(base
100 en
…….. )

c) ………………………………………………………………………………………………………………………………………………………………………………………………
….
Années 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972

Indice
simple
(base
100 en
……..)

III. LES INDICES SYNTHETIQUES OU COMPOSEES


1. Activité
Une entreprise de restauration rapide a enregistré ces dernières années le
coût de revient du menu type le plus demandé.
Les résultats donnés dans le tableau ci-dessous précisent pour les
principaux constituants du menu :
- les quantités nécessaires à la réalisation du menu ;
- le coût unitaire de chacun des constituants du menu.

1999 2001
Menu Q0 P0 Q1 P1
Hamburger 120 Kg 840 F/Kg 130 Kg 930 F/Kg
Frites 110 Kg 385 F/Kg 90 Kg 415 F/Kg
Boisson 30L 170 F/L 50L 200 F/L
gazeuse

L’indice du coût de revient de ce menu type est un indice composée.


Son calcul prend en compte l’évolution des quantités Q 0 et Q1 et des prix P0
et P1 des trois produits.
1. Calculer l’indice du coût de revient selon la méthode de LASPEYRES : on
ne tient compte que des quantités Q 0 .
● Coût de revient d’un menu en 1999 :
C99 =……………………………………………………………………………………………
●Coût de revient d’un menu en 2001 :
C01 =……………………………………………………………………………………………
●En prenant comme base 100 en 1999, l’indice de LASPEYRES est :

I01 = …………………………………………………………………………………………
99

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 28


Le calcul d’un indice composé par la méthode de LASPEYRES se fait toujours
avec les quantités fixées à l’époque de référence.
2. Calculer l’indice du coût de revient selon la méthode de PAASCHE : on ne
tient compte que des quantités Q1 .
Coût de revient d’un menu en 1999 et 2001 en utilisant les quantités
consommées en 2001 :
C99 =…………………………………………………………………………………………..

C01 =…………………………………………………………………………………………
L’indice de PAASCHE est :
I01 =……………………………………………………………………………………….
99
Le calcul de l’indice de PAASCHE se fait avec les quantités consommées en
2001.
2. Remarques :
- Les indices calculés…………et …………sont légèrement différents : il faut donc
préciser la méthode utilisée dans le calcul d’un indice composé.
- Le calcul par la méthode de LASPEYRES est le plus utilisé (on utilise
toujours les mêmes coefficients : ceux de l’époque 0)
- Les indices composés sont également appelés : « indices synthétiques »
ou « indices pondérés ».

3. Indices composés

 L’indice composé est un nombre sans unité, qui traduit l’évolution dans
le temps de plusieurs grandeurs.
 Le calcul de l’indice composé peut se faire par deux méthodes
différentes :
a. Méthode de LASPEYRES :
Les coefficients de pondération sont les quantités consommées à l’époque de
référence :
Σq 0 p1 p0 : prix ü
ïï
I1 = ×100 ý à l'époque 0
0 Σq 0 p 0 q 0 : quantitéïïþ
p1 :prix ü
ïï
ý à l'époque 1
q1 : quantitéïïþ
b) Méthode de PAASCHE :
Les coefficients de pondération sont les quantités consommées à l’époque
1 :

Σq1p1 p0 : prix ü
ïï
I¢1 = ×100 ý à l'époque 0
0 Σq1p0 q 0 : quantitéïïþ
p1 :prix ü
ïïý à l'époque 1
q1 : quantitéïïþ

Exemple
On donne le tableau suivant :

Produits Epoque 0 Epoque 1


Prix unitaire quantité Prix unitaire Quantité
A 15 2 18,5 5
B 6 10 4,5 8
C 3 25 4 32
Calculer à 0,1 près, l’indice composé des prix :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 29


1. par la méthode de LASPEYRES.
2. par la méthode de PAASCHE.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 30


EXERCICE 1 :
Un commerçant TRAVAUX DIRIGES vend un magnétoscope de
7 020F en novembre 1987. En
novembre 1986, le prix du magnétoscope était de 6 500F.
En prenant pour base 100 en novembre 1986, calculer l’indice du prix du
magnétoscope en novembre 1987 par rapport à novembre 1986.
EXERCICE 2 :
En avril 1985, le prix d’un kilogramme de café de marque et de qualité
déterminées est 384F. Le prix de ce kilogramme de café est passé à 470,4F
en juin 1987.
Quel est l’indice du prix de vente du café en juin 1987 en prenant pour
base 100 le prix en avril 1985 ?
EXERCICE 3 :
Compléter le tableau suivant :
P0 Pt It/0
Article A 164 188,6 ….
Article B 237 …… 94
Article C … 98,49 117,25

EXERCICE 4 :
Le prix d’un vélomoteur est de 41 860F en avril 1987. L’indice du prix de
ce vélomoteur, à cette date, par rapport au prix de février 1984 est 115.
Quel était le prix de ce vélomoteur en février 1984 ?
EXERCICE 5 :
Quantités pêchées en côte d’ivoire (en milliers de tonnes) :
1970 1980 1981 1982 1983
764,4 765,4 721,0 738,0 780,0
Calculer les indices simples pour les années 1980 à 1983, base 100 en 1970
1
(résultats au par excès) des quantités pêchées.
10
EXERCICE 6 :
Le prix d’un litre d’un produit déterminé était aux différentes époques
considérées :
Epoque Prix (FCFA)
0 36
1 39,06
2 40,68
3 43,74
4 50,85
1. calculer les indices I1 / 0 ; I2 / 0 ; I3 / 0 ; I 4 / 0 du prix du produit par rapport à
l’époque d’origine.
2. Calculer l’indice I 4 / 2 (indice du produit à l’époque 4 par rapport à
l’époque 2).
1
3. Vérifier la relation : I 4 / 0 =  I4 / 2  I2 / 0 
100
EXERCICE 7 :
En 1984, un aspirateur est vendu 15 520F. Un modèle équivalent de la même
marque valait 9 700F en 1980.
1. Calculer l’indice I84 / 80 du prix de l’aspirateur en 1984, base 100 en
1980.
2. En 1982, l’indice I82 / 80 correspondant était de 128 (base 100 en 1980).
Quel était le prix de l’aspirateur en 1982 ?
1
3. Calculer I84 / 82 . Ensuite, vérifier la relation : I84 / 80 =  I84 / 82  I82 / 80  .
100
4. Quel a été le pourcentage d’augmentation entre 1980 et 1984 (par rapport
au prix de 1980) ?

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 31


EXERCICE 8:
Prix
Epoque
Article 0 t
A 52 59
B 61 63
C 48 47

Quantités
Epoque
Article 0 t
A 52 59
B 61 63
C 48 47

1. Calculer l’indice synthétique des prix I t / 0 pour les 3 articles par la


méthode de Laspeyres.
2. Compter l’indice synthétique des prix I t / 0 pour les 3 articles par la
méthode de Paasche.
1
Résultats au par excès.
10

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 32


Chapitre 3

I. DEFINITION SÉRIES CHRONOLOGIQUES


On appelle série chronologique, une série statistique ordonnée en fonction
du temps. Autrement dit, c’est une série statistique à deux variables dont
l’une est le temps.
II. MODELES DE DECOMPOSITION DES SERIES CHRONOLOGIQUES
1. Etude des composantes des séries chronologiques

L’étude des phénomènes économiques a distingué depuis longtemps divers


types d’évolution qui peuvent éventuellement se combiner :
 La tendance (Tt) ou TREND : cette composante représente
l’évolution « moyenne » à long terme de la variable ; elle correspond à
une variation lente s’effectuant dans un sens déterminé qui se maintient
pendant de longues périodes.
 La composante cyclique (Ct) : cette composante chère aux
conjoncturistes, est souvent difficile à obtenir. Elle est un mouvement
d’allure quasi périodique comportant une phase croissante et une
décroissante. Il n’est pas toujours aisé de le distinguer de la
précédente.
 La composante saisonnière (St) : comme la précédente, cette composante
est supposée périodique. Elle se distingue cependant du fait que sa
période est généralement dépendante de notre environnement. Cette
liaison peut être naturelle, comme l’influence de saisons sur la
consommation mensuelle d’électricité, ou due au mode d’organisation de
notre société, comme l’impact de la période des fêtes de fin d’année sur
le chiffre d’affaires mensuel d’un magasin de jouets.
 La composante résiduelle (Rt) : celle-ci regroupe tout ce qui n’est pas
pris en compte par les composantes précédentes, et notamment les
multiples influences extérieures qui ont pour caractéristiques de ne pas
avoir d’impact important sur l’allure générale de la série.
2. Méthodes de décomposition

Comment combiner ces différentes composantes ? Deux lois d’agrégation sont


généralement retenues, on peut distinguer entre un schéma additif : Xt =
Tt+Ct+St+Rt et un schéma multiplicatif :
Xt = Tt.Ct.St.Rt.
Le schéma additif correspond à une chronique où le profil saisonnier ne se
modifie pas au cours du temps et où la tendance est peu marquée tandis que
le schéma multiplicatif rend compte des séries chronologiques où
l’amplitude du profil saisonnier évolue au cours du temps
proportionnellement à la valeur de la tendance. Notons que le schéma
multiplicatif se ramène au schéma additif par passage au logarithme
Log(Xt)=Log (Tt.Ct.St.Rt.)=Log (Tt)+Log (Ct)+Log(St)+Log (Rt).
3. Méthode permettant de connaître le schéma:
a. Méthode graphique

On relie par une courbe d’une par les maxima de la série, d’autre part les
minima.
 Si les deux courbes ainsi obtenues sont parallèles, le schéma est de
type additif.
 Si les deux courbes ne sont pas parallèles, le schéma est de type
multiplicatif.
b. Méthodes analytiques
 On calcule pour chaque année de la série la moyenne et l’écart-type des
observations. Si l’on peut considérer les écarts-types comme constants
sur la période, le schéma est de type additif : dans le cas contraire,
le schéma est de type multiplicatif. Et si on calcule la droite des

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 33


moindres carrés y = a x+ b si a=0, c’est un schéma additif et a≠0, le
schéma est multiplicatif.
 Dans le cas de variations saisonnières additives, la somme des écarts
n
saisonniers est nulle : S
j= 1
j  0
.
 Dans le cas de variations saisonnières multiplicatives, la somme des
n
écarts saisonniers est égale au nombre de périodes n : S
j= 1
j  n
.

Les méthodes d’analyse sont nombreuses ; aussi les solutions sont-elles


variables, tout en restant voisines les unes des autres. D’autre part, il
ne faut pas s’attendre à une grande précision dans les calculs (toujours
longs), car les variations saisonnières ne sont jamais régulières, ni d’une
ampleur identique.
4. Détermination de la tendance

La tendance observée peut être donnée par la direction d’une droite


d’ajustement affine de ce nuage de point. Si le coefficient directeur de
cette droite est positif, cela traduit bien une augmentation. Dans le cas
contraire, cela traduit une diminution.
5. Etude de la composante saisonnière

L’élimination de la composante saisonnière, appelée aussi la


désaisonnalisation d’une série chronologique, occupe une place
prépondérante dans la littérature. De nombreuses méthodes de
désaisonnalisation existent. Nous exposons ici seulement la méthode des
moyennes mobiles.
 Estimation de la composante saisonnière par moyenne mobile : Schéma
additif :

Considérons le cas d’une série Xt = Tt+Ct+St+Rt observée trimestriellement.


Nous allons déterminer les quatre coefficients saisonniers S1, S2, S3 , S4
caractéristiques de chaque trimestre. La procédure est la suivante :
a. Estimer la tendance X̂ t par la moyenne mobile

X t-2 X
 X t-1  X t +X t+1 + t+2
X̂ t  2 2 t = 3, 4, ...., n-2
4
X̂ t
ne contient plus de composante saisonnière.
b. Calculer les écarts à la série observée :
ˆ
et = X t  X t = 3, 4, ...., n-2
t
c. Rassembler les écarts relatifs aux mêmes trimestres pour les mêmes
années
1er trimestre : e5, e9, e13
2 ème trimestre : e6, e10, e14
3 ème trimestre : e3, e7, e11
4 ème trimestre : e4, e8, e12
Calculer la moyenne des écarts relatifs à un même trimestre : e1, e2 , e3 , e4 ;
ces nombres sont des coefficients saisonniers provisoires.
d. Calculer S = e1  e 2  e 3  e 4

 Si S=0 alors e1, e2 , e3 , e4 sont des coefficients saisonniers définitifs :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 34


S1 , S2 , S3 , S4 .
 Si S≠ 0, on norme les coefficients saisonniers afin que la somme soit
S S S S
nulle. Pour cela on pose : S1 = e1  , S2  e 2  , S3  e3  , S4  e 4  .
4 4 4 4
e. désaisonnaliser la série :

La série désaisonnalisée est alors : X t  Sj , pour un schéma additif. La


série désaisonnalisée est appelée série corrigée des variations
saisonnières, elle est notée CVS.
 Estimation de la composante saisonnière par moyenne mobile: schéma
multiplicatif :
 Estimer la tendance par moyenne mobile :
Cette étape est identique à celle du schéma additif.
 Calculer le rapport entre la série observée et la tendance:
Xt
et =
Xt
 Rassembler les coefficients relatifs au même trimestre et calculer leur
moyenne:
 Normer les coefficients :
Calculer S = e1 + e 2 + e3 +e 4 .
 Si S = 4 alors e1 , e2 , e3 , e4 sont les coefficients saisonniers
définitifs : S1 , S2 , S3 , S4 .
 Si S ≠ 4, on norme les coefficients saisonniers en posant :
e1  4 e2  4 e3  4 e4  4
S1 = ; S2 = ; S3 = ; S4 = .
S S S S
 Désaisonnaliser la série:
Xt
La série désaisonnalisée est alors : pour un schéma. La série
Sj
désaisonnalisée est appelée série corrigée des variations saisonnières,
elle est notée CVS.

REMARQUE :
Les calculs faits précédemment sont facilement transposables au cas d’une
série mensuelle. Dans ce cas, on estime 12 coefficients saisonniers S1 , S2
,…., S12 en estimant la tendance par la moyenne mobile d’ordre 12 suivante :
X t 6 X
 X t 5  X t  4  ...  X t +...X t  4 +X t 5 + t  6
X̂ t  2 2 t = 7, 8, ....,n-7, n-6
12
Dans ce cas, les coefficients saisonniers doivent vérifier les contraintes
12 12

S
j=1
j =0 pour le schéma additif et S
j=1
j = 12 pour le schéma

multiplicatif. On peut aussi utiliser la méthode de l’ajustement linéaire


pour désaisonnaliser une série. Le principe est le même que précédemment,
il suffit tout simplement d’estimer une tendance linéaire Xˆ = a t + b . Pour
t
le schéma additif, on parle de méthode de la différence à la tendance. Pour
le schéma multiplicatif, cette technique de désaisonnalisation est appelée
méthode du rapport à la tendance.
6. Prévision
a. Cas où la série Xt ne contient pas de composante saisonnière :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 35


Dans cette situation la prévision peut être faite par extrapolation sur une
droite de tendance dont l’équation est calculée à l’aide d’un ajustement
linéaire. Les valeurs extrapolées donnent directement les valeurs
prévisionnelles de la série.
b. Cas où la série Xt comporte une composante saisonnière :
Dans ce cas on désaisonnalise la série et on obtient la série CVS qui est
une approximation de la tendance. Les valeurs extrapolées de la série CVS
donnent des prévisions. On utilise ensuite les coefficients saisonniers
pour obtenir les prévisions de la série brute. Si la saisonnalité est
additive, on additionne par le coefficient saisonnier. Dans le cas d’une
saisonnalité multiplicative, on multiplie par le coefficient saisonnier.

EXERCICES D’APPLICATION
EXERCICE 1 :MOUVEMENT SAISONNIER ADDITIF : METHODE DES MOYENNES MOBILES,
ECARTS SAISONNIERS, SERIE DESAISONNALISEE
Une entreprise a relevé pendant quatre ans ses ventes trimestrielles (en
milliers de FCFA).
1er trimestre 2ème trimestre 3ème 4ème trimestre
trimestre
1987 102 100 104 108
1988 110 106 113 115
1989 117 115 120 122
1990 128 123 127 131
1991 134 130 - -

1. Montrer qu’il existe un mouvement saisonnier.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 36


y

x
ECHELLE : Abscisse : 1cm  1 trimestre
Ordonnée :1cm  10 000 F CFA (commençant par 100 000 F)
On remarque, le deuxième trimestre de chaque année, les ventes diminuent,
puis augment les trimestres suivants. Il existe donc un mouvement
saisonnier.
2. Ce mouvement est-il additif ou multiplicatif ?
En joignant d’une part les maxima, d’autres part les minima, les deux
courbes obtenues sont sensiblement parallèles. Le mouvement saisonnier est
donc additif.
Pour confirmation, calculons les moyennes et écarts-types des ventes de
chaque année.

Année Moyenne Ecart-type


4 4

 xi x 2
i

m= i=1 = i=1
 m2
4 4
1987
1988
1989
1990
La moyenne augmente au fil des années, l’écart-type reste pratiquement
constant. Le mouvement saisonnier est additif.
3. Calculer les écarts saisonniers par la méthode des moyennes mobiles.
 Le tableau des moyennes mobiles :
Année T1 T2 T3 T4
1987 - - 104.5
1988
1989

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 37


1990
102 110
 100  104  108 
X̂3 = 2 2  104, 50
4
 Etablissons les différences saisonnières entre les données brutes et les
ˆ ), puis la moyenne arithmétique des
moyennes mobiles ( e t = X t - X t
différences saisonnières se rapportant au même trimestre de chaque année
et enfin déterminons les 4 écarts saisonnier

T1 T2 T3 T4
1987

1988

1989

1990

1991

TOTAL Somme S Moyenne


S
4
Moyenne trimestrielle
et

Écarts saisonniers
S
Si = ei  où i = 1, 2, 3, 4
4

4. Désaisonnaliser la série.
Pour désaisonnaliser la série, il faut effectuer les calculs suivants X t  Sj
Où les Sj désignent les écarts saisonniers.
Année T1 T2 T3 T4
1987
1988
1989
1990
1991 - -

5. Calculer la tendance par la méthode des moindres carrés.


On ajuste sur les données de la série désaisonnalisée une droite d’équation
ti Xi ti X i ti2
1
2
3
4
5
6
7
8
9
10

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 38


11
12
13
14
15
16
17
18
TOTAL
MOYENNE t = X =

Covariance de t et X :
18

t i Xi
COV(t, X) = i=1
 tX
N
18

t i
2

Variance de t : V(t) = i=1


 (t )2
N
COV(t, X)
a=
V(t)
b=X-a t

L’équation du TREND est donc : X =………..t +………..

6. Effectuer le calcul « trend+écarts saisonniers » et comparer avec la


série brute.
t Valeurs brutes TREND TREND +Écart Différence =
saisonnier TREND+Écart
saisonnier-valeurs
brutes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18

Ce tableau montre que les différences entre les valeurs brutes de la série
et les valeurs du TREND modifiées par les écarts saisonniers sont
extrêmement faibles.
7. Quel est le montant de vente peut-on prévoir respectivement pour le
troisième et quatrième trimestre 1991?
Prévision des ventes pour le 3ème trimestre 1991 (t=……).

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 39


………………………………………………………………………………………………………………………..

Prévision des ventes pour le 4ème trimestre 1991 (t=……).


………………………………………………………………………………………………………………………..

EXERCICE 2 :MOUVEMENT SAISONNIER MULTIPLICATIF : MÉTHODE DES RAPPORTS À LA


TENDANCE DÉTERMINÉE PAR LES MOINDRES CARRÉS, COEFFICIENTS SAISONNIERS,
SÉRIE DÉSAISONNALISÉE
La série chronologique suivante représente le chiffre d’affaires
trimestriel, en milliers de francs, d’un magasin de 1990 à 1992.
1er trimestre 2ème trimestre 3ème 4ème trimestre
trimestre
1990 115 152 124 167
1991 117 162 130 187
1992 121 158 137 206

1. représenter graphiquement la série.


y

ECHELLE : Abscisse : 1cm  1 trimestre x


Ordonnée :1cm  10 000 F CFA (commençant par 100 000 F)
Calculons les moyennes et écarts-types des chiffres d’affaires pour chaque
année.
Année Moyenne Ecart-type
4 4

x i x 2
i

m= i=1 = i=1
 m2
4 4
1990
1991
1992

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 40


Les moyennes augmentent avec le temps ; les écarts-types également.
2. Déterminer l’équation de la droite de tendance X en fonction de t par
la méthode des moindres carrés.

 Ajustons les chiffres d’affaires trimestriels au moyen de la droite des


moindres carrés :

ti Xi ti X i ti2
1
2
3
4
5
6
7
8
9
10
11
12
TOTAL
MOYENNE t = X =

Covariance de t et X :
18

t i Xi
COV(t, X) = i=1
 tX
N
18

t i
2

Variance de t : V(t) = i=1


 (t )2
N
COV(t, X)
a=
V(t)
b=X-a t

L’équation du TREND est donc : X =………..t +………..


 Calculons les valeurs du TREND :

Année T1 T2 T3 T4
1990
1991
1992

3. Calculer les rapports à la tendance.


Calculons les rapports à la tendance et leur moyenne pour chaque
valeur observée
trimestre :
valeur du TREND

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 41


T1 T2 T3 T4
1990

1991

1992

TOTAL Somme S Moyenne


S
4
Moyenne trimestrielle

4. En déduire les coefficients saisonniers.


D’après les réponses de 3. la somme des coefficients saisonnier :………………et
la moyenne : …………………. Donc il n’ya pas lieu de corriger ces coefficients.
5. Calculer la série désaisonnalisée.
Pour obtenir les valeurs de la série désaisonnalisée, on divise chaque
valeur observée par le coefficient saisonnier correspondant c'est-à-dire (
Xt
):
Sj
Année T1 T2 T3 T4
1990
1991
1992

6. Quel chiffre d’affaires moyen peut-on prévoir respectivement pour le


premier trimestre et le deuxième trimestre 1993?
Le 1er trimestre 1993 (t= ), on a la prévision du chiffre d’affaires
moyen qui est :

Le 2ème trimestre 1993 (t= ), on a la prévision du chiffre d’affaires


moyen qui est :

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 42


CORRECTION DES EXERCICES D’APPLICATION
EXERCICE 1 :MOUVEMENT SAISONNIER ADDITIF : METHODE DES MOYENNES MOBILES,
ECARTS SAISONNIERS, SERIE DESAISONNALISEE

Une entreprise a relevé pendant quatre ans ses ventes trimestrielles (en
milliers de FCFA).

1er trimestre 2ème trimestre 3ème 4ème trimestre


trimestre
1987 102 100 104 108
1988 110 106 113 115
1989 117 115 120 122
1990 128 123 127 131
1991 134 130 - -

1. Montrer qu’il existe un mouvement saisonnier.


y

ECHELLE : Abscisse : 1cm  1 trimestre x


Ordonnée : 1cm  10 000 F CFA (commençant par 100 000 F)
On remarque, le 2ème trimestre de chaque année, les vente diminuent, puis
augmentent les trimestres suivants.
2. Ce mouvement est-il additif ou multiplicatif ?
En joignant d’une part les maxima, d’autres part les minima, les deux
courbes obtenues sont sensiblement parallèles. Le mouvement saisonnier est
donc additif.
Pour confirmation, calculons les moyennes et écarts-types des ventes de
chaque année.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 43


Année Moyenne Ecart-type
4 4

x i x 2
i

m= i=1 = i=1
 m2
4 4
1987 103,5 2,958
1988 111 3,391
1989 118,5 2,692
1990 127,25 2,861
La moyenne augmente au fil des années, l’écart-type reste pratiquement
constant. Le mouvement saisonnier est additif.
3. Calculer les écarts saisonniers par la méthode des moyennes mobiles.
 Le tableau des moyennes mobiles :
Année T1 T2 T3 T4
1987 - - 104,5 106,25
1988 108,125 110,125 111,875 113,875
1989 115,875 117,625 119,875 122,25
1990 124,125 126,125 128 129,625
102 110
 100  104  108 
X̂3 = 2 2  104.50
4
 Etablissons les différences saisonnières entre les données brutes et les
ˆ ), puis la moyenne arithmétique des
moyennes mobiles ( e t = X t - X t
différences saisonnières se rapportant au même trimestre de chaque année
et enfin déterminons les 4 écarts saisonniers.
T1 T2 T3 T4
1987 -0,5 1,75
- -
1988 1,875 -4,125 1,125 1,125

1989 1,125 -2,625 0,125 -0,25

1990 3,875 -3,125 -1 1,375

1991 - -

TOTAL 6,875 -9,875 -0,25 4 Somme S Moyenne


S
4
Moyenne trimestrielle 2,2916 -3,2916 -0,0625 1 -0,0625 -0,015625
et

Écarts saisonniers 2,307225 -3,275975 - 1,01562


S 0,046875 5
Si = ei  où i = 1, 2, 3, 4
4

4. Désaisonnaliser la série.
Pour désaisonnaliser la série, il faut effectuer les calculs suivants
Xt  Sj Où les Sj désignent les écarts saisonniers.

Année T1 T2 T3 T4
1987 99,69 103,28 104,05 106,98
1988 107,69 109,28 113,05 113,98

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 44


1989 114,69 118,28 120,05 120,98
1990 125,69 126,28 127,05 129,98
1991 131,69 133,28 - -

5. Calculer la tendance par la méthode des moindres carrés.


On ajuste sur les données de la série désaisonnalisée une droite d’équation
X=at+b
ti Xi ti X i ti2
1 99,69 99,69 1
2 103,28 206,56 4
3 104,05 312,15 9
4 106,98 427,92 16
5 107,69 538,45 25
6 109,28 655,68 36
7 113,05 791,35 49
8 113,98 911,84 64
9 114,69 1032,21 81
10 118,28 1182,8 100
11 120,05 1320,55 121
12 120,98 1451,76 144
13 125,69 1633,97 169
14 126,28 1767,92 196
15 127,05 1905,75 225
16 129,98 2079,68 256
17 131,69 2238,73 289
18 133,28 2399,04 324
TOTAL 171 2105,97 20956,05 2109
MOYENNE t = 9,5 X = 116,998 1164,225 117,166

Covariance de t et X :
18 52,744
 t i Xi
COV(t, X) = i=1
 tX
N
18

t i
2
26,916
Variance de t : V(t) = i=1
 (t ) 2

N
COV(t, X) 1,9596
a=
V(t)
b=X-a t 98,3818

L’équation du TREND est donc : X =1,96 t + 98,38

6. Effectuer le calcul « trend+écarts saisonniers » et comparer avec la


série brute.
t Valeurs brutes TREND TREND+Écart Différence =
saisonnier TREND+Écart
saisonnier-
valeurs brutes
1 102 100,34 102,64 0,64
2 100 102,3 99,02 -0,98
3 104 104,26 104,21 0,21
4 108 106,22 107,24 -0,76
5 110 108,18 110,49 0,49
6 106 110,14 106,86 0,86

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 45


7 113 112,1 112,05 -0,95
8 115 114,06 115,08 0,08
9 117 116,02 118,33 1,33
10 115 117,98 114,70 -0,30
11 120 119,94 119,89 0,90
12 122 121,9 122,92 -0,11
13 128 123,86 126,17 -1,83
14 123 125,82 122,54 -0,46
15 127 127,78 127,72 -0,72
16 131 129,74 130,76 -0,24
17 134 131,7 133,93 -0,07
18 130 133,66 130,38 0,38

Ce tableau montre que les différences entre les valeurs brutes de la série
et les valeurs du TREND modifiées par les écarts saisonniers sont
extrêmement faibles.
7. Quel est le montant de vente peut-on prévoir respectivement pour le
Troisième et quatrième trimestre 1991?
Prévision des ventes pour le 3ème trimestre 1991 (t=19).
(1,96x19+98,38)-0,05=135,57

Prévision des ventes pour le 4ème trimestre 1991 (t=20).


(1,96x20+98,38)-0,05=138,6

EXERCICE 2 :MOUVEMENT SAISONNIER MULTIPLICATIF : MÉTHODE DES RAPPORTS À LA


TENDANCE DÉTERMINÉE PAR LES MOINDRES CARRÉS, COEFFICIENTS SAISONNIERS,
SÉRIE DÉSAISONNALISÉE
La série chronologique suivante représente le chiffre d’affaires
trimestriel, en milliers de francs, d’un magasin de 1990 à 1992.

1er trimestre 2ème trimestre 3ème 4ème trimestre


trimestre
1990 115 152 124 167
1991 117 162 130 187
1992 121 158 137 206

1. représenter graphiquement la série.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 46


y

x
ECHELLE : Abscisse : 1cm  1 trimestre
Ordonnée :1cm  10 000 F CFA (commençant par 100 000 F)
Calculons les moyennes et écarts-types des chiffres d’affaires pour chaque
année.
Année Moyenne Ecart-type
4 4

 xi x 2
i

m= i=1 = i=1
 m2
4 4
1990 139,5 20,93
1991 149 27,37
1992 155,5 31,97
Les moyennes augmentent avec le temps ; les écarts-types également. Les
écarts-types ne sont pas constants ; le mouvement saisonnier est
multiplicatif, ce que confirme la représentation graphique.
2. Déterminer l’équation de la droite de tendance X en fonction de t par la
méthode des moindres carrés.
 Ajustons les chiffres d’affaires trimestriels au moyen de la droite des
moindres carrés :
ti Xi ti X i ti2
1 115 115 1
2 152 304 4
3 124 372 9
4 167 668 16
5 117 585 25
6 162 972 36
7 130 910 49
8 187 1496 64
9 121 1089 81

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 47


10 158 1580 100
11 137 1507 121
12 206 2472 144
TOTAL 78 1776 12070 650
MOYENNE t = 6,5 X = 148 1005,8333 54,1666

Covariance de t et X :
18 43,8333
 t i Xi
COV(t, X) = i=1
 tX
N
Variance de t :
18 11,9166
t i
2

V(t) = i=1
 (t )2
N
COV(t, X)
a= 3,6783
V(t)
b=X-a t 124,09105

L’équation du TREND est donc : X =3,68 t +124,09


 Calculons les valeurs du TREND
Année T1 T2 T3 T4
1990 127,77 131,45 135,13 138,81
1991 142,49 146,17 149,85 153,53
1992 157,21 160,89 164,57 168,25

3. Calculer les rapports à la tendance.


Calculons les rapports à la tendance et leur moyenne pour chaque
valeur observée
trimestre :
valeur du TREND

T1 T2 T3 T4
1990 0,9 1,1563 0,9176 1,203

1991
0,8211 1,1082 0,8675 1,2180
1992
0,7696 0,982 0,8324 1,2244
TOTAL Somme S Moyenne
2,4907 3,2465 2,6175 3,6454 S
4
Moyenne
trimestrielle 0,8302 1,0821 0,8725 1,2151 3,9999 0,999975

4. En déduire les coefficients saisonniers.


D’après 3. la somme des coefficients saisonnier : 3,9999 et la moyenne :
0,999975≈1. Donc il n’ya pas lieu de corriger ces coefficients.
5. Calculer la série désaisonnalisée.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 48


Pour obtenir les valeurs de la série désaisonnalisée, on divise chaque
valeur observée par le coefficient saisonnier correspondant c'est-à-dire (
Xt
):
Sj
Année T1 T2 T3 T4
1990 138,52 140,47 142,12 137,44
1991 140,93 149,71 149 153,9
1992 145,75 146,01 157,02 169,53

6. Quel chiffre d’affaires moyen peut-on prévoir respectivement pour le


premier trimestre et le deuxième trimestre 1993?
 Le 1er trimestre 1993 (t= 13), on a la prévision du chiffre d’affaires
moyen qui est

(3,68x13+124,09) x 0,8302= 140,74


 Le 2ème trimestre 1993 (t= ), on a la prévision du chiffre d’affaires
moyen qui est

(3,68x14+124,09) x 1,0821= 190,03.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 49


TRAVAUX DIRIGÉS
EXERCICE 1 :
Les dépenses xi et les chiffres d’affaires yi bimensuels d’une société ont
été enregistrés dans le tableau suivant :
Dépenses xi (en dizaines de millions 12 17 11 13 31 20
de FCFA)
Chiffres d’affaires yi (en dizaines de 99 130 92 108 232 150
millions de FCFA)

1.
a. Représenter le nuage de points.
b. Est-il possible de faire un ajustement affine ?

2. Déterminer les coordonnées du point moyen G X; Y .
3. Déterminer une équation de la droite de y en x par la méthode des
moindres carrés.
4. Déterminer :
a. les chiffres d’affaires si la dépense est de 300 millions de francs.
b. les dépenses si le chiffre d’affaire est de 2 milliards de francs.

EXERCICE 2 :
La série suivante donne le nombre d’immatriculations de voitures neuves
dans un pays africain (données brutes en milliers).
Années 1993 1994 1995 1996 1997
Trimestre 345 450 514 470 517
1 397 522 523 569 567
Trimestre 296 365 362 381 381
2 446 521 508 525 512
Trimestre
3
Trimestre
4
1. Déterminer la tendance de la série.
2. Calculer les moyennes mobiles d’ordre 4 et les coefficients saisonniers
trimestriels en considérant qu’il s’agit d’un modèle additif.
3. Calculer la série ajustée et mettre en évidence les coefficients
saisonniers (modèle additif) en choisissant leur moyenne.
4. Représenter sur un même graphique :
 La série brute.
 La série désaisonnalisée par les moyennes mobiles.
 La série désaisonnalisée avec l’ajustement linéaire.

EXERCICE 3 :
L’activité principale de la Société Dijonnaise Nouvelle (SDN) est la mise
en conserve et la vente de fruits et légumes. Depuis la fin de l’année
1992, la SDN a développé une division de légumes en semi-conserve. Les
ventes de ces produits ne sont pas régulières tout au long de l’année et le
directeur commercial souhaite étudier la structure des ventes à la lumière
des statistiques disponibles afin d’établir une prévision pour l’exercice
1998.
Statistiques des ventes des barquettes de légumes de 1994 à 1997 (en
milliers d’unités).

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 50


1er 2ème 3ème 4ème
trimestre trimestre trimestre trimestre
1994 152 175 126 140
1995 185 207 151 172
1996 218 238 180 205
1997 249 280 215 243

1. Représenter graphiquement les ventes trimestrielles de 1994 à 1997.


Décrire brièvement les phénomènes observés.
2. Citer les méthodes qui pourraient être utilisées pour faire apparaître
la composante tendancielle de cette série statistique.
3. Trouver l’équation de la droite d’ajustement de la série chronologique
en utilisant la méthode des moindres carrés.
4. Calculer les coefficients trimestriels par la méthode des rapports au
trend.
5. Donner une prévision trimestrielle des ventes (en milliers de
barquettes) pour l’année 1998.

EXERCICE 4 :
On considère la chronique trimestrielle de vingt observations suivantes :
1er 2ème 3ème 4ème
trimestre trimestre trimestre trimestre
1987 825 1019 1215 952
1988 852 1146 1373 1094
1989 952 1283 1522 1313
1990 1177 1593 1828 1497
1991 1275 1598 2011 1456

1. Justifier que l’allure de cette chronique est de type multiplicatif.


2. Calculer les coefficients saisonniers par la méthode des moyennes
mobiles.
3. Dresser le tableau de la série corrigée des variations saisonnières.
4. Calculer les coefficients saisonniers par la méthode des rapports à la
tendance générale, le trend étant établi par les moindres carrés.
Commenter.

Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 51


Introduction aux statistiques descriptives KESSE NOEL DIOMANDE Page 52

Vous aimerez peut-être aussi