Vous êtes sur la page 1sur 85

Université Mohammed V - Rabat

Faculté des Sciences Juridiques Économiques et Sociales - Salé

Prof : S.L. Aouragh

Statistique descriptive
Première version

Filière :
Sciences Économiques et Gestion
1er semestre,
Sections : A & B

Année universitaire : 2020/2021


l'Université Mohammed V
Faculté des Sciences Juridiques, Economiques et Sociales
Salé.

Filière:
Sciences Economiques et Gestion

Statistique descriptive
1er semestre, sections: A & B

Prof. S.L. Aouragh


aouragh@hotmail.com
https://www.aouragh.ma
https://www.facebook.com/groups/2054755894753681/
https://www.youtube.com/channel/UCfmH7UvbkdI58EEJy7hASnw

Année universitaire : 2020/2021

Bibliographie

Des ouvrages :
 Statistiques descriptives de Bernard Py (Edition 2007-
Economica)
 Exercices corrigés de statistique descriptive de Bernard Py
(Edition 1999-Economica)
 Statistiques descriptives de Bernard Grais (Edition 2003-
Dunod)
 Méthodes statistiques de Bernard Grais (Edition 2003-
Dunod)
 Statistiques pour l'économie et la gestion de Anderson,
Sweeney, Williams, traduit par Claire Borsenberger (3e
édition 2010-De Boeck, éditeur)
2
Pr. L. Aouragh - Statistique descriptive

1
Plan

 Partie 1: Séries simples


 Terminologie et concepts de base.
 Tableaux statistiques et représentations graphiques,
 Les paramètres de tendance centrale et de dispersion,
 Les paramètres de forme et de concentration,
 Partie 2: Les séries doubles
 Distribution conjointe, marginale, liaison entre 2 variables…
 Partie 3: Les indices
 Les indices élémentaires et synthétiques, les taux
 Partie 4: Les séries chronologiques
 Décomposition d’une série chronologique
 Méthodes d’étude d’une série chronologique
3
Pr. L. Aouragh - Statistique descriptive

Partie 1
Les séries simples

4
Pr. L. Aouragh - Statistique descriptive

2
Statistique et statistiques

Définitions:
La Statistique est l’ensemble des méthodes et
techniques permettant de recueillir, traiter et
interpréter un ensemble de données (informations
chiffrées) associées à une situation ou un phénomène.
Elle permet d’obtenir de l’information à partir des
données, et de prendre les meilleurs décisions.
Les Statistiques est l’ensemble de données ou
d’informations relatives à un phénomène ou un
processus donné,

5
Pr. L. Aouragh - Statistique descriptive

Domaine d’application

La statistique est utilisée en plusieurs domaines:


• Comptabilité, finance
Les bilans ou comptes de résultats, gestion du capital,
trésorerie, opérations avec les banques,
• Biologie
L’évolution d’une maladie,
•Production
Gestion des stocks ou du matériel, contrôle de la qualité
• Achats, ventes
Statistiques des ventes, études de marché.
6
Pr. L. Aouragh - Statistique descriptive

3
Étude statistique

L’étude statistique concerne soit:


1.Une seule variable : statistique à une
dimension, ou statistique univarié,
2.Deux variables à la fois : statistique à
deux dimensions,
3.Plus de deux variables à la fois:
statistique multidimensionnelle.

7
Pr. L. Aouragh - Statistique descriptive

Deux directions en statistique

Statistique descriptive:
Organisation, présentation et analyse des
données en mettant les points importants en
évidence, en utilisant des tableaux et des graphes.
Statistique inférentielle:
Elle s’appelle aussi statistique mathématique,
dont l’objet est de formuler des lois de
comportement à partir d’observation souvent
incomplètes.
8
Pr. L. Aouragh - Statistique descriptive

4
Recueil des données statistiques

Pour recueillir des informations sur une population statistique,


on dispose de deux méthodes :
 La méthode exhaustive ou recensement où chaque individu
de la population est étudié selon le ou les caractères étudiés.
Exemple: Recensement générale de la population
marocaine.
 La méthode de sondage ou échantillonnage qui consiste à
n’examiner qu’une partie de la population, appelée un
échantillon.
Exemple: Choix de 30 étudiants parmi 400 inscrits dans une
filière .
9
Pr. L. Aouragh - Statistique descriptive

Exemple 1 de données statistiques

1- Le recensement:
Pour étudier la répartition des terres agricoles
d’une région, on réalise le recensement des
exploitations agricoles et on note pour
chacune d’elles, un certains nombre de
caractéristiques comme : leurs tailles, le type
de cultures, l’âge de l’exploitant, ....

10
Pr. L. Aouragh - Statistique descriptive

5
Exemple 1 de données statistiques

La répartition des terres agricoles d’une région


11
Pr. L. Aouragh - Statistique descriptive

Exemple 1 de données statistiques

N Taille(ha) Âge(années) Culture Nbre d’employés

1 50 50 blé 2
2 50,5 45 vigne 4
3 35 38 orge 3
. . . . .
. . . . .
. . . . .
630 10 57 Vigne 1

Résultat du recensement des exploitations agricoles de la région

A partir de cette table on pourra réaliser différentes études statistiques.

12
Pr. L. Aouragh - Statistique descriptive

6
Exemple 2 de données statistiques

On observe, au cours d’une semaine, les


20 machines selon le nombre de pièces
défectueuses produites:
Machines 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nombre
8 16 9 33 14 5 3 7 10 7 9 9 3 8 3 3 5 14 8 7
de PD

 On l’appelle série brute,


 L’effectif total de la population est n=20
13
Pr. L. Aouragh - Statistique descriptive

Exemple 3 de données statistiques

2- L’échantillonnage :
Un questionnaire de satisfaction demande à
un groupe de consommateurs choisis au
hasard d’évaluer une prestation en cochant
l’une des six catégories suivants:
(a) nulle, (b) médiocre, (c) moyenne, (d)
assez bonne, (e) très bonne, (f) excellente.

14
Pr. L. Aouragh - Statistique descriptive

7
Exemple 4 de données statistiques

L’exploitation des bases de données:


Une société possède environ 3 millions de clients.
Pour chaque client elle dispose d’environ 30
données: nom, adresse, date de début, quantité de
produit, mode d’achat, ….
En vue d’identifier les clientes qui sont le plus
susceptible d’acheter, la société doit exploiter les
bases de données qui vont lui renseigner sur le
comportement d’achat des clients.
Par exemple: les plus anciens, la moyenne de la
durée de payement minimale.
15
Pr. L. Aouragh - Statistique descriptive

Vocabulaire 1/2

Population: La population est un ensemble


d’individus: personnes, objets ou éléments sur
lesquels on veut effectuer l’étude statistique.
Ces individus sont définis par une propriété
commune donnée,
La taille d’une population est le nombre d’individus
qui la composent.
Individu (ou unité statistique): Un élément de la
population.
Echantillon: Sous-ensemble de la population.
16
Pr. L. Aouragh - Statistique descriptive

8
Vocabulaire 2/2

Caractère ou variable: C'est la propriété commune de


la population étudiée, qui est observée ou mesurée sur
les individus de cette population statistique.
Modalité:
On appelle une modalité la valeur que peut prendre un
caractère.
Exemples:
1. Étude de la taille des étudiants
2. Étude du nombre d’enfants dans une famille
3. Étude de la taille des chemises dans un magasin
4. Étude de la couleur des voitures
17
Pr. L. Aouragh - Statistique descriptive

Vocabulaire 2/2

Types de caractères:
Variables

Qualitative Quantitative

Nominale Ordinale Discrète Continue

Exemples:
 Grade d’un fonctionnaire  Nombre de buts marqués chaque mois
 La mention du baccalauréat  Le poids d’un nouveau né
18
Pr. L. Aouragh - Statistique descriptive

9
Variable qualitative nominale

Une variable est qualitative nominale si ses modalités


ne peuvent pas être naturellement ordonnées.
Exemple: Nationalité d’un étranger, état matrimonial,…
Modalité:
Les valeurs prises par la variable s’appellent les
modalités.
Exemple de modalité:
 Pour la variable: état matrimonial, les modalités sont:
célibataire, marié, veuf, divorcé.
 Pour la couleur des cheveux : blanc, brun, noir….
19
Pr. L. Aouragh - Statistique descriptive

Variable qualitative ordinale

Une variable est qualitative ordinale si ses modalités ne sont


pas des valeurs numériques et elles peuvent être naturellement
ordonnées.
Exemple:
 Un commerçant a fait un recensement des chemises dans
son magasin, pour les classer selon la leur taille.

 Un questionnaire de satisfaction demande aux


consommateurs d’évaluer une prestation en cochant l’une
des six catégories suivantes:
(a) nulle, (b) médiocre, (c) moyenne, (d) assez bonne, (e)
très bonne, (f) excellente.
20
Pr. L. Aouragh - Statistique descriptive

10
Variable quantitative discrète

Une variable est quantitative discrète si elle ne peut


prendre que des valeurs numériques isolées d’un
intervalle quelconque.
L’ensemble de ses modalités est un ensemble discrète.
Exemple:
Le nombre d’enfants par famille,
Le nombre d’accidents par mois,
Effectifs des étudiants inscrits à la FSJES de Salé par
ans durant les 10 dernières années.

21
Pr. L. Aouragh - Statistique descriptive

Variable quantitative continue

Une variable est quantitative continue si elle peut


prendre toutes les valeurs d’un intervalle.
(Nombre de valeurs possibles est infini).

Exemple:
• Salaire d’un fonctionnaire,
• Âge d’un étudiant,
• Taille ou poids d’un bébé

22
Pr. L. Aouragh - Statistique descriptive

11
Exercice 1

La série suivante résulte d’une enquête auprès de


quelques étudiants pour connaître leur âge:

18,5 21 19 19 17,5 22 27 18,5 18 17 20,5 20 23

Déterminer les éléments suivants:


 La méthode utilisée pour recueillir des informations
 La population étudiée et la taille de l’échantillon,
 Le caractère étudié, son type et ses modalités

23
Pr. L. Aouragh - Statistique descriptive

Exercice 2

Le tableau ci-dessous donne la répartition des notes


obtenues à un contrôle de statistique par les 27
étudiants d’une filière de 400 étudiants.
Notes 6 8 10 13 14 17
Nombre des
3 5 6 7 5 1
étudiants
Déterminer les éléments suivants:
 La méthode utilisée pour recueillir des informations
 La population étudiée et sa taille,
 Le caractère étudié, son type et ses modalités
24
Pr. L. Aouragh - Statistique descriptive

12
Exercice 3

Les gendarmes ont effectué un contrôle de vitesse sur


le bord d'une route nationale.

Vitesse [50;70[ [70;90[ [90;110[ [110;130[

Effectif 25 80 25 15

Déterminer les éléments suivants:


 La méthode utilisée pour recueillir des informations
 La population étudiée et sa taille,
 Le caractère étudié, son type et ses modalités
25
Pr. L. Aouragh - Statistique descriptive

Exercice 4

On donne la répartition du nombre d’abonnés au


téléphone mobile en France en 2006.

Opérateurs Bouygue télécom SFR Orange Autres

Effectifs en millions 9,86 19,72 26,68 1,74

Déterminer les éléments suivants:


 La méthode utilisée pour recueillir des informations
 La population étudiée et sa taille,
 Le caractère étudié, son type et ses modalités
26
Pr. L. Aouragh - Statistique descriptive

13
Rappel

Déterminer la méthode utilisée pour recueillir des informations, la


population étudiée et sa taille, le caractère étudié, son type et ses
modalités dans les cas suivants:
 Une enquête réalisée par une agence de tourisme sur la
nationalité des touristes visitant le Maroc a concerné un
échantillon de 500 touristes.
 Une étude de marché a mesuré le degré de satisfaction d’un
échantillon de 500 clients d’une banque.
 On a interrogé 100 ménages de la ville de Salé sur le nombre
de pièces de leur logement.
 Une enquête sur la consommation annuelle d’électricité a été
effectuée sur une population de 2600 ménages.

27
Pr. L. Aouragh - Statistique descriptive

Tableau de données

Dans le cas d’une variable qualitative discrète on utilise


souvent le tableau des effectifs et des fréquences suivant:
Modalités de X x1 ….. xi ….. xk
Effectifs ni n1 ….. ni ….. nk
Fréquences fi f1 ….. fi ….. fk

ni le nombre d’individu correspondant à la modalité xi de la variable X,


k

n   ni désigne l’effectif total,


i 1

ni k

fi 
n
désigne la fréquence de la valeur xi , avec: f i 1
i
1
28
Pr. L. Aouragh - Statistique descriptive

14
Cas d’une variable quantitative discrète

Nombre On ne s'intéresse pas au nombre d’enfants de M.


Noms
d'enfants Azim ou de M. Farid par exemple, mais à la
M. Azim 2
M. Farid 3
répartition du caractère « Nombre d’enfants »
Mme Latifi 0 dans la population des 18 employés.
Melle Fatiha 0
M. Ahmed 1
Nombres Effectifs fréquence
M. Salih 0
M. Berrada 1
d’enfants
Mme Réda 0 0 6 33,33%
Melle Fatiha 2
M. Halim 4 1 4 22,22%
M. Chadi 1
Mme Faouzi 3 2 5 27,78%
M. Ali 2
Melle Loubna 0 3 2 11,11%
M. Fatih 0
M. Said 1 4 1 5,56%
M. Radi 2
Mme Faraj 2
Total 18 100%

29
Pr. L. Aouragh - Statistique descriptive

Variable quantitative continue

Afin de simplifier la présentation dans le cas des variables quantitatives


continues on regroupe les effectifs proches dans une classe,
Par exemple:
Les valeurs: 175 d’effectif 1, 176 d’effectif 2 et 177 d’effectif 1 peuvent
être regrouper dans la classe [175;178[ d’effectif 4.
Classes des moins de
[160 - 165 [ [165 - 170 [ [170 - 175 [ 175 et plus
tailles en cm 160
Effectifs 1 5 21 29 4

On définit l’amplitude ai d’une classe [xi-1,xi[ par: ai=xi-xi-1


ni
On définit la densité di d’une classe [xi-1,xi[ d’effectif ni par: di 
ai
30
Pr. L. Aouragh - Statistique descriptive

15
Exercice 1

Soit la liste suivante des prénoms d’un groupe de 20 étudiants


suivis entre parenthèses d’une indication de degré de
compréhension des cours et T.P. de statistique,
(A=peu, B=moyen, C=beaucoup, D= exceptionnel)
Pierre (C), Paul (C), Jacques (A), Ralph (B), Abdel (A), Sidonie
(B), Henri (C), Paulette (B), Farida (B), Laure (C), Kevin (D),
Carole (B), Marie-Claire (A), Jeanine (C), Julie (C), Ernest (C),
Cindy (C), Vanessa (D), José (C), Aurélien (C),

Donner la population, la taille de l’échantillon, le caractère


étudié, son type, et ses modalités.

31
Pr. L. Aouragh - Statistique descriptive

Exercice 2

Une enquête auprès d’une population de femmes de


40 ans a donné les résultats suivants:

Nombre d’enfants 0 1 2 3 4
Nombre de femmes 10 20 20 30 20

Donner la population, la taille de l’échantillon, le


caractère étudié, son type, et ses modalités.

32
Pr. L. Aouragh - Statistique descriptive

16
Exercice 3

Un commerçant a fait un recensement des chemises


dans son magasin, il a obtenu le résultat suivant:
Modalités = tailles Effectifs = Nombre de chemises dans le stock
XS 10
S 25
M 40
L 32
XL 3
XXL 20
Donner la population et sa taille, le caractère étudié,
son type, et ses modalités,
33
Pr. L. Aouragh - Statistique descriptive

Exercice 4

Le tableau suivant donne la distribution des


effectifs du poids en g d’un œuf:

Le poids [61;63,5[ [63,5;66,5[ [66,5;69,5[


L’effectifs 10 20 20
Donner la taille de l’échantillon, la population,
le caractère étudié, son type, et ses modalités,

34
Pr. L. Aouragh - Statistique descriptive

17
Exercice 5

Le tableau suivant donne la distribution des effectifs


de la durée de vie (par heure) des ampoules
électriques fabriquées par une compagnie,

La durée en
[500;2000[ [2000;3500[ [3500;5000[
heure
L’effectifs 30 45 25

Donner la taille de l’échantillon, la population, le


caractère étudié, son type, et ses modalités,

35
Pr. L. Aouragh - Statistique descriptive

Rappel

Population

Echantillon Recensement

Les individus

Caractère ou
variable

Les modalités
Qualitative Quantitative

Nominale Ordinale Discrète Continue

Tableau des Tableau des Tableau des Les Les


effectifs effectifs effectifs classes classes
36
Pr. L. Aouragh - Statistique descriptive

18
Tableau récapitulatif

Pour une variable qualitative ou une variable


quantitative discrète (non classée):
Effectifs Effectifs Fréquences Fréquences
Xi ni cumulés cumulés fi cumulées cumulées
croissants décroissants croissantes décroissantes
x1 n1 n1 n f1 f1 1
x2 n2 n1+n2 n-(n1) f2 f1+f2 1-(f1)
… … n1+n2+n3 n-(n1+n2) f1+f2+f3 1-(f1+f2)
xk-1 nk-1 n1+…+nk-1 n-(n1+…+nk-2) fk-1 f1+f2+…+fk-1 1-(f1+…+fk-2)
xk nk n1+…+nk=n nk fk f1+f2+…fk=1 fk

37
Pr. L. Aouragh - Statistique descriptive

Exercice

Dresser le tableau statistique des effectifs cumulés et


des fréquences cumulées pour les données suivantes

Modalité Effectifs
XS 10
S 25
M 40
L 32
XL 3
XXL 20

38
Pr. L. Aouragh - Statistique descriptive

19
Tableau récapitulatif

Pour une variable quantitative continue:


Pour les effectifs cumulés et les fréquences cumulées
c’est la même chose que les variables qualitatives.
Amplitude Centre de classe Densité Effectifs corrigés
Classe ni x  xi 1 ni
ai  xi  xi 1 ci  i di  n  d i  ppmc(ai )
2 ai ic i

[x0;x1[ n1 a1 c1 d1 n1C
[x1;x2[ n2 a2 c2 d2 n2C
… … … … …

[xk-1;xk[ nk ak ck dk nkc

39
Pr. L. Aouragh - Statistique descriptive

Exemple du tableau récapitulatif

Classes ni ai ci fi ficc ficd nicc nicd di nic

[20;25[ 9 5 22,5 0,06 0,06 1 9 140 1,8 18

[25;30[ 17 5 27,5 0,12 0,19 0,94 26 131 3,4 34

[30;35[ 36 5 32,5 0,26 0,44 0,81 62 114 7,2 72

[35;40[ 27 5 37,5 0,19 0,64 0,56 89 78 5,4 54

[40;50[ 45 10 45 0,32 0,96 0,36 134 51 4,5 45

[50;60[ 6 10 55 0,04 1 0,04 140 6 0,6 6

40
Pr. L. Aouragh - Statistique descriptive

20
Rappel

Compléter le tableau suivant.


Quel est le pourcentage des valeurs au moins égales à 5
Quel est le pourcentage des valeurs moins de 15

Classes ni ai ci fi ficc ficd nicc nicd di nic

[0; 5[ 10 10 5 2,5 0,07 0,07 1 10 40 2 60

[5;15[ 18 18 10 10 0,29 0,36 0,93 28 30 1,8 54

[15;30[ 12 12 15 22,5 0,64 1 0,64 40 12 0,8 24

41
Pr. L. Aouragh - Statistique descriptive

Les graphiques

Pour visualiser la distribution statistique d’une


variable, on utilise des graphiques.
Il existe plusieurs types, selon le type de données.

Exemple:
Dans le cas d'une variable qualitative, les modalités ne
peuvent pas être représentées sur un axe, selon une
échelle donnée, car elles ne sont pas numériques.
On utilise surtout dans ce cas des diagrammes
circulaires ou des diagramme en bâtons.
42
Pr. L. Aouragh - Statistique descriptive

21
Graphe d’une variable qualitative

État matrimonial Célibataire Marié Divorcé Veuf Total


Effectifs 30 80 20 20 150
Diagramme en bâtons (ou les tuyaux
d'orgue ou diagramme à bandes) Le graphique à secteurs

100 Effectifs
80
60 13% Célibataire
20%
40 13% Marié
20 Divorcé
54%
Veuf
0
Célibataire Marié Divorcé Veuf

ni
La longueur des barres =ni    360  f i  360
n
i

43
Pr. L. Aouragh - Statistique descriptive

Graphe d’une variable quantitative discrète

xi ni ni
0 4
1 7
2 8
3 8
4 6
5 4
6 3
xi
Nombre d’enfant Diagramme en bâtons
par famille La longueur des bâtons = ni

44
Pr. L. Aouragh - Statistique descriptive

22
Graphe d’une variable quantitative continue

Exemples d'histogrammes.
A gauche : des classes de même amplitude
A droite : des classes de différentes amplitudes.
Pr. L. Aouragh - Statistique descriptive 45

Graphe d’une variable quantitative

Classes ni ai ci fi di nic
[20;25[ 9 5 22,5 0,06 1,8 18
[25;30[ 17 5 27,5 0,12 3,4 34
[30;35[ 36 5 32,5 0,26 7,2 72
[35;40[ 27 5 37,5 0,19 5,4 54
[40;50[ 45 10 45 0,32 4,5 45
[50;60[ 6 10 55 0,04 0,6 6
Représenter graphiquement cette variable
46
Pr. L. Aouragh - Statistique descriptive

23
Graphe d’une variable quantitative

Polygone des effectifs dans le cas des classes


d’amplitudes différents
47
Pr. L. Aouragh - Statistique descriptive

Types de graphiques

IL existe plusieurs type de graphiques parmi:


Histogrammes
Diagramme en bâtons
Graphiques en courbes
Graphiques en secteurs
Graphiques en barres
Graphiques en aires
Graphiques en nuages de points (XY)
Graphiques en surface
Graphiques en anneaux
Graphiques en bulles
Graphique en radar
…….
48
Pr. L. Aouragh - Statistique descriptive

24
En barres Histogramme
s En secteurs

En courbes

En bâtons En surface

Nuages de points (XY)

49
Pr. L. Aouragh - Statistique descriptive
En aires En radar En anneaux

Notations

X : une variable statistique (caractère)


xi : (modalités) valeurs prises par la variable statistique X,
n : taille de l'échantillon
ni : l’effectif de la modalité xi
fi = ni /n : la fréquence de la modalité xi
ficc: la fréquence cumulée des valeurs prises par la variable X
qui sont inférieures ou égales à xi :

nicc : l’effectif cumulé des valeurs prises par la variable X qui


i
sont inférieures ou égales à xi : N  n
i  k k 1

Le signe  désigne somme et  désigne le produit


50
Pr. L. Aouragh - Statistique descriptive

25
Fonction de répartition

La fonction de répartition ou fonction cumulative est la


fonction F(x) qui: à tout réel associe la proportion des individus
dont le caractère est strictement inférieur à x.
 F(x) définie pour toute valeur réel de x
 F(x) constante dans l’intervalle de 2 valeurs consécutives de x
 F(x) = 0 pour la plus petite valeur possible de x : F(-∞ )= 0
 F(x) = 1 pour x sup à la plus grande valeur de x : F(+∞ )= 1

51
Pr. L. Aouragh - Statistique descriptive

Fonction de répartition (variable discrète)

La fonction de répartition est donnée par:


Fi = fréquence de nombre de famille qui  0 si x  x1

ont moins de xi enfants Ni/N F x   F i
si x i  x  x i 1
1 si x  xk
Exemple: le nombre d’enfants par famille,

xi ni Ni Fi F(0)= fréquence de nombre de famille moins de 0 enfants = 0/40
0 4 4 0,1 F(1) = fréquence de nombre de famille moins de 1 enfants = 4/40
1 7 11 0,275 F(2) = fréquence de nombre de famille moins de 2 enfants = 11/40
2 8 19 0,475 F(3) = fréquence de nombre de famille moins de 3 enfants = 19/40
3 8 27 0,675 F(4) = fréquence de nombre de famille moins de 3 enfants = 27/40
4 6 33 0,825 F(5) = fréquence de nombre de famille moins de 3 enfants = 33/40
5 4 37 0,925 F(6) = fréquence de nombre de famille moins de 6 enfants = 37/40
6 3 40 1 F(7) = fréquence de nombre de famille moins de 7 enfants = 40/40

52
Pr. L. Aouragh - Statistique descriptive

26
Représentation graphique de la fonction de
répartition d’une variable discrète

F
xi ni fi Fi
1,05
0 4 0,1 0,1 1
0,95
0,9
1 7 0,175 0,275 0,85
0,8
0,75
2 8 0,2 0,475 0,7
0,65
0,6
3 8 0,2 0,675 0,55
0,5
0,45
4 6 0,15 0,825 0,4
0,35
0,3
5 4 0,1 0,925 0,25
0,2
0,15
6 3 0,075 1 0,1
0,05
0 | | | | | | |
0 1 2 3 4 5 6

53
Pr. L. Aouragh - Statistique descriptive

Représentation graphique de la fonction de


répartition d’une variable classée

F
xi ni fi Fi 1,05
1
0,95
0,9
0,85
0,8
[500;2000[ 30 0,3 0,3 0,75
0,7
0,65
0,6
0,55
0,5
[2000;3500[ 45 0,45 0,75 0,45
0,4
0,35
0,3
0,25
0,2
[3500;5000[ 25 0,25 1 0,15
0,1
0,05
0 | | | |
500 2000 3500 5000

54
Pr. L. Aouragh - Statistique descriptive

27
Les paramètres statistiques

Le but de l'étude statistique est aussi de résumer


des données par des paramètres ou synthétiseurs.
Il existe 3 types de paramètres :
 Paramètres de position (ou de tendance centrale)
 Paramètres de dispersion
 Paramètres de forme (asymétrie, aplatissement,
concentration)
55
Pr. L. Aouragh - Statistique descriptive

Les paramètres de position

Le mode
Le mode (Mo) d’une série statistique est la modalité de la variable correspondant à
l’effectif le plus élevé. Une série peut avoir plusieurs modes.
La médiane
La médiane (Me) d’une série est la valeur qui partage cette série, préalablement
classée, en deux séries aux effectifs égaux.
Quartiles :
Un quartile est chacune des 3 valeurs qui divisent les données triées en 4 parts
égales, de sorte que chaque partie représente 1/4 de l'échantillon de population.
La moyenne arithmétique
Si les valeurs de X ne sont pas regroupées, la moyenne arithmétique d’une série
quantitative est définie par:
1 n
X  xi
n i 1
1 k k
n k
Si les valeurs de X sont regroupées: X  
n i 1
ni xi   i xi   f i xi
i 1 n i 1

56
Pr. L. Aouragh - Statistique descriptive

28
Les quantiles

Le Quantile
Les quantiles sont des caractéristiques de position partageant la série statistique
ordonnée en k parties égales.
Pour k = 4, les quantiles, appelés quartiles,
Pour k =10, les quantiles sont appelés déciles,
Application
Le diagramme en boîte à moustaches ou box-plot permet de représenter
schématiquement les principales caractéristiques d’une distribution en utilisant les quartiles.
La partie centrale de la distribution est représentée par une boîte de largeur arbitraire et de
longueur la distance interquartile, la médiane est tracée à l’intérieur.
La boîte rectangle est complétée par des moustaches correspondant aux valeurs suivantes:
– valeur supérieure : Q3 + 1,5(Q3 − Q1)
– valeur inférieure : Q1 - 1,5(Q3− Q1)
Les valeurs extérieures « aux moustaches » sont représentées
par des étoiles et peuvent être considérées comme aberrantes.

57
Pr. L. Aouragh - Statistique descriptive

Le mode

Nombre de chemises de cette taille


50
40 XS

30 S
M
20 L
XL
10
XXL
0
XS S M L XL XXL

Le mode de cette série statistique est la modalité de la variable


correspondant à l’effectif le plus élevé qui est dans ce cas la
taille M.
Remarque:
De même pour toutes les variables de type qualitatif ou
quantitatif non classé,
58
Pr. L. Aouragh - Statistique descriptive

29
Cas particulier de mode: bimodale

Diagramme en bâtons d’une variable discrète

59
Pr. L. Aouragh - Statistique descriptive

Le mode d’une variable classée

Pour les variables quantitatives classées, on parle d’abord de


la classe modale:
 Si les classes sont d’égales amplitudes, la classe modale
sera la classe où l’effectif est le plus élevé.
 Si les classes sont d’inégales amplitudes, la classe modale
sera la classe où:
ni
 La densité di 
xi  xi 1
Ou est la plus élevée
fi
 La densité de fréquence d fi 
xi  xi 1
60
Pr. L. Aouragh - Statistique descriptive

30
Le mode d’une variable classée

La classe modale est la classe pour laquelle l’effectif, la fréquence ou la


densité de fréquence est la plus élevée. Pour déterminer sa valeur on utilise
le schéma suivant:

a b

La classe modale [xi,xi+1[ étant déterminée, le Mo vérifie:

Théorème de Thalès:
Δ1 a Mo - x i x i Δ 2 + x i+1 Δ 1 Δ (x - x i )
= = Mo = = x i + 1 i+1
Δ2 b x i+1 - Mo Δ1 + Δ 2 Δ1 + Δ 2
61
Pr. L. Aouragh - Statistique descriptive

La médiane: Cas d’une variable non classée

Dans le cas d’une variable quantitative non classée, on


détermine la médiane par:
 La série statistique doit être rangée par ordre croissant,
x1<x2<…<xp<xp+1<...<xn
 On a deux cas:
 Si n est impair et égal 2p+1 la médiane sera: xp+1.
 Si n est pair et égal 2p, la médiane est: n p + nP + 1
Exemple: 2
Déterminer la médiane des deux séries suivantes:
1) 8 5 10 4 13 12 7 5 9.
2) 8 5 10 4 13 12 7 5.
62
Pr. L. Aouragh - Statistique descriptive

31
La médiane

La médiane ne se calcule que pour les variables quantitatives et son


calcul dépend du type de données. On distingue quatre cas :
 Les séries non groupées dont l’effectif est impair et où aucune
valeur n’est répétée. Exemple: {8 ,9, 5, 13, 25}
 Les séries non groupées dont l’effectif est pair et où aucune valeur
n’est répétée. Exemple: {13,1,9,10,2,4,12,7}
 Les séries groupées par valeurs. Exemple:
xi 5 8 9 10 xi 0 1 2 3
ni 2 3 4 3 ni 3 7 5 5

 Les séries groupées par classes de valeurs. Exemple:


xi [0;5[ [5;10[ [10;15[ [15;20[ xi [0;5[ [5;10[ [10;20[
ni 2 7 18 3 ni 20 30 50

63
Pr. L. Aouragh - Statistique descriptive

La médiane: Cas d’une variable classée

Soient a et b les bornes inférieurs et supérieurs de la classe


contenant la médiane, F(a) et F(b) les valeurs des fréquences
cumulées croissantes en a et b, alors: F(b)
On a: v
0.5 u
F(a) x y
a Me b

F (a) 0 ,5 F (b ) a Me b
x u

y v
Me  a 0,5  F a  0,5  F a 
 Me  a  b  a  
ba F b   F a  F b   F a 
64
Pr. L. Aouragh - Statistique descriptive

32
Exemple de calcul du mode et médiane

La série suivante représente l’âge des salariés d’une société:


Classes [20;25[ [25;30[ [30;35[ [35;40[ [40;50[ [50;60[
ni 9 17 36 27 45 6

1. Définir la population étudiée, l’unité statistique, taille de la


population, le caractère étudié, sa nature et ses modalités.
Les effectifs cumulés, les amplitudes, la densité, les
fréquences, les fréquences cumules croissantes et
décroissantes, sont déjà calculer dans le diapo 16
2. Déterminer la classe modale et déterminer le mode,
3. Déterminer la classe contenant la médiane et déterminer sa
valeur
65
Pr. L. Aouragh - Statistique descriptive

Mode et médiane pour une variable classée

Classes ni ai di=ni/Ai nic=dixppcm(ai) fi Fi


[20;25[ 9 5 1,8 18 0,06 0,06
[25;30[ 17 5 3,4 34 0,12 0,19
[30;35[ 36 5 7,2 72 0,26 0,44
0,5
[35;40[ 27 5 5,4 54 0,19 0,64
[40;50[ 45 10 4,5 45 0,32 0,96
[50;60[ 6 10 0,6 6 0,04 1
Même si la classe [40;50[ a l’effectif le plus élevé mais la classe modale
est [30;35[ car elle a la densité ou l’effectif corrigé la plus élevée.
La médiane qui est équivalent à 0.5 pour les Fi se trouve dans
l’intervalle [35;40[
66
Pr. L. Aouragh - Statistique descriptive

33
La médiane

100

80

60
NiD
40 Ni
20

0
1 3 5 7 9 11 13 15 17 19
Représentation graphique des effectifs cumulés croissants et décroissants.

La médiane de la série correspond au point d'intersection de ces


2 courbes

67
Pr. L. Aouragh - Statistique descriptive

La médiane

Propriété de la médiane:
La médiane donne des indications utiles sur la tendance
centrale d’une distribution statistique. Elle n’est pas influencée
par les valeurs extrêmes de la variable.

x1 x2 x3 x4 x5 x6 x7 x7

La médiane

La valeur de la médiane ne change pas même si la valeur X7


prend des valeurs différentes.
68
Pr. L. Aouragh - Statistique descriptive

34
Exemple de la médiane

Compléter le tableau suivant et calculer la médiane

Classes ni Ai di fi Fi
[1;2[ 7
[2;4[ 8
[4;5[ 10
[5;6[ 3
Total
69
Pr. L. Aouragh - Statistique descriptive

Les moyennes

On peut réduire un ensemble d’observations en une


seule observation constante appelée moyenne.
La moyenne est donc une valeur qui présente comme
si toutes les observations lui étaient égales.
On distingue plusieurs types de moyennes:
 La moyenne arithmétique,
 La moyenne géométrique,
 La moyenne harmonique,
 La moyenne quadratique.

70
Pr. L. Aouragh - Statistique descriptive

35
La moyenne arithmétique

On distingue deux types: moyenne pour les variables


quantitatives non classées et classées
La moyenne arithmétique (cas non classées)
1 n 1 k k
ni k
X   xi
n i 1
ou X   i i 
n i 1
n x 
i 1 n
x i
 
i 1
f i xi
La moyenne arithmétique (cas classées)
xi  xi 1
Le centre de la classe [xi,xi+1[, est : ci 
2
1 k k
ni k

La moyenne est: X   ni ci   ci   f i ci
n i 1 i 1 n i 1

71
Pr. L. Aouragh - Statistique descriptive

La moyenne géométrique

On distingue deux types: moyenne pour les variables


quantitatives non groupées et groupées.
1
k n k
n1 nk ni
Xg = n x 1 × ... × x n et Xg = n
x × ... × x
1 n = ∏ x i = ∏ x ifi
i=1 i =1

Dans le cas d’une variable classée on utilise ci à la place de xi.


Domaines d’application:
On utilise la moyenne géométrique dans:
 Le calcul du taux d’accroissement moyen,
 Le calcul des pourcentages moyens.
Exemple: calculer la moyenne géométrique de: 1; 2; 2; 4
72
Pr. L. Aouragh - Statistique descriptive

36
La moyenne harmonique

On distingue deux types: moyenne pour les variables


quantitatives non groupées et groupées.
n n 1
Xh  ou Xh  
n
1 k
1 k
1
x
i 1
n
i 1
i
xi
f
i 1
i
xi
i

Domaine d’application
Les calculs des durées moyennes,
Elle intervient lorsqu'on demande une moyenne de valeurs
se présentant sous forme de quotient de deux variables x/y
(km/h, kg/litre,...).
73
Pr. L. Aouragh - Statistique descriptive

La moyenne quadratique

On distingue deux types: moyenne pour les variables


quantitatives non groupées et groupées.
1 n 2 1 k k
Xq   xi
n i 1
ou Xq  
n i 1
ni xi2  fx
i 1
i i
2

Domaines d’utilisation
La moyenne quadratique intervient dans le calcul de certains
paramètres de dispersion
Exemple
Calculer la moyenne quadratique de : 2; 12; 2; 50. =25,749

74
Pr. L. Aouragh - Statistique descriptive

37
Exemple

Le tableau suivant représente la répartition des notes d’un


échantillon de 30 étudiants.
Classe de notes [0;5[ [5;10[ [10;15[ [15;20[
Nombre d’étudiants 2 7 18 3

Calculer les quatre moyennes suivantes:


Les moyennes
Arithmétique Géométrique Harmonique Quadratique
1
Xh  k
k k k

X   f i xi Xg   x if i
1 Xq   f i x i2
i 1 i 1 
i 1
fi
xi
i 1

75
Pr. L. Aouragh - Statistique descriptive

Comparaison des moyennes

Pour la même série statistique, les quatre moyennes vérifient


toujours la relation d’ordre suivante:
Xh  Xg  X  Xq

Conclusions :
1. Un inconvénient de la moyenne arithmétique est qu’elle est
très sensible aux valeurs extrêmes de la série.
2. La moyenne géométrique est peu sensible aux valeurs
extrêmes de la série.
3. La moyenne harmonique est plus sensible aux plus petites
valeurs de la série qu’aux plus grandes.
76
Pr. L. Aouragh - Statistique descriptive

38
Relation entre les paramètres de position

Asymétrie d’une distribution

Moyenne, mode, médiane et forme d’une distribution


La moyenne est influencée par les valeurs extrêmes de la distributions
77
Pr. L. Aouragh - Statistique descriptive

Les paramètres de dispersion

La variance V et l’écart-type σ:
1 k 1 k
ni xi  x    f i xi  x     ni xi2   x
k

V X   
2 2 2

n i 1 i 1 n  i 1 
Etendu:
 X   V X 
l'étendu est la différence entre la valeur maximale et la valeur
minimale d’une variable.
Les intervalles interquartiles :
L’intervalle interquartile d’une série statistique est égal à la différence :
Q3 – Q1.
Ecart interdécile:
On appelle premier décile d’une série la plus petite valeur D1 des termes
de la série pour laquelle au moins un dixième (10%) des données sont
inferieures ou égales à D1. On appelle écart interdécile le nombre D9-D1.

78
Pr. L. Aouragh - Statistique descriptive

39
L’interprétation des paramètres de dispersion

Etendu:
Les valeurs de la série sont réparties sur un intervalle d’amplitude égale à la
valeur de l'étendu.
Les intervalles interquartiles :
50% des valeurs de la série sont dans l’intervalle [Q1 ;Q3].
25% des valeurs de la série sont inférieures à Q1 (resp supérieures à Q3)
Ecart interdécile:
80% des valeurs de la série sont dans l’intervalle [D1 ;D9].
10% des valeurs de la série sont inférieures à D1 (resp supérieures à D9)
La valeur à D1 est D9/D1 fois plus élevé que à D9,
La variance V et l’écart-type σ:
L’écat-type exprime la dispersion des valeurs autour de la moyenne,
Son interprétation se base sur le calcul de coefficient de la variation.
CV= l’écat-type / la moyenne.

79
Pr. L. Aouragh - Statistique descriptive

Coefficient de variation

Pour une variable statistique réelle X, on appelle coefficient de variation le rapport:



CV  X
,
X
où :  X est l ' écart  type de X et X sa moyenne.
 C’est un nombre sans unité, qui permet de comparer la distribution autour de la
moyenne de deux variables statistiques de natures différentes: par exemple la
dispersion de salaires en dirhams et la dispersion de salaires en euros.
 Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la
moyenne est grande.
 Il est généralement exprimé en pourcentage.
 Il permet d’apprécier l’homogénéité de la distribution, une valeur du coefficient de
variation inférieure à 15 % traduit une bonne homogénéité de la distribution.

Exemple: les deux séries: 1, 10, 19 et 1000001, 1000010, 1000019


σ1=σ2=4,24. Mais les moyennes sont: m1=10, m2=1000010

80
Pr. L. Aouragh - Statistique descriptive

40
Paramètres de dispersion

Pour r  

et un caractère quantitatif X on définit:

 Le moment d’ordre r par:


1 k k

mr   ni xi   f i xir
r

n i 1 i 1

 Le moment centré d’ordre r par:


1 k
 r   ni x i  x   f i  x i  x 
 
k
r r

n i 1 i 1

81
Pr. L. Aouragh - Statistique descriptive

Paramètres de forme (asymétrie)

Coefficient d’asymétrie de Fisher : 1

Il est défini par: 


  3
1
 3

Si  0
1
, la distribution est symétrique autour de la moyenne.

Si   0 , la distribution est plus étalée vers la gauche.


1

Si   0 , la distribution est plus étalée vers la droite.


1

82
Pr. L. Aouragh - Statistique descriptive

41
Paramètres de forme (asymétrie)

Représentation graphique de trois séries statistiques de


différents types d’asymétrie.

 0
1

 01

 0
1

83
Pr. L. Aouragh - Statistique descriptive

Paramètres de forme (aplatissement)

Coefficient d’aplatissement de Fisher  2 :


Il est défini par: 4
  3
2
 4

Si  2  0 , L’aplatissement est le même que celui de la loi


Normale (de Gauss).

Si  2  0 , la concentration des valeurs autour de la moyenne


est faible: la distribution est plus aplatie que la loi Normale.

Si  2  0 , la concentration des valeurs autour de la moyenne


est forte: la distribution est moins aplatie que la loi Normale.
84
Pr. L. Aouragh - Statistique descriptive

42
Paramètres de forme (aplatissement)

2  0
2  0
2  0

Coefficient de Fisher γ2 (aplatissement d'une distribution):


85
Pr. L. Aouragh - Statistique descriptive

Paramètres de forme

Pratiquement, pour qu’une variable puisse être


considérée comme suivant une loi normale ou
de Gauss il faut que:
 Le coefficient d’asymétrie (en anglais
Skewness) doit être inférieur à |1|
 Le coefficient d’aplatissement (en anglais
Kurtosis) ou encore de concentration doit être
inferieur à |1,5|

86
Pr. L. Aouragh - Statistique descriptive

43
Exercice

Une enquête sur la consommation annuelle d’électricité a


été effectuée sur une population de 2600 ménages. Les
résultats figurent dans le tableau suivant:
Consommation annuelle en (kwh) Nombre de ménages
[0,200[ 455
[200,300[ 614
[300,400[ 532
[400,600[ 385
[600,800[ 422
[800,1000[ 164
[1000,2000[ 28
87
Pr. L. Aouragh - Statistique descriptive

Exercice à la maison

Le tableau suivant donne le niveau de scolarité, en nombre


d’années passées à l’école, d’un échantillon de 200 personnes

Niveau de scolarité Effectif

[0,6[ 40
[6,12[ 80
[12,14 [ 50
[14,16[ 30

88
Pr. L. Aouragh - Statistique descriptive

44
Exercice (suite)

1. Donner la population étudiée, et la taille de l’échantillon,


2. Donner le caractère X étudié, ses modalités et sa nature,
3. Calculer la moyenne, la médiane et le mode, comparer leurs valeurs,
que peut-on dire ?
4. Calculer la variance, l’écart type et le coefficient de variation de X,
5. Calculer l’étendu de X, que peut-on dire de sa valeur ?
6. Calculer les quartiles Q1, Q3 , et en déduire l’écart inter-quartiles,
7. Calculer les déciles D1, D9 , et en déduire l’écart inter-décile,
8. Calculer μ3 : le moment centré d’ordre 3, en déduire le coefficient
d’asymétrie de Fisher γ1 et interpréter le résultat,
9. Calculer μ4 : le moment centré d’ordre 4, en déduire le coefficient
d’aplatissement de Fisher γ2 et interpréter le résultat.

89
Pr. L. Aouragh - Statistique descriptive

Paramètre de concentration

Introduction:
D’après le rapport annuel de Bank Al-Maghrib (2005),
le total cumulé des situations comptables des 16
banques agréées s’est chiffré à 461,5 milliards DH, tel
que la part des 3 grandes banques est 63,8%, tandis
que celle des 8 petites banques est 4,2%.
C’est le phénomène de la concentration de l’activité
bancaire.
On dit que l’activité bancaire en 2005 est caractérisée
par une forte concentration.
90
Pr. L. Aouragh - Statistique descriptive

45
Paramètre de concentration

Exemple:
Soit la distribution suivante relative à la répartition de
80 salariés selon leur salaire horaire en DHS,
Salaire horaire en DHS Nombre de salariés ni
[10,20[ 20
[20,40[ 32
[40,80[ 16
[80,100[ 8
[100,160[ 4
91
Pr. L. Aouragh - Statistique descriptive

Indice de concentration de Gini

Soit X une variable divisée en k classes.


La ième classe [xi-1, xi[ a, pour centre, ci et, pour effectif, ni.
- si  ni ci la masse de caractère X dans la classe [xi-1, xi[.
k

- S   si la masse globale de X
i 1
si
- gi  la fréquence de la masse de X possédée par les
s
individus dans la classe [xi-1, xi[.
i

- Gi   g j La masse cumulée relative à la classe [xi-1, xi[ .


j 1

92
Pr. L. Aouragh - Statistique descriptive

46
Paramètre de concentration

Salaire
Nombre de
horaire en ci si=nici gi Gi fi Fi Gi-1+Gi (Gi-1+Gi)*fi
salariés ni
DHS

[10,20[ 20 15 300 0,09 0,09 0,25 0,25 0,09 0,02

[20,40[ 32 30 960 0,28 0,36 0,40 0,65 0,45 0,18

[40,80[ 16 60 960 0,28 0,64 0,20 0,85 1,01 0,20

[80,100[ 8 90 720 0,21 0,85 0,10 0,95 1,49 0,15

[100,160[ 4 130 520 0,15 1,00 0,05 1,00 1,85 0,09

3460 0,64

93
Pr. L. Aouragh - Statistique descriptive

Indice de concentration de Gini

On appelle courbe de concentration (ou courbe de Lorenz)


la ligne polygonale joignant les points de cordonnées (Fi,Gi).
i i
ni ci n
Où: Gi   g j
j 1
et Fi  f
j 1
j
gi 
S
et f i  i
n

1 1

Faible concentration

Gi Gi Forte concentration

Concentration nulle

0 Fi 1 0 Fi 1
94
Pr. L. Aouragh - Statistique descriptive

47
Indice de concentration de Gini

Interprétation de la courbe de Lorenz:


Gi

0,2

0 0,5 1
Fi

On voit que 50% des salaires se partagent 20% de la masse


salariale. Donc, on peut dire que la concentration est forte.
95
Pr. L. Aouragh - Statistique descriptive

Indice de concentration de Gini

Définition:
L’indice de Gini est égal à: Gi

1 C

aire de concentration ( en vert )


IG 
aire du triangle ABC
11
L' aire du triangle ABC   0,5
2 A B
Fi
Donc I G  2  ( aire de concentration )

96
Pr. L. Aouragh - Statistique descriptive

48
Indice de concentration de Gini

L' aire A 3 Trapèse 


G3  G2 F3  F2 
2
C
1 G  G2  f 3
 3
2
L' aire en vert  A1  A 2  A 3  A 4


G0  G1  f1  G1  G2  f 2  G2  G3  f 3  G3  G4  f 4
G3 2 2 2 2
1 4
L' aire en vert   G  Gi  f i
2 i 1 i 1
A4
G2 I G  2  l' aire en bleu   2  l' aire de concentrat ion 
A3  2  l' aire(ABC)  L' aire en bleu 
G1 A2 1 1 4
A1  2     Gi 1  Gi  f i 
A F1 F2 F3 B 2 2 1 
4

Donc I G  1   Gi 1  Gi  f i
1

97
Pr. L. Aouragh - Statistique descriptive

Indice de concentration de Gini

Calcul de l’indice de Gini:


L’indice de concentration ou indice de Gini que l’on note par IG
est donné par:
k

IG = 1 ∑ f i (G i 1 + Gi) Avec G0  0
i =1
Interprétation:
 On a toujours, 0 ≤ I G ≤ 1
 I G = 0 concentration nulle,
 I G = 1 concentration maximale,
 Plus la valeur de I C est grande plus la concentration est forte.

98
Pr. L. Aouragh - Statistique descriptive

49
Rappel (analogie)

Distributi on  xi , ni 1i  k  Distributi on  xi , ni xi 1i  k 


ni si  n i x i
k k
n   ni S   si
i 1 i 1
n si
fi  i gi 
n S
i i

Fi   f j Gi   g j
j 1 j 1

Me Ml
Où Ml est la valeur de caractère X qui partage la masse globale en
deux parties égales, il est calculé de la même façon que Me
99
Pr. L. Aouragh - Statistique descriptive

Partie 2
Les indices élémentaires et
les indices synthétiques

100
Pr. L. Aouragh - Statistique descriptive

50
Indices élémentaires

Introduction
On s’intéresse à l’étude d’une variable X variant dans
le temps et/ou dans l’espace,
X peut être simple ( le prix d’un produit, le taux de
chômage, …etc.) ou une variable complexe (le
niveau général des prix, production industrielle d’un
pays…)
Dans la majorité des cas, la comparaison sera
temporelle et portera essentiellement sur des prix et
des quantités.

101
Pr. L. Aouragh - Statistique descriptive

Indice élémentaire

Définition
Soit X une variable simple qui prend la valeur x0 à la date t0 et
la valeur xt à la date t. L’indice élémentaire de X à la date t
par rapport à la date t0, est donné par:
X t
Itt  0
X t 0

Remarque
Assez souvent on prend la date t0=0

102
Pr. L. Aouragh - Statistique descriptive

51
Variation d’une grandeur

Définition
Soit X une grandeur qui prend la valeur xt à la date t et x0 à la
date 0, alors la variation relative de X (ou le taux de variation
de X ) est donnée par:

xt  x 0 x t
x   1  It 0 1
x0 x0
- SiI t 0  1, alors x  0 , donc X a diminué entre 0 et t.
- Si I t 0  1, alors x  0 , donc X a augmenté entre 0 et t.

103
Pr. L. Aouragh - Statistique descriptive

Exemple d’indice élémentaire

Le prix à la consommation du lait frais pasteurisé a passé de


4,80DH/L en 1992 à 6,60DH/L en 2008.
L’indice du prix du lait en 2008 par rapport à 1992 est égale à:

6,60
I 2008 1992   1,375 x  I 2008 1992  1  0,375
4,80

D’où le prix du lait à augmenté de 37,5% entre 1992 et 2008

104
Pr. L. Aouragh - Statistique descriptive

52
Circularité et réversibilité d’un indice

Propriétés:
Si une grandeur numérique X prend les valeurs x0, x1,…,xt aux
instants 0, 1, …,t respectivement alors:
It 0 = I1 0 × I2 1 × .... I t - 1 t-2 It t -1 Circularité ou transférabilité,

1
I0 1 = Réversibilité,
I1 0

Exemple: Les prix successifs du 1Kg de sucre:


Dates 1999 2000 2001 2002
Prix(Dh/Kg) 4,50 4,65 4,97 5,12
105
Pr. L. Aouragh - Statistique descriptive

Les indices synthétiques


Notation:
Soit une grandeur X composée de k grandeurs simples X1,X2,…Xk.
On note pour tout j (1≤j≤k):
j j
- x et x : les valeurs respectivement de la grandeur Xj à la date
0 t
d’origine 0 et à la date t.
j
- I t 0 : l’indice élémentaire de Xj à la date t par rapport à la date 0,
c’est-à-dire: j x tj
It 0 = j
Définition: x0
Un indice synthétique mesure la variation de la valeur d'une grandeur
complexe définie comme agrégation d'un ensemble de grandeurs
élémentaires. L'indice de la grandeur complexe est une moyenne
pondérée des indices des grandeurs élémentaires.
Les pondérations sont les « masses » des grandeurs élémentaires.
106
Pr. L. Aouragh - Statistique descriptive

53
Les indices synthétiques

Formule des indices synthétique:


j
On associe à chaque indice élémentaire I t 0 un poids α
j

qui représente l’importance relative de la gradeur Xj,


k
avec: ∑ αj = 1
j=1

On a deux types de pondérations pour tout 1≤j≤k :


1. Pondération par rapport à la date d’origine que l’on note α 0j
j
2. Pondération par rapport à la date courante que l’on note α t

107
Pr. L. Aouragh - Statistique descriptive

L’indice de Laspeyres et de Paasche

Indice de Laspeyres:
C’est la moyenne arithmétique des indices élémentaires
j
k k
x tj
I . On le note par Lt/0: L t 0 = ∑ α × I
t 0
j
0
j
t0 =∑ α × jj
0
j=1 j=1 x0
Indice de Paasche:
C’est la moyenne harmonique des indices élémentaires
1 1
I tj 0 . On le note par Pt/0: Pt 0 = k =
1 k
x 0j
∑α × j
∑α × j j

j=1
t
I tj 0 j=1 xt t

108
Pr. L. Aouragh - Statistique descriptive

54
L’indice de Fischer

Définition:
C’est la moyenne géométrique des indices de Laspeyres
et de Paasche. On le note par Ft/0: Ft 0 = L t 0 × Pt 0
Exemple: Quantités Pondérations en %
Produit
1995 2000 1995 2000
Produits pétroliers 5664,5 6189 64,9 67,2
Électricité 1702,4 3011 31 32,7
Charbon 363,8 16 4,1 0,1

Calculer les 3 indices des la production à la date 2000


par rapport à la date 1995
109
Pr. L. Aouragh - Statistique descriptive

Solution

D’abord on a le tableau suivant:


α tj i. Par la formule de Laspeyres on a:
Produits I tj 0 α 0j I tj 0 I tj 0 3

Produits pétroliers 1,093 0,709 0,615


L t / 0 = ∑ α 0j I tj / 0 = 1,056 = 105,6%
j=1
Électricité 1,114 0,345 0,293 ii. Par la formule de Paasche on a:
Charbon 0,044 0,002 0,023 1 1
Pt / 0 = 3 = = 107,4%
Total ----- 1,056 0,931 1 0,931
∑ α tj
j=1 I tj / 0
On remarque que: iii. Par la formule de Fisher on a:

Lt/0 ≤ Ft / 0 ≤ Pt / 0 Ft / 0 = L t / 0 × Pt / 0 = 1,065 = 106,5%

110
Pr. L. Aouragh - Statistique descriptive

55
Les indices utilisés dans la pratique

Dans la pratique on s’intéresse aux trois grandeurs P, Q


et D qui sont généralement complexes, chacune
composée de k produits et définies par:
Les prix P
p 0j et p tj les prix unitaires respectifs du produit j à 0 et à t,
Les quantités (ou volumes) Q,
q 0j et q tj les quantités respectives du produit j à 0 et à t,
Les dépenses (ou valeurs) D.
d 0j = q 0j × p 0j et d tj = q tj × p tj les dépenses (ou les valeurs)
respectives du produit j à la date 0 et à la date t.

111
Pr. L. Aouragh - Statistique descriptive

Indices de prix

Indice de Laspeyres:
L’indice des prix de Laspeyres est donné par:
k
p tj q 0j p 0j
L t 0 ( P) = ∑ α 0j × avec α 0j =
j=1 p 0j k
est le coefficient
∑ q i0 p i0
i =1
budgétaire qui représente la part de la dépense totale
consacrée au produit j à la date d’origine (t=0)
k
∑ j=1
q 0j p tj
D’où: L t 0 ( P) = k Si les prix ne changent pas entre
∑ j=1
j
q p
0
j
0 0 et t on aura L t 0 ( P) = 1
112
Pr. L. Aouragh - Statistique descriptive

56
Indices de prix

Indice de Paasche:
L’indice des prix de Laspeyres est donné par:
1 q tj p tj
Pt 0 (p) = avec α = j
k
p 0j t k
est le coefficient
∑α × j
j
t ∑
𝐴 = 𝜋𝑟 q it p it
j=1 pt i =1
budgétaire qui représente la part de la dépense totale
consacrée au produit j à la date courante t.
k
∑ j=1 q tj p tj
D’où: Pt 0 (p) = k j j Si les prix ne changent pas
∑ j=1 q t p 0 entre 0 et t on aura 𝑃 / = 1
113
Pr. L. Aouragh - Statistique descriptive

Indices de quantités

Indice de Laspeyres:
L’indice des quantités de Laspeyres est donné par:
k
k
q j ∑ q jp j
L t 0 (q ) = ∑ α 0 × j = k
j t j=1 t 0

j=1 q0
∑ q 0j p 0j
Indice de Paasche: j=1

L’indice des quantités de Paasche est donné par:


k
1 ∑ j=1 q tj p tj
Pt 0 (q ) = k =
qj ∑
k
q 0j p tj
∑ α × 0j
j
t j=1
j=1 qt
114
Pr. L. Aouragh - Statistique descriptive

57
Indices de dépenses (ou de valeurs)

L’indice de dépenses est donné par:


k
∑ j=1
q tj p tj Dépense totale à la date t
D t 0 (d ) = k =
∑ q 0j p 0j Dépense totale à la date 0
j=1

Remarques:
1. Une dépense peut désigner soit la valeur des achats
soit la valeur des ventes, d’où on note parfois les
dépenses par Vt/0 au lieu de Dt/0
2. On vérifie sans peine, que pour les dépenses on a:
L t 0 (d ) = Pt 0 (d ) = D t 0 (d )
115
Pr. L. Aouragh - Statistique descriptive

Relations en les différents indices

D’après la définition des indices:


L t 0 (p), L t 0 (q ), Pt 0 (p), Pt 0 (q ), et D t 0 (d )
On a:
D t 0 = L t 0 (p) × Pt 0 (q ) = L t 0 (q ) × Pt 0 (p) et D t 0 = Ft 0 (p) × Ft 0 (q )
Exemple:
Période 0 Période 1
Calculer les 3 indices pour Produit
Prix Quantité Prix Quantité
Les prix et les quantités A 4 5 5 4
Calculer l’indice de valeur b 2 8 4 6
de la dépense de la famille C 6 1 5 2

116
Pr. L. Aouragh - Statistique descriptive

58
Solution
k
Période 0 Période 1 ∑ q 0j p1j 62
1) L1 0 (p ) =
j j j j j j j j j=1
q p q p qp
0 0 0 1 1 0 qp1 1 k =
42
= 148%
Produit Prix Q Prix Q ∑ qjpj
j=1 0 0

A 4 5 5 4 20 25 16 20 k
∑ q1j p 0j 40
L1 0 (q ) =
j=1
B 2 8 4 6 16 32 12 24 k = = ??? %
∑ qjpj 42
j=1 0 0
C 6 1 5 2 6 5 12 10
k
Total ---- ---- ---- ---- 42 62 40 54 ∑ q1jp1j 54
P1 0 (p ) =
j=1
k = = 135%
∑ q jp j 42
k j=1 1 0
∑ q1j p1j 54
P1 0 (q ) = F1 / 0 ( p) = L1 0 (p)P1 0 (p) = 141,4% et F1 / 0 (q ) = L1 0 (q )P1 0 (q ) = 91,1%
j=1
k = = 87,1%,
∑ j j
q p 62
j=1 0 1
k

2) ∑ q1j p1j 54
D1 0 (p ) =
j=1
k = = 128,6%
∑ q p j j 42
j=1 0 0

Remarques: i) Dans cette exemple on a : P1 0 < L1 0


ii) On vérifie aussi que:
D1 0 = L1 0 (p) × P1 0 (q ) = L1 0 (q )P1 0 (p) = F1 0 (p)F1 0 (q )

117
Pr. L. Aouragh - Statistique descriptive

Exercice d’application

Exemple:
Calculer les 3 indices pour les prix et les quantités;
Calculer l’indice de valeur de la dépense de la famille.

118
Pr. L. Aouragh - Statistique descriptive

59
Partie 3
Les séries doubles

119
Pr. L. Aouragh - Statistique descriptive

Exemple de série double

Construction de tableau de contingence:


Soit la distribution de 17500 jeunes salariés selon l’âge et le
salaire net, en milliers de dirhams:
Salaire
• Âge: en année
net(yi) • Salaire: mensuels
[5,6[ [6,7[ [7,8[ Total
Âge (xi) Les cellules vertes
représentent la
[20,22[ 1200 500 100 1800 distribution marginale
[22,24[ 2500 3500 600 6600 de caractère X,

[24,26[ 1800 5000 2300 9100 En bleu la distribution


Total 5500 9000 3000 17500 marginale de caractère
Y.

120
Pr. L. Aouragh - Statistique descriptive

60
Tableau de contingence

Modalités de Y

Y
y1 … yj … yq Total
X q

ni   nij
x1 n11 n1q n1.

Distribution marginale de X
j 1

… … p

Modalités
n j   nij
xi nij ni. i 1
de X
... … p q

xp np1 npq np. n   nij


i 1 j 1
Total n.1 … n.j … n.q n..
Distribution marginale de Y

121
Pr. L. Aouragh - Statistique descriptive

Eléments d’un tableau de contingence

Les effectifs:
Les effectifs partiels: nij égale au nombre d’individus présentant
la modalité xi de la variable X et la modalité yj de la variable Y

Les effectifs marginaux: ce sont les effectifs lus dans les 2


marges du tableau.
Pour X :
Variable X x1 x 2  xi  x p Total
Effectifs n1 n 2  ni   n P  n

Pour Y :
Variable Y y1 y2  y j  yq Total
Effectifs n1 n  2  n j  n q n

122
Pr. L. Aouragh - Statistique descriptive

61
Eléments d’un tableau de contingence

Les fréquences: nij


Les fréquences partielles: f ij 
n 
Les fréquences conditionnelles: nij
1. La fréquence conditionnelle de X selon Y: fi / j 
n j
n
2. La fréquence conditionnelle de Y selon X: f j / i  ij
ni
ni  n
Les fréquences marginales: f i  et f j   j
n  n 
Les relations entre les fréquences marginales et conditionnelles:
f i  f j / i  f  j  f i / j  f ij
123
Pr. L. Aouragh - Statistique descriptive

Indépendance de deux variables

Définition :
Deux variables sont indépendantes si les variations de l’une n’entrainent pas
de variations de l’autre.
Autrement:
Deux variables X et Y sont totalement indépendantes si les fréquences
conditionnelles f i / j ne dépendent plus de j.

 nij n
q
n n n n
fi / j  ij  i1  i 2  .....  iq  qj 1  i   f i
n j n1 n2 nq  n j n
j 1

nij ni n n n n n
   nij  i  j  ij  i   j donc f ij  f i  f  j
n  j n  n  n  n  n 
124
Pr. L. Aouragh - Statistique descriptive

62
Exemple d’indépendance de 2 variables

Indépendance des variables


Le tableau suivant représente la distribution statistique de deux
variables X et Y :

Calculer les fréquences partielles et les fréquences marginales.


Montrer que les caractères X et Y sont indépendants.

125
Pr. L. Aouragh - Statistique descriptive

Les caractéristiques des séries à 2 caractères

La moyenne marginale de X:
1 p p q p q

x  ni  xi avec n   ni    n j   nij


n i 1 i 1 j 1 i 1 j 1
La variance marginale de X:
1 p 1 p
V ( x)   ni   xi  x  V ( x)   ni xi2  x 2
2
ou
n i 1 n i 1
L’écart-type de X:  X  V (x )
X Y
La covariance:
i j
1 p q
cov( x , y )   nij  xi  x  y j  y 
n i 1 j 1
p q
ni. n.j
126
Pr. L. Aouragh - Statistique descriptive

63
Exercice

Pour 25 ménages, les âges de l’époux et de l’épouse, relevés sur le


registres d’un état civil sont les suivants:
(22,17); (23,18); (24,17); (24,18); (24,20); (24,21); (25,18); (25,19); (25,20);
(26,18); (26,19); (26,21); (26,23); (27,19); (27,21); (28,21); (28,22); (30,22);
(30,23); (31,24); (31,25); (34,24); (35,24); (35,25); (36,25);
Sachant que chaque couple (xi,yj) représente respectivement l’âge de
l’époux et l’âge de l’épouse au moment de mariage.
1. Ranger les données en classes de même amplitude 5, qui commencent
par 20 pour X et par 15 pour Y.
2. Calculer l’âge moyenne des époux et des épouses.
3. Calculer la variance de l’âge d’épouse, et son écart-type.
4. Calculer la covariance des deux variables
127
Pr. L. Aouragh - Statistique descriptive

Ajustement linéaire

Cadre, rappels et objectifs


On dispose de deux caractères X et Y quantitatifs.
On distingue trois objectifs :
 On cherche à savoir s'il existe un lien entre X et Y,
 On construit un modèle qui permet d'exprimer Y en
fonction de X.
 On calcule les prévisions et on donne leurs
incertitudes.

128
Pr. L. Aouragh - Statistique descriptive

64
Etude de liaison entre deux variables

Lorsqu'on observe deux variables sur les mêmes individus, on


peut s'intéresser à une liaison entre ces deux variables.

Trois types de liaison peuvent être envisagés:


1. La liaison nulle: lorsque il n’y a aucune influence d’un
caractère sur l’autre.
Exemple: salaire et la taille;
2. La liaison totale: lorsque il y a une liaison totale.
Exemple: le périmètre et le rayon d’un cercle;
3. La liaison relative: est le cas général, les caractères sont
dépendants l’un de l’autre dans un certaine mesure.
Exemple: la consommation et le revenu,

129
Pr. L. Aouragh - Statistique descriptive

Notion de corrélation

On dit qu'il y a une corrélation entre deux variables lorsqu'elles ont


tendance à varier:
1. Soit dans le même sens (Exemple, si X augmente, Y augmente
aussi),
2. Soit dans le sens inverse (Exemple, si X augmente, Y diminue).
Coefficient de corrélation:
On dispose de n individus dont on calcule leurs valeurs pour deux
variables quantitatives X et Y : (x1,y1), …, (xn, yn).
Le coefficient de corrélation linéaire entre X et Y est :
cov  X , Y  1 n
r avec cov( x, y) = ∑ (x - x )(y i - y )
 X Y n i=1 i

130
Pr. L. Aouragh - Statistique descriptive

65
Notion de corrélation

Interprétation de coefficient de corrélation:


 Si r est proche de 1, il y a une forte corrélation
positive entre X et Y (même sens de variation)
 Si r est proche de -1, il y a une forte corrélation
négative entre X et Y (différence du sens de
variation).
 Si r = 0, X et Y sont non corrélées : il n'y a pas
d'association linéaire entre X et Y.
 Si r = ±1, alors chacune de ces deux variables peut
définir l’autre d’une façon exacte.
131
Pr. L. Aouragh - Statistique descriptive

Interprétation graphique

132
Pr. L. Aouragh - Statistique descriptive

66
Ajustement linéaire

On dispose de deux caractères X et Y quantitatifs, on a:

1 n 1 n
x 
n i 1
x i
et V ( x )  
n i 1
 xi  x 2
1 n
cov( x, y )    xi  x  yi  y 
n i 1

Donc le coefficient de corrélation sera:


1 n n

cov( x, y ) n
  xi  x  yi  y   x i  x  y i  y 
r  i 1
 i 1

 x y 1 n 1 n n n

  xi  x  n   yi  y    xi  x    y i  y 
2 2 2 2

n i 1 i 1 i 1 i 1
133
Pr. L. Aouragh - Statistique descriptive

Ajustement par la méthode des moindres carrés

1600

1400 yˆ  aˆ x  bˆ
On cherche
1200

valeur
yi1000
â et b̂
observée
erreur ei En
800
valeur minimisant
prédite
ŷi *
600
n
400  ei2
i 1
200
Prix

0
0 100 200 300
xi
Surface

134
Pr. L. Aouragh - Statistique descriptive

67
Ajustement par la méthode des moindres carrés

Détermination de la droite de régression:


La méthode des moindre carrés consiste à trouver les
coefficients a et b de la droite de régression y=ax+b,
qui minimisent la distance quadratique entre ŷ et y i qui
revient à minimiser:
n n

S a , b     y i  yˆ i     y i  ( axi  b) 
2 2

i 1 i 1

Après un calcul, on obtient:


n 1 n
cov( X , Y ) ∑ i=1 ( x i - x )( y i - y ) ∑ i=1 x i y i - xy
â = = = n ; b̂ = y - âx
V( X ) n
∑ i=1 ( x i - x ) 2 1 n n 2
∑ x -x
n i =1 i
135
Pr. L. Aouragh - Statistique descriptive

Exercice

Soit X la note des mathématiques sur 20 points et Y la


note de statistique sur 20 points pour 10 étudiants:

X 2 4 6 6 9 10 11 12 13 18
Y 3 6 6 7 9 10 10 11 14 14

1. Donner la droite des moindres carrés de Y en X ,


2. Donner la droite des moindres carrés de X en Y ,

136
Pr. L. Aouragh - Statistique descriptive

68
Partie 3
Les séries chronologiques

137
Pr. L. Aouragh - Statistique descriptive

Rappel

Les ventes trimestrielles de jus de fruits dans un


grand magasin ont été, en milliers de litres, les
suivantes:
Calculer les prévisions de semestre 1 et 2 de l’année
2001 ?
1er 2ème 3ème 4ème
1996 170 300 610 120
1997 250 410 790 190
1998 290 460 890 250
1999 450 550 1100 270
2000 320 600 1260 280
138
Pr. L. Aouragh - Statistique descriptive

69
Définition d’une série chronologique

Une série chronologique ou chronique, ou


série temporelle, est une suite d’observations,
échelonnées dans le temps, d’une variable
quelconque.
Elle s’intéresse à l’évolution au cours du temps
d’un phénomène, dans le but de décrire,
expliquer puis prévoir ce phénomène dans le
futur.
Exemple:
Les ventes d’une librairie en fonction de temps
139
Pr. L. Aouragh - Statistique descriptive

Exemples des séries chronologiques

Exemple:
En économie:
 L’évolution des indices boursiers, des prix, des données économiques
des entreprises, des ventes et achats de biens, des productions
agricoles ou industrielles,
 L’état fait des prévisions sur le niveau de croissance de la production à
court et à moyen terme.
D’autres domaines:
 L’évolution du nombre du personnes atteintes d’une maladie.
 l’´evolution du nombre de voyageurs utilisant le train
 Nombre de clients qui visitent un supermarché par jour.
 La consommation d’électricité par mois.
 …

140
Pr. L. Aouragh - Statistique descriptive

70
Représentation graphique d’une série chronologique

Les ventes trimestrielles de jus de fruits dans un grand magasin


ont été, en milliers de litres, les suivantes:

1er 2ème 3ème 4ème

1996 170 300 610 120

1997 250 410 790 190

1998 290 460 890 250

1999 450 550 1100 270

2000 320 600 1260 280

141
Pr. L. Aouragh - Statistique descriptive

Description d’une série chronologique

Les composantes fondamentales d’une série


chronologique Yt sont: Tt , S t , C t , Rt
1. La tendance (ou trend) (Tt) représente l’évolution à
long terme de la série étudiée. Elle traduit le
comportement « moyen » de la série.
2. La composante saisonnière (ou saisonnalité) (St)
correspond à un phénomène qui se répète aux
intervalles de temps réguliers (périodiques). En
général, c’est un phénomène saisonnier d’où le
terme de variations saisonnières.
142
Pr. L. Aouragh - Statistique descriptive

71
Description d’une série chronologique

3. Un phénomène cyclique (Ct): c’est souvent le cas en


climatologie et en économie, mais souvent il n’est pas
pris en compte dans les séries,
Exemple : récession et expansion économique,...

4. La composante résiduelle (ou bruit ou résidu) (Rt)


correspond à des fluctuations irrégulières et
imprévisibles, en général de faible intensité mais de
nature aléatoire.
Exemple : grève, guerre, sécheresse...

143
Pr. L. Aouragh - Statistique descriptive

Les parties d’une série chronologique

144
Pr. L. Aouragh - Statistique descriptive

72
Modèles des séries chronologiques

Deux modèles sont possibles:


Additif : Y t  T t  S t  C t  R t
Multiplicatif: Y t  T t  S t  C t  R t
Pour faire cette détermination (modèle additif, multiplicatif)
graphiquement, on trace les deux droites passant respectivement
par les minimum et par les maximum de chaque saison.
Si ces deux droites sont parallèles, nous sommes en présence d’un
modèle additif. Dans le cas contraire, c’est un modèle multiplicatif.
Remarque:
On peut toujours se ramener à partir du modèle multiplicatif au
modèle additif en ajoutant le Logarithme:
log( Y t )  log( T t )  log( S t )  log( C t )  log( R t )
145
Pr. L. Aouragh - Statistique descriptive

Choix de modèle: Additif ou multiplicatif

Méthode de Buys et Ballot :


On calcule, pour chacune des années, la moyenne et l’écart type.
On trace les points d’abscisse la moyenne et d’ordonnée l’écart type
de la même année.
On trace la droite des moindres carrés de ces points.
 Si l’écart type est indépendant de la moyenne alors:
Le modèle est additif.
La pente (a) de la droite des moindres carrés est très proche de 0.
 Si l’écart type est fonction de la moyenne alors:
Le modèle est multiplicatif.
La pente (a) de la droite des moindres carrés n’est pas nulle.
146
Pr. L. Aouragh - Statistique descriptive

73
Estimation des paramètres de la tendance

A- Méthode des moindres carrés:


La tendance peut prendre des formes fonctionnelles assez
diverses citant:
Linéaire: T t  at  b  
Polynomiale:
Logarithmique: T t  a 0  a 1t  
Cas linéaire:
1 n
cov( X , Y ) n i 1 i
( x  x )( yi  y )

n
x y  nx y
i 1 i i
a   ; b  y  ax
1 n
i 1 i
n
V(X ) 2
 2

n
i1 ( xi  x ) 2 x n x
Et donc: T  at  b  
t

147
Pr. L. Aouragh - Statistique descriptive

Estimation des paramètres de la tendance

Exemple :
Déterminer la tendance par la méthode des
moindres carrés pour la série des ventes
trimestrielles exprimées en millions de DH:
t 1 2 3 4 5 6 7 8 9 10 11 12
Yt 3,6 3,9 4,3 3,4 3,8 4,1 5 3,9 4,7 5,1 5,8 4,7

148
Pr. L. Aouragh - Statistique descriptive

74
Estimation des paramètres de la tendance

t Yt t-moy(t) y-moy(y) (t-moy(t))² (t-moy(t))(y-moy(y))


1 3,6 -5,5 -0,76 30,25 4,17
2 3,9 -4,5 -0,46 20,25 2,06
3 4,3 -3,5 -0,06 12,25 0,20
4 3,4 -2,5 -0,96 6,25 2,40
5 3,8 -1,5 -0,56 2,25 0,84
6 4,1 -0,5 -0,26 0,25 0,13
7 5 0,5 0,64 0,25 0,32
8 3,9 1,5 -0,46 2,25 -0,69
9 4,7 2,5 0,34 6,25 0,85
10 5,1 3,5 0,74 12,25 2,60
11 5,8 4,5 1,44 20,25 6,49
12 4,7 5,5 0,34 30,25 1,88
143 21,25
Moyenne t 6,5
Moyenne Yt 4,36
149
Pr. L. Aouragh - Statistique descriptive

Estimation des paramètres de la tendance

150
Pr. L. Aouragh - Statistique descriptive

75
Estimation des paramètres de la tendance

B. Méthode des moyennes mobiles:


Une moyenne mobile pour une période de temps est une
moyenne arithmétique simple des valeurs de cette période et de
celles avoisinantes,
Exemple:
Moyennes mobiles d’ordre 3:
Soit la série y 1 , y 2 ,..., y T on aura
y  y 2  y3 y  y3  y 4 y  y T 1  y T
yˆ 1  1 , yˆ 2  2 ,..., yˆ T  2  T  2 ,
3 3 3
La série yˆ 1 , yˆ 2 ,..., yˆ T  2
réduit les fluctuations aléatoires.

151
Pr. L. Aouragh - Statistique descriptive

Estimation des paramètres de la tendance

Cas particulier de moyenne mobile:


Si l’ordre des moyennes mobiles est pair:
1. On calcule les MM d’ordre pair,
Période série MM4 MMC4
2. On calcule les MM d’ordre 2
1 15
de la nouvelle série 2 27
(MM corrigées). 19,0

3 20 20,25
Exemple: 21,5

On calcule les MM d’ordre 4 4 14 19,50


17,5

5 25
6 11

152
Pr. L. Aouragh - Statistique descriptive

76
Estimation des paramètres de la tendance

Exemple :
Déterminer la tendance par la méthode des moyennes
mobiles d’ordre 4 pour la série des ventes trimestrielles
exprimées en millions de DH,
t 1 2 3 4 5 6 7 8 9 10 11 12
Yt 3,6 3,9 4,3 3,4 3,8 4,1 5 3,9 4,7 5,1 5,8 4,7
Remarque:
Pour une meilleure estimation de la tendance, on choisit
l’ordre des moyennes mobiles égal au nombre de saisons.

153
Pr. L. Aouragh - Statistique descriptive

Calcul des coefficients saisonnières

Soit une série observée sur p périodes, de k valeurs pour


chacune, et ne contient pas de composante cyclique, alors:
La série brute s’écrit, pour 1  i  p et 1  j  k :
Le modèle additif: Yt  Yij  Tt  Sij  Rt 
 t  i  1k  j
Le modèle additif: Yt  Yij  Tt  S ij  Rt 
Exemple: Les ventes trimestrielle exprimées en millions de DH
Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
1988 3,6 3,9 4,3 3,4
1989 3,8 4,1 5 3,9
1990 4,7 5,1 5,8 4,7

Dans ce cas: p=3, k= 4, par exemple Y32=5,1


154
Pr. L. Aouragh - Statistique descriptive

77
Le modèle additif

Les coefficients saisonnières:


1. On détermine la tendance Tt;
2. On calcule les coefficients saisonniers Sij = Yij Tt
Les composantes saisonnières:
1. On calcule les composantes saisonnières bruts Sj pour chaque
saison j, 1 p
S j   S ij
p i 1
1 k
2. On calcule la moyenne des Sj : s  Sj
j j 1

3. Les composantes saisonnières sont: S j  S j  s


'

155
Pr. L. Aouragh - Statistique descriptive

Modèle multiplicatif

Les coefficients saisonnières


1. On détermine la tendance Tt;
Yij
2. On calcule les coefficients saisonniers S ij =
Tt
Les composantes saisonnières:
1. On calcule les composantes saisonnières 1 p
Sj   Sij
p i 1
bruts Sj pour chaque saison j,
1 k
2. On calcule la moyenne des Sj : s  Sj
j j 1
Sj
3. Les composantes saisonnières sont: S j 
'

s
156
Pr. L. Aouragh - Statistique descriptive

78
Exemple des coefficients saisonnières

Reprenons l’exemple des ventes trimestrielles de jus


de fruits dans un grand magasin ont été, en milliers de
litres, les suivantes:
1er 2ème 3ème 4ème
1996 170 300 610 120
1997 250 410 790 190
1998 290 460 890 250
1999 450 550 1100 270
2000 320 600 1260 280

Calculer les coefficients saisonnières de cette série,

157
Pr. L. Aouragh - Statistique descriptive

Les prévisions d’une série chronologiques

Les étapes à suivre:


 Détermination de la tendance Yt,
 Détermination de composantes saisonnières S’t,
 Les prévisions sont calculées par:
Pour le modèle additif: Yˆt  Tt  S j
'

Pour le modèle multiplicatif: Ŷt = Tt × S'j


Ici j est le reste de la division euclidienne de t par nombre de
saisons dans la série,
Exemple:
Pour les trimètres, le nombre de saisons est 4, si on veut les
prévisions à l’instants t=23. On a: 23=5*4+2 donc j=2
158
Pr. L. Aouragh - Statistique descriptive

79
Exemple d’une série chronologiques

Les importations en produits maraîchers (Yt), en milliers de


tonnes, d’une région du Nord, sont données, en stock au
premier jour de chaque trimestre, dans le tableau ci-dessous:

Lundi Mardi Mercredi Jeudi Vendredi


Semaine 1 1 2 7 9 8
Semaine 2 2 3 11 12 9
Semaine 3 5 6 11 14 12
Calculer les prévisions pour t=13 et t=23

Pr. L. Aouragh - Statistique descriptive 159

Exemple d’une série chronologique

Les importations en produits maraîchers (Yt), en milliers de


tonnes, d’une région du Nord, sont données, en stock au
premier jour de chaque trimestre, dans le tableau ci-dessous:

Année Tri 1 Tri 2 Tri 3 Tri 4


1986 1 2 7 9
1987 1 3 11 12
1988 5 6 11 14
Calculer les prévisions pour t=13 et t=23

Pr. L. Aouragh - Statistique descriptive 160

80
Université Mohammed V de Rabat Sciences Économiques et Gestion
Faculté des Sciences Juridiques Economiques et Sociales - Salé Semestre: S1, sections: A et B
Année Universitaire 2020/2021 Pr. L. Aouragh
 

Statistique déscriptive  Série 1
Exercice 1:
Une enquête réalisée par une agence de tourisme sur la nationalité des touristes visitant le
Maroc a concerné un échantillon de 500 touristes. Les résultats obtenus sont représentés
dans le tableau suivant:

Nationalité Française Allemande Italienne Hollandaise Belge Américaine Autres


Effectifs 85 106 62 44 40 70 93
1. Donner la méthode utilisée pour recueillir ces données,
2. Préciser la population; la taille de l’échantillon; le caractère étudié, sa nature et ses
modalités,
3. Dresser le tableau statistique des fréquences, et représenter graphiquement cette dis-
tribution.
Exercice 2:
Une étude de marché a mesuré le degré de satisfaction d’un échantillon de 500 clients
d’une banque. Les résultats sont présentés dans le tableau suivant:

Degré de satisfaction Pas de tout satisfait Insatisfait Indifférent Satisfait Très satisfait
Effectifs 223 187 32 55 3
1. Donner la méthode utilisée pour recueillir ces données,
2. Quelle est la population étudiée,
3. Quel est le caractère étudié ? quelle est sa nature et ses modalités ?
4. Dresser le tableau statistique des fréquences, et représenter graphiquement cette dis-
tribution.
Exercice 3:
On a interrogé 100 ménages de la ville de Salé sur le nombre de pièces de leur logement.
Le tableau ci-dessous représente les résultats obtenus:
Nombre de pièces 1 2 3 4 5
L’effectifs 50 30 40 20 5
1. Donner la méthode utilisée pour recueillir ces données,
2. Préciser la population, la taille de l’échantillon, le caractère, sa nature et ses modalités,
3. Dresser le tableau statistique des fréquences, et représenter graphiquement cette dis-
tribution.
Exercice 4:
Le tableau suivant donne le niveau de scolarité en nombre d’années passées à l’école d’un
échantillon de 200 personnes.
Nombre d’année de scolarité [0, 6[ [6, 12[ [12, 14[ [14, 16[
Effectifs 40 80 50 30
1. Calculer les amplitudes et représenter graphiquement cette distribution,
2. Quel est le nombre de personnes ayant un niveau de scolarité de moins de 12 années ?
3. Quelle est la proportion des personnes ayant un niveau d’au moins 12 années passées
à l’école ?

1/1
Université Mohammed V de Rabat Sciences Économiques et Gestion
Faculté des Sciences Juridiques Economiques et Sociales - Salé Semestre: S1, sections: A et B
Année Universitaire 2020/2021 Pr. L. Aouragh
 

Statistique déscriptive  Série 2

Exercice 1:
On a mesuré la taille d’un échantillon de 20 personnes et les résultats obtenus sont (en
cm): {148, 165, 145, 173, 148, 145, 152, 180, 135, 170, 170, 170, 142, 148, 165, 175, 180,
180, 180, 130 }
1. Donner la méthode utilisée pour recueillir ces données,
2. Préciser la population; la taille de l’échantillon; le caractère étudié, sa nature et ses
modalités,
3. Regrouper ces valeurs par classes d’amplitudes égales à 10, puis représenter graphique-
ment ces classes.
4. Calculer les paramètres suivants: le mode, la médiane, les quartiles et la moyenne
arithmétique.
5. Regrouper ces valeurs par 3 classes d’amplitudes respectivement 20, 20 et 10. Puis
représenter graphiquement ces classes.
Exercice 2:
On considère la répartition de 100 entreprises selon leurs chiffres d’affaires exprimés en
millions de Dirhams (mDH).

Chiffres d’affaires [10; 30[ [30; 50[ [50; 60[ [60; 80[
Nombre d’entreprises 20 40 30 10

1. Préciser la population étudiée, sa taille, le caractère et sa nature;


2. Quel est le pourcentage des entreprises qui ont un chiffre d’affaires moins de 50000000
DH;
3. Tracer l’histogramme de cette distribution;
4. Calculer la moyenne, le mode et la médiane de cette série. Que peut-on dire de
l’asymétrie de cette distribution,
Exercice 3:
Le tableau suivant représente la distribution des exploitations agricoles d’une région selon
la taille en hectare (ha)

La taille en hectare (ha) [2; 4[ [4; 6[ [6; 12[ [12; 20[


Les fréquences 0,15 0,25 0,48 0,12

1. Représenter graphiquement cette distribution;


2. Calculer la moyenne, le mode et la médiane, comparer leurs valeurs et interpréter le
résultat;
3. Donner le pourcentage des exploitations agricole qui ont une taille au moins égale à 4
ha;
4. Calculer µ3 : le moment centré d’ordre 3, en déduire le coefficient d’asymétrie de Fisher
γ1 et interpréter le résultat,
5. Calculer µ4 : le moment centré d’ordre 4, en déduire le coefficient d’aplatissement de
Fisher γ2 et interpréter le résultat.

1/1
Université Mohammed V de Rabat Sciences Économiques et Gestion
Faculté des Sciences Juridiques Economiques et Sociales - Salé Semestre: S1, sections: A et B
Année Universitaire 2020/2021 Pr. L. Aouragh
 

Statistique déscriptive  Série 3

Exercice 1:
Soit la distribution du nombre d’employés observés chez 1000 commerçants.
Nombre d’employés 0 1 2 3 4 5 6 7
Nombre de commerçants 50 100 200 150 120 160 130 90

1. Représenter graphiquement cette série,


2. Calculer la moyenne et la variance, en déduire le coefficient de la variation ?
3. Calculer le mode et la médiane, que peut-on dire de la distribution de cette série ?
4. Calculer les quartiles Q1 , Q3 ; et en déduire l’écart inter-quartile ?
5. Calculer les déciles D1 , D9 ; et en déduire l’écart inter-décile ?
6. Tracer la courbe de concentration,
7. Calculer le coefficient de concentration et interpréter le résultat,
Exercice 2:
Une enquête sur la consommation annuelle d’électricité a été effectuée sur une population
de 2600 ménages. Les résultats de l’enquête figurent dans le tableau suivant:
xi [0, 200[ [200, 300[ [300, 400[ [400, 600[ [600, 800[ [800, 1000[ [1000, 2000[
ni 455 614 532 385 422 164 28

1. Construire l’histogramme des consommations annuelles.


2. Calculer la moyenne et la variance, en déduire le coefficient de la variation ?
3. Calculer le mode et la médiane, que peut-on dire de la distribution de cette série ?
4. Calculer les quartiles Q1 , Q3 ; et en déduire l’écart inter-quartile ?
5. Calculer les déciles D1 , D9 ; et en déduire l’écart inter-décile ?
6. Tracer la courbe de concentration,
7. Calculer le coefficient de concentration et interpréter le résultat,
Exercice 3:
Le tableau suivant donne les résultats d’une étude statistique sur l’âge et le poids de 142
enfants:
PP
PP Age Y
PP
[3; 4[ [4; 5[ [5; 6[
Poids X PPPP
[10; 15[ 19 7 1
[15; 20[ 32 21 12
[20; 25[ 3 18 28
[25; 30[ 0 0 1

1. Calculer la distribution marginale des caractères X et Y,


2. Calculer l’âge moyen des enfants,
3. Calculer le poids moyen des enfants,
4. Calculer les fréquences conditionnelles du poids sachant que l’âge est dans [4 ;5],
5. Calculer les fréquences conditionnelles de l’âge sachant que le poids est dans [20 ;25],
6. Calculer les fréquences partielles,
7. Calculer les fréquences marginales,
8. Peut-on dire que le poids est indépendant de l’âge ? pourquoi ?

1/1
Université Mohammed V de Rabat Sciences Économiques et Gestion
Faculté des Sciences Juridiques Economiques et Sociales - Salé Semestre: S1, sections: A et B
Année Universitaire 2020/2021 Pr. L. Aouragh
 

Statistique déscriptive  Série 4
Exercice 1:
Le tableau suivant représente les ventes trimestrielles d’un magasin (en millions de dhs)
:
Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
2008 136 115 141 108
2009 146 114 158 105
2010 150 121 164 102
2011 153 122 174 100

1. Représenter graphiquement cette série,


2. Calculer les moyennes mobiles d’ordre 4 et représenter-les sur le même graphe,
Exercice 2:
Le tableau suivant représente l’évolution de chiffre d’affaires réalisé pour une entreprise:
Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
2003 - 9050 9380 9378
2004 9680 10100 10160 10469
2005 10738 10910 11058 11016
2006 10869 11034 11135 10845
2007 11108 11115 11424 10895
2008 11437 11352 11381 11401
2009 11507 11453 11561 -

1. Donner les composantes fondamentales d’une série chronologique,


2. Représenter graphiquement cette série,
3. On adoptera un modèle multiplicatif pour modéliser cette série chronologique. Cela
vous semble-t-il cohérent ? Pourquoi ?
4. Calculer la tendance en utilisant la méthode des moindres carrées,
5. Calculer les coefficients saisonniers de cette série.
En déduire les composantes saisonnières.
6. Quel sera le chiffre d’affaires du trimestre 3 de l’année 2010.
Exercice 3:
Le tableau suivant représente les consommations mensuelles d’un produit alimentaire dans
une population donnée:
1 2 3 4 5 6 7 8 9 10 11 12
2008 2639 2899 3370 3740 2927 3986 4217 1738 5221 6424 9842 13076
2009 3934 3162 4286 4676 5010 4874 4633 1649 5951 6981 9851 12670
2010 4348 3564 4577 4788 4618 5312 4298 1431 6123 7543 10897 13425

1. Représenter graphiquement cette série,


2. Donner le type du modèle convenable pour modéliser cette série,
3. Calculer la tendance en utilisant la méthode des moindres carrées,
4. Calculer les coefficients saisonniers. En déduire les composantes saisonnières,
5. Quelle sera la consommation de ce produit pour les deux premiers mois de l’année
2011.

1/1

Vous aimerez peut-être aussi