Vous êtes sur la page 1sur 58

LES INDICES

I) NOTION D'INDICE

Il est souvent nécessaire dans l'étude des phénomènes économiques et sociaux de décrire des
variations de grandeurs simples (par exemple: le prix, la production, le taux de chômage) qui
varient dans l'espace et dans le temps, car d'une région à une autre, d'une période à une autre
ces grandeurs peuvent être très fluctuantes.
Il est souvent difficile d'apprécier et de comparer ces grandeurs car les tableaux statistiques
fournissent un grand nombre de chiffres, ce qui rend les comparaisons immédiates difficiles.
Pour faciliter cette interprétation directe des comparaisons dans le temps et dans l'espace, il
faut généralement effectuer le rapport des grandeurs considérées : On parle d'indices
statistiques.
Exemple: Soit une ferme dont la vente passerait de 20 en 1990 à 26 en 1991 et à 30 en 1992.
𝑉0 20 × 100
1990 → × 100 = = 100
𝑉0 20
𝑉1 26 × 100
1991 → × 100 = = 130
𝑉0 20
𝑉2 30 × 100
1992 → × 100 = = 150
𝑉0 20

On pourra donc dire que 1'indice de vente de la ferme en retenant pour année de référence
1990, c’est-à-dire en retenant 100 pour indice de l'année de base, l'indice de la ferme passe
de 100 à 130 en 1991, et à 1 5 0 e n1992, soit un accroissement de30% et de 50%
directement lisible.
Il s'agit ici d'un indice temporel ou chronologique. Si à la place des années nous avions eu des
régions, il se serait agi d’indice régional ou spatial.
Il existe 2 types d'indices : les indices élémentaires et les indices synthétiques.

II) LES INDICES ELEMENTAIRES


A) Définition

On appelle indice élémentaire, le nombre sans dimension résultant du rapport de 2 valeurs


prises par une grandeur simple, soit à 2 dates différentes, soit sur 2 espaces différents.
Soit la variation dans le temps ou dans l'espace d'une grandeur simple V définie avec
précision, et prenant les valeurs suivantes:

1
V0, V1, …………..,Vt
Aux dates (ou périodes) successives
0,1,...............t
On appelle indice élémentaires de la grandeur V à la date (ou période) t par rapport à la
date (ou période) 0, le rapport
𝑉𝑡
𝑖𝑡/0 =
𝑉0
- La date (ou période) 0 est la date de référence ou de base de l'indice (pour les indices
chronologiques). Elle devient : situation de base ou de référence dans le cas des
indices spatiaux.
- La date(ou période) t est la date courante.

En règle générale ce rapport est exprimé en pourcentage.


𝑉𝑡
𝐼𝑡/0 = 𝑖𝑡/0 × 100 = × 100
𝑉0
On dit alors que l'indice à la date t est exprimé base 100 à la date de référence 0.
Si on définit l'indice comme simple rapport (sans le multiplier par 100) on peut
effectuer tous les calculs ultérieurs sans « s'encombrer » des puissances de 10, il suffit
alors de multiplier par100 le résultat final de ces calculs.

- Exemple:
-Indice du prix d'un bien X entre 1985 et 1990
𝑝𝑟𝑖𝑥 𝑒𝑛 1990
𝐼90/85 = × 100
𝑝𝑟𝑖𝑥 𝑒𝑛 1985
Base 100 en 1985

- Indice du prix d'un bien X entre la région d'Abidjan et la Côte d'Ivoire entière.
𝑝𝑟𝑖𝑥 𝑒𝑛 𝑟é𝑔𝑖𝑜𝑛 𝑑′𝐴𝑏𝑖𝑑𝑗𝑎𝑛
𝐼𝑅𝐴/𝐶𝐼 = × 100
𝑝𝑟𝑖𝑥 𝑒𝑛 𝐶ô𝑡𝑒 𝑑′𝐼𝑣𝑜𝑖𝑟𝑒
Base 100 pour la Côte d'Ivoire

2
B) Propriétés des indices élémentaires

Les indices élémentaires possèdent les propriétés de circularité et de réversibilité.


1) La circularité
Si une grandeur économique prend les valeurs Vo, Vt', Vt aux temps 0, t’, t, l’indice
élémentaire satisfait la relation :
1
𝐼𝑡 = 𝐼𝑡/𝑡′ × 𝐼𝑡′/0 ×
100

En effet:
𝑉𝑡 𝑉𝑡 100𝑉𝑡′
𝐼𝑡/0 = × 100 = × 100 ×
𝑉0 𝑉0 100𝑉𝑡′

𝑉𝑡 𝑉𝑡′ 1
𝐼𝑡/0 = × 100 × × 100 ×
𝑉𝑡′ 𝑉0 100
1
𝐼𝑡 = 𝐼𝑡/𝑡′ × 𝐼𝑡′/0 ×
100
𝐼𝑡/0 = 𝑖𝑡/𝑡′ × 𝑖𝑡′/0 × 100

Elle peut aussi s'écrire:


𝐼𝑡/0 × 100
𝐼𝑡/𝑡′ =
𝐼𝑡 ′/0

ou
𝑖𝑡/0 × 100
𝐼𝑡/𝑡′ =
𝑖𝑡 ′/0

Pour comparer 2 grandeurs simples à 2 dates t et t', il suffit de faire le rapport de


leurs indices. Ainsi la comparaison de l'évolution entre 2 dates différentes peut se faire
aussi bien sur les indices que sur les grandeurs elles-mêmes.
- On peut par conséquent opérer des changements de base sur les indices
élémentaires, en substituant à la date 0, la date t'.
- Cette propriété de circularité peut s'appliquer de période en période (de date en
date), se généraliser à une suite d'indices successifs. On dit que les indices
élémentaires sont enchainables.

3
𝐼1/0 𝐼2/1 𝐼3/2 𝐼𝑡/𝑡−1
𝐼𝑡/0 = 100 × [ × × × ⋯× ]
100 100 100 100

𝐼𝑣/0 = 100 × (𝑖1/0 × 𝑖2/1 × 𝑖3/2 × ⋯ × 𝑖𝑡−1/𝑡−2 × 𝑖𝑡/𝑡−1 )

La propriété de circularité permet ainsi d'obtenir l'indice élémentaire de la date t, par rapport à
la base, en effectuant le produit des indices élémentaires intermédiaires successifs.

2) Réversibilité.
Quand on inverse le rôle de la base et de la période courante, l'indice élémentaire
s'inverse à 104 près
𝐼𝑡/0 × 𝐼0/𝑡 = 104

ce qui équivaut à
104
𝐼0/𝑡 =
𝐼𝑡/0

ou
1
𝑖0/𝑡 =
𝑖𝑡/0

En effet:
𝑉𝑡
𝐼𝑡/0 = × 100
𝑉0

𝑉0
𝐼0/𝑡 = × 100
𝑉𝑡

𝑉𝑡 𝑉0
× 100 × × 100 = 10000 = 104
𝑉0 𝑉𝑡

4
3) Propriétés secondaires

a) Soient 3 variables a, b, c telles que a soit le produit des 2 autres (b x c), alors
quelque soit t, l'indice élémentaire du produit est égal au produit des indices
élémentaires à 10-2 près.
Si 𝑎 = 𝑏 × 𝑐
1
𝐼𝑡/0 (𝑎) = 𝐼𝑡/0 (𝑏) × 𝐼𝑡/0 (𝑐 ) ×
100
Ou
𝐼𝑡/0 (𝑎) = 𝑖𝑡/0 (𝑏) × 𝑖𝑡/0 (𝑐 ) × 100

b) Quand une grandeur simple est le rapport de 2 autres, l’indice élémentaire est
égal au rapport des indices élémentaires à102 près.
𝑎
Si 𝑏 =
𝑐

𝐼𝑡/0 (𝑎) × 100


𝐼𝑡/0 (𝑏) =
𝐼𝑡/0 (𝑐 )

C) Si entre la période de référence et la période t, la grandeur simple est


multipliée par une constante k l'indice élémentaire est multiplié par k.
𝑉𝑡 = 𝑘 × 𝑉0 → 𝐼𝑡/0 = 𝑘 × 100

En effet

𝑉𝑡 × 100 𝑉0
𝐼𝑡/0 = = 𝑘 × = 𝑘 × 100
𝑉0 𝑉0

III) LES INDICES SYNTHETIQUES


Un indice synthétique s'applique à une grandeur complexe qui est un ensemble de
grandeurs simples. Le niveau général des prix par exemple est constitué des prix
des divers éléments, boissons, logements, etc... L'évolution de chacune de ses
grandeurs simples est décrite par un indice élémentaire. On a donc une série

5
d'indices élémentaires qui doit être résumée numériquement par un indice
synthétique.
Soit une grandeur complexe X constituée de différents éléments :

𝑋 = {𝑥 1 , 𝑥 2 , 𝑥 3 , ⋯ , 𝑥 𝑖 , ⋯ , 𝑥 𝑘 }
Les indices élémentaires des constituants xi de X peuvent être calculés:

𝑖
𝑥1𝑖 × 100
𝐼𝑡/0 (𝑥 ) =
𝑥01
Mais, ces différents indices ne suffisent pas pour apprécier l'évolution du niveau
général des prix. Il est nécessaire de résumer, de synthétiser par un seul indice, qu'on
appelle indice synthétique de la grandeur complexe X, les différents indices
élémentaires, un peu comme1'on résume une distribution statistique, en calculant,
par exemple sa moyenne.
Chaque indice élémentaire est de type:

𝑖
𝑥1𝑖 × 100
𝐼𝑡/0 (𝑥 ) =
𝑥01

En économie on accorde une importance particulière aux variations de prix


(p), de quantités (q) ou de valeur (pq) qu'on appelle ici valeur globale
Valeur globale = prix x quantités
3 types d'indices (élémentaires et synthétiques) sont mesurables: Indice des prix, des
quantités et des valeurs.
L’indice des valeurs présente économiquement moins d'intérêt que les 2 autres dans
la mesure où son évolution dépend de celle des prix et de celle des quantités sans qu'on
puisse expliquer la cause d'une telle variation. Est-ce dû à une augmentation du prix
ou de la quantité.
∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝐼𝑡/0 (𝑝𝑞) = × 100
∑ 𝑝0𝑖 𝑞0𝑖

Pour lever le doute on considère dans le calcul de l'indice que l'une des 2 variables (le prix
ou la quantité) reste constante, pendant que l'autre varie.
- Un indice de prix se conçoit à quantités fixes.
6
- Un indice des quantités se conçoit à prix constants.
Supposons que p varie et que q reste constant entre la période 0 et la période t.
Alors pour un bien quelconque« i »la valeur globale à la date de base sera p i0 qi0 et à la
date courante pitqi0
L'indice élémentaire de valeur du bien i sera :

𝑝𝑡𝑖 𝑞0𝑖 𝑝𝑡𝑖


𝐼𝑡/0 (𝑝𝑞) = × 100 = 𝑖 × 100
𝑝0𝑖 𝑞0𝑖 𝑝0
C'est un indice élémentaire des prix.
Si nous voulons comparer les valeurs globales de tous les biens composant la grandeur
globale X, on aura
A la période de b a s e ∑ 𝑝0𝑖 𝑞0𝑖

Et à la période courante ∑ 𝑝𝑡𝑖 𝑞0𝑖


L'indice synthétique résumant tous les indices élémentaires sera:
∑ 𝑝𝑡𝑖 𝑞0𝑖
𝐼𝑡/0 (𝑝𝑞) = × 100
∑ 𝑝0𝑖 𝑞0𝑖

A) L’indice de Laspeyres
L’indice de Laspeyres est défini en prenant comme date de référence une date antérieure
à la date d'observation.
1) L'indice des prix de Laspeyres
∑ 𝑝𝑡𝑖 𝑞0𝑖
𝐿𝑃𝑡/0 = × 100
∑ 𝑝0𝑖 𝑞0𝑖

Remarques
a) La formule de définition peut encore s'écrire
𝑝𝑡
∑ 𝑝0𝑖 𝑞0𝑖
𝑝0
𝐿𝑃𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝0 𝑞0
Ecrite sous cette forme, la formule de l'indice des prix de Laspeyres se présente comme une
moyenne arithmétique. Ce qui permet de dire que l'indice des prix de Laspeyres est la
moyenne arithmétique de la série des indices élémentaires de prix, pondérée par des valeurs
globales de la date de base.
Le coefficient de pondération du type p0q0 s’appelle dans le cas des indices de prix, des

7
Coefficients budgétaires

b) On peut transformer la formule de définition ainsi


∑ 𝑝𝑡𝑖 𝑞0𝑖
𝐿𝑃𝑡/0 = 𝑝0 × 100
∑ 𝑝𝑡𝑖 𝑞0𝑖
𝑝𝑡

Ecrite sous cette forme l'indice des prix de Laspeyres se lit comme une moyenne
harmonique.
L'indice des prix de Laspeyres est la moyenne harmonique de la série des valeurs
globales de la date de base«0» pour les quantités, et de la date courante «t» pour les
prix.

2) L'indice des quantités (ou de volume) de Laspeyres

𝑞 ∑ 𝑝0𝑖 𝑞𝑡𝑖
𝐿𝑡/0 = × 100
∑ 𝑝0𝑖 𝑞0𝑖

Remarques
a)
𝑞𝑡
∑ 𝑝0𝑖 𝑞0𝑖
𝑞 𝑞0
𝐿𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝0 𝑞0

b)

𝑞 ∑ 𝑝0𝑖 𝑞𝑡𝑖
𝐿𝑡/0 = 𝑞0 × 100
∑ 𝑝0𝑖 𝑞𝑡𝑖
𝑞𝑡

Les indices synthétiques se calculent généralement avec une décimale significative.


B) Indice de Paasche
L'indice de Paasche est défini en prenant comme date de référence la date «actuelle » (t), et
non plus la date de« départ » o
1) L’indice des prix de Paasche

𝑝 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = × 100
∑ 𝑝0𝑖 𝑞𝑡𝑖

Remarques

8
𝑝𝑡
∑ 𝑝0𝑖 𝑞𝑡𝑖
𝑝 𝑝0
𝑃𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝0 𝑞𝑡
Il s'écrit comme une moyenne arithmétique.
L'indice des prix de Paasche est la moyenne arithmétique de la série des indices
élémentaires des prix, pondérée par les valeurs globales de la date courante «t» pour
les quantités, et de la date de base«0»pour les prix.

b) La formule peut aussi s'écrire sous la forme d'une moyenne harmonique

𝑞 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = 𝑝0 × 100
∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑝𝑡

L'indice des prix de Paasche est donc la moyenne harmonique de la série des indices
élémentaires (Pt / P0) pondérée par les valeurs globales de la date actuelle «t» (date
courante).
2) L'indice des quantités de Paasche

𝑞 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = × 100
∑ 𝑝𝑡𝑖 𝑞0𝑖

Remarques
a)
𝑞𝑡
∑ 𝑝𝑡𝑖 𝑞0𝑖
𝑞 𝑞0
𝑃𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝𝑡 𝑞0

b)

𝑞 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = 𝑞0 × 100
∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑞𝑡

9
C) Indice de Fisher
Aucun critère théorique, aucune raison ne nous permet de préférer 1'un ou1'autre des 2 indices
et dire que l'un des 2 indices est meilleur que l'autre, bien que les 2 donnent des résultats
différents.
L'indice de Laspeyres ayant tendance à surestimer, l'indice de Paasche ayant tendance à
sous-estimer.
L'économiste américain Irving Fisher propose un indice synthétique qu'il trouve idéal. La
valeur se situe entre les valeurs des 2autres (Laspeyres et Paasche).
L'indice de Fisher est la moyenne géométrique des indices de Laspeyres et de Paasche.

𝐹 𝑝 = √𝐿𝑝 × 𝑃𝑝
Et
𝐹 𝑞 = √𝐿𝑞 × 𝑃𝑞
L'indice de Fisher est compris entre ceux de Laspeyres et ceux de Paasche, aussi bien
pour les prix que pour les quantités, si les pondérations sont homogènes.
𝑃≤𝐹≤𝐿
L'indice des valeurs calculé par Laspeyres est égal à celui calculé par Paasche, et est
égal au produit de l'indice de Fisher des prix par l'indice de Fisher des quantités.
I (pq) = LpPq = LqPp = Lpq = FPFq

D) Propriétés des indices synthétiques


1) Circularité
Aucun des3 indices ne possède cette propriété.

2) Réversibilité
Quand on inverse le rôle du temps dans un indice de Laspeyres, on obtient un
indice de Paasche et inversement.
104
𝐿0/𝑡 =
𝑃𝑡/0

et
104
𝑃0/𝑡 =
𝐿𝑡/0

10
Les indices de Laspeyres et de Paasche ne sont pas réversibles. Par contre
l'indice de Fisher est réversible:
104
𝐹𝑡/0 =
𝐹0/𝑡

3) Agrégation
Les indices de Laspeyres et de Paasche ayant des structures de moyennes
arithmétiques de «sous populations» on peut utiliser les résultats des moyennes
de sous-populations et obtenir l'indice de Laspeyres et de Paasche d'un ensemble
à partir des indices des groupes.
Nous savons que:
Si une population P est composée de plusieurs sous populations, la moyenne de la
population P est la moyenne pondérée des moyennes des sous populations.
1
𝑋̅ = ∑ 𝑛ℎ 𝑥̅ℎ
𝑛
De même si un ensemble de produits est reparti en plusieurs groupes, l’indice de
Laspeyres d'ensemble est égal à l'indice de Laspeyres des indices de Laspeyres de
chaque groupe de constituants.
De même, l'indice de Paasche d'ensemble est égal à l'indice de Paasche des indices de
Paasche de chaque groupe.
L'indice de Fisher ne satisfait pas la propriété d'agrégation car ce n'est pas une
moyenne.
Indice de Sidwick

𝐿𝑡/0 + 𝑃𝑡/0
𝑆𝑡/0 = 𝑥100
2

11
DISTRIBUTION DES SERIES A DEUX DIMENSIONS

Dans les chapitres précédents les distributions étudiées étaient à une dimension c'est-à- dire
que l'on ne retenait pour l'étude qu'un seul caractère. Cependant pour l'étude de certains
phénomènes il s'avère indispensable de prendre simultanément deux caractères ou plus.
Nous nous limiterons à l'étude des séries statistiques à deux caractères. Elles se présentent
sous forme de tableau à deux dimensions ou à double entrée.

I) PRESENTATION GENERALE DES TABLEAUX STATISTIQUE A DOUBLE


ENTREE

Soit une population P comprenant n individus pour chacun desquels on a fait une
observation concernant simultanément les caractères X et Y

xi yi y1 y2 … yj …2 yl
Total
x1 n11 n12 … n1j … n1l n1.
x2 n21 n22 … n2j … n2l n2.
… … … … … …
xi ni1 ni2 … nij … nil ni.
… … … … … …
xk nk1 nk2 … nkj … nkl nk .
Total
n.1 n.2 … n.j … n.l
n.j n..

nij est l'effectif des individus présentant à la fois la modalité xi et la modalité yj, on dit
encore effectif partiel. Les effectifs nij sont toujours notés en prenant d'abord l'indice de x
(« i») et celui de y («j») ensuite nji n'existe pas.

Les tableaux à double entrée représentant les séries statistiques à 2 variables prennent le
nom de tableaux de contingence, appelés parfois tableau de corrélation.

Notons que dans les marges ainsi que pour toute somme l'indice qui varie est remplacé par un
point

Exemple« n2. » signifie que l'on a additionné les effectifs de la 2éme ligne.
L'indice j, qui a varié de1à l, est remplacé par un point.

12
De même « n.j » représente l'effectif de la modalité yj, pour toutes les modalités des caractères
x.
L'indice « i » de x varie de 1 à k, on le remplace par un point.

∑ nij = n1j + n2j + ⋯ + nij + ⋯ + nkj


i=1

∑ nij = n.j

i varie donc devient«. »

∑ nij = ni1 + ni2 + ⋯ + nij + ⋯ + nil


j=1

∑ nij = 𝑛𝑖 .

j varie donc devient «. »

En généralisant, on note 1'effectif général marginal de x : « ni. » (dernière colonne,


correspondant aux effectifs de la distribution marginale de x). On note l'effectif marginal
de y ; « n.j » (dernière ligne correspondant aux effectifs de la distribution marginale de y.

𝑛. . = ∑ 𝑛.𝑗 = ∑ 𝑛𝑖 .
𝑗 𝑖

La sommation ligne par ligne s'écrit


𝑛. . = ∑ ∑ 𝑛𝑖𝑗 = ∑ 𝑛𝑖 . = 𝑛
𝑖 𝑗 𝑖

La sommation colonne par colonne s'écrit


𝑛. . = ∑ ∑ 𝑛𝑖𝑗 = ∑ 𝑛.𝑗 = 𝑛
𝑗 𝑖 𝑗

En définitive

13
𝑛. . = ∑ ∑ 𝑛𝑖𝑗 = ∑ 𝑛𝑖 . = ∑ 𝑛.𝐽
𝑖 𝑗 𝑖 𝑗
La fréquence de l'évènement (xi, yj), on dit encore fréquence partielle de l'évènement (xi, yj)
est le rapport de l'effectif partiel sur l’effectif total. C'est la proportion des observations qui
présentent simultanément les modalités xi, yj.

𝑛𝑖𝑗
𝑓𝑖𝑗 =
𝑛. .

A) DISTRIBUTIONS MARGINALES

Les sommes des effectifs ou des fréquences en ligne définissent la distribution marginale
(d'effectifs ou de fréquences) suivant le caractère x. C'est une distribution à une seule
dimension.

La fréquence marginale de la modalité xi du caractère x est:


𝑛𝑖 .
𝑓𝑖 . =
𝑛. .

∑𝑗 𝑛𝑖𝑗 𝑛𝑖
𝑓𝑖 . = ∑ 𝑓𝑖𝑗 = =
𝑛. . 𝑛. .
𝑗

La distribution marginale suivant le caractère y est définie par les sommes en colonnes.

La fréquence marginale de la modalité yj est égale à

𝑛.𝑗
𝑓.𝑗 =
𝑛. .

∑𝑖 𝑛𝑖𝑗 𝑛.𝑗
𝑓.𝑗 = ∑ 𝑓𝑖𝑗 = =
𝑛. . 𝑛. .
𝑖

Comme pour les distributions à un caractère la somme des fréquences est égale à
l'unité.

∑ ∑ 𝑓𝑖𝑗 = ∑ 𝑓𝑖 . = ∑ 𝑓.𝑗 = 1

14
Les effectifs marginaux sont les effectifs lus dans les 2 marges du tableau.
{𝑛1 . , 𝑛2 . , 𝑛3 . , ⋯ , 𝑛𝑖 . , ⋯ , 𝑛𝑘 . } Pour x
{𝑛.1 , 𝑛.2 , 𝑛.3 , ⋯ , 𝑛.𝑖 , ⋯ , 𝑛.𝑘 } Pour y

B) DISTRIBUTIONS CONDITIONNELLES

Soient ni. individus présentant la modalité xi. Parmi ceux-ci il y en a une proportion
nij/ni. Qui présentent simultanément la modalité yj

La fréquence conditionnelle de la modalité yj liée par xi est :

𝑦 𝑛𝑖𝑗
𝑓𝑗/𝑖 = 𝑓 ( 𝑗⁄𝑥𝑖 ) =
𝑛.𝑖

C'est la proportion d'individus présentant la modalité yj, parmi les individus qui présentent
uniquement la modalité xi.

Les différentes fréquences conditionnelles pour une même modalité xi du caractère x


définissent la distribution conditionnelle de y liée par xi. C'est une distribution à un seul
caractère et il y'a autant de distributions conditionnelles de y qu'il y'a de modalités xi de x.

La distribution conditionnelle de x liée par yj se définit de la même manière.


La fréquence conditionnelle de la modalité xi, liée par yj est:

𝑥 𝑛𝑖𝑗
𝑓𝑖/𝑗 = 𝑓 ( 𝑖⁄𝑦𝑗 ) =
𝑛. 𝑗

On appelle «fréquences conditionnelles» le rapport de l'effectif partiel sur1'effectif


marginal.

Notation:
j
fi/j ou fi qui se lit fréquence de xi, sous condition que y = yj ou plus simplement « f de
i si j »

15
II) LES CARACTERISTIQUES DES SERIES A DEUX CARACTERES

A) LES CARACTERISTIQUES DES LOIS MARGINALES

1) Caractéristiques marginales du caractère x


Les caractéristiques marginales du caractère x (moyenne et variance) s'obtiennent à
partir de la distribution marginale de x c'est-à-dire à partir des k modalités (xi) et des k
effectifs marginaux (ni.)

a) La moyenne marginale𝑥̿
C'est une moyenne arithmétique notée 𝑥̿ qui se lit «x double barre».

1
𝑥̿ = ∑ 𝑛𝑖 . 𝑥𝑖
𝑛. .
𝑖
Avec
𝑛. . = ∑ 𝑛𝑖 .
𝑖
L'effectif marginal ni. étant une somme, on peut écrire:

1
𝑥̿ = ∑𝑖 ∑𝑗 𝑛𝑖𝑗 𝑥𝑖 Avec 𝑛. . = ∑𝑖 ∑𝑗 𝑛𝑖𝑗
𝑛..

b) La variance marginale de x (V(x))

𝟏
𝑽 (𝒙 ) = ̿ )𝟐
∑ 𝒏𝒊 . (𝒙𝒊 − 𝒙
𝒏. .
La formule développée est:
𝟏
𝑽(𝒙) = ∑ 𝒏𝒊 . 𝒙𝒊 𝟐 − 𝒙
̿𝟐
𝒏. .

L'écart type (𝜎) est égal à la racine carrée de la variance.

𝜎𝑥 = √𝑉(𝑥)

2) Caractéristiques marginales du caractère y

Les caractéristiques marginales du caractère y s'obtiennent àpartirdes1modalitésyjet des l


effectifs marginaux (n.j).
La moyenne 'écrit

1
𝑦̿ = ∑ 𝑛.𝑗 𝑦𝑗
𝑛. .
𝑗
Ou
1
𝑦̿ = ∑ ∑ 𝑛𝑖𝑗 𝑦𝑗
𝑛. .
𝑗 𝑖

La variance s'écrit
𝟏
𝑽(𝒚) = ̿ )𝟐
∑ 𝒏.𝒋 (𝒚𝒋 − 𝒚
𝒏. .

Ou la formule développée

𝟏
𝑽(𝒚) = ∑ 𝒏.𝒋 𝒚𝒋 𝟐 − 𝒚
̿𝟐
𝒏. .

Et

𝜎𝑦 = √𝑉(𝑦)

B) LES CARACTERISTIQUES DES LOIS CONDITIONNELLES

Les lois ou distributions conditionnelles sont au nombre de 2: celle de x selon y (où y


est fixé et où x varie) et celle de y selon x (où x est fixé, et où y varie).

1) Caractéristiques conditionnelles de x selon y

a) Définition
Pour calculer les caractéristiques conditionnelles de x selon y (moyenne, variance,
écart type), il faut se référer aux lois conditionnelles de x selon y, c'est-à-dire aux
k modalités de x et aux 1 colonnes d'effectifs, du tableau à double entrée.
Il y a au total l distributions conditionnelles de x selon y. On appelle lois
conditionnelles de x selon y les colonnes d'effectifs du tableau de contingence
associées aux modalités de x.
b) Moyennes conditionnelles de x selon y

On compte1moyennesconditionnelles de x selon y (ou de x si y).Elles se notent̅̅̅


𝑥𝑗

1
x̅j = ∑i nij xi avec 1≤𝑗≤𝐿
n.j

𝑥̅𝑗 est la moyenne conditionnelle de x, si y = yj

c) Variances conditionnelles de x selon y

Les variances conditionnelles de x selon y (ou de x si y), au nombre de1, se notent


Vj (x).

𝟏
𝑽𝒋 (𝒙) = ̅ 𝒋 )𝟐
∑ 𝒏.𝒋 . (𝒙𝒊 − 𝒙
𝒏.𝒋

La formule développée est

𝟏 𝟐
𝑽 𝒋 (𝒙 ) = ∑ 𝒏𝒊 . 𝒙𝒊 𝟐 − 𝒙
̅𝒋
𝒏.𝒋
𝒊

2) Caractéristiques conditionnelles de y selon x

Elles sont obtenus à partir des l modalités de y et à partir desk lignes d'effectifs partiels
du tableau à double entrée. Tout comme pour les distributions conditionnelles de x si y,
on dénombre autant de moyennes, de variances et d'écart type que de distributions
conditionnelles

1
y̅i = ∑ nij yj
n𝑖 .
j

𝟏
𝑽𝒊 (𝒚) = ̅ 𝒊 )𝟐
∑ 𝒏.𝒋 (𝒚𝒋 − 𝒚
𝒏𝒊 .
La formule développée est
𝟏
𝑽𝒊 (𝒀) = ∑ 𝒏𝒊𝒋 𝒀𝒋 𝟐 − 𝒀
̅𝟐
𝒏𝒊.
C) RELATIONS ENTRE LES CARACTERISTIQUES MARGINALES ET
CONDITIONNELLES

- Relations entre les moyennes marginales et conditionnelles

La moyenne marginale est égale à la moyenne des moyennes conditionnelles


pondérées par les effectifs marginaux.

1
𝑥̿ = ∑ 𝑛.𝑗 𝑥̅𝑗
𝑛. .
𝑗

1
𝑦̿ = ∑ 𝑛𝑖 . 𝑦̅𝑖
𝑛. .
𝑖

- Relations entre les variances


La variance marginale est égale à la moyenne des variances conditionnelles
augmentée de la variance pondérée des moyennes conditionnelles.

𝟏 𝟏
𝑽(𝒙) = ∑ 𝒏.𝒋 (𝒙 ̿ )𝟐 +
̅𝒋 − 𝒙 ∑ 𝒏.𝒋 𝑽𝒋 (𝒙)
𝒏. . 𝒏. .
𝒋 𝒋

Variance des moyennes Conditionnelles ̅𝒋


𝒙 + Moyenne des variances
conditionnelles 𝑽𝒋 (𝒙)

La variance peut encore se noter

̅𝒋 ) + ̅̅̅̅̅̅̅̅
𝑽(𝒙) = 𝑽(𝒙 𝑽𝒋 (𝒙)

𝟏 𝟏
𝑽(𝒚) = ∑ 𝒏𝒊 . (𝒚 ̿ )𝟐 +
̅𝒊 − 𝒚 ∑ 𝒏𝒊 . 𝑽𝒊 (𝒚)
𝒏. . 𝒏. .
𝒊 𝒊

̅𝒊 ) + ̅̅̅̅̅̅̅̅
𝑽(𝒚) = 𝑽(𝒚 𝑽𝒊 (𝒚)

D) LES MOMENTS ET LA COVARIANCE

1) Les moments des séries à deux caractères


Nous choisirons ici1'ordre «r» pour la variable x et1'ordre «s» pour la variable y.

Moments simples d'ordre r et s

1
𝑚𝑟,𝑠 = ∑ ∑ 𝑛𝑖𝑗 𝑥𝑖𝑟 𝑦𝑗𝑠
𝑛. .
𝑖 𝑗

𝑚1,0 = 𝑥̿
m0,1 = y̿
m2,0 et m0,2 sont utilisées pour le calcul de la variance dans la formule développée.

Moments centrés d'ordre r et s

Ils sont centrés sur les moyennes marginales 𝑥̿ et𝑦


̿
1
𝜇𝑟,𝑠 = ∑ ∑ 𝑛𝑖𝑗 ( 𝑥𝑖 − 𝑥̿ )𝑟 (𝑦𝑗 − 𝑦̿)𝑠
𝑛. .
𝑖 𝑗
Le moment centré d'ordre 1,1,
μ1,1 est une caractéristique fondamentale dans l'étude des séries à 2 variables, c'est
la covariance.

2) La covariance

On appelle covariance de 2 variables statistiques x et y (notée Cov(x, y)), le moment


centré d'ordre 1,1

1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̿ ) (𝑦𝑗 − 𝑦̿)
𝑛. .
𝑖 𝑗
Cov(x, y)=μ1,1

Si y=x on retrouve la formule de la variance de x. Cov(x, x) = V(x).

Pour faciliter les calculs, on utilise souvent la formule développée.

1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 𝑥𝑖 𝑦𝑗 − 𝑥̿ 𝑦̿
𝑛. .
𝑖 𝑗

On utilise aussi pour faciliter les calculs les changements de variables.


𝑥𝑖 −𝑥0 𝑦𝑗 −𝑦0
𝑋𝑖′ = 𝑌𝑗′ =
𝜎 𝛽

𝑥𝑖 = 𝜎𝑋𝑖′ + 𝑥0 𝑦𝑗 = 𝛽𝑌𝑗′ + 𝑦0

𝑋̿ = 𝜎𝑥̿′ + 𝑥0 𝑌̿ = 𝛽𝑦̿′ + 𝑦0

Par soustraction
𝑥𝑖 − 𝑋̿ = 𝜎(𝑋𝑖′ − 𝑥̿′ ) 𝑦𝑗 − 𝑌̿ = 𝛽(𝑌𝑗′ − 𝑦̿′ )

Par conséquent

1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̿ )(𝑦𝑗 − 𝑦̿)
𝑛. .
𝑖 𝑗
1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 𝜎(𝑋𝑖′ − 𝑥̿′ )𝛽(𝑌𝑗′ − 𝑦̿′ )
𝑛. .
𝑖 𝑗

𝜎𝛽
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 (𝑋𝑖′ − 𝑥̿′ )(𝑌𝑗′ − 𝑦̿′ )
𝑛. .
𝑖 𝑗

𝐶𝑜𝑣 (𝑥, 𝑦) = 𝜎𝛽𝐶𝑜𝑣(𝑥 ′ , 𝑦 ′ )

E) CALCUL PRATIQUE DES CARACTERISTIQUES DES SERIES A DEUX


DIMENSIONS

Le principe de calcul consiste à ajouter des colonnes et des lignes, en bon ordre, au
tableau de contingence.
xi yj y1 y2 y3 y4 ni. ni.xi ni.xi2  nijyj  nijyj2  nijxiyj
x1
x2
x3
x4
x5
n.j
n.jyj
n.jyj2
 nijxi
 nijxi2
 nijxiyj

Les 3 premières lignes et colonnes ajoutées au tableau de contingence servent pour le


calcul des moyennes et des variances marginales.
Les 2 d'après servent au calcul des moyennes et variances conditionnelles. La
dernière et les coins dans le tableau pour la covariance.

F) LES COURBES DE REGRESSION

De façon générale la représentation graphique des séries à 2 dimensions se présente


sous forme de nuage de points. Les courbes de régression ont pour objet de résumer ces
nuages de points.

La représentation normale de ces séries devrait se faire sur des espaces à 3 dimensions
ce qui présente quelques difficultés. On cherche alors une méthode qui permette de
résumer le nuage de points dans un plan.
Ainsi donc au lieu de faire correspondre à chaque xi, la valeur yj et1'effectif nij
correspondants, on lui fait correspondre une valeur qui fait la synthèse de yj et de nij et
cette valeur est la moyenne conditionnelle de y liée par x = xi c'est-à-dire yi.

De la même manière on fait correspondre à chaque yj la valeur xj. On obtient ainsi 2


lignes polygonales qui se nomment courbes de régression.
REGRESSION, AJUSTEMENT ET CORRELATION

1) ETUDE DE LA RELATION ENTRE DEUX VARIABLES

Il existe 3 types de liaison entre les variables.

A) La liaison totale ou liaison fonctionnelle réciproque

Il y a liaison totale entre les valeurs y et x lorsqu'à chaque valeur de xi, correspond une
valeur déterminée yj, et réciproquement. Exemple : le périmètre du cercle dépend de son
rayon. La connaissance de l'un entraine celle de l'autre.
Dans ce cas la moyenne conditionnelle 𝑦 ̅̅̅liée
𝑗 par xj, est égale à yJ

𝑥̅𝑗 = 𝑥𝑖 et ̅̅̅
𝑦𝑖 =yJ

Les moyennes conditionnelles sont donc égales aux valeurs des variables.

En effet, lorsque la liaison fonctionnelle est réciproque ou totale, un seul chiffre figure par
ligne et par colonne dans le tableau de contingence.

X et Y ont donc le même nombre de modalités et


1
𝑥̅𝑗 = ∑ 𝑛𝑖𝑗 𝑥𝑖
𝑛.𝑗
𝑖

mais ici nij = n.j on peut donc dire que

1
𝑥̅𝑗 = ∑ 𝑛.𝑗 𝑥𝑖
𝑛.𝑗
𝑖

𝑛.𝑗
𝑥̅𝑗 = ∑ 𝑥𝑖
𝑛.𝑗
𝑖

∑ i x i = xi puisque xi est unique, il n'y a qu'un seul terme par colonne.

En conclusion
𝑥̅𝑗 = 𝑥𝑖 𝑒𝑡 𝑦̅𝑖 = 𝑦𝑗
1 2 3 ni.
coté

Surface du carré
1 3 3
4 8 8
9 10 10
n.j 3 8 10 21

La liaison fonctionnelle n'est pas forcément réciproque.

B) Liaison nulle ou indépendance totale

Dans le cas de l'indépendance des 2 variables x et y, la connaissance de la valeur de l'une


des variables, x par exemple, n'apporte aucune information supplémentaire sur la
distribution de l'autre et, en particulier sur la moyenne de celle-ci.

Exemple: Le salaire d'un employé et sa taille.

Dans le cas de l'indépendance des 2 variables les distributions conditionnelles de chacune


des 2 variables sont identiques à la distribution marginale correspondante et, par
conséquent, identiques entre elles.

𝑥̅𝑗 = 𝑥̿ 𝑦̅𝑖 = 𝑦̿

Il en résulte que pour chacune des variables les moyennes conditionnelles sont égales
entre elles et égales à la moyenne marginale.

Les courbes de régression sont donc 2 droites parallèles aux axes de coordonnées.
Y1 Y2 Y3 m.

Xl 1 3 9 13
X2 2 6 18 26
X3 3 9 27 39
n.J 6 18 54 78

On dit de 2 variables x et y qu'elles sont indépendantes si les fréquences conditionnelles


fij sont égales pour un « i »fixé, c'est-à-dire si les fréquences conditionnelles de i selon j
ne dépendent pas de j dans la dite distribution et inversement.

𝑛𝑖1 𝑛𝑖2 𝑛𝑖3 𝑛𝑖𝑗 𝑛𝑖𝑙


𝑓𝑖/𝑗 = = = =⋯= =
𝑛.1 𝑛.2 𝑛.3 𝑛.𝑗 𝑛.𝑙

𝑛𝑖1 + 𝑛𝑖2 + 𝑛𝑖3 + ⋯ + 𝑛𝑖𝐽 + ⋯ + 𝑛𝑖𝑙


𝑓𝑖/𝑗 =
𝑛.1 + 𝑛.2 + 𝑛.3 + ⋯ + 𝑛.𝐽 + ⋯ + 𝑛.𝑙

∑𝑗 𝑛𝑖𝑗 ∑ 𝑛𝑖
𝑓𝑖/𝑗 = = = 𝑓𝑖 .
∑ 𝑛.𝑗 𝑛. .

Et
𝑓𝑖/𝑗 = 𝑓𝑖 .

Et
𝑓𝑖/𝑗 = 𝑓.𝑗

On en déduit que
1
𝑥̿ = ∑ 𝑛𝑖 𝑥𝑖 = ∑ 𝑓𝑖 . 𝑥𝑖
𝑛

Si nous substituons à fi. sa valeur fi/j nous obtenons

∑ 𝑛𝑖𝑗
𝑥̿ = ∑ 𝑓𝑖/𝑗 𝑥𝑖 = 𝑥𝑖
𝑛.𝑗

1
𝑥̿ = ∑ 𝑛𝑖𝑗 𝑥𝑖
𝑛.𝑗

1
𝑥̿ = ∑ 𝑛𝑖𝑗 𝑥𝑖 = 𝑥̅𝑗
𝑛.𝑗
Et

𝑥̿ = 𝑥̅𝑗 𝑒𝑡 𝑦̅ = 𝑦̅𝑖

Si les moyennes marginales sont égales aux moyennes conditionnelles il y a


indépendance entre les variables.

C) Corrélation et liaison relative

Sans qu'une loi rigoureuse préside à leurs relations, il existe une certaine
dépendance entre les variables étudiées. Cette situation est très fréquente
notamment dans le domainede1'économie et de la gestion: épargne et revenu,
consommation et revenu.

Les caractères sont dépendants l'un de l'autre, mais la connaissance de l'un ne


donne pas exactement celle de l'autre.

Lorsque les variations des 2 phénomènes se produisent dans le même sens on dit
que la corrélation est directe ou positive.

Lorsque les variations sont de sens contraire, on dit que la corrélation est
inverse ou négative.

Lorsque les courbes de régression sont des droites non parallèles aux
axes de coordonnées il y a corrélation linéaire.

y y
Corrélation positive x Corrélation négative x
II) L'AJUSTEMENT LINEAIRE

C'est une méthode souvent utilisé dans l'analyse et la prévision des phénomènes
économiques.

Les séries à deux dimensions ont une représentation graphique qui se présente souvent
sous forme de nuage de points.

Mais si suite à une représentation graphique les points représentés donnent une
configuration assez régulière, une droite(ou une courbe), par exemple, le statisticien
peut envisager de représenter les points, le nuage de point ou la courbe de régression
par une droite(ou une courbe).

Si dans la distribution représentée dans un système d'axe (perpendiculaire) à échelle


arithmétique (en prenant la même unité sur les 2axes), on constate que les points(Mi)
sont sensiblement alignés, on peut considérer que les valeurs yi sont les valeurs
approchées d'une fonction linéaire de xi.

Soit y = ax + b la droite
d'ajustement.

Il s’agit de déterminer les paramètres a et b

A) Méthode graphique ou
empirique
On promène par exemple sur le graphique une règle transparente, en se servant
du bord de la règle pour matérialiser la droite. En tâtonnant on essaie de situer
de la manière la plus satisfaisante la droite qui passe au travers des points Mi.
Au jugé, on essaie de choisir la droite de telle sorte que la somme algébrique
des écarts (di) à la droite adoptée soit nulle, sinon minima.

On peut aussi utiliser une feuille de papier transparent sur laquelle a été tracé un
ensemble de droites parallèles régulièrement espacées de part et d'autre d'une droite
centrale. Si nous apposons la feuille de papier transparent sur la représentation
graphique à ajuster, on trouvera aisément la position de la droite d'ajustement,
c'est-à-dire la droite centrale de l'ensemble des droites, situé de telle sorte que les
points à ajuster se répartissent équitablement de part et d'autre de cette droite, et à
l'intérieur du réseau des parallèles.
Cette méthode est évidemment subjective, mais en pratique elle donne de très
bon.s.résultats.

La droite étant tracée, on choisit 2 points quelconques de cette droite,


suffisamment espacés. On détermine par simple lecture sur les axes, les
30
coordonnées de ces points :

Exemple:

𝑥𝐴 𝑥𝐵
(𝐴| ) (𝐵| )
𝑦𝐴 𝑦𝐵

On en déduit1'équation de la droite «empirique»

𝑦𝐴 − 𝑦𝐵 𝑥𝐴 𝑦𝐵 − 𝑦𝐴 𝑥𝐵
𝑌= 𝑥+
𝑥𝐴 − 𝑥𝐵 𝑥𝐴 − 𝑥𝐵

Ou par la résolution du système d'équation

𝑦𝐴 = 𝑎𝑥𝐴 + 𝑏
{
𝑦𝐵 = 𝑎𝑥𝐵 + 𝑏

B) Méthode de Mayer

Le principe de la méthode est de diviser l'ensemble des points à ajuster en 2 sous-


ensembles égaux, de même effectif, dans l'ordre où les points se présentent(ou à
une observation près si le nombre total des observations est impair.)
On remplace alors chacun des 2 sous-ensembles par le point dont les coordonnées
sont les suivantes:
En abscisse la moyenne arithmétique des abscisses des points du sous-groupe.
En ordonnées la moyenne arithmétique des ordonnées des points du sous-groupe.

La droite de Mayer passe par ces 2 points. C'est la droite d'ajustement dont
1'équation est facile à déterminer.

Exemple: Soit la série suivante:

Xi yi
2 7
4 10
6 13
8 15
9 20
13 28

31
Divisons-la en 2 sous-ensembles égaux de 3points.
Les coordonnées des 3 premiers points du tableau sont:
2+4+6
A en abscisse : =4
3

7+10+13
en ordonnée: = 10
3

𝑥=4
(𝐴| )
𝑦 = 10

Les coordonnées des 3 derniers points

B en abscisse

8 + 9 + 13
= 10
3
En ordonnée:
15 + 20 + 28
= 21
3
𝑥 = 10
(𝐵| )
𝑦 = 21
La droite de Mayer recherchée passe par ces 2 points de coordonnées (4;10) et (10;21)
L’équation de Mayer de la forme y = ax + b sera obtenue par la détermination de a et
de b dans le système d'équation

10 = 4a + b
{
21 = 10a + b

a = 1,83 b = 2,67
La droite d'équation de Mayer a donc pour équation

Y = 1,83x + 2,67
(La méthode empirique donne 1,8x + 2,8)
On peut aussi procéder de la façon suivante:

Si di= yi-(axi+b) on divise la série des di en 2 sous-ensembles d'effectifs égaux à


l'unité près.

Pour chacun on fait di= 0

32
∑ 𝑑𝑖 = 0
1

∑ 𝑑𝑖 = 0
{ 2

Exemple:

𝑑𝑖 = 𝑦𝑖 − (𝑎𝑥𝑖 + 𝑏)

𝑦1 − (𝑎𝑥1 + 𝑏) 𝑦4 − (𝑎𝑥4 + 𝑏)

𝑦2 − (𝑎𝑥2 + 𝑏) 𝑦5 − (𝑎𝑥5 + 𝑏)

𝑦3 − (𝑎𝑥3 + 𝑏) 𝑦6 − (𝑎𝑥6 + 𝑏)

∑ 𝑦𝑖1 − (∑ 𝑎𝑥𝑖1 + 𝑛1 𝑏) ∑ 𝑦𝑖2 − (∑ 𝑎𝑥𝑖2 + 𝑛2 𝑏)

∑ 𝑦𝑖1 − (∑ 𝑎𝑥𝑖1 + 𝑛1 𝑏) = 0
{
∑ 𝑦𝑖2 − (∑ 𝑎𝑥𝑖2 + 𝑛2 𝑏) = 0

Reprenons1'exemple antérieur

7-(2a+ b) 15 - (8a+b)
10 - (4a + b) 20 - (9a+b)
13 - (6a +b) 28-(13a+b)
30 - (12a + 3b) 63 - (30a + 3b)

30 − (12𝑎 + 3𝑏) = 0
{
63 − (30𝑎 + 3𝑏) = 0
Si nous divisons les 2 équations par 3 nous obtenons le système antérieur.

10 - (4a + b) = 0
21 - (10a + b) = 0

C) Ajustement linéaire par la méthode des moindres carrés

Dans 1'ajustement linéaire par la méthode des moindres carrés, il est


question de déterminer en lieu et place des courbes de régression 2 droites telles
que pour chacune d'elles, les distances prises entre chaque point du nuage et la
droite soient les plus petites possibles. Ces 2 droites portent le nom de «droites de
régression», «droites d'ajustement» ou« droites des moindres carrés».

1) Cas où les observations sont individualisés

La droite d'ajustement de Y en X

Y = a x +b passe par le point moyen(x, y) et a pour pente

Cov(x, y) ∑(xi − x̅)(yi − y̅) ∑(xi − x̅)(yi − y̅)


a= = =
σ2x ∑(xi − x̅)2 ∑ xi 2 − nx 2

𝑏 = 𝑦̅ − 𝑎𝑥
̅̅̅

De même la droite d'ajustement de x en y


X = a' y + b' passe par le point moyen (𝑥̅ , 𝑦̅) et a pour pente

Cov(x, y) ∑(xi − x̅)(yi − y̅)


a′ = =
σ2y ∑(yi − y̅)2

𝑏′ = 𝑥̅ − 𝑎𝑦̅

Pour faciliter le calcul des coefficients de la droite d'ajustement, on peut procéder à un


changement d'origine.

2) Cas où les observations sont groupés

Lorsque les observations sont groupées par classe, on retient généralement pour
variables statistiques dans les calculs, les centres xi, yj de chaque classe

La droite d'ajustement de y en x, y = a x + b passe par le point moyen (𝑥̿ , 𝑦̿) et a


pourpente
Cov(x, y) ∑ ∑ 𝑛𝑖𝑗 (xi − 𝑥̿ )(yi − 𝑦̿)
a= =
𝑉(𝑥) ∑ 𝑛𝑖 . (xi − 𝑥̿ )2

𝑏 = 𝑦̅ − 𝑎𝑥̿
Demême la droite d'ajustement de x en y,

x= a'y + b' passe par le point moyen (x, y) et a pour pente

Cov(x, y) ∑ ∑ 𝑛𝑖𝑗 (𝑥̅𝑖 − x)(y̅j − y)


a′ = =
𝑉(𝑦) ∑ 𝑛.𝑗 (y𝑗 − 𝑦̿)2

𝑏′ = 𝑥̿ − 𝑎𝑦̿
Récapitulons
L'équation de la droite d'ajustement de y en x de la forme y = a x +b
(puisque 𝑏 = 𝑦̅ − 𝑎𝑥̿ ) est

Cov(x, y) Cov(x, y)
Y= x + 𝑦̅ − 𝑥̿
𝑉(𝑥) 𝑉(𝑥)
Ce qui donne
Cov(x, y)
Y = 𝑦̅ + (𝑥 − 𝑥̿ )
𝑉 (𝑥 )
Ou
𝐶𝑜𝑣(𝑥,𝑦)
Y−𝑦̅ = (𝑥 − 𝑥̿ ) et pour l’équation de la droite d’ajustement de x en y de la
𝑉(𝑥)

forme x=a’y+b’ (sachant que 𝑏′ = 𝑥̅ − 𝑎′𝑦̅ On obtient


Cov(x, y) Cov(x, y)
x= y + 𝑥̅̅ − 𝑦̿
𝑉(𝑦) 𝑉(𝑦)
Ce qui donne

Cov(x, y)
x − 𝑥̅̅ = (y − 𝑦̿)
𝑉 (𝑦 )

III) LE COEFFICIENT DE CORRELATION LINEAIRE

Le coefficient de corrélation linéaire a pour objet de mesurer l'intensité de la liaison


linéaire entre les 2 variables x et y.

A) Définition
Le coefficient de corrélation linéaire r entre x et y se définit par le rapport

𝐶𝑜𝑣(𝑥, 𝑦)
𝑟=
𝜎𝑥 𝜎𝑦
Ou 𝑟 = ±√𝑎𝑎′
Ce coefficient caractérise aussi bien l'intensité de la liaison de y en x, que de x en y.

B) Relations existant entre le coefficient de corrélation linéaire et les droites


d'ajustement

36
1) Droite d'ajustement de y en x

𝐶𝑜𝑣(𝑥, 𝑦)
𝑎=
𝑉(𝑥)

𝐶𝑜𝑣(𝑥,𝑦)
Sachant 𝑟 =
𝜎𝑥 𝜎𝑦

On peut dire
𝜎𝑦 𝜎𝑥
𝑎=𝑟 ou 𝑟=𝑎
𝜎𝑥 𝜎𝑦

2) Droite d'ajustement de x en y

𝐶𝑜𝑣(𝑥,𝑦) 𝜎𝑦 𝜎𝑦
𝑎′ = 𝑟= ou 𝑟 = 𝑎′
𝜎𝑦2 𝜎𝑥 𝜎𝑥

C) Propriétés

1) Si les variables x et y sont indépendants le coefficient de corrélation linéaire est égal à


O. C'est que lorsque 2 variables sont indépendantes Cov(x,y) = 0 (en raison de la
propriété qui dit que la covariance de 2 variables aléatoires indépendantes est nulle
D'où
𝐶𝑜𝑣(𝑥, 𝑦)
𝑟= =0
𝜎𝑥 𝜎𝑦

 Cependant r = 0 n'entraîne pas forcément l'indépendance de x et de y. ll indique


seulement que les 2 droites d'ajustement sont parallèles aux axes de coordonnées.

2) Le coefficient de corrélation linéaire est compris entre -1 et +1

-1 ≤ 𝑟 ≤ 1

Il est positif dans le cas où les variables varient dans le même sens et négatif dans le cas
où les variables varient en sens contraire.

3) Si les 2 variables x et y sont liées par une relation fonctionnelle linéaire, le coefficient
de corrélation linéaire est égal à -1 ou à +1

37
𝑐𝑜𝑣(𝑥,𝑦)
r=1 si a > 0 𝑎= >0
𝜎𝑥2

𝐶𝑜𝑣(𝑥,𝑦)
r = -1 si a < 0 𝑎= <0
𝜎𝑥2

4) Entre ces 2 extrêmes, absence de corrélation ou liaison fonctionnelle,


le coefficient de corrélation permet de mesurer la plus ou moins
grande dépendance linéaire entre 2 variables statistiques.
Il ya forte corrélation entre x et y (on dit encore une forte
dépendance linéaire) si r est proche de + 1 ou de - 1.

Quand r = 0, cela fait penser à une indépendance, mais il est nécessaire de le contrôler par
l'interprétation des phénomènes réels.

Le coefficient de corrélation linéaire n'a de sens, et ne doit donc être employé, que dans le
cas où la liaison entre les 2 variables peut être considérée comme approximativement
linéaire.
Le coefficient de corrélation linéaire ne varie pas si on procède à un changement d'origine
et d'échelle. C'est un nombre sans dimension.

Pour le calcul pratique de r, on utilise soit la formule de définition

𝑟 = √𝑎𝑎′
Avec
𝐶𝑜𝑣(𝑥, 𝑦)
𝑎=
𝑉(𝑥)
𝐶𝑜𝑣(𝑥, 𝑦)
𝑎′ =
𝑉(𝑦)

Soit par les formules développées de la covariance et


des variances.

IV) CORRELATION NON LINEAIRE: RAPPORT DE CORRELATION

Lorsque la régression est représentée par 2 droites ou lorsqu'on procède par ajustement
linéaire a ramené les nuages de points, ou la courbe de régression en une représentation
linéaire, on se retrouve en linéaire, et on peut aisément utiliser le coefficient de
corrélation r pour calculer l'intensité de la liaison.
Mais il arrive que la représentation donne une liaison non linéaire (logarithmique,
exponentiel, etc.), on va dans ce cas chercher à partir des courbes de régression un
nombre sans dimension capable de nous renseigner sur l'intensité de la liaison.
C'est le rapport de corrélation.
Nous avons vu que la variance marginale est la somme de la variance des moyennes
conditionnelles et de la moyenne des variances conditionnelles.

1 2 1
V(x) = ∑ 𝑛.𝑗 (x̅j − 𝑥̿ ) + ̅̅̅
∑ 𝑛.𝑗 𝑉𝑗 (𝑥)
𝑛. . 𝑛. .

Variance des moyennes conditionnelles (x̅)


j + moyenne des variances conditionnelles
(Vj(x))

Variance expliquée + variance résiduelle

̅̅̅
Autre notation : V(x)=V(x̅𝑗 )+𝑉𝑗 (𝑥)

Le premier terme

1 2
V(x̅𝑗 ) = ∑ 𝑛.𝑗 (x̅j − 𝑥̿ )
𝑛. .

Exprime la part de la variance marginale qui est expliquée par la variation des
moyennes conditionnelles x̅,
j c'est-à-dire par la courbe de régression de x en y 𝐶𝑥 . Elle
𝑦
traduit la dispersion des moyennes conditionnelles entre elles. On 1'appelle variance
expliquée par la régression

Le second terme

1
̅̅̅
∑ 𝑛.𝑗 𝑉𝑗 (𝑥)
𝑛. .

Mesure au contraire la part de la variance marginale qui résulte de la dispersion des points
(xi,yj) autour d la courbe de régression, c’est la variance résiduelle qui n’est pas expliquée
par la régression. C’est la variance qui reste après avoir effectué la régression. (C’est la
dispersion qui n’est pas résumé par la courbe de régression de x en y C x/y). On l’appelle
variance résiduelle.

C’est à partir de cette décomposition que se définit le rapport de corrélation.


Définition

Le rapport de corrélation noté 2 (êta carré) est le rapport de la variance expliquée sur la
variance marginale

𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑒𝑥𝑝𝑙𝑖𝑞𝑢é𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑟é𝑠𝑖𝑑𝑢𝑒𝑙𝑙𝑒


2 = =1−
𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑡𝑜𝑡𝑎𝑙𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑐𝑒 𝑡𝑜𝑡𝑎𝑙𝑒
(Il est parfois appelé coefficient de détermination)

Il y a 2 rapports de corrélation

 Le rapport de corrélation de x en y

𝑉(𝑥̅𝑗 ) ∑ 𝑛.𝑗 (𝑥̅𝑗 − 𝑥̿ )2


2𝑥/𝑦 = =
𝑉(𝑥) ∑ 𝑛𝑖 . (𝑥̅𝑖 − 𝑥̿ )2

Autres annotations 2𝑥,𝑦

1
∑ 𝑛.𝑗 𝑉𝑗 (𝑥)
2𝑥/𝑦 = 1 − 𝑛..
𝑉(𝑥)

Le rapport de corrélation de y en x

𝑉(𝑦̅𝑖 ) ∑ 𝑛𝑖 . (𝑦̅𝑖 − 𝑦̿)2


2𝑦/𝑥 = =
𝑉(𝑦) ∑ 𝑛.𝑗 (𝑦𝑖 − 𝑦̿)2
1
̅̅̅
∑ 𝑛𝑖 . 𝑉𝑖 (𝑥)
2𝑦/𝑥 =1− 𝑛..
𝑉(𝑦)

Par construction 0 ≤ 2 ≤ 1

Trois cas peuvent se présenter

1er cas 2𝑦/𝑥 = 0 Ce qui veut dire que 𝑉(𝑥


̅̅̅̅
𝑗) = 0

Il ya absence de corrélation entre x et y. En effet en l'absence de corrélation de x avec y la


courbe de régression de x en y est une droite parallèle à 1'axe des ordonnées. Toutes les
moyennes conditionnelles de̅̅̅xj sont égales entre elles et à la moyenne marginale x̅
La variance des moyennes conditionnelles

1 2
V(x̅𝑗 ) = ∑ 𝑛.𝑗 (x̅j − 𝑥̿ )
𝑛. .

est donc nulle et le rapport de corrélation2𝑦/𝑥 = 0

2eme cas 2𝑦 = 1 c'est-à-dire que 𝑉(𝑥


̅̅̅̅
𝑗 ) = 𝑉(𝑥) et la régression de xen y explique
𝑥
entotalitélaliaisonentrexet y. On est en présence d'une liaison fonctionnelle dexen y.

Pour 2𝑦/𝑥 = 1 également,


y on parle de double liaison fonctionnelle réciproque.

3ème cas : c’est le cas général

Plus 2𝑥/𝑦 se rapproche de 1 plus il y a liaison forte entre x et y ;


Plus 2𝑦/𝑥 se rapproche de 1, plus il y a liaison forte entre y et x.
• Le rapport de corrélation 2𝑥/𝑦 (ou2𝑦/𝑥 ) constitue une mesure de 1'intensité de
la liaison d'une variable x avec une variable y. Il satisfait l'égalité0 ≤ 2𝑥/𝑦 ≤ 1•
Le carré du coefficient (r2) est toujours inférieur aux valeurs du rapport de
corrélation 0 ≤ 𝑟 2 ≤ 2𝑥/𝑦 ≤ 1
 Le rapport de corrélation ne varie pas si on procède à un changement
d'origine et d'échelle. On dit qu'il est invariant par rapport à un
changement d'origine et d'unité.
 L'un des avantages du rapport de corrélation  2 est de pouvoir
raisonner en non linéaire et d'être plus proche de la véritable
configuration des points.
 On détermine 2 rapports de corrélation  2 contre un seul coefficient de
corrélation r. (Le coefficient de corrélation r est symétrique par
rapport à x et y).
 Lorsque 𝑟 2 = 2𝑥/𝑦 la linéarité en x est « de fait » il y a corrélation linéaire entre x et
y

Si 𝑟 2 = 2𝑥/𝑦 = 2𝑦/𝑥 On dit qu'il y a double corrélation linéaire.


 Un avantage de 2 tient au fait que r2 peut être nul, alors que 2 peut se
rapprocher de 1 et faire apparaitre une corrélation non linéaire cachée.
LES SERIES CHRONOLOGIQUES

I) PRESENTATION ET ANALYSE THEORIQUE DES SERIES


CHRONOLOGIQUES

A) GENERALITES

1) Définition d'une série chronologique


On appelle série chronologique, série temporelle ou chronique une série
d'observations chiffrées ordonnées dans le temps.

Le phénomène dont on suit l'évolution peut être un flux ou un stock (niveau):


Production, consommation, population, etc.

Dans le cas d'un niveau, chaque observation se rapporte à une date. Dans le cas d'un
flux, chaque observation se rapporte à une période : flux écoulé pendant la période.

Le temps est habituellement repéré par 1'indice t, porté en abscisse. Il est repéré en
année, trimestre, mois, jours, etc.
La variable étudiée, notée y, est portée en ordonnée sur les graphes rectangulaires.
Les séries chronologiques sont donc des distributions statistiques à 2 caractères dont
1'un est le temps.
Mais en 1'absence de pondération, le tableau se réduit à 2 colonnes. La variable est
donc liée fonctionnellement à la variable «temps ». A chaque date correspond une et
une seule valeur d’y, mais pas 1'inverse.
Le « temps» noté t prend les valeurs ti avec i variant de 1 à n
Et la variable y prend les valeurs ti
y = f(t) .
2) Représentations graphiques
a) Graphiques à échelle arithmétique (sur coordonnées rectangulaires)
Le temps est porté en abscisses et les variables en ordonnées. Les points obtenus sont
reliés par un segment de droite et jamais par une courbe. L'établissement de ce
graphique ne présente pas de difficultés particulières. L'échelle des ordonnées devra
être prise aussi grande que possible, afin qu'apparaissent nettement les variations du
phénomène et que le graphe ne soit trop aplati.

On remarque (assez difficilement du reste) une tendance générale à la hausse sur les
3 années. ··.

b) Les graphiques semi logarithmiques


L'échelle logarithmique s'emploie
 Lorsqu'il existe de si grandes différences de valeurs entre les variables que pour la
représentation graphique 1'on pourrait sortir du graphe cartésien.
 Lorsqu'on veut mettre en valeur les variations relatives
 Lorsque des cumuls de taux de croissance, faisant apparaître des exponentielles,
doivent être représentés en linéaire.

Le papier semi-logarithmique est défini par une échelle arithmétique en abscisse et


une échelle logarithmique en ordonnée.
Sue l'axe des abscisses on peut faire le choix d'une origine et d'une unité de longueur
quelconque. En revanche sur 1'axe des ordonnées on ne peut modifier 1'unité de
longueur retenue par le constructeur du papier qui est déterminée par la longueur du
module : c'est la distance entre 2 valeurs dont le rapport est de 1 à 10. C'est
1'intervalle entre 2 graduations puissances de 10.
Au commerce les papiers semi-logarithmique vendus ont 3 ou 4 modules.

c) Les graphiques de coordonnées polaires


Sont surtout utilisés pour des variations de données mensuelles. (Déjà vu, voir
chapitre II, du premier semestre)
B) DECOMPOSITION DU MOUVEMENT BRUT ET LES
MODELES THORIQUES D'ANALYSE

1) Définitions des composantes

On a coutume de distinguer 3 composantes principales dans une série chronologique


Le mouvement extra-saisonnier ou encore mouvement conjoncturel
Correspond à l'évolution fondamentale à laquelle viennent se superposer les autres
composantes. On la divise souvent en 2 éléments:

Le trend: ou tendance séculaire à long terme. C'est la courbe (droite ici) qui
«résume» le phénomène. C'est elle qui ajuste l'ensemble des points de la ligne brisée.
(Elle «lisse» la série)

Le cycle: sur des périodes plus courtes (mais toujours de longues durées) on observe
des fluctuations autour du Trend de haut en bas qui se répètent, c'est le cycle. Le cycle
est donc le mouvement oscillatoire d'amplitude et de périodicité variables, la
périodicité étant supérieure à 1'année.
Les variations saisonnières sont des fluctuations périodiques s'inscrivant dans le
cadre de l'année et qui se reproduisent de façon plus ou moins identique d'une année à
l'autre.

Sur notre graphe on aperçoit des mouvements de pics et de creux successifs qui se
répètent, périodiquement, à des dates précises. C'est cette suite de pics et de creux qu'on
appelle variation saisonnière.

Les variations résiduelles ou accidentelles: Ce sont des fluctuations irrégulières et


imprévisibles, supposées en général de faible amplitude qui traduisent l'effet de facteurs
perturbateurs non permanents. Sur le graphe elles sont matérialisées par les pics et les
creux à caractères exceptionnelles.

2) Formalisation des composantes dans le cadre d’un « modèle idéal».


Celui vers lequel tend ou devrait tendre toutes les séries chronologiques. Mais dans la
Pratique elles s'écartent de celui-ci

a) Trend et mouvement cyclique:(ft)


Le trend représente le mouvement de longue période, il schématise la tendance
générale. En général il est supérieur à 6 années calendaires. On procède
habituellement à un ajustement pour déterminer l'expression analytique du
Trend. Il est p l u s souvent représenté par une droite de la forme y = at + b
obtenu par ajustement linéaire à partir des différentes valeurs du phénomène
étudié.
D'autres ajustements sont possibles (exponentielle, hyperbolique, etc.)
Le cycle n'est pas exprimé analytiquement, mais son évolution est confondue avec celle du
Trend

b) Les Variations saisonnières (St)


Les variations saisonnières sont des fluctuations périodiques plus ou moins régulières qui
se superposent au mouvement extra-saisonnier. Leur période peut être journalière,
hebdomadaire ou annuelle. Elles ont de multiples causes: cycle des saisons, mode de vie,
coutumes, dispositions règlementaires, etc., dont les effets se produisent sensiblement à
date fixe. Parmi les plus importantes on peut citer: les congés, 1’inégalité des différents
mois, les facteurs climatiques, la périodicité de1'offre et de la demande de certains
produits.

Dans le modèle idéal l'appréciation des variations saisonnières reposent sur 2 principes de
base

• Principe de la répétition à l'identique: On estime qu'il y a une composante


saisonnière dans une série, si chaque année, à la même période, il se produit une
variation du phénomène (d'au moins 25%), par rapport à sa valeur moyenne..
7
Dans le modèle idéal, on considère qu'il ya une répétition rigoureusement identique.

Sl = S5 = S9
S2 = S6 = Sl0
Si elle est donnée en mois
St = St+12
Si la période est P

St=St+p=St+2p=St+3p

• Principe de conservation des aires


Dans le modèle de référence, on considère que les fluctuations autour du Trend se
compensent et que par conséquent 1'aire délimitée par la ligne brisée déterminant la série
chronologique au-dessus du Trend est identique à celle au-dessous du Trend.
On conclut que par an l'influence des variations saisonnières est neutre (nulle).

c) Les variations accidentelles (t)


Ce sont les évènements exceptionnels, imprévisibles, impossibles ou difficiles à estimer.
Dans le modèle de référence, on suppose que sur un petit nombre d'années, les variations
accidentelles se compensent.
t = 0
Il est évident que ces suppositions ne correspondent pas à la réalité

3) Décomposition du modèle idéal en deux sous-modèles théoriques d'analyse

Pour l'étude des séries chronologiques, il est important de faire une hypothèse
concernant leur type d'évolution.

On divise le modèle idéal en 2 sous-modèles :


• Le modèle additif lorsque1'évolution est de type additif
• Et le modèle multiplicatif lorsque l'évolution est de type multiplicatif.

a) Définition des modèles «additifs» et «multiplicatif»


• Lorsque le modèle est de type additif, on suppose que les composantes du
phénomène étudié sont indépendantes les unes des autres, les variations des
composantes saisonnières (St) sont constantes, par rapport à la tendance.

Yt = ft +St+t

Où ft = at + b, a et b sont les paramètres du trend

• Lorsque l'évolution est de type multiplicatif les composantes du phénomène


étudié sont dépendantes les unes des autres.

Yt = ft x St + t 1ère forme
Yt = ft x St x t 2ème forme

Le choix du modèle additif ou multiplicatif revient à l'utilisateur des informations


statistiques, en fonction de la configuration de la courbe, de la conjoncture
économique, etc.

Soulignons toutefois que la 2ème forme du modèle multiplicatif peut se ramener au


modèle additif
Yt =f t x St xt
Log yt =log ft + logSt + logt

b) La conservation des aires dans les deux modèles


Nous avons vu que dans le modèle de référence l'influence des variations saisonnières
est neutre sur l'année.
Considérons que les variations accidentelles (t) n'existent pas ou intégrons-les au

Trend.

•Modèle additif
Yt = ft + St (t =0)

Nous savons que la somme des variations saisonnières est nulle sur l'année
S1+S2+S3+S4=0

𝑝
Et que ∑1 𝑆𝑡 = 0 si p est la période de référence en mois ou trimestre
Et que la moyenne des variations saisonnières est nulle sur l'année. En mois

𝑝
1
∑ 𝑆𝑡 = 0
12
1

En général
1
∑𝑝1 𝑆𝑡 = 0 𝑆̅ = 0
𝑝

•Modèle multiplicatif
Yt = ftx St(t intégrés dans le trend)

Pour supprimer l'influence des variations saisonnières St, il faut que la moyenne
soit égale à l'unité.

1
∑p1 St = 1 S̅ = 1
p

II) METHODE ANALYTIQUE D'ETUDE DES SERIES CHRONOLOGIQUES


ET AJUSTEMENT

1) Définitions
Une fois le modèle d’évolution (additif ou multiplicatif) retenu, on détermine les
différents paramètres permettant d'obtenir les différentes composantes de la série
chronologique. On considère que les variations accidentelles Et n'existent pas ou sont
intégrés au Trend.

2) Détermination des paramètres a et b du trend linéaire

a) Ajustement dans le cas du modèle additif

Yt = ft + b (t=0)
ft = at + b
yt = at + b + St
La pente a égale

𝐶𝑜𝑣(𝑡, 𝑦)
𝑎=
𝑉(𝑡)
1
∑ 𝑡𝑖 𝑦𝑖 −𝑡̿𝑦̿
𝑛
Ou 𝑎 = 1
∑ 𝑡𝑖 2 −𝑡̅ 2
𝑁

Ou encore
∑ 𝑡𝑖 𝑦𝑖 − 𝑡̿𝑦̿
𝑎=
∑ 𝑡𝑖 2 − 𝑛𝑡̅ 2

𝑏 = 𝑦̿ − 𝑎𝑡̿

b) Ajustement dans le cas du modèle multiplicatif

Yt = ft x St (t negligée)

Log yt = log ft + log St. Le calcul est donc ramené au calcul précédent.

3) Estimation des coefficients saisonniers(Sj)

a) Définition des coefficients saisonniers


Dans le modèle de référence 1'influence des variations saisonnières est neutre et
les variations saisonnières se répètent théoriquement à1'identique de période en
période.

Dans la réalité, les variations saisonnières ne sont jamais identiques, il faut donc estimer
en lieu et place des St observées, des variations périodiques identiques chaque année
(mois par mois ou trimestre par trimestre) qu'on appelle coefficients saisonniers et
qu'on note Sj). -./

b) Calcul des coefficients saisonniers Sj par la méthode pratique

a) Calcule des coefficients saisonniers sj par la méthode pratique


 Dans le modèle additif :

On procède dans la façon suivante 𝑦𝑡 = 𝑣𝑎𝑙𝑒𝑢𝑟𝑠 𝑜𝑏𝑠𝑒𝑟𝑣é𝑒𝑠


𝑓𝑡 = 𝑣𝑎𝑙𝑒𝑢𝑟𝑠 𝑐𝑎𝑙𝑐𝑢𝑙é𝑒𝑠
𝑠𝑡 = 𝑦𝑡 − 𝑓𝑡
On obtient donc un certain nombre de St

Si n est le nombre d’années et j le nombre de mois ou de trimestre, alors on aura


n x j de St qu’on peut écrire Sij

Dans notre cas St = Sij

Dans l’année on peut avoir 12 valeurs de Sj (mois) ou 4 valeurs de sj (trimestre) en


calculant mois par mois ou trimestre par trimestre la moyenne arithmétique des Sj
1
sur l’ensemble des n années 𝑠𝑗 = ∑ 𝑠𝑖𝑗 .
𝑛

On peut calculer la médiane des St en lieu et place des moyennes arithmétique des St
pour éviter l’influence des valeurs aberrantes.

La somme des St ainsi obtenue devrait être égale à 0, ce qui n’est souvent pas le cas.
Si la somme des Sj sur l’année est ≠ 0, on calcule un coefficient correcteur sur
l’année.
1 1
𝜑 = ∑12 𝑗=1 𝑠𝑗 Ou 𝜑 = ∑4𝑗=1 𝑠𝑗
12 4
1 𝑝
Soit la formule générale 𝜑 = ∑𝑗=1 𝑠𝑗
𝑝
On obtient alors un coefficient corrigé saisonnier
𝑠′𝑗= 𝑠𝑗 −𝜑

Le coefficient correcteur 𝜑 reparti l’erreur d’approximation sur l’ensemble des p


périodes et le principe selon lequel la moyenne des coefficients saisonniers est égale
à 0 est respectée.

∑ 𝑆′𝑗 = 0 𝑜𝑢 ̅ =0
𝑆′
𝑗

 Dans le modèle multiplicatif


On procède de la façon suivante :

- st = yt / ft
- on calcule sj = moyenne des st
Ou sj = médiane des st
𝑝
- si la calculer 1
∑ 𝑠𝑗 ≠ 1 𝜑 = ∑ 𝑠𝑗
𝜑
𝑗=1
𝑗
1
∑ 𝑠′𝑗=1
𝑝
𝑗
- 𝑆′𝑗= 𝑠𝑗/𝛿 Alors

1- Etablissement de la chronique ajustée (𝑦̂𝑡 )

L’addition des 2 composantes (prend un coefficient saisonnier calculés) dans le


modèle additif ou leur produit dans le modèle multiplicatif, nous donnes la série
ajustée (𝑦̂𝑡 ).

Modèle additif et le modèle multiplicatif

𝑦̂𝑡 = 𝑓𝑡 + 𝑠′𝑗 𝑦̂𝑡 = 𝑓𝑡 × 𝑠′𝑗

La série ajustée nous donne ce qu’aurait été l’évolution du phénomène étudié si le


mouvement saisonnier était parfaitement régulier d’année en année.

Les p coefficients saisonnier identiques d’année en année, s’écrivent sous forme de


vecteur lorsque l’on veut donner l’équation.

Modèle additif par mois :


̂𝒕 = 𝒂𝒕 + 𝒃 + 𝒔′𝒋
𝒚

𝒔′𝟏

𝒄𝒐𝒗(𝒚,𝒕) 𝒄𝒐𝒗(𝒚,𝒕)
̂𝒕 =
𝒚 ̿−
×𝒕+𝒚 × 𝒕̿ + 𝒔′𝒋 𝒔′𝟐
𝒗(𝒕) 𝒗𝒕

𝒔′𝟏𝟐
𝒔′𝟏
𝒄𝒐𝒗(𝒚,𝒕)
̂𝒕 = 𝒚
𝒚 ̿+ × (𝒕 − 𝒕̿) + 𝒔′𝒋
𝒗(𝒕)

𝒔′𝟏𝟐

llI) METHODES EMPIRIQUES DE DECOMPOSITION DES SERIES


CHRONOLOGIQUES ET LA COVARIATION

A-Détermination du Trend et utilisation du procédé des moyennes mobiles

Ici nous verrons les méthodes purement graphiques de détermination du trend. Ils'agit en
général d e f i x e r l e mouvement brut c'est-à-dire qu'on adoucit les pics et les creux, tout
en gardant1'allure générale du phénomène.

1 - Les moyennes échelonnées

L'ensemble des observations ou des points correspondants est divisé dans


1'ordre en groupes contenant chacun le même nombre de points n étant de préférence
impair (en généra 3).
On fait ensuite correspondre à la valeur médiane de la variable de chacun, la moyenne
arithmétique des effectifs du groupe.
Cette méthode est certes rapide, mais trop simplificatrice. Elle réduit considérablement le
nombre de points de la représentation graphique.

2 - Méthodes des moyennes mobiles

Soit une variable yt (t variant de 1 à n) dont on s'intéresse à l’évolution temporelle, on


appelle moyenne d'ordre "p" (p<n) la série constituée par les moyennes arithmétiques
suivantes:
y1 +y2 +y3 +⋯+yp y2 +y3 +⋯+yp +1
; ; etc.
p p

En formalisant on obtient:
𝑝−1
1
𝑀𝑃 = ∑ 𝑦𝑡 + 1
𝑝
𝑖=0

Avec
𝑡 = 1; 2; … ; 𝑛
{
𝑖: 𝑒𝑛𝑡𝑖𝑒𝑟 𝑛𝑎𝑡𝑢𝑟𝑒𝑙 ≥ 0

- Les numérateurs de fractions portent le nom de sommes mobiles


- Les dénominateurs sont les "ordres" ou "longueurs" des moyennes mobiles.

ti yi Moyennes échelonnés d’ordre 3 Moyennes mobiles d’ordre 3

1 y1 𝒚𝟏 + 𝒚𝟐 + 𝒚𝟑
𝟑
2 y2 𝒚𝟏 + 𝒚𝟐 + 𝒚𝟑
𝟑 𝒚𝟐 + 𝒚𝟑 + 𝒚𝟒
3 y3 𝟑
4 y4 𝒚𝟑 + 𝒚𝟒 + 𝒚𝟓
𝒚𝟒 + 𝒚𝟓 + 𝒚𝟔 𝟑
5 y5 𝟑
𝒚𝟒 + 𝒚𝟓 + 𝒚𝟔
6 y6 𝟑

7 y7 𝒚𝟓 + 𝒚𝟔 + 𝒚𝟕
𝟑
3- choix de l'ordre et problèmes de parité

Le choix de l'ordre dépend du "rythme" apparent des variations régulières de la courbe


représentative du mouvement brut. Il s'agit de trouver le meilleur "filtrage". Ainsi si des
variations prononcées se produisent toutes les "j"
Périodes dans l'ensemble, on choisira une moyenne mobile d'ordre j.
_
- En pratique:

𝑄𝑢𝑎𝑛𝑑𝑙𝑒𝑠 𝑡𝑖 𝑠𝑜𝑛𝑡𝑑𝑒𝑠 𝑎𝑛𝑛é𝑒𝑠: 𝑜𝑛 𝑐ℎ𝑜𝑖𝑠𝑖𝑡 𝑝 = 3 𝑜𝑢 5


{ 𝑄𝑢𝑎𝑛𝑑𝑙𝑒𝑠 𝑡𝑖 𝑠𝑜𝑛𝑡𝑑𝑒𝑠𝑚𝑜𝑖𝑠: 𝑜𝑛 𝑐ℎ𝑜𝑖𝑠𝑖𝑡 𝑝 = 12
𝑄𝑢𝑎𝑛𝑑 𝑙𝑒𝑠 𝑡𝑖 𝑠𝑜𝑛𝑡𝑑𝑒𝑠 𝑡𝑟𝑖𝑚𝑒𝑠𝑡𝑟𝑒𝑠: 𝑜𝑛𝑐ℎ𝑜𝑖𝑠𝑖𝑡 𝑝 = 4

- Quand l'ordre est pair, cela pose un problème. Les valeurs des moyennes obtenues
se trouvent entre les lignes du tableau, et ne se rapportent donc plus aux dates
d'observation.
- Pour faire coïncider dates et moyennes, on effectue une deuxième somme mobile
d'ordre 2, après avoir fait la somme mobile pair, sur laquelle on calcule la
moyenne mobile en divisant par 2 fois 1'ordre choisi.

-Détermination du Trend
A partir des valeurs calculées, on trace point par point sur le graphique le trend de
la série: il apparait en ligne brisée suggérant une tendance centrale.
On peut lisser au 4èmedegré en calculant (n-1) moyennes mobiles de ces moyennes
mobiles.

B - la correction des variations saisonnières (CVS)

Cette correction peut se faire que si la série chronologique est subdivisée en


périodes inferieures à l'année. On néglige dans un premier temps les variations
accidentelles (t) comme on le faisait dans les procédés analytiques.
1- La méthode des différences ou des rapports au trend et l'obtention de la
série CVS
Le mouvement saisonnier est mis en évidence par les différences au trend en
modèle additif et par des rapports au trend en modèle multiplicatif.
Le trend est calculé soit analytiquement, soit par1'une des méthodes exposées plus
haut. Lorsqu'il est calculé analytiquement (ajustement) on le notera ft. Lorsqu'il est
calculé par les moyennes mobiles, on le notera Mt

1ère étape
Lesvariationssaisonnièressontcalculéespar"écarts"autrendpourchaque valeur de t.
Modèle additif modèle multiplicatif
𝑦
𝑆𝑡 = 𝑦𝑡 − 𝑓𝑡 𝑆𝑡 = 𝑡⁄𝑓𝑡

Ou
𝑦𝑡
𝑆𝑡 = 𝑦𝑡 − 𝑀𝑡 𝑆𝑡 = ⁄𝑀𝑡

On obtient donc dans une colonne du tableau autant de valeurs de St qu'il y a de dates t
d’observations (moins les dates extrêmes dans le cas des moyennes mobiles).

2e étape
On détermine les j valeurs des coefficients saisonniers Sj = 12 mois ou 4trimestres) par le
calcul période par période (mois par mois ou trimestre par trimestre) de la moyenne ou de
la médiane sur les n années.

3e étape
Si la somme ou la moyenne des Sj n'est pas égale à 0 dans le modèle additif, ou bien si la
moyenne n'est pas égale à 1 dans le modèle multiplicatif il faut corriger Sj en S'j.
Pour cette correction, on calcule

𝑝
1
𝜑 = ∑ 𝑆𝑗
𝑝
𝑗=1
4e étape
On retranche (modèle additif) ou on divise (modèle multiplicatif) les valeurs données
yt et les S'j·
La série obtenue est la CVS, série corrigée des variations saisonnières.

On la note yt*

Modèle additif modèle multiplicatif

Yt*= Yt - S'j Yt* = YtS'j

Yt* exprime ce qu'aurait été la réalité du phénomène, s'il n'y avait pas eu de saison.
Cette opération d'élimination du mouvement saisonnier s'appelle aussi
«dessaisonalisation ».

2- Remarques complémentaires sur la série CVS

Modèle additif modèle multiplicatif

Yt* = Yt - S'j Yt* = Yt/S'j

Yt incluse les t

𝑆
𝑦𝑡∗ = 𝑓𝑡 + [𝑆𝑡 − 𝑆′𝑗 ] + 𝑡 𝑦𝑡∗ = 𝑓𝑡 + [ 𝑡′ ] 𝑡
𝑆𝑡

L’Annulation de l'influence des saisons


Il ne faut pas confondre yt* (série CVS) et y’t* (série ajustée).Cette dernière intégrant un
mouvement saisonnier régulier d'autre en année.

- détermination des variations accidentelles

Il suffit d'enlever à la série CVS (yt*) l'influence du trend (ft) pour obtenir la composante
accidentelle (t).

Modèle additif Modèle multiplicatif


𝑦𝑡∗
𝑡 = 𝑦𝑡∗ − 𝑓𝑡 𝑡 =
𝑓𝑡

Vous aimerez peut-être aussi