Académique Documents
Professionnel Documents
Culture Documents
I) NOTION D'INDICE
Il est souvent nécessaire dans l'étude des phénomènes économiques et sociaux de décrire des
variations de grandeurs simples (par exemple: le prix, la production, le taux de chômage) qui
varient dans l'espace et dans le temps, car d'une région à une autre, d'une période à une autre
ces grandeurs peuvent être très fluctuantes.
Il est souvent difficile d'apprécier et de comparer ces grandeurs car les tableaux statistiques
fournissent un grand nombre de chiffres, ce qui rend les comparaisons immédiates difficiles.
Pour faciliter cette interprétation directe des comparaisons dans le temps et dans l'espace, il
faut généralement effectuer le rapport des grandeurs considérées : On parle d'indices
statistiques.
Exemple: Soit une ferme dont la vente passerait de 20 en 1990 à 26 en 1991 et à 30 en 1992.
𝑉0 20 × 100
1990 → × 100 = = 100
𝑉0 20
𝑉1 26 × 100
1991 → × 100 = = 130
𝑉0 20
𝑉2 30 × 100
1992 → × 100 = = 150
𝑉0 20
On pourra donc dire que 1'indice de vente de la ferme en retenant pour année de référence
1990, c’est-à-dire en retenant 100 pour indice de l'année de base, l'indice de la ferme passe
de 100 à 130 en 1991, et à 1 5 0 e n1992, soit un accroissement de30% et de 50%
directement lisible.
Il s'agit ici d'un indice temporel ou chronologique. Si à la place des années nous avions eu des
régions, il se serait agi d’indice régional ou spatial.
Il existe 2 types d'indices : les indices élémentaires et les indices synthétiques.
1
V0, V1, …………..,Vt
Aux dates (ou périodes) successives
0,1,...............t
On appelle indice élémentaires de la grandeur V à la date (ou période) t par rapport à la
date (ou période) 0, le rapport
𝑉𝑡
𝑖𝑡/0 =
𝑉0
- La date (ou période) 0 est la date de référence ou de base de l'indice (pour les indices
chronologiques). Elle devient : situation de base ou de référence dans le cas des
indices spatiaux.
- La date(ou période) t est la date courante.
- Exemple:
-Indice du prix d'un bien X entre 1985 et 1990
𝑝𝑟𝑖𝑥 𝑒𝑛 1990
𝐼90/85 = × 100
𝑝𝑟𝑖𝑥 𝑒𝑛 1985
Base 100 en 1985
- Indice du prix d'un bien X entre la région d'Abidjan et la Côte d'Ivoire entière.
𝑝𝑟𝑖𝑥 𝑒𝑛 𝑟é𝑔𝑖𝑜𝑛 𝑑′𝐴𝑏𝑖𝑑𝑗𝑎𝑛
𝐼𝑅𝐴/𝐶𝐼 = × 100
𝑝𝑟𝑖𝑥 𝑒𝑛 𝐶ô𝑡𝑒 𝑑′𝐼𝑣𝑜𝑖𝑟𝑒
Base 100 pour la Côte d'Ivoire
2
B) Propriétés des indices élémentaires
En effet:
𝑉𝑡 𝑉𝑡 100𝑉𝑡′
𝐼𝑡/0 = × 100 = × 100 ×
𝑉0 𝑉0 100𝑉𝑡′
𝑉𝑡 𝑉𝑡′ 1
𝐼𝑡/0 = × 100 × × 100 ×
𝑉𝑡′ 𝑉0 100
1
𝐼𝑡 = 𝐼𝑡/𝑡′ × 𝐼𝑡′/0 ×
100
𝐼𝑡/0 = 𝑖𝑡/𝑡′ × 𝑖𝑡′/0 × 100
ou
𝑖𝑡/0 × 100
𝐼𝑡/𝑡′ =
𝑖𝑡 ′/0
3
𝐼1/0 𝐼2/1 𝐼3/2 𝐼𝑡/𝑡−1
𝐼𝑡/0 = 100 × [ × × × ⋯× ]
100 100 100 100
La propriété de circularité permet ainsi d'obtenir l'indice élémentaire de la date t, par rapport à
la base, en effectuant le produit des indices élémentaires intermédiaires successifs.
2) Réversibilité.
Quand on inverse le rôle de la base et de la période courante, l'indice élémentaire
s'inverse à 104 près
𝐼𝑡/0 × 𝐼0/𝑡 = 104
ce qui équivaut à
104
𝐼0/𝑡 =
𝐼𝑡/0
ou
1
𝑖0/𝑡 =
𝑖𝑡/0
En effet:
𝑉𝑡
𝐼𝑡/0 = × 100
𝑉0
𝑉0
𝐼0/𝑡 = × 100
𝑉𝑡
𝑉𝑡 𝑉0
× 100 × × 100 = 10000 = 104
𝑉0 𝑉𝑡
4
3) Propriétés secondaires
a) Soient 3 variables a, b, c telles que a soit le produit des 2 autres (b x c), alors
quelque soit t, l'indice élémentaire du produit est égal au produit des indices
élémentaires à 10-2 près.
Si 𝑎 = 𝑏 × 𝑐
1
𝐼𝑡/0 (𝑎) = 𝐼𝑡/0 (𝑏) × 𝐼𝑡/0 (𝑐 ) ×
100
Ou
𝐼𝑡/0 (𝑎) = 𝑖𝑡/0 (𝑏) × 𝑖𝑡/0 (𝑐 ) × 100
b) Quand une grandeur simple est le rapport de 2 autres, l’indice élémentaire est
égal au rapport des indices élémentaires à102 près.
𝑎
Si 𝑏 =
𝑐
En effet
𝑉𝑡 × 100 𝑉0
𝐼𝑡/0 = = 𝑘 × = 𝑘 × 100
𝑉0 𝑉0
5
d'indices élémentaires qui doit être résumée numériquement par un indice
synthétique.
Soit une grandeur complexe X constituée de différents éléments :
𝑋 = {𝑥 1 , 𝑥 2 , 𝑥 3 , ⋯ , 𝑥 𝑖 , ⋯ , 𝑥 𝑘 }
Les indices élémentaires des constituants xi de X peuvent être calculés:
𝑖
𝑥1𝑖 × 100
𝐼𝑡/0 (𝑥 ) =
𝑥01
Mais, ces différents indices ne suffisent pas pour apprécier l'évolution du niveau
général des prix. Il est nécessaire de résumer, de synthétiser par un seul indice, qu'on
appelle indice synthétique de la grandeur complexe X, les différents indices
élémentaires, un peu comme1'on résume une distribution statistique, en calculant,
par exemple sa moyenne.
Chaque indice élémentaire est de type:
𝑖
𝑥1𝑖 × 100
𝐼𝑡/0 (𝑥 ) =
𝑥01
Pour lever le doute on considère dans le calcul de l'indice que l'une des 2 variables (le prix
ou la quantité) reste constante, pendant que l'autre varie.
- Un indice de prix se conçoit à quantités fixes.
6
- Un indice des quantités se conçoit à prix constants.
Supposons que p varie et que q reste constant entre la période 0 et la période t.
Alors pour un bien quelconque« i »la valeur globale à la date de base sera p i0 qi0 et à la
date courante pitqi0
L'indice élémentaire de valeur du bien i sera :
A) L’indice de Laspeyres
L’indice de Laspeyres est défini en prenant comme date de référence une date antérieure
à la date d'observation.
1) L'indice des prix de Laspeyres
∑ 𝑝𝑡𝑖 𝑞0𝑖
𝐿𝑃𝑡/0 = × 100
∑ 𝑝0𝑖 𝑞0𝑖
Remarques
a) La formule de définition peut encore s'écrire
𝑝𝑡
∑ 𝑝0𝑖 𝑞0𝑖
𝑝0
𝐿𝑃𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝0 𝑞0
Ecrite sous cette forme, la formule de l'indice des prix de Laspeyres se présente comme une
moyenne arithmétique. Ce qui permet de dire que l'indice des prix de Laspeyres est la
moyenne arithmétique de la série des indices élémentaires de prix, pondérée par des valeurs
globales de la date de base.
Le coefficient de pondération du type p0q0 s’appelle dans le cas des indices de prix, des
7
Coefficients budgétaires
Ecrite sous cette forme l'indice des prix de Laspeyres se lit comme une moyenne
harmonique.
L'indice des prix de Laspeyres est la moyenne harmonique de la série des valeurs
globales de la date de base«0» pour les quantités, et de la date courante «t» pour les
prix.
𝑞 ∑ 𝑝0𝑖 𝑞𝑡𝑖
𝐿𝑡/0 = × 100
∑ 𝑝0𝑖 𝑞0𝑖
Remarques
a)
𝑞𝑡
∑ 𝑝0𝑖 𝑞0𝑖
𝑞 𝑞0
𝐿𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝0 𝑞0
b)
𝑞 ∑ 𝑝0𝑖 𝑞𝑡𝑖
𝐿𝑡/0 = 𝑞0 × 100
∑ 𝑝0𝑖 𝑞𝑡𝑖
𝑞𝑡
𝑝 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = × 100
∑ 𝑝0𝑖 𝑞𝑡𝑖
Remarques
8
𝑝𝑡
∑ 𝑝0𝑖 𝑞𝑡𝑖
𝑝 𝑝0
𝑃𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝0 𝑞𝑡
Il s'écrit comme une moyenne arithmétique.
L'indice des prix de Paasche est la moyenne arithmétique de la série des indices
élémentaires des prix, pondérée par les valeurs globales de la date courante «t» pour
les quantités, et de la date de base«0»pour les prix.
𝑞 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = 𝑝0 × 100
∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑝𝑡
L'indice des prix de Paasche est donc la moyenne harmonique de la série des indices
élémentaires (Pt / P0) pondérée par les valeurs globales de la date actuelle «t» (date
courante).
2) L'indice des quantités de Paasche
𝑞 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = × 100
∑ 𝑝𝑡𝑖 𝑞0𝑖
Remarques
a)
𝑞𝑡
∑ 𝑝𝑡𝑖 𝑞0𝑖
𝑞 𝑞0
𝑃𝑡/0 = 𝑖 𝑖 × 100
∑ 𝑝𝑡 𝑞0
b)
𝑞 ∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑃𝑡/0 = 𝑞0 × 100
∑ 𝑝𝑡𝑖 𝑞𝑡𝑖
𝑞𝑡
9
C) Indice de Fisher
Aucun critère théorique, aucune raison ne nous permet de préférer 1'un ou1'autre des 2 indices
et dire que l'un des 2 indices est meilleur que l'autre, bien que les 2 donnent des résultats
différents.
L'indice de Laspeyres ayant tendance à surestimer, l'indice de Paasche ayant tendance à
sous-estimer.
L'économiste américain Irving Fisher propose un indice synthétique qu'il trouve idéal. La
valeur se situe entre les valeurs des 2autres (Laspeyres et Paasche).
L'indice de Fisher est la moyenne géométrique des indices de Laspeyres et de Paasche.
𝐹 𝑝 = √𝐿𝑝 × 𝑃𝑝
Et
𝐹 𝑞 = √𝐿𝑞 × 𝑃𝑞
L'indice de Fisher est compris entre ceux de Laspeyres et ceux de Paasche, aussi bien
pour les prix que pour les quantités, si les pondérations sont homogènes.
𝑃≤𝐹≤𝐿
L'indice des valeurs calculé par Laspeyres est égal à celui calculé par Paasche, et est
égal au produit de l'indice de Fisher des prix par l'indice de Fisher des quantités.
I (pq) = LpPq = LqPp = Lpq = FPFq
2) Réversibilité
Quand on inverse le rôle du temps dans un indice de Laspeyres, on obtient un
indice de Paasche et inversement.
104
𝐿0/𝑡 =
𝑃𝑡/0
et
104
𝑃0/𝑡 =
𝐿𝑡/0
10
Les indices de Laspeyres et de Paasche ne sont pas réversibles. Par contre
l'indice de Fisher est réversible:
104
𝐹𝑡/0 =
𝐹0/𝑡
3) Agrégation
Les indices de Laspeyres et de Paasche ayant des structures de moyennes
arithmétiques de «sous populations» on peut utiliser les résultats des moyennes
de sous-populations et obtenir l'indice de Laspeyres et de Paasche d'un ensemble
à partir des indices des groupes.
Nous savons que:
Si une population P est composée de plusieurs sous populations, la moyenne de la
population P est la moyenne pondérée des moyennes des sous populations.
1
𝑋̅ = ∑ 𝑛ℎ 𝑥̅ℎ
𝑛
De même si un ensemble de produits est reparti en plusieurs groupes, l’indice de
Laspeyres d'ensemble est égal à l'indice de Laspeyres des indices de Laspeyres de
chaque groupe de constituants.
De même, l'indice de Paasche d'ensemble est égal à l'indice de Paasche des indices de
Paasche de chaque groupe.
L'indice de Fisher ne satisfait pas la propriété d'agrégation car ce n'est pas une
moyenne.
Indice de Sidwick
𝐿𝑡/0 + 𝑃𝑡/0
𝑆𝑡/0 = 𝑥100
2
11
DISTRIBUTION DES SERIES A DEUX DIMENSIONS
Dans les chapitres précédents les distributions étudiées étaient à une dimension c'est-à- dire
que l'on ne retenait pour l'étude qu'un seul caractère. Cependant pour l'étude de certains
phénomènes il s'avère indispensable de prendre simultanément deux caractères ou plus.
Nous nous limiterons à l'étude des séries statistiques à deux caractères. Elles se présentent
sous forme de tableau à deux dimensions ou à double entrée.
Soit une population P comprenant n individus pour chacun desquels on a fait une
observation concernant simultanément les caractères X et Y
xi yi y1 y2 … yj …2 yl
Total
x1 n11 n12 … n1j … n1l n1.
x2 n21 n22 … n2j … n2l n2.
… … … … … …
xi ni1 ni2 … nij … nil ni.
… … … … … …
xk nk1 nk2 … nkj … nkl nk .
Total
n.1 n.2 … n.j … n.l
n.j n..
nij est l'effectif des individus présentant à la fois la modalité xi et la modalité yj, on dit
encore effectif partiel. Les effectifs nij sont toujours notés en prenant d'abord l'indice de x
(« i») et celui de y («j») ensuite nji n'existe pas.
Les tableaux à double entrée représentant les séries statistiques à 2 variables prennent le
nom de tableaux de contingence, appelés parfois tableau de corrélation.
Notons que dans les marges ainsi que pour toute somme l'indice qui varie est remplacé par un
point
Exemple« n2. » signifie que l'on a additionné les effectifs de la 2éme ligne.
L'indice j, qui a varié de1à l, est remplacé par un point.
12
De même « n.j » représente l'effectif de la modalité yj, pour toutes les modalités des caractères
x.
L'indice « i » de x varie de 1 à k, on le remplace par un point.
∑ nij = n.j
∑ nij = 𝑛𝑖 .
𝑛. . = ∑ 𝑛.𝑗 = ∑ 𝑛𝑖 .
𝑗 𝑖
En définitive
13
𝑛. . = ∑ ∑ 𝑛𝑖𝑗 = ∑ 𝑛𝑖 . = ∑ 𝑛.𝐽
𝑖 𝑗 𝑖 𝑗
La fréquence de l'évènement (xi, yj), on dit encore fréquence partielle de l'évènement (xi, yj)
est le rapport de l'effectif partiel sur l’effectif total. C'est la proportion des observations qui
présentent simultanément les modalités xi, yj.
𝑛𝑖𝑗
𝑓𝑖𝑗 =
𝑛. .
A) DISTRIBUTIONS MARGINALES
Les sommes des effectifs ou des fréquences en ligne définissent la distribution marginale
(d'effectifs ou de fréquences) suivant le caractère x. C'est une distribution à une seule
dimension.
∑𝑗 𝑛𝑖𝑗 𝑛𝑖
𝑓𝑖 . = ∑ 𝑓𝑖𝑗 = =
𝑛. . 𝑛. .
𝑗
La distribution marginale suivant le caractère y est définie par les sommes en colonnes.
𝑛.𝑗
𝑓.𝑗 =
𝑛. .
∑𝑖 𝑛𝑖𝑗 𝑛.𝑗
𝑓.𝑗 = ∑ 𝑓𝑖𝑗 = =
𝑛. . 𝑛. .
𝑖
Comme pour les distributions à un caractère la somme des fréquences est égale à
l'unité.
∑ ∑ 𝑓𝑖𝑗 = ∑ 𝑓𝑖 . = ∑ 𝑓.𝑗 = 1
14
Les effectifs marginaux sont les effectifs lus dans les 2 marges du tableau.
{𝑛1 . , 𝑛2 . , 𝑛3 . , ⋯ , 𝑛𝑖 . , ⋯ , 𝑛𝑘 . } Pour x
{𝑛.1 , 𝑛.2 , 𝑛.3 , ⋯ , 𝑛.𝑖 , ⋯ , 𝑛.𝑘 } Pour y
B) DISTRIBUTIONS CONDITIONNELLES
Soient ni. individus présentant la modalité xi. Parmi ceux-ci il y en a une proportion
nij/ni. Qui présentent simultanément la modalité yj
𝑦 𝑛𝑖𝑗
𝑓𝑗/𝑖 = 𝑓 ( 𝑗⁄𝑥𝑖 ) =
𝑛.𝑖
C'est la proportion d'individus présentant la modalité yj, parmi les individus qui présentent
uniquement la modalité xi.
𝑥 𝑛𝑖𝑗
𝑓𝑖/𝑗 = 𝑓 ( 𝑖⁄𝑦𝑗 ) =
𝑛. 𝑗
Notation:
j
fi/j ou fi qui se lit fréquence de xi, sous condition que y = yj ou plus simplement « f de
i si j »
15
II) LES CARACTERISTIQUES DES SERIES A DEUX CARACTERES
a) La moyenne marginale𝑥̿
C'est une moyenne arithmétique notée 𝑥̿ qui se lit «x double barre».
1
𝑥̿ = ∑ 𝑛𝑖 . 𝑥𝑖
𝑛. .
𝑖
Avec
𝑛. . = ∑ 𝑛𝑖 .
𝑖
L'effectif marginal ni. étant une somme, on peut écrire:
1
𝑥̿ = ∑𝑖 ∑𝑗 𝑛𝑖𝑗 𝑥𝑖 Avec 𝑛. . = ∑𝑖 ∑𝑗 𝑛𝑖𝑗
𝑛..
𝟏
𝑽 (𝒙 ) = ̿ )𝟐
∑ 𝒏𝒊 . (𝒙𝒊 − 𝒙
𝒏. .
La formule développée est:
𝟏
𝑽(𝒙) = ∑ 𝒏𝒊 . 𝒙𝒊 𝟐 − 𝒙
̿𝟐
𝒏. .
𝜎𝑥 = √𝑉(𝑥)
1
𝑦̿ = ∑ 𝑛.𝑗 𝑦𝑗
𝑛. .
𝑗
Ou
1
𝑦̿ = ∑ ∑ 𝑛𝑖𝑗 𝑦𝑗
𝑛. .
𝑗 𝑖
La variance s'écrit
𝟏
𝑽(𝒚) = ̿ )𝟐
∑ 𝒏.𝒋 (𝒚𝒋 − 𝒚
𝒏. .
Ou la formule développée
𝟏
𝑽(𝒚) = ∑ 𝒏.𝒋 𝒚𝒋 𝟐 − 𝒚
̿𝟐
𝒏. .
Et
𝜎𝑦 = √𝑉(𝑦)
a) Définition
Pour calculer les caractéristiques conditionnelles de x selon y (moyenne, variance,
écart type), il faut se référer aux lois conditionnelles de x selon y, c'est-à-dire aux
k modalités de x et aux 1 colonnes d'effectifs, du tableau à double entrée.
Il y a au total l distributions conditionnelles de x selon y. On appelle lois
conditionnelles de x selon y les colonnes d'effectifs du tableau de contingence
associées aux modalités de x.
b) Moyennes conditionnelles de x selon y
1
x̅j = ∑i nij xi avec 1≤𝑗≤𝐿
n.j
𝟏
𝑽𝒋 (𝒙) = ̅ 𝒋 )𝟐
∑ 𝒏.𝒋 . (𝒙𝒊 − 𝒙
𝒏.𝒋
𝟏 𝟐
𝑽 𝒋 (𝒙 ) = ∑ 𝒏𝒊 . 𝒙𝒊 𝟐 − 𝒙
̅𝒋
𝒏.𝒋
𝒊
Elles sont obtenus à partir des l modalités de y et à partir desk lignes d'effectifs partiels
du tableau à double entrée. Tout comme pour les distributions conditionnelles de x si y,
on dénombre autant de moyennes, de variances et d'écart type que de distributions
conditionnelles
1
y̅i = ∑ nij yj
n𝑖 .
j
𝟏
𝑽𝒊 (𝒚) = ̅ 𝒊 )𝟐
∑ 𝒏.𝒋 (𝒚𝒋 − 𝒚
𝒏𝒊 .
La formule développée est
𝟏
𝑽𝒊 (𝒀) = ∑ 𝒏𝒊𝒋 𝒀𝒋 𝟐 − 𝒀
̅𝟐
𝒏𝒊.
C) RELATIONS ENTRE LES CARACTERISTIQUES MARGINALES ET
CONDITIONNELLES
1
𝑥̿ = ∑ 𝑛.𝑗 𝑥̅𝑗
𝑛. .
𝑗
1
𝑦̿ = ∑ 𝑛𝑖 . 𝑦̅𝑖
𝑛. .
𝑖
𝟏 𝟏
𝑽(𝒙) = ∑ 𝒏.𝒋 (𝒙 ̿ )𝟐 +
̅𝒋 − 𝒙 ∑ 𝒏.𝒋 𝑽𝒋 (𝒙)
𝒏. . 𝒏. .
𝒋 𝒋
̅𝒋 ) + ̅̅̅̅̅̅̅̅
𝑽(𝒙) = 𝑽(𝒙 𝑽𝒋 (𝒙)
𝟏 𝟏
𝑽(𝒚) = ∑ 𝒏𝒊 . (𝒚 ̿ )𝟐 +
̅𝒊 − 𝒚 ∑ 𝒏𝒊 . 𝑽𝒊 (𝒚)
𝒏. . 𝒏. .
𝒊 𝒊
̅𝒊 ) + ̅̅̅̅̅̅̅̅
𝑽(𝒚) = 𝑽(𝒚 𝑽𝒊 (𝒚)
1
𝑚𝑟,𝑠 = ∑ ∑ 𝑛𝑖𝑗 𝑥𝑖𝑟 𝑦𝑗𝑠
𝑛. .
𝑖 𝑗
𝑚1,0 = 𝑥̿
m0,1 = y̿
m2,0 et m0,2 sont utilisées pour le calcul de la variance dans la formule développée.
2) La covariance
1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̿ ) (𝑦𝑗 − 𝑦̿)
𝑛. .
𝑖 𝑗
Cov(x, y)=μ1,1
1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 𝑥𝑖 𝑦𝑗 − 𝑥̿ 𝑦̿
𝑛. .
𝑖 𝑗
𝑥𝑖 = 𝜎𝑋𝑖′ + 𝑥0 𝑦𝑗 = 𝛽𝑌𝑗′ + 𝑦0
𝑋̿ = 𝜎𝑥̿′ + 𝑥0 𝑌̿ = 𝛽𝑦̿′ + 𝑦0
Par soustraction
𝑥𝑖 − 𝑋̿ = 𝜎(𝑋𝑖′ − 𝑥̿′ ) 𝑦𝑗 − 𝑌̿ = 𝛽(𝑌𝑗′ − 𝑦̿′ )
Par conséquent
1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 (𝑥𝑖 − 𝑥̿ )(𝑦𝑗 − 𝑦̿)
𝑛. .
𝑖 𝑗
1
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 𝜎(𝑋𝑖′ − 𝑥̿′ )𝛽(𝑌𝑗′ − 𝑦̿′ )
𝑛. .
𝑖 𝑗
𝜎𝛽
𝐶𝑜𝑣 (𝑥, 𝑦) = ∑ ∑ 𝑛𝑖𝑗 (𝑋𝑖′ − 𝑥̿′ )(𝑌𝑗′ − 𝑦̿′ )
𝑛. .
𝑖 𝑗
Le principe de calcul consiste à ajouter des colonnes et des lignes, en bon ordre, au
tableau de contingence.
xi yj y1 y2 y3 y4 ni. ni.xi ni.xi2 nijyj nijyj2 nijxiyj
x1
x2
x3
x4
x5
n.j
n.jyj
n.jyj2
nijxi
nijxi2
nijxiyj
La représentation normale de ces séries devrait se faire sur des espaces à 3 dimensions
ce qui présente quelques difficultés. On cherche alors une méthode qui permette de
résumer le nuage de points dans un plan.
Ainsi donc au lieu de faire correspondre à chaque xi, la valeur yj et1'effectif nij
correspondants, on lui fait correspondre une valeur qui fait la synthèse de yj et de nij et
cette valeur est la moyenne conditionnelle de y liée par x = xi c'est-à-dire yi.
Il y a liaison totale entre les valeurs y et x lorsqu'à chaque valeur de xi, correspond une
valeur déterminée yj, et réciproquement. Exemple : le périmètre du cercle dépend de son
rayon. La connaissance de l'un entraine celle de l'autre.
Dans ce cas la moyenne conditionnelle 𝑦 ̅̅̅liée
𝑗 par xj, est égale à yJ
𝑥̅𝑗 = 𝑥𝑖 et ̅̅̅
𝑦𝑖 =yJ
Les moyennes conditionnelles sont donc égales aux valeurs des variables.
En effet, lorsque la liaison fonctionnelle est réciproque ou totale, un seul chiffre figure par
ligne et par colonne dans le tableau de contingence.
1
𝑥̅𝑗 = ∑ 𝑛.𝑗 𝑥𝑖
𝑛.𝑗
𝑖
𝑛.𝑗
𝑥̅𝑗 = ∑ 𝑥𝑖
𝑛.𝑗
𝑖
En conclusion
𝑥̅𝑗 = 𝑥𝑖 𝑒𝑡 𝑦̅𝑖 = 𝑦𝑗
1 2 3 ni.
coté
Surface du carré
1 3 3
4 8 8
9 10 10
n.j 3 8 10 21
𝑥̅𝑗 = 𝑥̿ 𝑦̅𝑖 = 𝑦̿
Il en résulte que pour chacune des variables les moyennes conditionnelles sont égales
entre elles et égales à la moyenne marginale.
Les courbes de régression sont donc 2 droites parallèles aux axes de coordonnées.
Y1 Y2 Y3 m.
Xl 1 3 9 13
X2 2 6 18 26
X3 3 9 27 39
n.J 6 18 54 78
∑𝑗 𝑛𝑖𝑗 ∑ 𝑛𝑖
𝑓𝑖/𝑗 = = = 𝑓𝑖 .
∑ 𝑛.𝑗 𝑛. .
Et
𝑓𝑖/𝑗 = 𝑓𝑖 .
Et
𝑓𝑖/𝑗 = 𝑓.𝑗
On en déduit que
1
𝑥̿ = ∑ 𝑛𝑖 𝑥𝑖 = ∑ 𝑓𝑖 . 𝑥𝑖
𝑛
∑ 𝑛𝑖𝑗
𝑥̿ = ∑ 𝑓𝑖/𝑗 𝑥𝑖 = 𝑥𝑖
𝑛.𝑗
1
𝑥̿ = ∑ 𝑛𝑖𝑗 𝑥𝑖
𝑛.𝑗
1
𝑥̿ = ∑ 𝑛𝑖𝑗 𝑥𝑖 = 𝑥̅𝑗
𝑛.𝑗
Et
𝑥̿ = 𝑥̅𝑗 𝑒𝑡 𝑦̅ = 𝑦̅𝑖
Sans qu'une loi rigoureuse préside à leurs relations, il existe une certaine
dépendance entre les variables étudiées. Cette situation est très fréquente
notamment dans le domainede1'économie et de la gestion: épargne et revenu,
consommation et revenu.
Lorsque les variations des 2 phénomènes se produisent dans le même sens on dit
que la corrélation est directe ou positive.
Lorsque les variations sont de sens contraire, on dit que la corrélation est
inverse ou négative.
Lorsque les courbes de régression sont des droites non parallèles aux
axes de coordonnées il y a corrélation linéaire.
y y
Corrélation positive x Corrélation négative x
II) L'AJUSTEMENT LINEAIRE
C'est une méthode souvent utilisé dans l'analyse et la prévision des phénomènes
économiques.
Les séries à deux dimensions ont une représentation graphique qui se présente souvent
sous forme de nuage de points.
Mais si suite à une représentation graphique les points représentés donnent une
configuration assez régulière, une droite(ou une courbe), par exemple, le statisticien
peut envisager de représenter les points, le nuage de point ou la courbe de régression
par une droite(ou une courbe).
Soit y = ax + b la droite
d'ajustement.
A) Méthode graphique ou
empirique
On promène par exemple sur le graphique une règle transparente, en se servant
du bord de la règle pour matérialiser la droite. En tâtonnant on essaie de situer
de la manière la plus satisfaisante la droite qui passe au travers des points Mi.
Au jugé, on essaie de choisir la droite de telle sorte que la somme algébrique
des écarts (di) à la droite adoptée soit nulle, sinon minima.
On peut aussi utiliser une feuille de papier transparent sur laquelle a été tracé un
ensemble de droites parallèles régulièrement espacées de part et d'autre d'une droite
centrale. Si nous apposons la feuille de papier transparent sur la représentation
graphique à ajuster, on trouvera aisément la position de la droite d'ajustement,
c'est-à-dire la droite centrale de l'ensemble des droites, situé de telle sorte que les
points à ajuster se répartissent équitablement de part et d'autre de cette droite, et à
l'intérieur du réseau des parallèles.
Cette méthode est évidemment subjective, mais en pratique elle donne de très
bon.s.résultats.
Exemple:
𝑥𝐴 𝑥𝐵
(𝐴| ) (𝐵| )
𝑦𝐴 𝑦𝐵
𝑦𝐴 − 𝑦𝐵 𝑥𝐴 𝑦𝐵 − 𝑦𝐴 𝑥𝐵
𝑌= 𝑥+
𝑥𝐴 − 𝑥𝐵 𝑥𝐴 − 𝑥𝐵
𝑦𝐴 = 𝑎𝑥𝐴 + 𝑏
{
𝑦𝐵 = 𝑎𝑥𝐵 + 𝑏
B) Méthode de Mayer
La droite de Mayer passe par ces 2 points. C'est la droite d'ajustement dont
1'équation est facile à déterminer.
Xi yi
2 7
4 10
6 13
8 15
9 20
13 28
31
Divisons-la en 2 sous-ensembles égaux de 3points.
Les coordonnées des 3 premiers points du tableau sont:
2+4+6
A en abscisse : =4
3
7+10+13
en ordonnée: = 10
3
𝑥=4
(𝐴| )
𝑦 = 10
B en abscisse
8 + 9 + 13
= 10
3
En ordonnée:
15 + 20 + 28
= 21
3
𝑥 = 10
(𝐵| )
𝑦 = 21
La droite de Mayer recherchée passe par ces 2 points de coordonnées (4;10) et (10;21)
L’équation de Mayer de la forme y = ax + b sera obtenue par la détermination de a et
de b dans le système d'équation
10 = 4a + b
{
21 = 10a + b
a = 1,83 b = 2,67
La droite d'équation de Mayer a donc pour équation
Y = 1,83x + 2,67
(La méthode empirique donne 1,8x + 2,8)
On peut aussi procéder de la façon suivante:
32
∑ 𝑑𝑖 = 0
1
∑ 𝑑𝑖 = 0
{ 2
Exemple:
𝑑𝑖 = 𝑦𝑖 − (𝑎𝑥𝑖 + 𝑏)
𝑦1 − (𝑎𝑥1 + 𝑏) 𝑦4 − (𝑎𝑥4 + 𝑏)
𝑦2 − (𝑎𝑥2 + 𝑏) 𝑦5 − (𝑎𝑥5 + 𝑏)
𝑦3 − (𝑎𝑥3 + 𝑏) 𝑦6 − (𝑎𝑥6 + 𝑏)
∑ 𝑦𝑖1 − (∑ 𝑎𝑥𝑖1 + 𝑛1 𝑏) = 0
{
∑ 𝑦𝑖2 − (∑ 𝑎𝑥𝑖2 + 𝑛2 𝑏) = 0
Reprenons1'exemple antérieur
7-(2a+ b) 15 - (8a+b)
10 - (4a + b) 20 - (9a+b)
13 - (6a +b) 28-(13a+b)
30 - (12a + 3b) 63 - (30a + 3b)
30 − (12𝑎 + 3𝑏) = 0
{
63 − (30𝑎 + 3𝑏) = 0
Si nous divisons les 2 équations par 3 nous obtenons le système antérieur.
10 - (4a + b) = 0
21 - (10a + b) = 0
La droite d'ajustement de Y en X
𝑏 = 𝑦̅ − 𝑎𝑥
̅̅̅
𝑏′ = 𝑥̅ − 𝑎𝑦̅
Lorsque les observations sont groupées par classe, on retient généralement pour
variables statistiques dans les calculs, les centres xi, yj de chaque classe
𝑏 = 𝑦̅ − 𝑎𝑥̿
Demême la droite d'ajustement de x en y,
𝑏′ = 𝑥̿ − 𝑎𝑦̿
Récapitulons
L'équation de la droite d'ajustement de y en x de la forme y = a x +b
(puisque 𝑏 = 𝑦̅ − 𝑎𝑥̿ ) est
Cov(x, y) Cov(x, y)
Y= x + 𝑦̅ − 𝑥̿
𝑉(𝑥) 𝑉(𝑥)
Ce qui donne
Cov(x, y)
Y = 𝑦̅ + (𝑥 − 𝑥̿ )
𝑉 (𝑥 )
Ou
𝐶𝑜𝑣(𝑥,𝑦)
Y−𝑦̅ = (𝑥 − 𝑥̿ ) et pour l’équation de la droite d’ajustement de x en y de la
𝑉(𝑥)
Cov(x, y)
x − 𝑥̅̅ = (y − 𝑦̿)
𝑉 (𝑦 )
A) Définition
Le coefficient de corrélation linéaire r entre x et y se définit par le rapport
𝐶𝑜𝑣(𝑥, 𝑦)
𝑟=
𝜎𝑥 𝜎𝑦
Ou 𝑟 = ±√𝑎𝑎′
Ce coefficient caractérise aussi bien l'intensité de la liaison de y en x, que de x en y.
36
1) Droite d'ajustement de y en x
𝐶𝑜𝑣(𝑥, 𝑦)
𝑎=
𝑉(𝑥)
𝐶𝑜𝑣(𝑥,𝑦)
Sachant 𝑟 =
𝜎𝑥 𝜎𝑦
On peut dire
𝜎𝑦 𝜎𝑥
𝑎=𝑟 ou 𝑟=𝑎
𝜎𝑥 𝜎𝑦
2) Droite d'ajustement de x en y
𝐶𝑜𝑣(𝑥,𝑦) 𝜎𝑦 𝜎𝑦
𝑎′ = 𝑟= ou 𝑟 = 𝑎′
𝜎𝑦2 𝜎𝑥 𝜎𝑥
C) Propriétés
-1 ≤ 𝑟 ≤ 1
Il est positif dans le cas où les variables varient dans le même sens et négatif dans le cas
où les variables varient en sens contraire.
3) Si les 2 variables x et y sont liées par une relation fonctionnelle linéaire, le coefficient
de corrélation linéaire est égal à -1 ou à +1
37
𝑐𝑜𝑣(𝑥,𝑦)
r=1 si a > 0 𝑎= >0
𝜎𝑥2
𝐶𝑜𝑣(𝑥,𝑦)
r = -1 si a < 0 𝑎= <0
𝜎𝑥2
Quand r = 0, cela fait penser à une indépendance, mais il est nécessaire de le contrôler par
l'interprétation des phénomènes réels.
Le coefficient de corrélation linéaire n'a de sens, et ne doit donc être employé, que dans le
cas où la liaison entre les 2 variables peut être considérée comme approximativement
linéaire.
Le coefficient de corrélation linéaire ne varie pas si on procède à un changement d'origine
et d'échelle. C'est un nombre sans dimension.
𝑟 = √𝑎𝑎′
Avec
𝐶𝑜𝑣(𝑥, 𝑦)
𝑎=
𝑉(𝑥)
𝐶𝑜𝑣(𝑥, 𝑦)
𝑎′ =
𝑉(𝑦)
Lorsque la régression est représentée par 2 droites ou lorsqu'on procède par ajustement
linéaire a ramené les nuages de points, ou la courbe de régression en une représentation
linéaire, on se retrouve en linéaire, et on peut aisément utiliser le coefficient de
corrélation r pour calculer l'intensité de la liaison.
Mais il arrive que la représentation donne une liaison non linéaire (logarithmique,
exponentiel, etc.), on va dans ce cas chercher à partir des courbes de régression un
nombre sans dimension capable de nous renseigner sur l'intensité de la liaison.
C'est le rapport de corrélation.
Nous avons vu que la variance marginale est la somme de la variance des moyennes
conditionnelles et de la moyenne des variances conditionnelles.
1 2 1
V(x) = ∑ 𝑛.𝑗 (x̅j − 𝑥̿ ) + ̅̅̅
∑ 𝑛.𝑗 𝑉𝑗 (𝑥)
𝑛. . 𝑛. .
̅̅̅
Autre notation : V(x)=V(x̅𝑗 )+𝑉𝑗 (𝑥)
Le premier terme
1 2
V(x̅𝑗 ) = ∑ 𝑛.𝑗 (x̅j − 𝑥̿ )
𝑛. .
Exprime la part de la variance marginale qui est expliquée par la variation des
moyennes conditionnelles x̅,
j c'est-à-dire par la courbe de régression de x en y 𝐶𝑥 . Elle
𝑦
traduit la dispersion des moyennes conditionnelles entre elles. On 1'appelle variance
expliquée par la régression
Le second terme
1
̅̅̅
∑ 𝑛.𝑗 𝑉𝑗 (𝑥)
𝑛. .
Mesure au contraire la part de la variance marginale qui résulte de la dispersion des points
(xi,yj) autour d la courbe de régression, c’est la variance résiduelle qui n’est pas expliquée
par la régression. C’est la variance qui reste après avoir effectué la régression. (C’est la
dispersion qui n’est pas résumé par la courbe de régression de x en y C x/y). On l’appelle
variance résiduelle.
Le rapport de corrélation noté 2 (êta carré) est le rapport de la variance expliquée sur la
variance marginale
Il y a 2 rapports de corrélation
Le rapport de corrélation de x en y
1
∑ 𝑛.𝑗 𝑉𝑗 (𝑥)
2𝑥/𝑦 = 1 − 𝑛..
𝑉(𝑥)
Le rapport de corrélation de y en x
Par construction 0 ≤ 2 ≤ 1
1 2
V(x̅𝑗 ) = ∑ 𝑛.𝑗 (x̅j − 𝑥̿ )
𝑛. .
A) GENERALITES
Dans le cas d'un niveau, chaque observation se rapporte à une date. Dans le cas d'un
flux, chaque observation se rapporte à une période : flux écoulé pendant la période.
Le temps est habituellement repéré par 1'indice t, porté en abscisse. Il est repéré en
année, trimestre, mois, jours, etc.
La variable étudiée, notée y, est portée en ordonnée sur les graphes rectangulaires.
Les séries chronologiques sont donc des distributions statistiques à 2 caractères dont
1'un est le temps.
Mais en 1'absence de pondération, le tableau se réduit à 2 colonnes. La variable est
donc liée fonctionnellement à la variable «temps ». A chaque date correspond une et
une seule valeur d’y, mais pas 1'inverse.
Le « temps» noté t prend les valeurs ti avec i variant de 1 à n
Et la variable y prend les valeurs ti
y = f(t) .
2) Représentations graphiques
a) Graphiques à échelle arithmétique (sur coordonnées rectangulaires)
Le temps est porté en abscisses et les variables en ordonnées. Les points obtenus sont
reliés par un segment de droite et jamais par une courbe. L'établissement de ce
graphique ne présente pas de difficultés particulières. L'échelle des ordonnées devra
être prise aussi grande que possible, afin qu'apparaissent nettement les variations du
phénomène et que le graphe ne soit trop aplati.
On remarque (assez difficilement du reste) une tendance générale à la hausse sur les
3 années. ··.
Le trend: ou tendance séculaire à long terme. C'est la courbe (droite ici) qui
«résume» le phénomène. C'est elle qui ajuste l'ensemble des points de la ligne brisée.
(Elle «lisse» la série)
Le cycle: sur des périodes plus courtes (mais toujours de longues durées) on observe
des fluctuations autour du Trend de haut en bas qui se répètent, c'est le cycle. Le cycle
est donc le mouvement oscillatoire d'amplitude et de périodicité variables, la
périodicité étant supérieure à 1'année.
Les variations saisonnières sont des fluctuations périodiques s'inscrivant dans le
cadre de l'année et qui se reproduisent de façon plus ou moins identique d'une année à
l'autre.
Sur notre graphe on aperçoit des mouvements de pics et de creux successifs qui se
répètent, périodiquement, à des dates précises. C'est cette suite de pics et de creux qu'on
appelle variation saisonnière.
Dans le modèle idéal l'appréciation des variations saisonnières reposent sur 2 principes de
base
Sl = S5 = S9
S2 = S6 = Sl0
Si elle est donnée en mois
St = St+12
Si la période est P
St=St+p=St+2p=St+3p
Pour l'étude des séries chronologiques, il est important de faire une hypothèse
concernant leur type d'évolution.
Yt = ft +St+t
Yt = ft x St + t 1ère forme
Yt = ft x St x t 2ème forme
Trend.
•Modèle additif
Yt = ft + St (t =0)
Nous savons que la somme des variations saisonnières est nulle sur l'année
S1+S2+S3+S4=0
𝑝
Et que ∑1 𝑆𝑡 = 0 si p est la période de référence en mois ou trimestre
Et que la moyenne des variations saisonnières est nulle sur l'année. En mois
𝑝
1
∑ 𝑆𝑡 = 0
12
1
En général
1
∑𝑝1 𝑆𝑡 = 0 𝑆̅ = 0
𝑝
•Modèle multiplicatif
Yt = ftx St(t intégrés dans le trend)
Pour supprimer l'influence des variations saisonnières St, il faut que la moyenne
soit égale à l'unité.
1
∑p1 St = 1 S̅ = 1
p
1) Définitions
Une fois le modèle d’évolution (additif ou multiplicatif) retenu, on détermine les
différents paramètres permettant d'obtenir les différentes composantes de la série
chronologique. On considère que les variations accidentelles Et n'existent pas ou sont
intégrés au Trend.
Yt = ft + b (t=0)
ft = at + b
yt = at + b + St
La pente a égale
𝐶𝑜𝑣(𝑡, 𝑦)
𝑎=
𝑉(𝑡)
1
∑ 𝑡𝑖 𝑦𝑖 −𝑡̿𝑦̿
𝑛
Ou 𝑎 = 1
∑ 𝑡𝑖 2 −𝑡̅ 2
𝑁
Ou encore
∑ 𝑡𝑖 𝑦𝑖 − 𝑡̿𝑦̿
𝑎=
∑ 𝑡𝑖 2 − 𝑛𝑡̅ 2
𝑏 = 𝑦̿ − 𝑎𝑡̿
Yt = ft x St (t negligée)
Log yt = log ft + log St. Le calcul est donc ramené au calcul précédent.
Dans la réalité, les variations saisonnières ne sont jamais identiques, il faut donc estimer
en lieu et place des St observées, des variations périodiques identiques chaque année
(mois par mois ou trimestre par trimestre) qu'on appelle coefficients saisonniers et
qu'on note Sj). -./
On peut calculer la médiane des St en lieu et place des moyennes arithmétique des St
pour éviter l’influence des valeurs aberrantes.
La somme des St ainsi obtenue devrait être égale à 0, ce qui n’est souvent pas le cas.
Si la somme des Sj sur l’année est ≠ 0, on calcule un coefficient correcteur sur
l’année.
1 1
𝜑 = ∑12 𝑗=1 𝑠𝑗 Ou 𝜑 = ∑4𝑗=1 𝑠𝑗
12 4
1 𝑝
Soit la formule générale 𝜑 = ∑𝑗=1 𝑠𝑗
𝑝
On obtient alors un coefficient corrigé saisonnier
𝑠′𝑗= 𝑠𝑗 −𝜑
∑ 𝑆′𝑗 = 0 𝑜𝑢 ̅ =0
𝑆′
𝑗
- st = yt / ft
- on calcule sj = moyenne des st
Ou sj = médiane des st
𝑝
- si la calculer 1
∑ 𝑠𝑗 ≠ 1 𝜑 = ∑ 𝑠𝑗
𝜑
𝑗=1
𝑗
1
∑ 𝑠′𝑗=1
𝑝
𝑗
- 𝑆′𝑗= 𝑠𝑗/𝛿 Alors
𝒔′𝟏
𝒄𝒐𝒗(𝒚,𝒕) 𝒄𝒐𝒗(𝒚,𝒕)
̂𝒕 =
𝒚 ̿−
×𝒕+𝒚 × 𝒕̿ + 𝒔′𝒋 𝒔′𝟐
𝒗(𝒕) 𝒗𝒕
𝒔′𝟏𝟐
𝒔′𝟏
𝒄𝒐𝒗(𝒚,𝒕)
̂𝒕 = 𝒚
𝒚 ̿+ × (𝒕 − 𝒕̿) + 𝒔′𝒋
𝒗(𝒕)
𝒔′𝟏𝟐
Ici nous verrons les méthodes purement graphiques de détermination du trend. Ils'agit en
général d e f i x e r l e mouvement brut c'est-à-dire qu'on adoucit les pics et les creux, tout
en gardant1'allure générale du phénomène.
En formalisant on obtient:
𝑝−1
1
𝑀𝑃 = ∑ 𝑦𝑡 + 1
𝑝
𝑖=0
Avec
𝑡 = 1; 2; … ; 𝑛
{
𝑖: 𝑒𝑛𝑡𝑖𝑒𝑟 𝑛𝑎𝑡𝑢𝑟𝑒𝑙 ≥ 0
1 y1 𝒚𝟏 + 𝒚𝟐 + 𝒚𝟑
𝟑
2 y2 𝒚𝟏 + 𝒚𝟐 + 𝒚𝟑
𝟑 𝒚𝟐 + 𝒚𝟑 + 𝒚𝟒
3 y3 𝟑
4 y4 𝒚𝟑 + 𝒚𝟒 + 𝒚𝟓
𝒚𝟒 + 𝒚𝟓 + 𝒚𝟔 𝟑
5 y5 𝟑
𝒚𝟒 + 𝒚𝟓 + 𝒚𝟔
6 y6 𝟑
7 y7 𝒚𝟓 + 𝒚𝟔 + 𝒚𝟕
𝟑
3- choix de l'ordre et problèmes de parité
- Quand l'ordre est pair, cela pose un problème. Les valeurs des moyennes obtenues
se trouvent entre les lignes du tableau, et ne se rapportent donc plus aux dates
d'observation.
- Pour faire coïncider dates et moyennes, on effectue une deuxième somme mobile
d'ordre 2, après avoir fait la somme mobile pair, sur laquelle on calcule la
moyenne mobile en divisant par 2 fois 1'ordre choisi.
-Détermination du Trend
A partir des valeurs calculées, on trace point par point sur le graphique le trend de
la série: il apparait en ligne brisée suggérant une tendance centrale.
On peut lisser au 4èmedegré en calculant (n-1) moyennes mobiles de ces moyennes
mobiles.
1ère étape
Lesvariationssaisonnièressontcalculéespar"écarts"autrendpourchaque valeur de t.
Modèle additif modèle multiplicatif
𝑦
𝑆𝑡 = 𝑦𝑡 − 𝑓𝑡 𝑆𝑡 = 𝑡⁄𝑓𝑡
Ou
𝑦𝑡
𝑆𝑡 = 𝑦𝑡 − 𝑀𝑡 𝑆𝑡 = ⁄𝑀𝑡
On obtient donc dans une colonne du tableau autant de valeurs de St qu'il y a de dates t
d’observations (moins les dates extrêmes dans le cas des moyennes mobiles).
2e étape
On détermine les j valeurs des coefficients saisonniers Sj = 12 mois ou 4trimestres) par le
calcul période par période (mois par mois ou trimestre par trimestre) de la moyenne ou de
la médiane sur les n années.
3e étape
Si la somme ou la moyenne des Sj n'est pas égale à 0 dans le modèle additif, ou bien si la
moyenne n'est pas égale à 1 dans le modèle multiplicatif il faut corriger Sj en S'j.
Pour cette correction, on calcule
𝑝
1
𝜑 = ∑ 𝑆𝑗
𝑝
𝑗=1
4e étape
On retranche (modèle additif) ou on divise (modèle multiplicatif) les valeurs données
yt et les S'j·
La série obtenue est la CVS, série corrigée des variations saisonnières.
On la note yt*
Yt* exprime ce qu'aurait été la réalité du phénomène, s'il n'y avait pas eu de saison.
Cette opération d'élimination du mouvement saisonnier s'appelle aussi
«dessaisonalisation ».
Yt incluse les t
𝑆
𝑦𝑡∗ = 𝑓𝑡 + [𝑆𝑡 − 𝑆′𝑗 ] + 𝑡 𝑦𝑡∗ = 𝑓𝑡 + [ 𝑡′ ] 𝑡
𝑆𝑡
Il suffit d'enlever à la série CVS (yt*) l'influence du trend (ft) pour obtenir la composante
accidentelle (t).