Vous êtes sur la page 1sur 32

A.U.

2022/2023

Chapitre 3:
A JUSTEMENT D ’ UNE SÉRIE
TEMPORELLE

Séries temporelles et Contrôle qualité


4 année ERP-BI
Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Introduction et motivation

Introdution:

L’objectif de l’étude des séries temporelles est de faire des prédictions sur
l’évolution de la série.

Les méthodes mathématiques que l’on pourra utiliser sont:

1 Les méthodes non paramétriques: Méthode des moyennes mobiles.


2 Les méthodes paramétriques:
Les Modèles linéaires : Régression linéaire.
Les Modèles ARMA: Ces modèles sont plus lourds numériquement, mais plus
performants.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Lissage par moyennes mobiles centrées

• Le lissage des séries temporelles est une décomposition de la série en une


combinaison de trois termes représentant la tendance, les variations saisonnières et
un terme d’erreurs ou de perturbations. Il existe de nombreux modèles et
algorithmes différents pour effectuer ce genre de décomposition.

• On s’intéressera dans ce cours a une méthode non paramétrique: la méthode des


moyennes mobiles centrées.

• On dispose d’une série temporelle (yt )1≤t≤n , alors on cherche à trouver une fonction
simple du temps qui modélise au mieux la tendance de la série.

• Cette méthode s’articule sur le fait d’éliminer la composante saisonnière et


d’atténuer les fluctuations irrégulières.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Lissage par moyennes mobiles centrées

Définition:
• On appelle série des moyennes mobiles centrées d’ordre k avec k = 2m + 1,
m ∈ N, de la série (yt )1≤t≤n la série notée MMC(k) et définies par:
1 
MMCt (k) = yt−m + yt−m+1 + ... + yt−1 + yt + yt+1 + ... + yt+m
k
• Cependant série des moyennes mobiles centrées d’ordre k avec k = 2m,
m ∈ N, de la série (yt )1≤t≤n est la série notée MMC(k) et définies par:
11 1 
MMCt (k) = yt−m + yt−m+1 + ... + yt−1 + yt + yt+1 + ... + yt+m+1 + yt+m
k 2 2

Une moyenne mobile en t étant une combinaison linéaire finie des valeurs de la série
correspondant à des dates entourant t, elle réalise donc un lissage de la série, une
moyennisation.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Exemple: les séries des moyennes mobiles centrées d’ordre 2 et 4 de la série initiale
(yi )1≤i≤16 .

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Visualisation graphique: MMC(2) et MMC(4).

• Une moyenne mobile atténue l’amplitude des


fluctuations irrégulières d’une série temporelle.

• Plus l’ordre k de la moyenne mobile est élevé, et


plus cette atténuation est importante.

⇒ En appliquant une moyenne mobile sur une


série temporelle, on obtient un lissage de la série.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Choix pratique de l’ordre d’une moyenne mobile

Le but d’un lissage par moyenne mobile est de faire apparaître l’allure de la
tendance.

Lorsque des fluctuations périodiques et/ou irrégulières sont présentes, on aimerait


par conséquent réaliser les trois objectifs suivants :

1 Supprimer la composante périodique ;


2 Réduire le plus possible l’amplitude des fluctuations irrégulières ;
3 Et bien sûr, ne pas trop modifier la tendance

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Choix pratique de l’ordre d’une moyenne mobile

Il est bien rare que ces trois objectifs puissent être parfaitement atteints
simultanément. En effet, chacun de ces objectifs conduit à des choix différents de
moyenne mobile :

1 On supprime la composante périodique de période p avec une moyenne mobile


d’ordre p ;
2 On réduit l’amplitude des fluctuations irrégulières avec une moyenne mobile
d’ordre élevé ;
3 On préserve les détails de la tendance avec une moyenne mobile d’ordre faible.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

Ajustement de la tendance

Après avoir représenté la série, il est souvent possible d’inférer une représentation
paramétrique de sa tendance. Dans ce cas, on procède par régression linéaire pour
estimer cette tendance.

On dispose d’une série chronologique (yi )i=1,...,n où les seules composantes présentes
sont :
la tendance.
et la composante résiduelle (les fluctuations irrégulières).

Le problème : Peut-on trouver une fonction simple du temps qui modélise au mieux
la tendance de la série (yi )i=1,...,n ?

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

10

Ajustement linéaire de la tendance


On suppose que la tendance (fi )i=1,....,n est de la forme (fθ (ti ))i=1,...,n où θ est un
paramètre inconnu de dimension finie, qu’on estimera à l’aide des observations.

yi = fθ (ti ) + ϵ
Il nous faut alors :

choisir une famille de fonctions fθ dans une collection donnée de fonctions


paramétriques, et en général, c’est l’analyse graphique de la série chronologique
qui détermine la famille de fonctions paramétriques à considérer.
une fois la famille choisie, déterminer la valeur de θ qui conduit au meilleur
ajustement de la série (yi )i=1,...,n et en général, on choisit θ à l’aide du critère des
moindres carrés, on cherche la valeur de θ qui rend minimale
n
X
(yi − fθ (ti ))2
i=1

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

11

Ajustement linéaire de la tendance

Objectif:

On veut ajuster les données par une droite et donc modéliser la tendance par une
fonction de la forme :

fθ (t) = α t + b

Avec : θ = (α, b)

La méthode:
La méthode des moindres carrés

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

12

La méthode des moindres carrés : Estimation des paramètres de


la tendance

Cette méthode consiste à choisir les coefficients α et b de sorte que la quantité :


n
X
(yi − (α ti + b))2 = g(α, b)
i=1
soit minimale.
On cherche donc α et b solutions du système :

∂g
∂α (α, b) = 0

∂g
∂b (α, b) = 0

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

13

Calcul de l’estimateur des moindres carrés

On démontre que le couple solution est (α̂, b̂) avec :


n
X n
X
(yi − y)(ti − t) yi ti − nyt
i=1 i=1
α̂ = n = n
2
X X
(ti − t)2 ti 2 − nt
i=1 i=1
b̂ = y − α̂t
n
X n
X
1 1
Où t = n ti et y = n yi
i=1 i=1

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

14

Propriétés de l’estimateur des moindres carrés

1 La droite d’équation y = α̂t + b̂ s’appelle la droite des moindres carrés (DMC).


2 Le point moyen de coordonnées (t, y) appartient à la la droite des moindres carrés.
3 On peut apprécier la qualité de l’ajustement linéaire à l’aide du coefficient de
corrélation linéaire noté r et défini par :
n
X
(yi − y)(ti − t)
r = v i=1 v
n
u n
uX uX
2t
(yi − y)2
u
t (ti − t)
i=1 i=1

4 La variance de la série (yi )i=1,...,n se décompose en :

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

15

Propriétés de l’estimateur des moindres carrés

Somme des carrés


SCT
| {z } = SCR
| {z } + SCE
| {z }
Variance totale Variance résiduelle Variance expliquée

n
X
SCT = (yi − y)2
i=1
n
X n
X
2
SCE = (ŷi − y) = (α̂ ti + b̂ − y)2
i=1 i=1
n
X n
X
SCR = (yi − ŷ)2 = (yi − (α̂ ti + b̂))2
i=1 i=1

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

16

Ajustement polynômial de la tendance

Objectif
On veut ajuster les données par un polynôme de degré d et donc modéliser la
tendance par une fonction de la forme :

fθ (t) = α0 + α1 t + α2 t2 + · · · + αd td
Le cas d = 0 correspond à la tendance constante et le cas d = 1 à la tendance
linéaire.

Trouver la valeur de θ = (α0 , α1 , . . . , αd ) qui minimise
n
X
(yi − (α0 + α1 ti + . . . , αd tdi ))2
i=1

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

17

Calcul de l’estimateur des moindres carrés

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

18

Calcul de l’estimateur des moindres carrés

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

19

Propriétés de l’estimateur des moindres carrées


Distribution du vecteur des paramètres estimés θM C ∼ N (α, σϵ2 (T T )−1 )
θM C ∼ N (α, A) ⇒ α̂i ∼ N (α, A(i, i))

- σϵ2 (T T )−1 est la matrice variance covariance de α̂
- A(i, i) = σϵ2 (α̂i ) est la variance (théorique ou de la population) de α̂i , si σϵ2 est
connue.
Soit T la statistique associée à l’étude de de significativité de α̂i :

 H : α̂ = 0
0 i
 H1 : α̂i ̸= 0

Si σε2 est connue, alors :


α̂i − 0
T = √ ∼ N (0, 1)
σ (α̂i ) = Aii

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

20

Significativité des paramètres estimés par la méthode des


moindres carrés
Si σε2 est inconnue: Approximation de la variance σε2 de ε :
1 X 1 X
σ̂ε2 ≃ sd2 (ε̂) = (ε̂i − (ε̂))2 = (ε̂i − 0)2
n−k n n−k n
k le nombre de paramètres et n le nombre d’observations.
- A(i, i) est la variance (de l’échantillant : sd2 ) de α̂i .
Distribution du vecteur des paramètres :
Sous H0 :

α̂i − 0
T (α̂i ) = √ ∼ ST (n − K)
sd (α̂i ) = Aii

avec k c’est le nombre de paramètres estimés


et ST (n − k) est la loi de student à (n − k) degrés de liberté.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

21

Significativité des paramètres estimés par la méthode des


moindres carrés

Si (n − k) > 10, la statistique de student se rapproche de la N(0,1)


La valeur critique du test t-student à 95% en valeur absolue est 1.96 :
P (|T | ≥ 1.96) = 0.05
Pvalue :
Pvalue = P (|T | ≥ |T (α̂i )|)
= P (T ≥ |T (α̂i )| et T ≤ − |T (α̂i )|)
Si Pvalue ≤ 0.05 alors |T (α̂i )| ≥ 1.96
@UP-Maths Ajustement d’une série temporelle Séries temporelles
Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

22

Significativité des paramètres : Seuils de significativité

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

23

Significativité des paramètres : Rejet de H0-Pvalue

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

24

Significativité des paramètres : Acceptation de H0-Pvalue

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

25

Comparaison de modèles
Coefficient de détermination :
X
(ŷi − y)2
i Variance expliquée
R2 = X =
(yi − y) 2 Variance Totale
i

Coefficient de détermination ajusté (K nombre de paramètres) :

2 T −1
Radj = 1 − (1 − R2 )
T −K
T −1
T −K >,Terme d’amplification de de l’erreur non expliqué par le modèle.
Exemple :
Nbre de paramètres R2 R2 ajusté
20−1
m1 2 0.8 1 − (1 − R2 )( 20−2 ) = 0.78
20−1
m2 5 0.75 1 − (1 − R2 )( 20−5 ) = 0.68

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

26

Application 1 : Ajustement de la tendance sous R

1 A partir de la série temporelle du monbre de passager américains, utiliser la


méthode des moindres carrés pour estimer la tendance de la forme suivante:
f (t) = α1 t + α0

2 Représenter graphiquement l’équation de la tendance.

3 Etudier la qualité d’ajustement du modèle.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

27

Correction : Ajustement de la tendance sous R


1 Pour ajuster un modèle linéaire de la tendance yi = α1 ti + α0 + ϵi

> AP< −AirPassengers


> length(AP)
> tps< −1 : length(AP )
>mod1< −lm(AP ∼ tps)
>mod1
2 Pour représenter graphiquement l’équation de la tendance :
> plot(AP)
> points(time(AP), fitted(mod1),type="l",col="blue")
3 Pour voir les principales statistiques du modèle et la qualité d’ajustement du modèle :

> summary(mod1)
> AIC(mod1)

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

28

Application 2 : Ajustement de la tendance sous R

1 A partir de la série temporelle du monbre de passager américains, utiliser la


méthode des moindres carrés pour estimer la tendance de la forme suivante:

f (t) = α1 t + α2 t2 + α0

2 Etudier la qualité d’ajustement du modèle.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

29

Correction : Ajustement de la tendance sous R

1 Pour ajuster un modèle linéaire de la tendance yi = α1 ti + α2 t2i + α0

> AP< −AirPassengers


> length(AP)
> tps< −1 : length(AP )
>mod2< −lm(AP ∼ tps + I(tps2 ))
2 Pour Etudier la qualité d’ajustement du modèle :
>summary(mod2)
> AIC(mod2)

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

30

Ajustement de la composante saisonnière

Dans le cas d’une série temporelle avec une composante saisonnière st de période T
paire, l’expression st pourraît être réduite comme suit:
T T
2 2
X 2πi X 2πi
st = βi cos( t) + γi sin( t), t : 1....n
i=1
T i=1
T

où le vecteur des inconnus est θ = (β1 , ...β T , γ1 , ...γ T ).


2 2
• Également on estimera le vecteur θ par la méthode des moindres carrés ordinaires
(MMC).

• Rappel: cos(t) est de périodicité 2π


2π.t
cos( ) est périodique de période T
T /i

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

31

Exemple : Ajustement de la composante saisonnière sous R

En utilisant les fonctions sinusoïdales:

1 A partir de la série temporelle du monbre de passager américains, utiliser la


méthode des moindres carrés pour estimer la tendance de la forme suivante :
T T
2 2
X 2πi X 2πi
Yt = α1 t + α0 + βi cos( t) + γi sin( t) + ϵt , t : 1....n
i=1
T i=1
T
où le vecteur des inconnus est θ = (α1 , α0 , β1 , ...β T , γ1 , ...γ T ).
2 2

2 Etudier la qualité d’ajustement du modèle.

@UP-Maths Ajustement d’une série temporelle Séries temporelles


Les méthodes non paramétriques : La Méthode des moyennes mobiles Les méthodes paramétriques : Les modèles linéaires

32

Correction : Ajustement de la composante saisonnière sous R


1 Pour ajuster un modèle linéaire :

> AP< −AirPassengers


> length(AP)
> tps< −1 : length(AP )
> MC< −matrix(0, length(AP ), 6)
> MS< −matrix(0, length(AP ), 6)
>for (i in 1:6) MC[ ,i]< −cos(2 ∗ π ∗ tps ∗ i/12)
>for (i in 1:6) MS[ ,i]< −sin(2 ∗ π ∗ tps ∗ i/12)
>mod3< −lm(AP ∼ tps + M C + M S)
>mod3
2 Pour étudier la qualité d’ajustement de modèle:
>summary(mod3)
>AIC(mod3)

@UP-Maths Ajustement d’une série temporelle Séries temporelles

Vous aimerez peut-être aussi