Vous êtes sur la page 1sur 7

Pr

evision de la consommation d
electricit
e par
correction it
erative du biais
Pierre-Andre Cornillon, Nicolas Hengartner, Vincent Lefieux, Eric
Matzner-Lber

To cite this version:


Pierre-Andre Cornillon, Nicolas Hengartner, Vincent Lefieux, Eric Matzner-Lber. Prevision de
la consommation delectricite par correction iterative du biais. 41`emes Journees de Statistique,
SFdS, Bordeaux, 2009, Bordeaux, France, France. <inria-00386629>

HAL Id: inria-00386629


https://hal.inria.fr/inria-00386629
Submitted on 22 May 2009

HAL is a multi-disciplinary open access


archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.

Larchive ouverte pluridisciplinaire HAL, est


destinee au depot et `a la diffusion de documents
scientifiques de niveau recherche, publies ou non,
emanant des etablissements denseignement et de
recherche francais ou etrangers, des laboratoires
publics ou prives.

Prvision de la consommation dlectricit par correction


itrative du biais
Pierre-Andr Cornillon1 , Nicolas Hengartner2 , Vincent Leeux3 & Eric Matzner-Lber4
(1) UMR ASB - Montpellier SupAgro, pierre-andre.cornillon@supagro.inra.fr
(2) Los Alamos National Laboratory - NW - USA, nickh@lanl.gov
(3) RTE - Dpartement Mthodes et Appui, vincent.leeux@rte-france.com
(4) IRMAR UMR 6625 - Universit Rennes 2, eml@uhb.fr

Rsum
Une prvision correcte de la consommation dlectricit est fondamentale pour le bon
fonctionnement du rseau lectrique franais, dont Rseau de Transport dElectricit a la
charge. Les prvisions utilises quotidiennement par RTE sont issues dun modle alliant
une rgression paramtrique non linaire et un modle SARIMA. Dans lide dobtenir
un modle de prvision adaptatif, des mthodes de prvision non-paramtriques ont dj
t testes sans succs vritable. On sait notamment que la qualit dun prdicteur nonparamtrique rsiste mal un grand nombre de variables explicatives, ce quon appelle
communment le au de la dimension. Nous utilisons ici une mthode de correction
itrative du biais, en lissant les rsidus obtenus chaque tape. Nous prsentons dans
cette communication un exemple dapplication sur la consommation dlectricit franaise
pour lequel cette mthode se rvle performante.
Abstract
Rseau de Transport dElectricit (RTE), in charge of operating the French electric
transportation grid, needs an accurate forecast of the electricity consumption in order
to operate it correctly. The forecasts used everyday result from a model combining a
nonlinear parametric regression and a SARIMA model. In order to obtain an adaptive
forecasting model, nonparametric forecasting methods have already been tested without
real success. In particular, it is known that a nonparametric predictor behaves badly
with a great number of explanatory variables, what is commonly called the curse of
dimensionality. We use a method which iteratively corrects the bias initial estimator by
an estimate of the latter obtained by smoothing the residuals. We apply the method to
the french electricity consumption and show that the method compares favourably with
existing procedures.
Mots cls
Rgression non paramtrique, Mthode itrative, Lissage
Keywords
Nonparametric regression, Iterative procedure, Smoother

Problmatique

Llectricit ne se stockant pas, la production globale sur le rseau lectrique franais doit,
tout moment, tre strictement gale la consommation. Toute modication de la demande ou de la production dlectricit en un point du rseau se rpercute instantanment
sur tout le systme lectrique. Celui-ci doit donc sadapter en permanence pour satisfaire
lquilibre ore-demande.
La prvision court terme est un facteur essentiel pour assurer lquilibre entre la
production et la consommation durant la journe. La prvision faite par RTE permet
de garantir lquilibre physique global entre lore et la demande lchelle du pays. De
sa qualit dpendent le niveau des marges dexploitation ncessaires et plus largement la
sret du systme.
La solution actuellement en place sexplique historiquement. Les sries temporelles
ont connu un fort essor, notamment grce Box et Jenkins qui ont dvelopp leurs
modles SARIMA. Leur ouvrage a constitu une rfrence thorique, mais galement
un guide pratique assez riche, et ce particulirement dans le domaine lectrique. Choisir
SARIMA pour eectuer les prvisions tait donc a priori un choix techniquement pertinent
et quasiment naturel. Malheureusement, ces modles nintgrent pas de variables exognes
et il a donc fallu trouver un biais en leur adjoignant un modle de rgression (liant la
puissance consomme avec les variables climatiques et les signaux de prix).
Au nal, la prvision journalire seectue en trois tapes :
On corrige la courbe de charge de limpact du climat et des prix, an de se ramener
une srie temporelle ne dpendant plus des variables explicatives. On utilise
cet eet un modle de rgression, quon surnomme communment dans notre cas
modle de correction.
On utilise un modle SARIMA sur la srie ainsi corrige; la seule dynamique de
la srie permet de la prvoir.
On rutilise le modle de correction an dajouter la courbe corrige prvue
limpact futur du climat et des prix.
Mme si les rsultats oprationnels sont satisfaisants la plupart du temps, cette mthodologie prsente un certain nombre dinconvnients.
Le modle actuellement en place est complexe et il est trs di cile de modier sa
structure. Si on veut tester par exemple lincorporation dune nouvelle variable explicative,
il est peu probable dy parvenir facilement, la juxtaposition du modle de rgression et
du modle SARIMA ne permettant pas disoler les causes de lerreur nale de prvision.
De plus, une prvision mme en temps quoutil daide la dcision, devrait fournir un
intervalle de conance sur la prvision, ce qui est impossible pour linstant ; les mthodes
2

de bootstrap pourraient tre envisages mais les dpendances temporelles complexes et


les multiples variables exognes rendent la tche complexe.
Le non-paramtrique constitue une alternative intressante, en ce sens quil ne spcie
pas la fonction de lien. On peut a priori incorporer de nouvelles variables explicatives
et simplement restimer une fonction de lien de dimension plus leve. Il est galement
possible dlaborer des intervalles de conance en se basant sur lhistorique des erreurs
de modlisation. Linconvnient majeur de ces techniques rside dans le au de la dimension ; on sait en eet que des problmes de convergence se posent si la dimension du
modle saccrot (en pratique, ce problme de convergence va se traduire par des estimateurs de pitre qualit). Citons les travaux de Poggi [3] sur la prvision de la consommation
dlectricit corriges des alas climatiques et tarifaires.
Des alternatives semi-paramtriques existent, que ce soit lapproximation fonctionnelle
ou la rduction de dimension. La mthode employe ici reste non-paramtrique, et utilise
en fait le au de la dimension. En eet une autre faon dinterprter le au de la
dimension consiste voir que les estimateurs non paramtriques en dimension leve sont
tous biaiss ; nous appliquons donc une mthode itrative de rduction du biais la
prvision non-paramtrique de sries temporelles.

Prsentation de la mthode

On se place dans un contexte de rgression et on dsigne par f(Xi ; Yi )gni=1 n observations.


Supposons que les donnes (Xi ; Yi ) 2 Rd R sont lies via le modle de rgression
Yi = m(Xi ) + "i ;

i = 1; : : : ; n;

o m( ) est la fonction inconnue et les erreurs sont indpendantes, de moyenne nulle et


de variance 2 . Ce modle peut scrire sous forme matricielle
Y = m + ":
Un lisseur linaire scrit simplement sous la forme
m
b 1 = SY;

o S est matrice de lissage de taille n n et m


b = Yb = (Yb1 ; : : : ; Ybn )t , sont les valeurs
ajustes. En gnral, un lisseur est paramtr par un paramtre de lissage (la fentre
pour un lisseur noyau, la pnalit pour les splines de lissage...). Nous crirons le lisseur
de faon quune valeur leve de corresponde un estimateur trs lisse. Classiquement,
il faut ensuite slectionner le paramtre .

Nous partons dun estimateur lisse ( grand), et calculons les rsidus cette premire
tape et nous corrigeons lestimateur initial ou pilote en enlevant les rsidus lisss (par
simplicit nous conserverons le mme lisseur chaque tape), cela donne
R1 = Y m
b 1 = (I S1 )Y
m
b2 = m
b 1 + S1 R 1
= (S1 + S1 (I S1 ))Y:

Nous itrons cette procdure et lestimateur ltape k peut scrire


m
b k = S1 Y + S1 (I S1 )Y +
+ S1 (I S1 )k 1 Y
= S1 [Y + (I S1 )Y +
+ (I S1 )k 1 Y ]
= S1 ^ k :
Cette formulation permet une valuation de la fonction en tout point x via
m
b k (x) = S1 (x) ^ k :

On peut montrer que le comportement de lestimateur dpend des valeurs singulires de


I S1 . Cependant cet estimateur na un intrt que si nous pouvons choisir le nombre
ditration k. Ce choix est obtenu en utilisant le critre de validation croise gnralise
k^GCV = arg min log b2

2 log 1

k2K

trace(Sk )
n

Les rsultats thoriques concernant cet estimateur se trouvent dans [1].

Mise en uvre pratique

Les premires donnes sur lesquelles nous avons mis en uvre cette mthode, sont les
consommations horaires dlectricit corriges des alas climatique et tarifaire. Lobjectif
consiste prvoir une journe entire de charge partir des 2 semaines prcdentes, ce
qui constitue un historique relativement faible, propice introduire un biais important
sur le prdicteur non-paramtrique.
Dans notre problme nous souhaitons prvoir une srie chronologique fZt gnt=1 . Pour
prvoir le futur de cette srie sans autre information, nous avons dcid destimer un
modle autorgressif non-linaire de mmoire 24, le modle gnral scrit donc
ZH = f (ZH 1 ; ZH 2 ; : : : ; ZH

24 )

+ "H

o f : R24 7! R est une fonction inconnue. Pour estimer cette fonction, nous utilisons
14 jours dhistorique. Nous considrons un estimateur de cette fonction, sans prjuger de
4

lexistence dventuelles interactions entre les heures. Pour cela, nous allons utiliser un
estimateur non-paramtrique par la mthode des noyaux.
Appelons Y le vecteur n = 336 mesures contenant les charges de 14 jours. Construisons les vecteurs n = 336 mesures X1 ; X2 ; : : : ; X24 contenant les consommations de ces
14 jours (et plus) dcales dune heure, de deux heures, etc. La matrice regroupant ces 24
vecteurs est appele X et contient sur la ligne i les charges horaires dcales dune heure
chaque fois. Sur les donnes dont nous disposons, le modle scrit sous forme vectorielle
comme suit :
Y = f (X1 ; : : : ; X24 ) + "
Nous utilisons le noyau produit gaussien. Pour x 2 R24 , nous avons :
Kh (x

24
Y
1
p exp
Xi: ) =
2
j=1

(xj

Xij )2
h

o Xi: reprsente la i-me ligne de la matrice X et h 2 R+ est la largeur de fentre (


dterminer).
Lajustement du vecteur des observations Y par la mthode des noyaux est alors :
Y^ = KY
o K est la matrice n n suivante :
2
Kh (0)=w1
Kh (X1: X2: )=w1 Kh (X1: X3: )=w1
6Kh (X1: X2: )=w2
Kh (0)=w2
Kh (X2: X3: )=w2
K=4
..
..
.
.

3
7
5

P
avec wi = nj=1 Kh (x Xi: ).
Pour appliquer la mthode itrative de rduction du biais, nous partons dun estimateur biais obtenu partir des largeurs de fentre fhj g24
j=1 trop larges. Dans la seconde
tape, les rsidus Y Y^ sont alors rajusts par la mme mthode. Comme les largeurs de
fentre sont trop leves, les rsidus de cette seconde tape contiennent encore du signal
et nous pouvons lors dune troisime tape les rajuster par la mme mthode. Nous
itrons donc ce procd et nous nous arrtons ltape K, choisie par validation croise
gnralise.
Le choix du nombre dtapes k est conduit grce au critre de validation croise gnralise. Ce modle permet donc en fonction des charges de 0 23h dune journe j de prvoir
la charge 0h de la journe j + 1. Cette prvision note Z^0 est simplement :
Z^0 = f^(Z23 ; Z22 ; : : : ; Z0 )

Pour prvoir la charge du jour j + 1 de 1h 23h, il su t dutiliser lestimation f^ de


f inconnue et de calculer
Z^1 = f^(Z^0 ; Z23 ; : : : ; Z1 )
jusqu :
Z^23 = f^(Z^22 ; Z^21 ; : : : ; Z^0 ; Z23 )
Nous pouvons alors calculer pour chaque jour des critres de qualit de prvision
comme le MAPE ou le RMSE. Nous donnerons les rsultats numriques obtenus et la
comparaison avec les mthodes SARIMA, du noyau classique et MARS. Nous montrerons
ainsi les apports de la mthode sur notre problmatique.
Enn, nous prsenterons les premiers rsultats sur la consommation dlectricit globale (non corrige des alas climatique et tarifaire) qui ncessite la prise en compte de
variables exognes, la temprature entre autre.

Bibliographie
[1] Cornillon P. A., Hengartner N., Matzner-Lber E. (2009) Recursive Bias Estimation
for high dimensional regression smoothers, soumis.
[2] Friedman, J. (1991) Multivariate adaptive regression splines, The Annals of Statistics,
Vol. 19 337407.
[3] Poggi J. M. (1994) Prvision non-paramtrique de la consommation lectrique, Revue
de Statistique Applique, Vol. 42 N 4 83-98.

Vous aimerez peut-être aussi