Académique Documents
Professionnel Documents
Culture Documents
evision de la consommation d
electricit
e par
correction it
erative du biais
Pierre-Andre Cornillon, Nicolas Hengartner, Vincent Lefieux, Eric
Matzner-Lber
Rsum
Une prvision correcte de la consommation dlectricit est fondamentale pour le bon
fonctionnement du rseau lectrique franais, dont Rseau de Transport dElectricit a la
charge. Les prvisions utilises quotidiennement par RTE sont issues dun modle alliant
une rgression paramtrique non linaire et un modle SARIMA. Dans lide dobtenir
un modle de prvision adaptatif, des mthodes de prvision non-paramtriques ont dj
t testes sans succs vritable. On sait notamment que la qualit dun prdicteur nonparamtrique rsiste mal un grand nombre de variables explicatives, ce quon appelle
communment le au de la dimension. Nous utilisons ici une mthode de correction
itrative du biais, en lissant les rsidus obtenus chaque tape. Nous prsentons dans
cette communication un exemple dapplication sur la consommation dlectricit franaise
pour lequel cette mthode se rvle performante.
Abstract
Rseau de Transport dElectricit (RTE), in charge of operating the French electric
transportation grid, needs an accurate forecast of the electricity consumption in order
to operate it correctly. The forecasts used everyday result from a model combining a
nonlinear parametric regression and a SARIMA model. In order to obtain an adaptive
forecasting model, nonparametric forecasting methods have already been tested without
real success. In particular, it is known that a nonparametric predictor behaves badly
with a great number of explanatory variables, what is commonly called the curse of
dimensionality. We use a method which iteratively corrects the bias initial estimator by
an estimate of the latter obtained by smoothing the residuals. We apply the method to
the french electricity consumption and show that the method compares favourably with
existing procedures.
Mots cls
Rgression non paramtrique, Mthode itrative, Lissage
Keywords
Nonparametric regression, Iterative procedure, Smoother
Problmatique
Llectricit ne se stockant pas, la production globale sur le rseau lectrique franais doit,
tout moment, tre strictement gale la consommation. Toute modication de la demande ou de la production dlectricit en un point du rseau se rpercute instantanment
sur tout le systme lectrique. Celui-ci doit donc sadapter en permanence pour satisfaire
lquilibre ore-demande.
La prvision court terme est un facteur essentiel pour assurer lquilibre entre la
production et la consommation durant la journe. La prvision faite par RTE permet
de garantir lquilibre physique global entre lore et la demande lchelle du pays. De
sa qualit dpendent le niveau des marges dexploitation ncessaires et plus largement la
sret du systme.
La solution actuellement en place sexplique historiquement. Les sries temporelles
ont connu un fort essor, notamment grce Box et Jenkins qui ont dvelopp leurs
modles SARIMA. Leur ouvrage a constitu une rfrence thorique, mais galement
un guide pratique assez riche, et ce particulirement dans le domaine lectrique. Choisir
SARIMA pour eectuer les prvisions tait donc a priori un choix techniquement pertinent
et quasiment naturel. Malheureusement, ces modles nintgrent pas de variables exognes
et il a donc fallu trouver un biais en leur adjoignant un modle de rgression (liant la
puissance consomme avec les variables climatiques et les signaux de prix).
Au nal, la prvision journalire seectue en trois tapes :
On corrige la courbe de charge de limpact du climat et des prix, an de se ramener
une srie temporelle ne dpendant plus des variables explicatives. On utilise
cet eet un modle de rgression, quon surnomme communment dans notre cas
modle de correction.
On utilise un modle SARIMA sur la srie ainsi corrige; la seule dynamique de
la srie permet de la prvoir.
On rutilise le modle de correction an dajouter la courbe corrige prvue
limpact futur du climat et des prix.
Mme si les rsultats oprationnels sont satisfaisants la plupart du temps, cette mthodologie prsente un certain nombre dinconvnients.
Le modle actuellement en place est complexe et il est trs di cile de modier sa
structure. Si on veut tester par exemple lincorporation dune nouvelle variable explicative,
il est peu probable dy parvenir facilement, la juxtaposition du modle de rgression et
du modle SARIMA ne permettant pas disoler les causes de lerreur nale de prvision.
De plus, une prvision mme en temps quoutil daide la dcision, devrait fournir un
intervalle de conance sur la prvision, ce qui est impossible pour linstant ; les mthodes
2
Prsentation de la mthode
i = 1; : : : ; n;
Nous partons dun estimateur lisse ( grand), et calculons les rsidus cette premire
tape et nous corrigeons lestimateur initial ou pilote en enlevant les rsidus lisss (par
simplicit nous conserverons le mme lisseur chaque tape), cela donne
R1 = Y m
b 1 = (I S1 )Y
m
b2 = m
b 1 + S1 R 1
= (S1 + S1 (I S1 ))Y:
2 log 1
k2K
trace(Sk )
n
Les premires donnes sur lesquelles nous avons mis en uvre cette mthode, sont les
consommations horaires dlectricit corriges des alas climatique et tarifaire. Lobjectif
consiste prvoir une journe entire de charge partir des 2 semaines prcdentes, ce
qui constitue un historique relativement faible, propice introduire un biais important
sur le prdicteur non-paramtrique.
Dans notre problme nous souhaitons prvoir une srie chronologique fZt gnt=1 . Pour
prvoir le futur de cette srie sans autre information, nous avons dcid destimer un
modle autorgressif non-linaire de mmoire 24, le modle gnral scrit donc
ZH = f (ZH 1 ; ZH 2 ; : : : ; ZH
24 )
+ "H
o f : R24 7! R est une fonction inconnue. Pour estimer cette fonction, nous utilisons
14 jours dhistorique. Nous considrons un estimateur de cette fonction, sans prjuger de
4
lexistence dventuelles interactions entre les heures. Pour cela, nous allons utiliser un
estimateur non-paramtrique par la mthode des noyaux.
Appelons Y le vecteur n = 336 mesures contenant les charges de 14 jours. Construisons les vecteurs n = 336 mesures X1 ; X2 ; : : : ; X24 contenant les consommations de ces
14 jours (et plus) dcales dune heure, de deux heures, etc. La matrice regroupant ces 24
vecteurs est appele X et contient sur la ligne i les charges horaires dcales dune heure
chaque fois. Sur les donnes dont nous disposons, le modle scrit sous forme vectorielle
comme suit :
Y = f (X1 ; : : : ; X24 ) + "
Nous utilisons le noyau produit gaussien. Pour x 2 R24 , nous avons :
Kh (x
24
Y
1
p exp
Xi: ) =
2
j=1
(xj
Xij )2
h
3
7
5
P
avec wi = nj=1 Kh (x Xi: ).
Pour appliquer la mthode itrative de rduction du biais, nous partons dun estimateur biais obtenu partir des largeurs de fentre fhj g24
j=1 trop larges. Dans la seconde
tape, les rsidus Y Y^ sont alors rajusts par la mme mthode. Comme les largeurs de
fentre sont trop leves, les rsidus de cette seconde tape contiennent encore du signal
et nous pouvons lors dune troisime tape les rajuster par la mme mthode. Nous
itrons donc ce procd et nous nous arrtons ltape K, choisie par validation croise
gnralise.
Le choix du nombre dtapes k est conduit grce au critre de validation croise gnralise. Ce modle permet donc en fonction des charges de 0 23h dune journe j de prvoir
la charge 0h de la journe j + 1. Cette prvision note Z^0 est simplement :
Z^0 = f^(Z23 ; Z22 ; : : : ; Z0 )
Bibliographie
[1] Cornillon P. A., Hengartner N., Matzner-Lber E. (2009) Recursive Bias Estimation
for high dimensional regression smoothers, soumis.
[2] Friedman, J. (1991) Multivariate adaptive regression splines, The Annals of Statistics,
Vol. 19 337407.
[3] Poggi J. M. (1994) Prvision non-paramtrique de la consommation lectrique, Revue
de Statistique Applique, Vol. 42 N 4 83-98.