Académique Documents
Professionnel Documents
Culture Documents
Titre:
stochastique au problème de planification de la production
Title:
d'hydroélectricité
Auteur:
Mouad Faik
Author:
Date: 2015
Type: Mémoire ou thèse / Dissertation or Thesis
Faik, M. (2015). Application de méthodes de programmation dynamique
Référence: stochastique au problème de planification de la production d'hydroélectricité
Citation: [Mémoire de maîtrise, École Polytechnique de Montréal]. PolyPublie.
https://publications.polymtl.ca/1832/
URL de PolyPublie:
https://publications.polymtl.ca/1832/
PolyPublie URL:
Directeurs de
recherche: Michel Gendreau, & Stéphane Krau
Advisors:
Programme:
Maîtrise en mathématiques appliquées
Program:
MOUAD FAIK
DÉPARTEMENT DE MATHÉMATIQUES ET DE GÉNIE INDUSTRIEL
ÉCOLE POLYTECHNIQUE DE MONTRÉAL
Ce mémoire intitulé :
DÉDICACE
REMERCIEMENTS
Je tiens d’abord à remercier mon directeur de recherche Michel Gendreau pour son support
tout au long de ma maîtrise. Je remercie en son nom le fond de recherche CRSNG-Hydro
Québec pour avoir financé ce projet. Mes remerciements vont également à mon codirecteur
de recherche Stéphane Krau pour son implication et sa disponibilité. J’exprime aussi mes
remerciement à Gréegory Émiel, consultant en modélisation à Hydro-Québec, pour ses sug-
gestions fructueuses et les échanges scientifiques que nous avons eus. Je remercie les membres
du jury qui ont enrichi ce mémoire par leurs commentaires pertinents.
Je souhaite exprimer ma gratitude à l’Institut national polytechnique de Grenoble, plus
particulièrement l’École nationale supérieure d’informatique et de mathématiques appliquées
de Grenoble (ENSIMAG) pour m’avoir donné l’opportunité de faire un double diplôme à
l’École Polytechnique de Montréal. Je remercie tous les professeurs des deux écoles pour la
richesse de leurs enseignements.
Je remercie tout le personnel du CIRRELT, en particulier Serge Bisaillon, pour l’aide quoti-
dienne qu’il apporte aux étudiants.
Je remercie tous mes amis sans exception pour les moments inoubliables que j’ai partagés
avec eux que ce soit en étudiant ou en jouant ou en voyageant...
Je tiens à exprimer ma vive reconnaissance envers mes parents, mes frères et sœurs ainsi que
mes neveux et nièces pour leur support moral continu et leur encouragement durant tout mon
parcours académique. Un grand merci à ma fiancée Ola pour son aide précieuse dans l’édition
de plusieurs graphiques utilisés dans ce mémoire ainsi que pour ses lectures et corrections de
mon texte.
v
RÉSUMÉ
ABSTRACT
DÉDICACE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
REMERCIEMENTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
RÉSUMÉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
CHAPITRE 1 INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Contexte : le Québec, un immense potentiel hydroélectrique . . . . . . . . . 3
1.3 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Contenu du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
CHAPITRE 7 CONCLUSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.1 Synthèse des travaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2 Limitations de la solution proposée . . . . . . . . . . . . . . . . . . . . . . . 91
7.3 Améliorations futures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
RÉFÉRENCES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
ANNEXES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
x
Sigles et abréviations
CHAPITRE 1 INTRODUCTION
1.1 Généralités
L’hydroélectricité est une source d’énergie renouvelable qui constitue une grande part de
l’électricité générée dans le monde. Le tableau 1.1 1 donne quelques statistiques sur l’utilisa-
tion de cette source :
Pays % de l’hydroélectricité
Norvège 96.7
Brésil 75.2
Venezuela 64.8
Canada 60.0
Suède 47.5
Chine 17.5
Russie 15.6
Inde 11.2
Japon 8.1
États unis 7.0
– présente peu de danger dans son exploitation, contrairement à l’énergie nucléaire (le séisme
et tsunami de 2011 au Japon dont les conséquences ne sont toujours pas complètement
contrôlées est encore très récent).
Au Québec, comme le montre la figure 1.1 4 , l’hydroélectricité est la source par excellence
d’énergie :
6%
2%
92%
– Maximiser les bénéfices : cet objectif est présent dans les systèmes dérégulés : système
où l’échange (Import/Export) d’électricité est libéralisé comme par exemple en Norvège.
Le Québec est une terre abondante en ressources hydriques (500 000 lacs et 4500 rivières
qui couvrent 12% de son territoire). Ses ressources sont exploitées par une infrastructure
d’envergure : 656 barrages, 97 ouvrages régulateurs et 26 grands réservoirs d’une capacité
de stockage de 175 TWh alimentant en eau 60 centrales hydroélectriques (d’une puissance
installée pouvant aller jusqu’à 5 616 MW). La puissance totale installée pour ces centrales est
de 35 364 MW. Ceci classe le système d’électricité du Québec parmi les plus écologiques au
monde avec environ 99% d’hydroélectricité. La figure 1.2 montre les zones de concentration
de la production, notamment la Grande Rivière (encadrée), et la manière avec laquelle elle
est transportée via des liaisons électriques haute-tension. 5
Cet important potentiel est géré par Hydro-Québec, une grande entreprise appartenant au
5. Source : http://www.hydroquebec.ca
4
1.3 Objectifs
Le présent mémoire est divisé en sept chapitres, y compris cette introduction. Le chapitre
2 contient une revue de littérature des méthodes connues de résolution du problème de pla-
nification de la production d’hydroélectricité, en particulier les méthodes de programmation
dynamique stochastique (SDP et SDDP). Le chapitre 3 présente plusieurs aspects de modé-
lisation qui entrent en jeu dans le domaine de l’hydroélectricité en général, notamment les
fonctions de production des centrales hydroélectriques et les apports hydriques naturels. Le
6
Ce chapitre présente une revue de littérature des méthodes utilisées dans la planification
moyen-terme de la production d’hydroélectricité. La section 2.1 présente le problème de ges-
tion de réservoirs sous une forme générale et classifie les méthodes qui ont été utilisées pour le
résoudre. Les sections 2.2, 2.3 et 2.4 traite respectivement des méthodes basées sur les arbres
de scénarios, des méthodes basées sur la programmation dynamique stochastique (SDP) et de
la méthode de programmation dynamique duale stochastique (SDDP). Finalement, la section
2.5 est consacrée aux fonctions de production des centrales hydroélectriques qui constitue un
élément central de modélisation dans le problème de planification de la production d’hydro-
électricité.
Si l’on fait l’hypothèse que les apports de chaque semaine, notamment ξ1 durant la première
semaine, sont connus au début de celle-ci, le problème de planification moyen-terme de la
production d’hydroélectricité s’écrit sous la forme suivante :
contraintes sur les décisions de la période t. La fonction f peut être vue comme la fonction
de transition du schéma de programmation dynamique du problème (2.1).
L’aléa ξ t peut porter sur plusieurs paramètres : apports hydriques naturels au réservoirs,
demande en électricité, prix de l’électricité etc. Dans cette revue, on se restreint au cas où
l’aléa porte seulement sur les apports hydriques naturels.
Dans le contexte de planification moyen-terme, on ne tient pas compte des non-linéarités qui
entrent en jeu dans les définitions exactes des fonctions f et Bt .
Le but ultime de la planification de la production d’hydroélectricité est de trouver une po-
litique de gestion optimale sur tout l’horizon de planification. À la période t, à partir d’un
état initial St−1 et un apport prévu ξ t , il faut prendre une décision optimale Xt qui maximise
la somme des bénéfices immédiat Bt (St−1 , ξ t , Xt ) et futur
max Bt+1 St , ξ t+1 , Xt+1 + ... + EξT max BT (ST −1 , ξ T , XT )
.
Eξt+1
Xt+1 ,St+1 XT ,ST
St+1 =f (St ,ξ t+1 ,Xt+1 ) ST =f (ST −1 ,ξ T ,XT )
La politique de gestion doit permettre au décideur de prendre à chaque période une décision
pesée qui représente un compromis entre les différentes réalisations de l’aléa futur. De manière
schématique, si l’apport hydrique peut avoir deux réalisations possibles : humide (H) et sec
(S), les décisions doivent prendre en compte les quatre scénarios représentés à la figure 2.1.
Apport
incertain conséquence
H OK
Hydro
S Autres sources
H Déversement
Autres sources
S OK
t t+1 temps
Plusieurs méthodologies ont été proposées pour résoudre le problème (2.1). Des articles tels
9
que ceux de Yeh (1985), Labadie (2004) et plus récemment Rani et Moreira (2010), ont résumé
ces méthodologies sous forme de revues qui ont grandement facilité le travail bibliographique
des chercheurs dans ce domaine.
Il est à noter que le problème (2.1) est formulé avec l’hypothèse d’information parfaite de
l’aléa ξ t à une période t donnée alors que l’aléa futur ξ t+1 , ξ t+2 , .., ξ T est stochastique.
Cette hypothèse est réaliste dans le cadre de la planification moyen- et long-terme (voir, par
exemple, Labadie (2004)).
Labadie (2004) classifie les méthodes de résolution de (2.1) en deux catégories :
– optimisation stochastique implicite : dont la procédure est schématisée dans la figure
2.2. Dans ce type de méthodes, (2.1) n’est pas globalement résolu sur le processus stochas-
(m)
tique (ξ t )t , mais plutôt sur un grand nombre M de scénarios possibles ξt , t = 1 .. T, m =
1 .. M . Chaque scénario est résolu via un modèle déterministe et a sa propre politique de
gestion. Une politique de gestion globale est par la suite construite via des méthodes de
régression à partir des politiques propres des M scénarios.
Apport
Modèle
Temps Modèle
stochastique
d'optimisation
d'apports Décision
ou déterministe
optimale
historique vs. Stock
long
Décision
Régression
multiple,
RNA, Stock
Méthodes
d'inférence
Politique
optimale
de gestion
Modèle de Raffinement
simulation et tests
max
Stock
min
Temps
L’inconvénient de ce type d’approches est que les politiques obtenues sont anticipatives.
Cette anticipativité est due au fait que l’on résout des problèmes déterministes dont les
décisions à une période t donnée ne prennent pas en compte toutes les réalisations possibles
de l’aléa qui aura lieu dans les périodes subséquentes.
– optimisation stochastique explicite : dont la procédure est schématisée dans la figure
2.3. Dans ce cas, le processus stochastique (ξ t )t est explicitement pris en compte et les
modèles utilisés sont stochastiques dans le sens que les décisions sont prises de sorte à
maximiser la somme du bénéfice immédiat et du bénéfice futur. Ce bénéfice futur est
explicitement formulé comme somme pondérée des bénéfices futurs de toutes les réalisations
de l’aléa futur.
Apport
non-excédance
historique de probabilité Probabilité de
long
Modèle Apport
d'optimisation
stochastique
Politique
optimale
de gestion
Modèle de Raffinement
simulation et tests
max
Stock
min
Temps
Les politiques issues de ce type d’approches sont plus fiables vu qu’elles sont fidèles à la
formulation rigoureuse du problème (2.1).
Dans la suite on expose trois types d’approches d’optimisation stochastique explicite, à
savoir les méthodes basées sur les arbres de scénarios, les méthodes basées sur la program-
mation dynamique stochastique sous sa forme récursive pure (ASDP) et la méthode de
programmation dynamique duale stochastique (SDDP) (Pereira et Pinto (1991)) qui est
une variante itérative de ASDP basée sur la décomposition de Benders (Benders (1962)).
11
Les méthodes basées sur une réduction à un arbre de scénarios du processus stochastique des
apports partent d’une discrétisation de celui-ci sous forme d’un arbre de scénarios fini. Un
arbre de scénarios est schématisé dans la figure 2.4.
t=1
t=2
t=3
Le problème (2.1) est reformulé de manière équivalente sur l’arbre de scénarios en associant
à chaque nœud n de l’arbre un vecteur de décisions Xn et en le liant à son nœud père avec
des contraintes équivalentes aux contraintes de transition St = f (St−1 , ξ t , Xt ) dans (2.1).
Le problème est ensuite résolu par une méthode de décomposition. Les méthodes de décompo-
sition connues pour résoudre un programme stochastique sur arbre de scénarios sont de deux
types : méthodes de décomposition par étape et méthodes de décomposition par scénario.
Les méthodes de décomposition par étape sont basées sur la décomposition de Benders (Ben-
ders (1962)) et affectent une fonction de bénéfice futur Fn à chaque nœud n de l’arbre. Ces
fonctions Fn étant concaves linéaires par morceaux, elles sont construites de manière itéra-
tive par ajout d’hyperplans coupants. La méthode L-Shaped (Birge et Louveaux (2011)) est
souvent utilisée dans ce contexte (Archibald et al. (1999)). Cette méthode peut être couteuse
dans le cas où l’arbre contient un grand nombre de nœuds. Pour contourner cette difficulté,
Santos et Diniz (2009) proposent une approche multi-périodes agrégeant plusieurs périodes
12
consécutives en une seule pour diminuer le nombre de fonctions de bénéfice futur Fn à définir.
Les méthodes de décomposition par scénario définissent un sous-problème pour chaque scéna-
rio. Le problème maître contient les contraintes liantes dites de non-anticipativité qui assurent
qu’à chaque nœud, une seule décision est prise quelle que soit le scénario qui le traverse. La
méthode la plus connue dans cette classe est le Progressive Hedging. Elle a été récemment
implémentée en gestion de réservoirs par Carpentier et al. (2013).
Les méthodes basées sur la réduction à un arbre de scénarios restent limitées en matière de
taille des arbres de scénarios. Ceci fait perdre au processus stochastique d’apport sa richesse
et contraint sa discrétisation.
Le problème (2.1) peut être écrit sous la forme récursive équivalente suivante :
(2.2)
Ft (St−1 ) = Eξt max Bt (St−1 , ξ t , Xt ) + Ft+1 (St ) t = 2 .. T
Xt ,St
St =f (St−1 ,ξ t ,Xt )
FT +1 ≡ 0.
réservoir est discrétisé en M valeurs. Si l’état du système est représenté seulement par les
volumes des réservoirs, la complexité de SDP est en O T × M R .
Pour contourner sa complexité, deux approches ont été proposées.
La première, communément appelée méthode d’agrégation-désagrégation, consiste à agréger
un ensemble de réservoirs en un seul puis lancer SDP sur le système agrégé. Une politique
de gestion est ainsi obtenue sur le système agrégé et nécessite un post-traitement de désagré-
gation pour être opérationnelle. Ce type d’approches a été largement utilisé pour résoudre
le problème de planification moyen- et long-terme dans un système multi-réservoirs afin de
surmonter la combinatoire de SDP. Archibald et al. (1997) décomposent le problème en sous-
problèmes dans chacun l’ensemble des réservoirs est divisé en trois réservoirs agrégés : les
réservoirs en amont d’un réservoir r, le réservoir r et les réservoirs en aval de r. Turgeon et
Charbonneau (1998) agrègent les réservoirs par rivière puis assemble toutes les rivières en un
seul réservoir.
Malgré que l’approche agrégation-désagrégation surmonte la combinatoire du problème multi-
réservoirs, des difficultés sont rencontrées dans le post-traitement de désagrégation (Saad
et al. (1994)).
La deuxième approche utilisée avec SDP pour contourner sa combinatoire consiste à éviter
d’évaluer la fonction de bénéfice futur sur tous les points d’une grille régulière mais plutôt
sur une sous partie de cette grille. Cervellera et al. (2006) utilisent des techniques telles que
les les tableaux orthogonaux, les hypercubes latins et les suites à discrépance faible pour
discrétiser efficacement l’espace d’état. Ayant évalué la fonction de bénéfice futur sur l’espace
discrétisé, Cervellera et al. (2006) utilisent une technique basée sur les réseaux de neurones
pour approximer cette fonction sur l’espace d’état entier. Plus récemment, Krau et al. (2015)
ont développé une technique de discrétisation en temps réel de l’espace d’état en le découpant
en hyper-rectangles.
de Matos et al. (2015) propose deux techniques pour accélérer SDDP. La première consiste à
ne pas simuler un nombre fixe de scénarios dans la phase vers l’avant mais plutôt d’augmenter
ce nombre progressivement au fil des itérations. La deuxième technique consiste à sélectionner
quelques coupes définissant les fonctions de bénéfice futur Ft lorsque l’on résout les problèmes
à une étape. Ces deux techniques réussissent à améliorer le temps d’exécution de SDDP.
Cependant, la deuxième peut dégrader la qualité de la politique de gestion comme le souligne
de Matos et al. (2015).
Aouam et Yu (2008) propose une autre technique pour améliorer la performance de SDDP
qui consiste à ajouter, au début de l’algorithme, des coupes de Benders exclusivement aux
0 0
fonctions de bénéfice futur Ft pour t = 2 .. T où T < T et ensuite exécuter l’algorithme
standard de SDDP sur tout l’horizon de planification.
La puissance électrique p (MW) générée par une centrale hydroélectrique s’exprime en fonc-
tion de la hauteur de chute h (m) et le débit turbiné q (m3 /s) :
Cependant cette hypothèse simplificatrice reste acceptable pour des centrales dont la hauteur
de chute fluctue peu autour d’une valeur nominale.
La procédure d’approximation concave la plus utilisée pour atteindre ce but consiste à ap-
proximer cette fonction par une fonction concave linéaire par morceaux en utilisant des
méthodes d’ajustement convexe linéaire par morceaux comme celle développée par Magnani
et Boyd (2009). Ce type d’approche a été utilisé, entre autres, par Goor et al. (2010a).
17
L’hydroélectricité est produite par l’intermédiaire d’une double conversion énergétique repré-
sentée dans la figure 3.1 :
réseau de transport
niveau amont
vanne d’ouverture
transformateur
et
grille à débris
alternateur hauteur
de chute
conduite
turbine
niveau aval
tube
d’évacuation
Quelles sont alors les caractéristiques des infrastructures et installations utilisées pour pro-
duire l’hydroélectricité ?
3.1.1 Réservoir
Un réservoir est une infrastructure faisant barrage à l’eau qui coule le long d’une rivière, il
permet ainsi de stocker l’énergie potentielle de l’eau. La figure 3.2 nous donne une image
d’un réservoir réel.
Réservoir
vmax
N iv
vmin
Centrale Évacuateur
Une centrale hydroélectrique est une usine de production d’électricité constituée de plusieurs
groupes turbines-alternateurs. Ces derniers peuvent être parallèlement exploités en totalité
ou en partie. Les groupes turbines-alternateurs, et donc les centrales hydroélectriques, sont
caractérisés par une fonction entrée-sortie appelée fonction débit-puissance qui dépend de la
hauteur de chute. Cette fonction sera étudiée dans la section 3.2.
On distingue deux types de centrales :
– centrale à réservoir : installée en aval d’un réservoir. Ce type de centrales exploitent souvent
une dénivellation de l’eau importante et produisent une grande puissance. La figure 3.4
donne une image de ce type de centrales.
– centrale au fil de l’eau : alimentée directement par un cours d’eau et ne disposant pas
de réservoir. Ce type de centrales ont une faible hauteur de chute et par conséquent la
puissance qu’elles produisent dépend uniquement du débit du cours d’eau. La figure 3.5
donne une image de ce type de centrales.
(celle ressentie par la centrale), notée hnette . La relation entre ces deux hauteurs de chute est
ηT/A
Rendement
qtracé qmax q
Débit
0
T/A
Les zones noircies sont des zones d’opération interdites (phénomènes de vibration ou cavita-
tion).
On peut aussi obtenir la valeur de la puissance à un débit q et hauteur de chute brute h
donnés par la relation de similitude suivante (Hammadia (2000), Breton et al. (2004)) :
!β !−α
hnette hnette
pT /A (q, h) = p0T /A q (3.3)
h0nette h0nette
!−α !β
h h
et β(h) représente .
h0 h0
h0
p0(α(h1)q)
Puissance
3
h1
Puissance utile
1 0 1
ß(h )p (α(h )q)
2
1
pd
Réservoir en amont
Canal 1 Canal 2
hauteur de chute
Conduites
Groupes U1 U2 U4 U5
T/A U3 U6
Canal de Canal de
décharge 1 décharge 2
La puissance générée par la centrale pour un débit turbiné total q, une hauteur de chute nette
h et un nombre U de groupes turbines-alternateurs engagés s’exprime comme la somme des
puissances générées par ses groupes turbines-alternateurs
U
X
pC (q, h) = pT /A (δ i q, h) (3.5)
i=1
U
X
où les variables (positives) δ i vérifient δ i = 1, le débit total q est reparti sur les groupes
i=1
turbines-alternateurs de façon à maximiser la puissance totale générée par la centrale tout en
respectant les contraintes de zones interdites des groupes turbines-alternateurs (Problème de
chargement optimal connu dans la littérature (e.g. Hammadia (2000), Breton et al. (2004))).
La formule (3.3) de transformation par similitude pour un groupe turbine-alternateur peut
être généralisée au cas d’une centrale
U
X
pC (q, h) = pT /A (δ i q, h)
i=1
!β !−α
U
h h
p0T /A 0
X
= δiq
i=1 h0 h
!β U !−α (3.6)
h h
p0T /A
X
= δ i q
h0 i=1 h0
!β !−α
h h
= p0C q ,
h0 h0
450
(q5,p5)
400
(q4,p4)
350
(q2,p2) (q3,p3)
deux groupes engagés
Puissance (MW)
300
250
200
(q1,p1)
un seul groupe engagé
150
100
50
0
(q0,p0) 0 200 400 600 800 1000 1200
aucun groupe engagé
Débit (m3/s)
Si, par exemple, le modèle que l’on optimise indique qu’il faut turbiner au pas t de durée ∆t
à un débit q tel que q10 < q < q20 , on interprète cela comme turbiner pendant λ∆t au débit q10
et pendant (1 − λ)∆t au débit q20 , où λ ∈ [0, 1] vérifie q = λq10 + (1 − λ)q20 .
26
0
À une autre hauteur de chute brute h1 , on peut obtenir les points (qi1 , p1i ), i ∈ {0, .., UC }
correspondants aux mêmes configurations de production via la formule de transformation par
similitude (3.6), i.e. !α
h1
1
qi = qi0
h0
(3.7)
!β
1
h
1
pi = p0i
h0
Ainsi, on peut obtenir une fonction de production pour tout l’espace (q, h). La figure 3.12 en
donne un exemple.
Cette fonction, quoique concave si l’on fixe la hauteur de chute, n’est pas globalement concave.
Ainsi pour l’utiliser dans un cadre général de programmation linéaire où l’on maximise la
production hydroélectrique, il faut l’approximer par une fonction concave au préalable. Des
méthodes pour l’approximer par une fonction concave sont introduites dans la section sui-
vante.
27
λ ≥ 0.
Ici,
– K : nombre d’hyperplans affines qui approximent la fonction pC (q, h), c’est un paramètre ;
– (aq,j , ah,j , bj ) , j = 1 .. K sont des variables à déterminer.
Pour déterminer les valeurs de ces variables, on utilise un algorithme présenté par Magnani et
Boyd (2009) qui essaie d’ajuster un nuage de points ui , yi ∈ Rn × R par une fonction convexe
linéaire par morceaux. Dans notre cas, le nuage de points consiste en (qi , hi ), pi ∈ R2 × R
qu’on essaie d’ajuster avec une fonction concave linéaire par morceaux.
n 0
o
À partir des points (qi0 , p0i ), i ∈ 0, .., UC qui correspondent aux fonctionnements de la
centrale à la hauteur de chute de référence, on obtient via (3.7) les points (qij , pji ), i ∈
n 0
o
0, .., UC pour différentes hauteurs de chute hj , j = 1 .. Nh . On obtient ainsi le nuage de
n 0
o
points (qij , hj ), pji (i, j) ∈ 0, .., UC × {1, .., Nh }. Sans restreindre la généralité et pour
alléger la description de l’algorithme de Magnani et Boyd (2009), on note ce nuage de points
0
(qi , hi ), pi i = 1 .. Nh × UC .
(0) (0)
L’algorithme part d’une partition P1 , .. PK initiale de l’ensemble des indices des éléments
n 0
o
du nuage de points 1 .. Nh × UC , trouve un hyperplan optimal au sens d’un critère donné
pour chaque ensemble de la partition, met à jour la partition et refait la même procédure
jusqu’à ce que la partition ne change pas ou qu’un nombre maximum d’itérations est atteint.
ALGORITHME DE PARTITIONNEMENT
n 0
o
(0) (0)
• Données : partition P1 , .. PK de 1 .. Nh × UC et nombre maximum d’itérations
lmax
• Pour l = 0 .. lmax
1. Pour j = 1 .. K
(l+1) (l+1) (l+1)
trouver un hyperplan affine aq,j , ah,j , bj approximant le nuage de points
(l)
restreint à l’ensemble Pj
(l+1) (l+1)
2. Construire une nouvelle partition P1 .. PK avec les nouveaux hyperplans, i.e.
n n oo
(l+1) (l+1) (l+1)
Pj = i, j = min r, min a(l+1)
q,s qi + ah,s hi + b (l+1)
s = a(l+1)
q,r q i + ah,r hi + b(l+1)
r
s=1 .. K
(l+1) (l)
3. STOP si Pj = Pj pour tout j = 1 .. K
(l+1) ∗
(l+1) (l+1) (l+1)
(aq,j qi + ah,j hi + bj − pi )2
X
Xj = aq,j , ah,j , bj ∈ argmin
. (3.10)
(aq,j ,ah,j ,bj ) (l)
i∈Pj
(l+1)
Dans le cas où la matrice Aj est inversible, i.e. le problème (3.10) admet une unique
(l+1) ∗
solution optimale Xj telle que
(l+1) ∗ (l+1) −1
(l+1)
Xj = Aj wj . (3.12)
Dans le cas contraire, i.e. le problème (3.10) admet une infinité de solution, plusieurs
(l+1) ∗
options peuvent être suivies. L’une d’elles est de trouver la solution Xj la plus proche
(l)
de la solution de l’itération précédente Xj au sens de la norme euclidienne
(l+1) ∗ (l) ∗
n o
(l+1) (l+1) (l+1) (l+1)
Xj ∈ argmin Xj − Xj , Aj Xj = wj . (3.13)
(l+1) 2
Xj
min z
z,aq,j ,ah,j ,bj
Cette variante peut être coûteuse lorsque les programmes linéaires (3.15) sont de taille
relativement grande.
Dorénavant, on fait référence à cette variante par PartMINMAX.
ALGORITHME DE PARTITIONNEMENT++
• Données : Nombre d’essais Nessais et nombre maximum d’itérations lmax
• Pour s = 1 .. Nessais
1. Générer une partition initiale aléatoire
2. Exécuter ALGORITHME DE PARTITIONNEMENT avec la partition générée et
lmax
3. Garder une trace de la meilleure approximation par hyperplans obtenue
Le point 1. de l’algorithme ci-dessus est fait, comme le suggère Magnani et Boyd (2009), de
la manière suivante
– K points deux à deux différents uj = (qj , hj ), j = 1 .. K du nuages sont tirés au hasard
n o
– Pj0 = i, ||(qi , hi ) − uj ||2 < ||(qi , hi ) − us ||2 ∀s 6= j , j = 1 .. K. Autrement dit Pj0 est
formé des points qui sont plus proches de uj que des autres us , s 6= j
Le point 3. de l’algorithme ci-dessus dépend du critère que l’on utilise dans l’algorithme de
partitionnement.
31
Si l’on est dans le cas de PartMC, le meilleur partitionnement est celui qui a la plus petite
erreur-type (RMSE) (en anglais « Root Mean Square Error »), qui s’écrit
v
u 0
Nh ×UC 2
1
u
u X
RM SE = t
0 min aq,j qi + ah,j hi + bj − pi . (3.16)
Nh × UC i=1
j=1 .. K
Si l’on est dans le cas de PartMINMAX, le meilleur partitionnement est celui qui a la plus
petite erreur maximum (ErreurMax), qui s’écrit
ErreurM ax = max 0
min aq,j qi + ah,j hi + bj − pi . (3.17)
i=1 .. Nh ×UC j=1 .. K
Dans le chapitre 6, une comparaisons des trois approches (EnvConc, PartMC, PartMIN-
MAX) est faite sur plusieurs centrales hydroélectriques. On montre que PartMC et Part-
MINMAX sont plus appropriées aux fonctions de productions des centrales considérées avec
un léger avantage pour PartMINMAX grâce à sa simplicité.
Les apports hydriques naturels sont généralement caractérisés par des aspects périodiques
(dus aux saisons de l’année) et stochastiques. La figure 3.13 illustre ces deux aspects en
traçant la courbe des apports par période hebdomadaire d’un historique de 53 années (la
période 1 correspond à la 1re semaine de janvier et ainsi de suite jusqu’à la 52e période qui
correspond à la dernière semaine de décembre).
Si l’on considère le cas d’une seule rivière, l’apport hydrique durant une période t donnée peut
être modélisé par une seule variable aléatoire At . La corrélation temporelle entre les apports
de différentes périodes est souvent modélisée par un modèle PAR(p) (Periodic Auoregressive
model of order p) dans lequel l’apport At est fonction des apports passés At−1 , .., At−p par
la formule p
At − µ t X At−j − µt−j
= φt,j + t . (3.18)
σt j=1 σt−j
14000
12000
8000
6000
4000
2000
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51
Semaine
A0 , .. , A1−p , où A1−i est l’apport hydriques à la rivière durant la ie période avant le début
de l’horizon considéré et ce en remontant dans le temps.
Dans le cadre de la programmation dynamique stochastique, plus le paramètre p est grand
plus la complexité de la résolution augmente (exponentiellement). C’est pour cette raison
que souvent on utilise juste un PAR(1). L’équation (3.18) devient
At − µ t At−1 − µt−1
= φt + t . (3.19)
σt σt−1
L’équation (3.19) contient une incohérence. En effet, le bruit t étant gaussien, il peut prendre
toute valeur réelle, même négative, ce qui peut emmener à des réalisations de signe négatif de
l’apport At . Pour éviter cela, une option serait d’utiliser plutôt une loi gaussienne tronquée
pour le bruit t . Une solution plus générale et qui présente aucune incohérence est d’utiliser
une transformation f de l’apport qui n’est pas affectée par les valeurs négatives que peut
prendre le bruit t , le modèle PAR(1) prend ainsi la forme
Un des candidats potentiels pour jouer le rôle de la fonction f dans (3.20) est la fonction
33
Les paramètres du modèle PAR(1) transformé (3.21) sont estimés à partir de l’historique
(i)
des apports. On dispose souvent d’un nombre H d’années de données historiques At , t =
1 .. T, i = 1 .. H. On peut ainsi faire les estimations suivantes, dans cet ordre et pour tout
t = 1 .. T :
H
1 X
(i)
1. µt ≈ µ̂t = ln At ;
H i=1
v
u H
u 1 X (i)
2
2. σt ≈ σ̂t = t ln At − µ̂t ;
H i=1
3. φt est obtenu par régression linéaire au sens des moindres carrés appliquée à (3.21), i.e.
(i)
(i)
2
H
X ln At − µ̂t ln At−1 − µ̂t−1
φt ∈ argmin −ϕ ;
ϕ i=1 σ̂t σ̂t−1
v
u
(i)
(i)
2
u
u 1 H
X ln At − µ̂t ln At−1 − µ̂t−1
4. σt ≈ σ̂t = t − φt .
H i=1 σ̂t σ̂t−1
Dans le cadre de l’optimisation stochastique approchée, on approxime souvent les vraies dis-
tributions (continues) des aléas par des distributions discrètes. Cette démarche est largement
utilisée en optimisation sur arbres de scénarios, en programmation dynamique stochastique
etc.
Les modèles PAR subissent aussi cette démarche classique et peuvent être discrétisé sous
forme d’un arbre de scénarios comme suit :
à partir de la valeur déterministe A0 , générer N réalisations de la variable aléatoire A1 via
l’équation (3.21). À partir de chaque réalisation de A1 générer N réalisations de la variable
aléatoire A2 . Et ainsi de suite jusqu’à atteindre la période T . La figure 3.14 illustre cette
démarche pour N = 2.
34
A0
(1) (2)
1 1
A1
En programmation dynamique stochastique et dans le cas où le processus des apports est régi
par un modèle PAR(1), la fonction de valeur de Bellman de la période t dépend de l’apport
passé At−1 . Comme on va le voir dans le chapitre 5, quand on utilise la transformation
(équation (3.21)) des apports, cette fonction de Bellman n’est plus convexe par rapport à
At−1 . Dans ce cas-ci, on est obligé de définir une fonction de valeur de Bellman propre à
chaque valeur de l’apport passé At−1 . Or, on peut observer dans la figure 3.14 que le nombre
de valeurs discrétisées de At−1 croit exponentiellement avec t (2t−1 si N = 2) ce qui rend
inefficace cette démarche de discrétisation du processus stochastique des apports.
Une alternative plus efficace pour discrétiser le processus stochastique des apports est d’échan-
(i)
tillonner a priori la variable aléatoire d’apport At en N quantiles Aet , i = 1 .. N pour
toute période t = 1 .. T . On passe alors d’une variable aléatoire continue At à une variable
aléatoire discrète Af . Cette discrétisation a priori se fait directement à partir de l’historique
t
sans utiliser les variables aléatoires t . Ces dernières sont toutefois cruciales pour approximer
les matrices des probabilités de transition P t où Pijt = P A f =A e(j) |A
f = e(i) .
A
t t t−1 t−1
On obtient ainsi un processus stochastique PAR(1) des apports hydriques naturels sous forme
d’une chaine de Markov à temps discret dont l’espace des états est fini.
35
A0
A2
A3
Durant une journée, la demande en électricité (puissance) peut varier. On distingue souvent
des heures de pointe, au matin par exemple, et des heures de consommation moyenne. Il est
alors judicieux d’inclure plusieurs classes de demande dans le problème de planification pour
que l’estimation des ressources utilisées soit plus fidèle à la fluctuation de la demande.
Chaque classe de demande cls est représentée par une proportion de durée δcls par rapport
à la durée totale ∆t du pas de temps t. Par exemple, pour un pas hebdomadaire (i.e. 168
heures) la classe de pointe a une proportion de 0.25, soit une durée de 42 heures, et la classe
normale 0.75, soit une durée de 126 heures. La figure 3.16 illustre la différence de demande
en puissance pour un cas de deux classes
10
Demande (GW)
4 classe
classe moyenne
pointe
2
0
30 42 60 90 120 150 168
Durée (h)
Le modèle de planification contient des variables de décisions (débit turbiné, puissance géné-
rée) pour chaque classe de demande.
37
4.1 Notation
Symboles et ensembles
Symbole Description
hm3 hectomètres cube (un million de mètres cube)
MW mega-watts
MWh mega-watts heure
$ dollar canadien
R ensemble des réservoirs
R+ ensemble des réservoirs à capacité positive
R− ensemble des réservoirs sans capacité
C ensemble des centrales hydroélectriques
C+ ensemble des centrales à hauteur de chute variable (i.e., centrales à réservoir)
C− ensemble des centrales à hauteur de chute fixe (i.e., centrales au fil de l’eau)
OE ensemble des ouvrages d’évacuation
C d (r) ensemble des centrales du réservoir r (d pour downstream)
OE d (r) ensemble des ouvrages d’évacuation du réservoir r
C u (r) ensemble des centrales dont l’eau turbinée va au réservoir r (u pour upstream)
OE u (r) ensemble des ouvrages d’évacuation dont l’eau déversée va au réservoir r
r réservoir
c centrale
oe ouvrage d’évacuation
r(c) réservoir de la centrale c
lr fonction donnant le niveau d’eau du réservoir r en fonction de son volume
pc fonction donnant la puissance générée de la centrale c en fonction de son débit
(cas d’une centrale au fil de l’eau)
Bt fonction de bénéfice immédiat de la semaine t
38
Constantes
Variables
Si seuls les apports hydriques sont stochastiques et s’ils suivent un modèle PAR(1), le pro-
blème de planification moyen-terme de la production d’hydroélectricité peut se formuler
comme suit
où
– B1 (V0 , A1 , X1 ) est la fonction bénéfice de la semaine 1, partant de l’état initial V0 , et ayant
l’apport hydrique A1 et ayant pris les décisions X1 ;
– Pour t = 2 .. T, Bt (Vt−1 , At , Xt ) est la fonction bénéfice de la semaine t, partant de l’état
initial Vt−1 (qui est en fait l’état final de la semaine t − 1), et ayant un apport hydrique
At et ayant pris les décisions Xt ;
– f ( . , . , . ) est une fonction de transition qui, partant d’un état initial au début d’une
semaine et un apport hydrique et des décisions durant cette semaine, renvoie l’état final
du système.
Hypothèse :
Dans la formulation ci-haut, on a fait l’hypothèse d’information parfaite (“Wait and see”), i.e.,
l’apport durant une période est connu d’avance et influence directement les décisions prises
durant cette période. En toute rigueur, cette hypothèse n’est pas indispensable. Cependant,
elle permet de rendre le problème plus réaliste vu que :
– les périodes de l’horizon de planification dans un contexte moyen-terme sont souvent des
semaines (parfois des mois). Il n’est donc pas réaliste de décider sans tenir compte de
l’apport hydrique durant une période donnée ;
– des modèles météorologiques et statistiques permettent au décideur d’avoir des prévisions
assez fiables à court-terme.
41
4.3.1 Objectifs
Pour la semaine 1, partant de l’état initial du système V0 et sachant qu’il y aura l’apport
hydrique A1 , l’objectif est de prendre une décision X1 de sorte à maximiser la somme du
bénéfice immédiat
et du bénéfice futur
EA2 |A1
max B2 (V1 , A2 , X2 ) + ...
.
X2 ,V2
V2 =f (V1 ,A2 ,X2 )
Pour une semaine t = 2 .. T − 1, partant d’un état initial du système Vt−1 et sachant qu’il y
aura un apport hydrique At , l’objectif est de prendre une décision Xt de sorte à maximiser
la somme du bénéfice immédiat
et du bénéfice futur
Pour t = T , partant d’un état initial du système VT −1 et sachant qu’il y aura un apport
hydrique AT , l’objectif est de prendre une décision XT de sorte à maximiser le bénéfice
immédiat
4.3.2 Contraintes
vr,t−1 + vr,t
u
lr,t = lr
2
donne le niveau du réservoir r en fonction de son volume moyen (sur une semaine). La fonction
lr (.) est concave linéaire par morceaux, La manière de la représenter dans un modèle linéaire
est détaillée dans l’annexe A.
La contrainte
0 ≤ vr,t ≤ vr
0 ≤ qoe,t ≤ qoe
u
hc,t = lr(c),t − lcd
u
donne la hauteur de chute de la centrale c, qui est la différence entre le niveau en amont lr(c),t
(niveau du réservoir r(c)) et le niveau en aval lcd .
Les contraintes
(j)
ppc,t ≤ a(j) p (j)
c,q qc,t + ac,h hc,t + bc , j = 1 .. Kc
(j)
pop (j) op
(j)
c,t ≤ ac,q qc,t + ac,h hc,t + bc , j = 1 .. Kc
donnent la puissance générée par la centrale à hauteur de chute variable c durant la classe
de demande de pointe et la classe de demande moyenne, respectivement. Il s’agit d’une
approximation concave linéaire par morceaux de la fonction de production de la centrale c
(voir section 3.2.4).
Les contraintes
p op hc,t 0
0 ≤ qc,t , qc,t ≤ q
h0c c
donnent les bornes sur le débit turbiné de la centrale : la borne supérieure de débit dépend
de la hauteur de chute.
Pour une centrale c à hauteur de chute fixe, les contraintes
ppc,t = pc qc,t
p
pop op
c,t = pc qc,t
p op
0 ≤ qc,t , qc,t ≤ qc0
Les contraintes
ppt =
X p
pc,t
c∈C
pop
X op
t = pc,t
c∈C
vr,0 + vr,1
u
lr,1 = lr ∀r ∈ R+
2
u
hc,1 = lr(c),1 − lcd ∀c ∈ C +
(j)
ppc,1 ≤ a(j) p (j)
c,q qc,1 + ac,h hc,1 + bc ∀c ∈ C + , j = 1 .. Kc
(j)
pop (j) op (j)
c,1 ≤ ac,q qc,1 + ac,h hc,1 + bc ∀c ∈ C + , j = 1 .. Kc
ppc,1 = pc qc,1
p
∀c ∈ C −
pop op
c,1 = pc qc,1 ∀c ∈ C −
pp1 =
X p
pc,1
c∈C
pop
X op
1 = pc,1
c∈C
0 ≤ vr,1 ≤ vr ∀r ∈ R+
p op hc,1 0
0 ≤ qc,1 , qc,1 ≤ q ∀c ∈ C +
h0c c
p op
0 ≤ qc,1 , qc,1 ≤ qc0 ∀c ∈ C −
0 ≤ qoe,1 ≤ qoe ∀oe ∈ OE
46
Pour t = 2 .. T − 1
équivaut à
EAt+1 |At
max Bt+1 (Vt , At+1 , Xt+1 ) + ...
Xt+1 ,Vt+1
Vt+1 =f (Vt ,At+1 ,Xt+1 )
X p op
τ p ρqc,t + τ op ρqc,t
X
s. à vr,t = vr,t−1 − − ρqoe,t
c∈C d (r) oe∈OE d (r)
X p op
τ p ρqc,t + τ op ρqc,t ∀r ∈ R+
X
+ + ρqoe,t + δr,t ρAt
c∈C u (r) oe∈OE u (r)
X p op
τ p ρqc,t + τ op ρqc,t
X
+ ρqoe,t =
c∈C d (r) oe∈OE d (r)
X p op
τ p ρqc,t + τ op ρqc,t ∀r ∈ R−
X
+ ρqoe,t + δr,t ρAt
c∈C u (r) oe∈OE u (r)
vr,t−1 + vr,t
u
lr,t = lr ∀r ∈ R+
2
u
hc,t = lr(c),t − lcd ∀c ∈ C +
(j)
ppc,t ≤ a(j) p (j)
c,q qc,t + ac,h hc,t + bc ∀c ∈ C + , j = 1 .. Kc
(j)
pop (j) op (j)
c,t ≤ ac,q qc,t + ac,h hc,t + bc ∀c ∈ C + , j = 1 .. Kc
ppc,t = pc qc,t
p
∀c ∈ C −
pop op
c,t = pc qc,t ∀c ∈ C −
ppt =
X p
pc,t
c∈C
pop
X op
t = pc,t
c∈C
0 ≤ vr,t ≤ vr ∀r ∈ R+
p op hc,t 0
0 ≤ qc,t , qc,t ≤ q ∀c ∈ C +
h0c c
p op
0 ≤ qc,t , qc,t ≤ qc0 ∀c ∈ C −
0 ≤ qoe,t ≤ qoe ∀oe ∈ OE
47
vr,T −1 + vr,T
u
lr,T = lr ∀r ∈ R+
2
u
hc,T = lr(c),T − lcd ∀c ∈ C +
(j)
ppc,T ≤ a(j) p (j)
c,q qc,T + ac,h hc,T + bc ∀c ∈ C + , j = 1 .. Kc
(j)
pop (j) op (j)
c,T ≤ ac,q qc,T + ac,h hc,T + bc ∀c ∈ C + , j = 1 .. Kc
p
ppc,T = pc qc,T ∀c ∈ C −
pop op
c,T = pc qc,T ∀c ∈ C −
ppT =
X p
pc,T
c∈C
pop
X op
T = pc,T
c∈C
pop op op
T + shT ≥ dT
0 ≤ vr,T ≤ vr ∀r ∈ R+
p op hc,T 0
0 ≤ qc,T , qc,T ≤ q ∀c ∈ C +
h0c c
p op
0 ≤ qc,T , qc,T ≤ qc0 ∀c ∈ C −
5.1 Notation
durant la semaine t
i1 indice de A1 dans la discrétisation de la variable aléatoire d’apport
A
f
1
49
Symboles
Symbole Description
Ft fonction de bénéfice futur de la semaine t−1 cas du vrai processus stochastique
d’apport (At )t
Fet fonction de bénéfice futur de la semaine t − 1 cas du processus stochastique
d’apport discrétisé A
f
t
t
(i) (i)
Fet fonction de bénéfice futur de la semaine t − 1 restreinte à l’apport Aet−1
e (i)
F approximation de la fonction Fet
(i)
t
FT +1 (AT , VT ) ≡ 0.
(5.1)
Les équations (5.1) constituent le schéma de programmation dynamique équivalent au pro-
blème (4.1).
la fonction Ft+1 est appelée fonction de bénéfice futur de la semaine t. Elle valorise l’état
du système à la fin de la semaine t. Ici, puisque les apports hydriques sont temporellement
corrélés (modèle PAR(1)), l’état du système est constitué, en plus des volumes des réservoirs,
de l’apport passé.
L’objectif de la planification moyen-terme de la production d’hydroélectricité est de déter-
miner ces fonctions de bénéfice futur qui permettront de prendre des décisions optimales à
chaque semaine qui tiennent compte de l’aléa futur. Or, il est difficile de trouver ces fonctions
lorsque les distributions des variables aléatoires (At )t sont continues (nombre infini de fonc-
tions à déterminer). C’est pour cette raison que l’on discrétise le processus d’apport (At )t
comme développé dans la section 3.3.3 et l’on passe du processus d’apport continue (At )t au
50
processus d’apport discret A
f . Les formules de récurrence précédentes deviennent
t
t
Θ
e =
1 max B1 (V0 , A1 , X1 ) + Fe2 (A1 , V1 )
X1 ,V1
V1 =f (V0 ,A1 ,X1 )
Fet Aet−1 , Vt−1 = EA
e t |Aet−1 max f ,X + F
Bt Vt−1 , A t t
e
t+1 A
f ,V
t t t = 2 .. T
Xt ,Vt
e t ,Xt )
Vt =f (Vt−1 ,A
FeT +1 ≡ 0.
(5.2)
Si les décisions à chaque semaine t sont prises en utilisant les fonctions de bénéfice futur
(Ft )t , on dit que les décisions suivent une politique de gestion. En particuliers, le vecteur des
volumes des réservoirs à la fin de la semaine t, Vt , est une fonction des apports qui ont eu
lieu jusqu’à t, i.e. Vt = Vt (A1 , A2 , .. , At ). La figure suivante illustre cet aspect
2
Vt+1
A2t+1
A1 At
V0 V1 Vt
A1t+1
1
Vt+1
Figure 5.1 Deux scénarios partageant les mêmes apports jusqu’à la semaine t
Les deux scénarios de la figure partageront les mêmes décisions, i.e. les mêmes volumes de
réservoirs V1 , .. Vt .
Cette propriété de politique de gestion nous permet d’écrire
Θ1 = EA2 , .. AT |A1 B1 (V0 , A1 , X1 ) + B2 (V1 , A2 , X2 ) + ... BT (VT −1 , AT , XT ) (5.3)
51
et
Θ
e
1 = EA
e 2, e T |A1
.. A
B1 (V0 , A1 , X1 ) + B2 V1 ,A
f
2 , X2 + ... BT VT −1 ,A
f
T , XT . (5.4)
Dans cette section, on démontre que la fonction de bénéfice futur Fet est concave et linéaire
par morceaux par rapport à Vt−1 . On démontre aussi que cette propriété n’est pas vérifiée
pour At−1 .
Dans Birge et Louveaux (2011), il est prouvé, dans le cas de variables aléatoires continues
indépendantes, que les fonctions de bénéfice futur sont concaves par rapport à la variable
d’état et que, lorsque le support des variables aléatoires est fini, ces fonctions sont de plus
linéaires par morceaux. La preuve est généralisable au cas que l’on étudie. En effet, pour
t = T,
FeT AeT −1 , VT −1 = EA
e T |AeT −1 max Bt (VT −1 , A
f , X )
T T FeT +1 ≡ 0
XT ,VT
VT =f (VT −1 ,A
e T ,XT )
Or AeT −1 , VT −1 7→ max Bt VT −1 , A
f ,X
T T est concave linéaire par morceaux
XT ,VT
VT =f (VT −1 ,A
e T ,XT )
par rapport à VT −1 car VT −1 fait partie du second membre des contraintes
VT = f VT −1 , A T et ainsi AT −1 , VT −1 7→ FT AT −1 , VT −1 est aussi concave linéaire
f ,X e e e
T
par morceaux par rapport à VT −1 car l’espérance mathématique est sur un ensemble fini de
valeurs possibles de la variable aléatoire A
f .
T
Pour t = T − 1,
FeT −1 AeT −2 , VT −2 = E max e T −1 , XT −1 + FeT A
BT −1 VT −2 , A e T −1 , VT −1 .
Ae T −1 |AT −2
e XT −1 ,VT −1
VT −1 =f VT −2 ,AT −1 ,XT −1
e
Puisque A T −1 , VT −1 7→ FT AT −1 , VT −1 est concave linéaire par morceaux par rapport à
f e f
52
VT −1 , le modèle
max BT −1 VT −2 , A T −1 , XT −1 + FT AT −1 , VT −1
f e f
XT −1 ,VT −1
VT −1 =f (VT −2 ,A
e T −1 ,XT −1 )
est concave linéaire par morceaux par rapport à VT −2 car VT −2 fait partie du second membre
des contraintes VT −1 = f VT −2 , A
f
T −1 , X T −1 et ainsi A
e
T −2 , VT −2 →
7 F
e
T −1 A
e
T −2 , VT −2
est aussi concave linéaire par morceaux par rapport à VT −2 car l’espérance mathématique est
sur un ensemble fini de valeurs possibles de la variable aléatoire A f
T −1 .
Il suffit de répéter le même raisonnement pour montrer que Aet−1 , Vt−1 7→ Fet Aet−1 , Vt−1
est concave linéaire par morceaux par rapport à Vt−1 pour tout t = 2 .. T .
Il est fréquent dans la littérature que l’on étend le caractère concave linéaire par morceaux de
la fonction de bénéfice futur Fet à l’apport passé Aet−1 ce qui nous permet de rassembler l’état
volume Vt−1 et l’état apport passé Aet−1 et dire, tout simplement, que Fet est concave linéaire
par morceaux sur son domaine de définition (i.e. par rapport à l’état St−1 = Aet−1 , Vt−1 ).
Ceci est possible lorsque les apports suivent un modèle PAR(1) de la forme
At − µ t At−1 − µt−1
= φt + t .
σt σt−1
σt σt
A
f =
t φt Aet−1 −φt µt−1 + µt + σt t .
σt−1 σt−1
| {z } | {z }
coefficient terme
indépendant de indépendant de
la valeur de la valeur de
A
et−1 A
et−1
Ainsi, indirectement, Aet−1 fait partie du second membre des contraintes Vt = f Vt−1 , A
f ,X
t t
f ,X + F
Bt Vt−1 , A
dans max t+1 At , Vt .
e f
t t
Xt ,Vt
Vt =f (Vt−1 ,A
e t ,Xt )
Une preuve similaire à celle développée dans la sous-section précédente nous permet de mon-
53
trer que pour tout t = 2 .. T, Fet est concave linéaire par morceaux par rapport à Aet−1 .
Malheureusement, ceci n’est plus le cas quand on considère un modèle PAR(1) de la forme
Ceci nous oblige à définir une fonction de bénéfice futur pour chaque cas d’apport passé.
(i) (i)
Par la suite, on note Fet (Vt−1 ) = Fet Aet−1 , Vt−1 , t = 3 .. T et Fe2 (V1 ) = Fe2 (A1 , V1 ).
(i)
On a vu que la fonction Vt−1 7→ Fet (Vt−1 ) est concave linéaire par morceaux, et comme Vt−1
est borné elle peut être exprimée comme maximum d’un nombre fini d’hyperplans supports,
(i) (i) (i) (i)
i.e. il existe Kt < ∞ et αt,m , βt,m m = 1 .. Kt tels que pour tout Vt−1
(i) (i) T (i) (i)
Fe (V
t t−1 ) = max αt,m Vt−1 + βt,m = max Θt
(i) (i)
m=1 .. Kt Θt
(i) (i) T (i) (i)
s.à Θt ≤ αt,m Vt−1 + βt,m m = 1 .. Kt .
(i)
Ainsi pour représenter de façon complète la fonction Fet il suffit de trouver les pentes
(i)
αt,m (i) et les ordonnées à l’origine (βt,m )m=1 .. K (i) .
m=1 .. Kt t
(i)
Comment trouver alors l’expression ainsi décrite de Fet ?
(j)
Supposons que l’on dispose de Fet+1 pour un certain t ∈ {2 .. T } et pour tout j = 1 .. N , on
a, en tout point Vt−1 ,
(i)
Fet (Vt−1 ) = EA (i)
e t |Ae
max f ,X + F
Bt Vt−1 , A t t
e
t+1 At , Vt
f
t−1 Xt ,Vt
Vt =f (Vt−1 ,A
e t ,Xt )
N
Pijt f(j) , X (j)
X
= max Bt Vt−1 ,A t t + Fe t+1 (Vt ) .
Xt ,Vt
j=1
e (j)
Vt =f Vt−1 ,A t ,Xt
54
Donc
N
(i) f(j) , X (j)
Pijt ∂
X
∂ Fe (V
t t−1 ) = max Bt ., At t + Fe t+1 (Vt ) (Vt−1 )
Xt ,Vt
j=1
e t(j) ,Xt
Vt =f .,A
où π (j) sont des valeurs duales optimales des contraintes de conservation de masse des réser-
voirs à capacité positive (les contraintes dans lesquelles Vt−1 apparait dans le second membre).
Donc
N
(i) (j)
Pijt πt .
X
∂ Fet (Vt−1 ) =
j=1
(i)
Ainsi on obtient l’hyperplan support H de Fet au point Vt−1
Soit
(i) (i) T (i) (i) T
H : Θt ≤ ∂ Fet (Vt−1 ) Vt−1 + Fet (Vt−1 ) − ∂ Fet (Vt−1 ) Vt−1
| {z } | {z }
(i) T βt
(i)
αt
Cette procédure de construction d’hyperplans supports est schématisée dans la figure 5.2.
55
(i)
Fet (Vt−1 )
(i)
Fet (Vt−1 )
Vt−1 V Vt−1
Figure 5.2 Illustration d’une fonction de bénéfice futur et ses hyperplans supports
En pratique, ce n’est pas une tâche facile de déterminer tous les hyperplans supports des
(i) e (i) concave linéaires
fonctions Fet . On se contente plutôt de les approximer par des fonctions F t
par morceaux dont les hyperplans supports sont des hyperplans coupants des fonctions Fe2
e (i) et F
respectives. En particulier, Fe2 ≤ F e (i) ≤ F
e (i) pour tout t = 3 .. T et tout i = 1 .. N .
t t t
(i)
Les fonctions Ft sont définies ainsi pour tout t = 3 .. T et tout i = 1 .. N
e
e (i) (V ) = E
F t t−1 Ae t |Ae(i)
max Bt Vt−1 , A
f ,X + F
t t
e
t+1 At , Vt
f
t−1 Xt ,Vt
Vt =f (Vt−1 ,A
e t ,Xt )
N
Pijt f(j) , X e (j)
X
= max Bt Vt−1 ,A t t +F t+1 (Vt )
Xt ,Vt
j=1
e t(j) ,Xt
Vt =f Vt−1 ,A
e (j) ≡ 0 j = 1 .. N .
avec F T +1
56
e de F
On définit, de même, l’approximation F e
2 2
e (V ) = E
F2 1 A
e 2 |A1 max Bt V1 , A
f ,X + F
2 2
e A
3
f ,V
2 2
X2 ,V2
V2 =f (V1 ,A
e 2 ,X2 )
N
Pij2 f(j) , X (j)
X
= max Bt V1 ,A 2 2 + F3 (V2 ) .
e
X2 ,V2
j=1
e 2(j) ,X2
V2 =f V1 ,A
e ≈
Θ max B1 (V0 , A1 , X1 ) + F
e (V )
1 2 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )
(i) e (i)
La figure 5.3 illustre les deux fonctions : Fet et son approximation F t
(i)
F
e
t
(i)
Ft
e
V Vt−1
Figure 5.3 Approximation d’une fonction de bénéfice futur par des hyperplans coupants
57
(i)
Le problème (5.2) peut-être résolu à l’optimalité. Des approximations Fe
t (respectivement
(i)
F2 ) aux fonctions Ft (respectivement à la fonction F2 ) sont construites récursivement de
e e e
e (i) .
L’algorithme suivant permet de construire récursivement les fonctions F t
58
• Pour tout t = T .. 2
◦ Pour tout Vt−1 ∈ D
1. Pour tout j = 1 .. N
(j) (j) (j)
(a) Résoudre P Lt : max Bt Vt−1 , A
f ,X + F
t t
e
t+1 (Vt )
Xt ,Vt
(j)
Vt =f Vt−1 ,A
e t ,Xt
(j) (j)
(b) Récupérer la valeur optimale de l’objectif Zt de P Lt ainsi que les valeurs
(j)
duales optimales relatives aux contraintes de conservation de masse des
πt
réservoirs à capacité positive
2. Si t > 2
(a) Pour tout i = 1 .. N
N
e (i) (V ) = Pijt Zt
(j)
X
i. Calculer F t t−1
j=1
N
e (i) (V Pijt πt
(j)
X
ii. Calculer ∂F t t−1 ) =
j=1
e (i) l’hyperplan coupant
iii. Ajouter à la définition de F t
3. Sinon (t = 2)
N
(j)
Pi21 j Z2
X
(a) Calculer F
e (V ) =
2 1
j=1
N
(j)
Pi21 j π2
X
(b) Calculer ∂ F
e (V ) =
2 1
j=1
T
H : Θ2 ≤ ∂ F
e (V ) (V − V ) + F
2 1 1 1
e (V )
2 1
Cette méthode, quoique exacte, a une complexité exponentielle. En effet, sans restreindre la
généralité, supposons que l’on discrétise le volume d’un réservoir r en M valeurs distinctes, ce
qui donne |D| = M |R | . En supposant que la complexité de 1.(a). est en O(1), la complexité
+
59
de la méthode
ci-dessus, en d’autres termes le nombre de programmes linéaires à résoudre,
est en O T × N × M |R+ |
. Le tableau 5.3 donne un ordre de grandeur de cette complexité
pour N = 5, M = 20, T = 52 (horizon d’une année) et différentes valeurs de |R+ |.
T × N × M |R |
+
|R+ |
1 5 200
2 104 000
3 2 080 000
4 41 600 000
5 832 000 000
6 16 640 000 000
On observe bien que cette méthode serait très couteuse même pour une valeur modeste de
M = 20.
2. Si t < T
(a) Conserver la valeur optimal Vt = Vt (volume initial pour l’étape suivante)
(i )
(b) Conserver l’état candidat Aet t , Vt pour la passe vers l’arrière
(i ) (i ) T (i )
e t−1 (V ) (V
H : Θt t−1 ≤ ∂ Ft t−1
e t−1 (V )
t−1 − Vt−1 ) + Ft t−1
3. Sinon (t = 2)
N
(j)
Pi21 j Z2
X
(a) Calculer F
e (V ) =
2 1
j=1
N
(j)
Pi21 j π2
X
(b) Calculer ∂F
e
2 (V1 ) =
j=1
T
H : Θ2 ≤ ∂ F
e (V ) (V − V ) + F
2 1 1 1
e (V )
2 1
Comme mentionné avant, la méthode SDDP effectue une passe vers l’avant suivie d’une passe
vers l’arrière à chaque itération. Souvent, on fixe un nombre maximum d’itérations Imax . Ci-
après le pseudo-code de l’algorithme SDDP.
62
SDDP : L’ALGORITHME
• Données : Un nombre maximum d’itérations Imax
• Pour tout l = 1 .. Imax
1. Exécuter une PASSE VERS L’AVANT
2. Exécuter une PASSE VERS L’ARRIÈRE
Un des critères d’arrêt les plus utilisés dans SDDP est le critère d’intervalle de confiance : une
borne inférieure et un intervalle de confiance sur la borne supérieure de Θ e (5.2) sont calculés.
(5.5) implique
B1 (V0 , A1 , X1∗ ) + F
e (X ∗ ) ≥ B (V , A , X ∗∗ ) + F
2 1 1 0 1 1
e (X ∗∗ ) .
2 1
B1 (V0 , A1 , X1∗∗ ) + F
e (X ∗∗ ) ≥ B (V , A , X ∗∗ ) + F
2 1 1 0 1 1
e (X ∗∗ ) .
2 1
B1 (V0 , A1 , X1∗ ) + F
e (X ∗ ) ≥ B (V , A , X ∗∗ ) + F
2 1 1 0 1 1
e (X ∗∗ ) .
2 1
Ainsi
max e (V ) ≥ Θ
B1 (V0 , A1 , X1 ) + F e . (5.7)
2 1 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )
63
Θ1 = max B1 (V0 , A1 , X1 ) + F
e (V ) .
2 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )
Borne inférieure
Notons S le nombre de scénarios A
f
t possibles S = O N T .
t
Soient (Zs∗∗ )s les valeurs optimales de l’objectif si l’on simule les S scénarios avec les fonctions
(i)
de bénéfices futurs Fe2 et Fet . (5.4) peut être réécrite
t,i
S
P (s)Zs∗∗
X
Θ
e
1 = (5.8)
s=1
S S
P (s)Zs∗ ≤ P (s)Zs∗∗ ,
X X
(5.9)
s=1 s=1
soit
S
P (s)Zs∗ ≤ Θ
X
e .
1 (5.10)
s=1
Θ1 − zα/2 √σ 0 , Θ1 + zα/2 √σ est un intervalle de confiance à 100(1 − α)% pour Θ où zα/2
S S0
est le (1 − α)-quantile de la loi normale centrée réduite. On prend souvent α = 0.5 ce qui
donne z0.025 = 1.96.
5.7.5 Convergence
n’est pas nécessaire dans notre cas car on utilise toutes les N réalisations possibles pour
calculer une nouvelle coupe. La preuve de Philpott et Guan (2008) est plus générale dans
le sens qu’elle n’exige pas d’utiliser toutes les réalisations possibles (si N est grand cela
peut-être fastidieux).
Cette section est basée sur l’article en cours de rédaction intitulé « Adaptive discretization of
the state space for stochastic dynamic programming applied to multireservoir system » des
auteurs Stéphane Krau, Grégory Émiel, James Merleau et Robert Leconte. On essaiera dans
cette section de présenter l’idée générale sans rentrer dans les petits détails qui sont décris
dans l’article précité.
La méthode ASDP est très similaire à la méthode SDP présenté précédemment. La seule
65
(i)
différence consiste à utiliser une discrétisation adaptée de l’espace des états Dt−1 au lieu de
la discrétisation a priori D pour construire la fonction de bénéfice futur F e (i) utilisée dans
t
(i)
SDP. Cette discrétisation Dt−1 , bien entendu, dépend de t et de i (pour t = 2 on utilise une
seule discrétisation D1 puisqu’une seule fonction de bénéfice futur Fe2 est à déterminer). Le
but étant de ne pas discrétiser de façon uniforme l’espace des états, mais plutôt discrétiser
là où la fonction de bénéfice futur Fe (i) présente une forte courbure.
t
V∗
Les hyper-rectangles H sont triés en temps réel par ordre décroissant de εHmax et à chaque
H n
itération l’hyper-rectangle avec la plus grande εmax est découpé en 2 hyper-rectangles fils.
Cette méthode nécessite la résolution d’un programme linéaire pour chacun des 2n hyper-
rectangles fils à chaque découpage d’un hyper-rectangle père, elle peut ainsi devenir couteuse
à mesure que la dimension de l’espace d’état volume augmente. Dans la sous-section suivante,
une méthode simple de découpage est présentée.
Au lieu de trouver le point intérieur d’un hyper-rectangle H qui maximise l’erreur εH max , on
calcule l’erreur sur chacune des n2n−1 arêtes e de H et on regroupe ces erreurs par dimen-
sion, i.e. l’erreur associée à une dimension de l’espace état volume correspond à la somme des
erreurs des 2n−1 arêtes qui lui sont parallèles. L’hyper-rectangle est ensuite découpé en deux
hyper-rectangles fils de volumes égaux suivant la dimension de plus forte erreur. Cette nou-
velle manière de découper engendre seulement 2n−1 nouveaux échantillons par hyper-rectangle
découpé.
L’avantage de cette méthode de découpage est qu’elle ne nécessite pas de résolution d’un
programme linéaire car l’erreur sur une arête peut être calculée analytiquement comme le
montre la figure 5.4.
εemax
Figure 5.4 Calcul analytique de l’erreur sur une arête d’un hyper-rectangle
En effet, il suffit de trouver le point d’intersection des deux droites de l’extrapolation, l’erreur
est alors la distance de ce point à la droite d’interpolation.
– Si (t = 2)
◦ Tant que |D1 | < Dmax
1. Découper l’hyper-rectangle H de D1 ayant le plus grand volume d’erreur.
2. Pour tout sommet V1 nouvellement ajouté à Dt−1
(a) Pour tout j = 1 .. N
(j) (j) (j)
i. Résoudre P L2 : max e 2 , X2 + e
B2 V1 , A F3 (V2 )
X2 ,V2
V2 =f V1 ,A2 ,X2 e (j)
(j) (j)
ii. Récupérer la valeur optimale de l’objectif Z2 de P L2 ainsi que les valeurs duales opti-
(j)
males π2 relatives aux contraintes de conservation de masse des réservoirs à capacité positive
N
X (j)
F2 (V1 ) =
(b) Calculer e Pi21 j Z2
j=1
N
X (j)
(c) Calculer ∂ e
F2 (V1 ) = Pi21 j π2
j=1
F2 l’hyperplan coupant
(d) Ajouter à la définition de e
T
H : Θ2 ≤ ∂ e
F2 (V1 ) (V1 − V1 ) + e
F2 (V1 )
69
Au lieu de fixer a priori un nombre maximum Dmax d’échantillons de l’espace d’état volume,
on peut avoir un critère d’arrêt sur le volume d’erreur maximal des hyper-rectangles. Dès que
le volume d’erreur est en bas d’une tolérance fixée, on estime que les fonctions de bénéfice futur
de la semaine courante sont suffisamment approximées et on passe à la semaine précédente.
5.8.5 Convergence
(i)
Tout comme SDP (cf. section 5.6), plus Dmax est grand plus les approximations F e ,F
2
e
t
(i)
s’approchent des vraies fonctions Ft , Ft , et on peut de même affirmer qu’à partir d’une
e e
Ce chapitre présente les résultats de l’application de la méthodologie vue dans les chapitres
précédents sur un cas réel : La Grande rivière située au nord de la province de Québec (voir
la figure 1.2). Il s’agit de la rivière qui fournit la plus importante part d’électricité au Québec.
Le chapitre est découpé en trois sections majeures. Dans la première section, on décrit le cas
d’étude. Dans la deuxième section, une comparaison des deux modélisations des fonctions
de production des centrales hydroélectriques vues au chapitre 3 est faite sur les centrales
considérées. Enfin, on fournit dans la troisième section les résultats de l’application des mé-
thodes SDDP et ASDP vues au chapitre 5 au problème de planification moyen-terme de la
production d’hydroélectricité.
LGR contient six réservoirs dont quatre sont des réservoirs à capacité positive (peuvent
stocker l’eau) : Caniapiscau, La Grande4 , La Grande3 , La Grande2 . Les réservoirs La Forge2
et La Forge1 sont considérés comme réservoirs sans capacité. Le tableau 6.1 donnent les
caractéristiques des quatre réservoirs à capacité positive.
Équivalent
énergétique
Réservoir Volume maximum (hm3 ) approximatif (GWh)
À chaque réservoir de LGR sont associés une centrale hydroélectrique et un ouvrage d’éva-
cuation. Rappelons qu’un réservoir à capacité positive possède une centrale à hauteur de
chute variable et qu’un réservoir sans capacité possède une centrale à hauteur de chute fixe.
Le tableau 6.2 donne les caractéristiques des centrales de LGR, on y trouve la hauteur de
chute, le débit et la puissance maximums à la hauteur de chute de référence.
71
0
Centrale hmax (m) qmax (m3 /s) p0max (MW)
Le tableau 6.3 donne les débits maximums des ouvrages d’évacuation de LGR.
Caniapiscau ∞
La Forge2 2 475.00
La Forge1 2 958.50
La Grande4 7 723.23
La Grande3 10 507.00
La Grande2 16 415.00
La figure 6.1 illustre la disposition et les relations entre les différentes composantes de LGR.
On y voit en particulier que le déversement au niveau de Caniapiscau est hors-système
(confluent) et il est préférable de le réduire le plus possible vu que plusieurs autres réser-
voirs sont en bas de Caniapiscau et pourraient donc utiliser cette eau « gaspillée ».
72
Apport naturel
Caniapiscau
La Forge2
Réservoir a
capacité positive
Réservoir
La Forge1 sans capacité
Centrale
hydroélectrique
La Grande4 Ouvrage
d’évacuation
Chemin d’eau
La Grande3 Confluent
Légende
La Grande2
Les modèles de planification de la production d’hydroélectricité que l’on traite visent, entre
autres, à satisfaire la demande en électricité. La figure 6.2 illustre la demande à satisfaire
sur une année (on considère que la demande est stationnaire, c’est à dire qu’elle demeure
inchangée d’une année à l’autre). On considère deux classe de demande : une classe pointe
et une classe moyenne qui dure respectivement 42h et 126h sur une semaine (168h).
14000
12000
10000
Demande (MW)
8000
6000
4000
2000
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
Semaine
Classe pointe Classe moyenne
Chacune des trois modélisations vues au chapitre 3 sont évaluées sur une grille fine G de
l’espace débit-hauteur de chute (q, h). Le critère d’évaluation du résultat d’une modélisation
donnée est l’erreur-type sur la grille G, RM SEG
v
u 1 X
RM SEG = (peC (qi , hi ) − pC (qi , hi ))2 (6.1)
u
t
|G| (qi ,hi )∈G
74
où peC est la fonction puissance approximée ((3.8) dans le cas de EnvConc, (3.9) dans le cas
de PartMC ou PartMINMAX) et pC est la fonction puissance exacte (3.6).
Le tableau 6.4 donnent la taille des grilles utilisées.
Centrale |G|
Caniapiscau 16 962
La Grande4 32 832
La Grande3 49 521
La Grande2 56 225
Le tableau 6.5 donne, pour chacune des centrales à hauteur de chute variable, l’erreur-type
RM SEG de la production estimée et le pourcentage de RM SEG par rapport à la puissance
installée de la centrale quand on approxime les fonction de production des centrales par la
méthode EnvConc.
Pour les deux variantes PartMC et PartMINMAX, les plans affines sont obtenus sur
un sous-ensemble de la grille constitués des points (q, h, p) de configurations optimales pour
différentes valeurs de la hauteur de chute, ceci est tout à fait raisonnable car une centrale est
utilisée dans l’une de ces configurations.
Les résultats de l’application de l’algorithme de partitionnement sur les fonctions de produc-
tions des 4 centrales à hauteur de chute variable du cas d’étude sont résumés dans les figures
6.3, 6.4, 6.5 et 6.6. L’erreur-type est représentée en pourcentage de la puissance installée
75
de la centrale. À noter que pour ces résultats, on a choisit les paramètres Nessais = 100 et
lmax = 200.
Caniapiscau Caniapiscau
4 5 4 5
3.5 3.5
4 4
3 3
Nombre d`hyperplans
Nombre d`hyperplans
2.5 2.5
3 3
RMSEG [%]
RMSEG [%]
2 2
2 2
1.5 1.5
1 1
1 1
0.5 0.5
0 0 0 0
12 18 24 30 36 42 48 54 60 66 72 78 84 90 96 102 108 114 120 12 18 24 30 36 42 48 54 60 66 72 78 84 90 96 102 108 114 120
Figure 6.3 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale Caniapiscau)
La Grande4 La Grande4
0.9 6 0.9 6
0.8 0.8
5 5
0.7 0.7
Nombre d`hyperplans
Nombre d`hyperplans
0.6 4 0.6 4
RMSEG [%]
RMSEG [%]
0.5 0.5
3 3
0.4 0.4
0.3 2 0.3 2
0.2 0.2
1 1
0.1 0.1
0 0 0 0
26 39 52 65 78 91 104 117 130 143 156 169 182 195 208 221 234 247 260 26 39 52 65 78 91 104 117 130 143 156 169 182 195 208 221 234 247 260
Figure 6.4 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale La Grande4 )
76
La Grande3 La Grande3
1.6 6 1.6 6
1.4 1.4
5 5
1.2 1.2
Nombre d`hyperplans
Nombre d`hyperplans
4 4
1 1
RMSEG [%]
RMSEG [%]
0.8 3 0.8 3
0.6 0.6
2 2
0.4 0.4
1 1
0.2 0.2
0 0 0 0
32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 272 288 304 320 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 272 288 304 320
Figure 6.5 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale La Grande3 )
La Grande2 La Grande2
0.25 11 0.25 11
10 10
0.2 9 0.2
9
Nombre d`hyperplans
Nombre d`hyperplans
8 8
7 7
0.15 0.15
RMSEG [%]
MQG [%]
6 6
5 5
0.1 0.1
4 4
3 3
0.05 2
0.05
2
1 1
0 0 0 0
58 87 116 145 174 203 232 261 290 319 348 377 406 435 464 493 522 551 580 58 87 116 145 174 203 232 261 290 319 348 377 406 435 464 493 522 551 580
Figure 6.6 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale La Grande2 )
Si l’on prend le cas de la centrale Caniapiscau (figure 6.3), on peut remarquer que les deux
approches de partitionnement PartMC et PartMINMAX sont comparables au niveau de
77
l’erreur-type (RM SEG ). Cependant, PartMINMAX est meilleure que PartMC au niveau
du nombre d’hyperplans définissant la fonction de production approximée. On peut faire le
même constat pour les autres centrales.
Par ailleurs, PartMC est meilleure que PartMINMAX au niveau du temps d’exécution
de l’algorithme de partitionnement (c.f. section 3.2.4 du chapitre 3). En effet, pour trouver le
meilleur hyperplan au sens de l’erreur maximum la plus petite, PartMINMAX résout un
programme linéaire assez grand, alors que PartMC ou effectue une inversion de matrice 3×3
ou résout un problème quadratique à trois variables. Le tableau 6.6 illustre cette différence
en temps d’exécution. Ici, on a pris Nessais = 100 et lmax = 50.
Caniapiscau 120 43 82
La Grande4 260 88 164
La Grande3 320 109 195
La Grande2 580 271 362
6.2.3 Conclusion
Les résultats qu’on vient d’analyser montre que les trois modélisations EnvConc, PartMC
et PartMINMAX sont comparables et plus ou moins équivalentes en matière d’erreur-type
RM SEG . Cependant, Elle peuvent impacter différemment la performance (temps d’exécu-
tion) des algorithmes de planification de la production d’hydroélectricité. En effet, il s’agit
de modélisations complémentaires au sens de la théorie de la programmation linéaire. Env-
Conc nécessitent plusieurs variables (les λ) et trois contraintes. la modélisation par fonction
concave affine par morceaux (que ce soit via PartMC ou PartMINMAX) n’ajoute pas de
variables mais nécessite l’ajout d’une contrainte par hyperplan.
Intuitivement, on peut faire la conjecture que la modélisation des fonctions de production par
des fonctions concaves affines par morceaux est plus performante si le nombre d’hyperplans
reste raisonnable, dans ce cas PartMINMAX semble être la plus appropriée. À la fin de ce
chapitre, un retour sur les deux modélisations sera fourni.
78
Dans cette section, on présente les résultats issus de l’application des méthodes SDDP et
ASDP au problème de planification moyen-terme de la production d’hydroélectricité. L’ob-
jectif est de trouver une politique optimale de gestion de LGR sur un horizon d’une année.
On part des volumes initiaux des réservoirs listés dans le tableau 6.7.
Caniapiscau 30 000
La Grande4 5 000
La Grande3 18 000
La Grande2 16 000
On exécute SDDP avec un nombre d’itérations Imax = 3000. À chaque 200 itérations, on
calcule la borne supérieure et une estimation de la borne inférieure sur 1000 scénarios tirés
aléatoirement à chaque fois (cf. section 5.7.4). Comme ASDP n’est pas une méthode itérative
(une seule passe backward permet de construire une approximation des fonctions de bénéfice
futur) et pour pouvoir la comparer avec SDDP, on l’exécute à chaque 200 itérations de SDDP
avec un nombre d’échantillons Dmax qui augmente de 200 à chaque fois et on calcule les bornes
de la même manière et en utilisant les mêmes scénarios que SDDP.
79
La figure 6.7 montre l’évolution des bornes inférieure et supérieure pour les deux méthodes
SDDP et ASDP.
Borne Inf SDDP Borne Sup SDDP Borne Inf ASDP Borne Sup ASDP Borne Inf SDDP Borne Sup SDDP Borne Inf ASDP Borne Sup ASDP
7.9
x 100000000
x 100000000
5.43
7.4
6.9
Bornes sur l'objectif total ($)
5.9
5.4 5.33
4.9
4.4 5.28
3.9
3.4 5.23
0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
Itération Itération
(a) (b)
Figure 6.7 (a) évolution des bornes inférieure et supérieure ; (b) zoom sur la convergence.
Une autre métrique qui permet de comparer la performance des deux méthodes en matière
de politique de gestion consiste à fixer, au tout début, un certain nombre de scénarios, par
exemple 1000, et les simuler à chaque 200 itérations comme ce qu’on a fait pour les bornes.
À l’issu de chaque simulation, on calcule la valeur moyenne et l’écart-type de l’objectif sur
ces scénarios fixes. On rapporte sur la figure 6.8 l’évolution de la politique de gestion en
matière de bénéfice sur 1000 scénarios fixes. Pour chaque méthode, SDDP et ASDP, on trace
la courbe de l’objectif moyen, et ses bornes statistiques (± son écart-type).
obj moy SDDP obj min SDDP obj max SDDP obj moy SDDP obj min SDDP obj max SDDP
obj moy ASDP obj min asdp obj max ASDP obj moy ASDP obj min asdp obj max ASDP
5.7
x 100000000
x 100000000
5.5 5.6
5.5
5.0 5.4
Objectif total ($)
5.2
4.5
5.1
5.0
4.0
4.9
4.8
3.5 4.7
0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
Itération Itération
On observe que l’objectif moyen ainsi que ses bornes statistiques dans le cas de SDDP sont
plus grandes que ceux dans le cas de ASDP. Ce qui confirme que la politique de gestion de
SDDP est meilleure que celle de ASDP.
Quelles sont alors les raisons de l’avance de SDDP par rapport à ASDP ?
On essaie de répondre à cette question dans la sous-section suivante en creusant dans la
manière d’échantillonner l’espace des états de l’une ou l’autre des deux méthodes.
L’échantillonnage de l’espace des états constitue une différence majeure entre SDDP et ASDP.
La figure 6.9 montre la distribution des coupes de Benders sur les cinq cas d’apport pour
81
chaque semaine lorsqu’on exécute SDDP pour un nombre d’itérations Imax = 3000 et ASDP
pour un nombre d’états échantillonnés Dmax = 3000.
Cas d'apport 1 Cas d'apport 2 Cas d'apport 3 Cas d'apport 4 Cas d'apport 5 Cas d'apport 1 Cas d'apport 2 Cas d'apport 3 Cas d'apport 4 Cas d'apport 5
Nombre d'hyperplans de la fonction de bénéfice futur
1200 1200
1000 1000
800 800
600 600
400 400
200 200
0 0
2
12
22
32
42
52
62
72
82
92
102
112
122
132
142
152
162
172
182
192
202
212
222
232
242
252
262
272
282
292
302
2
12
22
32
42
52
62
72
82
92
102
112
122
132
142
152
162
172
182
192
202
212
222
232
242
252
262
272
282
292
302
Semaine Semaine
Figure 6.9 Distribution des coupes de Benders sur les différents cas d’apport
On note que ASDP (b) distribue les coupes de Benders quasiment uniformément (une relati-
vement petite fluctuation autour de la moyenne 600 = 3000
5
) sur les cinq fonctions de bénéfice
(i)
futur Ft i = 1 .. 5 pour toutes les semaines t. Alors que SDDP (a) ne les distribue pas
e
de cette façon. Examinons de près le processus d’apports PAR(1) discrétisé que l’on utilise
illustré dans la figure 6.10
82
A1
A2
A3
A4
De prime abord, on constate que la cas d’apport 3 est le plus récurrent pour toutes les
semaines, suivi des deux cas d’apport 2 et 4, et en dernier les deux cas d’apport restants 1
et 5.
Vu que l’échantillonnage dans SDDP se fait par génération de scénarios aléatoires du proces-
sus d’apport discrétisé, il est donc prévu que la distribution des coupes de Benders sur les
différents cas d’apport d’une semaine donnée soit plus favorable au cas d’apport 3, puis aux
deux cas 2 et 4 puis aux autres cas 1 et 5. Quant à ASDP, le critère de volume d’erreur fait
qu’elle distribue uniformément les coupes sur les cinq cas d’apport.
Ceci étant pour l’échantillonnage de l’espace de l’état apport passé, qu’en est-il de l’échan-
tillonnage de l’espace de l’état volume ?
La figure 6.11 rapporte les volumes échantillonnés de chacun des quatre réservoirs à capacité
positive de LGR des deux premières années (soit 104 semaines) de l’horizon de planification
rallongé. Les volumes échantillonnés par SDDP sont représentés par des points bleus, ceux
échantillonnés par ASDP sont de couleur orange.
83
(a) (b)
(c) (d)
échantillonner à des endroits par lesquels la gestion ne va probablement pas passer (si l’on se
fie au processus stochastique d’apport utilisé). Prenons, par exemple, le cas du réservoir La
Grande2 sur la figure 6.11(d), ASDP échantillonne son volume à des valeurs basses malgré
que la performance de sa centrale augmente avec son niveau. Contrairement à SDDP, ASDP
n’exploite pas les volumes initiaux des réservoirs pour restreindre son échantillonnage aux
premières semaines de l’horizon.
En conclusion, SDDP échantillonne l’espace des états par apprentissage du processus sto-
chastique d’apport et tient compte des conditions initiales du système (les volumes initiaux
des réservoirs V0 et l’apport A1 ). Alors que ASDP essaie de discrétiser l’espace des états sans
tenir compte de la distribution des apports et sans utiliser l’information de l’état initial du
système.
Apport minimum
11000 Apport maximum
10000
9000
8000
Apport (m³/s)
7000
6000
5000
4000
3000
2000
1000
5 10 15 20 25 30 35 40 45 50
Semaine
Les figures 6.13, 6.14, 6.15 et 6.16 donnent les diagrammes en boîte du volume moyen simulé
des réservoirs Caniapiscau, La Grande4 , La Grande3 et La Grande2 respectivement. La figure
6.17 donne les diagrammes en boîte du débit déversé hors-système de Caniapiscau. À gauche
la simulation est faite avec la politique de gestion obtenue via SDDP, à droite elle est faite
avec la politique obtenue via ASDP.
3.5 3.5
Volume moyen (hm³)
2.5 2.5
2 2
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
La Grande 4 La Grande 4
7000 7000
6500 6500
6000
Volume moyen (hm³)
6000
5500
5500
5000
5000
4500
4500
4000
4000
3500
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
La Grande 3 La Grande 3
#10 4 #10 4
2.5
2.4
2.2
Volume moyen (hm³)
1.8
1.6
1.5
1.4
1.2
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
La Grande 2 La Grande 2
#10 4 #10 4
1.9 1.9
1.8 1.8
Volume moyen (hm³)
1.7 1.7
1.6 1.6
1.5 1.5
1.4 1.4
1.3 1.3
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
20 120
100
15
Débit déversé (m³/s)
10 60
40
20
0 0
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
Figure 6.17 Diagramme en boîte du débit déversé simulé de l’ouvrage d’évacuation Caniapis-
cau
On note les différences suivantes en matière de stratégie de gestion des deux méthodes :
– pour le réservoir Caniapiscau, ASDP essaie de le remplir juste avant la venue de l’hiver.
SDDP y garde un niveau relativement constant durant tout l’automne. Toutefois ASDP
se trouve obligée de déverser hors-système plus fréquemment et en plus grandes quantités
que SDDP ;
– pour le réservoir La Grande3 , SDDP le remplit plus que ASDP durant la crue de printemps
et jusqu’à la venue de l’hiver. Ce réservoir dispose de la 3e plus importante centrale, ainsi
la stratégie de SDDP de le remplir pour se préparer à la forte demande de l’hiver est
pertinente ;
– pour le réservoir La Grande2 , on note une nette différence de gestion durant le début de
l’hiver, SDDP le garde presque toujours à son niveau maximum ce qui est plus optimal vu
que sa centrale est la plus performante.
Le comportement des deux méthodes vis-à-vis du réservoir La Grande4 est relativement
similaire.
Pour ce qui est du déversé de Caniapiscau, rappelons qu’il s’agit d’un déversé hors-système
du haut de LGR (cf. figure 6.1). Ce déversé est un gaspillage car s’il est plutôt turbiné par
la centrale Caniapiscau, il peut être recyclé par les centrales en aval. On note que SDDP ne
déverse que rarement à ce niveau. ASDP en déverse moins rarement (cf. figure 6.17).
88
Simulation de la production
Les figures 6.18 et 6.19 donnent les diagrammes en boîte de la production produite simulée des
classes pointe et moyenne respectivement. À gauche la simulation est faite avec la politique
de gestion obtenue via SDDP, à droite elle est faite avec la politique obtenue via ASDP.
1.4 1.4
Puissance produite (MW)
1 1
0.8 0.8
0.6 0.6
0.4 0.4
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
Figure 6.18 Diagramme en boîte de la puissance produite simulée durant la classe pointe
14000 14000
12000 12000
Puissance produite (MW)
10000 10000
8000 8000
6000 6000
4000 4000
2000 2000
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine
Figure 6.19 Diagramme en boîte de la puissance produite simulée durant la classe moyenne
On note que la puissance produite dans le cas de SDDP est, dans la majorité des scénarios,
plus en deçà de la puissance minimum (demande) que ASDP. Ce phénomène est plus prononcé
dans le cas de la classe moyenne qui dure le plus sur une semaine (75%). Ainsi la gestion
89
avec SDDP permet d’avoir plus de marge sur la production tout en gardant une gestion des
stocks d’eau raisonnable.
On exécute SDDP avec un nombre d’itération Imax = 3000 pour chacune des deux modélisa-
tions des fonctions de production et on rapporte son temps d’exécution. Pour la modélisation
par fonctions concaves linéaires par morceaux des fonctions de production, on utilise les
nombres d’hyperplans listés dans le tableau 6.8.
Caniapiscau 2
La Grande4 4
La Grande3 3
La Grande2 7
On avait émis la conjecture que la modélisation par fonctions concaves linéaires par mor-
ceaux des fonctions de production (avec ses deux variantes PartMC et PartMINMAX)
serait meilleure que la modélisation par enveloppe concave de deux fonctions extrêmes (Env-
Conc) en matière de temps d’exécution de SDDP et ASDP si le nombre d’hyperplans de
l’approximation est raisonnablement petit. On vérifie que c’est bien le cas puisque SDDP
avec la première se termine après 25min de temps d’exécution alors qu’avec la deuxième elle
se termine après 38min, soit un gain approximatif de 34%.
90
CHAPITRE 7 CONCLUSION
Le travail effectué et présenté dans ce mémoire peut se résumer aux points suivants
1. Modélisation d’un cas d’étude réel (La Grande Rivière) ;
2. Comparaison de différentes méthodes d’approximation concave des fonctions de pro-
duction des centrales hydroélectriques et en matière de leur erreur-type (RMSE) et en
matière de leur influence sur le temps d’exécution des modèles de planification étudiés ;
3. Application de deux méthodes basées sur la programmation dynamique stochastique
(SDDP et ASDP) au problème de planification moyen-terme de la production d’hydro-
électricité ;
4. Comparaison des deux méthodes (SDDP et ASDP) sur un cas réel et d’envergure
(LGR).
Pour ce qui est des fonctions de production des centrales hydroélectriques, les deux approches
proposées se sont avérées quasiment équivalentes au niveau de l’erreur-type (RMSE). La
modélisation par une fonction concave linéaire par morceaux est toutefois meilleure sur le
temps d’exécution des programmes linéaires utilisés dans les méthodes de planification. En
plus du critère des moindres carrés utilisé par l’algorithme de partitionnement de Magnani
et Boyd (2009), nous avons proposé une variante du même algorithme avec le critère de
minimisation du maximum de l’erreur. Cette nouvelle variante est plus couteuse en temps
d’exécution de l’algorithme de partitionnement mais nous a permis de réduire le nombre
d’hyperplans tout en gardant une erreur-type (RMSE) compétitive.
L’application des méthodes SDDP et ASDP s’est faite sur LGR avec un nombre important
de réservoirs. La comparaison de ses deux méthodes a montré que :
– SDDP et ASDP peuvent résoudre un problème de planification multi-réservoir ;
– SDDP échantillonne l’espace des états par simulations de scénarios tirés aléatoirement
(passe vers l’avant). De ce fait, les coupes sont générées là où le processus stochastique
des apports l’indique. ASDPA n’apprend pas du processus stochastique des apports car
elle n’échantillonne pas par simulations. De manière graphique, SDDP échantillonne à
l’intérieur des hyper-rectangles, ASDP échantillonne les sommets des hyper-rectangles ;
– malgré qu’elle nécessite une phase de rodage de sa politique, SDDP converge vers une
politique optimale après un nombre fini d’itérations ;
– ASDP distribue quasiment uniformément les coupes de Benders sur les différents cas d’ap-
91
port d’une semaine donnée. Cependant, ces différents cas d’apport ne sont en général pas
équiprobables ;
– la convergence de SDDP est plus fine que celle de ASDP ;
– la politique obtenue via SDDP est plus proche de la politique optimale que celle obtenue
via ASDP ;
Malgré sa convergence prouvée, SDDP nécessite une phase de rodage de la politique durant
les premières itérations. La durée de cette phase de rodage dépend de la longueur de l’horizon
de planification. Il s’agit de la seule limitation de SDDP.
Quant à ASDP, elle échantillonne l’espace des états parmi les sommets d’hyper-rectangles
crées en temps réel. Or, la gestion des réservoirs passe par des points à l’intérieur des hyper-
rectangles. Il faut donc raffiner le découpage de l’espace des états et donc couper plus encore
les hyper-rectangles. On risque alors d’augmenter énormément la complexité de la méthode et
la rendre proche de SDP. ASDP ne tient pas compte du processus stochastique des apports
pour échantillonner l’espace des états, son caractère récursif ne permet pas de faire des
simulations pour échantillonner.
Pour éviter les limitations de SDDP et de ASDP, nous proposons une méthode qui combine les
deux ASDP-SDDP. Notons H le nombre d’années de l’horizon (rallongé) de planification, une
façon de combiner les deux méthodes serait d’initialiser les coupes des h (h ≤ H) dernières
années de l’horizon de planification par ASDP avec un nombre maximum d’échantillons Dmax
raisonnable (si 4 réservoirs comme le cas d’étude du chapitre 6, prendre par exemple Dmax =
1000 ou 2000), ensuite lancer SDDP sur tout l’horizon. Le cas de h = H est particulièrement
intéressant. En se faisant, SDDP convergerait plus rapidement et ne nécessiterait pas de phase
de rodage. Ainsi, on éviterait le rodage de SDDP et on profiterait de son échantillonnage
efficace de l’espace des états.
Une amélioration possible de ASDP serait de pondérer le volume d’erreur par la probabilité
du cas d’apport associé. Ceci permettrait un échantillonnage plus cohérent avec le processus
stochastique d’apport.
92
RÉFÉRENCES
——, Dynamic Programming and Optimal Control, Volume II, 4e éd. Athena Scientific,
2012.
——, “Accounting for losses in the optimization of production of hydroplants”, IEEE Tran-
sactions on Energy Conversion, vol. 19, no. 2, pp. 346–351, 2004.
——, “Managing hydroelectric reservoirs over an extended horizon using benders decom-
position with a memory loss assumption”, IEEE Transactions on Power Systems, vol. 30,
no. 2, pp. 563–572, 2015.
93
C. Cervellera, A. Wen, et V. C. Chen, “Neural network and regression spline value function
approximations for stochastic dynamic programming”, Computers & Operations Research,
vol. 34, no. 1, pp. 70–90, 2007.
T. Halliburton et al., “An optimal hydrothermal planning model for the new zealand power
system”, Australian Journal of Electrical & Electronics Engineering, vol. 1, no. 3, p. 193,
2004.
94
S. Krau, G. Émiel, J. Merleau, et R. Leconte, “Adaptive discretization of the state space for
stochastic dynamic programming applied to multi-reservoir system”, 2015, Manuscrit non
publié.
T. Kristiansen, “Financial risk management in the electric power industry using stochastic
optimization”, Advanced Modeling and Optimization, vol. 6, no. 2, pp. 17–24, 2004.
R. J. Pinto, C. L. Borges, et M. E. Maceira, “An efficient parallel algorithm for large scale
hydrothermal system operation planning”, IEEE Transactions on Power Systems, vol. 28,
no. 4, pp. 4888–4896, 2013.
T. Røtting, A. Gjelsvik et al., “Stochastic dual dynamic programming for seasonal scheduling
in the norwegian power system”, IEEE Transactions on Power Systems, vol. 7, no. 1, pp.
273–279, 1992.
96
——, “A decomposition method for the long-term scheduling of reservoirs in series”, Water
Resources Research, vol. 17, no. 6, pp. 1565–1570, 1981.
Dans cet annexe, on explose plusieurs approches équivalentes pour représenter une fonction
concave linéaire par morceaux dans un modèle linéaire de maximisation.
Considérons une fonction concave linéaire par morceaux x 7→ y (figure A.1)
y3
y4
y2
y1
y0
x0 x1 x2 x3 x4 x
On a pour x0 ≤ x ≤ x4
4
X 4
X
y (x) = max λi yi = y0 + max aj svj = max z
λ sv z
i=0 j=1
4
X 4
X
s.à λ i xi = x s.à svj = x − x0 s.à z ≤ aj x + bj , j = 1 .. 4
i=0 j=1
4
X
λi = 1 svj ≤ xj − xj−1 , j = 1 .. 4
i=0
λ≥0 sv ≥ 0
Où aj et bj sont respectivement la pente et l’ordonnée à l’origine du j e plan affine correspon-
dant au j e morceau.
Si, dans un modèle de programmation linéaire complexe, on utilise deux variables Y et X et
99
que l’on souhaite que Y = y (X), il faut s’assurer que pour une valeur fixe de la variable X
le modèle va aller chercher la plus grande valeur possible de Y . Si c’est le cas il suffit alors
d’incorporer un des ensembles de contraintes (équivalents) parmi les suivants
4
X 4
Y = λi y i
X
Y = y0 + aj svj
i=0
4
j=1
4
X
X= λ i xi
X n
i=0 ≡ X = x0 + svj ≡ Y ≤ aj X + bj , j = 1 .. 4
4 j=1
X
λi = 1
svj ≤ xj − xj−1 , j = 1 .. 4
i=0
sv ≥ 0
λ≥0
Remarque :
Le développement précédent s’est fait pour un nombre de morceaux égal à 4. Il reste généra-
lisable à un nombre de morceaux quelconque.