Vous êtes sur la page 1sur 114

Application de méthodes de programmation dynamique

Titre:
stochastique au problème de planification de la production
Title:
d'hydroélectricité
Auteur:
Mouad Faik
Author:
Date: 2015
Type: Mémoire ou thèse / Dissertation or Thesis
Faik, M. (2015). Application de méthodes de programmation dynamique
Référence: stochastique au problème de planification de la production d'hydroélectricité
Citation: [Mémoire de maîtrise, École Polytechnique de Montréal]. PolyPublie.
https://publications.polymtl.ca/1832/

Document en libre accès dans PolyPublie


Open Access document in PolyPublie

URL de PolyPublie:
https://publications.polymtl.ca/1832/
PolyPublie URL:
Directeurs de
recherche: Michel Gendreau, & Stéphane Krau
Advisors:
Programme:
Maîtrise en mathématiques appliquées
Program:

Ce fichier a été téléchargé à partir de PolyPublie, le dépôt institutionnel de Polytechnique Montréal


This file has been downloaded from PolyPublie, the institutional repository of Polytechnique Montréal
https://publications.polymtl.ca
UNIVERSITÉ DE MONTRÉAL

APPLICATION DE MÉTHODES DE PROGRAMMATION DYNAMIQUE


STOCHASTIQUE AU PROBLÈME DE PLANIFICATION DE LA PRODUCTION
D’HYDROÉLECTRICITÉ

MOUAD FAIK
DÉPARTEMENT DE MATHÉMATIQUES ET DE GÉNIE INDUSTRIEL
ÉCOLE POLYTECHNIQUE DE MONTRÉAL

MÉMOIRE PRÉSENTÉ EN VUE DE L’OBTENTION


DU DIPLÔME DE MAÎTRISE ÈS SCIENCES APPLIQUÉES
(MATHÉMATIQUES APPLIQUÉES)
AOÛT 2015

© Mouad Faik, 2015.


UNIVERSITÉ DE MONTRÉAL

ÉCOLE POLYTECHNIQUE DE MONTRÉAL

Ce mémoire intitulé :

APPLICATION DE MÉTHODES DE PROGRAMMATION DYNAMIQUE


STOCHASTIQUE AU PROBLÈME DE PLANIFICATION DE LA PRODUCTION
D’HYDROÉLECTRICITÉ

présenté par : FAIK Mouad


en vue de l’obtention du diplôme de : Maîtrise ès sciences appliquées
a été dûment accepté par le jury d’examen constitué de :

M. AUDET Charles, Ph. D., président


M. GENDREAU Michel, Ph. D., membre et directeur de recherche
M. KRAU Stéphane, Ph. D., membre et codirecteur de recherche
M. BASTIN Fabian, Doctorat, membre
iii

DÉDICACE

À mes frères Mohammed et Hicham


qui m’encourageaient toujours
à persévérer dans mes études
et viser plus haut.
À toute ma famille. . .
iv

REMERCIEMENTS

Je tiens d’abord à remercier mon directeur de recherche Michel Gendreau pour son support
tout au long de ma maîtrise. Je remercie en son nom le fond de recherche CRSNG-Hydro
Québec pour avoir financé ce projet. Mes remerciements vont également à mon codirecteur
de recherche Stéphane Krau pour son implication et sa disponibilité. J’exprime aussi mes
remerciement à Gréegory Émiel, consultant en modélisation à Hydro-Québec, pour ses sug-
gestions fructueuses et les échanges scientifiques que nous avons eus. Je remercie les membres
du jury qui ont enrichi ce mémoire par leurs commentaires pertinents.
Je souhaite exprimer ma gratitude à l’Institut national polytechnique de Grenoble, plus
particulièrement l’École nationale supérieure d’informatique et de mathématiques appliquées
de Grenoble (ENSIMAG) pour m’avoir donné l’opportunité de faire un double diplôme à
l’École Polytechnique de Montréal. Je remercie tous les professeurs des deux écoles pour la
richesse de leurs enseignements.
Je remercie tout le personnel du CIRRELT, en particulier Serge Bisaillon, pour l’aide quoti-
dienne qu’il apporte aux étudiants.
Je remercie tous mes amis sans exception pour les moments inoubliables que j’ai partagés
avec eux que ce soit en étudiant ou en jouant ou en voyageant...
Je tiens à exprimer ma vive reconnaissance envers mes parents, mes frères et sœurs ainsi que
mes neveux et nièces pour leur support moral continu et leur encouragement durant tout mon
parcours académique. Un grand merci à ma fiancée Ola pour son aide précieuse dans l’édition
de plusieurs graphiques utilisés dans ce mémoire ainsi que pour ses lectures et corrections de
mon texte.
v

RÉSUMÉ

La planification de la production d’hydroélectricité est un problème complexe qui se situe


au croisement de plusieurs branches des mathématiques appliquées. La prise de décisions
optimales ou quasi-optimales passe par l’optimisation, parfois déterministe et en nombre
entiers (planification court-terme), parfois stochastique et continue (planification moyen- et
long-terme). La maîtrise de l’aspect stochastique des apports hydriques naturels et/ou des
prix de l’énergie passe par l’utilisation et le développement de modèles statistiques probabi-
listes. La modélisation des fonctions de production des centrales hydroélectriques passe par
l’optimisation non-linéaire et des méthodes de calcul numériques.
Dans ce mémoire, deux volets sont étudiés : méthodes d’approximation concave des fonc-
tions de production des centrales hydroélectriques et méthodes d’optimisation stochastique
appliquées au problème de planification moyen-terme de la production d’hydroélectricité sous
incertitude portant sur les apports hydriques naturels.
Les fonctions de production des centrales hydroélectriques dépendent du débit turbiné et de
la hauteur de chute. Ces fonctions ne sont ni linéaires ni même concaves. Pour les incorporer à
un modèle mathématique linéaire de maximisation, il faut au préalable les approximer par des
fonctions concaves linéarisables. Pour ce faire, on propose deux méthodes : approximation de
la fonction objectif par enveloppe concave et approximation par une fonction concave linéaire
par morceaux. La dernière étant en deux variantes : construction d’hyperplans d’ajustement
avec le critère des moindres carrés ou le critère de minimisation de l’erreur maximale par
rapport à la vraie fonction de production. On conclut que les deux méthodes sont à peu
près équivalentes en matière d’erreur-type mais que la deuxième méthode est meilleure sur
le temps d’exécution des modèles de planification de la production utilisés.
Le problème de planification moyen-terme de la production d’hydroélectricité sous incertitude
peut être approché et résolu par différentes méthodes. Les méthodes de programmation dyna-
mique stochastique restent les plus rigoureuses en matière et de formulation et d’algorithmes
de résolution et de prise en compte de l’incertitude. On se propose d’appliquer deux mé-
thodes basées sur la programmation dynamique stochastique : la programmation dynamique
duale stochastique (SDDP) et une méthode de programmation dynamique stochastique ap-
prochée (ASDP) dont l’idée centrale est de discrétiser l’espace des états en hyper-rectangles.
On compare les deux méthodes sur un cas d’étude réel : La Grande Rivière, la rivière la plus
importante du parc hydroélectrique du Québec.
vi

ABSTRACT

The hydro-power generation planning is a complex problem implicating different fields of


applied mathematics. Optimal or almost-optimal decisions are taken after optimization.
This optimization is sometimes deterministic with integer variables (short-term planning),
sometimes it is stochastic and continuous (mid or long-term planning). In order to master the
randomness of parameters such as inflows or spot prices one must use and develop statistical
and probabilistic models. Hydro-plants’ power generation functions are modeled using non-
linear optimization, numerical calculating methods. etc.
This thesis focuses on two main subjects: concavation methods of hydro-plants’ power gen-
eration functions and stochastic optimization methods applied to a mid-term hydro-power
generation planning problem under uncertainty that lies on natural inflows.
Hydro-plants’ power generation functions depend on the turbined outflow and water head,
they are consequently not linear nor concave. These functions must be approximated by
concave, piecewise linear functions, so they can fit into a linear mathematical programming
model. There are two methods to do so: approximation of the objective function by a concave
hull and approximation by a concave piecewise linear function. The second approach has two
variants: fitting hyperplanes construction with the least squares criterion or the criterion of
minimizing the maximal error to the real generation function. We conclude that these two
methods are almost equivalent according to their root-mean square error, but the second
method has less impact on planning algorithms’ running time.
There are many methods that can be used to solve the mid-term hydro-power generation
planning under uncertainty. Stochastic dynamic programming-based methods are still the
most rigorous with respect to their formulation, the solution algorithms used and the way
in which uncertainty is represented. Two of these methods are compared in this thesis:
Stochastic Dual Dynamic Programming (SDDP) and a variant of Approximate Stochastic
Dynamic Programming (ASDP), which is mainly based on a state space discretization into
hyper-rectangles. These two methods are compared on a real case-study: La Grande Rivière,
the most important river in Quebec hydroelectricity system.
vii

TABLE DES MATIÈRES

DÉDICACE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii

REMERCIEMENTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv

RÉSUMÉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v

ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi

TABLE DES MATIÈRES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii

LISTE DES TABLEAUX . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . x

LISTE DES FIGURES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xi

LISTE DES SIGLES ET ABRÉVIATIONS . . . . . . . . . . . . . . . . . . . . . . . xiii

LISTE DES ANNEXES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiv

CHAPITRE 1 INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Contexte : le Québec, un immense potentiel hydroélectrique . . . . . . . . . 3
1.3 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Contenu du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

CHAPITRE 2 REVUE DE LITTÉRATURE . . . . . . . . . . . . . . . . . . . . . . 7


2.1 Gestion de réservoirs sous incertitude . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Résolution par réduction à un arbre de scénarios . . . . . . . . . . . . . . . . 11
2.3 Résolution par programmation dynamique stochastique approchée . . . . . . 12
2.4 Résolution par programmation dynamique duale stochastique . . . . . . . . . 13
2.5 Fonctions de production des centrales hydroélectriques . . . . . . . . . . . . 15

CHAPITRE 3 ÉLÉMENTS DE MODÉLISATION . . . . . . . . . . . . . . . . . . 17


3.1 Infrastructures et installations hydroélectriques . . . . . . . . . . . . . . . . 17
3.1.1 Réservoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.2 Centrale hydroélectrique . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.1.3 Ouvrage d’évacuation . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
viii

3.2 Fonction de production d’une centrale hydroélectrique . . . . . . . . . . . . . 20


3.2.1 Cas d’un groupe turbine-alternateur . . . . . . . . . . . . . . . . . . 21
3.2.2 Cas d’une centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.2.3 Modélisation pour la planification moyen-terme de la production . . . 24
3.2.4 Approximation concave des fonctions de production . . . . . . . . . . 27
3.3 Apports hydriques naturels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3.1 Modèles auto-régressifs périodiques . . . . . . . . . . . . . . . . . . . 31
3.3.2 Estimation des paramètres du modèle PAR(1) . . . . . . . . . . . . . 33
3.3.3 Génération d’un processus stochastique PAR(1) discrétisé . . . . . . . 33
3.4 Classes de demande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

CHAPITRE 4 PROBLÈME DE PLANIFICATION DE LA PRODUCTION D’HY-


DROÉLECTRICITÉ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.1 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Formulation du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.3 Description du problème . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.3.2 Contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

CHAPITRE 5 MÉTHODES DE RÉSOLUTION PAR PROGRAMMATION DYNA-


MIQUE STOCHASTIQUE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1 Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.2 Reformulation du problème : schéma de programmation dynamique . . . . . 49
5.3 Programmation dynamique stochastique et politique de gestion . . . . . . . . 50
5.4 Concavité des fonctions de bénéfice futur . . . . . . . . . . . . . . . . . . . . 51
5.4.1 Concavité par rapport à l’état volume . . . . . . . . . . . . . . . . . . 51
5.4.2 Concavité par rapport à l’état apport passé . . . . . . . . . . . . . . . 52
5.5 Représentation des fonctions de bénéfice futur . . . . . . . . . . . . . . . . . 53
5.6 Méthode de programmation dynamique stochastique exacte . . . . . . . . . . 57
5.7 Méthode de programmation dynamique duale stochastique (SDDP) . . . . . 59
5.7.1 Passe vers l’avant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.7.2 Passe vers l’arrière . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.7.3 L’algorithme SDDP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.7.4 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.7.5 Convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.8 Méthode de programmation dynamique stochastique approchée (ASDP) . . . 64
5.8.1 Discrétisation adaptée de l’espace d’état volume . . . . . . . . . . . . 65
ix

5.8.2 Discrétisation adaptée simplifiée de l’espace d’état volume . . . . . . 66


5.8.3 L’algorithme ASDP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.8.4 Critère d’arrêt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.8.5 Convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69

CHAPITRE 6 ANALYSE D’UN CAS D’ÉTUDE : LA GRANDE RIVIÈRE . . . . 70


6.1 Description du cas d’étude . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.1.1 Caractéristiques des installations hydroélectriques . . . . . . . . . . . 70
6.1.2 Demande en électricité . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.2 Comparaison de différentes modélisations des fonctions de production des cen-
trales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.2.1 Modélisation par enveloppe concave . . . . . . . . . . . . . . . . . . . 74
6.2.2 Modélisation par une fonction concave affine par morceaux . . . . . . 74
6.2.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3 Planification moyen-terme de la production d’hydroélectricité : SDDP vs ASDP 78
6.3.1 Évolution des bornes . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.3.2 Raffinement de la politique . . . . . . . . . . . . . . . . . . . . . . . . 80
6.3.3 Échantillonnage de l’espace des états . . . . . . . . . . . . . . . . . . 80
6.3.4 Gestion des réservoirs et de la production de LGR . . . . . . . . . . . 84
6.4 Retour sur les fonctions de production . . . . . . . . . . . . . . . . . . . . . 89

CHAPITRE 7 CONCLUSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.1 Synthèse des travaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
7.2 Limitations de la solution proposée . . . . . . . . . . . . . . . . . . . . . . . 91
7.3 Améliorations futures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

RÉFÉRENCES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

ANNEXES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
x

LISTE DES TABLEAUX

Tableau 1.1 Pourcentage de l’hydroélectricité dans la production totale . . . . . . 1


Tableau 5.3 Complexité du schéma SDP exact . . . . . . . . . . . . . . . . . . . . 59
Tableau 6.1 Caractéristiques des réservoirs de LGR . . . . . . . . . . . . . . . . . 70
Tableau 6.2 Caractéristiques des centrales de LGR . . . . . . . . . . . . . . . . . 71
Tableau 6.3 Caractéristiques des ouvrages d’évacuation de LGR . . . . . . . . . . 71
Tableau 6.4 Taille des grilles utilisées . . . . . . . . . . . . . . . . . . . . . . . . . 74
Tableau 6.5 Erreur-type de la production estimée (cas de EnvConc) . . . . . . . 74
Tableau 6.6 Ordre de grandeur du temps d’exécution de l’algorithme de partition-
nement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
Tableau 6.7 Volumes initiaux des réservoirs à capacité positive . . . . . . . . . . . 78
Tableau 6.8 Nombre d’hyperplans de l’approximation de la fonction de production 89
xi

LISTE DES FIGURES

Figure 1.1 Source d’électricité au Québec . . . . . . . . . . . . . . . . . . . . . . 2


Figure 1.2 Hydroélectricité du Québec . . . . . . . . . . . . . . . . . . . . . . . 4
Figure 2.1 Processus décisionnel à deux étapes . . . . . . . . . . . . . . . . . . . 8
Figure 2.2 Procédure d’optimisation stochastique implicite (Labadie (2004)) . . 9
Figure 2.3 Procédure d’optimisation stochastique explicite (Labadie (2004)) . . . 10
Figure 2.4 Un arbre de scénarios . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Figure 3.1 Processus de production de l’hydroélectricité . . . . . . . . . . . . . . 17
Figure 3.2 Barrage de la Trenche (Québec) . . . . . . . . . . . . . . . . . . . . . 18
Figure 3.3 Schéma de base d’un réservoir . . . . . . . . . . . . . . . . . . . . . . 18
Figure 3.4 Centrale Robert-Bourassa, une centrale souterraine à réservoir (Québec) 19
Figure 3.5 Centrale de Carillon, une centrale au fil de l’eau (Québec) . . . . . . 19
Figure 3.6 Évacuateur de crues du barrage Robert-Bourassa (Québec) . . . . . . 20
Figure 3.7 Rendement d’un groupe turbine-alternateur . . . . . . . . . . . . . . 21
Figure 3.8 Exemple de fonction débit-puissance . . . . . . . . . . . . . . . . . . 22
Figure 3.9 Transformation par similitude de la fonction débit-puissance . . . . . 23
Figure 3.10 Exemple de configuration physique d’une centrale . . . . . . . . . . . 23
Figure 3.11 Exemple de fonction de production à hauteur de référence (Centrale à
deux groupes) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
Figure 3.12 Exemple de fonction de production globale . . . . . . . . . . . . . . . 26
Figure 3.13 Historique des apports hydriques (53 années) . . . . . . . . . . . . . . 32
Figure 3.14 Génération naïve du processus stochastique discrétisé . . . . . . . . . 34
Figure 3.15 Génération efficace du processus stochastique discrétisé . . . . . . . . 35
Figure 3.16 Classes de demande . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Figure 5.1 Deux scénarios partageant les mêmes apports jusqu’à la semaine t . . 50
Figure 5.2 Illustration d’une fonction de bénéfice futur et ses hyperplans supports 55
Figure 5.3 Approximation d’une fonction de bénéfice futur par des hyperplans
coupants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Figure 5.4 Calcul analytique de l’erreur sur une arête d’un hyper-rectangle . . . 67
Figure 6.1 Schéma de La Grande Rivière . . . . . . . . . . . . . . . . . . . . . . 72
Figure 6.2 Demande électrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
Figure 6.3 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute,
(2) l’erreur-type (RM SEG ), et (3) le nombre d’hyperplans approximant
la fonction de production (cas de la centrale Caniapiscau) . . . . . . . 75
xii

Figure 6.4 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute,


(2) l’erreur-type (RM SEG ), et (3) le nombre d’hyperplans approximant
la fonction de production (cas de la centrale La Grande4 ) . . . . . . . 75
Figure 6.5 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute,
(2) l’erreur-type (RM SEG ), et (3) le nombre d’hyperplans approximant
la fonction de production (cas de la centrale La Grande3 ) . . . . . . . 76
Figure 6.6 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute,
(2) l’erreur-type (RM SEG ), et (3) le nombre d’hyperplans approximant
la fonction de production (cas de la centrale La Grande2 ) . . . . . . . 76
Figure 6.7 (a) évolution des bornes inférieure et supérieure ; (b) zoom sur la conver-
gence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
Figure 6.8 Amélioration de la politique sur 1000 scénarios fixes . . . . . . . . . . 80
Figure 6.9 Distribution des coupes de Benders sur les différents cas d’apport . . 81
Figure 6.10 Transitions dans le processus d’apports PAR(1) discrétisé . . . . . . . 82
Figure 6.11 Volumes échantillonnés par les méthodes SDDP et ASDP . . . . . . . 83
Figure 6.12 Scénarios de simulation post-politique . . . . . . . . . . . . . . . . . . 84
Figure 6.13 Diagramme en boîte du volume moyen simulé du réservoir Caniapiscau 85
Figure 6.14 Diagramme en boîte du volume moyen simulé du réservoir La Grande4 85
Figure 6.15 Diagramme en boîte du volume moyen simulé du réservoir La Grande3 86
Figure 6.16 Diagramme en boîte du volume moyen simulé du réservoir La Grande2 86
Figure 6.17 Diagramme en boîte du débit déversé simulé de l’ouvrage d’évacuation
Caniapiscau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
Figure 6.18 Diagramme en boîte de la puissance produite simulée durant la classe
pointe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Figure 6.19 Diagramme en boîte de la puissance produite simulée durant la classe
moyenne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
Figure A.1 Une fonction concave linéaire par morceaux . . . . . . . . . . . . . . 98
xiii

LISTE DES SIGLES ET ABRÉVIATIONS

Sigles et abréviations

SDP Stochastic Dynamic Programming


SDDP Stochastic Dual Dynamic Programming
ASDP Approximate Stochastic Dynamic Programming
PAR Periodic Autoregressive
RMSE Root Mean Square Error
LGR La Grande Rivière
xiv

LISTE DES ANNEXES

ANNEXE A REPRÉSENTATION DES FONCTIONS CONCAVES LINÉAIRES


PAR MORCEAUX DANS LES MODÈLES LINÉAIRES . . . . . . . 98
1

CHAPITRE 1 INTRODUCTION

1.1 Généralités

L’hydroélectricité est une source d’énergie renouvelable qui constitue une grande part de
l’électricité générée dans le monde. Le tableau 1.1 1 donne quelques statistiques sur l’utilisa-
tion de cette source :

Tableau 1.1 Pourcentage de l’hydroélectricité dans la production totale

Pays % de l’hydroélectricité

Norvège 96.7
Brésil 75.2
Venezuela 64.8
Canada 60.0
Suède 47.5
Chine 17.5
Russie 15.6
Inde 11.2
Japon 8.1
États unis 7.0

Reste des pays 14.0

Tout le monde 16.5

Plusieurs aspects de l’hydroélectricité sont particulièrement attrayants :


– il s’agit d’une des sources d’énergie les plus propres : « une centrale hydroélectrique émet
10 grammes de dioxyde de carbone (CO2 ) par kilowattheure produit, autant que son équi-
valent éolien et quatre fois moins que son équivalent solaire avec panneaux solaires photo-
voltaïques. Une centrale hydroélectrique produit 100 fois moins de GES 2 qu’une centrale
au charbon. » 3 ;
– peu de coûts de production, l’eau étant gratuitement exploitée, au contraire de l’électricité
produite du nucléaire ou du gaz naturel etc ;
1. Source : http://www.iea.org Agence internationale de l’énergie (Statistiques de 2012)
2. Gaz à effet de serre.
3. Source : http://www.hydroquebec.ca
2

– présente peu de danger dans son exploitation, contrairement à l’énergie nucléaire (le séisme
et tsunami de 2011 au Japon dont les conséquences ne sont toujours pas complètement
contrôlées est encore très récent).
Au Québec, comme le montre la figure 1.1 4 , l’hydroélectricité est la source par excellence
d’énergie :

6%

2%

92%

Hydro Éolien Autres

Figure 1.1 Source d’électricité au Québec

Le tableau et la figure précédents montrent le poids de l’hydroélectricité dans le monde,


en particulier dans les systèmes à dominance hydroélectrique tels que le Norvège, le Brésil
et le Québec. D’où l’importance de développer des modèles et méthodes de programmation
mathématique pour représenter et résoudre le problème de gestion des ressources hydriques.
Les objectifs de la planification de la production d’électricité dans un système à dominance
hydroélectrique peuvent varier selon son pourcentage d’énergie hydroélectrique, la nature du
marché dont il fait partie, etc. On trouve les objectifs phares suivants :
– Assurer la durabilité des ressources hydriques : cet objectif est partagé par tous les
différents systèmes ;
– Minimiser les coûts de recours aux autres sources d’énergie : cet objectif est
fortement présent dans les systèmes où il y a un recours important aux autres sources
d’énergie (thermique, nucléaire, etc) plus coûteuses, comme par exemple au Brésil ;
4. Adapté du rapport annuel d’Hydro-Québec de 2014.
3

– Maximiser les bénéfices : cet objectif est présent dans les systèmes dérégulés : système
où l’échange (Import/Export) d’électricité est libéralisé comme par exemple en Norvège.

En pratique, le problème de la planification de la production hydroélectrique est approché par


un processus décisionnel à plusieurs niveaux d’horizon de temps. On distingue habituellement
les niveaux suivants :
– Planification long-terme : elle se fait sur un horizon de 3 ans et plus, fournit des
objectifs finaux pour la planification moyen-terme (par exemple, les valeurs marginales de
l’eau dans chaque réservoir à la fin de l’horizon) et peut aussi donner des indications sur les
investissements futurs en infrastructure. Elle peut incorporer un modèle de changements
climatiques ;
– Planification moyen-terme : elle se fait sur un horizon de 1 à 2 ans avec un pas de temps
hebdomadaire, fournit des estimations des valeurs de l’eau à chaque fin de pas d’horizon
et des entrées pour la planification court-terme ;
– Planification court-terme : elle se fait sur un horizon de quelques jours avec un pas
horaire, fournit un plan de production détaillé qui sert à guider les opérations.
Ce processus décisionnel en trois niveaux fournit, si l’on peut ainsi dire, des « macro »-
décisions qui vont piloter l’opération en temps réel qui vient ajouter d’autres variables de
décisions, que l’on peut qualifier de « micro »-décisions, telles que la configuration à adopter
pour chaque centrale (le nombre de groupes à engager et lesquels), la manière réelle dont
l’électricité générée devra être transférée d’un nœud vers un autre du système de transport
d’électricité.

1.2 Contexte : le Québec, un immense potentiel hydroélectrique

Le Québec est une terre abondante en ressources hydriques (500 000 lacs et 4500 rivières
qui couvrent 12% de son territoire). Ses ressources sont exploitées par une infrastructure
d’envergure : 656 barrages, 97 ouvrages régulateurs et 26 grands réservoirs d’une capacité
de stockage de 175 TWh alimentant en eau 60 centrales hydroélectriques (d’une puissance
installée pouvant aller jusqu’à 5 616 MW). La puissance totale installée pour ces centrales est
de 35 364 MW. Ceci classe le système d’électricité du Québec parmi les plus écologiques au
monde avec environ 99% d’hydroélectricité. La figure 1.2 montre les zones de concentration
de la production, notamment la Grande Rivière (encadrée), et la manière avec laquelle elle
est transportée via des liaisons électriques haute-tension. 5
Cet important potentiel est géré par Hydro-Québec, une grande entreprise appartenant au
5. Source : http://www.hydroquebec.ca
4

Figure 1.2 Hydroélectricité du Québec


5

gouvernement du Québec et leader mondial dans le domaine de l’hydroélectricité. Cette en-


treprise s’occupe de la gestion du parc hydroélectrique ainsi que des autres sources d’énergies
exploitées (thermique, éolienne, etc.) en matière de production, de transport, d’investissement
(notamment l’agrandissement du parc hydroélectrique) et de recherche et développement.
Parmi les enjeux majeurs de la gestion de la production de l’électricité au Québec on peut
citer la maîtrise de l’aspect stochastique de certains phénomènes comme les apports naturels
aux réservoirs et la demande. En d’autres termes, il y a besoin d’élaborer des modèles et
méthodes de gestion capables de tenir compte, au mieux, de cette stochasticité.

1.3 Objectifs

L’objectif du présent mémoire est l’application de deux méthodes de programmation dyna-


mique stochastique, à savoir la célèbre « Stochastic Dual Dynamic Programming » (SDDP),
et une nouvelle méthode de programmation dynamique stochastique approchée (ASDP), à
la planification moyen-terme de la production d’hydroélectricité. Pour atteindre cet objectif
final, les étapes suivantes sont déterminantes :
– Modélisation du parc hydroélectrique et extraction des entrées du modèle mathématique
de la base de données de l’unité production d’Hydro-Québec ;
– Choix d’une représentation des fonctions de production des centrales hydroélectriques qui
réduit le plus possible l’écart entre la production estimée et la production réelle. En fait,
les fonctions de production des centrales hydroélectriques ne sont ni linéaires, ni même
concaves. Or, les modèles d’optimisation utilisés sont linéaires. D’où le besoin de linéa-
riser ces fonctions tout en restant proche de leurs vraies valeurs. Plusieurs approches de
linéarisation sont présentées et comparées entre elles ;
– Application et comparaison des méthodes SDDP et ASDP, avec le choix effectué pour
la modélisation des fonctions de productions, sur la partie la plus importante du parc
hydroélectrique du Québec, à savoir La Grande Rivière.

1.4 Contenu du mémoire

Le présent mémoire est divisé en sept chapitres, y compris cette introduction. Le chapitre
2 contient une revue de littérature des méthodes connues de résolution du problème de pla-
nification de la production d’hydroélectricité, en particulier les méthodes de programmation
dynamique stochastique (SDP et SDDP). Le chapitre 3 présente plusieurs aspects de modé-
lisation qui entrent en jeu dans le domaine de l’hydroélectricité en général, notamment les
fonctions de production des centrales hydroélectriques et les apports hydriques naturels. Le
6

chapitre 4 décrit le problème de planification de la production d’hydroélectricité. Le chapitre


5 décrit les méthodes de programmation dynamique stochastique utilisées dans ce mémoire :
SDP (en particulier ASDP) et SDDP. Le chapitre 6 présente et analyse les résultats numé-
riques obtenus sur un cas d’étude réel : La Grande Rivière. Enfin, dans le dernier chapitre,
on conclut sur les travaux qui ont été menés et on expose des pistes de recherche future à
explorer.
7

CHAPITRE 2 REVUE DE LITTÉRATURE

Ce chapitre présente une revue de littérature des méthodes utilisées dans la planification
moyen-terme de la production d’hydroélectricité. La section 2.1 présente le problème de ges-
tion de réservoirs sous une forme générale et classifie les méthodes qui ont été utilisées pour le
résoudre. Les sections 2.2, 2.3 et 2.4 traite respectivement des méthodes basées sur les arbres
de scénarios, des méthodes basées sur la programmation dynamique stochastique (SDP) et de
la méthode de programmation dynamique duale stochastique (SDDP). Finalement, la section
2.5 est consacrée aux fonctions de production des centrales hydroélectriques qui constitue un
élément central de modélisation dans le problème de planification de la production d’hydro-
électricité.

2.1 Gestion de réservoirs sous incertitude

Si l’on fait l’hypothèse que les apports de chaque semaine, notamment ξ1 durant la première
semaine, sont connus au début de celle-ci, le problème de planification moyen-terme de la
production d’hydroélectricité s’écrit sous la forme suivante :

Θ1 = max B1 (S0 , ξ1 , X1 ) + Eξ2  max B2 (S1 , ξ 2 , X2 )+



X1 ,S1 X2 ,S2
S1 =f (S0 ,ξ1 ,X1 ) S2 =f (S1 ,ξ 2 ,X2 )

... + Eξt  max Bt (St−1 , ξ t , Xt ) + ... (2.1)



Xt ,St
St =f (St−1 ,ξ t ,Xt )
 

... + EξT  max BT (ST −1 , ξ T , XT )




XT ,ST
ST =f (ST −1 ,ξ T ,XT )

où S0 est le vecteur de l’état initial du système, St est le vecteur de l’état du système à la


fin de la période t, Xt est le vecteur des décisions de la période t (débits turbinés, débits
déversés etc.), Bt est la fonction bénéfice immédiat de la période t et ξ t vecteur des aléas
ayant lieu durant la période t.
Le vecteur St de l’état du système contient les volumes des réservoirs à la fin de la période t.
Il peut aussi contenir d’autres composantes telles que des apports passés dans le cas où l’on
modélise les apports hydriques naturels avec un modèle périodique auto-régressif PAR(p).
St = f (St−1 , ξ t , Xt ) représente les contraintes de conservation de masse des réservoirs et des
8

contraintes sur les décisions de la période t. La fonction f peut être vue comme la fonction
de transition du schéma de programmation dynamique du problème (2.1).
L’aléa ξ t peut porter sur plusieurs paramètres : apports hydriques naturels au réservoirs,
demande en électricité, prix de l’électricité etc. Dans cette revue, on se restreint au cas où
l’aléa porte seulement sur les apports hydriques naturels.
Dans le contexte de planification moyen-terme, on ne tient pas compte des non-linéarités qui
entrent en jeu dans les définitions exactes des fonctions f et Bt .
Le but ultime de la planification de la production d’hydroélectricité est de trouver une po-
litique de gestion optimale sur tout l’horizon de planification. À la période t, à partir d’un
état initial St−1 et un apport prévu ξ t , il faut prendre une décision optimale Xt qui maximise
la somme des bénéfices immédiat Bt (St−1 , ξ t , Xt ) et futur
  
  
max Bt+1 St , ξ t+1 , Xt+1 + ... + EξT  max BT (ST −1 , ξ T , XT )
.

Eξt+1 
 Xt+1 ,St+1 XT ,ST
St+1 =f (St ,ξ t+1 ,Xt+1 ) ST =f (ST −1 ,ξ T ,XT )

La politique de gestion doit permettre au décideur de prendre à chaque période une décision
pesée qui représente un compromis entre les différentes réalisations de l’aléa futur. De manière
schématique, si l’apport hydrique peut avoir deux réalisations possibles : humide (H) et sec
(S), les décisions doivent prendre en compte les quatre scénarios représentés à la figure 2.1.

Apport
incertain conséquence

H OK
Hydro
S Autres sources

H Déversement
Autres sources
S OK

t t+1 temps

Figure 2.1 Processus décisionnel à deux étapes

Plusieurs méthodologies ont été proposées pour résoudre le problème (2.1). Des articles tels
9

que ceux de Yeh (1985), Labadie (2004) et plus récemment Rani et Moreira (2010), ont résumé
ces méthodologies sous forme de revues qui ont grandement facilité le travail bibliographique
des chercheurs dans ce domaine.
Il est à noter que le problème (2.1) est formulé avec l’hypothèse d’information parfaite de
 
l’aléa ξ t à une période t donnée alors que l’aléa futur ξ t+1 , ξ t+2 , .., ξ T est stochastique.
Cette hypothèse est réaliste dans le cadre de la planification moyen- et long-terme (voir, par
exemple, Labadie (2004)).
Labadie (2004) classifie les méthodes de résolution de (2.1) en deux catégories :
– optimisation stochastique implicite : dont la procédure est schématisée dans la figure
2.2. Dans ce type de méthodes, (2.1) n’est pas globalement résolu sur le processus stochas-
(m)
tique (ξ t )t , mais plutôt sur un grand nombre M de scénarios possibles ξt , t = 1 .. T, m =
1 .. M . Chaque scénario est résolu via un modèle déterministe et a sa propre politique de
gestion. Une politique de gestion globale est par la suite construite via des méthodes de
régression à partir des politiques propres des M scénarios.
Apport

Modèle
Temps Modèle
stochastique
d'optimisation
d'apports Décision
ou déterministe
optimale
historique vs. Stock
long
Décision

Régression
multiple,
RNA, Stock
Méthodes
d'inférence

Politique
optimale
de gestion

Modèle de Raffinement
simulation et tests

max
Stock

min

Temps

Figure 2.2 Procédure d’optimisation stochastique implicite (Labadie (2004))

L’article de Karamouz et Houck (1987) présente un exemple de ce type d’approche où il


est question d’itérer un cycle constitué d’un programme dynamique déterministe, d’une
analyse avec la régression et d’une simulation de politique.
10

L’inconvénient de ce type d’approches est que les politiques obtenues sont anticipatives.
Cette anticipativité est due au fait que l’on résout des problèmes déterministes dont les
décisions à une période t donnée ne prennent pas en compte toutes les réalisations possibles
de l’aléa qui aura lieu dans les périodes subséquentes.
– optimisation stochastique explicite : dont la procédure est schématisée dans la figure
2.3. Dans ce cas, le processus stochastique (ξ t )t est explicitement pris en compte et les
modèles utilisés sont stochastiques dans le sens que les décisions sont prises de sorte à
maximiser la somme du bénéfice immédiat et du bénéfice futur. Ce bénéfice futur est
explicitement formulé comme somme pondérée des bénéfices futurs de toutes les réalisations
de l’aléa futur.
Apport

Modèle Temps Analyse


stochastique statistique
d'apports fréquentielle
ou Distribution

non-excédance
historique de probabilité Probabilité de
long
Modèle Apport
d'optimisation
stochastique

Politique
optimale
de gestion
Modèle de Raffinement
simulation et tests

max
Stock

min
Temps

Figure 2.3 Procédure d’optimisation stochastique explicite (Labadie (2004))

Les politiques issues de ce type d’approches sont plus fiables vu qu’elles sont fidèles à la
formulation rigoureuse du problème (2.1).
Dans la suite on expose trois types d’approches d’optimisation stochastique explicite, à
savoir les méthodes basées sur les arbres de scénarios, les méthodes basées sur la program-
mation dynamique stochastique sous sa forme récursive pure (ASDP) et la méthode de
programmation dynamique duale stochastique (SDDP) (Pereira et Pinto (1991)) qui est
une variante itérative de ASDP basée sur la décomposition de Benders (Benders (1962)).
11

2.2 Résolution par réduction à un arbre de scénarios

Les méthodes basées sur une réduction à un arbre de scénarios du processus stochastique des
apports partent d’une discrétisation de celui-ci sous forme d’un arbre de scénarios fini. Un
arbre de scénarios est schématisé dans la figure 2.4.

t=1

t=2

t=3

Figure 2.4 Un arbre de scénarios

Le problème (2.1) est reformulé de manière équivalente sur l’arbre de scénarios en associant
à chaque nœud n de l’arbre un vecteur de décisions Xn et en le liant à son nœud père avec
des contraintes équivalentes aux contraintes de transition St = f (St−1 , ξ t , Xt ) dans (2.1).
Le problème est ensuite résolu par une méthode de décomposition. Les méthodes de décompo-
sition connues pour résoudre un programme stochastique sur arbre de scénarios sont de deux
types : méthodes de décomposition par étape et méthodes de décomposition par scénario.
Les méthodes de décomposition par étape sont basées sur la décomposition de Benders (Ben-
ders (1962)) et affectent une fonction de bénéfice futur Fn à chaque nœud n de l’arbre. Ces
fonctions Fn étant concaves linéaires par morceaux, elles sont construites de manière itéra-
tive par ajout d’hyperplans coupants. La méthode L-Shaped (Birge et Louveaux (2011)) est
souvent utilisée dans ce contexte (Archibald et al. (1999)). Cette méthode peut être couteuse
dans le cas où l’arbre contient un grand nombre de nœuds. Pour contourner cette difficulté,
Santos et Diniz (2009) proposent une approche multi-périodes agrégeant plusieurs périodes
12

consécutives en une seule pour diminuer le nombre de fonctions de bénéfice futur Fn à définir.
Les méthodes de décomposition par scénario définissent un sous-problème pour chaque scéna-
rio. Le problème maître contient les contraintes liantes dites de non-anticipativité qui assurent
qu’à chaque nœud, une seule décision est prise quelle que soit le scénario qui le traverse. La
méthode la plus connue dans cette classe est le Progressive Hedging. Elle a été récemment
implémentée en gestion de réservoirs par Carpentier et al. (2013).
Les méthodes basées sur la réduction à un arbre de scénarios restent limitées en matière de
taille des arbres de scénarios. Ceci fait perdre au processus stochastique d’apport sa richesse
et contraint sa discrétisation.

2.3 Résolution par programmation dynamique stochastique approchée

Le problème (2.1) peut être écrit sous la forme récursive équivalente suivante :

Θ1 = max B1 (S0 , ξ 1 , X1 ) + F2 (S1 )


X1 ,S1
S1 =f (S0 ,ξ 1 ,X1 )

 
(2.2)
Ft (St−1 ) = Eξt  max Bt (St−1 , ξ t , Xt ) + Ft+1 (St ) t = 2 .. T
 
Xt ,St
St =f (St−1 ,ξ t ,Xt )

FT +1 ≡ 0.

En exploitant le principe d’optimalité de Bellman (Bellman (1957)), le problème (2.2) peut


être résolu à l’optimalité. Les fonctions de bénéfice futur Ft sont construites récursivement
en allant de t = T à t = 2. La récurrence est bien définie puisque la fonction de bénéfice futur
à la dernière période est soit connue soit nulle comme énoncé précédemment (FT +1 ≡ 0).
L’algorithme de SDP commence par construire une approximation FT de FT . FT est ensuite
utilisée pour construire une approximation FT −1 de FT −1 et ainsi de suite jusqu’à construire
une approximation F2 de F2 . À chaque période, l’approximation Ft et son gradient sont éva-
lués sur une grille fine du domaine de définition de St−1 , ensuite des méthodes d’interpolation
(Johnson et al. (1993), Tejada-Guibert et al. (1993)) ou d’extrapolation (programmation dy-
namique duale (DDP), Benders (1962)) sont utilisées pour construire une représentation
complète de Ft en se basant sur la concavité de Ft (Birge et Louveaux (2011)).
Malgré sa simplicité, la complexité de cette méthode est exponentielle en le nombre de réser-
voirs. En effet, supposons que le système comporte R réservoirs et que le volume de chaque
13

réservoir est discrétisé en M valeurs. Si l’état du système est représenté seulement par les
 
volumes des réservoirs, la complexité de SDP est en O T × M R .
Pour contourner sa complexité, deux approches ont été proposées.
La première, communément appelée méthode d’agrégation-désagrégation, consiste à agréger
un ensemble de réservoirs en un seul puis lancer SDP sur le système agrégé. Une politique
de gestion est ainsi obtenue sur le système agrégé et nécessite un post-traitement de désagré-
gation pour être opérationnelle. Ce type d’approches a été largement utilisé pour résoudre
le problème de planification moyen- et long-terme dans un système multi-réservoirs afin de
surmonter la combinatoire de SDP. Archibald et al. (1997) décomposent le problème en sous-
problèmes dans chacun l’ensemble des réservoirs est divisé en trois réservoirs agrégés : les
réservoirs en amont d’un réservoir r, le réservoir r et les réservoirs en aval de r. Turgeon et
Charbonneau (1998) agrègent les réservoirs par rivière puis assemble toutes les rivières en un
seul réservoir.
Malgré que l’approche agrégation-désagrégation surmonte la combinatoire du problème multi-
réservoirs, des difficultés sont rencontrées dans le post-traitement de désagrégation (Saad
et al. (1994)).
La deuxième approche utilisée avec SDP pour contourner sa combinatoire consiste à éviter
d’évaluer la fonction de bénéfice futur sur tous les points d’une grille régulière mais plutôt
sur une sous partie de cette grille. Cervellera et al. (2006) utilisent des techniques telles que
les les tableaux orthogonaux, les hypercubes latins et les suites à discrépance faible pour
discrétiser efficacement l’espace d’état. Ayant évalué la fonction de bénéfice futur sur l’espace
discrétisé, Cervellera et al. (2006) utilisent une technique basée sur les réseaux de neurones
pour approximer cette fonction sur l’espace d’état entier. Plus récemment, Krau et al. (2015)
ont développé une technique de discrétisation en temps réel de l’espace d’état en le découpant
en hyper-rectangles.

2.4 Résolution par programmation dynamique duale stochastique

La méthode de programmation dynamique duale stochastique (SDDP) est une approche


qui surmonte la complexité de SDP et n’assume aucune discrétisation a priori de l’espace
d’état. Cette méthode a été présentée pour la première fois par Pereira et Pinto (1991)
et a reçu une notoriété mondiale par la suite. Elle a été utilisée comme outil de gestion
dans plusieurs systèmes hydroélectriques dans le monde : Brésil (Maceira et al. (2008)),
Scandinavie (Røtting et al. (1992), Mo et al. (2001), Kristiansen (2004)), Nouvelle-Zélande
(Halliburton et al. (2004)), Turquie (Tilmant et Kelman (2007)), Afrique (Goor et al. (2010a),
14

Goor et al. (2010b), Tilmant et al. (2010)).


Au lieu de construire les approximations Ft de Ft en une seule récurrence, SDDP procède de
manière itérative et raffine à chaque itération une sur-approximation Ft de Ft en exploitant la
concavité de la fonction de bénéfice futur Ft (Birge et Louveaux (2011)) avec des hyperplans
coupants.
Plus précisément, une itération de SDDP est constituée d’une passe vers l’avant (forward
pass) et d’une passe vers l’arrière (backward pass). La passe vers l’avant permet de préciser
des candidats St−1 , t = 2 .. T par simulation de la politique approximative (Ft )t courante
avec un (ou plusieurs) scénario(s) tiré(s) aléatoirement du processus stochastique d’apport.
La passe vers l’arrière permet de raffiner la politique (Ft )t par ajout d’une coupe de Benders
à Ft au point candidat St−1 pour t = T .. 2.
Vu son caractère itératif, SDDP nécessite un critère d’arrêt. En plus du nombre maximum
d’itérations, deux types de critères d’arrêt ont été présenté dans la littérature. Le premier
(Pereira et Pinto (1991), Shapiro (2011)) consiste à calculer une borne supérieure en résolvant
le problème à une étape de la première période. Un estimateur de la borne inférieure est
ensuite calculé en simulant un nombre assez grand de scénarios du processus stochastique
d’apport et permet de définir un intervalle de confiance sur la valeur de l’objectif (2.1). Le
critère consiste à tester si la borne supérieure est à l’intérieur de cet intervalle de confiance.
Ce critère est discuté par Shapiro (2011), en particulier plus la tolérance de l’intervalle de
confiance est petite plus celui-ci est large et SDDP s’arrête prématurément. Le deuxième
critère d’arrêt est présenté par Homem-de Mello et al. (2011) sous forme de tests d’hypothèses.
Sous certaines hypothèses non restrictives, Philpott et Guan (2008) et Shapiro (2011) ont
prouvé la convergence de SDDP après un nombre fini d’itérations. La preuve faite par Philpott
et Guan (2008) est plus simple et se base sur la preuve de convergence de la méthode de
décomposition de Benders (Benders (1962)). Le résultat central utilisé dans cette preuve est
la finitude du nombre de coupes de Benders pouvant être générées pour définir les fonctions de
bénéfice futur approximées (Ft )t . Rigoureusement parlant, les deux articles précités prouvent
que Ft converge presque surement vers la vraie fonction de bénéfice futur Ft pour tout
t = 2 .. T et ce après un nombre fini d’itérations.
Le seul inconvénient de SDDP réside dans la phase de rodage dont elle a besoin avant de
stabiliser la politique. En effet, les coupes générées aux premières itérations ne sont plus
significatives après un certain nombre d’itérations. En plus, plus le nombre de périodes de
l’horizon est grand plus cette phase de rodage est longue. Quelques articles ont proposé des
approches visant à accélérer la convergence de SDDP et réduire l’impact de la phase de rodage
sur son temps d’exécution.
15

de Matos et al. (2015) propose deux techniques pour accélérer SDDP. La première consiste à
ne pas simuler un nombre fixe de scénarios dans la phase vers l’avant mais plutôt d’augmenter
ce nombre progressivement au fil des itérations. La deuxième technique consiste à sélectionner
quelques coupes définissant les fonctions de bénéfice futur Ft lorsque l’on résout les problèmes
à une étape. Ces deux techniques réussissent à améliorer le temps d’exécution de SDDP.
Cependant, la deuxième peut dégrader la qualité de la politique de gestion comme le souligne
de Matos et al. (2015).
Aouam et Yu (2008) propose une autre technique pour améliorer la performance de SDDP
qui consiste à ajouter, au début de l’algorithme, des coupes de Benders exclusivement aux
0 0
fonctions de bénéfice futur Ft pour t = 2 .. T où T < T et ensuite exécuter l’algorithme
standard de SDDP sur tout l’horizon de planification.

2.5 Fonctions de production des centrales hydroélectriques

La puissance électrique p (MW) générée par une centrale hydroélectrique s’exprime en fonc-
tion de la hauteur de chute h (m) et le débit turbiné q (m3 /s) :

p(q, h) = η(q)ρgqh (2.3)

où ρ (kg/m3 ) est la densité volumique de l’eau, g (m/s2 ) est l’accélération de la pesanteur.


En pratique, la centrale ne capte pas toute l’énergie potentielle de l’eau à cause des pertes
dans les conduites communes et l’effet de tarage aval.
Dans les publications de Hammadia (2000), Breton et al. (2002) et Breton et al. (2004),
ces pertes ont été prises en compte dans la hauteur de chute de manière sous-jacente en
remplaçant h dans (2.3) par la hauteur de chute nette hnette telle que hnette = h − ∆hpertes .
Dans l’article de Diniz et Maceira (2008), ces pertes sont prises en compte de manière expli-
cite. Une représentations quadri-dimensionnelle est adoptée (q, h, ∆hpertes ) 7→ p où les pertes
énergétiques sont prises en compte dans la hauteur de chute (∆hpertes ) mais en tant que
variable explicite.
Pour les besoins de la planification moyen-terme de la production hydroélectrique, une fonc-
tion globale du domaine débit-hauteur de chute au domaine puissance doit être construite au
préalable. Dans le cas où l’on utilise des modèles linéaires qui maximise la production, cette
fonction globale doit être approximée par des fonctions concaves linéarisables.
Plusieurs articles traitant la planification de la production d’hydroélectricité (Archibald et al.
(1999), Tilmant et Kelman (2007)) négligent l’effet hauteur de chute dans leurs modèles.
16

Cependant cette hypothèse simplificatrice reste acceptable pour des centrales dont la hauteur
de chute fluctue peu autour d’une valeur nominale.
La procédure d’approximation concave la plus utilisée pour atteindre ce but consiste à ap-
proximer cette fonction par une fonction concave linéaire par morceaux en utilisant des
méthodes d’ajustement convexe linéaire par morceaux comme celle développée par Magnani
et Boyd (2009). Ce type d’approche a été utilisé, entre autres, par Goor et al. (2010a).
17

CHAPITRE 3 ÉLÉMENTS DE MODÉLISATION

Ce chapitre présente les éléments de modélisation dans le contexte de l’hydroélectricité. En


premier lieu, les infrastructures et installations en jeu dans ce domaine sont introduites.
Ensuite, plusieurs aspects importants de modélisation sont étudiés en détail, à savoir les
fonctions de production des centrales hydroélectriques, les apports naturels (en eau) aux
réservoirs et la modélisation de la fluctuation de la demande en électricité par des classes.
Note : Les images réelles présentes dans ce chapitre sont prises du site-web
http://www.hydroquebec.ca.

3.1 Infrastructures et installations hydroélectriques

L’hydroélectricité est produite par l’intermédiaire d’une double conversion énergétique repré-
sentée dans la figure 3.1 :

réseau de transport
niveau amont

vanne d’ouverture
transformateur
et
grille à débris

alternateur hauteur
de chute
conduite
turbine

niveau aval

tube
d’évacuation

Figure 3.1 Processus de production de l’hydroélectricité (Hammadia (2000))

– Conversion de l’énergie potentielle de pesanteur en énergie mécanique


À l’ouverture de la vanne, l’eau emmagasinée dans le réservoir en amont s’engouffre dans
la conduite amenant à une turbine. La vitesse de l’eau entraine la rotation et de la turbine
et du rotor de l’alternateur. Ensuite
– Conversion de l’énergie mécanique de rotation en énergie électrique
L’alternateur formé du rotor (mobile) et du stator (fixe) produit un courant alternatif grâce
à la rotation du rotor.
18

Quelles sont alors les caractéristiques des infrastructures et installations utilisées pour pro-
duire l’hydroélectricité ?

3.1.1 Réservoir

Un réservoir est une infrastructure faisant barrage à l’eau qui coule le long d’une rivière, il
permet ainsi de stocker l’énergie potentielle de l’eau. La figure 3.2 nous donne une image
d’un réservoir réel.

Figure 3.2 Barrage de la Trenche (Québec)

Un réservoir (schéma de base dans la figure 3.3) est caractérisé par :


– un volume minimum vmin et un volume maximum vmax . Le volume vmax − vmin est le
volume pour générer de l’électricité. Ainsi, dans les modèles qu’on verra par la suite, on
considère le volume relatif (à vmin ) du réservoir dont les bornes sont 0 et v = vmax − vmin ;
– une fonction v 7→ N iv donnant le niveau de l’eau du réservoir en fonction de son volume.
Cette fonction est concave linéaire par morceaux (on peut imaginer la surface horizontale
de l’eau augmenter avec le niveau).

Réservoir
vmax
N iv
vmin

Centrale Évacuateur

Figure 3.3 Schéma de base d’un réservoir


19

3.1.2 Centrale hydroélectrique

Une centrale hydroélectrique est une usine de production d’électricité constituée de plusieurs
groupes turbines-alternateurs. Ces derniers peuvent être parallèlement exploités en totalité
ou en partie. Les groupes turbines-alternateurs, et donc les centrales hydroélectriques, sont
caractérisés par une fonction entrée-sortie appelée fonction débit-puissance qui dépend de la
hauteur de chute. Cette fonction sera étudiée dans la section 3.2.
On distingue deux types de centrales :
– centrale à réservoir : installée en aval d’un réservoir. Ce type de centrales exploitent souvent
une dénivellation de l’eau importante et produisent une grande puissance. La figure 3.4
donne une image de ce type de centrales.

Figure 3.4 Centrale Robert-Bourassa, une centrale souterraine à réservoir (Québec)

– centrale au fil de l’eau : alimentée directement par un cours d’eau et ne disposant pas
de réservoir. Ce type de centrales ont une faible hauteur de chute et par conséquent la
puissance qu’elles produisent dépend uniquement du débit du cours d’eau. La figure 3.5
donne une image de ce type de centrales.

Figure 3.5 Centrale de Carillon, une centrale au fil de l’eau (Québec)


20

3.1.3 Ouvrage d’évacuation

Un ouvrage d’évacuation (appelé aussi évacuateur de crues ou déversoir) est un aménagement


hydroélectrique en aval d’un réservoir qui permet de contrôler son niveau d’eau pour empêcher
qu’il ne dépasse sa limite. Cet ouvrage permet aussi d’approvisionner en eau un réservoir plus
bas. La figure 3.6 donne une image d’un évacuateur de crues réel.

Figure 3.6 Évacuateur de crues du barrage Robert-Bourassa (Québec)

3.2 Fonction de production d’une centrale hydroélectrique

Le fonction de production d’une centrale hydroélectrique dépend de deux facteurs : le débit


turbiné et la hauteur de chute. Cette dernière étant la différence entre le niveau en amont de
la centrale et le niveau en aval.
L’énergie potentielle de l’eau que la centrale capte et transforme effectivement en énergie
électrique est plus petite que l’énergie potentielle de l’eau en repos (avant d’être acheminée
et turbinée). En effet, plusieurs facteurs affectent cette énergie captée, à savoir
– les frottements au niveaux des conduites d’eau et d’autres installations d’acheminement
– le tarage aval qui correspond à l’augmentation du niveau aval due au débit sortant de la
centrale.
On modélise souvent cette perte énergétique par une perte en hauteur de chute. On parle
ainsi de hauteur de chute brute (celle de l’eau en repos), notée h, et de hauteur de chute nette
21

(celle ressentie par la centrale), notée hnette . La relation entre ces deux hauteurs de chute est

hnette = h − ∆hpertes (3.1)

où ∆hpertes correspond aux pertes énergétiques.

3.2.1 Cas d’un groupe turbine-alternateur

La puissance électrique pT /A (M W ) produite par un groupe turbine-alternateur opérant à


un débit q (m3 /s) et une hauteur de chute brute h (m) s’écrit sous la forme :

pT /A (q, h) = ηT /A (q)ρgqhnette (3.2)

où ρ (kg/m3 ) est la densité volumique de l’eau, g (m/s2 ) l’accélération de la pesanteur et


ηT /A (q) < 1 le rendement du groupe. Ce rendement dépend du débit turbiné q comme le
montre la figure 3.7, en particulier il est optimal pour un débit spécifique q tracé appelé débit
de tracé.

ηT/A
Rendement

qtracé qmax q
Débit

Figure 3.7 Rendement d’un groupe turbine-alternateur (Hammadia (2000))

On dispose souvent de la courbe de la fonction débit-puissance d’un groupe turbine-alternateur


pour une hauteur de chute brute spécifique appelée hauteur de référence, notée h0 . On note
cette fonction q 7→ p0T /A (q). La figure 3.8 donne un exemple de fonction débit-puissance
22

0
T/A

Figure 3.8 Exemple de fonction débit-puissance (Hammadia (2000))

Les zones noircies sont des zones d’opération interdites (phénomènes de vibration ou cavita-
tion).
On peut aussi obtenir la valeur de la puissance à un débit q et hauteur de chute brute h
donnés par la relation de similitude suivante (Hammadia (2000), Breton et al. (2004)) :
!β  !−α 
hnette hnette
pT /A (q, h) = p0T /A  q (3.3)
h0nette h0nette

où α et β ∈ R sont des paramètres qui dépendent du groupe turbine-alternateur. (3.3) peut


être approximée par 
!β !−α 
h h
pT /A (q, h) = p0T /A  0 q (3.4)
h0 h

Cette approximation repose sur les deux hypothèses suivantes :


hnette h − ∆hpertes h
– 0 = 0 0
≈ 0 le rapport des hauteurs de chute nettes est sensiblement égal
hnette h − ∆hpertes h
à celui
 des hauteurs de chute brutes ;
!−α   !−α 
hnette h
– ηT /A  0 q  ≈ ηT /A  0 q  ≈ ηT /A (q). En pratique, cette hypothèse n’est
hnette h
pas restrictive car d’une part le groupe turbine-alternateur fonctionne généralement à son
débit de tracé (sur la figure 3.7, on peut observer le caractère aplati de la courbe q 7→
!−α !−α
hnette h
ηT /A (q) autour du débit de tracé), et d’une autre part ≈ ≈ 1.
h0nette h0
La figure 3.9 illustre cette transformation de la fonction débit-puissance de la hauteur de
chute brute de référence à une autre hauteur de chute brute. Dans cette figure, α(h) représente
23

!−α !β
h h
et β(h) représente .
h0 h0

p(q) limites de débit à h 2


h2 h0 h1
limites de débit à h 0
limites de débit à h1 h2

h0
p0(α(h1)q)
Puissance

3
h1

Puissance utile
1 0 1
ß(h )p (α(h )q)

2
1
pd

0 q min q α(h1) q qmax q


Puissance dissipée
Débit

Figure 3.9 Transformation par similitude de la fonction débit-puissance (Hammadia (2000))

3.2.2 Cas d’une centrale

Une centrale hydroélectrique est composée d’un ou plusieurs groupes turbines-alternateurs.


La figure 3.10 donne un exemple de configuration physique d’une centrale.

Réservoir en amont

Canal 1 Canal 2
hauteur de chute

Conduites

Groupes U1 U2 U4 U5
T/A U3 U6

Canal de Canal de
décharge 1 décharge 2

Bief aval de la centrale

Figure 3.10 Exemple de configuration physique d’une centrale (Hammadia (2000))


24

La puissance générée par la centrale pour un débit turbiné total q, une hauteur de chute nette
h et un nombre U de groupes turbines-alternateurs engagés s’exprime comme la somme des
puissances générées par ses groupes turbines-alternateurs

U
X
pC (q, h) = pT /A (δ i q, h) (3.5)
i=1

U
X
où les variables (positives) δ i vérifient δ i = 1, le débit total q est reparti sur les groupes
i=1
turbines-alternateurs de façon à maximiser la puissance totale générée par la centrale tout en
respectant les contraintes de zones interdites des groupes turbines-alternateurs (Problème de
chargement optimal connu dans la littérature (e.g. Hammadia (2000), Breton et al. (2004))).
La formule (3.3) de transformation par similitude pour un groupe turbine-alternateur peut
être généralisée au cas d’une centrale

U
X
pC (q, h) = pT /A (δ i q, h)
i=1
!β  !−α 
U
h h
p0T /A  0
X
= δiq
i=1 h0 h
!β U  !−α  (3.6)
h h
p0T /A
X
= δ i q
h0 i=1 h0
!β  !−α 
h h
= p0C  q ,
h0 h0

où la fonction p0C est la fonction de production de la centrale à la hauteur de chute de référence


h0 .

3.2.3 Modélisation pour la planification moyen-terme de la production

Dans le cadre de la planification moyen-terme de la production hydroélectrique (horizon


d’une à deux années avec un pas de temps hebdomadaire), il est question de déterminer la
quantité de ressources hydrauliques à puiser de chaque réservoir pour répondre à la demande
et de savoir la puissance électrique obtenue.
La planification court-terme (horizon de quelques jours avec un pas horaire) tient compte
des décisions globales prises par la planification moyen-terme et fournit un plan d’opération
des centrales avec toutes les considérations liées au choix des groupes turbines-alternateurs
à engager ou retirer pour la maintenance, les zones d’opérations interdites des groupes etc.
25

Dans cette perspective, la fonction de production d’une centrale hydroélectrique pour un


modèle moyen-terme est modélisée par un ensemble fini de configurations de production.
Plus précisément, pour une centrale C composée de UC groupes turbines-alternateurs, on
dispose de points (qi0 , p0i ), i ∈ {0, .., UC } ∪ {UC + 1, .., UC + LC } correspondant à des
configurations optimales de production à la hauteur de chute (brute) de référence. Les points
(qi0 , p0i ), i ∈ {0, .., UC } correspond à l’engagement de i groupes turbines-alternateurs. Les
points (qi0 , p0i ), i ∈ {UC + 1, .., UC + LC } correspondent à des configurations qui engagent
tous les UC groupes avec un débit supplémentaire, auxquelles on peut avoir recours en cas
0
de demande élevée. Pour alléger la notation, on note dorénavant UC = UC + LC .
Pour éviter d’utiliser des modèles d’optimisation en nombres entiers pour la planification
moyen-terme, on modélise la fonction de production à hauteur de chute de référence par
0
interpolation des points (qi0 , p0i ), i ∈ {0, .., UC }, on obtient ainsi une fonction concave (voir,
par exemple, Hammadia (2000)) linéaire par morceaux. La figure 3.11 donne un exemple
d’une telle interpolation.

450
(q5,p5)
400
(q4,p4)
350
(q2,p2) (q3,p3)
deux groupes engagés
Puissance (MW)

300

250

200
(q1,p1)
un seul groupe engagé
150

100

50

0
(q0,p0) 0 200 400 600 800 1000 1200
aucun groupe engagé
Débit (m3/s)

Figure 3.11 Exemple de fonction de production à hauteur de référence (Centrale à deux


groupes)

Si, par exemple, le modèle que l’on optimise indique qu’il faut turbiner au pas t de durée ∆t
à un débit q tel que q10 < q < q20 , on interprète cela comme turbiner pendant λ∆t au débit q10
et pendant (1 − λ)∆t au débit q20 , où λ ∈ [0, 1] vérifie q = λq10 + (1 − λ)q20 .
26

0
À une autre hauteur de chute brute h1 , on peut obtenir les points (qi1 , p1i ), i ∈ {0, .., UC }
correspondants aux mêmes configurations de production via la formule de transformation par
similitude (3.6), i.e. !α
h1

1
qi = qi0





 h0


(3.7)
 !β
 1

 h
1
 pi = p0i



h0

Ainsi, on peut obtenir une fonction de production pour tout l’espace (q, h). La figure 3.12 en
donne un exemple.

Figure 3.12 Exemple de fonction de production globale

Cette fonction, quoique concave si l’on fixe la hauteur de chute, n’est pas globalement concave.
Ainsi pour l’utiliser dans un cadre général de programmation linéaire où l’on maximise la
production hydroélectrique, il faut l’approximer par une fonction concave au préalable. Des
méthodes pour l’approximer par une fonction concave sont introduites dans la section sui-
vante.
27

3.2.4 Approximation concave des fonctions de production

Plusieurs approches d’approximation concave des fonctions de production sont envisageables.


On présente ici deux méthodes différentes :
– approximation par enveloppe concave de deux fonctions de production aux hauteurs de
chute limites (minimum et maximum) ;
– approximation par une fonction concave affine par morceaux.

Approximation par enveloppe concave


On obtient les fonctions de production respectives de la centrale à ses hauteurs de chute
brutes minimum hmin et maximum hmax via les équations (3.7). Ce qui nous donne les points
n 0
o
(qimin , pmin
i ) (q max max
i , pi ), i ∈ 0, .., UC

La production pC (q, h) est alors approximée par

pC (q, h) ≈ peC (q, h) := max p


λ,p
0 0
UC UC
λmin qimin + λmax qimax
X X
s. à q = i i
i=1 i=1
0 0
UC UC
λmin hmin + λmax hmax
X X
h= i i
i=1 i=1 (3.8)
0 0
UC UC
λmin pmin λmax pmax
X X
p= i i + i i
i=1 i=1
0 0
UC UC
λmin λmax
X X
i + i =1
i=1 i=1

λ ≥ 0.

Dorénavant, on fait référence à cette approche par EnvConc.

Approximation par une fonction concave affine par morceaux


La fonction de production globale pC (q, h) est approximée par une fonction concave affine
par morceaux, i.e.

pC (q, h) ≈ peC (q, h) := min (aq,j q + ah,j h + bj )


j=1 .. K
= max p (3.9)
p
p ≤ aq,j q + ah,j h + bj j = 1 .. K.
28

Ici,
– K : nombre d’hyperplans affines qui approximent la fonction pC (q, h), c’est un paramètre ;
– (aq,j , ah,j , bj ) , j = 1 .. K sont des variables à déterminer.

Pour déterminer les valeurs de ces variables, on utilise un algorithme présenté par Magnani et
Boyd (2009) qui essaie d’ajuster un nuage de points ui , yi ∈ Rn × R par une fonction convexe
linéaire par morceaux. Dans notre cas, le nuage de points consiste en (qi , hi ), pi ∈ R2 × R
qu’on essaie d’ajuster avec une fonction concave linéaire par morceaux.
n 0
o
À partir des points (qi0 , p0i ), i ∈ 0, .., UC qui correspondent aux fonctionnements de la
centrale à la hauteur de chute de référence, on obtient via (3.7) les points (qij , pji ), i ∈
n 0
o
0, .., UC pour différentes hauteurs de chute hj , j = 1 .. Nh . On obtient ainsi le nuage de
n 0
o
points (qij , hj ), pji (i, j) ∈ 0, .., UC × {1, .., Nh }. Sans restreindre la généralité et pour
alléger la description de l’algorithme de Magnani et Boyd (2009), on note ce nuage de points
0
(qi , hi ), pi i = 1 .. Nh × UC .
(0) (0)
L’algorithme part d’une partition P1 , .. PK initiale de l’ensemble des indices des éléments
n 0
o
du nuage de points 1 .. Nh × UC , trouve un hyperplan optimal au sens d’un critère donné
pour chaque ensemble de la partition, met à jour la partition et refait la même procédure
jusqu’à ce que la partition ne change pas ou qu’un nombre maximum d’itérations est atteint.

ALGORITHME DE PARTITIONNEMENT
n 0
o
(0) (0)
• Données : partition P1 , .. PK de 1 .. Nh × UC et nombre maximum d’itérations
lmax
• Pour l = 0 .. lmax
1. Pour j = 1 .. K
 
(l+1) (l+1) (l+1)
trouver un hyperplan affine aq,j , ah,j , bj approximant le nuage de points
(l)
restreint à l’ensemble Pj
(l+1) (l+1)
2. Construire une nouvelle partition P1 .. PK avec les nouveaux hyperplans, i.e.
n n   oo
(l+1) (l+1) (l+1)
Pj = i, j = min r, min a(l+1)
q,s qi + ah,s hi + b (l+1)
s = a(l+1)
q,r q i + ah,r hi + b(l+1)
r
s=1 .. K

(l+1) (l)
3. STOP si Pj = Pj pour tout j = 1 .. K

Le point 2. de l’algorithme ci-dessus est, en d’autres termes, l’affectation à la nouvelle je


(l+1)
partition Pj les points où le je hyperplan affine (aq,j , ah,j , bj ) est actif.
29

Le point 1. de l’algorithme ci-dessus peut avoir plusieurs variantes.


– Meilleur hyperplan affine au sens des moindres carrés : cette variante est celle
proposée dans l’article de Magnani et Boyd (2009) consiste à déterminer (aq,j , ah,j , bj ) avec
le critère de moindres carrés, i.e.
 

(l+1) ∗
 
(l+1) (l+1) (l+1)
(aq,j qi + ah,j hi + bj − pi )2 
 X 
Xj = aq,j , ah,j , bj ∈ argmin 
 . (3.10)
(aq,j ,ah,j ,bj ) (l)
i∈Pj

Ce qui équivaut à résoudre


   
qi2
X X X X
qi hi qi  a(l+1) qi pi 
 
  q,j
 
 i∈P (l) i∈Pj
(l)
i∈P
(l)   i∈P (l) 
 Xj j
 Xj
    
  
h2i
X X

qi hi hi   
(l+1) 

hi pi 
ah,j  = . (3.11)
   
   
 i∈P (l) i∈Pj
(l) (l)
i∈Pj    i∈P (l) 
 j    j 
(l)
 X X    X 
 qi hi Pj 
(l+1)
  pi 
bj
   
(l) (l) (l)
i∈Pj i∈Pj | {z } i∈Pj
| {z } (l+1) | {z }
(l+1) Xj (l+1)
Aj wj

(l+1)
Dans le cas où la matrice Aj est inversible, i.e. le problème (3.10) admet une unique
(l+1) ∗
solution optimale Xj telle que

(l+1) ∗ (l+1) −1
 
(l+1)
Xj = Aj wj . (3.12)

Dans le cas contraire, i.e. le problème (3.10) admet une infinité de solution, plusieurs
(l+1) ∗
options peuvent être suivies. L’une d’elles est de trouver la solution Xj la plus proche
(l)
de la solution de l’itération précédente Xj au sens de la norme euclidienne

(l+1) ∗ (l) ∗
n o
(l+1) (l+1) (l+1) (l+1)
Xj ∈ argmin Xj − Xj , Aj Xj = wj . (3.13)
(l+1) 2
Xj

Dorénavant, on fait référence à cette variante par PartMC.

– Meilleur hyperplan affine au sens du minimum du maximum des écarts : ici,


on propose de remplacer le critère de moindres carrés par le critère de minimisation du
maximum des écarts, i.e.
 
(l+1) ∗
 
(l+1) (l+1) (l+1)
Xj = aq,j , ah,j , bj ∈ argmin  max |aq,j qi + ah,j hi + bj − pi | . (3.14)
(l)
(aq,j ,ah,j ,bj ) i∈Pj
30

Ce qui revient à résoudre le programme linéaire suivant

min z
z,aq,j ,ah,j ,bj

s. à z ≥ aq,j qi + ah,j hi + bj − pi (3.15)


z ≥ − (aq,j qi + ah,j hi + bj − pi ) .

Cette variante peut être coûteuse lorsque les programmes linéaires (3.15) sont de taille
relativement grande.
Dorénavant, on fait référence à cette variante par PartMINMAX.

Remarque : Au cours de l’algorithme, il se peut qu’un des ensembles de la partition devient


vide. Dans ce cas on diminue le nombre d’hyperplans.
Comme le mentionne Magnani et Boyd (2009), l’algorithme de partitionnement qu’on vient
(0) (0)
de développer dépend fortement de la partition de départ P1 , .. PK . C’est pourquoi il pro-
pose de faire plusieurs essais avec différentes partitions initiales et d’en garder la meilleure
approximation par hyperplans obtenue.

ALGORITHME DE PARTITIONNEMENT++
• Données : Nombre d’essais Nessais et nombre maximum d’itérations lmax
• Pour s = 1 .. Nessais
1. Générer une partition initiale aléatoire
2. Exécuter ALGORITHME DE PARTITIONNEMENT avec la partition générée et
lmax
3. Garder une trace de la meilleure approximation par hyperplans obtenue

Le point 1. de l’algorithme ci-dessus est fait, comme le suggère Magnani et Boyd (2009), de
la manière suivante
– K points deux à deux différents uj = (qj , hj ), j = 1 .. K du nuages sont tirés au hasard
n o
– Pj0 = i, ||(qi , hi ) − uj ||2 < ||(qi , hi ) − us ||2 ∀s 6= j , j = 1 .. K. Autrement dit Pj0 est
formé des points qui sont plus proches de uj que des autres us , s 6= j
Le point 3. de l’algorithme ci-dessus dépend du critère que l’on utilise dans l’algorithme de
partitionnement.
31

Si l’on est dans le cas de PartMC, le meilleur partitionnement est celui qui a la plus petite
erreur-type (RMSE) (en anglais « Root Mean Square Error »), qui s’écrit
v
u 0
Nh ×UC 2
1
u
u X  
RM SE = t
0 min aq,j qi + ah,j hi + bj − pi . (3.16)
Nh × UC i=1
j=1 .. K

Si l’on est dans le cas de PartMINMAX, le meilleur partitionnement est celui qui a la plus
petite erreur maximum (ErreurMax), qui s’écrit
 
ErreurM ax = max 0
min aq,j qi + ah,j hi + bj − pi . (3.17)
i=1 .. Nh ×UC j=1 .. K

Dans le chapitre 6, une comparaisons des trois approches (EnvConc, PartMC, PartMIN-
MAX) est faite sur plusieurs centrales hydroélectriques. On montre que PartMC et Part-
MINMAX sont plus appropriées aux fonctions de productions des centrales considérées avec
un léger avantage pour PartMINMAX grâce à sa simplicité.

3.3 Apports hydriques naturels

3.3.1 Modèles auto-régressifs périodiques

Les apports hydriques naturels sont généralement caractérisés par des aspects périodiques
(dus aux saisons de l’année) et stochastiques. La figure 3.13 illustre ces deux aspects en
traçant la courbe des apports par période hebdomadaire d’un historique de 53 années (la
période 1 correspond à la 1re semaine de janvier et ainsi de suite jusqu’à la 52e période qui
correspond à la dernière semaine de décembre).
Si l’on considère le cas d’une seule rivière, l’apport hydrique durant une période t donnée peut
être modélisé par une seule variable aléatoire At . La corrélation temporelle entre les apports
de différentes périodes est souvent modélisée par un modèle PAR(p) (Periodic Auoregressive
model of order p) dans lequel l’apport At est fonction des apports passés At−1 , .., At−p par
la formule p
At − µ t X At−j − µt−j
= φt,j + t . (3.18)
σt j=1 σt−j

Où µi et σi sont respectivement l’espérance mathématique et l’écart-type de Ai , φt,1 , .., φt,p


sont les paramètres du modèle PAR(p) et t un bruit gaussien de moyenne nulle et d’écart-
type σt . Les bruits t , t = 1 .. T sont indépendants. Il est à noter que la définition (3.18) est
incomplète sans la donnée des p apports hydriques passés (quantités déterministes connues)
32

14000

12000

Apport hydrique (m3/s)


10000

8000

6000

4000

2000

0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51
Semaine

Figure 3.13 Historique des apports hydriques (53 années)

A0 , .. , A1−p , où A1−i est l’apport hydriques à la rivière durant la ie période avant le début
de l’horizon considéré et ce en remontant dans le temps.
Dans le cadre de la programmation dynamique stochastique, plus le paramètre p est grand
plus la complexité de la résolution augmente (exponentiellement). C’est pour cette raison
que souvent on utilise juste un PAR(1). L’équation (3.18) devient

At − µ t At−1 − µt−1
= φt + t . (3.19)
σt σt−1

L’équation (3.19) contient une incohérence. En effet, le bruit t étant gaussien, il peut prendre
toute valeur réelle, même négative, ce qui peut emmener à des réalisations de signe négatif de
l’apport At . Pour éviter cela, une option serait d’utiliser plutôt une loi gaussienne tronquée
pour le bruit t . Une solution plus générale et qui présente aucune incohérence est d’utiliser
une transformation f de l’apport qui n’est pas affectée par les valeurs négatives que peut
prendre le bruit t , le modèle PAR(1) prend ainsi la forme

f (At ) − µt f (At−1 ) − µt−1


= φt + t . (3.20)
σt σt−1

Un des candidats potentiels pour jouer le rôle de la fonction f dans (3.20) est la fonction
33

logarithme népérien, notée ln, on obtient alors le modèle suivant

ln (At ) − µt ln (At−1 ) − µt−1


= φt + t . (3.21)
σt σt−1

C’est ce modèle que l’on utilise dorénavant.

3.3.2 Estimation des paramètres du modèle PAR(1)

Les paramètres du modèle PAR(1) transformé (3.21) sont estimés à partir de l’historique
(i)
des apports. On dispose souvent d’un nombre H d’années de données historiques At , t =
1 .. T, i = 1 .. H. On peut ainsi faire les estimations suivantes, dans cet ordre et pour tout
t = 1 .. T :
H
1 X 
(i)

1. µt ≈ µ̂t = ln At ;
H i=1
v
u H  
u 1 X (i)
 2
2. σt ≈ σ̂t = t ln At − µ̂t ;
H i=1
3. φt est obtenu par régression linéaire au sens des moindres carrés appliquée à (3.21), i.e.
 
(i)
 
(i)
 2
H
X ln At − µ̂t ln At−1 − µ̂t−1
φt ∈ argmin  −ϕ  ;
ϕ i=1 σ̂t σ̂t−1

v
u  
(i)
 
(i)
 2
u
u 1 H
X ln At − µ̂t ln At−1 − µ̂t−1
4. σt ≈ σ̂t = t  − φt  .
H i=1 σ̂t σ̂t−1

3.3.3 Génération d’un processus stochastique PAR(1) discrétisé

Dans le cadre de l’optimisation stochastique approchée, on approxime souvent les vraies dis-
tributions (continues) des aléas par des distributions discrètes. Cette démarche est largement
utilisée en optimisation sur arbres de scénarios, en programmation dynamique stochastique
etc.
Les modèles PAR subissent aussi cette démarche classique et peuvent être discrétisé sous
forme d’un arbre de scénarios comme suit :
à partir de la valeur déterministe A0 , générer N réalisations de la variable aléatoire A1 via
l’équation (3.21). À partir de chaque réalisation de A1 générer N réalisations de la variable
aléatoire A2 . Et ainsi de suite jusqu’à atteindre la période T . La figure 3.14 illustre cette
démarche pour N = 2.
34

A0

(1) (2)
1 1
A1

(1) (2) (3) (4)


2 2 2 2
A2

(1) (2) (3) (4) (5) (6) (7) (8)


3 3 3 3 3 3 3 3
A3

Figure 3.14 Génération naïve du processus stochastique discrétisé

En programmation dynamique stochastique et dans le cas où le processus des apports est régi
par un modèle PAR(1), la fonction de valeur de Bellman de la période t dépend de l’apport
passé At−1 . Comme on va le voir dans le chapitre 5, quand on utilise la transformation
(équation (3.21)) des apports, cette fonction de Bellman n’est plus convexe par rapport à
At−1 . Dans ce cas-ci, on est obligé de définir une fonction de valeur de Bellman propre à
chaque valeur de l’apport passé At−1 . Or, on peut observer dans la figure 3.14 que le nombre
de valeurs discrétisées de At−1 croit exponentiellement avec t (2t−1 si N = 2) ce qui rend
inefficace cette démarche de discrétisation du processus stochastique des apports.
Une alternative plus efficace pour discrétiser le processus stochastique des apports est d’échan-
(i)
tillonner a priori la variable aléatoire d’apport At en N quantiles Aet , i = 1 .. N pour
toute période t = 1 .. T . On passe alors d’une variable aléatoire continue At à une variable
aléatoire discrète Af . Cette discrétisation a priori se fait directement à partir de l’historique
t

sans utiliser les variables aléatoires t . Ces dernières sont toutefois cruciales pour approximer
 
les matrices des probabilités de transition P t où Pijt = P A f =A e(j) |A
f = e(i) .
A
t t t−1 t−1

On obtient ainsi un processus stochastique PAR(1) des apports hydriques naturels sous forme
d’une chaine de Markov à temps discret dont l’espace des états est fini.
35

A0

(1) (2) (3) (4) (5)


Ã1 Ã1 Ã1 Ã1 Ã1
A1

A2

A3

Figure 3.15 Génération efficace du processus stochastique discrétisé

Estimation des matrices P t des probabilités de transition


(i) i−1
Pour chaque période t = 1 .. T , i = 1 .. N , Aet représente le quantile de l’historique
N −1
de At
(i,1) (i,2) (i,N )
Soient t ∈ {1, .. , T }, i ∈ {1, .. , N } et soient et , et , .. , et tels que
   
(j) (i)
(i,N )
log Aet − µt log Aet−1 − µt−1
et = − φt j = 1 .. N. (3.22)
σt σt−1

(1) (2) (N ) (i,1) (i,2) (i,N )


Puisque Aet < Aet < .. < Aet , et < et < .. < et
(i) (j)
Les probabilités de transition de Aet−1 à Aet sont définies par
   i
(i,1)




P t ∈ −∞, t si j = 1
   i
Pijt ≈ P t ∈
(i,j−1)
t ,
(i,j)
t si 1 < j < N


(i,N −1)
   i
P t ∈ t , +∞ si j = N


 Z (i,1) − 1 y2
1 t 2 σ2 (3.23)




 e t dy si j = 1


 σt 2π −∞
 Z (i,j) − 1 y2
1

 t 2 2
= √ (i,j−1)
e σt dy si 1 < j < N

 σt 2π t
 2
1 − 12 y2

 Z +∞
√ σ


 e t dy si j = N
σt 2π t(i,N −1)

36

3.4 Classes de demande

Durant une journée, la demande en électricité (puissance) peut varier. On distingue souvent
des heures de pointe, au matin par exemple, et des heures de consommation moyenne. Il est
alors judicieux d’inclure plusieurs classes de demande dans le problème de planification pour
que l’estimation des ressources utilisées soit plus fidèle à la fluctuation de la demande.
Chaque classe de demande cls est représentée par une proportion de durée δcls par rapport
à la durée totale ∆t du pas de temps t. Par exemple, pour un pas hebdomadaire (i.e. 168
heures) la classe de pointe a une proportion de 0.25, soit une durée de 42 heures, et la classe
normale 0.75, soit une durée de 126 heures. La figure 3.16 illustre la différence de demande
en puissance pour un cas de deux classes

10
Demande (GW)

4 classe
classe moyenne
pointe
2

0
30 42 60 90 120 150 168
Durée (h)

Figure 3.16 Classes de demande

Le modèle de planification contient des variables de décisions (débit turbiné, puissance géné-
rée) pour chaque classe de demande.
37

CHAPITRE 4 PROBLÈME DE PLANIFICATION DE LA PRODUCTION


D’HYDROÉLECTRICITÉ

Ce chapitre présente la notation et la formulation du problème de planification de la produc-


tion d’hydroélectricité.

4.1 Notation

Symboles et ensembles

Symbole Description
hm3 hectomètres cube (un million de mètres cube)
MW mega-watts
MWh mega-watts heure
$ dollar canadien
R ensemble des réservoirs
R+ ensemble des réservoirs à capacité positive
R− ensemble des réservoirs sans capacité
C ensemble des centrales hydroélectriques
C+ ensemble des centrales à hauteur de chute variable (i.e., centrales à réservoir)
C− ensemble des centrales à hauteur de chute fixe (i.e., centrales au fil de l’eau)
OE ensemble des ouvrages d’évacuation
C d (r) ensemble des centrales du réservoir r (d pour downstream)
OE d (r) ensemble des ouvrages d’évacuation du réservoir r
C u (r) ensemble des centrales dont l’eau turbinée va au réservoir r (u pour upstream)
OE u (r) ensemble des ouvrages d’évacuation dont l’eau déversée va au réservoir r
r réservoir
c centrale
oe ouvrage d’évacuation
r(c) réservoir de la centrale c
lr fonction donnant le niveau d’eau du réservoir r en fonction de son volume
pc fonction donnant la puissance générée de la centrale c en fonction de son débit
(cas d’une centrale au fil de l’eau)
Bt fonction de bénéfice immédiat de la semaine t
38

Constantes

Symbole Unité Description


3
vr hm volume maximum du réservoir r
vr,0 hm3 volume initial du réservoir r
V0 hm3 vecteur des volumes initiaux des réservoirs, V0 = (vr,0 )r∈R+
δr,t proportion du réservoir r par rapport à l’apport hydrique total à
la rivière durant la semaine t
lcd m niveau aval de référence de la centrale c
h0c m hauteur de chute de référence de la centrale c
qc0 m3 /s débit maximum de la centrale c à sa hauteur de chute de référence
3
qoe m /s débit maximum de l’ouvrage d’évacuation oe
γc , ωc paramètres de la fonction de production de la centrale c
Kc nombre d’hyperplans affines approximant la fonction de production
de la centrale c
a(j)
c,q
3
MW/m /s pente relative au débit du je hyperplan affine
(j)
ac,h MW/m pente relative à la hauteur de chute du je hyperplan affine
b(j)
c MW ordonnée à l’origine du je hyperplan affine
∆ h durée d’une semaine (∆ = 168h)
τp proportion de la classe de pointe par rapport à la durée d’une se-
maine
τ op proportion de la classe moyenne par rapport à la durée d’une se-
maine t (τ op = 1 − τ p )
ρ constante de conversion d’un débit constant (m3 /s) durant une
3600 × ∆
semaine à un volume (hm3 ), ρ = = 0.6048
106
dpt MW demande minimum en puissance instantanée durant la semaine t
et la classe de demande de pointe
dop
t MW demande minimum en puissance instantanée durant la semaine t
et la classe de demande moyenne
νtp $/MWh prix de l’électricité durant la semaine t et la classe de pointe
νtop $/MWh prix de l’électricité durant la semaine t et la classe moyenne
cpt $/MWh coût encouru pour une demande non satisfaite durant la semaine t
et la classe de pointe
cop
t $/MWh coût encouru pour une demande non satisfaite durant la semaine t
et la classe moyenne
39

T nombre de semaines dans l’horizon de planification (52 semaines


pour une année, 104 pour 2 années ...)

Variables

Symbole Unité Description


3
vr,t hm volume du réservoir r à la fin de la semaine t
u
lr,t m niveau d’eau du réservoir r durant la semaine t
qoe,t m3 /s débit déversé de l’ouvrage d’évacuation oe durant la semaine t
hc,t m hauteur de chute de la centrale c durant la semaine t
p
qc,t m3 /s débit turbiné de la centrale c durant la semaine t et la classe de
demande de pointe (p pour peak)
op
qc,t m3 /s débit turbiné de la centrale c durant la semaine t et la classe de
demande moyenne (op pour off-peak)
ppc,t MW puissance instantanée générée par la centrale c durant la semaine t
et la classe de demande de pointe
pop
c,t MW puissance instantanée générée par la centrale c durant la semaine t
et la classe de demande moyenne
ppt MW puissance instantanée totale (somme sur toutes les centrales) géné-
rée durant la semaine t et la classe de demande de pointe
pop
t MW puissance instantanée totale (somme sur toutes les centrales) géné-
rée durant la semaine t et la classe de demande moyenne
shpt MW demande instantanée non satisfaite durant la semaine t et la classe
de demande de pointe (sh pour shedding)
shop
t MW demande instantanée non satisfaite durant la semaine t et la classe
de demande moyenne
Vt hm3 vecteur des volumes des réservoirs à fin de la semaine t, Vt =
(vr,t )r∈R+
Xt m3 /s vecteur des décisions de la semaine t, Xt =
 
p op
(qc,t )c∈C , (qc,t )c∈C , (qoe,t )oe∈OE

Processus stochastique d’apports

Symbole Unité Description


A1 m3 /s apport hydrique à la rivière durant la semaine 1 (connu à l’avance)
At m3 /s variable aléatoire (continue) de l’apport à la rivière durant la se-
maine t
40

4.2 Formulation du problème

Si seuls les apports hydriques sont stochastiques et s’ils suivent un modèle PAR(1), le pro-
blème de planification moyen-terme de la production d’hydroélectricité peut se formuler
comme suit

Θ1 = max B1 (V0 , A1 , X1 ) + EA2 |A1 


 max B2 (V1 , A2 , X2 )+
X1 ,V1 X2 ,V2
V1 =f (V0 ,A1 ,X1 ) V2 =f (V1 ,A2 ,X2 )

... + EAt |At−1 


 max Bt (Vt−1 , At , Xt ) + ... (4.1)
Xt ,Vt
Vt =f (Vt−1 ,At ,Xt )
 

... + EAT |AT −1  max BT (VT −1 , AT , XT )


 
XT ,VT
VT =f (VT −1 ,AT ,XT )


– B1 (V0 , A1 , X1 ) est la fonction bénéfice de la semaine 1, partant de l’état initial V0 , et ayant
l’apport hydrique A1 et ayant pris les décisions X1 ;
– Pour t = 2 .. T, Bt (Vt−1 , At , Xt ) est la fonction bénéfice de la semaine t, partant de l’état
initial Vt−1 (qui est en fait l’état final de la semaine t − 1), et ayant un apport hydrique
At et ayant pris les décisions Xt ;
– f ( . , . , . ) est une fonction de transition qui, partant d’un état initial au début d’une
semaine et un apport hydrique et des décisions durant cette semaine, renvoie l’état final
du système.
Hypothèse :
Dans la formulation ci-haut, on a fait l’hypothèse d’information parfaite (“Wait and see”), i.e.,
l’apport durant une période est connu d’avance et influence directement les décisions prises
durant cette période. En toute rigueur, cette hypothèse n’est pas indispensable. Cependant,
elle permet de rendre le problème plus réaliste vu que :
– les périodes de l’horizon de planification dans un contexte moyen-terme sont souvent des
semaines (parfois des mois). Il n’est donc pas réaliste de décider sans tenir compte de
l’apport hydrique durant une période donnée ;
– des modèles météorologiques et statistiques permettent au décideur d’avoir des prévisions
assez fiables à court-terme.
41

4.3 Description du problème

4.3.1 Objectifs

Pour la semaine 1, partant de l’état initial du système V0 et sachant qu’il y aura l’apport
hydrique A1 , l’objectif est de prendre une décision X1 de sorte à maximiser la somme du
bénéfice immédiat

B1 (V0 , A1 , X1 ) = ν1p τ p ∆pp1 + ν1op τ op ∆pop p p p op op op


1 − c1 τ ∆sh1 − c1 τ ∆sh1

et du bénéfice futur
 

EA2 |A1 
 max B2 (V1 , A2 , X2 ) + ...
.
X2 ,V2
V2 =f (V1 ,A2 ,X2 )

Pour une semaine t = 2 .. T − 1, partant d’un état initial du système Vt−1 et sachant qu’il y
aura un apport hydrique At , l’objectif est de prendre une décision Xt de sorte à maximiser
la somme du bénéfice immédiat

Bt (Vt−1 , At , Xt ) = νtp τ p ∆ppt + νtop τ op ∆pop p p p op op op


t − ct τ ∆sht − ct τ ∆sht

et du bénéfice futur
 

max Bt+1 (Vt , At+1 , Xt+1 ) + ... .


 
EAt+1 |At 
Xt+1 ,Vt+1
Vt+1 =f (Vt ,At+1 ,Xt+1 )

Pour t = T , partant d’un état initial du système VT −1 et sachant qu’il y aura un apport
hydrique AT , l’objectif est de prendre une décision XT de sorte à maximiser le bénéfice
immédiat

Bt (VT −1 , AT , XT ) = νTp τ p ∆ppT + νTop τ op ∆pop p p p op op op


T − cT τ ∆shT − cT τ ∆shT .

Le bénéfice immédiat correspond au profit tiré de la production de la semaine considérée. Par


exemple, le terme νtp τ p ∆ppt est le prix de l’électricité fournie durant la demande de pointe.
En effet, ppt étant la puissance instantanée (MW) fournie, τ p ∆ étant le nombre d’heures de la
classe de demande de pointe, on obtient la quantité fournie τ p ∆ppt de MWh que l’on multiplie
par le prix νtp du MWh. Les autres termes de l’objectif peuvent être interprétés de manière
similaire.
42

4.3.2 Contraintes

Les contraintes Vt = f (Vt−1 , At , Xt ) relient le volume finale Vt au volume initial Vt−1 , à


l’apport aléatoire At et aux décisions Xt .

Contraintes liées aux réservoirs

Les contraintes de la forme


X  p op
 X
vr,t = vr,t−1 − τ p ρqc,t + τ op ρqc,t − ρqoe,t
c∈C d (r) oe∈OE d (r)
X  p op
 X
+ τ p ρqc,t + τ op ρqc,t + ρqoe,t + δr,t ρAt
u
c∈C u (r) oe∈OE (r)
X  p op
 X X  p

op
X
τ p ρqc,t + τ op ρqc,t + ρqoe,t = τ p ρqc,t + τ op ρqc,t + ρqoe,t + δr,t ρAt
c∈C d (r) oe∈OE d (r) c∈C u (r) oe∈OE u (r)

correspondent aux équations de conservation de masse des réservoirs à capacité positive et


des réservoirs sans capacité, respectivement.
Pour un réservoir à capacité positive r, la contrainte

vr,t−1 + vr,t
 
u
lr,t = lr
2

donne le niveau du réservoir r en fonction de son volume moyen (sur une semaine). La fonction
lr (.) est concave linéaire par morceaux, La manière de la représenter dans un modèle linéaire
est détaillée dans l’annexe A.
La contrainte
0 ≤ vr,t ≤ vr

permet de respecter la capacité de stockage maximale du réservoir à capacité positive r.


Pour un ouvrage d’évacuation oe lié à un réservoir r, la contrainte

0 ≤ qoe,t ≤ qoe

permet de respecter sa capacité d’évacuation.


43

Contraintes liées aux centrales

Pour une centrale c à hauteur de chute variable, la contrainte

u
hc,t = lr(c),t − lcd

u
donne la hauteur de chute de la centrale c, qui est la différence entre le niveau en amont lr(c),t
(niveau du réservoir r(c)) et le niveau en aval lcd .
Les contraintes 
(j)




ppc,t ≤ a(j) p (j)
c,q qc,t + ac,h hc,t + bc , j = 1 .. Kc


(j)
pop (j) op

(j)
c,t ≤ ac,q qc,t + ac,h hc,t + bc , j = 1 .. Kc

donnent la puissance générée par la centrale à hauteur de chute variable c durant la classe
de demande de pointe et la classe de demande moyenne, respectivement. Il s’agit d’une
approximation concave linéaire par morceaux de la fonction de production de la centrale c
(voir section 3.2.4).
Les contraintes
p op hc,t 0
0 ≤ qc,t , qc,t ≤ q
h0c c
donnent les bornes sur le débit turbiné de la centrale : la borne supérieure de débit dépend
de la hauteur de chute.
Pour une centrale c à hauteur de chute fixe, les contraintes
  




ppc,t = pc qc,t
p

  
pop op

c,t = pc qc,t

donnent la puissance générée de la centrale durant la classe de demande de pointe et la classe


de demande moyenne, respectivement. La fonction pc (.) est concave linéaire par morceaux, La
manière de la représenter dans un modèle linéaire est détaillée dans l’annexe A. La contrainte

p op
0 ≤ qc,t , qc,t ≤ qc0

donne les bornes sur le débit turbiné de la centrale c.


44

Contraintes d’équilibre électrique

Les contraintes
ppt =
 X p


 pc,t
c∈C




pop
 X op
t = pc,t




c∈C

expriment la puissance instantanée totale générée pour la classe de demande de pointe et la


classe de demande moyenne, respectivement.
Finalement, les contraintes 




ppt + shpt ≥ dpt

pop op op

t + sht ≥ dt

correspondent à l’équilibre offre-demande pour la classe de demande de pointe et la classe de


demande moyenne, respectivement. Il est à noter que l’on se permet de produire plus que la
demande si l’on peut.
Ci-après une formulation plus détaillée du modèle avec les variables, contraintes et objectifs.
45

 

max B1 (V0 , A1 , X1 ) + EA2 |A1  max B2 (V1 , A2 , X2 ) + ... équivaut à


 
X1 ,V1 X2 ,V2
V1 =f (V0 ,A1 ,X1 ) V2 =f (V1 ,A2 ,X2 )

max ν1p τ p ∆pp1 + ν1op τ op ∆pop p p p op op op


1 − c1 τ ∆sh1 − c1 τ ∆sh1 +
X1 ,V1
 

max B2 (V1 , A2 , X2 ) + ...


 
EA2 |A1 
X2 ,V2
V2 =f (V1 ,A2 ,X2 )
X  p op

τ p ρqc,1 + τ op ρqc,1
X
s. à vr,1 = vr,0 − − ρqoe,1
c∈C d (r) oe∈OE d (r)
X  p op

τ p ρqc,1 + τ op ρqc,1 ∀r ∈ R+
X
+ + ρqoe,1 + δr,1 ρA1
c∈C u (r) oe∈OE u (r)
X  p op

τ p ρqc,1 + τ op ρqc,1
X
+ ρqoe,1 =
c∈C d (r) oe∈OE d (r)
X  p op

τ p ρqc,1 + τ op ρqc,1 ∀r ∈ R−
X
+ ρqoe,1 + δr,1 ρA1
c∈C u (r) oe∈OE u (r)

vr,0 + vr,1
 
u
lr,1 = lr ∀r ∈ R+
2
u
hc,1 = lr(c),1 − lcd ∀c ∈ C +
(j)
ppc,1 ≤ a(j) p (j)
c,q qc,1 + ac,h hc,1 + bc ∀c ∈ C + , j = 1 .. Kc
(j)
pop (j) op (j)
c,1 ≤ ac,q qc,1 + ac,h hc,1 + bc ∀c ∈ C + , j = 1 .. Kc
 
ppc,1 = pc qc,1
p
∀c ∈ C −
 
pop op
c,1 = pc qc,1 ∀c ∈ C −

pp1 =
X p
pc,1
c∈C

pop
X op
1 = pc,1
c∈C

pp1 + shp1 ≥ dp1


pop op op
1 + sh1 ≥ d1

0 ≤ vr,1 ≤ vr ∀r ∈ R+
p op hc,1 0
0 ≤ qc,1 , qc,1 ≤ q ∀c ∈ C +
h0c c
p op
0 ≤ qc,1 , qc,1 ≤ qc0 ∀c ∈ C −
0 ≤ qoe,1 ≤ qoe ∀oe ∈ OE
46

Pour t = 2 .. T − 1  

max Bt (Vt−1 , At , Xt ) + EAt+1 |At 


 max Bt+1 (Vt , At+1 , Xt+1 ) + ...

Xt ,Vt Xt+1 ,Vt+1
Vt =f (Vt−1 ,At ,Xt ) Vt+1 =f (Vt ,At+1 ,Xt+1 )

équivaut à

max νtp τ p ∆ppt + νtop τ op ∆pop p p p op op op


t − ct τ ∆sht − ct τ ∆sht +
Xt ,Vt
 

EAt+1 |At 
 max Bt+1 (Vt , At+1 , Xt+1 ) + ...

Xt+1 ,Vt+1
Vt+1 =f (Vt ,At+1 ,Xt+1 )
X  p op

τ p ρqc,t + τ op ρqc,t
X
s. à vr,t = vr,t−1 − − ρqoe,t
c∈C d (r) oe∈OE d (r)
X  p op

τ p ρqc,t + τ op ρqc,t ∀r ∈ R+
X
+ + ρqoe,t + δr,t ρAt
c∈C u (r) oe∈OE u (r)
X  p op

τ p ρqc,t + τ op ρqc,t
X
+ ρqoe,t =
c∈C d (r) oe∈OE d (r)
X  p op

τ p ρqc,t + τ op ρqc,t ∀r ∈ R−
X
+ ρqoe,t + δr,t ρAt
c∈C u (r) oe∈OE u (r)
vr,t−1 + vr,t
 
u
lr,t = lr ∀r ∈ R+
2
u
hc,t = lr(c),t − lcd ∀c ∈ C +
(j)
ppc,t ≤ a(j) p (j)
c,q qc,t + ac,h hc,t + bc ∀c ∈ C + , j = 1 .. Kc
(j)
pop (j) op (j)
c,t ≤ ac,q qc,t + ac,h hc,t + bc ∀c ∈ C + , j = 1 .. Kc
 
ppc,t = pc qc,t
p
∀c ∈ C −
 
pop op
c,t = pc qc,t ∀c ∈ C −

ppt =
X p
pc,t
c∈C

pop
X op
t = pc,t
c∈C

ppt + shpt ≥ dpt


pop op op
t + sht ≥ dt

0 ≤ vr,t ≤ vr ∀r ∈ R+
p op hc,t 0
0 ≤ qc,t , qc,t ≤ q ∀c ∈ C +
h0c c
p op
0 ≤ qc,t , qc,t ≤ qc0 ∀c ∈ C −
0 ≤ qoe,t ≤ qoe ∀oe ∈ OE
47

max BT (VT −1 , AT , XT ) équivaut à


XT ,VT
VT =f (VT −1 ,AT ,XT )

max νTp τ p ∆ppT + νTop τ op ∆pop p p p op op op


T − cT τ ∆shT − cT τ ∆shT
XT ,VT
X  p op

τ p ρqc,T + τ op ρqc,T
X
s. à vr,T = vr,T −1 − − ρqoe,T
c∈C d (r) oe∈OE d (r)
X  p op

τ p ρqc,T + τ op ρqc,T ∀r ∈ R+
X
+ + ρqoe,T + δr,T ρAT
c∈C u (r) oe∈OE u (r)
X  p op

τ p ρqc,T + τ op ρqc,T
X
+ ρqoe,T =
c∈C d (r) oe∈OE d (r)
X  p op

τ p ρqc,T + τ op ρqc,T ∀r ∈ R−
X
+ ρqoe,T + δr,T ρAT
c∈C u (r) oe∈OE u (r)

vr,T −1 + vr,T
 
u
lr,T = lr ∀r ∈ R+
2
u
hc,T = lr(c),T − lcd ∀c ∈ C +
(j)
ppc,T ≤ a(j) p (j)
c,q qc,T + ac,h hc,T + bc ∀c ∈ C + , j = 1 .. Kc
(j)
pop (j) op (j)
c,T ≤ ac,q qc,T + ac,h hc,T + bc ∀c ∈ C + , j = 1 .. Kc
 
p
ppc,T = pc qc,T ∀c ∈ C −
 
pop op
c,T = pc qc,T ∀c ∈ C −

ppT =
X p
pc,T
c∈C

pop
X op
T = pc,T
c∈C

ppT + shpT ≥ dpT

pop op op
T + shT ≥ dT

0 ≤ vr,T ≤ vr ∀r ∈ R+

p op hc,T 0
0 ≤ qc,T , qc,T ≤ q ∀c ∈ C +
h0c c
p op
0 ≤ qc,T , qc,T ≤ qc0 ∀c ∈ C −

0 ≤ qoe,T ≤ qoe ∀oe ∈ OE


48

CHAPITRE 5 MÉTHODES DE RÉSOLUTION PAR PROGRAMMATION


DYNAMIQUE STOCHASTIQUE

Ce chapitre présente des résultats théoriques et la méthodologie utilisée pour résoudre le


problème de planification moyen-terme de la production d’hydroélectricité. En particulier,
on reformule le problème de planification (4.1) en un schéma de programmation dynamique.
Ensuite, on expose une méthode exacte de programmation dynamique (SDP) pour le résoudre
dans sa nouvelle forme et on montre que cette méthode a une complexité exponentielle. Deux
méthodes qui dérivent de SDP : SDDP et ASDP, et qui essaient de contourner sa complexité
sont présentées par la suite.
Il est à noter que la programmation dynamique présentée et utilisée dans ce mémoire est
la programmation dynamique duale. Par conséquent, on majore les fonctions de valeur de
Bellman par leurs hyperplans tangents ou coupants. Ainsi, serait-il plus cohérent d’appe-
ler les méthodes présentées dans ce chapitre respectivement par Programmation dynamique
duale stochastique (SDDP), Programmation dynamique duale stochastique itérative (ISDDP)
et Programmation dynamique duale stochastique approchée (ASDDP). Cependant, le fait que
la deuxième méthode est largement connue sous le nom SDDP nous a incité à adopter les
noms respectifs de SDP, SDDP et ASDP.

5.1 Notation

En plus de la notation présentée dans le chapitre précédent, on introduit la notation supplé-


mentaire suivante
Processus stochastique d’apports

Symbole Unité Description


A
f
t m3 /s variable aléatoire (discrète) de l’apport à la rivière durant la semaine
t
N nombre de valeurs discrètes des variables aléatoires A f
(i)
Aet m3 /s ie valeur discrète de la variable aléatoire Af
t
(i) (j)
Pijt probabilité de transition de At−1 , durant la semaine t − 1, à Aet ,
e

durant la semaine t
i1 indice de A1 dans la discrétisation de la variable aléatoire d’apport
A
f
1
49

Symboles

Symbole Description

Ft fonction de bénéfice futur de la semaine t−1 cas du vrai processus stochastique

d’apport (At )t

Fet fonction de bénéfice futur de la semaine t − 1 cas du processus stochastique
  
d’apport discrétisé A
f
t
t
(i) (i)
Fet fonction de bénéfice futur de la semaine t − 1 restreinte à l’apport Aet−1
e (i)
F approximation de la fonction Fet
(i)
t

5.2 Reformulation du problème : schéma de programmation dynamique

Définissons les formules de récurrence suivantes

Θ1 = max B1 (V0 , A1 , X1 ) + F2 (A1 , V1 )


X1 ,V1
V1 =f (V0 ,A1 ,X1 )
 

Ft (At−1 , Vt−1 ) = EAt |At−1 


 max Bt (Vt−1 , At , Xt ) + Ft+1 (At , Vt )
 t = 2 .. T
Xt ,Vt
Vt =f (Vt−1 ,At ,Xt )

FT +1 (AT , VT ) ≡ 0.
(5.1)
Les équations (5.1) constituent le schéma de programmation dynamique équivalent au pro-
blème (4.1).
la fonction Ft+1 est appelée fonction de bénéfice futur de la semaine t. Elle valorise l’état
du système à la fin de la semaine t. Ici, puisque les apports hydriques sont temporellement
corrélés (modèle PAR(1)), l’état du système est constitué, en plus des volumes des réservoirs,
de l’apport passé.
L’objectif de la planification moyen-terme de la production d’hydroélectricité est de déter-
miner ces fonctions de bénéfice futur qui permettront de prendre des décisions optimales à
chaque semaine qui tiennent compte de l’aléa futur. Or, il est difficile de trouver ces fonctions
lorsque les distributions des variables aléatoires (At )t sont continues (nombre infini de fonc-
tions à déterminer). C’est pour cette raison que l’on discrétise le processus d’apport (At )t
comme développé dans la section 3.3.3 et l’on passe du processus d’apport continue (At )t au
50

 
processus d’apport discret A
f . Les formules de récurrence précédentes deviennent
t
t

Θ
e =
1 max B1 (V0 , A1 , X1 ) + Fe2 (A1 , V1 )
X1 ,V1
V1 =f (V0 ,A1 ,X1 )
 
      
Fet Aet−1 , Vt−1 = EA 
e t |Aet−1  max f ,X + F
Bt Vt−1 , A t t
e
t+1 A
f ,V 
t t  t = 2 .. T
Xt ,Vt
e t ,Xt )
Vt =f (Vt−1 ,A

FeT +1 ≡ 0.
(5.2)

5.3 Programmation dynamique stochastique et politique de gestion

Si les décisions à chaque semaine t sont prises en utilisant les fonctions de bénéfice futur
(Ft )t , on dit que les décisions suivent une politique de gestion. En particuliers, le vecteur des
volumes des réservoirs à la fin de la semaine t, Vt , est une fonction des apports qui ont eu
lieu jusqu’à t, i.e. Vt = Vt (A1 , A2 , .. , At ). La figure suivante illustre cet aspect

2
Vt+1
A2t+1
A1 At

V0 V1 Vt
A1t+1
1
Vt+1

Figure 5.1 Deux scénarios partageant les mêmes apports jusqu’à la semaine t

Les deux scénarios de la figure partageront les mêmes décisions, i.e. les mêmes volumes de
réservoirs V1 , .. Vt .
Cette propriété de politique de gestion nous permet d’écrire
 
Θ1 = EA2 , .. AT |A1 B1 (V0 , A1 , X1 ) + B2 (V1 , A2 , X2 ) + ... BT (VT −1 , AT , XT ) (5.3)
51

et
    
Θ
e
1 = EA
e 2, e T |A1
.. A
B1 (V0 , A1 , X1 ) + B2 V1 ,A
f
2 , X2 + ... BT VT −1 ,A
f
T , XT . (5.4)

5.4 Concavité des fonctions de bénéfice futur

Dans cette section, on démontre que la fonction de bénéfice futur Fet est concave et linéaire
par morceaux par rapport à Vt−1 . On démontre aussi que cette propriété n’est pas vérifiée
pour At−1 .

5.4.1 Concavité par rapport à l’état volume

Dans Birge et Louveaux (2011), il est prouvé, dans le cas de variables aléatoires continues
indépendantes, que les fonctions de bénéfice futur sont concaves par rapport à la variable
d’état et que, lorsque le support des variables aléatoires est fini, ces fonctions sont de plus
linéaires par morceaux. La preuve est généralisable au cas que l’on étudie. En effet, pour
t = T,
 
     
FeT AeT −1 , VT −1 = EA 
e T |AeT −1  max Bt (VT −1 , A
f , X )
T T  FeT +1 ≡ 0
XT ,VT
VT =f (VT −1 ,A
e T ,XT )

   
Or AeT −1 , VT −1 7→ max Bt VT −1 , A
f ,X
T T est concave linéaire par morceaux
XT ,VT
VT =f (VT −1 ,A
e T ,XT )
par rapport à VT −1 car VT −1 fait partie du second membre des contraintes
     
VT = f VT −1 , A T et ainsi AT −1 , VT −1 7→ FT AT −1 , VT −1 est aussi concave linéaire
f ,X e e e
T

par morceaux par rapport à VT −1 car l’espérance mathématique est sur un ensemble fini de
valeurs possibles de la variable aléatoire A
f .
T

Pour t = T − 1,
 
      
FeT −1 AeT −2 , VT −2 = E  max e T −1 , XT −1 + FeT A
BT −1 VT −2 , A e T −1 , VT −1  .
Ae T −1 |AT −2 
e XT −1 ,VT −1 

VT −1 =f VT −2 ,AT −1 ,XT −1
e

   
Puisque A T −1 , VT −1 7→ FT AT −1 , VT −1 est concave linéaire par morceaux par rapport à
f e f
52

VT −1 , le modèle
   
max BT −1 VT −2 , A T −1 , XT −1 + FT AT −1 , VT −1
f e f
XT −1 ,VT −1
VT −1 =f (VT −2 ,A
e T −1 ,XT −1 )

est linéaire, alors


     
AeT −2 , VT −2 7→ max BT −1 VT −2 , A
f
T −1 , XT −1 + FT AT −1 , VT −1
e f
XT −1 ,VT −1
VT −1 =f (VT −2 ,A
e T −1 ,XT −1 )

est concave linéaire par morceaux par rapport à VT −2 car VT −2 fait partie du second membre
     
des contraintes VT −1 = f VT −2 , A
f
T −1 , X T −1 et ainsi A
e
T −2 , VT −2 →
7 F
e
T −1 A
e
T −2 , VT −2

est aussi concave linéaire par morceaux par rapport à VT −2 car l’espérance mathématique est
sur un ensemble fini de valeurs possibles de la variable aléatoire A f
T −1 .
   
Il suffit de répéter le même raisonnement pour montrer que Aet−1 , Vt−1 7→ Fet Aet−1 , Vt−1
est concave linéaire par morceaux par rapport à Vt−1 pour tout t = 2 .. T . 

5.4.2 Concavité par rapport à l’état apport passé

Il est fréquent dans la littérature que l’on étend le caractère concave linéaire par morceaux de
la fonction de bénéfice futur Fet à l’apport passé Aet−1 ce qui nous permet de rassembler l’état
volume Vt−1 et l’état apport passé Aet−1 et dire, tout simplement, que Fet est concave linéaire
 
par morceaux sur son domaine de définition (i.e. par rapport à l’état St−1 = Aet−1 , Vt−1 ).
Ceci est possible lorsque les apports suivent un modèle PAR(1) de la forme

At − µ t At−1 − µt−1
= φt + t .
σt σt−1

En effet, l’équation précédente nous permet d’écrire

σt σt
A
f =
t φt Aet−1 −φt µt−1 + µt + σt t .
σt−1 σt−1
| {z } | {z }
coefficient terme
indépendant de indépendant de
la valeur de la valeur de
A
et−1 A
et−1

 
Ainsi, indirectement, Aet−1 fait partie du second membre des contraintes Vt = f Vt−1 , A
f ,X
t t
   
f ,X + F
Bt Vt−1 , A
dans max t+1 At , Vt .
e f
t t
Xt ,Vt
Vt =f (Vt−1 ,A
e t ,Xt )

Une preuve similaire à celle développée dans la sous-section précédente nous permet de mon-
53

trer que pour tout t = 2 .. T, Fet est concave linéaire par morceaux par rapport à Aet−1 .
Malheureusement, ceci n’est plus le cas quand on considère un modèle PAR(1) de la forme

ln (At ) − µt ln (At−1 ) − µt−1


= φt + t .
σt σt−1

Ceci nous oblige à définir une fonction de bénéfice futur pour chaque cas d’apport passé.
 
(i) (i)
Par la suite, on note Fet (Vt−1 ) = Fet Aet−1 , Vt−1 , t = 3 .. T et Fe2 (V1 ) = Fe2 (A1 , V1 ).

5.5 Représentation des fonctions de bénéfice futur

(i)
On a vu que la fonction Vt−1 7→ Fet (Vt−1 ) est concave linéaire par morceaux, et comme Vt−1
est borné elle peut être exprimée comme maximum d’un nombre fini d’hyperplans supports,
 
(i) (i) (i) (i)
i.e. il existe Kt < ∞ et αt,m , βt,m m = 1 .. Kt tels que pour tout Vt−1
 
(i) (i) T (i) (i)
Fe (V
t t−1 ) = max αt,m Vt−1 + βt,m = max Θt
(i) (i)
m=1 .. Kt Θt
(i) (i) T (i) (i)
s.à Θt ≤ αt,m Vt−1 + βt,m m = 1 .. Kt .

(i)
Ainsi pour représenter de façon complète la fonction Fet il suffit de trouver les pentes
 
(i)
αt,m (i) et les ordonnées à l’origine (βt,m )m=1 .. K (i) .
m=1 .. Kt t

(i)
Comment trouver alors l’expression ainsi décrite de Fet ?
(j)
Supposons que l’on dispose de Fet+1 pour un certain t ∈ {2 .. T } et pour tout j = 1 .. N , on
a, en tout point Vt−1 ,
 
   
(i) 
Fet (Vt−1 ) = EA (i)
e t |Ae 
 max f ,X + F
Bt Vt−1 , A t t
e
t+1 At , Vt 
f 
t−1 Xt ,Vt
Vt =f (Vt−1 ,A
e t ,Xt )
 
N    
Pijt f(j) , X (j)
X  
=  max Bt Vt−1 ,A t t + Fe t+1 (Vt ) .

 Xt ,Vt

j=1   
e (j)
Vt =f Vt−1 ,A t ,Xt
54

Donc
 
N    
(i) f(j) , X (j)
Pijt ∂
X  
∂ Fe (V
t t−1 ) =  max Bt ., At t + Fe t+1 (Vt ) (Vt−1 )

Xt ,Vt

j=1    
e t(j) ,Xt
Vt =f .,A

(l’opérateur de sous-gradient ∂ étant pris par rapport à la variable Vt−1 ).


Or, pour tout j = 1 .. N
   
max e (j) , Xt + Fe(j) (Vt ) =
Bt Vt−1 , A max e (j) , Xt + Θ(j)
Bt Vt−1 , A
t t+1 t t+1
Xt ,Vt  Xt ,Vt
e (j)
Vt =f Vt−1 ,A t ,Xt
 
s.à e (j) , Xt
Vt = f Vt−1 , A
(j)
πt
t

(j) (j) T (j) (j)


Θt+1 ≤ αt+1,m Vt + βt+1,m m = 1 .. Kt+1

où π (j) sont des valeurs duales optimales des contraintes de conservation de masse des réser-
voirs à capacité positive (les contraintes dans lesquelles Vt−1 apparait dans le second membre).
Donc
N
(i) (j)
Pijt πt .
X
∂ Fet (Vt−1 ) =
j=1

(i)
Ainsi on obtient l’hyperplan support H de Fet au point Vt−1

(i) (i) T (i)


H : Θt ≤ ∂ Fet (Vt−1 ) (Vt−1 − Vt−1 ) + Fet (Vt−1 )

Soit
(i) (i) T (i) (i) T
H : Θt ≤ ∂ Fet (Vt−1 ) Vt−1 + Fet (Vt−1 ) − ∂ Fet (Vt−1 ) Vt−1
| {z } | {z }
(i) T βt
(i)
αt

Cette procédure de construction d’hyperplans supports est schématisée dans la figure 5.2.
55

(i) (i) T (i) (i) T


H : Θt ≤ ∂ Fet (Vt−1 ) Vt−1 + Fet (Vt−1 ) − ∂ Fet (Vt−1 ) Vt−1
| {z } | {z }
(i) T (i)
βt
αt

(i)
Fet (Vt−1 )

(i)
Fet (Vt−1 )

Vt−1 V Vt−1

Figure 5.2 Illustration d’une fonction de bénéfice futur et ses hyperplans supports

En pratique, ce n’est pas une tâche facile de déterminer tous les hyperplans supports des
(i) e (i) concave linéaires
fonctions Fet . On se contente plutôt de les approximer par des fonctions F t
par morceaux dont les hyperplans supports sont des hyperplans coupants des fonctions Fe2
e (i) et F
respectives. En particulier, Fe2 ≤ F e (i) ≤ F
e (i) pour tout t = 3 .. T et tout i = 1 .. N .
t t t
(i)
Les fonctions Ft sont définies ainsi pour tout t = 3 .. T et tout i = 1 .. N
e

 
   
e (i) (V ) = E

F t t−1 Ae t |Ae(i) 
 max Bt Vt−1 , A
f ,X + F
t t
e
t+1 At , Vt 
f 
t−1 Xt ,Vt
Vt =f (Vt−1 ,A
e t ,Xt )
 
N    
Pijt f(j) , X e (j)
X  
=  max Bt Vt−1 ,A t t +F t+1 (Vt )

 Xt ,Vt

j=1   
e t(j) ,Xt
Vt =f Vt−1 ,A

e (j) ≡ 0 j = 1 .. N .
avec F T +1
56

e de F
On définit, de même, l’approximation F e
2 2

 
    
e (V ) = E
F2 1 A

e 2 |A1  max Bt V1 , A
f ,X + F
2 2
e A
3
f ,V 
2 2 
X2 ,V2
V2 =f (V1 ,A
e 2 ,X2 )
 
N    
Pij2 f(j) , X (j)
X  
=  max Bt V1 ,A 2 2 + F3 (V2 ) .
e 
X2 ,V2

j=1   
e 2(j) ,X2
V2 =f V1 ,A

La valeur de l’objectif dans (5.2) est alors approximée par

e ≈
Θ max B1 (V0 , A1 , X1 ) + F
e (V )
1 2 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )

e (j) des fonctions F


De façon similaire, sachant les approximations F e (j) , j = 1 .. N , on peut
t+1 t+1
(i) (i)
ajouter un hyperplan coupant de Ft à la définition de Ft .
e e

(i) e (i)
La figure 5.3 illustre les deux fonctions : Fet et son approximation F t

(i)
F
e
t
(i)
Ft
e

V Vt−1

Figure 5.3 Approximation d’une fonction de bénéfice futur par des hyperplans coupants
57

5.6 Méthode de programmation dynamique stochastique exacte

(i)
Le problème (5.2) peut-être résolu à l’optimalité. Des approximations Fe
t (respectivement
(i)
F2 ) aux fonctions Ft (respectivement à la fonction F2 ) sont construites récursivement de
e e e

t = T à t = 2 par un algorithme de programmation dynamique.


(j) (j)
Plus précisément, étant données des approximations F t+1 aux fonctions Ft+1 j = 1 .. N et
e e

une discrétisation D de l’espace volume V = Πr∈R+ [0, vr ], on construit un hyperplan coupant


(i) e (i) .
de Fet en tout point de D et on l’ajoute à la définition de F t
(i)
Plus la discrétisation D est exhaustive, plus les approximations F
e
t s’approchent des vraies
(i)
fonctions Fet . Rigoureusement, étant donné que l’espace volume V est borné, le nombre
(i)
d’hyperplans supports de chaque fonction Fet est fini, on peut alors affirmer qu’à partir
d’une valeur assez grande de |D|, on aura

2 = F2
 F
e e
 F e (i)
e (i) = F ∀t ∈ {3, .. , T } ∀i ∈ {1, .. , N } .
t t

e (i) .
L’algorithme suivant permet de construire récursivement les fonctions F t
58

ALGORITHME DE PROGRAMMATION DYNAMIQUE STOCHASTIQUE


 
• Données : D discrétisation de l’espace volume D ⊂ R|R |
+

• Pour tout t = T .. 2
◦ Pour tout Vt−1 ∈ D
1. Pour tout j = 1 .. N
   
(j) (j) (j)
(a) Résoudre P Lt : max Bt Vt−1 , A
f ,X + F
t t
e
t+1 (Vt )
 Xt ,Vt 
(j)
Vt =f Vt−1 ,A
e t ,Xt
 
(j) (j)
(b) Récupérer la valeur optimale de l’objectif Zt de P Lt ainsi que les valeurs
(j)
duales optimales relatives aux contraintes de conservation de masse des
πt
réservoirs à capacité positive
2. Si t > 2
(a) Pour tout i = 1 .. N
N
e (i) (V ) = Pijt Zt
(j)
X
i. Calculer F t t−1
j=1
N
e (i) (V Pijt πt
(j)
X
ii. Calculer ∂F t t−1 ) =
j=1
e (i) l’hyperplan coupant
iii. Ajouter à la définition de F t

(i) (i) T (i)


H : Θt ≤ ∂ F
e (V ) (V
t t−1 t−1 − Vt−1 ) + Ft (Vt−1 )
e

3. Sinon (t = 2)
N
(j)
Pi21 j Z2
X
(a) Calculer F
e (V ) =
2 1
j=1
N
(j)
Pi21 j π2
X
(b) Calculer ∂ F
e (V ) =
2 1
j=1

(c) Ajouter à la définition de F


e l’hyperplan coupant
2

T
H : Θ2 ≤ ∂ F
e (V ) (V − V ) + F
2 1 1 1
e (V )
2 1

Cette méthode, quoique exacte, a une complexité exponentielle. En effet, sans restreindre la
généralité, supposons que l’on discrétise le volume d’un réservoir r en M valeurs distinctes, ce
qui donne |D| = M |R | . En supposant que la complexité de 1.(a). est en O(1), la complexité
+
59

de la méthode
 ci-dessus, en d’autres termes le nombre de programmes linéaires à résoudre,
est en O T × N × M |R+ |
. Le tableau 5.3 donne un ordre de grandeur de cette complexité
pour N = 5, M = 20, T = 52 (horizon d’une année) et différentes valeurs de |R+ |.

Tableau 5.3 Complexité du schéma SDP exact

T × N × M |R |
+
|R+ |

1 5 200
2 104 000
3 2 080 000
4 41 600 000
5 832 000 000
6 16 640 000 000

On observe bien que cette méthode serait très couteuse même pour une valeur modeste de
M = 20.

5.7 Méthode de programmation dynamique duale stochastique (SDDP)

La méthode de programmation dynamique duale stochastique (« Stochastic Dual Dynamic


Programming », en abrégé SDDP) est une généralisation de la décomposition de Benders
(Benders (1962)) multi-étapes au cas d’un programme linéaire stochastique.
La décomposition de Benders multi-étapes permet de résoudre un problème linéaire déter-
ministe dans lequel les décisions sont prises par étapes, i.e. la matrice des contraintes est
par bloc mais avec des contraintes liantes qui lient les variables de décisions de deux étapes
consécutives.
SDDP peut être vue comme variante de SDP mais au lieu de faire un échantillonnage a priori
(la discrétisation D utilisée précédemment), elle effectue un échantillonnage par simulations.
Comme la décomposition de Benders, SDDP est une méthode itérative dans laquelle une
passe vers l’avant (forward) et une passe vers l’arrière (backward) sont effectuées à chaque
itération.
60

5.7.1 Passe vers l’avant


 
t−1 (i )
La passe vers l’avant permet de trouver des états candidats V1 , At−1 , Vt−1 en si-
    t=3 .. T
(i ) e (i)
mulant un scénario At t avec la politique 2,
F
e F t courante. Ces états candidats
t=2 .. T t,i  
seront utilisés dans la passe vers l’arrière pour raffiner la politique F e (i)
e , F .
2 t
t,i

Le pseudo-code suivant constitue l’algorithme de la passe vers l’avant de SDDP.

SDDP : PASSE VERS L’AVANT


 
(i )
• Données : Scénario Aet t tiré aléatoirement du processus stochastique discrétisé
t=2 .. T
• Résoudre
(P L1 ) : max B1 (V0 , A1 , X1 ) + F
e (V )
2 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )

• Conserver la valeur optimal V1 = V1 (volume initial pour l’étape suivante)


• Conserver l’état candidat V1 pour la passe vers l’arrière
• Pour tout t = 2 .. T
   
(i ) (i ) (i )
1. Résoudre P Lt t : max Bt Vt−1 , Aet t , Xt + F
e t (V )
t+1 t
 Xt ,Vt 
(it )
Vt =f Vt−1 ,A
et ,Xt

2. Si t < T
(a) Conserver la valeur optimal Vt = Vt (volume initial pour l’étape suivante)
 
(i )
(b) Conserver l’état candidat Aet t , Vt pour la passe vers l’arrière

5.7.2 Passe vers l’arrière

e t−1 aux candidats respec- (i )


La passe vers l’arrière permet de raffiner les approximations Fe ,F
2 t
 
(it−1 )
tifs V1 , At−1 , Vt−1
e issus de la passe vers l’avant. Un hyperplan coupant (ou coupe de
t=3 .. T
Benders) est ajouté e (it−1 )
àF
au point Vt−1 pour t = T .. 3, et ensuite, de même, un hyperplan
t
coupant (ou coupe de Benders) est ajouté à F
e au point V .
2 1

Le pseudo-code suivant décrit l’algorithme de la passe vers l’arrière de SDDP.


61

SDDP : PASSE VERS L’ARRIÈRE


 
t−1 (i )
• Données : États candidats V1 , Aet−1 , Vt−1
t=3 .. T
• Pour tout t = T .. 2
1. Pour tout j = 1 .. N
   
(j) (j) (j)
(a) Résoudre P Lt : max Bt Vt−1 , A
f ,X + F
t t
e
t+1 (Vt )
 Xt ,Vt 
(j)
Vt =f Vt−1 ,A
e t ,Xt
 
(j) (j)
(b) Récupérer la valeur optimale de l’objectif Zt de P Lt ainsi que les valeurs
(j)
duales optimales relatives aux contraintes de conservation de masse des
πt
réservoirs à capacité positive
2. Si t > 2
N
e (it−1 ) (V Pitt−1 j Zt
(j)
X
(a) Calculer F t t−1 ) =
j=1
N
e (it−1 ) (V ) = Pitt−1 j πt
(j)
X
(b) Calculer ∂ F t t−1
j=1
e (it−1 ) l’hyperplan coupant
(c) Ajouter à la définition de F t

(i ) (i ) T (i )
e t−1 (V ) (V
H : Θt t−1 ≤ ∂ Ft t−1
e t−1 (V )
t−1 − Vt−1 ) + Ft t−1

3. Sinon (t = 2)
N
(j)
Pi21 j Z2
X
(a) Calculer F
e (V ) =
2 1
j=1
N
(j)
Pi21 j π2
X
(b) Calculer ∂F
e
2 (V1 ) =
j=1

(c) Ajouter à la définition de F


e l’hyperplan coupant
2

T
H : Θ2 ≤ ∂ F
e (V ) (V − V ) + F
2 1 1 1
e (V )
2 1

5.7.3 L’algorithme SDDP

Comme mentionné avant, la méthode SDDP effectue une passe vers l’avant suivie d’une passe
vers l’arrière à chaque itération. Souvent, on fixe un nombre maximum d’itérations Imax . Ci-
après le pseudo-code de l’algorithme SDDP.
62

SDDP : L’ALGORITHME
• Données : Un nombre maximum d’itérations Imax
• Pour tout l = 1 .. Imax
1. Exécuter une PASSE VERS L’AVANT
2. Exécuter une PASSE VERS L’ARRIÈRE

5.7.4 Critère d’arrêt

Un des critères d’arrêt les plus utilisés dans SDDP est le critère d’intervalle de confiance : une
borne inférieure et un intervalle de confiance sur la borne supérieure de Θ e (5.2) sont calculés.

Le critère d’arrêt consiste à tester si la borne inférieure est à l’intérieur de l’intervalle de


confiance.
Borne supérieure
Soient (X1∗ , V1∗ ) tel que

(X1∗ , V1∗ ) ∈ argmax B1 (V0 , A1 , X1 ) + F


e (V )
2 1 (5.5)
X1 ,V1
V1 =f (V0 ,A1 ,X1 )

et soient (X1∗∗ , V1∗∗ ) tels que

(X1∗∗ , V1∗∗ ) ∈ argmax B1 (V0 , A1 , X1 ) + Fe2 (V1 ) . (5.6)


X1 ,V1
V1 =f (V0 ,A1 ,X1 )

(5.5) implique

B1 (V0 , A1 , X1∗ ) + F
e (X ∗ ) ≥ B (V , A , X ∗∗ ) + F
2 1 1 0 1 1
e (X ∗∗ ) .
2 1

e est une sur-approximation de F


Or F e , donc
2 2

B1 (V0 , A1 , X1∗∗ ) + F
e (X ∗∗ ) ≥ B (V , A , X ∗∗ ) + F
2 1 1 0 1 1
e (X ∗∗ ) .
2 1

Les deux inégalités précédentes donnent

B1 (V0 , A1 , X1∗ ) + F
e (X ∗ ) ≥ B (V , A , X ∗∗ ) + F
2 1 1 0 1 1
e (X ∗∗ ) .
2 1

Ainsi
max e (V ) ≥ Θ
B1 (V0 , A1 , X1 ) + F e . (5.7)
2 1 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )
63

On note la borne supérieure

Θ1 = max B1 (V0 , A1 , X1 ) + F
e (V ) .
2 1
X1 ,V1
V1 =f (V0 ,A1 ,X1 )

Borne inférieure
    
Notons S le nombre de scénarios A
f
t possibles S = O N T .
t

Soient (Zs∗∗ )s les valeurs optimales de l’objectif si l’on simule les S scénarios avec les fonctions
 
(i)
de bénéfices futurs Fe2 et Fet . (5.4) peut être réécrite
t,i

S
P (s)Zs∗∗
X
Θ
e
1 = (5.8)
s=1

où P (s) est la probabilité du scénario s.


Soient (Zs∗ )s les valeurs optimales de l’objectif si l’on simule les S scénarios avec les fonctions
 
de bénéfices futurs approximées F e et F e (i) . Puisque ces valeurs optimales ont été obtenues
2 t
t,i
en utilisant une politique sous-optimale, on a l’inégalité suivante

S S
P (s)Zs∗ ≤ P (s)Zs∗∗ ,
X X
(5.9)
s=1 s=1

soit
S
P (s)Zs∗ ≤ Θ
X
e .
1 (5.10)
s=1

Estimateur de la borne inférieure


Le calcul de la borne inférieure en simulant l’ensemble de tous les scénarios possibles demande
0
 0 
beaucoup de temps de calcul. En pratique, on tire un nombre S de scénarios S  S et
on calcule une estimation statistique de la borne inférieure (5.10)
0
S S
1 X ∗
P (s)Zs∗ .
X
Z ≈ (5.11)
S 0 s=1 s s=1
0
Notons que pour que la dernière inégalité soit juste il faut que le tirage aléatoire des S
scénarios soit effectué avec remise.
Intervalle de confiance
v
0 u 0
S S
1 1 X
u
Zs∗ (Z ∗ − Θ1 )2
X u
Notons Θ1 = 0 et soit l’écart-type empirique σ = t
S s=1 S 0 − 1 s=1 s
64

 
Θ1 − zα/2 √σ 0 , Θ1 + zα/2 √σ est un intervalle de confiance à 100(1 − α)% pour Θ où zα/2
S S0
est le (1 − α)-quantile de la loi normale centrée réduite. On prend souvent α = 0.5 ce qui
donne z0.025 = 1.96.

5.7.5 Convergence

Deux articles majeurs prouvent la convergence de la méthode SDDP : l’article de Philpott


et Guan (2008) et celui de Shapiro (2011). La preuve de convergence dans Philpott et Guan
(2008) se base sur la preuve de convergence de la décomposition de Benders multi-étapes en
la généralisant au cas stochastique. Il démontre que le nombre d’hyperplans coupants que l’on
peut générer pour définir chaque fonction de bénéfice futur Fe (i) (ou F
e ) est fini. Plus encore,
t 2
 
il démontre que, sous certaines hypothèses non restrictives, les approximations F e , Fe (i)
2 t
  t,i
(i)
convergent vers les vraies fonctions 2 , t Fe Fe après un nombre fini d’itérations.
t,i
Les hypothèses en question sont :
– les ensembles réalisables des programmes linéaires à une étape sont bornés et non vides,
ce qui est vérifié dans notre cas car le volume de chaque réservoir est borné et on pénalise
la demande non-satisfaite ;
– chaque scénario possible (i.e. dont la probabilité d’occurrence est positive) du processus
 
stochastique A f
t doit pouvoir être tiré une infinité de fois dans la passe vers l’avant, cette
t
hypothèse est vérifiée dans notre cas si l’on utilise un vrai générateur de nombres aléatoires
de loi U(0, 1). En pratique, on utilise un pseudo-générateur de nombres aléatoires ;
– chaque réalisation possible de la variable aléatoire A f doit pouvoir être tirée une infinité de
t
(i)
fois lors de l’ajout de coupes à une fonction Ft dans la passe vers l’arrière. Cette hypothèse
e

n’est pas nécessaire dans notre cas car on utilise toutes les N réalisations possibles pour
calculer une nouvelle coupe. La preuve de Philpott et Guan (2008) est plus générale dans
le sens qu’elle n’exige pas d’utiliser toutes les réalisations possibles (si N est grand cela
peut-être fastidieux).

5.8 Méthode de programmation dynamique stochastique approchée (ASDP)

Cette section est basée sur l’article en cours de rédaction intitulé « Adaptive discretization of
the state space for stochastic dynamic programming applied to multireservoir system » des
auteurs Stéphane Krau, Grégory Émiel, James Merleau et Robert Leconte. On essaiera dans
cette section de présenter l’idée générale sans rentrer dans les petits détails qui sont décris
dans l’article précité.
La méthode ASDP est très similaire à la méthode SDP présenté précédemment. La seule
65

(i)
différence consiste à utiliser une discrétisation adaptée de l’espace des états Dt−1 au lieu de
la discrétisation a priori D pour construire la fonction de bénéfice futur F e (i) utilisée dans
t
(i)
SDP. Cette discrétisation Dt−1 , bien entendu, dépend de t et de i (pour t = 2 on utilise une
seule discrétisation D1 puisqu’une seule fonction de bénéfice futur Fe2 est à déterminer). Le
but étant de ne pas discrétiser de façon uniforme l’espace des états, mais plutôt discrétiser
là où la fonction de bénéfice futur Fe (i) présente une forte courbure.
t

5.8.1 Discrétisation adaptée de l’espace d’état volume

Soient t ∈ {3 .. T } et i ∈ {1 .. N }. Notons n = |R+ |, la dimension de l’espace d’état volume.


L’espace volume V = Πr∈R+ [0, vr ] et partitionné en sous-régions spéciales de forme d’hyper-
(i)
rectangles. Initialement, la discrétisation Dt−1 de V est formée des points extrêmes de V,
(i) (i)
i.e. Dt−1 ← Πr∈R+ {0, vr }, Dt−1 est un seul hyper-rectangle. L’algorithme de discrétisation
(i)
adaptée consiste à découper chaque hyper-rectangle de Dt−1 en sous hyper-rectangles selon
un critère donné.
Un façon de découper un hyper-rectangle H est de trouver le point intérieur de H qui maxi-
e (i) sur H. Cette erreur
mise l’erreur sur l’approximation de la fonction de bénéfice futur F t
(i)
maximum est définie comme étant le maximum de la différence entre Ft et son interpolation
e

sur H, elle est obtenue en résolvant le programme linéaire suivant


n
εH e (i) (i)
X
max = max Ft (V) −
e (V )
λj Ft j
V,λ
j=1
n
X
s. à V= λj Vj
j=1 (5.12)
n
X
λj = 1
j=1
λ≥0

où les Vj sont les 2n sommets de l’hyper-rectangle H.


Soit V ∗ une solution optimale du programme linéaire (5.12), l’hyper-rectangle H est découpé
(i)
en 2n hyper-rectangles fils et n2n−1 + 1 nouveaux points sont ajoutés à la discrétisation Dt−1
comme l’illustre la figure suivante
66

V∗

Les hyper-rectangles H sont triés en temps réel par ordre décroissant de εHmax et à chaque
H n
itération l’hyper-rectangle avec la plus grande εmax est découpé en 2 hyper-rectangles fils.
Cette méthode nécessite la résolution d’un programme linéaire pour chacun des 2n hyper-
rectangles fils à chaque découpage d’un hyper-rectangle père, elle peut ainsi devenir couteuse
à mesure que la dimension de l’espace d’état volume augmente. Dans la sous-section suivante,
une méthode simple de découpage est présentée.

5.8.2 Discrétisation adaptée simplifiée de l’espace d’état volume

Au lieu de trouver le point intérieur d’un hyper-rectangle H qui maximise l’erreur εH max , on
calcule l’erreur sur chacune des n2n−1 arêtes e de H et on regroupe ces erreurs par dimen-
sion, i.e. l’erreur associée à une dimension de l’espace état volume correspond à la somme des
erreurs des 2n−1 arêtes qui lui sont parallèles. L’hyper-rectangle est ensuite découpé en deux
hyper-rectangles fils de volumes égaux suivant la dimension de plus forte erreur. Cette nou-
velle manière de découper engendre seulement 2n−1 nouveaux échantillons par hyper-rectangle
découpé.

Pour éviter de découper de très petits hyper-rectangles, l’erreur associée à un hyper-rectangle


est pondérée par son volume (produit des longueurs selon chaque dimension), on parle ainsi
de volume d’erreur.
67

L’avantage de cette méthode de découpage est qu’elle ne nécessite pas de résolution d’un
programme linéaire car l’erreur sur une arête peut être calculée analytiquement comme le
montre la figure 5.4.

εemax

Figure 5.4 Calcul analytique de l’erreur sur une arête d’un hyper-rectangle

En effet, il suffit de trouver le point d’intersection des deux droites de l’extrapolation, l’erreur
est alors la distance de ce point à la droite d’interpolation.

5.8.3 L’algorithme ASDP

Le pseudo-code suivant décrit l’algorithme de ASDP.


68

ALGORITHME DE PROGRAMMATION DYNAMIQUE STOCHASTIQUE APPROCHÉE


• Données : Dmax nombre maximum d’échantillons de l’espace d’état volume
• Pour tout t = T .. 2
– Si t > 2
N
X (i)
◦ Tant que Dt−1 < Dmax
i=1
(i)
1. Découper l’hyper-rectangle H de ∪N
i=1 Dt−1 ayant le plus grand volume d’erreur. Soit k l’unique
(k)
élément de {1 .. N } tel que H fait partie de la partition de Dt−1
(k)
2. Pour tout sommet Vt−1 nouvellement ajouté à Dt−1
(a) Pour tout j = 1 .. N
   
(j) (j) (j)
i. Résoudre P Lt : max Bt Vt−1 , A
e t , Xt + e
Ft+1 (Vt )
Xt ,Vt 
Vt =f Vt−1 ,At e (j) ,Xt
 
(j) (j)
ii. Récupérer la valeur optimale de l’objectif Zt de P Lt ainsi que les valeurs duales opti-
(j)
males πt relatives aux contraintes de conservation de masse des réservoirs à capacité positive
N
(k)
X t (j)
Ft (Vt−1 ) =
(b) Calculer e Pkj Zt
j=1
N
X
(k) t (j)
(c) Calculer ∂ e
Ft (Vt−1 ) = Pkj πt
j=1
(k)
Ft l’hyperplan coupant
(d) Ajouter à la définition de e

(k) (k) T (k)


H : Θt ≤ ∂e
Ft (Vt−1 ) (Vt−1 − Vt−1 ) + e
Ft (Vt−1 )

– Si (t = 2)
◦ Tant que |D1 | < Dmax
1. Découper l’hyper-rectangle H de D1 ayant le plus grand volume d’erreur.
2. Pour tout sommet V1 nouvellement ajouté à Dt−1
(a) Pour tout j = 1 .. N
   
(j) (j) (j)
i. Résoudre P L2 : max e 2 , X2 + e
B2 V1 , A F3 (V2 )
X2 ,V2 
V2 =f V1 ,A2 ,X2 e (j)
 
(j) (j)
ii. Récupérer la valeur optimale de l’objectif Z2 de P L2 ainsi que les valeurs duales opti-
(j)
males π2 relatives aux contraintes de conservation de masse des réservoirs à capacité positive
N
X (j)
F2 (V1 ) =
(b) Calculer e Pi21 j Z2
j=1
N
X (j)
(c) Calculer ∂ e
F2 (V1 ) = Pi21 j π2
j=1

F2 l’hyperplan coupant
(d) Ajouter à la définition de e

T
H : Θ2 ≤ ∂ e
F2 (V1 ) (V1 − V1 ) + e
F2 (V1 )
69

5.8.4 Critère d’arrêt

Au lieu de fixer a priori un nombre maximum Dmax d’échantillons de l’espace d’état volume,
on peut avoir un critère d’arrêt sur le volume d’erreur maximal des hyper-rectangles. Dès que
le volume d’erreur est en bas d’une tolérance fixée, on estime que les fonctions de bénéfice futur
de la semaine courante sont suffisamment approximées et on passe à la semaine précédente.

5.8.5 Convergence
(i)
Tout comme SDP (cf. section 5.6), plus Dmax est grand plus les approximations F e ,F
2
e
t
(i)
s’approchent des vraies fonctions Ft , Ft , et on peut de même affirmer qu’à partir d’une
e e

valeur assez grande de Dmax on aura



2 = F2
 F
e e
 e (i) = F
F e (i) ∀t ∈ {3, .. , T } ∀i ∈ {1, .. , N }
t t
70

CHAPITRE 6 ANALYSE D’UN CAS D’ÉTUDE : LA GRANDE RIVIÈRE

Ce chapitre présente les résultats de l’application de la méthodologie vue dans les chapitres
précédents sur un cas réel : La Grande rivière située au nord de la province de Québec (voir
la figure 1.2). Il s’agit de la rivière qui fournit la plus importante part d’électricité au Québec.
Le chapitre est découpé en trois sections majeures. Dans la première section, on décrit le cas
d’étude. Dans la deuxième section, une comparaison des deux modélisations des fonctions
de production des centrales hydroélectriques vues au chapitre 3 est faite sur les centrales
considérées. Enfin, on fournit dans la troisième section les résultats de l’application des mé-
thodes SDDP et ASDP vues au chapitre 5 au problème de planification moyen-terme de la
production d’hydroélectricité.

6.1 Description du cas d’étude

6.1.1 Caractéristiques des installations hydroélectriques

LGR contient six réservoirs dont quatre sont des réservoirs à capacité positive (peuvent
stocker l’eau) : Caniapiscau, La Grande4 , La Grande3 , La Grande2 . Les réservoirs La Forge2
et La Forge1 sont considérés comme réservoirs sans capacité. Le tableau 6.1 donnent les
caractéristiques des quatre réservoirs à capacité positive.

Tableau 6.1 Caractéristiques des réservoirs de LGR

Équivalent
énergétique
Réservoir Volume maximum (hm3 ) approximatif (GWh)

Caniapiscau 39 009 47 772


La Grande4 7 079 6 483
La Grande3 25 195 15 583
La Grande2 19 369 8 131

À chaque réservoir de LGR sont associés une centrale hydroélectrique et un ouvrage d’éva-
cuation. Rappelons qu’un réservoir à capacité positive possède une centrale à hauteur de
chute variable et qu’un réservoir sans capacité possède une centrale à hauteur de chute fixe.
Le tableau 6.2 donne les caractéristiques des centrales de LGR, on y trouve la hauteur de
chute, le débit et la puissance maximums à la hauteur de chute de référence.
71

Tableau 6.2 Caractéristiques des centrales de LGR

0
Centrale hmax (m) qmax (m3 /s) p0max (MW)

Caniapiscau 41.34 1 133 402.90


La Forge2 - 1 192.13 280.07
La Forge1 - 1 642.90 828.67
La Grande4 119.60 2 545.75 2 656.24
La Grande3 84.20 3 552.84 2 362.84
La Grande2 145.73 6 245.97 7 394.14

Le tableau 6.3 donne les débits maximums des ouvrages d’évacuation de LGR.

Tableau 6.3 Caractéristiques des ouvrages d’évacuation de LGR

Ouvrage d’évacuation qmax (m3 /s)

Caniapiscau ∞
La Forge2 2 475.00
La Forge1 2 958.50
La Grande4 7 723.23
La Grande3 10 507.00
La Grande2 16 415.00

La figure 6.1 illustre la disposition et les relations entre les différentes composantes de LGR.
On y voit en particulier que le déversement au niveau de Caniapiscau est hors-système
(confluent) et il est préférable de le réduire le plus possible vu que plusieurs autres réser-
voirs sont en bas de Caniapiscau et pourraient donc utiliser cette eau « gaspillée ».
72

Apport naturel

Caniapiscau

La Forge2
Réservoir a
capacité positive

Réservoir
La Forge1 sans capacité

Centrale
hydroélectrique

La Grande4 Ouvrage
d’évacuation

Chemin d’eau

La Grande3 Confluent

Légende

La Grande2

Figure 6.1 Schéma de La Grande Rivière


73

6.1.2 Demande en électricité

Les modèles de planification de la production d’hydroélectricité que l’on traite visent, entre
autres, à satisfaire la demande en électricité. La figure 6.2 illustre la demande à satisfaire
sur une année (on considère que la demande est stationnaire, c’est à dire qu’elle demeure
inchangée d’une année à l’autre). On considère deux classe de demande : une classe pointe
et une classe moyenne qui dure respectivement 42h et 126h sur une semaine (168h).

14000

12000

10000
Demande (MW)

8000

6000

4000

2000

0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52

Semaine
Classe pointe Classe moyenne

Figure 6.2 Demande électrique

6.2 Comparaison de différentes modélisations des fonctions de production des


centrales

Chacune des trois modélisations vues au chapitre 3 sont évaluées sur une grille fine G de
l’espace débit-hauteur de chute (q, h). Le critère d’évaluation du résultat d’une modélisation
donnée est l’erreur-type sur la grille G, RM SEG

v
u 1 X
RM SEG = (peC (qi , hi ) − pC (qi , hi ))2 (6.1)
u
t
|G| (qi ,hi )∈G
74

où peC est la fonction puissance approximée ((3.8) dans le cas de EnvConc, (3.9) dans le cas
de PartMC ou PartMINMAX) et pC est la fonction puissance exacte (3.6).
Le tableau 6.4 donnent la taille des grilles utilisées.

Tableau 6.4 Taille des grilles utilisées

Centrale |G|

Caniapiscau 16 962
La Grande4 32 832
La Grande3 49 521
La Grande2 56 225

6.2.1 Modélisation par enveloppe concave

Le tableau 6.5 donne, pour chacune des centrales à hauteur de chute variable, l’erreur-type
RM SEG de la production estimée et le pourcentage de RM SEG par rapport à la puissance
installée de la centrale quand on approxime les fonction de production des centrales par la
méthode EnvConc.

Tableau 6.5 Erreur-type de la production estimée (cas de EnvConc)

Centrale RM SEG (MW) RM SEG [%]

Caniapiscau 14.56 3.61


La Grande4 20.41 0.77
La Grande3 32.08 1.36
La Grande2 15.57 0.21

6.2.2 Modélisation par une fonction concave affine par morceaux

Pour les deux variantes PartMC et PartMINMAX, les plans affines sont obtenus sur
un sous-ensemble de la grille constitués des points (q, h, p) de configurations optimales pour
différentes valeurs de la hauteur de chute, ceci est tout à fait raisonnable car une centrale est
utilisée dans l’une de ces configurations.
Les résultats de l’application de l’algorithme de partitionnement sur les fonctions de produc-
tions des 4 centrales à hauteur de chute variable du cas d’étude sont résumés dans les figures
6.3, 6.4, 6.5 et 6.6. L’erreur-type est représentée en pourcentage de la puissance installée
75

de la centrale. À noter que pour ces résultats, on a choisit les paramètres Nessais = 100 et
lmax = 200.

Caniapiscau Caniapiscau
4 5 4 5

3.5 3.5
4 4
3 3

Nombre d`hyperplans

Nombre d`hyperplans
2.5 2.5
3 3
RMSEG [%]

RMSEG [%]
2 2

2 2
1.5 1.5

1 1
1 1
0.5 0.5

0 0 0 0
12 18 24 30 36 42 48 54 60 66 72 78 84 90 96 102 108 114 120 12 18 24 30 36 42 48 54 60 66 72 78 84 90 96 102 108 114 120

Nombre de points Nombre de points


RMSEG[%] Nombre d'hypeplans RMSEG[%] Nombre d'hypeplans

(a) PartMC (b) PartMINMAX

Figure 6.3 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale Caniapiscau)

La Grande4 La Grande4
0.9 6 0.9 6

0.8 0.8
5 5
0.7 0.7
Nombre d`hyperplans

Nombre d`hyperplans
0.6 4 0.6 4
RMSEG [%]

RMSEG [%]

0.5 0.5
3 3
0.4 0.4

0.3 2 0.3 2

0.2 0.2
1 1
0.1 0.1

0 0 0 0
26 39 52 65 78 91 104 117 130 143 156 169 182 195 208 221 234 247 260 26 39 52 65 78 91 104 117 130 143 156 169 182 195 208 221 234 247 260

Nombre de points Nombre de points


RMSEG[%] Nombre d'hypeplans RMSEG[%] Nombre d'hypeplans

(a) PartMC (b) PartMINMAX

Figure 6.4 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale La Grande4 )
76

La Grande3 La Grande3
1.6 6 1.6 6

1.4 1.4
5 5
1.2 1.2

Nombre d`hyperplans

Nombre d`hyperplans
4 4
1 1
RMSEG [%]

RMSEG [%]
0.8 3 0.8 3

0.6 0.6
2 2
0.4 0.4
1 1
0.2 0.2

0 0 0 0
32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 272 288 304 320 32 48 64 80 96 112 128 144 160 176 192 208 224 240 256 272 288 304 320

Nombre de points Nombre de points


RMSEG[%] Nombre d'hypeplans RMSEG[%] Nombre d'hypeplans

(a) PartMC (b) PartMINMAX

Figure 6.5 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale La Grande3 )

La Grande2 La Grande2
0.25 11 0.25 11

10 10

0.2 9 0.2
9

Nombre d`hyperplans
Nombre d`hyperplans

8 8

7 7
0.15 0.15
RMSEG [%]

MQG [%]

6 6

5 5
0.1 0.1
4 4

3 3

0.05 2
0.05
2

1 1

0 0 0 0
58 87 116 145 174 203 232 261 290 319 348 377 406 435 464 493 522 551 580 58 87 116 145 174 203 232 261 290 319 348 377 406 435 464 493 522 551 580

Nombre de points Nombre de points


RMSEG[%] Nombre d'hypeplans MQG[%] Nombre d'hypeplans

(a) PartMC (b) PartMINMAX

Figure 6.6 Relation entre, (1) la discrétisation de l’espace débit-hauteur de chute, (2) l’erreur-
type (RM SEG ), et (3) le nombre d’hyperplans approximant la fonction de production (cas
de la centrale La Grande2 )

Si l’on prend le cas de la centrale Caniapiscau (figure 6.3), on peut remarquer que les deux
approches de partitionnement PartMC et PartMINMAX sont comparables au niveau de
77

l’erreur-type (RM SEG ). Cependant, PartMINMAX est meilleure que PartMC au niveau
du nombre d’hyperplans définissant la fonction de production approximée. On peut faire le
même constat pour les autres centrales.
Par ailleurs, PartMC est meilleure que PartMINMAX au niveau du temps d’exécution
de l’algorithme de partitionnement (c.f. section 3.2.4 du chapitre 3). En effet, pour trouver le
meilleur hyperplan au sens de l’erreur maximum la plus petite, PartMINMAX résout un
programme linéaire assez grand, alors que PartMC ou effectue une inversion de matrice 3×3
ou résout un problème quadratique à trois variables. Le tableau 6.6 illustre cette différence
en temps d’exécution. Ici, on a pris Nessais = 100 et lmax = 50.

Tableau 6.6 Ordre de grandeur du temps d’exécution de l’algorithme de partitionnement

Centrale Nuage de points Temps PartMC (s) Temps PartMINMAX (s)

Caniapiscau 120 43 82
La Grande4 260 88 164
La Grande3 320 109 195
La Grande2 580 271 362

On peut voir que le temps d’exécution de l’algorithme de partitionnement avec PartMIN-


MAX est à peu près le double de celui avec PartMC.

6.2.3 Conclusion

Les résultats qu’on vient d’analyser montre que les trois modélisations EnvConc, PartMC
et PartMINMAX sont comparables et plus ou moins équivalentes en matière d’erreur-type
RM SEG . Cependant, Elle peuvent impacter différemment la performance (temps d’exécu-
tion) des algorithmes de planification de la production d’hydroélectricité. En effet, il s’agit
de modélisations complémentaires au sens de la théorie de la programmation linéaire. Env-
Conc nécessitent plusieurs variables (les λ) et trois contraintes. la modélisation par fonction
concave affine par morceaux (que ce soit via PartMC ou PartMINMAX) n’ajoute pas de
variables mais nécessite l’ajout d’une contrainte par hyperplan.
Intuitivement, on peut faire la conjecture que la modélisation des fonctions de production par
des fonctions concaves affines par morceaux est plus performante si le nombre d’hyperplans
reste raisonnable, dans ce cas PartMINMAX semble être la plus appropriée. À la fin de ce
chapitre, un retour sur les deux modélisations sera fourni.
78

6.3 Planification moyen-terme de la production d’hydroélectricité : SDDP vs


ASDP

Dans cette section, on présente les résultats issus de l’application des méthodes SDDP et
ASDP au problème de planification moyen-terme de la production d’hydroélectricité. L’ob-
jectif est de trouver une politique optimale de gestion de LGR sur un horizon d’une année.
On part des volumes initiaux des réservoirs listés dans le tableau 6.7.

Tableau 6.7 Volumes initiaux des réservoirs à capacité positive

Réservoir Volume initial V0

Caniapiscau 30 000
La Grande4 5 000
La Grande3 18 000
La Grande2 16 000

Quant à l’apport de la semaine 1, supposé connu à l’avance, on part d’une valeur de A1 =


2418.331120 m3 /s.
Le processus d’apport hydrique est discrétisé en N = 5 valeurs pour chaque semaine.
Comme on ne connait pas la valeur de l’eau à la fin de l’horizon considéré (fixée à FT +1 ≡ 0),
il faut en théorie résoudre le problème de planification sur un horizon infini (T → ∞) ce qui
n’est pas envisageable en pratique. Une façon approximative de surmonter cet obstacle est de
résoudre le problème sur un horizon rallongé assez grand. On choisit d’illustrer les résultats
pour un horizon rallongé de 6 ans (soit T = 312 périodes d’une semaine). Bien évidement,
plus l’horizon rallongé est long, plus la politique sur la première année est fiable.

6.3.1 Évolution des bornes

On exécute SDDP avec un nombre d’itérations Imax = 3000. À chaque 200 itérations, on
calcule la borne supérieure et une estimation de la borne inférieure sur 1000 scénarios tirés
aléatoirement à chaque fois (cf. section 5.7.4). Comme ASDP n’est pas une méthode itérative
(une seule passe backward permet de construire une approximation des fonctions de bénéfice
futur) et pour pouvoir la comparer avec SDDP, on l’exécute à chaque 200 itérations de SDDP
avec un nombre d’échantillons Dmax qui augmente de 200 à chaque fois et on calcule les bornes
de la même manière et en utilisant les mêmes scénarios que SDDP.
79

La figure 6.7 montre l’évolution des bornes inférieure et supérieure pour les deux méthodes
SDDP et ASDP.

Borne Inf SDDP Borne Sup SDDP Borne Inf ASDP Borne Sup ASDP Borne Inf SDDP Borne Sup SDDP Borne Inf ASDP Borne Sup ASDP

7.9
x 100000000

x 100000000
5.43
7.4

6.9
Bornes sur l'objectif total ($)

Bonres sur l'objectif total ($)


5.38
6.4

5.9

5.4 5.33

4.9

4.4 5.28

3.9

3.4 5.23
0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
Itération Itération

(a) (b)

Figure 6.7 (a) évolution des bornes inférieure et supérieure ; (b) zoom sur la convergence.

Plusieurs remarques peuvent être soulignées :


– l’estimation de la borne inférieure peut fluctuer vu que les scénarios utilisés sont différents
à chaque fois. À l’inverse, la borne supérieure décroit progressivement ;
– aux 400 premières itérations (ce qui équivaut à deux évaluations des bornes), la borne
supérieure de ASDP décroit plus rapidement que SDDP, ce qui est prévisible vu le caractère
itératif de SDDP. En effet, aux premières passes vers l’avant de SDDP et plus on s’éloigne
dans l’horizon de planification, les coupes sont générées à des volumes bas, ce qui fait que
les premières coupes véhiculent peu d’information sur le futur. On dit que SDDP nécessite
une phase de rodage avant de commencer à échantillonner au bon endroit ;
– quant à l’estimation de la borne inférieure, on observe qu’elle est nettement meilleure dans
le cas de SDDP, ceci sera justifié dans la section 6.3.3 ;
– malgré qu’elle nécessite une phase de rodage, SDDP converge avec un gap (entre les deux
bornes) plus fin que ASDP, observons sur la figure 6.7(b) que, dans le cas de SDDP,
l’estimateur de la borne inférieure est supérieur ou égal à la borne supérieure à trois
reprises (les itérations 2000, 2600 et 3000).
80

6.3.2 Raffinement de la politique

Une autre métrique qui permet de comparer la performance des deux méthodes en matière
de politique de gestion consiste à fixer, au tout début, un certain nombre de scénarios, par
exemple 1000, et les simuler à chaque 200 itérations comme ce qu’on a fait pour les bornes.
À l’issu de chaque simulation, on calcule la valeur moyenne et l’écart-type de l’objectif sur
ces scénarios fixes. On rapporte sur la figure 6.8 l’évolution de la politique de gestion en
matière de bénéfice sur 1000 scénarios fixes. Pour chaque méthode, SDDP et ASDP, on trace
la courbe de l’objectif moyen, et ses bornes statistiques (± son écart-type).

obj moy SDDP obj min SDDP obj max SDDP obj moy SDDP obj min SDDP obj max SDDP
obj moy ASDP obj min asdp obj max ASDP obj moy ASDP obj min asdp obj max ASDP
5.7
x 100000000

x 100000000
5.5 5.6

5.5

5.0 5.4
Objectif total ($)

Objectif total ($)


5.3

5.2
4.5
5.1

5.0
4.0
4.9

4.8

3.5 4.7
0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000 0 200 400 600 800 1000 1200 1400 1600 1800 2000 2200 2400 2600 2800 3000
Itération Itération

(a) (b) zoom

Figure 6.8 Amélioration de la politique sur 1000 scénarios fixes

On observe que l’objectif moyen ainsi que ses bornes statistiques dans le cas de SDDP sont
plus grandes que ceux dans le cas de ASDP. Ce qui confirme que la politique de gestion de
SDDP est meilleure que celle de ASDP.
Quelles sont alors les raisons de l’avance de SDDP par rapport à ASDP ?
On essaie de répondre à cette question dans la sous-section suivante en creusant dans la
manière d’échantillonner l’espace des états de l’une ou l’autre des deux méthodes.

6.3.3 Échantillonnage de l’espace des états

L’échantillonnage de l’espace des états constitue une différence majeure entre SDDP et ASDP.
La figure 6.9 montre la distribution des coupes de Benders sur les cinq cas d’apport pour
81

chaque semaine lorsqu’on exécute SDDP pour un nombre d’itérations Imax = 3000 et ASDP
pour un nombre d’états échantillonnés Dmax = 3000.

Cas d'apport 1 Cas d'apport 2 Cas d'apport 3 Cas d'apport 4 Cas d'apport 5 Cas d'apport 1 Cas d'apport 2 Cas d'apport 3 Cas d'apport 4 Cas d'apport 5
Nombre d'hyperplans de la fonction de bénéfice futur

Nombre d'hyperplans de la fonction de bénéfice futur


1400 1400

1200 1200

1000 1000

800 800

600 600

400 400

200 200

0 0
2
12
22
32
42
52
62
72
82
92
102
112
122
132
142
152
162
172
182
192
202
212
222
232
242
252
262
272
282
292
302

2
12
22
32
42
52
62
72
82
92
102
112
122
132
142
152
162
172
182
192
202
212
222
232
242
252
262
272
282
292
302
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.9 Distribution des coupes de Benders sur les différents cas d’apport

On note que ASDP (b) distribue les coupes de Benders quasiment uniformément (une relati-
vement petite fluctuation autour de la moyenne 600 = 3000
5
) sur les cinq fonctions de bénéfice
(i)
futur Ft i = 1 .. 5 pour toutes les semaines t. Alors que SDDP (a) ne les distribue pas
e

de cette façon. Examinons de près le processus d’apports PAR(1) discrétisé que l’on utilise
illustré dans la figure 6.10
82

A1

A2

A3

A4

Forte probabilité de transition


Faible probabilité de transition
Très faible probabilité de transition

Figure 6.10 Transitions dans le processus d’apports PAR(1) discrétisé

De prime abord, on constate que la cas d’apport 3 est le plus récurrent pour toutes les
semaines, suivi des deux cas d’apport 2 et 4, et en dernier les deux cas d’apport restants 1
et 5.
Vu que l’échantillonnage dans SDDP se fait par génération de scénarios aléatoires du proces-
sus d’apport discrétisé, il est donc prévu que la distribution des coupes de Benders sur les
différents cas d’apport d’une semaine donnée soit plus favorable au cas d’apport 3, puis aux
deux cas 2 et 4 puis aux autres cas 1 et 5. Quant à ASDP, le critère de volume d’erreur fait
qu’elle distribue uniformément les coupes sur les cinq cas d’apport.
Ceci étant pour l’échantillonnage de l’espace de l’état apport passé, qu’en est-il de l’échan-
tillonnage de l’espace de l’état volume ?
La figure 6.11 rapporte les volumes échantillonnés de chacun des quatre réservoirs à capacité
positive de LGR des deux premières années (soit 104 semaines) de l’horizon de planification
rallongé. Les volumes échantillonnés par SDDP sont représentés par des points bleus, ceux
échantillonnés par ASDP sont de couleur orange.
83

(a) (b)

(c) (d)

Figure 6.11 Volumes échantillonnés par les méthodes SDDP et ASDP

On voit clairement que SDDP échantillonne suivant le processus stochastique d’apport :


puiser des réservoirs avant la crue de printemps pour les préparer à recevoir des quanti-
tés importantes d’apport d’eau. De plus, l’échantillonnage de SDDP contient des zones de
concentration qui correspondent aux intervalles de volumes probables des semaines. On peut
aussi remarquer que SDDP discrimine les réservoirs selon les performances de leurs centrales
respectives : le volume du réservoir La Grande2 est dans la plupart du temps échantillonné
proche de sa capacité maximale vu que sa centrale est la plus performante en production
(hauteur de chute de plus de 145m et une puissance maximum dépassant les 7000MW).
Remarquons aussi que SDDP tient compte des volumes initiaux des réservoirs dans son
échantillonnent aux premières semaines de l’horizon.
Quant à ASDP, vu son critère de découpage basé sur le volume d’erreur le volume qu’elle
échantillonne tend à être uniforme sur toutes les semaines. On remarque aussi que ASDP peut
84

échantillonner à des endroits par lesquels la gestion ne va probablement pas passer (si l’on se
fie au processus stochastique d’apport utilisé). Prenons, par exemple, le cas du réservoir La
Grande2 sur la figure 6.11(d), ASDP échantillonne son volume à des valeurs basses malgré
que la performance de sa centrale augmente avec son niveau. Contrairement à SDDP, ASDP
n’exploite pas les volumes initiaux des réservoirs pour restreindre son échantillonnage aux
premières semaines de l’horizon.
En conclusion, SDDP échantillonne l’espace des états par apprentissage du processus sto-
chastique d’apport et tient compte des conditions initiales du système (les volumes initiaux
des réservoirs V0 et l’apport A1 ). Alors que ASDP essaie de discrétiser l’espace des états sans
tenir compte de la distribution des apports et sans utiliser l’information de l’état initial du
système.

6.3.4 Gestion des réservoirs et de la production de LGR

On présente dans cette section la simulation de la gestion des réservoirs et de la production


de LGR suite à l’application de SDDP avec un nombre d’itérations Imax = 3000 et ASDP
avec un nombre d’échantillons de l’espace des états Dmax = 3000. La simulation est effectuée
sur 1000 scénarios du processus stochastique d’apport discrétisé. La figure 6.12 donne le
diagramme en boîte de ces scénarios.

Apport minimum
11000 Apport maximum

10000

9000

8000
Apport (m³/s)

7000

6000

5000

4000

3000

2000

1000
5 10 15 20 25 30 35 40 45 50
Semaine

Figure 6.12 Scénarios de simulation post-politique


85

Simulation de la gestion des réservoirs

Les figures 6.13, 6.14, 6.15 et 6.16 donnent les diagrammes en boîte du volume moyen simulé
des réservoirs Caniapiscau, La Grande4 , La Grande3 et La Grande2 respectivement. La figure
6.17 donne les diagrammes en boîte du débit déversé hors-système de Caniapiscau. À gauche
la simulation est faite avec la politique de gestion obtenue via SDDP, à droite elle est faite
avec la politique obtenue via ASDP.

#10 4 Caniapiscau #10 4 Caniapiscau


4 4

3.5 3.5
Volume moyen (hm³)

Volume moyen (hm³)


3 3

2.5 2.5

2 2

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.13 Diagramme en boîte du volume moyen simulé du réservoir Caniapiscau

La Grande 4 La Grande 4

7000 7000

6500 6500

6000
Volume moyen (hm³)

Volume moyen (hm³)

6000

5500
5500

5000
5000

4500
4500

4000
4000

3500

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.14 Diagramme en boîte du volume moyen simulé du réservoir La Grande4


86

La Grande 3 La Grande 3
#10 4 #10 4

2.5

2.4

2.2
Volume moyen (hm³)

Volume moyen (hm³)


2 2

1.8

1.6
1.5

1.4

1.2

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.15 Diagramme en boîte du volume moyen simulé du réservoir La Grande3

La Grande 2 La Grande 2
#10 4 #10 4

1.9 1.9

1.8 1.8
Volume moyen (hm³)

Volume moyen (hm³)

1.7 1.7

1.6 1.6

1.5 1.5

1.4 1.4

1.3 1.3

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.16 Diagramme en boîte du volume moyen simulé du réservoir La Grande2


87

Déversé Caniapiscau Déversé Caniapiscau

20 120

100

15
Débit déversé (m³/s)

Débit déversé (m³/s)


80

10 60

40

20

0 0

5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.17 Diagramme en boîte du débit déversé simulé de l’ouvrage d’évacuation Caniapis-
cau

On note les différences suivantes en matière de stratégie de gestion des deux méthodes :
– pour le réservoir Caniapiscau, ASDP essaie de le remplir juste avant la venue de l’hiver.
SDDP y garde un niveau relativement constant durant tout l’automne. Toutefois ASDP
se trouve obligée de déverser hors-système plus fréquemment et en plus grandes quantités
que SDDP ;
– pour le réservoir La Grande3 , SDDP le remplit plus que ASDP durant la crue de printemps
et jusqu’à la venue de l’hiver. Ce réservoir dispose de la 3e plus importante centrale, ainsi
la stratégie de SDDP de le remplir pour se préparer à la forte demande de l’hiver est
pertinente ;
– pour le réservoir La Grande2 , on note une nette différence de gestion durant le début de
l’hiver, SDDP le garde presque toujours à son niveau maximum ce qui est plus optimal vu
que sa centrale est la plus performante.
Le comportement des deux méthodes vis-à-vis du réservoir La Grande4 est relativement
similaire.
Pour ce qui est du déversé de Caniapiscau, rappelons qu’il s’agit d’un déversé hors-système
du haut de LGR (cf. figure 6.1). Ce déversé est un gaspillage car s’il est plutôt turbiné par
la centrale Caniapiscau, il peut être recyclé par les centrales en aval. On note que SDDP ne
déverse que rarement à ce niveau. ASDP en déverse moins rarement (cf. figure 6.17).
88

Simulation de la production

Les figures 6.18 et 6.19 donnent les diagrammes en boîte de la production produite simulée des
classes pointe et moyenne respectivement. À gauche la simulation est faite avec la politique
de gestion obtenue via SDDP, à droite elle est faite avec la politique obtenue via ASDP.

#10 4 Classe pointe #10 4 Classe pointe


1.6 1.6

1.4 1.4
Puissance produite (MW)

Puissance produite (MW)


1.2 1.2

1 1

0.8 0.8

0.6 0.6

0.4 0.4
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.18 Diagramme en boîte de la puissance produite simulée durant la classe pointe

Classe moyenne Classe moyenne


16000 16000

14000 14000

12000 12000
Puissance produite (MW)

Puissance produite (MW)

10000 10000

8000 8000

6000 6000

4000 4000

2000 2000
5 10 15 20 25 30 35 40 45 50 5 10 15 20 25 30 35 40 45 50
Semaine Semaine

(a) SDDP (b) ASDP

Figure 6.19 Diagramme en boîte de la puissance produite simulée durant la classe moyenne

On note que la puissance produite dans le cas de SDDP est, dans la majorité des scénarios,
plus en deçà de la puissance minimum (demande) que ASDP. Ce phénomène est plus prononcé
dans le cas de la classe moyenne qui dure le plus sur une semaine (75%). Ainsi la gestion
89

avec SDDP permet d’avoir plus de marge sur la production tout en gardant une gestion des
stocks d’eau raisonnable.

6.4 Retour sur les fonctions de production

On exécute SDDP avec un nombre d’itération Imax = 3000 pour chacune des deux modélisa-
tions des fonctions de production et on rapporte son temps d’exécution. Pour la modélisation
par fonctions concaves linéaires par morceaux des fonctions de production, on utilise les
nombres d’hyperplans listés dans le tableau 6.8.

Tableau 6.8 Nombre d’hyperplans de l’approximation de la fonction de production

Centrale Nombre d’hyperplans

Caniapiscau 2
La Grande4 4
La Grande3 3
La Grande2 7

On avait émis la conjecture que la modélisation par fonctions concaves linéaires par mor-
ceaux des fonctions de production (avec ses deux variantes PartMC et PartMINMAX)
serait meilleure que la modélisation par enveloppe concave de deux fonctions extrêmes (Env-
Conc) en matière de temps d’exécution de SDDP et ASDP si le nombre d’hyperplans de
l’approximation est raisonnablement petit. On vérifie que c’est bien le cas puisque SDDP
avec la première se termine après 25min de temps d’exécution alors qu’avec la deuxième elle
se termine après 38min, soit un gain approximatif de 34%.
90

CHAPITRE 7 CONCLUSION

7.1 Synthèse des travaux

Le travail effectué et présenté dans ce mémoire peut se résumer aux points suivants
1. Modélisation d’un cas d’étude réel (La Grande Rivière) ;
2. Comparaison de différentes méthodes d’approximation concave des fonctions de pro-
duction des centrales hydroélectriques et en matière de leur erreur-type (RMSE) et en
matière de leur influence sur le temps d’exécution des modèles de planification étudiés ;
3. Application de deux méthodes basées sur la programmation dynamique stochastique
(SDDP et ASDP) au problème de planification moyen-terme de la production d’hydro-
électricité ;
4. Comparaison des deux méthodes (SDDP et ASDP) sur un cas réel et d’envergure
(LGR).
Pour ce qui est des fonctions de production des centrales hydroélectriques, les deux approches
proposées se sont avérées quasiment équivalentes au niveau de l’erreur-type (RMSE). La
modélisation par une fonction concave linéaire par morceaux est toutefois meilleure sur le
temps d’exécution des programmes linéaires utilisés dans les méthodes de planification. En
plus du critère des moindres carrés utilisé par l’algorithme de partitionnement de Magnani
et Boyd (2009), nous avons proposé une variante du même algorithme avec le critère de
minimisation du maximum de l’erreur. Cette nouvelle variante est plus couteuse en temps
d’exécution de l’algorithme de partitionnement mais nous a permis de réduire le nombre
d’hyperplans tout en gardant une erreur-type (RMSE) compétitive.
L’application des méthodes SDDP et ASDP s’est faite sur LGR avec un nombre important
de réservoirs. La comparaison de ses deux méthodes a montré que :
– SDDP et ASDP peuvent résoudre un problème de planification multi-réservoir ;
– SDDP échantillonne l’espace des états par simulations de scénarios tirés aléatoirement
(passe vers l’avant). De ce fait, les coupes sont générées là où le processus stochastique
des apports l’indique. ASDPA n’apprend pas du processus stochastique des apports car
elle n’échantillonne pas par simulations. De manière graphique, SDDP échantillonne à
l’intérieur des hyper-rectangles, ASDP échantillonne les sommets des hyper-rectangles ;
– malgré qu’elle nécessite une phase de rodage de sa politique, SDDP converge vers une
politique optimale après un nombre fini d’itérations ;
– ASDP distribue quasiment uniformément les coupes de Benders sur les différents cas d’ap-
91

port d’une semaine donnée. Cependant, ces différents cas d’apport ne sont en général pas
équiprobables ;
– la convergence de SDDP est plus fine que celle de ASDP ;
– la politique obtenue via SDDP est plus proche de la politique optimale que celle obtenue
via ASDP ;

7.2 Limitations de la solution proposée

Malgré sa convergence prouvée, SDDP nécessite une phase de rodage de la politique durant
les premières itérations. La durée de cette phase de rodage dépend de la longueur de l’horizon
de planification. Il s’agit de la seule limitation de SDDP.
Quant à ASDP, elle échantillonne l’espace des états parmi les sommets d’hyper-rectangles
crées en temps réel. Or, la gestion des réservoirs passe par des points à l’intérieur des hyper-
rectangles. Il faut donc raffiner le découpage de l’espace des états et donc couper plus encore
les hyper-rectangles. On risque alors d’augmenter énormément la complexité de la méthode et
la rendre proche de SDP. ASDP ne tient pas compte du processus stochastique des apports
pour échantillonner l’espace des états, son caractère récursif ne permet pas de faire des
simulations pour échantillonner.

7.3 Améliorations futures

Pour éviter les limitations de SDDP et de ASDP, nous proposons une méthode qui combine les
deux ASDP-SDDP. Notons H le nombre d’années de l’horizon (rallongé) de planification, une
façon de combiner les deux méthodes serait d’initialiser les coupes des h (h ≤ H) dernières
années de l’horizon de planification par ASDP avec un nombre maximum d’échantillons Dmax
raisonnable (si 4 réservoirs comme le cas d’étude du chapitre 6, prendre par exemple Dmax =
1000 ou 2000), ensuite lancer SDDP sur tout l’horizon. Le cas de h = H est particulièrement
intéressant. En se faisant, SDDP convergerait plus rapidement et ne nécessiterait pas de phase
de rodage. Ainsi, on éviterait le rodage de SDDP et on profiterait de son échantillonnage
efficace de l’espace des états.
Une amélioration possible de ASDP serait de pondérer le volume d’erreur par la probabilité
du cas d’apport associé. Ceci permettrait un échantillonnage plus cohérent avec le processus
stochastique d’apport.
92

RÉFÉRENCES

T. Aouam et Z. Yu, “Multistage stochastic hydrothermal scheduling”, dans IEEE Interna-


tional Conference on Electro/Information Technology. IEEE, 2008, pp. 66–71.

T. Archibald, K. McKinnon, et L. Thomas, “An aggregate stochastic dynamic programming


model of multireservoir systems”, Water Resources Research, vol. 33, no. 2, pp. 333–340,
1997.

T. Archibald, C. Buchanan, K. McKinnon, et L. Thomas, “Nested benders decomposition


and dynamic programming for reservoir optimisation”, Journal of the Operational Research
Society, vol. 50, no. 5, pp. 468–479, 1999.

R. E. Bellman, Dynamic programming. Princeton University Press, 1957.

J. F. Benders, “Partitioning procedures for solving mixed-variables programming problems”,


Numerische Mathematik, vol. 4, no. 1, pp. 238–252, 1962.

D. P. Bertsekas, Dynamic Programming and Optimal Control, Volume I, 3e éd. Athena


Scientific, 2005.

——, Dynamic Programming and Optimal Control, Volume II, 4e éd. Athena Scientific,
2012.

J. R. Birge et F. Louveaux, Introduction to stochastic programming. Springer Science &


Business Media, 2011.

M. Breton, S. Hachem, et A. Hammadia, “A decomposition approach for the solution of the


unit loading problem in hydroplants”, Automatica, vol. 38, no. 3, pp. 477–485, 2002.

——, “Accounting for losses in the optimization of production of hydroplants”, IEEE Tran-
sactions on Energy Conversion, vol. 19, no. 2, pp. 346–351, 2004.

P.-L. Carpentier, M. Gendreau, et F. Bastin, “Long-term management of a hydroelectric


multireservoir system under uncertainty using the progressive hedging algorithm”, Water
Resources Research, vol. 49, no. 5, pp. 2812–2827, 2013.

——, “Managing hydroelectric reservoirs over an extended horizon using benders decom-
position with a memory loss assumption”, IEEE Transactions on Power Systems, vol. 30,
no. 2, pp. 563–572, 2015.
93

C. Cervellera, V. C. Chen, et A. Wen, “Optimization of a large-scale water reservoir network


by stochastic dynamic programming with efficient state space discretization”, European
Journal of Operational Research, vol. 171, no. 3, pp. 1139–1151, 2006.

C. Cervellera, A. Wen, et V. C. Chen, “Neural network and regression spline value function
approximations for stochastic dynamic programming”, Computers & Operations Research,
vol. 34, no. 1, pp. 70–90, 2007.

V. L. de Matos, A. B. Philpott, et E. C. Finardi, “Improving the performance of stochastic


dual dynamic programming”, Journal of Computational and Applied Mathematics, vol. 290,
pp. 196 – 208, 2015.

A. L. Diniz, F. Costa, A. L. Pimentel, L. Xavier, et M. Maceira, “Improvement in the hydro


plants production function for the mid-term operation planning model in hydrothermal
systems”, dans International Conference on Engineering Optimization. Citeseer, 2008.

A. L. Diniz et M. E. P. Maceira, “A four-dimensional model of hydro generation for the


short-term hydrothermal dispatch problem considering head and spillage effects”, IEEE
Transactions on Power Systems, vol. 23, no. 3, pp. 1298–1308, 2008.

J. Dupačová, G. Consigli, et S. W. Wallace, “Scenarios for multistage stochastic programs”,


Annals of Operations Research, vol. 100, no. 1-4, pp. 25–53, 2000.

M. El-Hawary et K. Ravindranath, “Hydro-thermal power flow scheduling accounting for


head variations”, IEEE Transactions on Power Systems, vol. 7, no. 3, pp. 1232–1238, 1992.

A. Gjelsvik, B. Mo, et A. Haugstad, “Long-and medium-term operations planning and


stochastic modelling in hydro-dominated power systems based on stochastic dual dynamic
programming”, dans Handbook of Power Systems I. Springer, 2010, pp. 33–55.

Q. Goor, C. Halleux, Y. Mohamed, et A. Tilmant, “Optimal operation of a multipurpose


multireservoir system in the eastern nile river basin”, Hydrology and Earth System Sciences,
vol. 14, no. 10, pp. 1895–1908, 2010.

Q. Goor, R. Kelman, et A. Tilmant, “Optimal multipurpose-multireservoir operation model


with variable productivity of hydropower plants”, Journal of Water Resources Planning and
Management, vol. 137, no. 3, pp. 258–267, 2010.

T. Halliburton et al., “An optimal hydrothermal planning model for the new zealand power
system”, Australian Journal of Electrical & Electronics Engineering, vol. 1, no. 3, p. 193,
2004.
94

A. Hammadia, “Contributions à l’optimisation, en temps réel et à court terme, des ressources


hydroélectriques d’une rivière”, Thèse de doctorat, École Polytechnique de Montréal, Mont-
réal, QC, Canada, 2000.

T. Homem-de Mello, V. L. de Matos, et E. C. Finardi, “Sampling strategies and stopping


criteria for stochastic dual dynamic programming : a case study in long-term hydrothermal
scheduling”, Energy Systems, vol. 2, no. 1, pp. 1–31, 2011.

W.-C. Huang, R. Harboe, et J. J. Bogardi, “Testing stochastic dynamic programming models


conditioned on observed or forecasted inflows”, Journal of Water Resources Planning and
Management, vol. 117, no. 1, pp. 28–36, 1991.

S. A. Johnson, J. R. Stedinger, C. A. Shoemaker, Y. Li, et J. A. Tejada-Guibert, “Nume-


rical solution of continuous-state dynamic programs using linear and spline interpolation”,
Operations Research, vol. 41, no. 3, pp. 484–500, 1993.

C. R. P. Jr et P. K. Kitanidis, “Limitations of deterministic optimization applied to reservoir


operations”, Journal of Water Resources Planning and Management, vol. 125, no. 3, pp.
135–142, 1999.

M. Karamouz et M. H. Houck, “Comparison of stochastic and deterministic dynamic pro-


gramming for reservoir operating rule generation”, Journal of the American Water Resources
Association, vol. 23, no. 1, pp. 1–9, 1987.

M. Karamouz et H. V. Vasiliadis, “Bayesian stochastic optimization of reservoir operation


using uncertain forecasts”, Water Resources Research, vol. 28, no. 5, pp. 1221–1232, 1992.

M. Karamouz, M. H. Houck, et J. W. Delleur, “Optimization and simulation of multiple


reservoir systems”, Journal of Water Resources Planning and Management, vol. 118, no. 1,
pp. 71–81, 1992.

S. Krau, G. Émiel, J. Merleau, et R. Leconte, “Adaptive discretization of the state space for
stochastic dynamic programming applied to multi-reservoir system”, 2015, Manuscrit non
publié.

T. Kristiansen, “Financial risk management in the electric power industry using stochastic
optimization”, Advanced Modeling and Optimization, vol. 6, no. 2, pp. 17–24, 2004.

J. W. Labadie, “Optimal operation of multireservoir systems : state-of-the-art review”,


Journal of Water Resources Planning and Management, vol. 130, no. 2, pp. 93–111, 2004.
95

M. E. P. Maceira, V. S. Duarte, D. D. J. Penna, L. A. M. Moraes, et A. C. G. Melo, “Ten


years of application of stochastic dual dynamic programming in official and agent studies in
brazil-description of the newave program”, 16th PSCC, Glasgow, Scotland, pp. 14–18, 2008.

A. Magnani et S. P. Boyd, “Convex piecewise-linear fitting”, Optimization and Engineering,


vol. 10, no. 1, pp. 1–17, 2009.

B. Mo, A. Gjelsvik, et A. Grundt, “Integrated risk management of hydro power scheduling


and contract management”, IEEE Transactions on Power Systems, vol. 16, no. 2, pp. 216–
221, 2001.

M. V. F. Pereira et L. M. V. G. Pinto, “Application of decomposition techniques to the


mid-and short-term scheduling of hydrothermal systems”, IEEE Transactions on Power
Apparatus and Systems, no. 11, pp. 3611–3618, 1983.

M. Pereira, N. Campodonico, et R. Kelman, “Application of stochastic dual dp and exten-


sions to hydrothermal scheduling”, PSRI Technical Report, 1999.

M. V. F. Pereira et L. M. V. G. Pinto, “Multi-stage stochastic optimization applied to


energy planning”, Mathematical Programming, vol. 52, no. 1-3, pp. 359–375, 1991.

A. B. Philpott et V. L. de Matos, “Dynamic sampling algorithms for multi-stage stochastic


programs with risk aversion”, European Journal of Operational Research, vol. 218, no. 2,
pp. 470–483, 2012.

A. B. Philpott et Z. Guan, “On the convergence of stochastic dual dynamic programming


and related methods”, Operations Research Letters, vol. 36, no. 4, pp. 450–455, 2008.

R. J. Pinto, C. L. Borges, et M. E. Maceira, “An efficient parallel algorithm for large scale
hydrothermal system operation planning”, IEEE Transactions on Power Systems, vol. 28,
no. 4, pp. 4888–4896, 2013.

D. Rani et M. M. Moreira, “Simulation–optimization modeling : a survey and potential


application in reservoir systems operation”, Water Resources Management, vol. 24, no. 6,
pp. 1107–1138, 2010.

T. Røtting, A. Gjelsvik et al., “Stochastic dual dynamic programming for seasonal scheduling
in the norwegian power system”, IEEE Transactions on Power Systems, vol. 7, no. 1, pp.
273–279, 1992.
96

M. Saad, A. Turgeon, P. Bigras, et R. Duquette, “Learning disaggregation technique for the


operation of long-term hydroelectric power systems”, Water Resources Research, vol. 30,
no. 11, pp. 3195–3202, 1994.

T. N. D. Santos et A. L. Diniz, “A new multiperiod stage definition for the multistage


benders decomposition approach applied to hydrothermal scheduling”, IEEE Transactions
on Power Systems, vol. 24, no. 3, pp. 1383–1392, 2009.

A. Shapiro, “Analysis of stochastic dual dynamic programming method”, European Journal


of Operational Research, vol. 209, no. 1, pp. 63–72, 2011.

J. R. Stedinger, B. F. Sule, et D. P. Loucks, “Stochastic dynamic programming models for


reservoir operation optimization”, Water Resources Research, vol. 20, no. 11, pp. 1499–1505,
1984.

J. A. Tejada-Guibert, S. A. Johnson, et J. R. Stedinger, “Comparison of two approaches for


implementing multireservoir operating policies derived using stochastic dynamic program-
ming”, Water Resources Research, vol. 29, no. 12, pp. 3969–3980, 1993.

——, “The value of hydrologic information in stochastic dynamic programming models of


a multireservoir system”, Water Resources Research, vol. 31, no. 10, pp. 2571–2579, 1995.

A. Tilmant, L. Beevers, et B. Muyunda, “Restoring a flow regime through the coordinated


operation of a multireservoir system : The case of the zambezi river basin”, Water Resources
Research, vol. 46, no. 7, 2010.

A. Tilmant et R. Kelman, “A stochastic approach to analyze trade-offs and risks associated


with large-scale water resources systems”, Water resources research, vol. 43, no. 6, 2007.

A. Turgeon, “Optimal operation of multireservoir power systems with stochastic inflows”,


Water Resources Research, vol. 16, no. 2, pp. 275–283, 1980.

——, “A decomposition method for the long-term scheduling of reservoirs in series”, Water
Resources Research, vol. 17, no. 6, pp. 1565–1570, 1981.

——, “Stochastic optimization of multireservoir operation : The optimal reservoir trajectory


approach”, Water Resources Research, vol. 43, no. 5, 2007.

A. Turgeon et R. Charbonneau, “An aggregation-disaggregation approach to long-term re-


servoir management”, Water Resources Research, vol. 34, no. 12, pp. 3585–3594, 1998.
97

S. Yakowitz, “Dynamic programming applications in water resources”, Water Resources


Research, vol. 18, no. 4, pp. 673–696, 1982.

W. W.-G. Yeh, “Reservoir management and operations models : A state-of-the-art review”,


Water Resources Research, vol. 21, no. 12, pp. 1797–1818, 1985.
98

ANNEXE A REPRÉSENTATION DES FONCTIONS CONCAVES


LINÉAIRES PAR MORCEAUX DANS LES MODÈLES LINÉAIRES

Dans cet annexe, on explose plusieurs approches équivalentes pour représenter une fonction
concave linéaire par morceaux dans un modèle linéaire de maximisation.
Considérons une fonction concave linéaire par morceaux x 7→ y (figure A.1)

y3
y4
y2

y1

y0

x0 x1 x2 x3 x4 x

Figure A.1 Une fonction concave linéaire par morceaux

On a pour x0 ≤ x ≤ x4

4
X 4
X
y (x) = max λi yi = y0 + max aj svj = max z
λ sv z
i=0 j=1
4
X 4
X
s.à λ i xi = x s.à svj = x − x0 s.à z ≤ aj x + bj , j = 1 .. 4
i=0 j=1
4
X
λi = 1 svj ≤ xj − xj−1 , j = 1 .. 4
i=0

λ≥0 sv ≥ 0
Où aj et bj sont respectivement la pente et l’ordonnée à l’origine du j e plan affine correspon-
dant au j e morceau.
Si, dans un modèle de programmation linéaire complexe, on utilise deux variables Y et X et
99

que l’on souhaite que Y = y (X), il faut s’assurer que pour une valeur fixe de la variable X
le modèle va aller chercher la plus grande valeur possible de Y . Si c’est le cas il suffit alors
d’incorporer un des ensembles de contraintes (équivalents) parmi les suivants


4 
 X 4
Y = λi y i

  X
Y = y0 + aj svj

 

 

 i=0 



 4


 j=1
4
 X 
X= λ i xi

 
 X n
i=0 ≡ X = x0 + svj ≡ Y ≤ aj X + bj , j = 1 .. 4
4 j=1

 


 X 




 λi = 1 


 svj ≤ xj − xj−1 , j = 1 .. 4
 
 i=0 
sv ≥ 0

 

λ≥0

Dans le modèle de planification de la production d’hydroélectricité qu’on traite dans ce


mémoire, il est question de maximiser la production totale. Ainsi,
– les contraintes de type p = pc (q) sont exactes ;
– les contraintes de type lru = lr (v) sont aussi exactes car, à un débit donné, plus le niveau
du réservoir r est grand plus la centrale associée à r produit d’électricité.

Remarque :
Le développement précédent s’est fait pour un nombre de morceaux égal à 4. Il reste généra-
lisable à un nombre de morceaux quelconque.

Vous aimerez peut-être aussi