Vous êtes sur la page 1sur 197

UNIVERSITÉ DES ANTILLES ET DE LA GUYANE

THÈSE
Présentée en vue d’obtenir le titre de

Docteur de L’Université des Antilles et de la Guyane

Spécialité : ENERGETIQUE

par

Stéphanie MONJOLY

Titre

OUTILS DE PREDICTION POUR LA PRODUCTION


D’ELECTRICITE D’ORIGINE EOLIENNE
Application à l’optimisation du couplage aux réseaux de distributions
d’électricité.

N : [13AGUY0679]

Soutenue le 16 Décembre 2013

Composition du Jury

M. Philippe POGGI Professeur à l’Université de Corse, Rapporteur, Président du Jury


M. Philippe LAURET Professeur à l’Université de la Réunion, Rapporteur
M. Laurent BELLEMARE Directeur de l’Agence Martiniquaise de l’énergie, Examinateur
M. Ruddy BLONBOU Maitre de Conférences à l’Université des Antilles et de la Guyane, Examinateur
M. Narcisse ZAHIBO Professeur à l’Université des Antilles et de la Guyane, Directeur de thèse
“¡Vivir con miedo es como vivir a medias!”

2
Remerciements

Merci au Professeur Narcisse ZAHIBO pour sa disponibilité et son accueil au sien du


Laboratoire de recherches en Géoscience et Energie. Je tiens également à le remercier pour
la sympathie qu’il m’a témoignée au cours de ces années de thèse.

Merci à M Ruddy BLONBOU d’avoir accepté d’encadrer cette thèse et dont l’aide précieuse
a été indispensable sur le plan scientifique. Je tiens également à le remercié pour la patience
et la sympathie dont il a fait preuve au cours de ces années.

Merci aux professeurs Philippe LAURET et Philippe POGGI des Universités de La Réunion
et de Corse d’avoir accepté d’être membre du Jury et rapporteurs.

Merci à M Laurent BELLEMARE d’avoir accepté d’être membre du Jury.

Merci à tous les membres du Laboratoire LaRGE de m’avoir si bien accueilli, tout
particulièrement ceux du groupe Energie, Ted Soubdhan, Rudy Calif, Jean-Louis Bernard et
Frédéric Dupont.

Je remercie également LA RÉGION MARTINIQUE et l’ADEME, d’avoir pris part à cette


thèse en finançant mes travaux de recherches.

Merci à tous les doctorants et post-doc que j’ai côtoyé durant ma thèse :
A Maïna, j’avais rarement eu le privilège de discuter gastronomie avec une personne aussi
passionnée que moi, Merci !!!!
A Sandrine et Jean- François pour tous les bons moments passés ensemble.
A Raphaël, toujours prêt à défendre nos droits !!
A Thomas, Vanessa, Christophe, Frédéric ….

Voy a agradecer una persona que no me conoce, pero esto no tiene importancia. Muchas
gracias a JCF que me ayudό a soportar todos estos años de estudios. Cada temporada de tu
carera fue un placer y un viaje magnifico!!

Pour finir, le plus important, MERCI à mes parents et à ma sœur pour tout l’amour et le
soutient que vous me portez et pour toutes vos prières qui m’ont accompagnées, je vous aime
infiniment !!!

3
RÉSUME

La forte variabilité de la vitesse du vent fait que l’énergie produite par un parc éolien n’est pas
constante dans le temps. Le gestionnaire ne peut donc pas dimensionner son réseau électrique
en prenant intégralement ce type de production en compte. L’une des solutions préconisées
pour permettre le développement de l’éolien et son intégration avec une plus grande sureté
aux réseaux, est de développer et d’améliorer les outils de prévisions. Le travail de thèse
consiste à améliorer les performances d’un outil de prédiction basé sur les réseaux de
neurones bayesiens, permettant la prédiction de la puissance à très court terme. Le prédicteur
fonctionne notamment par l’ajustement de paramètres, certain se détermine
« automatiquement » via le mécanisme des réseaux de neurones bayesiens d’autres, que nous
nommerons paramètres temporels, sont à l’appréciation de l’utilisateur. Le travail mené
consiste à établir un protocole pour la fixation de ces paramètres tout en améliorant les
performances du prédicteur. Nous avons donc décidé de conditionner leurs valeurs en
fonction de la variabilité des séquences de puissance précédent l’instant de prévision. Tout
d’abord nous avons classé des séquences de puissance en fonction de leurs coefficients de
variation en appliquant la méthode des C-moyennes floues. Puis, chaque classe formée a été
testées sur plusieurs valeurs de paramètres, les valeurs associées aux meilleures prédictions
ont été retenues. Enfin, ces résultats couplés au formalisme des Chaines de Markov, par le
biais de la matrice de transition, ont permis d’obtenir des taux d’amélioration par rapport à la
persistance allant de 7,73 à 23,22 % selon l’horizon de prédiction considéré.

4
ABSTRACT

The high variability of the wind speed has for consequences that the energy produced by a
wind farm is not constant over time. Therefore, the manager can't size the electrical network
by taking into account this type of production. One solution advocated for the development of
wind energy and its integration with greater security at network, is to develop and improve
forecasting tools. The thesis objective is to improve the performance of a prediction tool
based on Bayesian neural networks, allowing the prediction of wind power for short
timescales. The predictor works, in particular, by the adjustment of parameters, some is
determined "automatically" through the mechanism of neural networks Bayesian other ,
which we call temporal parameters are at the discretion of the user. The work involves
establishing a protocol for the determination of these parameters and improving the
performance of the predictor. So, we decided to condition their values depending on the
sequence variability of wind power previous the moment of the forecast. First we classified
sequences of power according to their coefficients of variation using the method of fuzzy C -
means. Then, each formed class was tested for several parameters values, the values
associated with the best predictions were selected. Finally, these results coupled with the
formalism of Markov chains, through the transition matrix allowed to obtain rates of
improvement over the persistence ranging from 7.73 to 23.22 % depending on the prediction
horizon considered.

5
Tables des matières

Introduction Générale ......................................................................................... 18


CHAPITRE 1 : Contexte énergétique de la Martinique et la
Guadeloupe. ........................................................................................................................ 25
1.1 Situation géographique et climatique de la Martinique et de la Guadeloupe. ......... 25
1.2 Situation énergétique de la Martinique et de la Guadeloupe ........................................... 27
1.3 Les énergies renouvelables en Guadeloupe ...................................................................... 29
1.3.1 Etats des lieux et limites d’intégration des énergies renouvelables dans l’Archipel
Guadeloupéen. ...................................................................................................................... 29
1.3.2 Etat des lieux de l’éolien dans l’Archipel Guadeloupéen ......................................... 31
Conclusion ................................................................................................................................. 34
CHAPITRE 2 :Analyse de la Vitesse du Vent et de la Puissance
EN SORTIE DE FERmES DaNS L’aRChIpEL GuaDELOupéEN ...................... 36
Introduction ............................................................................................................................... 36
2.1 Transmission des données du site de Petit Canal ............................................................ 36
2.2 Analyse statistique de la vitesse du vent. .......................................................................... 38
2.2.1 Fonction de répartition et distribution de la vitesse du vent. .................................... 39
2.2.2 La distribution de Weibull .......................................................................................... 41
2.3 Analyse de la puissance en sortie de fermes : site de Petit-Canal ................................... 46
2.3.1 Comparaison des évolutions de période de la vitesse de vent et de la puissance.... 46
2.3.3 Détermination de la Fonction de transfert probabiliste d’un groupe
d’aérogénérateurs. ................................................................................................................. 50
Conclusion ..................................................................................................................................... 52

6
CHAPITRE 3 :ETaT DE L’aRT DE La pRévISION à COuRT TERmE
DaNS LE DOmaINE DE L’éOLIEN ............................................................................... 54
Introduction ............................................................................................................................... 54
3.1 L’horizon de prédiction. ..................................................................................................... 55
3.2 Le processus autorégressif à moyenne mobile ARMA .................................................... 56
3.2.1 Principe ........................................................................................................................ 56
3.2.2 Résultats bibliographiques obtenus par application de l’autorégression pour la
prévision dans le domaine éolien. ........................................................................................ 57
3.3 Les filtres de Kalman.......................................................................................................... 58
3.3.1 Principe ........................................................................................................................ 58
3.3.2 Résultats bibliographiques obtenus par application du filtre de Kalman pour la
prévision dans le domaine éolien. ........................................................................................ 59
3.4 Les réseaux de neurones artificiels .................................................................................... 60
3.4.1 Principe ........................................................................................................................ 60
3.4.2 Résultats bibliographiques obtenus par application des réseaux de neurones pour la
prévision dans le domaine éolien. ........................................................................................ 61
3.5 Les méthodes basées sur les Prévisions Météorologiques Numériques (NWP) ............. 64
3.5.1 Principe ........................................................................................................................ 64
3.5.2 Résultats bibliographiques obtenus par utilisation des prévisions météorologiques
numériques comme entrées de modèles de prévision dans le domaine éolien. ................ 66
3.6 Autre méthodes ................................................................................................................... 67
Conclusion ................................................................................................................................. 69
CHAPITRE 4 :Les Réseaux de Neurones Bayesiens .................................. 71
Introduction ............................................................................................................................... 71
4.1 Le Perceptron multicouche ................................................................................................ 72
4.2 Apprentissage du réseau de neurones ................................................................................ 75
4.2.1 La méthode de la descente du gradient ...................................................................... 77
4.2.2 La méthode du gradient conjugué .............................................................................. 78
4.2.3 La méthode de quasi-Newton ..................................................................................... 78
4.2.4 La méthode de Levenberg- Marquardt...................................................................... 78
4.3 Le formalisme Bayesien ..................................................................................................... 79

7
4.3.1 Probabilité jointes, conditionnelles et marginales. .................................................... 79
4.3.2 Réseau de neurones bayesiens (RNB) ....................................................................... 81
4.3.2.1 La vraisemblance P D ,  , H ....................................................................... 82

4.3.2.2 Distribution a priori des poids synaptiques et des biais P   , H ................. 83

4.3.2.3 Distribution a postériori des paramètres : P( D,  ,  , H ) ............................... 84

4.3.2.4 La structure de l’évidence P D  ,  , H .......................................................... 85

4.3.2.5 La méthode « Automatic Relevance Determination (ARD) » .......................... 88


4.3.3 Détermination de l’intervalle de confiance en sortie de réseau ................................ 88
Conclusion ................................................................................................................................. 89
CHAPITRE 5 :MODÈLE DE PRÉVISION DE LA PUISSANCE ÉOLIENNE...... 90
À COURT-TERME ................................................................................................................. 90
Introduction ............................................................................................................................... 90
5.1 Le modèle prévision à cout-terme ..................................................................................... 91
5.1.1 Précision sur les paramètres du prédicteur ................................................................ 92
5.1.2 Prétraitement des données .......................................................................................... 93

5.1.3 Indicateur de performance du prédicteur : improvRMSE et improvMAE ............ 98


5.2 Détermination du nombre d’entrées du réseau de neurones prédicteur. ....................... 100

5.3 Sensibilité de la performance du prédicteur par rapport aux paramètres Tlong _ mem et

Tshort _ mem . .............................................................................................................................. 103


5.3.1 L’erreur de prédiction ............................................................................................... 104
5.3.2 L’intervalle de confiance de la prévision ................................................................. 106
5.3.3 Les taux d’amélioration par rapport à la persistance : improvMAE et improv RMSE . ... 107
5.4 Sensibilité de la performance du schéma de prévision par rapport aux conditions de
vent........................................................................................................................................... 109
Conclusion ............................................................................................................................... 119
CHAPITRE 6 :Classification des séquences de puissance ............. 120
Introduction ............................................................................................................................. 120
6.1 La méthode des C-moyennes floues ................................................................................ 120

8
6.2 Classification des séquences de puissance éolienne ....................................................... 122
6.3 Détermination et stationnarité des centres de classes ..................................................... 129
6.4 La méthodologie des Chaines de Markov ....................................................................... 133
Conclusion ............................................................................................................................... 135
CHAPITRE 7 :Influence des régimes de variation des
séquences de puissance sur le paramétrage du prédicteur137
Introduction ............................................................................................................................. 137
7.1 Méthodologie pour le calcul du couple ( Tshort _ mem , Tlong _ mem ) optimal........................... 137

7.2 Résultats ............................................................................................................................ 139


7.2.1 Recherche de Tshort _ mem optimal pour Tlong _ mem fixé à 12heures. ............................ 139

7.2.1.1 « Etat de départ » faiblement variable .............................................................. 139


7.2.1.2 « Etat de départ » moyennement variable ........................................................ 147
7.2.1.3 Etat de départ « fortement variable» ................................................................. 152
7.2.2 Généralisation de l’analyse pour Tlong mem = 9 et 18 heures. .................................. 153

7.2.3 Tableau Récapitulatif des résultats ........................................................................... 158


7.3 Sélection des paramètres optimaux conditionnée aux régimes de variation. ................ 159
7.3.1 Méthodes d’utilisation conjointes de la matrice de transitions et des couples de
paramètres optimaux ( Tshort _ mem , Tlong _ mem )....................................................................... 159

7.3.2 Résultats ..................................................................................................................... 160


7.3.3 Nouveau schéma de prédiction ................................................................................. 166
Conclusion ............................................................................................................................... 168
CHAPITRE 8 :APPLICATIONS - perspectives ................................................... 169
Introduction ............................................................................................................................. 169
8.1 Protocole du processus de prédiction en temps réel dans le cadre du projet ANEMOS
Plus........................................................................................................................................... 169
8.1.1 Le Project ANEMOS.Plus ........................................................................................ 169
8.1.2 Modèle de prévision en temps réel ........................................................................... 170
8.2 Gestion dynamiques du stockage pour l’intégration de l’électricité d’origine éolienne au
réseau. ...................................................................................................................................... 174
Conclusion ............................................................................................................................... 176

9
CONCLUSION GÉNÉRALE .............................................................................................. 177
Annexe 1 ............................................................................................................................... 182
ANNEXE 2 ............................................................................................................................... 186
BIBLIOGRAPHIE................................................................................................................... 188

10
Tables des Figures

Figure I- 1 : Structure de la production d'électricité mondiale en 2009................................... 20


Figure I-2 : Structure de la production d'électricité mondiale d'origine renouvelable en 2009
........................................................................................................................................................ 21

Figure 1-1 : Situation géographique de la Martinique et de la Guadeloupe dans la Caraïbe 25


Figure 1-2 : Circulation atmosphérique...................................................................................... 26
Figure 1-3 : Répartition des énergies renouvelables en Guadeloupe en 2010 ......................... 29
Figure 1-4 : Evolution de la puissance éolienne installée en Guadeloupe [7,9] ..................... 31
Figure 1- 5 : Répartition des fermes éoliennes de l'archipel Guadeloupéen ............................ 33
Figure 1-6 : Schéma de la bascule des éoliennes guadeloupéennes ......................................... 34

Figure 2-1 : Localisation de Petit Canal dans l'archipel guadeloupéen .................................. 37


Figure 2-2 : Chaine te transmission des données de Petit Canal [11] ..................................... 38
Figure 2-3 : Signal de vitesse de vent mesurée sur le site de Petit Canal................................. 39
Figure 2-4 : Fonction de répartition du signal de vitesse mesuré ............................................. 40
Figure 2-5 : Densité de probabilité du signal de vitesse de vent mesuré .................................. 41
Figure 2-6 Comparaison des densités de probabilités de Weibull pour chaque mois de
mesures .......................................................................................................................................... 44
Figure 2-7 : Signal de Puissance en sortie de ferme mesuré à Petit Canal .............................. 46
Figure 2-8 : Densité spectrale de la vitesse du vent et de la puissance électrique .................. 47
Figure 2-9 : Cohérence entre la vitesse du vent et la puissance en sortie de ferme ................ 48
Figure 2-10 : Gain de la fonction de transfert entre la vitesse du vent et la puissance
électrique ....................................................................................................................................... 49

11
Figure 2-11 : Gain de la fonction de transfert entre la vitesse du vent et la puissance
électrique ....................................................................................................................................... 50
Figure 2-12 Fonction de transfert expérimentale ....................................................................... 51
Figure 2-13 : Fonction de transfert probabiliste de la puissance électrique ........................... 52

Figure 3-1 : Principe du filtre de Kalman discret ...................................................................... 58


Figure 3-2 : Schéma d'un neurone formel à x n entrées et une sortie y .................................... 60

Figure 4-1 : Schéma d'un perceptron multicouches avec une couche d'entrée ( l neurones), une
couche cachée (3 neurones) et une couche de sortie (1 neurone) ............................................. 73
Figure 4- 2 : Fonctions d'activation ............................................................................................ 74

Figure 5-1 : Modèle de prévision à court terme de la puissance éolienne [66] ....................... 92
Figure 5-2 : Signal de puissance moyenné sur 30 minutes ........................................................ 94
Figure 5-3 : Gain du signal moyenné (rouge) et non moyenné (bleu) ...................................... 95
Figure 5- 4 : Phase du signal moyenné (rouge) et non moyenné (bleu) ................................... 95
Figure 5-5 : Distribution de la puissance normalisée ................................................................ 97
Figure 5-6 : Différence (%) entre la cible et la persistance pour un horizon de prédiction de
20 minutes ...................................................................................................................................... 99
Figure 5-7 : improv MAE (a) et improv RMSE (b) en fonction du nombre d'entrées et de Tlong _ mem

avec Tshort _ mem fixé à 15 minutes ................................................................................................ 102

Figure 5-8 : improv MAE (a) et improv RMSE (b) en fonction du nombre d'entrées et de Tlong _ mem

avec Tshort _ mem fixé à 25 minutes ............................................................................................... 103

Figure 5-9 : Evolution de NMAE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de

prédiction de 5 minutes............................................................................................................... 104


Figure 5-10 : Evolution de NMAE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de

prédiction de 15 minutes............................................................................................................. 105


Figure 5-11 : Evolution de NRMSE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de

prédiction de 5 minutes............................................................................................................... 105

12
Figure 5-12 : Evolution de NRMSE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de

prédiction de 15 minutes............................................................................................................. 106


Figure 5-13 : Evolution de l'amplitude de l'intervalle de confiance en fonction de Tlong _ mem et

Tshort _ mem pour un horizon de 10 minutes ................................................................................... 107

Figure 5-14 : Evolution de improvMAE (a) et improv RMSE (b) en fonction de Tlong _ mem et Tshort _ mem

pour un horizon de 5 minutes ..................................................................................................... 108


Figure 5-15 : Echantillon complet utilisé pour la détermination des paramètres dans le cas 1
...................................................................................................................................................... 110
Figure 5-16 : improvMAE pour des horizons de 20 (a), 30 (b) et 40 minutes en fonction de

Tlong _ mem et pour différentes valeurs de Tshort _ mem ...................................................................... 112

Figure 5- 17 : improv RMSE pour des horizons de 20 (a), 30 (b) et 40 (c) minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem ...................................................................... 114

Figure 5-18 : Echantillon complet utilisé pour la détermination des paramètres dans le cas 2
...................................................................................................................................................... 115
Figure 5-19 : improvMAE pour des horizons de 20 (a), 30 (b) et 40 (c) minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem ....................................................................... 117

Figure 5-20 : improv RMSE pour des horizons de 20 (a), 30 (b) et 40 (c) minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem ....................................................................... 118

Figure 6-1 : Coefficient de variation en fonction de la puissance moyenne pour les


échantillons de puissance électrique de 12 heures ................................................................... 123
Figure 6-2 : Ecart (%) entre la valeur du coefficient de variation calculée sur une heure et
celle calculée sur 12 heures ....................................................................................................... 124
Figure 6-3 : Distribution des échantillons d'une heure (a) et 12 heures (b) en fonction de la
valeur du coefficient de variation. ............................................................................................. 125
Figure 6-4 : Séquence de puissance (a) et vitesse de vent associée (b) représentant un régime
faiblement turbulent, coefficient de variation ∈ [0,15%[ ....................................................... 126

13
Figure 6-5 : Séquence de puissance (a) et vitesse de vent associée (b) représentant un régime
moyennement turbulent, coefficient de variation ∈ [15,40%[ ............................................... 127
Figure 6-6 : Séquence de puissance (a) et vitesse de vent associée (b) représentant un régime
fortement turbulent, coefficient de variation ∈ [40,+100%[ ................................................. 127
Figure 6-7 : Nuage de points représentant la répartition des coefficients de variation des
échantillons de 12 heures. .......................................................................................................... 128
Figure 6-8 : Représentation des centres de classes calculés Tableau 6-1 .............................. 130
Figure 6-9 : Représentation des échantillons en fonction des 3 classes ................................. 131
Figure 6-10 : Schéma de la stratégie de prévision ................................................................... 132

Figure 7-1 : Fonction de répartition ......................................................................................... 138


Figure 7-2 : Fonction de répartition de improv RMSE pour la combinaison de transition C (3,1)
...................................................................................................................................................... 140
Figure 7-3 : Prévision de puissance pour une combinaison C (3,1) , un horizon de 5 minutes et
Tshort _ mem =5 minutes ................................................................................................................... 141

Figure 7-4 : Densité de probabilité de improv RMSE pour une combinaison C (3,2) et un horizon
de prédiction de 5 minutes.......................................................................................................... 142
Figure 7-5 : Fonction de répartition de improv RMSE pour une combinaison C (3,2) et un
horizon de prédiction de 15 minutes .......................................................................................... 143
Figure 7-6 : Densité de probabilité de improv RMSE pour une combinaison C (3,2) et un horizon
de prédiction de 15 minutes........................................................................................................ 143
Figure 7-7 : Prédiction pour un horizon d 5 minutes avec Tshort _ mem = 5 minutes pour une

combinaison de transition C (3,2) .............................................................................................. 144


Figure 7-8 : Prévision de la puissance pour un horizon de 10 minutes avec Tshort _ mem = 10

minutes pour une combinaison C (3,2) ....................................................................................... 145


Figure 7-9 : Fonction de répartition de improv RMSE pour la combinaison C (3,3) et un horizon
de prédiction de 5 minutes.......................................................................................................... 146
Figure 7- 10 : Prévision de la puissance avec un horizon de 15 minutes et Tshort _ mem = 5

minutes pour une combinaison C (3,3) ....................................................................................... 147

14
Figure 7- 11 : Fonction de répartition de improv RMSE pour la combinaison C(2,1) et un horizon
de prédiction de 5 minutes.......................................................................................................... 148
Figure 7-12 : Fonction de répartition de improv RMSE pour la combinaison C(2,1) et un horizon
de prédiction de 10 minutes........................................................................................................ 148
Figure 7-13 : Fonction de répartition de improv RMSE pour la combinaison C(2,1) et un horizon
de prédiction de 15 minutes........................................................................................................ 149
Figure 7-14 : Fonction de répartition de improv RMSE pour C (2,2) et un horizon de prédiction
de 10 minutes ............................................................................................................................... 150
Figure 7-15 : Prévision de la puissance avec un horizon de 10 minutes et Tshort _ mem = 30

minutes pour une combinaison C (2,2) ...................................................................................... 151


Figure 7-16 : Fonction de répartition de improv RMSE pour la combinaison de transition
C (1,1) et un horizon de prédiction de 5 minutes ........................................................................ 152
Figure 7-17 : Densité de probabilité, en bleu l'aire définie par l'équation (1) ...................... 153
Figure 7-18 : Comparaison des PDF de improv RMSE pour une combinaison C (2,3) et un
horizon de prédiction de 5 minutes ............................................................................................ 154
Figure 7-19 : Comparaison des PDF de improv RMSE pour une combinaison C (2,3) et un
horizon de prédiction de 10 minutes .......................................................................................... 155
Figure 7-20 : Comparaison des PDF de improv RMSE pour une combinaison C (1,1) et un
horizon de prédiction de 15 minutes. ......................................................................................... 156
Figure 7-21: Comparaison des PDF de pour une combinaison de transition C(1,3) et un
horizon de prédiction de 10 minutes .......................................................................................... 157
Figure 7-22 : Comparaison des résultats obtenus pour les 3 propositions : τ = 5 minutes .. 162
Figure 7-23 : Comparaison des résultats obtenus pour les 3 propositions: τ = 10 minutes 162
Figure 7- 24 : Comparaison des résultats obtenus pour les 3 propositions : τ = 15 minutes 163
Figure 7-25 : Comparaison des résultats obtenus pour les 3 propositions : τ = 5 minutes .. 164
Figure 7- 26 : Comparaison des résultats obtenus pour les 3 propositions τ = 10 minutes.. 165
Figure 7-27 : Comparaison des résultats obtenus pour les 3 propositions τ = 15 minutes... 165
Figure 7-28 : Nouveau processus du schéma de prévision ...................................................... 167

15
Figure 8-1 : Consortium ANEMOS.Plus ................................................................................... 170
Figure 8-2 : Mesures de puissance en sortie de ferme sur le site de Mahaudière pour la
journée du 9 septembre 2010 ..................................................................................................... 171
Figure 8-3 : Description du processus de prédiction en ligne [80] ........................................ 172
Figure 8-4 : Prévision de puissance pour la journée du 16 Décembre 2010 ......................... 173
Figure 8-5 : Puissance électrique prévue et injectée superposée à la puissance réelle [84,85]
...................................................................................................................................................... 175
Figure 8-6 : Evolution de la réserve d'énergie du système de stockage [84,85] .................... 176

16
Tables des tableaux

Tableau 1-1 : Situation énergétique de la Martinique en 2010 ................................................. 28


Tableau 1-2 : Situation énergétique de la Guadeloupe en 2010 ............................................... 28

Tableau 2- 1 : Caractéristiques de la vitesse de vent mesurée .................................................. 38


Tableau 2-2 : Paramètres de formes et d'échelles calculées pour chaque mois de mesure..... 43
Tableau 2-3 : Caractéristiques de la vitesse et de la direction du vent sur les 4 sites [16] .... 44

Tableau 5-1 : Valeurs du biais entre la valeur cible et la persistance pour différents horizons
de prédiction .................................................................................................................................. 99
Tableau 5-2 : Moyennes, écarts type et intensité de la turbulence de chaque échantillon
utilisé pour l'apprentissage en fonction de Tlong _ mem ................................................................ 111

Tableau 5-3 : Moyennes, écarts type et intensité de la turbulence de chaque échantillon utilisé
pour l'apprentissage en fonction de la longueur de Tlong _ mem .................................................. 115

Tableau 6-1 : Evolution des coordonnées des centres de classes............................................ 129


Tableau 6-2 : Pourcentage d’appartenance à chaque classe calculé sur la totalité de
l’échantillon................................................................................................................................. 131

Tableau 7-1 : Valeurs moyennes de improv RMSE pour la configuration C (3,1) et un horizon de
prédiction de 5 minutes............................................................................................................... 140
Tableau 7-2 : Evaluation de la prévision représentée sur la Figure 7-3 ................................ 141
Tableau 7-3 : Evaluation de la prévision représentée sur la Figure 7-7 ................................ 144
Tableau 7-4 : Evaluation de la prévision représentée sur la Figure 7-8 ................................ 145
Tableau 7- 5 : Valeurs moyennes de improv RMSE pour la configuration C (3,3) et un horizon de
prédiction de 5 minutes............................................................................................................... 146

17
Tableau 7- 6 : Evaluation de la prévision représentée Figure 7-10........................................ 147
Tableau 7-7 : improv RMSE (%) pour les trois horizons de prédiction dans le cas de la

combinaison de transition C (2,1) .............................................................................................. 149


Tableau 7- 8 : Valeurs moyennes de improv RMSE pour un horizon de prédiction de 15 minutes
...................................................................................................................................................... 150
Tableau 7-9 : Evaluation de la prévision présentée Figure 7-15 ............................................ 151
Tableau 7-10 : improv RMSE (%) pour les trois horizons de prédiction dans le cas de la

combinaison de transition C(2,3) ............................................................................................. 151


Tableau 7- 11 : improv RMSE pour la combinaison de transition C (1,1) suivant les différents et
pour un horizon de prédiction de 5 minutes .............................................................................. 152
Tableau 7-12 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison
C (2,3) et un horizon de prédiction de 5 minutes....................................................................... 155

Tableau 7-13 : Comparaison des valeurs moyennes de Im provRMSE pour une combinaison

C (2,3) et un horizon de prédiction de 10 minutes..................................................................... 155


Tableau 7-14 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison et
un horizon de prédiction de 15 minutes..................................................................................... 157
Tableau 7-15 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison de

transition C(1,3) et un horizon de prédiction de 10 minutes .................................................... 158

Tableau 7-16 : Tableau regroupant les couples ( Tshort _ mem , Tlong _ mem ) optimaux selon les

transitions de régimes de puissance et les horizons de prédiction .......................................... 158


Tableau 7- 17 : Paramètres pondérés pour les régimes de puissance de type C(3, y) ........... 161
Tableau 7-18 : Comparaison des performances du modèle de prévision en fonction des 3
propositions pour un horizon de prédiction de 15 minutes ...................................................... 161
Tableau 7-19 : Paramètres pondérés pour les régimes de puissance de type C(2, y) ............ 163
Tableau 7- 20 : Comparaison des performances du modèle en fonction des trois propositions
pour un horizon de prédiction de 10 minutes ............................................................................ 164

Tableau 8-1 : Evaluation de la prédiction fournie pour la journée du 16 Décembre 2010... 173

18
Introduction Générale

En ce début de 21 ème siècle, nous sommes confrontés au réchauffement climatique dû


notamment à l’augmentation du taux de rejet de gaz à effet de serre dans l’atmosphère. En
effet, selon le rapport de l’académie des sciences [1], les changements climatiques semblent
s’être accélérés au cours des dernières décennies.
La température de la surface de la terre a augmentée de 0,8 ± 0,2 °C depuis 1870 et le niveau
des océans a connu une hausse de 0,7 mm/an entre 1870 et 1930 pour passer à +1,7 mm/an
depuis 1930 et arriver à une hausse de 3,4 mm/an depuis 1992.
Cette élévation est due, pour un tiers à la dilatation de l’océan, conséquence du réchauffement
et pour deux tiers à la fonte des glaces.
L’un des principaux facteurs de ce réchauffement est l’augmentation des concentrations
atmosphériques des gaz à effet de serre et notamment de dioxyde de carbone. La
concentration de dioxyde de carbone, à cause de l’activité industrielle, augmente
régulièrement depuis les années 1850. Le taux mesuré en 2009 était de 388 ppm (partie par
million) contre 280 ppm en 1870. L’augmentation résulte pour moitié de l’utilisation des
combustibles fossiles, l’autre moitié étant due au déboisement et à la production de ciment.
Ce changement de concentration de dioxyde de carbone dans l’atmosphère se traduit par une
augmentation du rayonnement infrarouge émis par le sol. Si le taux de CO² atmosphérique
venait à doubler, cette augmentation serait évaluée à 3,7 ± 0,1 W/m².
Compte tenu du fait que la population mondiale est passée de 2,519 milliards d’individus en
1950 à 6,465 milliards en 2005, cette explosion démographique entraîne donc indéniablement
une augmentation de la consommation d’énergie électrique.
Or, selon l’agence Internationale de l’énergie [2], les émissions de CO² dues à l’énergie
[émissions de la combustion d’énergies fossile pour un usage final (transport, chauffage)
(production d’électricité, raffinage de pétrole)] ont augmenté de 40,1 % entre 1990 et 2008
dans le monde et de 4,5 % en France sur la même période.

19
Introduction Générale

A ce jour, 80,9 % de l’énergie produite l’est à l’aide de sources non-renouvelables (pétrole,


gaz naturel charbon) or, certaines de ces ressources seront bientôt épuisées. En effet, selon le
Centre de Géologie des Etats-Unis, étant donné la consommation actuelle il n’y aura plus de
pétrole d’ici 2050, plus de gaz naturel d’ici 2072 et plus de Charbon d’ici 2158.
L’utilisation des énergies renouvelables est donc une solution indispensable qui permet de
sécuriser l’approvisionnement en énergie, de réduire les niveaux de pollution associés à la
production d’énergie d’origine fossile et de ralentir voire pallier l’épuisement des ressources
non renouvelables.
D’après le douzième inventaire (Edition 2010) de la production d’électricité d’origine
renouvelable dans le monde, la production d’électricité renouvelable atteint en 2009 les
3810,3 TWh soit 19,1% de la production mondiale.
Ce qui reste encore largement faible par rapport à la production d’origine fossile mais
supérieure au nucléaire (Figure I-1).
On remarque (Figure I-2) que c’est l’électricité d’origine hydraulique qui produit le plus en
2009 avec 84,3% de l’électricité d’origine renouvelable.

16.1 %

Géothermie 0.3 %
Eolien 1.3 %
Biomasse 1.2 %
Dechets non renouveables 0.2 %
13.5 % Solaire 0.1 %
Hydraulique
Nucléaire
Fossiles

67.2 %

Figure I- 1 : Structure de la production d'électricité mondiale en 2009

20
Introduction Générale

7% 1.7 %

6.3 %

0.6 %

Géothermie
Eolien
Biomasse
Solaire
Hydraulique
Energie marine 0.01 %

84.3 %

Figure I-2 : Structure de la production d'électricité mondiale d'origine renouvelable en 2009

Dans le travail de thèse, nous nous intéresserons plus particulièrement à la seconde source de
production renouvelable : l’énergie d’origine éolienne.
Selon the World Wind Energy Association (WWEA) [3], l’ensemble des éoliennes installées
fin 2009 produit 340 TW.h par an, pour une capacité installée de 159 213 MW, ce qui
correspond à 2% de la consommation électrique mondiale.
En France, l’éolien est le moyen de production qui connaît le plus fort taux de croissance
entre 1999 et 2009 avec 67% contre 39 % pour le solaire et 1% pour le nucléaire. Malgré cela
il ne représente que 1,4 % de la production avec 4521 MW de capacité installée.
D’après [4] l’intégration d’éoliennes dans le réseau électrique entraine certains problèmes tels
que:
 Le caractère aléatoire et difficilement prévisible de leur production.
 L’absence de réglage puissance-fréquence des aérogénérateurs.
 Une sensibilité élevée aux creux de tension et aux variations de fréquences pour
certaines technologies.
 Une sensibilité importante aux variations rapides de la force du vent.

21
Introduction Générale

Le problème majeur de l’éolien est la grande variabilité de sa production et surtout à la


difficulté de prévoir cette production plusieurs heures à l’avance. La non garantie de la
production éolienne induit qu’elle ne participe pas au « service système » (réglage de la
tension, de la fréquence, démarrage autonome ou black-start, possibilité de fonctionner en
îlotage..), ce qui amène les éoliennes à se comporter comme des générateurs passifs du point
de vue du gestionnaire du réseau électrique. Le taux de pénétration de l’éolien doit alors être
limité afin de pouvoir garantir la stabilité du réseau dans les conditions acceptables [4].
Toutefois il a été indiqué par Georgilakis [5] que l’intégration des éoliennes à un réseau
électrique était d’autant moins compliqué que le réseaux était grand. De plus une zone
géographique à grande diffusion de l'énergie éolienne permettra de réduire la variabilité et
d'accroître la prévisibilité.
Les problèmes liés à l’intégration de la production éolienne dans un réseau électrique sont
plus présents dans les milieux insulaires tels que la Martinique et la Guadeloupe du fait qu’ils
ne sont pas interconnectés.

Le taux d’intégration des électricités, d’origine dites fatales (éolien, solaire photovoltaïque)
dans ces régions a été limité à 30 %. Les récents chiffres de la situation énergétique de la
Martinique et de la Guadeloupe montrent une augmentation rapide du solaire photovoltaïque
qui représentait en Mars 2011 32 MW raccordée au réseau en Martinique [6] et 29 MW en
Guadeloupe [7]. Cette augmentation entraine que cette limite de 30 % est quasi atteinte dans
les deux iles. Il faut donc mettre en place des solutions afin de permettre au gestionnaire de
limiter l’impact de ces productions sur son réseau. Les principales solutions envisagées
consistent à développer des outils de prévisions et de stockage afin de permettre au
gestionnaire d’anticiper et /ou de garantir le niveau de production raccordée au réseau
électrique.

La prévision à court terme de la puissance électrique fournie par des fermes éoliennes
permettrait au gestionnaire de mieux gérer l’équilibre du réseau lorsque le taux de pénétration
de l’électricité éolienne est important.

22
Introduction Générale

L’objectif de la thèse est donc de mettre en place un modèle de prévision performant, basé sur
des méthodes mathématiques, visant à fournir une estimation de la puissance en sortie des
fermes éoliennes pour des horizons de prédiction ne dépassant pas l’heure. Ceci permettra
dans l’avenir, au gestionnaire d’optimiser la gestion de son réseau électrique en y facilitant
l’intégration de la ressource éolienne.

Le mémoire de thèse sera organisé comme suit:

 Le chapitre 1 présentera le contexte énergétique de la Martinique et de la Guadeloupe


en faisant un état des lieux des moyens de production présent sur les deux iles. Puis on
présentera l’évolution de l’éolien et la répartition des fermes dans l’archipel guadeloupéen,
lieu de notre étude.
 Le chapitre 2 portera sur l’analyse de la vitesse du vent et de la puissance en sortie de
ferme éolienne, elle permettra de vérifier s’il existe des effets de sites. Puis nous effectuerons
une analyse statistique de la vitesse du vent et de la puissance en sortie de la ferme de Petit
Canal afin de déterminer le temps à partir duquel ces deux variables ne sont plus corrélées.
Enfin nous établirons la fonction de transfert probabiliste vent-puissance qui permet de
déterminer la probabilité d’atteindre un pourcentage de la puissance installée en fonction de la
vitesse de vent.
 Le chapitre 3 présentera un état de l’art de la prévision à court terme dans le domaine
de l’éolien ponctué d’éléments de méthodologie des principaux outils mathématiques utilisés.
Après avoir précisé les horizons de prédiction pertinents pour notre étude, nous proposons un
un état de l’art de la prévision de la vitesse du vent et ou de la puissance électrique produite
par des aérogénérateurs..
 Le chapitre 4 se concentrera sur les outils mathématiques à partir desquels notre
modèle de prédiction est conçu ; il présente la méthodologie détaillée des réseaux de neurones
et l’explication du modèle bayesien.
 Le chapitre 5 donnera une description détaillée du modèle de prévision développé au
laboratoire pour des échelles de temps courtes (inférieures à l’heure). Puis une étude de
l’influence des paramètres temporels sur les performances du modèle de prévision sera
effectuée. Pour finir nous examinerons en quoi la nature turbulente de l’écoulement autour du

23
Introduction Générale

site de production a une influence sur la qualité de la prévision. La nature turbulente de


l’écoulement sera évaluée à partir du calcul du coefficient de variation de la puissance
produite.
 Le chapitre 6 proposera, au vu des résultats obtenus au Chapitre 5, une classification
des séquences de puissance basées sur le coefficient de variation à l’aide de la méthode
Fuzzy-C-mean afin de mettre en évidence trois régimes de variation. Par la suite, dans une
approche inspirée des chaines de Markov, nous déterminons la matrice de transition reflétant
les probabilités de passage d’un régime de variation à un autre.
 Au Chapitre 7, nous présenterons une méthode nous permettant de déterminer, à partir
du régime de variation en cours (évaluer sur les 12 heures précédentes) et celui de l’heure à
venir, le couple Tshort _ mem et Tlong _ mem optimal. Puis, les probabilités de transition données par

la matrice couplée aux jeux de paramètres optimaux, nous permettrons de tester 3 approches
intégrant ces deux informations, afin de faire évoluer le schéma de prévision en y ajoutant une
procédure adaptée aux régimes de variation observées au cours des 12 dernières heures.
 Le chapitre 8 présentera deux applications directes du modèle de prédiction : la
prédiction en temps réel développé dans le cadre du projet ANEMOS.PLUS et la gestion
dynamique d’un système de stockage pour l’intégration de l’électricité d’origine éolienne au
réseau.

24
CHAPITRE 1

Contexte énergétique de la
Martinique et la Guadeloupe.

1.1 Situation géographique et climatique de la Martinique et de la


Guadeloupe.

La Martinique et la Guadeloupe sont deux départements français d’outre mer situés dans l’arc
antillais. La Martinique se situe à 14,40°N 61°O tandis que la Guadeloupe se situe à 16,15°N
61,35 °O, ces deux régions sont donc situées dans la zone intertropicale. (Figure 1-1).

Figure 1-1 : Situation géographique de la Martinique et de la Guadeloupe dans la Caraïbe

25
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

Le climat de la zone intertropicale est chaud et humide et l’arc des petites Antilles bénéficie
d’un vent d’Est appelé Les Alizés.
Les alizés résultent de la circulation générale de l’atmosphère entre l’équateur thermique et
les régions subtropicales. A l'équateur thermique le fort réchauffement solaire donne
naissance à une importante convection, celle-ci est accompagnée d'une zone de basse pression
permanente vers laquelle se déplacent des masses d'air en provenance des anticyclones
subtropicaux situés au nord et au sud. La force de Coriolis dévie la trajectoire de ces masses
d'air vers l'ouest dans les deux hémisphères. (Figure 1-2)

Figure 1-2 : Circulation atmosphérique

26
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

1.2 Situation énergétique de la Martinique et de la Guadeloupe

Les réseaux électrique de la Martinique et de la Guadeloupe, de part leur caractère insulaire,


ne sont pas interconnectées, ces îles subviennent donc seules à leurs besoins en énergies.
La production électrique est, dans les deux cas, principalement assurée à partir des ressources
fossiles mais d’autres types de moyens de productions renouvelables sont mis en place.
Dans la section suivante, on présentera en détail, la répartition des moyens de production et
leur puissance installée.

La non interconnexion de la Martinique et de la Guadeloupe à un grand réseau électrique,


comme cela se fait en Europe, rend le réseau de transport d’électricité très fragile. En effet, un
court circuit sur un ouvrage de haute-tension engendre des creux de tension sur toute l’île. La
perte (ou panne) d’un seul groupe dans le système électrique insulaire entraîne des
perturbations importantes.

Ces régions ont un taux d’accroissement démographique de 0,54 % pour la Martinique et de


0,45 % pour la Guadeloupe (ce taux était de 0,55 % en 2009 en France métropolitaine).
La population Martiniquaise est passée de 381 000 habitants en 1999 à 402 000 en 2009 et de
386 000 en 1999 pour la Guadeloupe à 404 000 en 2009.
Tout ceci nécessite donc de prévoir régulièrement de nouveaux moyens de production en
supplément de ceux déjà en place (Tableaux 1-1 et 1-2).

27
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

Situation énergétique de la Martinique [6]


Moyens Puissance
de production installée
Moteurs Diesel EDF 282,2 MW
TAC EDF 61,8 MW
TAC1 du Galion 40 MW
SARA 3 MW
Usine d’incinération des ordures ménagères 4 MW
Sites Photovoltaïques 32 MW
Eoliennes du Vauclin 1,1 MW
TOTAL 424,1 MW

Tableau 1-1 : Situation énergétique de la Martinique en 2010

Situation énergétique de la Guadeloupe [7]


Moyens Puissance
de Production Installée
Moteurs Diesel EDF 175,8 MW
TAC Jarry Sud 100 MW
Secours îles du Sud 12,7 MW
Hydraulique 9,6 MW
Eolien 27,4 MW
Géothermie 15 MW
Centrale Thermique 93,5 MW
Photovoltaïque 29 MW
TOTAL 462 MW

Tableau 1-2 : Situation énergétique de la Guadeloupe en 2010

1
Turbine à Combustion

28
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

Du fait de la plus grande diversité des énergies renouvelables présentes en Guadeloupe dans
la section suivante on s’intéressera aux moyens de production de ce territoire.

1.3 Les énergies renouvelables en Guadeloupe

1.3.1 Etats des lieux et limites d’intégration des énergies renouvelables dans
l’Archipel Guadeloupéen.

L’électricité d’origine renouvelable à des sources multiples en Guadeloupe. Outre l’éolien


qui nous concerne plus particulièrement on recense aussi le photovoltaïque, la bagasse, la
géothermie et l’hydraulique. (Figure1-3)

Répartion des ENR en Guadeloupe

100

90

80

70
Puissance installée (MW)

60

50

40

30

20

10

0
Bagasse Photovoltaïque Eolien Géothermie Hydraulique

Figure 1-3 : Répartition des énergies renouvelables en Guadeloupe en 2010

29
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

L’éolien et le Photovoltaïque sont des énergies renouvelables à caractère aléatoire


puisqu’elles dépendent de sources, dont on ne peut garantir la constance. De plus le
foisonnement à l’échelle départementale est limité : la puissance globale produite
instantanément n’est donc pas garantie.
Pour faire face à cette contrainte et aux risques encourus par le réseau, il a été décidé, par
arrêté du 23 Avril 2008, de limiter la somme des puissances actives injectées par de telles
installations à 30 % de la puissance consommée instantanée.

Marin [8], explique que le fait de ne pas connaître la disponibilité de la production éolienne, a
des répercussions sur tout le réseau électrique. En effet, certaines différences de
caractéristiques entre la production éolienne et celle des unités de productions
conventionnelles ont des répercussions sur le réseau électrique notamment à cause que la
disponibilité de la production est inconnue.
De plus, les productions à base d’énergies renouvelables, ne contribuent pas aux réglages de
la fréquence. Ce qui signifie, que le dimensionnement d’un réseau insulaire n’est pas conçu
pour prendre en compte de trop grandes variations de production dues au caractère aléatoire
de la ressource solaire ou éolienne.
Or, l’essor du photovoltaïque ces deux dernières années fait que cette limite de 30 % est
pratiquement atteinte fin 2011 en Guadeloupe et le sera prochainement en Martinique selon
les prévisions de EDF [6,7].
Pour aller aux delà de ces 30 % il faudrait :
 Favoriser le développement d’Energies renouvelables à puissance garantie (Biomasse
Géothermie…)
 Développer les moyens de prévisions de production pour l’éolien et le
photovoltaïque
 Stocker les ENR aléatoire (Batteries, piles à combustible…)

30
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

Ce travail de thèse à pour but de répondre à la seconde proposition en proposant un outil de


prévision de la puissance éolienne produite par le parc éolien. Les données utilisées pour
concevoir ce modèle sont des mesures de vitesse de vent et de puissance en sortie des fermes
éoliennes de l’Archipel Guadeloupéen. Dans la section suivante nous présenterons l’état des
lieux de l’éolien dans l’Archipel.

1.3.2 Etat des lieux de l’éolien dans l’Archipel Guadeloupéen

La première ferme éolienne de l’archipel guadeloupéen, constituée de 20 éoliennes de 25 kW


chacune, a été installée sur l’ile de la Désirade en 1993. Depuis et ce jusqu’en 2008 la
Guadeloupe s’est constitué un parc éolien qui atteint aujourd’hui une puissance installée de
plus de 27 MW (Figure 1-4) répartie sur 12 fermes (Figure 1-5).

Evolution de la puisance éolienne installée en Guadeloupe entre 1996 et 2010

30

25

20
Puissance installée (MW)

15

10

0
1996 1997 1998 1999 2000 2001 2002 2003 2004 2006 2007 2008 2010
Années

Figure 1-4 : Evolution de la puissance éolienne installée en Guadeloupe [7,9]

De plus, d’après le rapport sur le développement de l’énergie éolienne terrestre dans les DOM
et en Corse [10], pour faciliter l’intégration de l’énergie éolienne dans le réseau électrique, le
concept de ferme éolienne a été largement développé : la ferme devient une véritable centrale
conventionnelle avec la capacité de fournir des services systèmes, grâce au développement

31
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

d’outils de gestion probabiliste du réseau électrique et de fonctions de prévision et de


stockage. En effet :
- l’éolien hors stockage et prévisions présente un coût très inferieur au coût moyen du bouquet
énergétique
- il contribue à la sécurisation de l’approvisionnement énergétique, puisqu’il utilise une
ressource locale, contrairement aux énergies fossiles, qui sont entièrement importées, aux
cours mondiaux, difficilement prévisibles ;
- l’énergie éolienne n’est pas stable, mais elle est mieux prévisible que le photovoltaïque.
- « L’éolien + stockage + prévisions », sous réserve que le stockage soit efficace, peut fournir
au réseau, une énergie électrique qui ne nuit pas a la stabilité du réseau ;
- l’éolien est une énergie sans émission de CO2 et sans déchets.

32
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

Figure 1- 5 : Répartition des fermes éoliennes de l'archipel Guadeloupéen

33
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

L’archipel guadeloupéen est situé en une zone cyclonique et cette particularité fait que les
éoliennes qui y sont implantées doivent résister aux phénomènes cycloniques.
Le constructeur Vergnet, qui fournit toutes les machines installées en Guadeloupe, à donc fait
en sorte quelles soient rétractables. (Figure 1-6)

Figure 1-6 : Schéma de la bascule des éoliennes guadeloupéennes

D’après la DEAL de Guadeloupe (Direction l’Environnement de l’Aménagement et du


Logement), les douze fermes ont fourni au réseau, en 2012, 51 GWh. Ce chiffre était de 45
GWh en 2011, soit une évolution de 13,3 %.

Conclusion

De part leur situation géographique les régions de la Martinique et de la Guadeloupe ne sont


pas interconnectées à de grand réseaux électriques de type continental et subviennent donc
seules à leurs besoins en électricité.

34
Chapitre 1 : Contexte énergétique de la Martinique et de la Guadeloupe

La production d’électricité d’origine fossile tient encore une grande place dans ces régions
malgré une forte diversité de moyen de production d’origine renouvelable. Du fait du
caractère fluctuant des principales ressources renouvelables et de l’instabilité dont serait
victime le réseau si leur taux d’insertion était trop important ce dernier a été limité à 30%.

Les contraintes liées à la variabilité des puissances injectées sur le réseau peuvent être gérées
si elles sont anticipées grâce aux prévisions de production. Ainsi, pour faire face a une hausse
ou a une baisse brutale de la production des énergies fatales, il faut environ 15 minutes pour
démarrer une turbine a gaz, 30 minutes pour un moteur diesel.
La faible prévisibilité constitue l’autre handicap des énergies fatales. De ce point de vue,
l’éolien offre une meilleure prévisibilité que le photovoltaïque mais cela reste insuffisant pour
une gestion sécurisée du réseau. La perte brutale d’un groupe de production peut provoquer
un creux de tension généralisé et, le cas échéant, se traduire par une déconnexion indésirable
d’une partie de la clientèle. Selon EdF, « la perte d’un groupe de 2 MW dans une Zone Non
Interconnectée est équivalente, toutes proportions gardées, à une perte simultanée de
plusieurs centrales nucléaires en Europe continentale ».[10]
L’objectif principal de ce travail de thèse est de proposer un modèle de prévision de la
puissance éolienne en sortie de ferme pour faciliter l’intégration de l’électricité éolienne dans
les réseaux électriques. Au prochain chapitre, les résultats de l’analyse de la vitesse du vent
seront présentés suivi d’une analyse de la fonction de transfert vent - puissance en sortie de
ferme, sur le site de Petit-Canal.

35
CHAPITRE 2

Analyse de la Vitesse du Vent


et de la Puissance en Sortie
de FermES DaNS L’aRChIpEl
Guadeloupéen

Introduction

Dans ce chapitre, nous effectuons une étude de la vitesse du vent mesurée sur le site de Petit-
Canal. Nous présenterons tout d’abord le site de mesure et le processus de transmission des
données. Ensuite, nous nous intéresserons aux caractéristiques de la ressource : le vent. Puis,
nous réaliserons une étude statistique de la puissance en sortie de ferme en effectuant une
analyse fréquentielle, en traçant la densité spectrale, le carré de la cohérence, le gain et la
phase de la fonction de transfert définie à partir des données expérimentales. Enfin, nous
déterminerons la fonction de transfert probabiliste afin de visualiser la dispersion de la
puissance électrique produite en sortie de ferme en fonction de la vitesse du vent.

2.1 Transmission des données du site de Petit Canal

Les mesures de vitesse de vent ont été effectuées sur le site de Gros Cap à Petit Canal (16°23’
N ; 61°24’ O) (Figure 2-1).

36
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

Figure 2-1 : Localisation de Petit Canal dans l'archipel guadeloupéen

Dans sa thèse, Calif [11] a décrit la chaine de transmission du site de Gros-Cap (Petit Canal)
dont les données recueillies arrivent directement au sein du laboratoire.
Les moyens techniques disponibles pour les mesures de vent sont : un anémomètre à
coupelles, une girouette et un anémomètre ultrasonique qui a aussi été utilisé pour des
campagnes courtes de mesure à haute cadence (20 Hz), de la vitesse de vent.
La tension de sorties de ces trois appareils, ainsi que celle du module délivrant la puissance
électrique en sortie de ferme sont connectés à une centrale d’acquisition Campbell Scientific
de type CR23X.
Les données sont stockées dans la mémoire tampon de la centrale puis sont transférées vers
un ordinateur portable.
Les données sont alors transmises par liaison téléphonique à un autre ordinateur situé à
l’Université via un logiciel de communication PC Anywhere version 9.2 qui permet un
pilotage depuis l’université. La chaine permet un transfert des données en continu. (Figure 2-
2).

37
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

Capteur Anémomètre Anémomètre Puissance en


angulaire à coupelles tridimensionnel sortie

Centrale d’acquisition Campbell Scientific CR23X

PC Logiciel PC au
communication
sur site laboratoire

Figure 2-2 : Chaine te transmission des données de Petit Canal [11]

2.2 Analyse statistique de la vitesse du vent.

Pour cette étude nous utiliserons les données de vitesse de vent, mesurées avec une fréquence
d’acquisition de 1 Hz entre le 15 Mars et le 31 Aout 2006.
Le signal de vent mesuré durant cette période est représenté en Figure 2-3. Le Tableau 2-1
donne la moyenne et l’écart type du signal et permet de mettre en évidence la gamme de
valeurs de la vitesse qui s’étend de 0.006 à 21.50 m/s.

Moyenne Ecart Type Max Min


8.37 m/s 2.73 m/s 21.50 m/s 6.10-3 m/s

Tableau 2- 1 : Caractéristiques de la vitesse de vent mesurée

38
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

24

22 Signal
Moyenne
20 Moyenne+ecart type
Moyenne-écart type
18

16
Vitesse (m/s)

14

12

10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Temps (semaines)

Figure 2-3 : Signal de vitesse de vent mesurée sur le site de Petit Canal

2.2.1 Fonction de répartition et distribution de la vitesse du vent.

La fonction de répartition permet de déterminer la probabilité pour qu’à un instant t


quelconque la valeur de la vitesse de vent v soit inférieure à une amplitude A suivant
l’équation (1) :
F (v)  prob( A  v) (1)

La Figure 2-4 représente la fonction de répartition du signal de vitesse de vent mesuré.

39
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

100

90

80

70
Fréquence cumulée (%)

60

50

40

30

20

10

0
0 2 4 6 8 10 12 14 16 18
Vitesse (m/s)

Figure 2-4 : Fonction de répartition du signal de vitesse mesuré

On remarque notamment que 90% des vitesses de vent mesurées sont inférieures à 12m/s.

La fonction densité de probabilité est la dérivée de la fonction de répartition et se défini


comme suit :

dF (2)
f (v) 
dv

Elle permet de calculer la probabilité pour la vitesse v considérée soit comprise dans un
intervalle v0 ; v0  v .

v0 v
P(v0  v  v0  v)   f (v)v (3)
v0

Calif [11] a fait varier v de 0.3 à 0.7 m/s et a montré que la distribution reste inchangé pour
ces différentes valeurs.
Nous avons donc choisi de calculer la densité de probabilité en fixant v  0.3 m/s

40
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

La Figure 2-5 représente la fonction de répartition expérimentale des vitesses de vent


mesurées.

0.25

0.2
Densité de probabilité

0.15

0.1

0.05

0
0 2 4 6 8 10 12 14 16 18 20 22 24
Vitesse (m/s)

Figure 2-5 : Densité de probabilité du signal de vitesse de vent mesuré

2.2.2 La distribution de Weibull

L’analyse de la vitesse du vent, et plus particulièrement l’estimation de la fonction densité de


probabilité, se fait également à l’aide de la fonction de Weibull. En effet la distribution de
Weibull à deux paramètres est la distribution qui décrit le plus communément la vitesse du
vent.
La densité de probabilité du vent s’écrit alors comme suit :

k v
k 1
  v k  (4)
f (v )    exp    
c c  c 

Tandis que la fonction de distribution cumulée de correspondant à la distribution de Weibull


est la suivante :

41
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

  v k 
F (v)  1  exp     (5)
 c 
 

Où c est le paramètre d’échelle de la distribution de Weibull (exprimé en m/s) et k le


paramètre de forme de la distribution de Weibull (nombre sans dimension). Généralement le
paramètre d’échelle "c" indique le caractère venteux du site étudié tandis que le paramètre de
forme "k " indique le caractère « pointu » de la distribution. Les valeurs de "k " sont
généralement comprises entre 1.5 et 3 [12].

Il existe de nombreuses méthodes qui permettent de déterminer les paramètres de la


distribution de Weibull, des méthodes graphiques [12,13,14] et des méthodes statistiques
[13,15,16] .
Nous utiliserons ici la méthode statistique basée sur l’estimation du maximum de la
vraisemblance compte tenu de son efficacité lorsque le nombre d’échantillons est important
[15]. De façon générale, l’estimation du maximum de vraisemblance est une méthode qui
consiste à déterminer la valeur d’un paramètre  qui maximise la fonction vraisemblance
L en résolvant l’équation (6) :
d log L (6)
0
d
La fonction vraisemblance pour un échantillon aléatoire x1 , x2 ,..., xn de longueur n est

représentée par l’équation (7) :


n
L   f X i (xi , ) (7)
i 1

Quand nous l’appliquons à la distribution de Weibull en utilisant l’équation de la densité de


probabilité définie par l’équation(4) nous obtenons l’équation (8):

n
 k  v 
k 1
  vi  k 
L(v1 , v2 ,..., vn , k , c)     i  exp     (8)
i 1  c  c 
 c 
 
En dérivant l’équation (7) en fonction de k et c on obtient deux équation (9) et (10) :

42
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

 ln L n n 1 n
   ln vi   vik ln vi  0 (9)
k k i 1 c i 1

 ln L n 1 n
    vik  0 (10)
c c c² i 1

Puis, en isolant c dans (9) et en le remplaçant dans (10) nos obtenons l’équation (11)
permettant de déterminer la valeur de k par une procédure itérative :
n

v k
i ln vi
1 1 n (11)
i 1
n
   ln vi  0
k n i 1
vi 1
k
i

Pour finir en remplaçant la valeur de k trouvé dans l’équation(10) nous obtenons c .

Nous avons établi la distribution de Weibull ainsi que ces paramètres de forme et d’échelle
pour la totalité de l’échantillon de mesure de vitesse de vent puis, pour chaque mois entier de
données (Avril, Mai, Juin, Juillet et Aout 2006) afin de comparer l’évolution de la distribution
de Weibull (Figure 2-6). Les valeurs trouvées sont répertoriées dans le Tableau 2-2.

Période Paramètre de forme : k Paramètre d’échelle : c


Totalité : 170 jours 3.33 9.29 m/s
Mois d’Avril 2.99 7.72 m/s
Mois de Mai 3.61 7.60 m/s
Mois de Juin 5.00 10.43 m/s
Mois de Juillet 5.66 11.27 m/s
Mois d’Août 3.23 9.81 m/s

Tableau 2-2 : Paramètres de formes et d'échelles calculées pour chaque mois de mesure

43
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

0.2
170 jours
0.18 Avril
Mai
0.16 Juin
Juillet
Fonction densité de probabilité

0.14 Août

0.12

0.1

0.08

0.06

0.04

0.02

0
0 5 10 15 20 25
Vitesse (m/s)

Figure 2-6 Comparaison des densités de probabilités de Weibull pour chaque mois de
mesures

Blonbou et al. [17] ont effectué une analyse de la vitesse du vent sur 4 sites de l’archipel
Guadeloupéen (Marie-Galante, Désirade 2, Désirade 3 et Petit Canal).
Le Tableau 2-3 présente les résultats obtenus après le calcul des paramètres de weibull pour
chacun des sites. Les données utilisées avaient été moyennées sur 10 minutes et les mesures
avaient été faites sur une période de 33 semaines avec une fréquence d’acquisition de 0,5 Hz.

Sites Moyenne Moyenne Ecart Paramètre de Paramètre


vitesse (m/s) direction (°) type (m/s) forme (k) d’échelle (c)
Désirade 2 9,4 92 ° 3,1 3,2 10,1
Désirade 3 7,4 111 ° 2,5 3,3 8,3
Marie-Galante 8,0 95 ° 2,8 3,1 8,9
Petit-Canal 8,0 93 ° 3 3 9,1

Tableau 2-3 : Caractéristiques de la vitesse et de la direction du vent sur les 4 sites [17]

44
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

Les résultats obtenus par Blonbou et al. [17] pour le site de petit canal sont comparables à
ceux obtenus Tableau 2-2, pour la totalité de notre échantillon.

Blonbou et al. [17] avaient aussi pour but d’effectuer une comparaison de la variabilité de la
vitesse et de la direction du vent à différentes échelles (1 heure et 24 heures) entre les 4 sites.
Cette analyse montre que pour des échelles de temps supérieures à 24 heures, il y a
synchronisation des variations de la vitesse de vent sur les 4 sites.
Cette même analyse fait état du fait que pour des échelles de temps courtes (inférieures à
l’heure) les évolutions de la vitesse du vent sont soumises à un effet de site. Ce résultat est
important compte tenu du fait que l’objectif du travail de thèse est de prédire à court terme
(échelles inférieures à l’heure) la puissance produite par des fermes du territoire, ce qui
impliquera l’utilisation des mesures locales pour évaluer la prévision pour chaque ferme.

Dans la prochaine partie on s’intéressera, à l’étude de la puissance éolienne en sortie de ferme


pour le site de Petit canal.

45
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

2.3 Analyse de la puissance en sortie de fermes : site de Petit-


Canal

Nous disposons de 170 jours de données de mesures de puissance qui ont été faites sur le site
de Petit-Canal en 2006. Les données illustrées sur la Figure 2-7 ont été moyennées sur 30
minutes à l’aide de la moyenne glissante afin d’effacer les aberrations dans les mesures.

7000
signal
moyenne
6000 moyenne+ écart type
moyenne - écart type

5000
Puissance (kW)

4000

3000

2000

1000

0
0 2 4 6 8 10 12 14 16 18 20 22 24 25
Temps (semaines)

Figure 2-7 : Signal de Puissance en sortie de ferme mesuré à Petit Canal

2.3.1 Comparaison des évolutions de période de la vitesse de vent et de la


puissance

Nous effectuons cette comparaison en traçant la densité spectrale de la vitesse du vent et de la


puissance, afin de comparer la répartition de la vitesse et de la puissance suivant chaque
gamme de fréquence.
La densité spectrale se calcule à l’aide d’un périodogramme.

46
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

Le périodogramme S ( f ) est un estimateur de la Densité Spectrale à base de transformée de


Fourier (TF) qui suit le schéma suivant :

TF
xobs (n) xobs (i 2f ) DS xobs ( f )

Le périodogramme est une fonction aléatoire de la variable continue f définie par l’équation
(12):
n 2
1 (12)
S( f ) 
n
 xl e i 2fl
l 1

10
10
Puissance
Vitesse
8
10

6
10
Densité Spectrale

4
10

2
10

0
10

-2
10

-4
10 -4 -3 -2 -1 0 1
10 10 10 10 10 10
Fréquences (Hz)

Figure 2-8 : Densité spectrale de la vitesse du vent et de la puissance électrique

Nous remarquons que la puissance en sortie des fermes a un comportement identique à celui
de la vitesse du vent, en effet on retrouve des pics pour des fréquences similaires (Figure 2-8).
Les densités de probabilités ont été tracées pour des fréquences comprises entre 2.10 -4 Hz et 2
Hz.

Nous nous intéressons maintenant à la fonction de transfert vent-puissance en calculant et en


traçant la cohérence, le gain et la phase de cette fonction.

47
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

La cohérence (ou le carré de la cohérence) est un outil statistique utilisé afin d’examiner la
relation entre deux signaux. Elle permet généralement de déterminer la fonction de transfert
entre une entrée et une sortie d’un système linéaire.

Le carré de la cohérence est une fonction des densités spectrales P , P


vv pp
  et de la densité

spectrale croisée P .
vp

2
Pvp ( f ) (13)
C vp ( f ) 
Pvv ( f ) Ppp ( f )

Calif et al. [18] utilisent la cohérence « vent-puissance » comme étant égale au spectre croisée
entre V et P divisé par le produit de la puissance spectrale de V et P . Ce quotient est un
réel compris entre 0 et 1 qui mesure la corrélation entre V et P pour une fréquence f .
La Figure 2-9 montre que la cohérence C vp descend en dessous de 0,4 pour la fréquence

3.10-3, cela indique que la cohérence entre la vitesse du vent et les fluctuations de puissance
associés à des échelles inférieures de 5 minutes est faible.

0.9

0.8

0.7

0.6
Coherence

0.5

0.4

0.3

0.2

0.1

0 -4 -3 -2 -1 0
10 10 10 10 10
Fréquences

Figure 2-9 : Cohérence entre la vitesse du vent et la puissance en sortie de ferme

48
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

Confirmons cette analyse par le tracé du gain et de la phase de la fonction de transfert.


La fonction de transfert est définie comme étant le quotient de la densité spectrale croisée

Pvp et la densité spectrale Pvv .


Pvp ( f )
Tvp ( f )  (14)
Pvv ( f )

Nous déterminons ainsi le gain G ( f ) et la phase  ( f ) de la fonction de transfert comme


étant respectivement :
(15)

G ( f )  20 * log 10 ( Tvp ( f ) ) (16)


 ( f )  arg( Tvp ( f ))

53

52

51
Gain (dB)

50

49

48

47

-3 -2
10 10
Fréquences (Hz)

Figure 2-10 : Gain de la fonction de transfert entre la vitesse du vent et la puissance


électrique

49
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

0.5

0
Phase (radian)

-0.5

-1

-1.5
-3 -2
10 10
Fréquences (Hz)

Figure 2-11 : Gain de la fonction de transfert entre la vitesse du vent et la puissance


électrique

Sur les Figures 2-10 et 2-11, nous remarquons que le vent et la puissance ne sont plus en
phase à partir d’une fréquence de 3.10 -3 Hz.
Ce qui signifie que les deux signaux ne sont plus corrélés pour des échelles de temps
inférieures à 3.10-3 Hz, soit 5 minutes.
Une étude similaire avait été menée par Calif et al. [18] avec l’utilisation d’un an et demi de
donnée. Elle avait mis en évidence que la vitesse de vent et la puissance n’étaient plus
corrélées en dessous de 8 minutes, nous restons dans le même ordre de grandeur.

2.3.3 Détermination de la Fonction de transfert probabiliste d’un groupe


d’aérogénérateurs.

La quantité d’énergie produite par un aérogénérateur, dépend des caractéristiques du vent sur
le site, du type de machine mais aussi de la répartition de celles-ci sur le site. La fonction de

50
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

transfert théorique d’une ferme éolienne est obtenue en considérant que chaque machine
fonctionne simultanément et est affectée du même vent.
En utilisant des données enregistrées sur une période de 6 semaines en 2006 et moyennées
sur une minute, on trace la fonction de transfert expérimentale (Figure 2-12).

5000

4500

4000
Puissance moyennée sur 1 minute

3500

3000

2500

2000

1500

1000

500

0
0 2 4 6 8 10 12 14 16 18 20
Vitesse de vent moyennées sur 1 minute

Figure 2-12 Fonction de transfert expérimentale

On remarque que la production sera maximale pour des vitesses de vent comprises entre 12 et
14 m/s. On voit bien aussi que la production est très faible pour des vitesses de vent
inférieures à 6 m/s.
Estimons maintenant, la probabilité d’obtenir un pourcentage de la puissance installée en
fonction d’une vitesse de vent donnée. Pour ce faire, nous établissons la fonction de
répartition qui peut être considérée comme étant la probabilité conditionnelle que la moyenne
de la puissance électrique ait une valeur inférieure ou égale à un seuil donné sachant la vitesse
moyenne du vent.
Ce que l’on peut écrire comme suit :

f ( P v )  prob( p  P v ) (16)

Avec P désignant le seuil.

51
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

5000

4500

4000

3500

90
60 80
Puissance (kW)

3000 70

50
40

80

90
30

70
2500

70
90

80
20 60
50 30
40

10
2000
20

50
60
40
10

30
1500

1000
70
8900

500
0
1020

60 4500
3
0 90
2 4 6 8 10 12 14 16 18
Vitesse du vent (m/s)

Figure 2-13 : Fonction de transfert probabiliste de la puissance électrique

Calif [11] avait déterminé que l’utilisation de cette fonction probabiliste couplée à une
prévision de la vitesse du vent permettrait une prévision au sens probabiliste de la puissance
prédite. En effet la fonction de transfert probabiliste fournie une information sur la probabilité
d’atteindre un niveau de puissance produite en fonction de la vitesse du vent.
Par exemple sur la Figure 2-13, pour une vitesse de vent de 14 m/s nous avons une
probabilité de 10% d’avoir une puissance en sortie de ferme inférieure à 2500 kW, cette
probabilité passe à 40 % pour une vitesse de vent de 12 m/s.

Conclusion

Nous avons vu que pour des échelles de temps courtes (inférieures à l’heure) l’utilisation de la
vitesse de vent pour prédire la puissance éolienne sera conditionnée par un effet de sites, c’est

52
Chapitre 2 : Analyse de la vitesse du vent et de la puissance en sortie de fermes dans l’Archipel
guadeloupéen

à dire qu’il faudra des mesures de vitesse de vent spécifique à chaque sites pour prédire la
puissance en sortie de ferme à court terme.
Nous avons aussi vu que pour des échelles de temps inférieurs à 5 minutes la vitesse de vent
et la puissance ne sont plus corrélées.
Donc, nous pourrons utiliser la vitesse du vent et/ ou la puissance comme données d’entrée du
prédicteur à conditions que les mesures aient été faites sur le même site et que les échelles de
temps considérées ne soient pas inférieures à 5 minutes.
La mise en place d’un prédicteur nécessite l’utilisation de plusieurs algorithmes
mathématiques. Dans le chapitre suivant nous décrirons un ensemble de méthodes
mathématiques pouvant être appliquées à la prévision et un état de l’art des prédicteurs mis en
place ainsi que les résultats obtenus lors de leurs utilisation pour prédire la vitesse du vent et /
ou la puissance éolienne.

53
Chapitre 3

ETaT DE L’art de la prévision à


court terme dans le domaine
DE L’éOLIEN

Introduction

Dans ce chapitre, nous abordons l’état de l’art de la prévision pour l’exploitation de l’énergie
éolienne. Outre la méthode mathématiques appliquée afin d’obtenir la prévision, la nature des
données utilisées en entrée des modèles est un autre critère intervenant dans l’élaboration d’un
modèle de prévision. Ces données, utilisées comme entrées au schéma de prévision, peuvent
être séparées en deux catégories, les mesures faites sur sites et les prévisions météorologiques
numériques. Dans ce chapitre, nous ferons tout d’abord, une rapide présentation des
principales méthodes mathématiques utilisées pour la prévision dans le domaine de l’éolien.
L’essentielle de ces méthodes, utilisent des modèles autorégressifs basés sur l’utilisation d’un
historique de données, indexés dans le temps, appelé séries temporelles.
Bourbonnais et al. [19] décrivent une série temporelle comme une succession d’observations
au cours du temps, représentant un phénomène. Les techniques traditionnelles de traitement
des séries temporelles procèdent par décomposition puis reconstitution de la série temporelle
afin d’effectuer la prévision. L’étude des séries temporelles a bénéficié de nombreux apports
théoriques [20] fondés essentiellement sur le progrès de leur modélisation. En conséquence,
les méthodes mathématiques présentées dans ce chapitre se rapportent à l’analyse des séries
temporelles de vent ou de puissance électrique d’origine éolienne.

54
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

L’analyse des séries de vitesse de vent montre que l’on a affaire à un processus stochastique
[11]. En effet ces mesures de vent se présentent comme une suite de variables aléatoires
indicées par le temps. Nous ferons état des principaux résultats obtenus en fonction des
méthodes utilisées.

3.1 L’horizon de prédiction.

Le choix de l’horizon de prédiction diffère selon l’utilisation que l’on veut faire de la
prédiction. Wang et al. [21] séparent les horizons en trois catégories :
Le court terme immédiat pouvant aller jusqu'à un horizon de 8 heures. Les prévisions
utilisant cet horizon sont principalement vouées à être utilisées soit, lors d’opérations en
temps réel sur le réseau électrique, soit, lors d’actions de régulations.
Le cout terme pouvant aller jusqu'à un horizon d’une journée. Les prévisions peuvent alors
être utilisées lors de la planification de la charge économique et de la sécurité du marché
électrique.
Le long terme pouvant aller jusqu'à plusieurs jours. Les applications des prévisions visent
plutôt les planifications des maintenances, les opérations de management et le calcule de
coûts optimaux.

Voyant [22], présente une décomposition des horizons de prédiction en fonctions des moyens
de productions que doit gérer le gestionnaire du réseau électrique corse.
Le très court terme, qui englobe les horizons de quelques minutes, pour la gestion des
moyens de productions hydraulique et de l’interconnexion (Corse – Sardaigne – Italie) qui
sont rapidement exploitables.
Le court terme, pour un horizon allant jusqu'à 1 heure, correspond au délai d’allumage des
dispositifs thermiques (turbines à combustion, moteurs thermiques) du gestionnaire du réseau.
Le moyen terme, cas pour lequel l’horizon peut aller jusqu'à 2 jours, permet des prévisions
qui sont utile pour la gestion des stocks fossiles et l’anticipation sur la journée du lendemain.

55
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Dans la suite du chapitre nous verrons que la plupart des travaux menés le sont sur le court
terme alors que les travaux sur le très court terme sont moins nombreux. Notre état de l’art se
concentrera principalement sur le très court terme et le court terme allant donc de quelques
minutes à 48 heures.

3.2 Le processus autorégressif à moyenne mobile ARMA

3.2.1 Principe

Les processus autorégressifs permettent de prédire le comportement d’une série


chronologique en fonction des valeurs passées. C’est en 1938 que Wold décompose, dans le
domaine du temps, les processus aléatoires selon 2 processus orthogonaux dont l’un est dit
déterminable et l’autre indéterminable. Le premier est appelé ainsi car il peut être exactement
prévu, le second est le résultat d’une combinaison linéaire infinie de chocs aléatoires : c’est le
processus de Yule (processus à combinaison linéaire infini qui ne peut être prévue). En 1954
Wold défini à partir des processus indéterminables les modèles linéaires ARMA stationnaire
composé d’une partie autorégressive notée AR et d’une partie moyenne mobile notée MA.
[19].
La partie AR exprime la série temporelle comme une fonction linéaire de ses valeurs passées
tandis que la partie MA suggère que le série présente des fluctuations autour d’une valeur
moyenne. On estime alors que la meilleure estimation de la tendance du signal est représentée
par la moyenne pondérée d’un certain nombre de valeurs antérieures. Le modèle ARMA est
la combinaison des deux modèles cités ci-dessus, on obtient alors une série temporelle
aléatoire décrite comme suit :

p q
xt    i xt i   t    j  t  j (1)
i 1 j 1

56
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Où  i est le paramètre d’autorégression,  j le paramètre de la moyenne mobile (avec  0  1 )

et  t , un bruit blanc.

3.2.2 Résultats bibliographiques obtenus par application de


l’autorégression pour la prévision dans le domaine éolien.

Tantareanu [23,24] utilise la méthode ARMA afin de prédire la vitesse du vent pour 3 à 10
pas d’avance à partir de données acquise avec une fréquence de 2,5 Hz et moyennées toutes
les 4 secondes. Il obtient une amélioration de 30 % par rapport la persistance 2.
Torres et al. [25] utilisent aussi les modèles ARMA pour des horizons de 1 à 10, les meilleurs
résultats on été trouvés pour un horizon de 10 h avec une amélioration de la RMSE (Erreur
Quadratique Moyenne) de 12-20 % par rapport à la persistance.
Poggi et al. [26] utilisent les modèles autorégressifs AR afin de simuler la vitesse du vent
avec un pas de temps de 3 heures. Le coefficient de corrélation entre les vitesses simulées et
les vitesses réelles est de 98% et l’erreur quadratique moyenne (RMSE) est inférieure à 10%.
Baile et al. [27,28] mettent en place un modèle autorégressif saisonnier de prévision de la
vitesse du vent basé sur l’analyse multifractale des fluctuations.. Ce modèle fournie des
prévisions pour un horizon d’1 à 48 heures. Baile et al ont comparé les résultats de leur
modèle à ceux fourni par les réseaux de neurones, la persistance et le modèle proposé par
Nielsen et al. [29]. En comparant les erreurs absolues et les erreurs quadratiques Baile et al.
trouvent que leur modèle obtient des résultats 1 à 10 % meilleurs que la persistance et les
réseaux de neurones.

Nous remarquons que l’utilisation des méthodes autorégressive pour la prévision permet
d’obtenir des résultats pouvant faire mieux que la persistance. Cependant, la diversité des
méthodes d’évaluation des performances des modèles mis en place par les auteurs fait qu’il
est difficile de les comparer. De plus, sachant que les pas et les horizons de prévisions ont un

2
En statistique la persistance d'une variable temporelle est sa prédisposition à conserver, dans son évolution les
valeurs qu'elle a prises précédemment. En d’autres termes on peut définir la persistance comme le fait de
considérer que la valeur la plus probable à un instant t  1 est celle mesurée à l’instant t .

57
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

influence sur les performance des modèles, la comparaison des résultats quand ces critères
sont différents d’un modèle à un autre est compliquée.

3.3 Les filtres de Kalman

3.3.1 Principe

Autre méthode mathématiques utilisée dans le cadre de la prévision, les filtres de Kalman
sont définis par Welsh et Bishop [30] comme un jeu d’équations mathématiques qui fournit
un moyen efficace permettant d’estimer l’état d’un processus.
Les équations du filtre de Kalman peuvent être classées en deux catégories, la prédiction et la
mise à jour. Les équations qui régissent la prédiction sont responsables de la projection dans
le temps de l’état actuel et de l’erreur de covariance afin d’obtenir les estimations à priori
pour un temps futur.
Les équations de la mise à jour sont elles, responsables du retour d’information (feedback)
c’est-à-dire qu’elles fournissent une nouvelle mesure à l’estimation à priori, afin d’obtenir une
amélioration de l’estimation à posteriori.
La Figure 3-1 résume le principe du filtre de Kalman et décrit les équations utilisées.

Correction
Prédiction
Estimation
K k  Pk H T HPk H T  R 
1
initiale (1)

xˆ  Axˆ k 1  Buk 1 (1)

k
xˆ ; Pk 1
k 1
xˆ k  xˆ k  K k ( z k  Hxˆ k ) (2)
Pk  APk 1 A  Q (2)

Pk  ( I  K k H ) Pk (3)

Figure 3-1 : Principe du filtre de Kalman discret

58
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Prédiction
(1) Prévoit l’état du système
(2) Prévoit la covariance de l’erreur

Correction
(1) calcul le gain
(2) Mise à jour de l’estimation de l’état du système en fonction de la mesure z
k

(3) Mise à jour de la covariance de l’erreur

Si Q et R sont constants, alors la covariance de l’erreur P et le gain seront rapidement


k

stabilisés et resterons constants. Dans ce cas les paramètres peuvent être pré-calculés.
Une signification détaillée des variables en présence est fournies en Annexe 1.

3.3.2 Résultats bibliographiques obtenus par application du filtre de


Kalman pour la prévision dans le domaine éolien.

L’état de l’art de la prévision à court terme de Costa et al. [31] fait entre autre, un état des
lieux des travaux de Bossanyi qui a appliqué le filtre de Kalman pour la prédiction de la
vitesse du vent avec un pas de temps d’une minute et a comparé ces résultats à la persistance.
Bossanyi disposait de 1000 heures de données enregistrées avec un pas de temps d’une
minute. La meilleure amélioration par rapport à la persistance, 10 %, est obtenue pour un pas
de prévision d’une minute.
Louka et al. [32] évaluent les performances d’un modèle basé sur des prévisions de vitesse de
vent fournie par le modèle de prévision météorologique SKIRON. Les prévisions fournies
sont filtrées par l’utilisation du filtre de Kalman et comparées aux vitesses de vent réellement
observeés. Louka et al. remarquent que le biais est passées en moyenne de -2,48 % à -0,09 %
quand les prévisions SKIRON sont filtrées, pour des horizons de prédiction allant de 24 à 120
heures.

59
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

3.4 Les réseaux de neurones artificiels

3.4.1 Principe

Dreyfus et al. [33] définissent un neurone artificiel comme étant une fonction non linéaire,
paramétrée à valeurs bornées.
Les variables de cette fonction sont habituellement appelées « entrées » du neurone et les
valeurs de sa fonction sont appelées « sorties » (Figure 3-2). Les neurones les plus
fréquemment utilisés sont ceux pour lesquels, la fonction f est une fonction non linéaire
[34].
Cette fonction f est appelée fonction d’activation

Figure 3-2 : Schéma d'un neurone formel à x n entrées et une sortie y

La fonction f peut être paramétrée de manière quelconque, mais deux types de paramétrages
sont plus fréquemment utilisés :
- Les paramètres sont attachés aux entrées du neurone : la sortie du neurone est une
fonction non linéaire d’une combinaison de variables xi  pondérées par des paramètres wi 
appelés poids synaptiques ou plus simplement poids [33]. Si nous choisissons comme
fonction d’activation la fonction non linéaire « tangente hyperbolique » la sortie du neurone
est alors représentée par l’équation (2) :
 n
 (2)
y  th w0   wi xi 
 i 1 
où w0 représente est une constante appelée biais.

60
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Les paramètres sont attachés à la non linéarité du neurone : ils interviennent directement
dans la fonction f [33]. La fonction f peut alors être une fonction radiale ou une ondelette.
Si par exemple nous choisissons une fonction radiale, la sortie du neurone sera alors
représentée par l’équation (3):
 n 2 
   xi  wi   (3)
y  exp  i 1 
 2 wn21 
 

Où wi sont les coordonnées du centre de la gaussienne et wn 1 son écart type.

Pour Dreyfus [33,34], un neurone formel ne réalise donc rien d’autre qu’une somme pondérée
suivie d’une non linéarité. C’est l’association, de tels éléments simples sous forme de réseaux,
qui permet de réaliser des fonctions utiles pour les applications industrielles.
Il existe deux grands types de réseaux de neurones : les réseaux de neurones non bouclés qui
sont des réseaux statistiques et les réseaux de neurones bouclés qui sont des réseaux
dynamiques.

3.4.2 Résultats bibliographiques obtenus par application des réseaux de


neurones pour la prévision dans le domaine éolien.

Pourmousavi Kani et al. [35], ont eux effectué des prévisions sur le très court terme. En effet,
les horizons varient entre 2,5 et 7,5 secondes. Ils comparent deux modèles, le premier basé sur
les réseaux de neurones de type perceptron multicouches (PMC) et l’autre sur une
combinaison PMC – Chaines de Markov. Le modèle composé obtient des résultats légèrement
supérieurs à ceux obtenus par le simple PMC, l’erreur absolue moyenne (MAPE) à variée de
3,6821 % à 3,1439 % soit une diminution d’environ 14,62 %.
Alexiadis et al. [36] obtiennent une amélioration de 32 % par rapport à la persistance pour un
horizon et un pas de prédiction d’une heure. Au cours de son étude, ils remarquent que les
réseaux de neurones reproduisent difficilement une situation qui ne leurs a pas été présentée
durant la phase d’apprentissage.

61
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Sfetsos [37] effectue une comparaison entre le modèle ARIMA (p,d,q) [19] et plusieurs types
de réseaux de neurones, (réseaux de neurone linéaire, réseaux de neurones logique, réseaux
de neurones à base radiales, réseaux de neurones d’Elman …) afin de prédire la vitesse du
vent à l’aide d’un mois de données horaire. Les modèles basés sur l’intelligence artificielle
font mieux que les modèles linéaires. Le modèle qui obtient la meilleure amélioration par
rapport à la persistance est celui basé sur les réseaux de neurones logiques avec 4.89%
d’amélioration.
Maqsood et al. [38], ont eux aussi fait une comparaison, mais entre différent types de réseaux
de neurones (Perceptron multicouche, réseaux de neurones d’Elman, réseaux de neurones à
base radiale, réseau de neurones de Hopfield). L’objectif était de prédire, entre autre, la
vitesse du vent au cours des 4 saisons. Le perceptron multicouche (PCM) et les réseaux de
neurones d’Elman donnent des résultats quasi similaires tandis que les réseaux de Hopfield
sont moins efficaces. Néanmoins la prévision effectuée à l’aide des réseaux de neurones à
base radiale est meilleure. Si nous comparons les RMSE de l’été on obtient, 1,9 % pour les
réseaux à base radiale, 1,99 % et 2 % pour le PMC et le réseau d’Elman et 3,65 % pour les
réseaux d’Hopfield.

Cadenas et al. [39], ont eux porté leur comparaison sur la structure du réseau. En effet ils ont
comparé 4 réseaux de neurones à architectures différentes :
 Architecture 1 : 3 couches avec 3 neurones sur la couche d’entrée, 3 sur la couche
cachée et 1 sur la sortie.
 Architecture 2 : 3 couches avec 3 neurones sur la couche d’entrée, 2 sur le couche
cachée et 1 sur la sortie.
 Architecture 3 : 2 couches avec 3 neurones sur la couche d’entrée et 1 neurone en
sortie
 Architecture 4 : 2 couches avec 2 neurones sur la couche d’entrée et 1 en sortie.
Toutes les données en entrée sont des vitesses de vent horaire.
Les erreurs (erreur absolue et erreur quadratique) les plus faibles sont obtenues pour
l’Architecture 4. Par exemple, les erreurs quadratiques sont les suivantes : Architecture 1 :
0,19 %, architecture 2 : 0,2 %, architecture 3 : 0,18 % et architecture 4 : 0,16 %.

62
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Ce résultat montre qu’une grande complexité au niveau de l’architecture du réseau ne confère


pas nécessairement de meilleures performances en termes de prévisions.

Li et al. [40] comparent les prévisions de puissance obtenues par un modèle basé sur les
réseaux de neurones et la conversion de la vitesse du vent en puissance par utilisation de la
courbe de puissance. L’apprentissage du réseau s’effectue à l’aide d’un échantillon de
données de vitesse et direction du vent mesurées sur une période d’un mois et moyennées
toutes les 10 minutes. Les performances de chaque modèle, par rapport à la puissance
mesurée, sont estimées en calculant le pourcentage de différence entre la mesure et la
prédiction pour 4 éoliennes. Cette différence varie entre 4.06 et 0.76 % pour les réseaux de
neurones et entre -28.76 et -3.21 % pour la méthode dite « traditionnelle ».

Catalão et al. [41] mettent en place un modèle basé sur les réseaux de neurones et les
transformées en ondelettes et le compare à des modèles basés sur les réseaux de neurones
classiques et la méthode ARIMA (1,2,1). En entrée des réseaux de neurones, les auteurs
utilisent 12 heures de données avec un pas de temps de 15 minutes et prédisent en sortie 3 h
de puissance avec un pas de temps de 15 minutes. La comparaison est faite sur une prévision
de 24h de puissance en sortie de ferme. Les 3 modèles testés font mieux que la persistance
avec une erreur absolue moyenne de 6.97 % pour le modèle réseaux de neurones/ transformée
en ondelette, 7,26 % et 10,34 % respectivement pour les réseaux de neurones et la méthode
ARIMA, contre 19,04 % pour la persistance.

Nous avons vu dans cette section 3.4, que la comparaison entre tous les résultats est assez
difficile puisque les pas et les horizons de prévisions sont différents dans les exemples
présentées. Par contre certains auteurs [35, 37, 38, 39, 40, 41] ont effectuées des
comparaisons entre plusieurs méthodes ou plusieurs de réseaux de neurones. Il en ressort que
les modèles basés sur l’utilisation des réseaux de neurones obtiennent de meilleurs résultats
que le ceux basé sur le modèle ARIMA.

63
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

3.5 Les méthodes basées sur les Prévisions Météorologiques


Numériques (NWP)

Les méthodes présentées aux sections 3.2, 3.3 et 3.4 peuvent être assimilés à des méthodes
statistiques basées sur l’analyse des séries temporelles de vent ou de puissance électrique. Il
existe des méthodes basées sur l’utilisation entrée des prévisions numériques NWP
(Numerical Weather Prediction) qui prennent en considérations des données comme la
caractéristique du terrain, les obstacles, la pression ou la température afin d’estimer
l’évolution future du vent [42].

3.5.1 Principe

Les modèles de prévisions météorologiques NWP, utilisent les systèmes d’équations


différentielles basées sur les lois physiques, la mécanique des fluides et la chimie. L’un des
facteurs qui influence le plus la précision des modèles NWP est la dimension du maillage. Les
méthodes NWP impliquent la résolution de ces équations pour chaque nœud du maillage. En
effet le maillage des ces modèles s’effectue en divisant l’atmosphère en un réseau 3D à l’aide
d’un système de coordonnées. On obtient ainsi un maillage météorologique et climatique dont
la taille de la grille peut varier entre 5 Km et 300 Km.

Gooijer et al. [43] font remarquer qu’un espacement du maillage plus fin que celui utilisés
pour les prévisions météorologiques est nécessaire pour produire des résultats utilisables sur
les sites éoliens. En d’autres termes, la grossièreté du maillage de ces modèles de circulation
générale atmosphérique et océanique, ne permet pas de rendre compte précisément de
l'évolution locale de l'atmosphère ou de l'océan. Il faut donc utiliser des méthodes de
désagrégation spatiale, en anglais "downscaling".
Il est possible de « downscaler » dynamiquement, à l'aide de modèles à échelles moyennes
tels que les model PSU /NCAR (Penssylvania State University/ National Center Atmospheric
Research model) ou WRF (Weather Research and Forecasting).

64
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Ces modèles sont forcés à leurs frontières latérales par des champs de basse résolution
(simulations de GCMs, analyses).
Leur utilisation est limitée par la précision des données de conditions de surface et de
topographie disponibles, par la difficulté à maîtriser les différents paramétrages nécessaires au
fonctionnement du modèle (turbulence sous-grille,...) et par les ressources numériques dont il
faut disposer (en particulier pour le downscaling climatique).

D'autres outils de downscaling sont basés sur l'utilisation des relations statistiques entre la
grande échelle et le climat à l'échelle locale d’un point de vue spatial ou temporel. Par
exemple, un downscaling spatial consisterait, dans le cas de l’éolien, à ramener la résolution
des données NWP à une échelle se réduisant à l’environnement de la turbine en utilisant une
modélisation physique basée sur les corrélations spatio-temporelles, tandis qu’un downscaling
temporel serait utilisé, dans le cadre de la prévision à court terme, afin ramener les prévisions
NWP (qui sont au mieux horaire) à une échelle de temps adéquate au très court-terme
(généralement inférieure à l’heure).
Les prévisions de vitesse de vent fournies par les modèles NWP peuvent être modifiés afin
qu’elles tiennent compte de la topographie du terrain, la rugosité et les obstacles présents sur
le site en utilisant un DEM (Digital Elevation Model). L’un des modèles les plus connus est le
modèle WaP’s [42,43].

Mais tous ces modèles n’arrivent pas à reproduire avec précision certaines caractéristiques
importante pour la prévision du vent sur un site donné. Des corrections peuvent être apportées
à l’aide de modèle statistique MOS (Model Output Statistics). Les corrections apportées par
MOS sont réalisées en comparant les vitesses de vent prédites et les vitesses de vent mesurées
sur un ensemble de données test. Généralement un biais et une erreur d’échelle seront
évidents en visualisant la courbe de la vitesse prédite tracée par rapport à la vitesse mesurée.
Ceux-ci peuvent être utilisés, plus précisément à travers la définition d'une courbe de tarage.
Enfin, les effets de sillage d’une éolienne sur l’autre, dans un parc, peuvent être pris en
compte à l'aide des logiciels comme PARK dans lequel les corrections de type MOS sur le
résultat final peuvent intégrées. [43]

65
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

3.5.2 Résultats bibliographiques obtenus par utilisation des prévisions


météorologiques numériques comme entrées de modèles de prévision dans
le domaine éolien.

Landberg [44] met en place un modèle en ligne de prévision de la production en sortie de


ferme. En entrée, le modèle utilise des prévisions de vent fournies par HIRLAM (Hight
Resolution Local Area Modelling). Puis, afin de prendre en compte les conditions locales
telles que les obstacles et la rugosité sur le site, le programme WAsP (Wind Atlas Analysis
and Application Program), est appliqué aux prévisions numériques. A cela s’ajoute
l’utilisation du programme MOS (traitement statistique des sorties du modèle), avant la
modification des données de vitesse ou après la conversion en puissance électrique par le biais
de la courbe de puissance, afin de réduire les erreurs de prédiction. Dans le cas de la prévision
de la puissance en sortie d’une seule ferme, le modèle fait mieux que la persistance pour un
horizon supérieur à 4h. Le modèle a aussi été testé pour la prédiction de la puissance en sortie
de 10 fermes (puissance totale de 24 MW) et les performances ont montré qu’il fait mieux que
la persistance pour un horizon de 12 heures.

L’état de l’art de Costa et al. [31], décrit un modèle de prévision développé par Beyer. Les
vitesses de vent utilisées en entrée proviennent du German Weather Service’s model
(Deutchlanmodell). Avec un horizon de prédiction pouvant atteindre 48 heures et un pas de
prévision de 6 heures, le modèle de Beyer utilise les courbes de puissance afin de convertir la
vitesse de vent en puissance électrique. Les résultats sont présentés pour 6 sites du Nord de
l’Allemagne et indiquent de bonne prévision si l’horizon ne dépasse pas 24 heures. De plus, il
évalue les corrélations spatiales de l’écart de prédiction et conclut que :
- Les corrélations décroissent à mesure que la distance augmente.
- Les écarts, pour de longs horizons de prédiction, sont plus importants que pour les courts,
car l’erreur systématique de prédiction augmente pour des temps, longs.

Notons qu’il existe aussi des modèles basés sur la combinaison des approches statistique et
physique. Ils sont utilisés afin d’obtenir de meilleurs résultats. C’est notamment le cas pour le

66
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

modèle Zepphyr décrit par Nielsen et al et Giebel et al. [45,46], qui voit le jour en 2002, et
qui résulte de la combinaison d’un modèle statistique, WPPT et d’un modèle physique appelé,
Prédictor [47]. D’autres modèles couplant approche statistiques et approche physique sont
présenté par Ramirez-Rosado et al. [48]. Ils ont été testé pour des horizons allant de 30
minutes à 72 heures. Les deux modèles présentés sont basés sur l’utilisation des courbes de
puissance et d’un modèle dynamique. Les courbes de puissance sont les fonctions de transfert
fixes entre les prévisions numériques de vent, en un point géographique de référence dans la
zone de parc éolien, et la production d'énergie électrique correspondante. Le premier modèle
appelé FORECAS utilise un réseau de neurones perceptron multicouche tandis que le second
SGP utilise une combinaison ARMA-filtre de Kalman-réseau de neurones. Pour le modèle
FORECAS l’erreur quadratique varie entre 14 et 19,2 % tandis que le modèle SGP a une
erreur qui varie entre 14,1 et 18,8 % sur une période de 12 à 72 heures.
On remarque ici que le simple réseau de neurone de type perceptron multicouche obtient des
résultats quasi similaires à ceux obtenus avec un modèle dynamique plus complexe combinant
les méthodes ARMA-Filtre de Kalman et Réseau de Neurones.

Notons qu’il existe une multitude de modèles de prévisions toutes approches confondues,
Monteiro et al. [24], Foley et al. [49] et Wang et al. [21] en font un résumé dans leurs
publications respectives.

3.6 Autre méthodes

Juban et al. [50] font remarquer que la plupart des méthodes utilisées fournissent une seule
valeur pour plusieurs horizons de prédictions. C’est ce que l’on définit comme étant une
prévision déterministe. Le principal inconvénient de ces prédictions est qu’il n’y a aucune
information fournie à priori sur l’amplitude de la déviation des valeurs prédites par rapport
aux valeurs cibles. L’utilisation des modèles probabilistes telles que la régression de quantiles
ou l’estimation par la méthode des noyaux peut pallier ce manque.

67
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

Bremmes [51] utilise la régression des quantiles afin d’estimer la probabilité de production
d’une ferme éolienne à Vinka en Norvège. Il dispose de la production horaire totale de la
ferme ainsi que des prévisions numériques de vitesse et de direction du vent à 10 m fourni par
le modèle HIRLAM notée HIRLAM 10. Ces données HIRLAM sont fournies pour des délais
de 24 à 47 heures. Bremmes met en place plusieurs modèles résultant de la combinaison des
trois variables à sa disposition. Les données sont divisées en plusieurs échantillons, le dernier
est utilisé pour les tests et la validation du modèle tandis que les autres sont utilisés pour
l’apprentissage.
La procédure est mise en place pour des horizons de 24, 30, 36, 42 et 47 heures et des
prévisions pour des percentiles de 5, 25, 50, 75 et 90 sont effectuées pour chaque modèle et
chaque horizons. Bremmes trouve en traçant les distributions empiriques des intervalles de
prédiction que le modèle basé sur la régression locale de quantiles utilisant les données
HIRLAM 10 avait plus de variations dans l’intervalle de 90 % que le modèle basé sur les
données sur site, c'est-à-dire que les prédictions fournies à partir des données HIRLAM 10
ayant subi une régression de quantile ont une incertitude plus faible dans le temps.
Bremmes publie un autre article [52] sur la comparaison de trois méthodes probabilistes :
- La régression locale de quantiles.
- La modèle à gaussienne locale qui à pour but d’estimer la moyenne et la variance des
valeurs d’un predicteur.
- L’estimateur de Nadaraya-Watson qui fournie une estimation de la CDF (fonction
distribution cumulative conditionnelle) pour un jeu de valeurs seuils.
Les conclusions montrent qu’il n’y a pas de modèles qui se détachent bien que le modèle à
gaussienne locale fonctionne moins bien du fait qu’il ne puisse pas reproduire les distributions
bimodales.
Si l’on cherche un modèle facile à mettre en place l’utilisation de modèle Nadaraya -Watson
est le plus approprié des trois.
Nielsen et al. [53] utilisent aussi la régression de quantile afin d’intégrer des prévisions
probabilistes dans des modèles de prévisions de puissance existants.
Pinson et al. [54] ont testé plusieurs méthodes permettant d’obtenir un intervalle de confiance
de 50 %. La première méthode était basée sur la modélisation de la puissance par une
distribution gaussienne, la seconde sur une analyse de prévisions météorologiques, expliquée

68
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

par Nielsen et al. [55], et la troisième était la régression des quantiles. Après avoir comparé
les probabilités de couverture, la taille moyenne et l’écart type de l’intervalle prédit en
fonction de l’horizon de prédiction, pour les trois méthodes, ils en déduisent que la régression
de quantiles surpasse les deux autres.

Conclusion

Dans ce chapitre nous avons, tout d’abord, donné une vue des outils mathématiques les plus
utilisées dans le domaine de la prévision. Dans la suite du chapitre nous avons présenté les
résultats qui ont été obtenue par l’utilisation de ces méthodes. Nous avons constaté qu’il
existe peu de travaux sur la prévision de la puissance à très court terme, c'est-à-dire pour des
échelles de temps inférieure à l’heure. Parmi les résultats évoqués nous remarquons que
certains auteurs ont opté pour la prévision de la ressource, à travers la vitesse du vent, sachant
que l’obtention d’une estimation de la puissance produite pourra se faire par l’utilisation des
courbes de puissance fournie par des constructeurs. Néanmoins, si l’on veut obtenir la
puissance en sortie de ferme à partir des prévisions de vitesse de vent, l’utilisation de la
courbe de puissance fournie par les constructeurs d’éolienne n’est que théorique et ne
caractérise qu’une éolienne isolée, elle ne peut donc pas servir à la conversion de l’énergie de
toute une ferme. [27].
Le modèle de prédiction mis en place au Laboratoire, basé sur ce principe, prédit directement
la puissance en sortie de fermes. De plus, Wang et al. [21] précise que, les modèles de
prévision à court terme immédiat utilisent généralement des approches statistiques telles que
les réseaux de neurones artificiels notamment à cause du temps d’exploitation des prévisions
météorologiques numériques. Or, les réseaux de neurones obtenaient de bons résultats. La
flexibilité de leurs paramétrages, font des réseaux de neurones un outil intéressant pour
l’implémentation, sur un site, d’un schéma de prévision.
Nous avions évoqué section 3.6 les approches probabilistes, c'est-à-dire qui permettent de
quantifier la probabilité d’obtenir la valeur prédite. Cet aspect à été intégré au modèle de
prévision que nous avons mis en place en combinant la méthode des réseaux de neurones à un
formalisme bayesien. Ce formalisme bayesien permet d’obtenir, en complément de la

69
Chapitre 3 : Etat de l’art de la prévision à court terme dans le domaine de l’éolien

prédiction, un intervalle de confiance traduisant la confiance qu’a le prédicteur en sa


prévision. Dans ce chapitre nous avons effectué une présentation très générale des réseaux de
neurones. Dans le chapitre suivant nous reviendrons en détail sur les réseaux de neurones de
type perceptron multicouches ainsi que sur le formalisme bayesien qui ont été utilisé pour la
mise en place du modèle de prévision développé au laboratoire.

70
Chapitre 4

Les Réseaux de Neurones


Bayesiens

Introduction

Il est intéressant d’observer l’historique de l’évolution d’une variable pour pouvoir en extraire
les lois sous jacentes de son évolution future. Les régressions donnent accès aux lois régissant
les séries temporelles : elles expriment la dépendance des futures observations aux
observations précédentes de la série.

Dans le cas de la prédiction de l’évolution d’une série temporelle, le but est de déterminer une
régression F : kn  k telle que : (1)
xi  k  F ( xi , xi 1 ,..., xi  k 1 )

On considère ainsi que toutes les futures observations sont fonction des observations passées.
Reste alors à déterminer la fonction F .

La modélisation de F peut être réalisée de différentes façons. En effet, si l’on considère que
la fonction F est linéaire, alors elle pourra être approximée par des modèles tels que les
modèles autorégressifs de type AR et ARMA. Mais dans la plupart des cas, les séries
temporelles sont issues de processus non-linéaires et une approximation linéaire de la fonction
F ne permet pas, dans ces conditions, de reproduire au mieux le comportement du processus.

71
Chapitre 4 : Les réseaux de neurones bayesiens

Dans ce cas l’utilisation d’autres méthodes de modélisation non-linéaire telles que, les
régressions par noyau et les réseaux de neurones sont à préférer. Les réseaux de neurones sont
une des méthodes mathématiques qui permettent de modéliser la fonction F . En effet, les
réseaux de neurones sont des modèles non linéaires utilisés pour les régressions empiriques et
les modèles de classification.
La flexibilité des réseaux de neurones leurs permet de reproduire plus de relations complexes
que les modèles statistiques traditionnels. Ils s’apparentent aux modeles de type « boite
noires » car ils ne requièrent aucune information détaillée sur le système. Kalogirou [56]
décrit les réseaux de neurones comme étant capable d’apprendre la relation entre les
paramètres d’entrée et les variables contrôlées et incontrôlées, en étudiant au préalable des
données enregistrées.
L’utilisation des réseaux de neurones permet aussi une approche probabiliste de la prévision,
ce qui permet de quantifier la probabilité d’obtenir la valeur prédite à l’intérieur d’un
intervalle donné. Nous obtenons ceci en combinant la méthode des réseaux de neurones au
formalisme bayesien qui permet de quantifier la confiance qu’a le prédicteur dans sa
prévision.

Dans ce chapitre, nous ferons tout d’abord une présentation du perceptron multicouche avant
d’en détailler le processus d’apprentissage. Puis, nous finirons par une description du modèle
bayesien et la façon dont il peut être utilisé pour optimiser la phase d’apprentissage du réseau
ainsi que l’impact qu’il peut avoir sur l’interprétation des résultats.

4.1 Le Perceptron multicouche

L’état de l’art présenté chapitre 3, relate l’importante utilisation des réseaux de neurones dans
le cadre de la prévision. Selon Jain et al. [57] les réseaux de neurones les plus adaptés à la
prévision, sont de type perceptron multicouche. La structure du perceptron multicouche,
consiste en une succession de couches, une couche d’entrée, une couche de sortie et une ou
plusieurs couches cachées. La couche cachée est composée de plusieurs neurones qui sont

72
Chapitre 4 : Les réseaux de neurones bayesiens

connectés aux neurones de la couche d’entrée et de sortie. A chaque connexion correspond un


poids et chaque neurone possède une fonction de transfert ou d’activation. (Figure 4-1)
Le processus d’apprentissage du réseau de neurones consiste à rechercher dans l’ espace des
paramètres du réseau, « le jeu de poids» optimal qui permet une bonne adéquation avec la
cible.
En pratique, on définit une fonction erreur qui dépend d’un ensemble de poids. Cet ensemble
 
de poids est noté    (jl1) ,  ij( 2 ) ,  (j1) ,  i( 2) . L’erreur rend compte de l’écart qu’il existe entre

la sortie du réseau y et la cible t .


Le but de l’apprentissage est d’ajuster le jeu de poids de sorte que cette erreur soit la plus
petite possible. On effectue alors une minimisation de l’erreur. [58]

x1 x2 x3 xl
Couche
d’entrée
 31(1)  32(1)
 33(1)
 3l(1)

Σ
 3(1) Biais
Couche
Cachée
f (1)

11( 2) 12( 2)  ( 2)
13

Σ
Couche de
1( 2) Biais Sortie
f ( 2)

Figure 4-1 : Schéma d'un perceptron multicouches avec une couche d'entrée ( l neurones),
une couche cachée (3 neurones) et une couche de sortie (1 neurone)

73
Chapitre 4 : Les réseaux de neurones bayesiens

Généralement, la fonction d’activation de la couche d’entrées et de la couche de sortie est


linéaire, celle de la couche cachée est non linéaire. Ce choix permet au réseau d’avoir une
plus grande flexibilité de calcul que pour un modèle de régression standard.
Les fonctions non linéaires les plus utilisées sont la fonction sigmoïde (3) et la fonction
logistique (4) représentées sur la Figure 4-2.

(3)
f (1) ( x)  tanh( x)
1
f (1) ( x) 
1  exp(  x) (4)

~ 1
Notons que f ( ~x )  tanh(~x ) est équivalent à f ( x)  si on applique la transformation
1 e x
x ~
linéaire x  sur le entrées et f  2 f  1 sur la sortie. Ainsi un réseau de neurones dont la
2

fonction d’activation de la couche cachée est la fonction sigmoïde est équivalent à un réseau
utilisant la fonction logistique mais ayant des poids et des biais différents [59].

Selon Bishop [59], la fonction logistique (3) est la plus souvent utilisée comme fonction
d’activation au niveau de la couche cachée. Cependant, il peut y avoir certain avantage
pratique à utiliser la fonction sigmoïde (4). En effet, il est souvent constaté que les fonctions
d'activation "tanh" donnent lieu à une convergence plus rapide de l’algorithme
d’apprentissage que la fonction logistique.

Figure 4- 2 : Fonctions d'activation

74
Chapitre 4 : Les réseaux de neurones bayesiens

Dans le cas du perceptron multicouches, les sorties y i du réseau sont obtenues par :

(5)
yi  f ( 2 ) ( ij( 2 ) f (1) (  (jl1) xl   (j1) )   i( 2 ) )
j l

xl : valeur du l ème neurone de la couche d’entrée

 jl : poids associés à la connections entre l’entrée l et le neurone caché j


 j(1) : biais associés au neurone caché j
 ij : poids associés à la connections entre le neurone caché j et la sortie i

 j( 2 ) : biais associés à la sortie i

4.2 Apprentissage du réseau de neurones

L’apprentissage du réseau de neurones s’effectue de telle sorte qu’à une entrée xi présentée

au réseau corresponde une cible spécifique t i . Cet ensemble, noté : D  xi , ti i 1 est appelé
N

ensemble d’apprentissage. L’ajustement des poids se fait après comparaison entre la sortie
(prédiction) y i et la cible t i jusqu'à ce que la sortie corresponde au mieux à la cible, c'est-à-

dire que l’erreur soit minimale [58].


Soit E D l’erreur du réseau définit par :

1 (6)
E D ()  
2 m i
(t i( m )  y i ( X ( m ) ; )) 2

X représente l’ensemble des entrées.


 représente l’ensemble des poids.

75
Chapitre 4 : Les réseaux de neurones bayesiens

La minimisation de l’erreur E D est la première étape. Vient ensuite la « généralisation » qui

consiste à évaluer la capacité du réseau à donner une prédiction correcte quand il est confronté
à un échantillon qui n’a pas été utilisé pendant la phase d’apprentissage.
De façon générale les performances du réseau s’évaluent à l’aide de l’erreur quadratique
moyenne (RMSE).
La généralisation s’obtient en se basant la procédure de régularisation.
La régularisation ne consiste pas à effacer le jeu de poids inapproprié mais à faire tendre vers
zéro les paramètres qui ne participent pas à la relation.
On obtient donc une erreur modifiée notée M   tel que:

M (  )   E D (  )  E  (7)

1
Le terme E     i2 est appelé « weight decay », il « pénalise » les grandes valeurs de poids
2 i
qui sont connues pour être responsables de l’instabilité du modèle.
 et  sont appelés hyperparamètres :
  contrôle le niveau de régularisation des autres paramètres
  contrôle et fixe le niveau de bruit affecté à la cible.
En considérant le bruit sur les données en entrée comme une distribution gaussienne on
1
définit  comme étant l’inverse de la variance :  bruit
2



Posons   l’erreur modifiée devient alors :

 (8)

2
M ()  E D ()  
2 i i
Le paramètre μ est appelé coefficient de régularisation.

Le plus souvent les données cibles sont bruitées ce qui peut entrainer le phénomène de sur -
apprentissage. On peut parler de sur-apprentissage si l'erreur de prédiction du réseau sur
l'ensemble d'apprentissage diminue tandis que l'erreur sur la validation augmente de manière

76
Chapitre 4 : Les réseaux de neurones bayesiens

significative. Cela signifie que le réseau continue à améliorer ses performances sur les
échantillons d'apprentissage mais perd son pouvoir de prédiction sur ceux provenant de la
validation.
Le sur-apprentissage intervient lorsque le nombre de neurones est trop élevé. Dans ce cas le
réseau est capable de reproduire exactement les données de la base d’apprentissage au
détriment de l’extrapolation sur des données non connues.

La minimisation de l’erreur est basée sur une évaluation répétée du gradient de M définie par
l’équation (8) en utilisant la rétropropagation.
La technique de rétropropagation du gradient permet de calculer le gradient de l’erreur pour
chaque neurone, de la dernière couche (la sortie) vers la première (l’entrée). Les poids
synaptiques, qui contribuent à engendrer une erreur importante se verront modifiés de
manière plus significative que les poids qui ont engendré une erreur marginale.

4.2.1 La méthode de la descente du gradient

L’une des méthodes les plus connues pour minimiser l’erreur est la méthode de la descente de
gradient.
Cette méthode a pour but de converger de manière itérative vers une configuration optimisée
des poids synaptiques
Dans l’espace des poids synaptiques, on part d’un point initial et on construit les points
suivants en prenant la direction de la plus grande pente sur une distance appelée pas de la
descente.
M (9)
 n 1   n  
 n

L’algorithme de rétropropagation estime la dérivée partielle de la fonction erreur par rapport


à chaque poids.
Cependant, la méthode de gradient à quelques inconvénients :
 Les choix du point initial et du pas restent empiriques
 L’algorithme peut faire converger la suite vers un minimum local

77
Chapitre 4 : Les réseaux de neurones bayesiens

 Les termes de la suite peuvent tendre vers l’infini


 La convergence est relativement lente.
Pour une convergence plus rapide on peut utiliser d’autres, méthodes du second ordre telles
que :
 La méthode du gradient conjugué
 La méthode de quasi Newton
 La méthode de Levenberg-Marquardt

4.2.2 La méthode du gradient conjugué

Cette méthode utilise un algorithme pour que la direction de recherche soit optimisée. La
direction dépend non seulement du gradient au point  mais aussi du gradient au point
n n 1
M M
n1  n   n (  n ) (10)
 n n1

4.2.3 La méthode de quasi-Newton

Cette méthode fait appel aux dérivées partielles du second ordre de l’erreur par rapport aux
poids.
Les itérations pour l’actualisation des poids sont de la forme :
n1  n en M (n ) (11)

Où He est la matrice hessienne de M(Ω).

4.2.4 La méthode de Levenberg- Marquardt

Cette méthode choisit de façon automatique un compromis entre la direction du gradient et la


direction de Newton ce qui permet d’éviter les problèmes liées au choix du pas et aux
nombre d’itérations.

(12)

78
Chapitre 4 : Les réseaux de neurones bayesiens

n 1  n  Hen  n .I  J n
1

1
n : Paramètre permettant de réduire le pas si celui-ci est trop grand (pas=  )
n

I : matrice identité
J n : Fonction coût = erreur quadratique moyenne sur les exemples de l’ensemble
d’apprentissage.

L’apprentissage « traditionnel » du réseau conduit à la détermination d’un seul jeu de poids


qui mène à une prédiction. Pour compléter cette prédiction, il nous parait utile d’y ajouter une
information sur la distribution, a posteriori, de la valeur de la prédiction. Notre choix s’est
donc porté sur l’utilisation d’une approche bayésienne qui permet d’avoir après
l’apprentissage, la fonction densité de probabilité, a postériori, des poids du réseau et celle de
la prédiction.

4.3 Le formalisme Bayesien

L’approche bayesienne considère les données comme des variables aléatoires suivant une
densité de probabilité (PDF), définie à priori.
L’issu de l’apprentissage consiste à ajuster les caractéristiques de ces PDF en fonctions du
degré de confiance sur les différentes valeurs des paramètres estimés en cours
d’apprentissage.
Cette PDF est initialisée à l’aide d’une distribution à priori et est convertie en distribution a
postériori, une fois que les données ont été observées, à l’aide du théorème de Bayes [60].

4.3.1 Probabilité jointes, conditionnelles et marginales.

En statistique on utilise le théorème de Bayes afin de mettre à jour ou actualiser les


estimations d’une probabilité ou d’un paramètre quelconque à partir d’observations et des lois
de probabilité de ces observations.

79
Chapitre 4 : Les réseaux de neurones bayesiens

Soit P ( A B, H ) une probabilité conditionnelle qui mesure la plausibilité de la proposition A

supposant que les informations contenue dans les propositions B et H soit vraies.
Il y a deux règles en probabilité : la règle du produit et la règle de la somme.

La règle du produit donne la probabilité conjointe de A et B appelé probabilité jointe telle


que :

P( A, B H )  P( A B, H ) P( B H ) (13)

Remarquons qu’elle résulte du produit le la probabilité conditionnelle, définie précédemment,


par la probabilité d’obtenir B sachant H .

La règle de la somme donne la distribution de la probabilité marginale de A telle que :

P ( A H )   P ( A, B H )   P( A B, H ) P( B H ). (14)
B B

Après avoir spécifié les probabilités jointes de toute les variables comme dans l’équation (13)
MacKay [60] indique que l’on peut définir des règles de probabilité afin d’évaluer comment
nos croyances et prédictions, peuvent changer quand on acquière de nouvelles informations,
c'est-à-dire quand on change les termes à droite du symbole « | ». La réponse est apportée par
l’utilisation du théorème de Bayes (15) :

P( A B, H ) P( B H ) (15)
P( B A, H ) 
P( A H )

H est une condition récurrente dans les probabilités du théorème, dans ce cas, l’inférence
bayesienne est subjective et il est impossible de raisonner sur les données sans faires de
suppositions.
D’un autre coté l’inférence est objective puisque toutes les personnes qui auront les mêmes
hypothèses auront la même inférence.

80
Chapitre 4 : Les réseaux de neurones bayesiens

La méthode bayesienne nous oblige à faire de ces suppositions tacites des suppositions
explicites et fournit des règles permettant de raisonner à partir de ces suppositions.

Intéressons nous maintenant au théorème de bayes appliquées à l’estimation des paramètres


d’un réseau de neurones.
En effet, dans le cas de l’apprentissage d’un réseau de neurones, on recherche la distribution à
postériori du jeu de poids compte tenu des hypothèses sur la distribution à priori des
paramètres et sur la structure du réseau de neurones.

4.3.2 Réseau de neurones bayesiens (RNB)

Le modèle bayesien n’intervient pas sur la structure même du réseau mais essentiellement au
niveau de la phase d’apprentissage en introduisant un aspect probabiliste à l’estimation des
poids lors du processus de minimisation de l’erreur. Au niveau de la réponse (sortie) du
réseau, cela permet en permettant d’introduire un intervalle de confiance pour qualifier la
plausibilité des prévisions.
Probabilité a priori sur les
Vraisemblance poids synaptiques et les biais

P D ,  ,  P   , 
P  D,  ,  ,   (16)
P D , ,

Probabilité à Evidence pour  et 


posteriori

H représente l’architecture du réseau défini par le nombre de neurones sur les couches
d’entrée, cachées et de sortie.

Intéressons nous maintenant à chaque terme de l’égalité (16). En se basant sur les travaux de
MacKay [61,62] on propose d’utiliser des hypothèses d’approximations gaussiennes, on

81
Chapitre 4 : Les réseaux de neurones bayesiens

supposera pour ce faire que le bruit sur les données utilisées, est gaussien et que donc, la
distribution des erreurs le sera aussi. Les PDF, a priori, des paramètres auront également une
distribution gaussienne.

4.3.2.1 La vraisemblance P D ,  , H

l’échantillon D  xi , ti i 1
N
Considérons de longueur N , utilisé pour l’apprentissage. Le

réseau de neurones a pour objectif de trouver une relation R entre les entrées x i et les sorties

ti (cibles).
Les données utilisées ayant de forte chances d’être bruitées, la relation se traduit par :
ti  R( xi )   i
(17)
Supposons que la ieme cible ti résulte de la relation déterministe des données en

entrées, X, auxquelles on ajoute un bruit gaussien.


Considérons aussi que les erreurs ont une distribution normale centrée en zéro et une
variance  2  1  .La distribution du bruit s’écrit alors:

   
p  i    exp    i  (18)
2  2 

La probabilité commune à l’échantillon de N valeurs de bruit s’écrira :

 
N
p    p1 ,......... .....,  N     p  i 
i 1

N 2
     N

 
 2 
exp  
 2

i 1
i
2


Or  i  ti  yi , en remplaçant dans l’expression précédente on obtient
N 2
     N
 (19)
p(  )   
 2 
exp  
 2
 (t
i 1
i  yi ) 2 

82
Chapitre 4 : Les réseaux de neurones bayesiens

1
Or E D () 
2
 (ti(m)  yi ( X ( m) ; )) 2 donc on obtient :
1
pD ,  ,    exp(E D ) (20)
Z D ( )

Comme précisé précédemment, β est un hyperparamètre qui représente l’inverse de la


variance du bruit de la cible.
On considère que l’hyperparamètre β est connu et la gaussienne bruit permet de calculer le
facteur de normalisation donné par :
N 2
 2  (21)
Z D (  )   
  
De plus, le fait de choisir une fonction vraisemblance gaussienne conduit à une interprétation
probabiliste de la fonction erreur puisque la fonction erreur peut être interprétée comme étant
le minimum de la fonction log-vraisemblance de l’équation (20).

Le fait de considérer le log de la vraisemblance vient du fait que les fonctions erreurs sont
habituellement une somme, par exemple l’erreur E D est une somme d’erreur quadratique. Par

contre les probabilités étant multiplicatives p( A, B)  p( A) p(B) , donc

log PA, B  log P( A)  log P(B)

4.3.2.2 Distribution a priori des poids synaptiques et des biais P   , H

Partons du principe que l’on a qu’une petite idée de la valeur des poids du réseau. Pour
n’écarter aucune possibilité, on choisit de considérer que la PDF des paramètres du réseau de
neurones a priori, est une gaussienne avec une variance élevée:

1
p (  , H )  e ( E ) (22)
Z  ( )

Z  ( ) représente la constante de normalisation de la PDF.

83
Chapitre 4 : Les réseaux de neurones bayesiens

Le choix d’une probabilité à priori gaussienne pour les poids permet une interprétation
probabiliste de E  ainsi que son interprétation comme étant le minimum du log de la
distribution de la probabilité à priori sur les paramètres (poids et biais du réseau).

En considérant que α est connu, et comme on a choisi une distribution gaussienne, on en


déduit la constante de normalisation Z  ( ) :
m2
 2  (23)
Z  ( )   e ( E )
d   
 
m représente le nombre total de paramètres du réseau de neurones.

4.3.2.3 Distribution a postériori des paramètres : P( D,  ,  , H )

Nous avons définit, précédemment, la vraisemblance et la probabilité à priori comme étant


égale respectivement à :

1
pD ,  ,    exp(E D ) (24)
Z D ( )
1 (25)
p (  , H )  e ( E )
Z  ( )
D’après le théorème de bayes on en déduit que :

1 (26)
P( D,  ,  , H )  e ( ED E )
Z D ( ).Z  ( )
Posons
1
S ()  E D  E et Z S ( ,  )  tel que Z S ( ,  )   e  S (  ) d
Z D (  ).Z  ( )

Dans le cas des réseaux de neurones il y a plusieurs paramètres, donc le calcul de ne peux pas
se faire de façon analytique

84
Chapitre 4 : Les réseaux de neurones bayesiens

Mac Kay [61,62] propose une estimation de la probabilité a postériori via l’hypothèse de
l’approximation gaussienne.
La distribution de la probabilité à postériori, est l’exemple type d’une distribution
multimodale dans l’espace des poids et chaque minimum local correspond une interprétation
différente des données. En effet chaque jeu de poids Ω trouvé (localement) en minimisant
S () est interprété comme le minimum local le plus probable et est noté  MP . Nous
pouvons donc localement approximer S () comme étant une fonction quadratique. En
utilisant l’Hessien de la fonction erreur, noté A, calculée en fonction du jeu de poids, nous
obtenons :

 1 
S ()    S ( MP )  (   MP )T A(   MP )  (27)
 2 

Où A est la matrice hessienne de la fonction erreur S () :

(28)
A  S 

L’approximation gaussienne de la probabilité a postériori permet aussi de calculer le facteur


normalisation Z 'S ( ,  ) :

 exp  S ( MP ) 
1 2
Z ' S ( ,  )  (2 ) m 2  A (29)
Où A est le déterminant de la matrice hessienne A de la fonction S ()

4.3.2.4 La structure de l’évidence P D  ,  , H

Pour calculer les facteurs de normalisation Z S' ( ,  ) (29) et la constante de normalisation

Z  ( ) (23) nous avons considéré, dans les deux cas, que les hyperparamètres β et α étaient
connus.
Mais ces hyperparamètres doivent eux aussi être estimés.
Mackay [61] donne une méthode basée sur la structure de l’évidence.

85
Chapitre 4 : Les réseaux de neurones bayesiens

Tout d’abord appliquons le théorème de Bayes aux hyper-paramètres afin d’avoir leurs
probabilités a postériori, on obtient :
P D a,  ,  P  ,   (30)
P  ,  D,  
P D 

P  ,  H est la probabilité a priori sur la valeurs des paramètres mais cette fois ci nous

n’avons aucune idée de la valeur des paramètres donc on considère que leur distribution suit
une loi uniforme. Le terme est appelé évidence pour α et β .
De plus la probabilité P ( D H ) ne dépend pas des hyperparamètres. Donc maximiser la

probabilité a postériori P ( ,  H , D ) revient à maximiser l’évidence [63]. En utilisant les

approximations gaussiennes pour les PDF des poids on montre que le terme de l’évidence
peut s’écrire :
Z S' ( ,  , ) (31)
P( D  ,  , H ) 
Z D (  ) Z  ( )

Les valeurs optimales des hyperparamètres  MP et  MP correspondent à une maximisation de


l’évidence. Pour ce faire, nous utilisons la fonction logarithmique, ce qui équivaut à
considérer que maximiser une probabilité revient à minimiser la fonction erreur qui s’y
rattache [63].

 exp  S ( MP )
1 2
(2 ) m 2  A (32)
P( D  ,  , H )  N 2 m2
 2   2 
   
    

1 N N m (33)
log P( D  ,  , H )   log A  S (MP )  log(2 )  log( )  log( )
2 2 2 2

En dérivant l’équation ci-dessus en fonction de α puis de β on trouve les valeurs optimales


 MP et  MP suivantes :

86
Chapitre 4 : Les réseaux de neurones bayesiens


 MP  (34)
2EMP
N  (35)
 MP 
2 EDMP
La quantité  désigne le nombre de paramètres convenablement déterminés et vaut :
m
k
  (37)
k 1 k  
k représente les valeurs propres de la matrice hessienne G de l’erreur E D , G   ED .[62]

Maintenant que les hyper-paramètres peuvent être optimisés résumons le processus


conduisant au jeu de poids le plus probable [63].
Dans un premier temps on choisit des valeurs de α et β. Ce qui permet d’initialiser les poids
du réseau en utilisant les valeurs provenant de la distribution à priori.
A l’instant i on aura donc une estimation des poids Ω i, des hyper-paramètres αi et βi et de
l’erreur S i () .
1
L’objectif est de déterminer les valeurs  iMP qui minimisent l’erreur S i () en utilisant, par
exemple, l’algorithme du gradient conjugué. Après obtention du jeu de poids le plus probable
à l’instant i+1 on calcule Ei 1 et EDi 1 .
Puis on calcule les nouvelles valeurs des hyper-paramètres suivant trois étapes :
m
 
k
Etape 1/  i 1     .
k 1  k   
i

 i 1
Etape 2 /  i 1 
2 E i 1

N   i 1
Etape 3/  i 1 
2 E Di 1

Puis avec les nouvelles valeurs des hyper-paramètres on redéfinit le jeu de poids le plus
probables à l’instant i+2 et ainsi de suite.

87
Chapitre 4 : Les réseaux de neurones bayesiens

Le processus s’arrêtera lorsque l’erreur S () sera égal à la moitié du nombre de points des
N
données soit S ()  alors    MP et    MP .
2

4.3.2.5 La méthode « Automatic Relevance Determination (ARD) »

La probabilité à priori qui mène à S () définie par l‘équation (26), n’est pas la meilleure car
elle applique les mêmes restrictions (α) aux jeux de poids des différentes couches, ce qui n’est
pas conforme aux propriétés d’échelles d’un réseau de neurones [58].
De meilleurs résultats peuvent être obtenus si on sépare les poids en différents groupes (un
groupe pour les poids et les biais de chaque couche)
La valeur d’un α pourrait alors être utilisée comme indicateur de la pertinence des entrées
qu’il contrôle : si le α associé est très grand, le processus de minimisation forcerait les poids à
être très petits et l’entrée aurait alors peu de pertinence sur la sortie. Ce méthode s’appelle
« the automatic relevance determination (ARD) » et permet de déterminer l’influence des
entrées sur la sortie du réseau. Ainsi les entrée de faible pertinence ne sont pas retirer du
réseau, l’algorithme réduit simplement l’influence des ces entrées en réduisant leurs poids
[64].
Par exemple, Lauret et al. [63] mettent en évidence que pour la prévision de la charge
électrique l’utilisation en entrée de la charge électrique comme variable est plus pertinente
que le rayonnement solaire global et la température.

4.3.3 Détermination de l’intervalle de confiance en sortie de réseau

Outre le fait de pourvoir estimer la distribution des poids la plus probable, le réseau de
neurones bayesien permet aussi de déterminer, non plus une valeur prédite mais un intervalle
dans lequel devrait se trouver la prédiction. En effet au lieu d’obtenir la meilleure estimation
de la prédiction comme avec un réseau de neurones classique, le modèle bayesien fourni une
distribution des sorties du réseau.

88
Chapitre 4 : Les réseaux de neurones bayesiens

L’hypothèse gaussienne sur la distribution des poids du réseau entraine que la distribution des
sorties des réseaux est aussi gaussienne et prend la forme suivante [63] :

1  (t  yMP ) 2  (38)
P(t x, D)  exp  
2 2t  2 t2 

La moyenne de cette distribution est donnée par y MP  y ( x,  MP ) et un écart type

 t   2  g T A1 g avec g, le gradient de la sortie du modèle évalué pour la meilleur


estimation.

Conclusion

Dans se chapitre nous avons présenté la méthodologie des réseaux de neurones de type
perceptron multicouches et le formalisme bayesien
Nous avons vu que le l’aspect probabiliste du modèle bayesien intervient lors de la phase
d’apprentissage (minimisation de l’erreur afin de déterminer le jeu de paramètre (poids,
hyper-paramètres) adéquats) et sur la nature des informations à la sortie du réseau
(prédictions).
En effet, l’apprentissage bayesien consiste à trouver les paramètres les plus probables sachant
que les données ont été observées, en utilisant une distribution à priori des paramètres.
Dans le chapitre suivant nous détaillerons comment les RNB ont été intégrés dans le modèle
de prévision mis en place au laboratoire LaRGE en détaillant le principe du prédicteur. Nous
verrons qu’outre les paramètres relatifs à la structure du réseau, d’autres paramètres temporels
interviennent dans le mécanisme du prédicteur. La suite du mémoire s’attachera à l’étude de
ces paramètres et à l’influence qu’ils ont sur les performances du modèle de prévision.

89
CHAPITRE 5

MODÈLE DE PRÉVISION DE LA
PUISSANCE ÉOLIENNE
À COURT-TERME

Introduction

Le modèle de prévision mis en place met à profit la souplesse d’utilisation des réseaux de
neurones bayesiens dans une approche adaptative.
Il utilise en entrée des données de vitesse du vent et/ ou de puissance électrique produite par
des aérogénérateurs, et sa grande flexibilité permet, notamment, de choisir l’horizon de la
prédiction souhaité.
Nous ciblons la prévision à court terme c'est-à-dire pour des horizons de prédictions inférieurs
à une heure.
Dans la première partie du chapitre on expliquera les principes du modèle ainsi que la
méthode de prétraitement appliquée aux données afin de réduire l’influence de l’évolution du
signal à moyen et long terme sur la performance de la prévision.
Puis, nous exposerons une analyse des erreurs de prévision et de l’intervalle de confiance à
travers l’évaluation qualitative des prévisions.
Cette analyse sera suivie d’une étude destinée à évaluer la sensibilité du modèle de prévision,
aux paramètres de configurations dont les valeurs semblent dépendre des régimes
météorologiques observés localement, identifié dans notre approche par les coefficients de
variation des séquences de puissance.

90
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

5.1 Le modèle prévision à cout-terme

Le but du modèle prédicteur est de fournir à un instant t une estimation de la production


éolienne PWind (t  k ) à un instant (t  k ) ultérieur.

Le modèle de prévision à court terme proposé, se base sur un modèle paramétrique simulant
la fonction reliant les évolutions passées d’un signal et son évolution future.
Il nécessite l’utilisation d’un certain nombre de paramètres qui devront être sélectionnés lors
d’une procédure d’apprentissage ou le modèle est comparé à un jeu de données historique.

L’outil proposé ici se destine à une utilisation sur le site de production éolienne ou au niveau
du centre de commande du réseau électrique par le gestionnaire.
Aussi, nous avons ciblé deux variables d’entrée : la vitesse de vent mesurée à proximité du
site de production ou directement la puissance électrique produite par les aérogénérateurs
concernés.
La méthode de prévision est détaillée sur le schéma de la figure 5-1. [65]

Le prédicteur utilise un jeu de données vent et/ou puissance en entrée et le processus se


décompose en 4 grandes phases.
 Le choix des paramètres du prédicteur
 Le prétraitement des données en entrée
 L’apprentissage qui permet la détermination des paramètres du réseau par
minimisation de l’erreur entre la cible et la prévision. (chapitre 4)
 La prédiction

Dans la suite du chapitre, nous nous concentrerons sur les deux premières phases, le
prétraitement des données en entrée et le choix des paramètres du prédicteur.

91
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

Figure 5-1 : Modèle de prévision à court terme de la puissance éolienne [65]

5.1.1 Précision sur les paramètres du prédicteur

La première étape consiste à fixer un certain nombre de paramètres, différent de ceux cités
dans le chapitre 5, régissant la mécanique du réseau tels que :
 La mémoire longue notée Tlong _ mem , qui détermine la longueur de l’échantillon qui

sera utilisé pour l’apprentissage.


Comme précisé précédemment le prédicteur repose sur le principe des réseaux de neurones
bayesiens ce qui veut dire qu’il existe une phase d’apprentissage durant laquelle les
paramètres (Ω, α et β décrits dans le chapitre 4) sont optimisés afin de retranscrire au mieux la
relation entrée-sortie en utilisant un échantillon de données {donnée d’entrée ; cible}
appelé «ensemble d’apprentissage » dont la longueur est fixée par Tlong _ mem .

Nous avons donc, un set d’apprentissage dont les données sont comprises entre
V (t i     
 Tlong _ mem ),..., V (ti ) et PWind (ti  Tlong _ mem ),..., PWind (ti ) avec ti  t T short _ memkmax , t .

92
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

 La mémoire courte notée Tshort _ mem , qui détermine la longueur de l’échantillon dans

lequel seront choisies les données d’entrée du prédicteur.


Les prédictions sont calculées à partir des vecteurs d’entrées dont chaque composante, à un
instant t donné, représente les ninp valeurs récentes prises dans un intervalle du vecteur

   
vitesse V (t  Tshort _ mem ),..., V (t ) ou du vecteur puissance PWind (t  Tshort _ mem ),..., PWind (t ) .

 L’horizon de prédiction  qui permet de déterminer la date pour laquelle est


effectuée la première prédiction ( t   ).

Après la phase qui consiste à fixer les paramètres et ainsi déterminer les intervalles dans
lesquels seront choisis les différents jeux de données, il est nécessaire que ces données soient
traitées en amont de toutes phases d’apprentissage ou de prédiction.
En effet, si l’on se place dans le cas de la ferme de Petit Canal, la puissance installée du
groupe d’aérogénérateurs étudié, évolue de manière non linéaire entre 0 MW et 5 MW.
L’apprentissage se base sur une analyse localisée dans le temps, du signal de puissance (ou de
vent). Il nous a donc paru préférable de normaliser les données utilisées en entrée afin de
réduire l’influence de la valeur moyenne sur la performance de la procédure d’apprentissage.
C’est ce qui est effectué lors de la phase de prétraitement des données (preprocessing),
décrite dans la section qui suit.

5.1.2 Prétraitement des données

Nous disposons d’un jeu de données, mesurées sur site, de vitesse de vent et de production
associée pour une ferme éolienne donnée (ou un groupe d’aérogénérateurs).
Les données utilisées subissent un premier traitement afin d’en atténuer les aberrations liées à
la chaine d’acquisition. Pour cela, on effectue une moyenne glissante sur 30 minutes. Cette
moyenne glissante peut être assimilé à un filtre passe bas qui permet de lisser le signal pour
en faire ressortir les tendances essentielles pour notre étude. Son utilisation permet d’éliminer
les fluctuations associées aux échelles de temps inférieures ou égales à l’échelle choisie.

93
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

N 1
t
1 2
u N (t ) 
N
 u (i)
N 1
(1)
i t 
2

N 1 N 1
avec 1   t  Ntotal 
2 2

La figure 5-2 présente une comparaison, sur 24 heures, entre le signal brut (bleu) et le signal
ayant été traité avec la moyenne glissante sur 30 minutes (rouge)

3000
Signal de puissance
Signal moyenné
2500

2000
Puissance (kW)

1500

1000

500

0
0 4 8 12 16 20 24
Temps (Heures)

Figure 5-2 : Signal de puissance moyenné sur 30 minutes

Afin de montrer que le signal de départ et le signal moyenné conservent la même dynamique,
sur les échelles de temps qui nous intéressent, nous choisissons de tracer le gain et la phase,
sur la totalité des 25 semaines de données (Figure 5-3 et 5-4).

94
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

-40

-50

-60

-70
Gain (dB)

-80

-90

-100

-110 signal
signal moyenné

-120
-6 -5 -4 -3 -2 -1 0
10 10 10 10 10 10 10
Fréquences (Hz)

Figure 5-3 : Gain du signal moyenné (rouge) et non moyenné (bleu)

1
Phase (radian)

-1

-2

-3

-4
-6 -5 -4 -3 -2 -1 0
10 10 10 10 10 10 10
Fréquences (Hz)

Figure 5- 4 : Phase du signal moyenné (rouge) et non moyenné (bleu)

Nous remarquons, qu’ils suivent une évolution quasi similaire pour des fréquences allant de
7.10-5 Hz à 5.10-3 Hz ce qui correspond à des périodes allant de 4 heures à 3 minutes. Le
signal filtré contient donc l’information nécessaire à l’étude de ses évolutions, sur les échelles
de temps allant de quelques minutes quelques heures.

95
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

L’utilisation directement des mesures de vitesse du vent ou de puissance électrique éolienne,


comme données d’entrée du réseau de neurones prédicteur, supposent qu’elles contiennent
toutes les évolutions du phénomène mesuré (tendance et fluctuations), utile au calcul de la
prédiction. L’inconvénient est que l’utilisation des uniquement filtré passe-bas provoque une
capacité à la généralisation limitée du prédicteur et les améliorations ne peuvent être obtenues
qu’au coût d’une augmentation de la complexité du réseau (augmentation du nombre
d’entrées et du nombre de neurones sur la couche cachée). Ceci pourrait augmenter le temps
nécessaire à obtenir une prévision.

Or, l’objectif du présent travail est de fournir une prédiction à très court terme de la puissance,
ce qui nécessite un temps de calcul réduit.
On décide donc d’extraire les évolutions lentes du phénomène pour se concentrer sur les
évolutions moyennement rapides (celles associées aux échelles de temps de l’ordre de la
dizaine de minutes à quelques heures) qui détermine l’évolution que l’on cherche à anticiper.
Cela se résume par le fait de s’affranchir de l’influence des valeurs moyennes associées au
temps long (au-delà de l’heure), sur la performance de l’apprentissage. Nous effectuons donc
le calcul suivant sur les données d’entrée du réseau :

ninp
1
u (t  (l  1)TS ) 
ninp
 u(t  (l _ 1)T )
S

xl (t ) 
l 1 (2)
ninp
1
ninp
 u(t  (l  1)T )
l 1
S

u représente la vitesse de vent ou la puissance moyenne.


l représente l’indice de l’entrée

n inp représente le nombre d’entrée du réseau de neurone prédicteur

Ts désigne l’intervalle entre chaque composante du vecteur d’entrée

Les valeurs de la puissance électrique cible du prédicteur vont potentiellement de 0 kW à


puissance totale installée sur la (ou les) ferme(s) éoliennes étudiée(s). En s’appuyant sur les

96
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

arguments proches de ceux avancés pour les données en entrée on redéfinit les données de la
fonction cible telle que :

ninp
1
PW ind (t  k ) 
n inp P
l 1
W ind (t  (l _ 1)TS )
(3)
t k (t )  ninp
1
n inp P
l 1
W ind (t  (l  1)TS )

Ce prétraitement des données a pour résultat d’obtenir des jeux de données (entrée et sortie)
ayant des valeurs comprises dans un intervalle restreint autour de zéro.
La Figures 5-5 représente la distribution de la puissance normalisée à l’aide de l’équation (2).
Le calcul a été fait pour Ts =60 secondes et n inp = 5.

0.25
Distribution de la puissance normalisée

0.2
Densité de probabilité

0.15

0.1

0.05

0
-0.06 -0.05 -0.04 -0.03 -0.02 -0.01 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.10 0.11
Puissance normalisée

Figure 5-5 : Distribution de la puissance normalisée

Ce sont ces données prétraitées qui servent d’entrée et de cible au réseau prédicteur, aussi,
pour avoir un signal exploitable, il faut traiter en sens inverse la prédiction en sortie du
prédicteur.

97
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

On effectue alors l’opération suivante :


ninp
1 (4)
y (t   ) 
n inp P
i 1
W ind (t  (l  1)TS )  ( ~
y (t   )  1)

~y est la sortie du prédicteur, c'est-à-dire à la prévision de la puissance électrique

adimensionnée.

5.1.3 Indicateur de performance du prédicteur : improvRMSE et improvMAE

Le détail de la phase d’apprentissage ayant été renseigné dans le chapitre 4, attardons nous ici
sur l’étude qui a permis de déterminer le choix des paramètres prédicteur cités dans la section
précédente.
La validation de ce choix se fait en prenant en compte un certain panel d’indicateurs.
Dans notre cas on distingue 3 types d’indicateurs :
 Les erreurs (Annexe 2)
 L’amélioration par rapport à la persistance
 Le coefficient de corrélation (Annexe 2)
Les performances du prédicteur sont évaluées par le calcul de différentes erreurs, du
coefficient de corrélation et du taux d’amélioration par rapport à la persistance proposés dans
Madsen et al. [66]. (Se référer à l’Annexe 2)
En statistique la persistance d'une variable temporelle est sa prédisposition à conserver, dans
son évolution les valeurs qu'elle a prises précédemment. En d’autres termes on peut définir la
persistance comme le fait de considérer que la valeur la plus probable à un instant t  1 est
celle mesurée à l’instant t .

Considérons un échantillon de puissance et utilisons le principe de la persistance pour prédire


les valeurs de la puissance aux instants t   avec   20,30,40 minutes, pour un pas de
prédiction de 5 minutes. On remarque que, dans environs 60% des cas, la différence

98
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

normalisée entre la valeur ciblée et la persistance est comprise entre -5 et 5% (Figure 5-6).
Cette observation est valable pour les trois horizons considérés (Tableau 5-1). Pour une
différence observée entre -15 et 15% nous retrouvons, 91,4 % des cas.

Nbiais (%) [-25 ; -15[ [-15 ; -5 [ [-5 ; 5 [ [5 ; 15 [ [15 ; 25]


  20 min 4.5 % 18 % 57 % 16.3% 4.1%
  30 min 4.1 % 18.4 % 56.6 % 16.7 % 4.1 %
  40 min 4.1 % 18 % 56.6 % 17.1 % 4.1 %

Tableau 5-1 : Valeurs du biais entre la valeur cible et la persistance pour différents horizons
de prédiction
60

50

40
Fréquence (%)

30

20

10

0
-25 -15 -5 5 15 25
Différence (Biais) (%)

Figure 5-6 : Différence (%) entre la cible et la persistance pour un horizon de prédiction de
20 minutes

Ceci montre qu’il est difficile, dans le domaine de la prévision à court terme, de faire mieux
que la persistance. Giebel et al. [23,67] avaient précisé que « pour prédire mieux que la
persistance pour des horizons courts utilisant les mêmes entrées, que sont, les mesures en
ligne de ce qui doit être prédit est possible seulement avec des efforts ».

99
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

Dorénavant, nous utiliserons la persistance comme modèle étalon, pour évaluer la


performance du modèle de prédiction. Les erreurs de prédiction obtenues en utilisant le
prédicteur seront comparées avec les erreurs obtenues, dans les mêmes conditions, en utilisant
la persistance comme modèle de prévision.
Pour évaluer la performance du prédicteur, nous calculons deux indicateurs qui renseignent
sur le taux d’amélioration de l’erreur de prévision par rapport à la persistance. Ces indicateurs
sont calculées à partir des erreurs de prévision, quadratiques moyennes ou absolues notées
RMSE et MAE pour le prédicteur et RMSE pst et MAE pst pour le modèle de prévision étalon

basé sur la persistance. Ces indicateurs sont notés improvRMSE et improv MAE , et sont appelés

taux d’amélioration par rapport à la persistance.


RMSE pst  RMSE (5)
improvRMSE 
RMSE pst

MAE pst  MAE (6)


improvMAE 
MAE pst

5.2 Détermination du nombre d’entrées du réseau de neurones


prédicteur.

Outre les paramètres présentés en section 5.1, il existe d’autres paramètres comme le pas de
prédiction, la structure du réseau (nombre de neurones présent sur chaque couche). Des tests,
effectués en amont du travail de thèse, avaient permis de déterminer le nombre de neurones
sur la couche cachée [65]. Le nombre de sortie, a était choisi afin de pouvoir obtenir,
simultanément, les prévisions pour 3 horizons de prédiction. En résumé nous avons :
 Nombre de neurones sur la couche cachée : 5
 Nombre de neurones sur la couche de sortie : 3
 Pas de prédiction : 5 minutes.

100
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

Cette section présentera les résultats de l’étude visant à déterminer le nombre d’entrée. Nous
avons choisi de tester 3 valeurs pour le nombre d’entrée notée n inp = 5, 10 et 15. Nous avons

observé que des valeurs de n inp trop petite ( n inp < 5) conduisent à des instabilités numériques,

au niveau du réseau de neurones prédicteur, lors des calculs de rétropropagation de l’erreur.

Les Figures 5-7 et 5-8 présentent les résultats pour, respectivement, Tshort _ mem =15 minutes et

25 minutes. Ces figures illustrent les résultats correspondant à 3 horizons de prédiction


différentiés par un camaïeu de couleur (bleu pour un horizon de 5 minutes, vert pour celui de
30 minutes et rouge pour celui de 40 minutes). Trois valeurs ont été testées pour le
paramètre Tlong _ mem : 4 heures, 12 heures et 20 heures.

Le choix de la valeur de n inp s’est fait en comparant les taux d’améliorations par rapport à la

persistance, des prévisions obtenus en faisant varier la valeur de n inp .

Pour chacune des configurations présentées, quelque soit l’horizon de prédiction considéré,
systématiquement nous obtenons de meilleurs résultats pour un nombre de neurones sur le
couche d’entrée égale à 5.

10

-10
Improv MAE (%)

-20

nin=5; hrz=20 min


nin=10 ''
-30 nin=15 ''
nin=5; hrz =30 min
nin=10 ''
-40 nin=15 ''
nin=5; hrz =40 min
nin=10 ''
nin=15 ''
-50
4 12 20
Tlong-mem (Heures)

(a)

101
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

20

10

-10
(%)

-20
RMSE
Improv

-30 nin=5 ; hrz=20 min


nin=10 ''
-40 nin=15 ''
nin=5 ; hrz= 30 min
-50 nin=10 ''
nin=15 ''
nin=5 ; hrz =40 min
-60
nin=10 ''
nin=15 ''
-70
4 12 20
Tlong-mem (Heures)

(b)

Figure 5-7 : improv MAE (a) et improv RMSE (b) en fonction du nombre d'entrées et de Tlong _ mem
avec Tshort _ mem fixé à 15 minutes

10

-10
Improv MAE (%)

-20

nin=5; hrz=20 min


nin=10 ''
-30 nin=15 ''
nin=5 ; hrz =30 min
nin=10 ''
-40 nin=15 ''
nin=5 ; hrz=40 min
nin=10 ''
nin=15 ''
-50
4 12 20
Tlong-mem (Heure)

(a)

102
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

20

10

-10
Improv RMSE (%)

-20
nin=5 ; hrz=20 min
nin=10 "
-30
nin=15 "
nin=5; hrz =30 min
-40 nin=10 "
nin=15 "
nin=5 ; hrz =40 min
-50 nin=10 "
nin=15 "
-60
4 12 20
Tlong-mem (Heures)

(b)

Figure 5-8 : improv MAE (a) et improv RMSE (b) en fonction du nombre d'entrées et de Tlong _ mem
avec Tshort _ mem fixé à 25 minutes

5.3 Sensibilité de la performance du prédicteur par rapport aux


paramètres Tlong _ mem et Tshort _ mem .

Nous étudions dans cette section, l’évolution de l’erreur de prévision, des taux d’amélioration
par rapport à la persistance et de l’amplitude de l’intervalle d confiance, en fonction des
paramètres Tlong _ mem et Tshort _ mem . Pour cela nous avons testé les valeurs suivantes :

T short = {5,10, 15, 20, 25, 30 minutes}


T long = {4, 8, 12, 16, 20, 24, heures}
Les tests ont été effectués pour 3 horizons de prédiction, 5, 10 et 15 minutes.

103
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

5.3.1 L’erreur de prédiction

Nous avons étudié l’évolution des l’erreur quadratique moyenne normalisée (NRMSE) et de
l’erreur moyenne absolue normalisée (NMAE) définies en Annexe 2. Les résultats ont montré
que le paramètre Tlong _ mem a très peu d’influence sur les erreurs quadratiques et absolues. En

effet pour un Tshort _ mem fixé à 5 minutes et pour toutes les valeurs de Tlong _ mem testée, on

remarque que l’erreur varie de 2,88 % à 3,02 % et de 4,17 à 4,35 % pour NMAE et NRMSE
respectivement. L’évolution des erreurs en fonction de Tshort _ mem , bien qu’un peu plus

importante, reste toutes de même assez faible puisqu’elle ne dépasse pas une différence de 3
points. Par contre nous remarquons que plus l’horizon de prédiction est important plus la
valeur des erreurs augmente. Par exemple, pour un même échantillon, en fixant Tlong _ mem = 4

heures, et Tshort _ mem =5 minutes, NMEA passe de 2,50% pour un horizon de 5 minutes à 8,44 %

pour un horizon de 15 minutes. Les Figures 5-9 et 5-10 représentent l’évolution de NMAE
pour des horizons de 5 et 15 minutes tandis que les figures 5-11 et 5-12 représentent
l’évolution de NRMSE. Toutefois et bien qu’elles augmentes en fonction des horizons de
prédiction, on remarque aussi que les erreurs ne dépassent pas 10% .

4.5

4
NMAE (%)

3.5

2.5
30
25 24
20 20
16
15 12
10 8
4
5
T (minutes) Tlong-mem (heures)
short-mem

Figure 5-9 : Evolution de NMAE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de
prédiction de 5 minutes

104
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

11

10

9
NMAE (%)

6
30
25 24
20 20
16
15 12
10 8
4
5
T (minutes) Tlong-mem (heures)
short-mem

Figure 5-10 : Evolution de NMAE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de
prédiction de 15 minutes

5.5
NRMSE (%)

4.5

4
30
25 24
20 20
16
15 12
10 8
4
5
T (minutes) Tlong-mem (heures)
short-mem

Figure 5-11 : Evolution de NRMSE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de
prédiction de 5 minutes

105
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

15
NRMSE (%)

10

5
30
25 24
20 20
16
15 12
10 8
4
5
T (minutes) Tlong-mem (heures)
short-mem

Figure 5-12 : Evolution de NRMSE en fonction de Tlong _ mem et Tshort _ mem pour un horizon de
prédiction de 15 minutes

5.3.2 L’intervalle de confiance de la prévision

L’intervalle de confiance représente une quantification de l’assurance qu’a le prédicteur dans


son calcul de la prévision. Nous remarquons que les variations de Tlong _ mem et Tshort _ mem

agissent de la même façon sur l’intervalle de confiance. En effet, plus les valeurs de
Tlong _ mem et Tshort _ mem sont élevés plus l’intervalle de confiance est étroit (Figure 5-13). Ce qui

est logique et traduit le fait que plus le prédicteur a des données à sa « disposition » plus il
considère sa prévision pertinente. L’intervalle de confiance est un critère qui qualifie l’auto-
évaluation de la performance du prédicteur.

106
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

3000

2500
Delta (kW)

2000

1500

1000
30
25 24
20 20
15 16
12
10 8
5 4
T (minutes) Tlong-mem (heures)
short-mem

Figure 5-13 : Evolution de l'amplitude de l'intervalle de confiance en fonction de Tlong _ mem et


Tshort _ mem pour un horizon de 10 minutes

5.3.3 Les taux d’amélioration par rapport à la persistance : improvMAE et


improv RMSE .

Contrairement aux erreurs NRMSE et NMAE évoquées dans la section 5.3.1, les taux
d’améliorations par rapport à la persistance sont plus sensibles aux variations des paramètres
Tshort _ mem et Tlong _ mem . En effet une augmentation de la valeur de Tlong _ mem améliore. De façon

improvMAE et improv RMSE . C’est notamment le cas illustré dans les Figures 5-14 en fixant

Tshort _ mem = 30 minutes et en faisant varier Tlong _ mem , nous passons pour improvMAE de -24,21 %

à 2.69 %. Nous remarquons aussi que la valeur de Tshort _ mem à une influence sur les valeurs des

taux d’améliorations, mais il est difficile à ce stade de nos travaux de déterminer le sens de
cette influence.

107
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

30

20

10
(%)

0
MAE

-10
Improv

-20

-30

-40
30
25 24
20 20
15 16
12
10 8
5 4
T (minutes) Tlong-mem (heures)
short-mem

(a)

20

10
(%)
RMSE

0
Improv

-10

-20
30
25 24
20 20
15 16
12
10 8
5 4
T (minutes) Tlong-mem (heures)
short-mem

(b)

Figure 5-14 : Evolution de improvMAE (a) et improv RMSE (b) en fonction de Tlong _ mem et Tshort _ mem
pour un horizon de 5 minutes

Dans la suite du chapitre nous allons poursuivre l’investigation sur les paramètres interne ou
externes qui influencent la performance du schéma de prédiction. Ainsi, nous intégrerons la

108
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

typologie du signal d’entrée, caractérisée en termes de coefficient de variation, à notre


analyse.

5.4 Sensibilité de la performance du schéma de prévision par


rapport aux conditions de vent.

Le vent est une ressource très fluctuante ; les conditions météorologiques peuvent donc
évoluer rapidement sur un site de production éolienne. Ceci rend nécessaire des paramétrages
différents du schéma de prévision selon que les régimes de vent et donc de puissance sont
stables ou agités sur la période considérée. Ces considérations nous conduisent à examiner en
quoi la nature turbulente de l’écoulement autour du site de production à une influence sur la
qualité de la prévision. Plus spécifiquement, nous rechercherons à mettre en évidence
l’influence du régime de vent sur les principaux paramètres du schéma de prévision ;
Tlong _ mem et Tshort _ mem .

Le caractère turbulent d’une séquence de données de vent sera caractérisé par le


coefficient « intensité de la turbulence ».
v
Iv 
U (7)
Où  v est l’écart type de l’échantillon et U est la vitesse moyenne de l’échantillon.
Dans notre étude nous avons, pour l’essentiel, utilisé le signal de puissance électrique. Par
analogie nous avons caractérisé le régime de l’écoulement autour du site étudié, par le
coefficient de variation du signal de puissance :
p
Ip 
P (8)

Où  P est l’écart type de l’échantillon de puissance et P est la puissance moyenne de


l’échantillon.
Nous commencerons notre analyse sur un premier échantillon de puissance test (Figure 5-16)
classé à « fort coefficient de variation » puisque le coefficient de variation, évalué pour des
portions de données de longueur différentes reste supérieur à 24%. Le Tableau 5-2 répertorie

109
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

le coefficient de variation de toutes les portions de l’échantillon test choisis en fonction de la


valeur de Tlong _ mem . Différentes valeurs des deux principaux paramètres du schéma de

prévision, Tlong _ mem et Tshort _ mem seront expérimentés :

 Tlong _ mem : 2 heures, 4 heures, 8 heures, 12 heures, 16 heures, 20 heures et 24 heures.

 Tshort _ mem : 5 minutes, 10 minutes, 15 minutes, 20 minutes, 25 minutes et 30 minutes.

6000

5500

5000

4500
Puissance (kW)

4000

3500

3000

2500

2000

1500

1000
0 2 4 6 8 10 12 14 16 18 20 22 24
Temps (Heures)

Figure 5-15 : Echantillon complet utilisé pour la détermination des paramètres dans le cas 1

110
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

Coefficient de
Echantillons Moyenne (µ) Ecart type (σ)
variation (%)
Tlong _ mem = 2h 3438.8 kW 845.4 kW 24.5 %

Tlong _ mem = 4h 3684.5 kW 905.3 kW 24.6 %

Tlong _ mem = 8h 3054.6 kW 985.7 kW 32.2 %

Tlong _ mem = 12h 3332.3 kW 949.5 kW 28.5 %

Tlong _ mem = 16h 3151.8 kW 909.6 kW 28.8 %

Tlong _ mem = 20h 2933 kW 928.8 kW 31.7 %

Tlong _ mem = 24h 2820.9 kW 893.4 kW 31.6 %

Tableau 5-2 : Moyennes, écarts type et coefficient de variation de chaque échantillon utilisé
pour l'apprentissage en fonction de Tlong _ mem

20

10

-10
Improv MAE (%)

-20

-30

5 minutes
-40 10 minutes
15 minutes
20 minutes
-50
25 minutes
30 minutes
-60
2 4 8 12 16 20 24
Tlong-mem (Heures)

(a)

111
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

20

10

-10
Improv MAE (%)

-20

-30

-40
5 minutes
10 minutes
-50
15 minutes
20 minutes
-60 25 minutes
30 minutes
-70
2 4 8 12 16 20 24
Tlong-mem (Heures)

(b)

20

10

-10

-20
Improv MAE (%)

-30

-40

-50 5 minutes
10 minutes
-60 15 minutes
20 minutes
-70 25 minutes
30 minutes
-80
2 4 8 12 16 20 24
Tlong-mem (Heures)

(c)

Figure 5-16 : improvMAE pour des horizons de 20 (a), 30 (b) et 40 minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem

112
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

20

-20

-40
Improv RMSE (%)

-60

-80

5 minutes
-100 10 minutes
15 minutes
-120 20 minutes
25 minutes
30 minutes
-140
2 4 8 12 16 20 24
Tlong-mem (Heures)

(a)

40

20

-20
Improv RMSE (%)

-40

-60

-80

-100
5 minutes
10 minutes
-120 15 minutes
20 minutes
-140 25 minutes
30 minutes
-160
2 4 8 12 16 20 24
Tlong-mem (Heures)

(b)

113
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

40

20

-20
Improv RMSE (%)

-40

-60

-80
5 minutes
10 minutes
-100
15 minutes
20 minutes
-120 25 minutes
30 minutes
-140
2 4 8 12 16 20 24
Tlong-mem(Heures)

(c)

Figure 5- 17 : improv RMSE pour des horizons de 20 (a), 30 (b) et 40 (c) minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem

De façon générale, on remarque qu’il y a une augmentation du taux d’amélioration par rapport
à la persistance suivant l’accroissement des valeurs de Tlong _ mem . Les valeurs de improvMAE et

improv RMSE sont presque toujours positives à partir de Tlong _ mem = 8 heures et atteignent leurs

maximum pour 16 heures, tout en notant qu’à partir de 12 heures nous remarquons que les
améliorations évoluent très lentement (Figures 5-16 et 5-17). Nous remarquons qu’il est plus
difficile de conclure sur l’influence des valeurs de Tshort _ mem . On remarque tout de même

qu’on semble avoir une meilleure amélioration par rapport à la persistance pour Tshort _ mem = 20

minutes dans le cas où les horizons sont de 30 et 40 minutes, tandis que dans le cas où
l’horizon est de 20 minutes la valeur de Tshort _ mem la plus adéquate semble être 5 minutes.

Nous continuons notre analyse sur un second échantillon test (Figure 5-18) pour lequel il est
plus difficile de conclure en termes de typologie de variation.

114
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

7000

6000

5000
Puissance (kW)

4000

3000

2000

1000
0 2 4 6 8 10 12 14 16 18 20 22 24
Temps (Heures)

Figure 5-18 : Echantillon complet utilisé pour la détermination des paramètres dans le cas 2

Le Tableau 5-3 répertorie le coefficient de variation pour toutes les portions test, en fonction
de la valeur de Tlong _ mem .

Coefficient de
Echantillons Moyenne (µ) Ecart type (σ)
Variation (%)
Tlong _ mem = 2h 5359.5 kW 145.6 kW 2.71

Tlong _ mem = 4h 4666.3 kW 740.56 kW 15.9

Tlong _ mem = 8h 4549.6 kW 636.98 kW 14

Tlong _ mem = 12h 4736.9 kW 712.33 kW 15.04

Tlong _ mem = 16h 4289 kW 1083.8 kW 25.27

Tlong _ mem = 20h 4283.4 kW 1045.1 kW 24.40

Tlong _ mem = 24h 4208.6 kW 986.8kW 23.45

Tableau 5-3 : Moyennes, écarts type et coefficient de variation de chaque échantillon utilisé
pour l'apprentissage en fonction de la longueur de Tlong _ mem

115
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

-2
5 minutes
-4 10 minutes
15 minutes
-6 20 minutes
25 minutes
-8 30 minutes

-10
Improv MAE (%)

-12

-14

-16

-18

-20

-22
2 4 8 12 16 20 24
Tlong-mem (Heures)

(a)

10
5 minutes
10 minutes
15 minutes
5
20 minutes
25 minutes
30 minutes
0
Improv MAE (%)

-5

-10

-15

-20
2 4 8 12 16 20 24
Tlong-mem (Heures)

(b)

116
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

-5

-10

-15
Improv MAE (%)

-20

-25

5 minutes
-30 10 minutes
15 minutes
-35 20 minutes
25 minutes
30 minutes
-40
2 4 8 12 16 20 24
Tlong-mem (Heures)

(c)

Figure 5-19 : improvMAE pour des horizons de 20 (a), 30 (b) et 40 (c) minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem

4
5 minutes
10 minutes
2
15 minutes
20 minutes
0 25 minutes
30 minutes
-2
(%)

-4
RMSE
Improv

-6

-8

-10

-12

-14
2 4 8 12 16 20 24
Tlong-mem (Heures)

(a)

117
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

10

0
Improv RMSE (%)

-5

-10
5 minutes
10 minutes
15 minutes
-15
20 minutes
25 minutes
30 minutes
-20
2 4 8 12 16 20 24
Tlong-mem (Heures)

(b)

-5

-10
Improv RMSE (%)

-15

-20

-25 5 minutes
10 minutes
15 minutes
-30 20 minutes
25 minutes
30 minutes
-35
2 4 8 12 16 20 24
Tlong-mem (Heures)

(c)

Figure 5-20 : improv RMSE pour des horizons de 20 (a), 30 (b) et 40 (c) minutes en fonction de
Tlong _ mem et pour différentes valeurs de Tshort _ mem

118
Chapitre 5 : Modèle de prévision de la puissance éolienne à court-terme

Dans ce second cas, on remarque nettement que le meilleur taux d’amélioration par rapport à
la persistance est atteinte pour une mémoire longue de Tlong _ mem = 12 heures quelque soit

l’horizon de prédiction. Contrairement au premier cas l’amélioration ne se stabilise pas mais


après avoir atteint un maximum elle décroit.
L’amélioration par rapport à la persistance est légèrement plus élevée pour un horizon de 30
minutes mais ne dépasse pas 10%.
De plus, il apparaît que Tshort _ mem = 25 minutes ou 30 minutes soient les valeurs les plus

performantes quand on se place à des horizons de prédiction de 20 et 30 minutes.


(Figures 5-19 (a,b) et Figures 5-20 (a,b)).

Conclusion
Nous avons observé que le nombre d’entrée le plus adéquat lors du choix des paramètres du
réseau doit être petit, n inp = 5, et qu’augmenter ce nombre n’augmente pas la qualité de la

prédiction ni la performance du réseau. Nous avons aussi observé que les variations de
n’avaient pas de grande influence sur les erreurs. Par contre plus Tlong _ mem et Tshort _ mem sont

importants, plus l’amplitude de l’intervalle de confiance est faible. Ce qui vient du fait que,
plus le prédicteur a des données à sa disposition plus il a confiance en sa prédiction, sans pour
autant assurer, que pour ces valeurs, la prédiction soit réellement de meilleure qualité.
La nature turbulente ou pas de l’écoulement autour du site de production à une influence sur
la qualité de la prévision. Plus spécifiquement, cette influence s’exprime par l’existence d’un
couple optimal, fonction des conditions de vent sur le site. Une première analyse de sensibilité
de la performance du schéma de prédiction aux conditions de vent via les séquences de
puissance observée, fait apparaître Tlong _ mem = 12 heures, comme un bon compromis quelques

soient les conditions de vent.


Pour aller plus loin dans les conclusions, dans le chapitre 6, nous discuterons de l’intérêt de
détecter « l’état » (le régime de variation) dans lequel on se trouve au moment où est calculée
la prévision. Ceci, couplée à une évaluation de la transition d’un régime de variation vers un
autre, devrait permettre de compléter l’analyse entamée à la section 5.4. Ce dernier sera
l’objet du chapitre 7.

119
Chapitre 6

Classification des séquences


de puissance

Introduction

Il nous a paru intéressant de développer une méthode qui permet de détecter « l’état » (le
régime de variation) dans lequel on se trouve au moment où est calculé la prévision. Dans ce
chapitre, nous présenterons une procédure de classification de séquences de la puissance
électrique produite par les éoliennes. Pour ce faire, on se propose, dans un premier temps, de
classer les séquences d’une durée de 12 heures du signal de puissance éolienne selon la
distribution du coefficient de variation (définie comme le rapport entre l’écart type et la
puissance moyenne) calculée pour les sous-échantillons d’une heure de chaque séquence de
12 heures. La procédure de classification utilisée est basée sur la méthode des C-moyennes
floues : FCM (Fuzzy C-means en anglais).
Dans un second temps, une procédure basée sur le formalisme des chaines de Markov, nous
permet d’évaluer la probabilité d’occurrence des différent « états » ou régimes de variation à
partir des séquences observées dans le passé récent.

6.1 La méthode des C-moyennes floues

La méthode des C-moyennes floues est une méthode de classification itérative qui permet de
classer des individus (ou échantillons) selon C classes. Elle permet de déterminer les centres

120
Chapitre 6 : Classification des séquences de puissance

des classes et génère la matrice qui permet d’estimer l’appartenance des individus à une de
ces classes prédéfinies. [68].
Le but principal de cette méthode est la minimisation d’une fonction coût, qui est
normalement choisie pour être la distance totale entre tous les échantillons et les centres de
classes [69].
La méthode des C-moyennes floues est un algorithme d’optimisation itératif qui minimise la
fonction coût suivante [68, 69, 70]:

n c
J (U ,V )    ikm xk  vi
2
(1)
k 1 i 1

Où n désigne le nombre de points total de la séquence, c le nombre classe, xk est le kième

point de la séquence, vi le iième centre de classe et ik est le degré d’appartenance du k ième

point à la iième classe et m est une constante supérieure à 1 (en général m  2) .


La distance utilisée est la distance euclidienne.
En dérivant la fonction J (U ,V ) selon vi (en fixant U ) et selon ik (en fixant V ) on obtient
les deux équations suivantes [68,71] :

 ( ik ) m xk (2)
vi  k 1
n

 (
k 1
ik )m

1 (3)
 ik  2 ( m 1)
c  x k  vi 
 
  x v 
j 1
 k j 

L’algorithme de classification par C-moyenne floue peut être résumé de la façon


suivante [68,69]:
Soit X k  ( x1 , x2 ,...) les vecteurs représentant les individus à classer.

121
Chapitre 6 : Classification des séquences de puissance

1. Fixer les paramètres empiriques :


- m (1  m   ) « coefficient floue » : coefficient qui peut être considéré comme étant
un paramètre de distorsion, il accentue les faibles niveaux d’appartenance et contribue
à mieux séparer les classes [70].
- C (2  C  n) : le nombre de classes
-  : critère d’arrêt : critère qui permet de déterminer la condition pour laquelle un point
appartient à une classe.
2. Initialiser le vecteur V par C centres aléatoirement choisis.
3. Calculer la matrice U des ik à l’aide de l’équation (2).

4. Calculer le nouveau centre de classe de chaque classe à l’aide de l’équation (2):


5. Mettre à jour la matrice U et incrémenter le compteur à l’aide de l’équation (3)
6. Calculer la distance entre les nouveaux et les anciens centres par :

h  V t 1  V t (4)

7. Répéter les étapes de 3 à 6 tant que h   .

6.2 Classification des séquences de puissance éolienne

Nous disposons de 25 semaines de données enregistrées avec un pas de temps d’une seconde.
Nous illustrerons la méthodologie sur ces données.
Dans un premier temps, nous calculons le coefficient de variation pour tous les échantillons
de 12 heures extraits des 25 semaines de données.
En traçant le coefficient de variation en fonction de la valeur moyenne de la puissance (Figure
6-1), on remarque que les plus fortes valeurs du coefficient de variation se retrouvent surtout
pour de faible valeur de la puissance moyenne.

122
Chapitre 6 : Classification des séquences de puissance

160

140

120
Coefficient de variation (%)

100

80

60

40

20

0
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Puisance moyenne (kW)

Figure 6-1 : Coefficient de variation en fonction de la puissance moyenne pour les


échantillons de puissance électrique de 12 heures

La question que l’on peut se poser alors est de savoir si le coefficient de variation calculée
pour un échantillon complet de 12 heures est assez représentatif des différents régimes de
puissance observés sur le site, au cours de cette période.
Pour le vérifier, on calcule le coefficient de variation toutes les heures et on la compare au
coefficient de variation calculé pour l’ensemble des 12 heures, suivant l’équation (5) :

I 1h  I 12h (5)
ecart 
I 12h

La Figure 6-2 montre que l’on atteint jusqu'à 200% d’écart avec la valeur du coefficient de
variation calculés sur 12 heures. De façon générale les valeurs calculées sur une période d’1
heure sont inférieures à celles calculées sur 12 heures.

123
Chapitre 6 : Classification des séquences de puissance

200

150

100
Ecart (%)

50

-50

-100
0 5 10 15 20 25
Temps (semaines)

Figure 6-2 : Ecart (%) entre la valeur du coefficient de variation calculée sur une heure et
celle calculée sur 12 heures

Les données sont découpées en séquences de 12 heures, puis chaque séquence de 12 heures
est découpée en sous-échantillon d’une heure. Le coefficient de variation est calculé pour
chaque sous-échantillon d’une heure afin d’obtenir la répartition de ces 12 coefficients de
variation, pour chaque échantillon de 12 heures. On se retrouve donc avec 339 échantillons de
12 heures associés à 339 histogrammes des valeurs du coefficient de variation obtenus pour
les sous-échantillons d’une heure.

En analysant la répartition du coefficient de variation sur les échantillons d’une heure et de 12


heures, on remarque que dans le second cas les valeurs inférieures à 10% sont inexistantes
(Figure 6-3). Ce qui signifie que les épisodes faiblement variable ont une durée inférieure à 12
heures. En d’autres termes les régimes de puissance stables ont une durée inférieure à 12
heures.

124
Chapitre 6 : Classification des séquences de puissance

35

30

25
Echantillon d'une heure (%)

20

15

10

0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170
Coefficient de variation (%)

(a)

27

24

21
Intervalles de 12 heures (%)

18

15

12

0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170
Coefficient de variation (%)

(b)

Figure 6-3 : Distribution des échantillons d'une heure (a) et 12 heures (b) en fonction de la
valeur du coefficient de variation.

Nous avons donc déterminé pour chaque séquence de 12 heures, la distribution des 12 valeurs
du coefficient de variation calculées pour chaque sous-séquence d’une heure. On fixe 3
intervalles (exprimée en %) : 0 ≤ Ip ≤ 15 ; 15 < Ip ≤ 40 et Ip > 40 qui correspondent

125
Chapitre 6 : Classification des séquences de puissance

respectivement à des régimes, que nous jugeons, faiblement variable, moyennement variable
et fortement variable. Des exemples de séquence puissance d’une heure correspondant à
chaque intervalle sont représentés sur les Figures 6-4, 6-5 et 6-6.

2200 8.5

2000 8

1800 7.5

1600 7

Vitesse du vent (m/s)


Puissance (kW)

1400 6.5

1200 6

1000 5.5

800 5

600 4.5
Coefficient de variation = 5,52 % Intensité de la turbulence = 1,61 %
400 4

200 3.5
0 10 20 30 40 50 60 0 10 20 30 40 50 60
Temps (minutes) Temps (minutes)

(a) (b)

Figure 6-4 : Séquence de puissance (a) et vitesse de vent associée (b) représentant un régime
faiblement variable, coefficient de variation 0 ≤ Ip ≤ 15

126
Chapitre 6 : Classification des séquences de puissance

2200 8.5

2000 8

1800 7.5

1600 7

Vitesse du vent (m/s)


1400 6.5
Puissance (kW)

1200 6

1000 5.5

800 5

600 4.5
Coefficient de variation = 25,26 % Intensité de la turbulence = 4,07 %
400 4

200 3.5
0 10 20 30 40 50 60 0 10 20 30 40 50 60
Temps (minutes)
Temps (minutes)

(a) (b)

Figure 6-5 : Séquence de puissance (a) et vitesse de vent associée (b) représentant un régime
moyennement variable, coefficient de variation 15 < Ip ≤ 40

2200 8.5
Coefficient de variation =57,12 % Intensité de la turbulence = 19,26 %
2000 8

1800
7.5
1600
7
Vitesse du vent (m/s)

1400
Puissance (kW)

6.5
1200
6
1000
5.5
800
5
600
4.5
400

200 4

0 3.5
0 10 20 30 40 50 60 0 10 20 30 40 50 60
Temps (minutes) Temps (minutes)

(a) (b)
Figure 6-6 : Séquence de puissance (a) et vitesse de vent associée (b) représentant un régime
fortement variable, coefficient de variation Ip > 40

127
Chapitre 6 : Classification des séquences de puissance

Chaque échantillon de 12 heures est alors représenté par un histogramme à trois coordonnées
définies comme le nombre de sous séquences d’une heure dont le coefficient de variation
appartient à chacun des trois intervalles précités. La répartition des séquences de 12 heures,
dans l’espace défini par ces trois cordonnées, est donnée sur la Figure 6-7.
Notons que dans cet espace, certaines séquences ont les mêmes coordonnées. D’où le faible
nombre de points représentés par rapport au nombre total d’échantillons.

12
Coefficient de variation ]40,+100%]

10

0
12
10
12
8 10
6 8
4 6
4
2 2
0 0
Coefficient de variation ]15,40 %] Coefficient de variation ]0,15 %]

Figure 6-7 : Nuage de points représentant la répartition des coefficients de variation des
échantillons de 12 heures.

Par la suite, nous appliquerons la méthode des C-moyennes floues, expliquée en début de
chapitre, pour répartir les séquences de 12 heures représentées par ce nuage de points, en 3
classes. Suivant la pratique relevée dans la littérature, le paramètre m est fixé à m  2 .

128
Chapitre 6 : Classification des séquences de puissance

6.3 Détermination et stationnarité des centres de classes

Les coordonnées des centres de classe sont calculées avec la méthode des C-moyennes floues
à partir des coordonnées des 339 échantillons de 12 heures. Afin de valider les coordonnées
obtenues pour les 3 centres de classes, on cherchera à vérifier leur stationnarité.
Pour ce faire on calcule les coordonnées des centres de classes pour des jeux de données dont
la taille varie (Tableau 6-1). Au vu des résultats présentés on peut déduire que les
coordonnées des centres de classes évoluent peu en fonction de la taille des données (Figure
6-8).
Temps Coordonnées des centres de classes.
[6,80 ; 4,36 ; 0,83]
2 semaines [3,40 ; 8,21 ; 0,37]
[1,29 ; 4,40 ; 6,30]
[7,94 ; 3,50 ; 0,55]
4 semaines [3,60 ; 7,45 ; 0,93]
[0,82 ; 3,90 ; 7,20]
[7,40 ; 3,55 ; 0,60]
6 semaines [3,56 ; 7,22 ; 1,21]
[0,66 ; 3,25 ; 8,08]
[7,55 ; 3,72 ; 0,72]
8 semaines [3,21 ; 7,25 ; 1,53]
[0,81 ; 3,07 ; 8,10]
[7,47 ; 3,91 ; 0,61]
10 semaines [3,22 ; 7,23 ; 1,54]
[0,91 ; 3,13 ; 7,95]
[8,63 ; 3,02 ; 0,34]
12 semaines [3.53 ; 7,10 ; 1,36]
[0,95 ; 3,22 ; 7,82]
[9,17 ; 2,49 ; 0,32]
14 semaines [3,73 ; 7,01 ; 1,25]
[0,97 ; 3,28 ; 7,73]
[9,69 ; 2,08 ; 0.21]
16 semaines [3,93 ; 6,88 ; 1,78]
[1,02 ; 3,39 ; 7,58]
[9,59 ; 2,19 ; 0,21]
18 semaines [4,07 ; 6,80 ; 1,12]
[1,03 ; 3,42 ; 7,54]
[9,72 ; 2,07 ; 0,21]
20 semaines [4,22 ; 6,65 ; 1,13]
[0,97 ; 3,55 ; 7,47]
[9,74 ; 2,06 ; 0,19]
22 semaines [4,32 ; 6,63 ; 1,05]
[1,03 ; 3,72 ; 7,24]

Tableau 6-1 : Evolution des coordonnées des centres de classes

129
Chapitre 6 : Classification des séquences de puissance

10
Coefficient de variation [40;+100 %]

0
10
8 10
8
6 6
4 4
2
2 0
Coefficient de variation [15,40 %[ Coefficient de variation [0,15 %[

Figure 6-8 : Représentation des centres de classes calculés Tableau 6-1

Après le calcul des coordonnées des centres de classe sur la totalité de l’échantillon (environ
25 semaines). Nous obtenons les centres de classe suivant pour le reste de l’étude :

[ 0.78 ; 4.50 ; 6.70 ]

C= [ 4.08 ; 7.03 ; 0.88 ]

[ 9.67 ; 2.16 ; 0.16 ]

L’appartenance de chaque échantillon à une classe donnée est déterminée en fonction des trois
valeurs ik qui donnent le degré d’appartenance d’un échantillon k à une classe i .

L’échantillon fera partie de la C-classe pour laquelle la valeur de ik sera la plus grande.

130
Chapitre 6 : Classification des séquences de puissance

Nous avons représenté sur la Figure 6-6, la répartition des 339 échantillons dans les 3 classes
trouvés.
Le Tableau 6-2 donne le pourcentage d’échantillon appartenant à chaque classe. On remarque
que la plus grande population (45,1%) est observée pour la seconde classe qui correspond à
des régimes de variation majoritairement moyens. Vient ensuite la classe des échantillons
faiblement variables (33,7%) puis celles des échantillons fortement variables (21,2 %).

Classe 1
Centre de classe 1
Classe 2
12 Centre de classe 2
Coefficient de variation ]40,+100%]

Classe 3
10 Centre de classe 3

0
12
10
12
8 10
6 8
4 6
4
2 2
0 0
Coefficient de variation ]15,40 %] Coefficient de variation ]0,15 %]

Figure 6-9 : Représentation des échantillons en fonction des 3 classes

Classes 1 : fortement 2 : moyennement 3 : faiblement


variable variable variable
Pourcentages 21,2 % 45,1 % 33,7 %

Tableau 6-2 : Pourcentage d’appartenance à chaque classe calculé sur la totalité de


l’échantillon

131
Chapitre 6 : Classification des séquences de puissance

La méthode présentée ci–dessus permet d’identifier le régime de variation sur les 12 dernières
heures précédent un instant t .
Cette information sera associée, dans le cadre d’un formalisme de type chaînes de Markov, à
la valeur du coefficient de variation du signal de puissance, sur l’heure qui suit
immédiatement l’instant t (Figure 6-10).

t -12 h t t+τ

Fourni une
prévision à
l’horizon t+τ

Détermination Calcul de la probabilité Choix du jeu de


du régime de d’occurrence d’une valeur paramètres pour
variation sur les du coefficient de variation l’étalonnage du
12 dernières durant l’heure suivante prédicteur
heures.

Figure 6-10 : Schéma de la stratégie de prévision

Dans la section suivante, nous étudierons le séquençage dans le temps ; régimes des 12
dernières heures  valeurs du coefficient de variation de la puissance durant l’heure à venir.
A l’aide de la méthodologie des chaines de Markov, nous établirons les matrices de
probabilité de passage d’un des trois régimes (fortement variable, moyennement variable et
faiblement variable) détectée sur les 12 dernières heures, à la gamme de valeur à laquelle
appartiendra le coefficient de variation pour l’heure qui suit immédiatement. La section
suivante rappelle le principe d’une chaine de Markov.

132
Chapitre 6 : Classification des séquences de puissance

6.4 La méthodologie des Chaines de Markov

Une chaine de Markov est un processus stochastique qui peut être paramétré par une
estimation empirique des probabilités de transition entre des états discrets d’un système
observé [72].
Soit  X n nN une suite de variables aléatoires à valeurs dans un espace dénombrable  appelé

espace des états. On dit que  X n nN est une chaine de Markov si et seulement si /

   
P X n 1  j X n  i , X n 1  in 1 ,..., X à  ià  P X n1  j X n  i . (6)

pour tout état j et pour toute suite d’état i0 , i1 ,..., in 1 , i pour lesquels la probabilité

conditionnelle a un sens [73,74,75] c'est-à-dire tels que :

P X n  i, X n1  in1 ,..., X 1  i1 , X à  io   0 (7)

Une chaîne de Markov  X n nN est dite homogène (dans le temps) si P  X n 1  in 1 X n  in  ne

dépend pas de n .
C'est-à-dire que les changements d’états ne dépendent que de l’état en cours et pas de la date.
La dynamique du processus est alors entièrement caractérisée par les pi , j  P( X n1  j X n  i )

appelée probabilité de transition de l’état i à l’état j si la chaîne est homogène.

Une chaîne de Markov du premier ordre se caractérise par le fait que chaque état dépend
seulement de l’état le précédent immédiatement, tandis que les chaînes de Markov du second
ordre voire plus sont un processus dans lequel l’état suivant dépend des deux voire plus
d’états précédents [72]. L’ensemble des probabilités de transition entre un jeu d’états
prédéfinis permet de définir la matrice de transition.

133
Chapitre 6 : Classification des séquences de puissance

Une matrice M  ( p , i, j  I ) est une matrice stochastique ou de transition si chaque


i, j

ligne p  ( p , j  I ) est une distribution de probabilité.


i i, j

Pour tout i, j  E , p peut alors s’interpréter comme la probabilité d’aller à l’état j sachant
i, j

qu’on se trouve à l’état i à l’instant d’avant. Ce qui peut être calculé à partir de ni , j , le

nombre de transitions observées entre les états i et j :


nij (8)
pi , j 
n j
ij

(9)
p
j 1
ij 1

Les chaînes de Markov ont été utilisées pour générer ou simuler des séquences de vent plus
ou moins réalistes [72, 76, 77, 78]. Ici, on utilisera seulement les probabilités fournies par la
matrice de transition pour inférer la valeur du coefficient de variation de la puissance
électrique durant l’heure à venir.

Cette information sera associée à une procédure d’apprentissage proposé dans le chapitre
précédent pour associer un couple optimal, ( Tshort _ mem , Tlong _ mem ), à la valeur augurée du

coefficient de variation, indiquant ainsi au prédicteur le jeu de paramètres susceptible de


convenir pour la prédiction à court terme de la puissance éolienne.
Après avoir déterminé la classe à laquelle appartient chaque échantillon de 12 heures à l’aide
de la méthode FCM, L’approche markovienne permet d’estimer la probabilité qu’à partir
d’une classe donnée, la valeur du coefficient de variation de la puissance au cours de l’heure
qui suit, appartienne à l’un des intervalles prédéfinis.
Pour classer les valeurs du coefficient de variation calculé sur l’heure succédant chaque
séquence de 12 heures, nous utilisons la segmentation employée lors du calcul des
coordonnées des séquences.
On distingue alors 9 combinaisons de transitions possibles puisqu’il existe 3 états associés
aux classes de variation (définies précédemment) et 3 intervalles pour les valeurs du
coefficient de variation.

134
Chapitre 6 : Classification des séquences de puissance

A partir des données expérimentales on trouve la matrice de transition suivante :

 0,44 0,43 0,13 


 
M   0,11 0,50 0,39
 0,02 0,27 0,71
 

On remarque qu’il n’y a pas de probabilité nulle et que chaque combinaison est observée à
plusieurs reprises au cours des 25 semaines de données à notre disposition.
Cette matrice de transition permet d’indiquer à un instant t la probabilité que l’on a de se
trouver dans un régime de variation dans l’heure suivante sachant le régime dans lequel on se
trouvait durant les 12 heures précédentes.
On pourra ainsi pondérer les prévisions obtenues lors de l’utilisations des couples ( Tshortmem ,

Tlongmem ) optimaux que l’on déterminera dans le chapitre suivant.

Conclusion
Nous avons déterminé, dans ce chapitre, 3 régimes de variation associés au signal de
puissance électrique, en appliquant une classification par la méthode des C-moyennes floues.
Cette classification a permis de mettre en exergue que le régime de variation le plus
représentatif est celui qui a un coefficient de variation moyen c'est-à-dire compris entre 15 et
40 %.
De plus en déterminant à un instant t donné, la matrice de transition entres ces 3 classes
(régimes de variation) et le coefficient de variation sur l’heure suivant l’instant t , nous avons
remarqué que les plus fortes probabilités de transition se trouvait sur la diagonale de la
matrice. Ceci indique que la probabilité la plus forte est de rester dans le même régime de
variation. Notons tout de même que les autres probabilités ne sont pas négligeables et qu’il
faudra en tenir compte.
Dans le chapitre 5 nous avions déterminé la valeur de Tlong _ mem la plus susceptible de

contribuer à une bonne prédiction mais l’étude n’avait pas permis de conclure sur les valeurs

135
Chapitre 6 : Classification des séquences de puissance

de Tshort _ mem . L’objectif poursuivi, dans le prochain chapitre, est de mettre en exergue une

méthodologie pour le calcul du jeu de paramètre optimal, ( Tshort _ mem , Tlong _ mem ), en vu de

l’étalonnage du prédicteur en fonction des régimes de variation rencontrés.

136
CHAPITRE 7

Influence des régimes de


variation des séquences de
puissance sur le paramétrage
du prédicteur

Introduction

Il nous parait intéressant d’évaluer l’influence des différents régimes de variation (étudié à
travers le signal de puissance électrique issu des aérogénérateurs) sur la valeur optimale des
principaux paramètres qui influencent les performances du prédicteur : Tshort _ mem et Tlong _ mem .

En combinant les outils développés aux chapitres 5 et 6, nous pourrions ainsi disposer d’une
procédure pour déterminer automatiquement la valeur optimale de ces paramètres en fonction
de l’évolution du régime de variation du signal de puissance. C’est l’objectif que l’on se fixe
dans le présent chapitre, qui vise à améliorer l’aptitude du schéma de prédiction à s’adapter
aux changements de régime de variation associés à la puissance électrique produite par les
aérogénérateurs.

7.1 Méthodologie pour le calcul du couple ( Tshort _ mem , Tlong _ mem ) optimal.

Etape 1 : Nous segmentons les données en séquences de 13 heures (12h +1h) et retenons une
sélection de séquences correspondant à chacune des neuf combinaisons de transition définies
dans le chapitre précédent.

137
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Etape 2 : Pour chaque séquence sélectionnée, nous appliquons le prédicteur à l’instant t


correspondant à la fin des 12 premières heures (qui définissent « l’état de départ »). Le
prédicteur calcule la prédiction pour un jeu de paramètres donné, dont le couple Tshort _ mem et

Tlong _ mem .

Etape 3 : Nous répétons l’étape 2 pour différents couples ( Tshort _ mem , Tlong _ mem ), les autres

paramètres du prédicteur sont maintenus constants. Nous obtenons ainsi, une série d’erreurs
de prévisions associées à chaque couple. A titre d’illustration nous ne présenterons que les
erreurs RMSE à travers improv RMSE .

Etape 4 : L’analyse des distributions de improv RMSE permet de détecter le couple

( Tshort _ mem , Tlong _ mem ) associé à la plus grande probabilité d’avoir une amélioration positive de

improv RMSE . La probabilité d’avoir Im provRMSE positif est donnée par l’ordonnée à l’origine
des courbes représentant la fonction de répartition de improv RMSE (Figure 1). Cette fonction
fournit la probabilité qu’à un instant t quelconque un signal aléatoire ait une amplitude X
inférieure à une valeur x .

0.9

0.8

0.7
Fonction de Répartition

0.6

0.5

0.4

0.3

0.2

0.1

0
-15 -10 -5 0 5 10 15 20
ImprovRMSE (%)

Figure 7-1 : Fonction de répartition

138
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Etape 5 : Le prédicteur est considéré meilleur que la persistance lorsque l’ordonnée à


l’origine de la fonction de répartition est inférieure ou égale à 0.5 (50%).

NOTATION :
Dans la suite du chapitre nous désignerons par C ( x, y) x , y 1, 2,3 la combinaison des transitions

entre un régime x de variation définie sur les 12 dernières heures et le régime de variation
y définie sur l’heure à venir. Pour chacune des 9 combinaisons de transition, l’analyse sera
conduite sur 30 échantillons représentant des situations empiriques extraites des 25 semaines
de données présentées au Chapitre 2.

7.2 Résultats

7.2.1 Recherche de Tshort _ mem optimal pour Tlong _ mem fixé à 12heures.

Dans la suite des premiers résultats présentés à la section 5.4 du chapitre 5, nous démarrons
cette étude en fixant Tlong _ mem à 12 heures

Pour chacune des 9 combinaisons nous avons testé 6 valeurs de Tshort _ mem (5, 10, 15, 20, 25 et

30 minutes) et trois horizons de prédictions (5, 10, et 15 minutes). On applique alors la


méthodologie définie à la section 7.1.

7.2.1.1 « Etat de départ » faiblement variable

 Combinaison de transition C (3,1)

Pour la combinaison de transition C (3,1) la moyenne des valeurs de improv RMSE est positive
pour les trois horizons de prédiction. Par exemple pour un horizon de prédiction de 5 minutes
on obtient 16,89 % (Tableau 1).

139
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Tshort _ mem 5 minutes 10 minutes 15 minutes 20 minutes 25 minutes 30 minutes

Im provRMSE 16.89 % 14.54 % 9.81 % 2.26 % -4.01% -4.03 %

Tableau 7-1 : Valeurs moyennes de improv RMSE pour la configuration C (3,1) et un horizon de
prédiction de 5 minutes

Horizon de prédiction=5 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-120 -100 -80 -60 -40 -20 0 20 40 60 80
ImprovRMSE (%)

Figure 7-2 : Fonction de répartition de improv RMSE pour la combinaison de transition C (3,1)

La fonction de répartition (Figure 7-2) confirme bien que la valeur Tshort _ mem = 5 minutes est

celle qui offre à improv RMSE la plus grande probabilité d’être supérieure à zéro (80 %). Donc,

dans ce cas, nous concluons que la valeur de Tshort _ mem la plus adéquate est 5 minutes.

La même analyse des valeurs moyennes et des fonctions de répartition a été effectuée pour
les horizons de 10 minutes et 15 minutes. Nous obtenons, pour l’horizon de prédiction de 10
minutes, la valeur optimale pour Tshort _ mem = 5 minutes et pour l’horizon de 15 minutes la

valeur optimale pour Tshort _ mem =10 minutes. Un exemple de prévision obtenu en appliquant les

valeurs trouvées est donné Figure 7-3.

140
2500
Puissance prédite
Puissance réelle
Persistance
2000
Intervalle de confiance

1500
Puissance (kW)

1000

500

-500
0 10 20 30 40 50 60
Temps (minutes)

Figure 7-3 : Prévision de puissance pour une combinaison C (3,1) , un horizon de 5 minutes et
Tshort _ mem =5 minutes

Les erreurs normalisées et le taux d’amélioration calculés pour évaluer la qualité de la


prévision sont donnés dans le Tableau 7-2.

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE CORR


1,29 % 2,62 % 3,59 % 3,38 % 14,61 % 24,77 % 0,95

Tableau 7-2 : Evaluation de la prévision représentée sur la Figure 7-3

 Combinaison de transition C (3,2)

Pour les combinaisons de transition C (3,2) et l’horizon de prédiction de 5 minutes les


prévisions effectuées avec Tshort _ mem = 5 minutes sont toujours positives comme c’est le cas

pour l’exemple présenté Figure 7-4, dans ce cas on ne gardera comme valeur optimale
Tshort _ mem = 5min.

141
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Horizon de prédiction=5 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-120 -100 -80 -60 -40 -20 0 20 40 60
ImprovRMSE (%)

Figure 7-4 : Densité de probabilité de improv RMSE pour une combinaison C (3,2) et un horizon
de prédiction de 5 minutes

Pour les deux autres horizons (10 et 15 minutes) les valeurs de Tshort _ mem qui se détachent sont

25 et 30 minutes (Figures 7-5 et 7-6). En effet, le choix final se portera sur 30 minutes car
cette valeur a une plus forte densité de probabilité d’avoir des valeurs de Im provRMSE

positive. La Figure 7-6 donne la densité de probabilité de improv RMSE pour une
combinaison C (3,2) , un horizon de prédiction de 15 minutes et pour Tshort _ mem = 25 et 30
minutes.

142
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Horizon de prédiction=15 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-150 -100 -50 0 50 100
ImprovRMSE (%)

Figure 7-5 : Fonction de répartition de improv RMSE pour une combinaison C (3,2) et un
horizon de prédiction de 15 minutes

Horizon de prédiction=15 minutes


1.4

TShort-mem=25 minutes
1.2
TShort-mem=30 minutes

1
densité de porbabilité (%)

0.8

0.6

0.4

0.2

0
-150 -130 -110 -90 -70 -50 -30 -10 0 10 30 50 70 90 100
ImprovRMSE (%)

Figure 7-6 : Densité de probabilité de improv RMSE pour une combinaison C (3,2) et un horizon
de prédiction de 15 minutes.

La fixation de ces paramètres permet, comme dans le cas précédent, d’obtenir par exemple les
prévisions suivantes (Figure 7-7 et 7-8, Tableau 7-3 et 7-4).

143
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

8000
Puissance prédite
Puissance réelle
7000 Persistance
Intervalle de confiance

6000
Puissance (kW)

5000

4000

3000

2000

1000
0 10 20 30 40 50 60
Temps (minutes)

Figure 7-7 : Prédiction pour un horizon d 5 minutes avec Tshort _ mem = 5 minutes pour une
combinaison de transition C (3,2)

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE CORR


- 1,32 % 4,33 % 5,35 % 5,23 % 28,62 % 35,83 % 0,98

Tableau 7-3 : Evaluation de la prévision représentée sur la Figure 7-7

Nous remarquons Figure 7-7 que l’intervalle de confiance atteint une largeur d’environ 3500
kW, mais nous remarquons Tableau 7-3 que les performances du prédicteur sont bonnes.
Comme nous l’avions évoqué Chapitre 5, la largeur de l’intervalle de confiance n’a pas
d’influence sur les performances du prédicteur mais renseigne sur la confiance qu’a le
prédicteur en sa prédiction. Le fait que sa largeur diminue quand les valeurs des paramètres
augmentent (Chapitre 5) démontre que plus le modèle a d’informations, plus il a confiance en
sa prédiction. Or, l’étude de l’influence des paramètres montre que les performances du
prédicteur ne répondent pas à la même logique.

144
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

4500
Puissance prédite
Puissance réelle
4000 Persistance
Intervalle de confiance
3500

3000
Puissace (kW)

2500

2000

1500

1000

500
0 10 20 30 40 50 60
Temps (minutes)

Figure 7-8 : Prévision de la puissance pour un horizon de 10 minutes avec Tshort _ mem = 10
minutes pour une combinaison C (3,2)

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE CORR


6,34 % 6,85 % 7,42 % 3,88 % 27,84 % 28,14 % 0,98

Tableau 7-4 : Evaluation de la prévision représentée sur la Figure 7-8

 Combinaison de transition C (3,3)

Dans le cas des combinaisons de transition C (3,3) , 5 minutes est la seule valeur de Tshort _ mem

qui semble convenir pour les trois horizons de prédiction (5,10 et 15 minutes). Cette valeur
convient car, pour chaque horizon de prédiction considéré, le calcul de la valeur moyenne de
improv RMSE montre que pour Tshort _ mem = 5 minutes on obtient la plus forte valeur moyenne

(Tableau 7-5) et a la plus grande probabilité d’être supérieure à zéro, par exemple 84 % pour
l’horizon de 5 minutes (Figure 7-9).

145
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Tshort _ mem 5 minutes 10 minutes 15 minutes 20 minutes 25 minutes 30 minutes

improv RMSE 10,55 % 9,33 % 7,62 % 6,75 % 4,88 % 8,12 %

Tableau 7- 5 : Valeurs moyennes de improv RMSE pour la configuration C (3,3) et un horizon de


prédiction de 5 minutes

Horizon de prédiction=5 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-40 -30 -20 -10 0 10 20 30 40
ImprovRMSE (%)

Figure 7-9 : Fonction de répartition de improv RMSE pour la combinaison C (3,3) et un horizon
de prédiction de 5 minutes

L’utilisation de ces paramètres optimaux permet aussi d’obtenir les calculs de prévisions
suivantes (Figure 7-10, Tableau 7-6)

146
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Puissnace prédite
4500 Puissance réelle
Persistance
Intervalle de confiance

4000
Puissance (kW)

3500

3000

2500

2000

0 10 20 30 40 50 60
Temps (minutes)

Figure 7- 10 : Prévision de la puissance avec un horizon de 15 minutes et Tshort _ mem = 5


minutes pour une combinaison C (3,3)

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE CORR


1,.81 % 2,98 % 3,64 % 3,19 % 2,76 % 3,87 % 0,64

Tableau 7- 6 : Evaluation de la prévision représentée Figure 7-10

7.2.1.2 « Etat de départ » moyennement variable

 Combinaison de transition C (2,1)

Dans le cas des combinaisons de transitions C (2,1) , Tshort _ mem = 5 minutes est la valeur de

Tshort _ mem qui convient pour l’horizon de prédiction de 5 minutes. En effet, pour cette valeur

nous obtenons une probabilité d’être supérieure à zéro égale à 60 % (Figure 7-11), de plus,
comme indiqué dans le tableau 7-7, pour cet horizon de prédiction Tshort _ mem = 5 minutes

obtient la valeur moyenne positive la plus élevée. La même analyse est faite pour l’horizon

147
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

de prédiction de 10 minutes avec Tshort _ mem = 30 minutes (Figure 7-12 et Tableau 7-7). Le

Tableau 7-7, indique que pour l’horizon de prédiction de 15 minutes, aucune valeurs de
Tshort _ mem ne permet de faire mieux que la persistance compte tenu des critères établis.

Horizon de prédiction=5 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-120 -100 -80 -60 -40 -20 0 20 40
ImprovRMSE (%)

Figure 7- 11 : Fonction de répartition de improv RMSE pour la combinaison C(2,1) et un


horizon de prédiction de 5 minutes

Horizon de prédiction=10 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-120 -100 -80 -60 -40 -20 0 20 40 60
ImprovRMSE (%)

Figure 7-12 : Fonction de répartition de improv RMSE pour la combinaison C(2,1) et un horizon
de prédiction de 10 minutes

148
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Horizon de prédiction=15 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-140 -120 -100 -80 -60 -40 -20 0 20 40 60
ImprovRMSE (%)

Figure 7-13 : Fonction de répartition de improv RMSE pour la combinaison C(2,1) et un horizon
de prédiction de 15 minutes

Tshort _ mem 5 minutes 10 minutes 15 minutes 20 minutes 25 minutes 30 minutes

τ = 5 min 4,54 2,19 -3,08 -8,14 -9,72 -1,38


τ = 10 min -1,84 -4,80 -5,63 -8,88 -4,44 0,41
τ = 15 min -9,54 -14,30 -13,92 -11,24 -8,17 -3,24

Tableau 7-7 : improv RMSE (%) pour les trois horizons de prédiction dans le cas de la
combinaison de transition C (2,1)

 Combinaison de transition C (2,2)

Dans le cas de la combinaison de transition C (2,2) , les résultats montrent que pour l’horizon

de prédiction de 5 minutes la valeur de Tshort _ mem qui permet d’obtenir les meilleurs résultats

est 5 minutes. Pour les horizons de 10 et 15 minutes cette valeur passe à 30 minutes. En effet,
pour ces deux horizons la valeur moyenne de l’amélioration par rapport à la persistance est
plus élevée pour Tshort _ mem = 30 minutes (Tableau 7-8) et la probabilité d’obtenir des valeurs de

improv RMSE supérieur à zéro est plus importante pour cette valeur de Tshort _ mem (Figure 7-14).

149
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

La Figure 7-15 présente un exemple de prévision obtenue avec cette valeur de Tshort _ mem pour

un horizon de prédiction de 10 minutes.

Horizon de prédiction=10 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes

0.7 TShort-mem=25 minutes


Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-50 -40 -30 -20 -10 0 10 20 30 40 50
ImprovRMSE (%)

Figure 7-14 : Fonction de répartition de improv RMSE pour C (2,2) et un horizon de prédiction
de 10 minutes

Tshort _ mem 5 minutes 10 minutes 15 minutes 20 minutes 25 minutes 30 minutes

improv RMSE -1,97 % -2,10 % -3,13 % 0,3 % 3,78 % 5,86 %

Tableau 7- 8 : Valeurs moyennes de improv RMSE pour un horizon de prédiction de 15 minutes

150
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Horizon de prédiction =10 minutes


2000
Puissance prédite
Puissance réelle
Persistance
1500 Intervalle de Confiance
Puissance (kW)

1000

500

-500
0 10 20 30 40 50 60
Temps (minutes)

Figure 7-15 : Prévision de la puissance avec un horizon de 10 minutes et Tshort _ mem = 30


minutes pour une combinaison C (2,2)

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE CORR


1,98 % 2,68 % 3,25 % 2,60 % 26,21 % 22,60 % 0,93

Tableau 7-9 : Evaluation de la prévision présentée Figure 7-15

 Combinaison de transition C(2,3)

Pour la combinaison de transition C(2,3) la performance du schéma de prédiction est moins


bonne que la simple persistance (Tableau 7-10) .

Tshort _ mem 5 minutes 10 minutes 15 minutes 20 minutes 25 minutes 30 minutes

τ = 5 min -0,44 -0,34 -2,13 -2,90 -2,70 -0 ,86


τ = 10 min -6,25 -4,44 -11,23 -12,24 -8,63 -7,99
τ = 15 min -12,03 -10,44 -17,01 -18,78 -15,74 -15,84

Tableau 7-10 : improv RMSE (%) pour les trois horizons de prédiction dans le cas de la
combinaison de transition C(2,3)

151
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

7.2.1.3 Etat de départ « fortement variable»

Pour les combinaisons de transitions C (1,1) , C (1,2) , C (1,3) , les valeurs de Tshort _ mem testées ne

permettent pas d’obtenir des taux d’amélioration par rapport à la persistance positifs et la
probabilité d’atteindre des valeurs de Im provRMSE supérieures à zéros ne dépasse pas les 30
% dans les meilleurs des cas.
Par exemple ci-dessous (Figure 7-16, Tableau 7-11) les résultats pour la configuration
C (1,1) : passage d’un régime fortement variable à un autre régime fortement variable et un
horizon de 5 minutes.

Horizon de prédiction=5 minutes


1
TShort-mem=5 minutes
0.9 TShort-mem=10 minutes
TShort-mem=15 minutes
0.8
TShort-mem=20 minutes
0.7 TShort-mem=25 minutes
Fonction de Répartition

TShort-mem=30 minutes
0.6

0.5

0.4

0.3

0.2

0.1

0
-450 -400 -350 -300 -250 -200 -150 -100 -50 0 50
ImprovRMSE (%)

Figure 7-16 : Fonction de répartition de improv RMSE pour la combinaison de transition


C (1,1) et un horizon de prédiction de 5 minutes

Tshort _ mem 5 minutes 10 minutes 15 minutes 20 minutes 25 minutes 30 minutes

improv RMSE -18,26 % -25.21 % -30,63 % -24,94 % -30,55 % -38,33 %

Tableau 7- 11 : improv RMSE pour la combinaison de transition C (1,1) suivant les différents et
pour un horizon de prédiction de 5 minutes

152
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

7.2.2 Généralisation de l’analyse pour Tlongmem = 9 et 18 heures.

Les résultats obtenus avec une valeur de Tlong _ mem = 12 heures pour les 4 configurations de

transitions C (1,1) , C (1,2) , C (1,3) et C(2,3) montrent que la probabilité d’obtenir improv RMSE
supérieur à zéros ne dépasse pas les 30 % dans les meilleurs des cas. Pour poursuivre notre
investigation, nous allons faire varier Tlong _ mem afin de vérifier si en augmentant ou en

diminuant la valeur de ce paramètre nous réussissons à améliorer l’indicateur de performance


du schéma de prédiction. Pour chacune des 5 configurations de transitions nous effectuons de
nouveaux tests mais avec des valeurs de Tlong _ mem de 9 heures et 18 heures. On détermine pour

chaque valeur de Tlong _ mem (9 heures et 18 heures) la valeur de Tshort _ mem qui donne le meilleur

résultat ; l’analyse des distributions improv RMSE permet de valider le couple

( Tshort _ mem , Tlong _ mem ).

Le critère utilisé est défini par la valeur de l’air désignée ci-dessous (Figure 7-17) et définie
par l’équation (1) :
Cette probabilité est donnée par l’aire sous la courbe (Figure 7-17) définie par l’équation (1) :


(1)
ire   PDF
0
Im provRMSE d .improv RMSE

Figure 7-17 : Densité de probabilité, en bleu l'aire définie par l'équation (1)

153
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

La performance du schéma de prédiction sera meilleures que la persistance lorsque cette aire
sera supérieure à 0,5.

 Combinaison de transition C(2,3)

Dans le cas d’une transition de moyennement variable à fortement variable C(2,3) , pour un

horizon de prédiction de 5 minutes, l’utilisation de Tlong _ mem = 18 heures permet d’obtenir le

meilleur taux d’amélioration par rapport à la persistance pour la valeur de Tshort _ mem =30

minutes (Figure 7-18 et Tableau 7-12). Dans le cas d’un horizon de prédiction de 10 minutes,
Tlong _ mem = 18 heures permet de passer d’un taux d’amélioration négatif à un taux

d’amélioration positif pour deux pour une valeur de Tshort _ mem égale à 25 minutes. Les

résultats obtenus pour l’horizon de prédiction de 10 minutes sont illustrés dans la Figure 7 -19
et résumé dans le Tableau 7-13.

Horizon de prédiction=5 minutes


2.5
TShort-mem=5 minutes
TShort-mem=10 minutes
TShort-mem=30 minutes
2
Tlong-mem=18 heures
Densité de probabilité (%)

Tlong-mem=9 heures
1.5

0.5

0
-80 -60 -40 -20 0 20 40 60
ImprovRMSE (%)

Figure 7-18 : Comparaison des PDF de improv RMSE pour une combinaison C (2,3) et un
horizon de prédiction de 5 minutes

154
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

improv RMSE pour un horizon de 5 minutes


Tshort _ mem 5 minutes 10 minutes 30 minutes

Tlong _ mem = 9 heures 0,95 % 2,25 % 0,99 %

Tlong _ mem = 18 heures 5,84 % 3,32 % 8,57 %

Tableau 7-12 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison
C (2,3) et un horizon de prédiction de 5 minutes.

Horizon de prédiction=10 minutes


2.5

TShort-mem=10 minutes
2 TShort-mem=25 minutes
Tlong-mem=18 heures
Densité de probabilité (%)

1.5 Tlong-mem=9 heures

0.5

0
-150 -100 -50 0 50 100
ImprovRMSE (%)

Figure 7-19 : Comparaison des PDF de improv RMSE pour une combinaison C (2,3) et un
horizon de prédiction de 10 minutes

improv RMSE pour un horizon de 10 minutes (%)

Tshort _ mem 10 minutes 25 minutes

Tlong _ mem = 9 heures -3,07 % -10 ,41 %

Tlong _ mem = 18 heures -2,90 % 5,16 %

Tableau 7-13 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison
C (2,3) et un horizon de prédiction de 10 minutes

155
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Pour la combinaison de transition C(2,3) et un horizon de prédiction de 15 minutes la


performance du schéma de prédiction est moins bonne que la simple persistance.

 Combinaison de transition C (1, y)

On remarque que dans le cas où l’état de départ est fortement variable C (1, y) , improv RMSE
connait une amélioration pour la plus grande valeur de Tlong _ mem testée (18 heures) mais reste

tout de même négative en valeur moyenne. Les Figures 7-20 et 7-21 ainsi que et les Tableaux
7-14 et 7-15 représentent les résultats obtenus pour les horizons de prédiction de 15 minutes
et 10 minutes respectivement.

Par soucis de lisibilité, nous avons choisi de ne représenter que les courbes relatives aux
valeurs de Tshort _ mem les plus favorables.

Horizon de prédiction=15 minutes


1.4
TShort-mem=15 minutes
TShort-mem=20 minutes
1.2
TShort-mem=25 minutes
Tlong-mem=18 heures
1
Densité de probabilité (%)

Tlong-mem=9 heures

0.8

0.6

0.4

0.2

0
-400 -350 -300 -250 -200 -150 -100 -50 0 50 100
ImprovMAE (%)

Figure 7-20 : Comparaison des PDF de improv RMSE pour une combinaison C (1,1) et un
horizon de prédiction de 15 minutes.

156
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

improv RMSE pour un horizon de 15 minutes

Tshort _ mem 15 minutes 20 minutes 25 minutes

Tlong _ mem = 9 heures -63,21 % -52,75 % -58,62 %

Tlong _ mem = 18 heures -31,50 % -31,24 % -33,18 %

Tableau 7-14 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison et
un horizon de prédiction de 15 minutes.

.
Horizon de prédiction=10 minutes
1.4
TShort-mem=15 minutes
TShort-mem=20 minutes
1.2
Tlong-mem=18 heures

1 Tlong-mem=9 heures
Densité de probabilité (%)

0.8

0.6

0.4

0.2

0
-350 -300 -250 -200 -150 -100 -50 0 50
ImprovMAE (%)

Figure 7-21: Comparaison des PDF de pour une combinaison de transition C(1,3) et un
horizon de prédiction de 10 minutes

157
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

improv RMSE pour un horizon de 10 minutes

Tshort _ mem 15 minutes 20 minutes

Tlong _ mem = 9 heures -44,25 % -50,47 %

Tlong _ mem = 18 heures -16,00 % -16,15 %

Tableau 7-15 : Comparaison des valeurs moyennes de improv RMSE pour une combinaison de
transition C(1,3) et un horizon de prédiction de 10 minutes

7.2.3 Tableau Récapitulatif des résultats

Résumons les résultats obtenus dans le Tableau 7-16.

C (1,1) C (1,2) C (1,3)

τ =5 min Persistance Persistance Persistance


τ =10 min Persistance Persistance Persistance
τ =15 min Persistance Persistance Persistance
C (2,1) C (2,2) C (2,3)

Tlong _ mem Tshort _ mem Tlong _ mem Tshort _ mem Tlong _ mem Tshort _ mem
τ =5 min 12 h 5 min 12 h 5 min 18 h 30 min
τ =10 min 12 h 30 min 12 h 30 min 18 h 25 min
τ =15 min Persistance 12 h 30 min Persistance
C (3,1) C (3,2) C (3,3)

τ =5 min 12 h 5 min 12 h 5 min 12 h 5 min


τ =10 min 12 h 5 min 12 h 30 min 12 h 5 min
τ =15 min 12 h 10 min 12 h 30 min 12 h 5 min

Tableau 7-16 : Tableau regroupant les couples ( Tshort _ mem , Tlong _ mem ) optimaux selon les
transitions de régimes de puissance et les horizons de prédiction

158
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

7.3 Sélection des paramètres optimaux conditionnée aux régimes


de variation.

7.3.1 Méthodes d’utilisation conjointes de la matrice de transitions et des


couples de paramètres optimaux ( Tshort _ mem , Tlong _ mem ).

Nous proposons 3 possibilités d’utilisation conjointe des couples ( Tshort _ mem , Tlong _ mem )

optimaux et de la matrice de transition [79] :

1 / En fonction du régime de puissance des 12 heures précédant le moment de la prédiction,


on choisi d’étalonner le prédicteur avec les paramètres optimaux associés à la transition la
plus probable pour l’heure suivante, compte tenu des probabilités données dans la matrice de
transition.

 0,44 0,43 0,13 


 
M   0,11 0,50 0,39
 0,02 0,27 0,71
 

Nous avons vu, chapitre 6, que les plus fortes probabilités de transition se trouvaient sur la
diagonale, ce qui correspondait au fait de rester dans le même régime de puissance dans
l’heure suivante.

Mais nous avions aussi remarqué que les autres probabilités n’étaient pas négligeables. Les
deux autres propositions d’utilisation tiennent compte de ce résultat :

2 / Selon le régime de variation des 12 heures précédant le moment de la prédiction, on


effectue une somme pondérée (équations (2) et (3) ci-dessous), des couples de paramètres
obtenus pour chaque transition possible, par les éléments de la matrice de transition, afin d’en
trouver de nouveau, notés (Tlong _ mem pond , Tshort _ mem pond ) .

159
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Tlong _ mem  Tlong _ memC (.,1)  M (,1)  Tlong _ memC (., 2 )  M (,2)  Tlong _ memC (., 3)  M (,3) (2)
pond

Tshort _ mem  Tshort _ memC (.,1)  M (,1)  Tshort _ memC (., 2 )  M (,2)  Tshort _ memC (., 3)  M (,3) (3)
pond

3 / Contrairement à la proposition précédente, nous n’effectuons pas une somme pondérée des
paramètres mais une somme pondérée des prévisions obtenues à l’aide des couples de
( Tshort _ mem , Tlong _ mem ) obtenus du Tableau 7-16.

Selon le régime de variation des 12 heures précédant le moment de la prédiction, nous


effectuons trois prévisions correspondant aux trois combinaisons de transition possibles en
attribuant à chacune, les couples de paramètres ( Tshort _ mem , Tlong _ mem ) déterminés. Puis nous

calculons la somme pondérée des prévisions notée Y pond à l’aide des coefficients de la matrice

de transition comme indiqué par l’équation (4).

Y pond  YC (.,1)  M (.,1)  YC (.,2)  M (., 2)  YC (.,3)  M (.,3) (4)

Nous avons testés ces trois propositions sur 12 échantillons, 6 dont les 12 heures précédant le
moment de la prédiction était moyennement variable et 6 dont les 12 heures précédant le
moment de la prévision étaient faiblement variable.
Aucun test n’a été effectué dans le cas ou les 12 heures précédant le moment de la pr évision
sont fortement variable puisqu’en référence au Tableau 7-16, dans ce cas, la persistance fait
mieux que le modèle de prévision.

7.3.2 Résultats

Dans le cas ou les 12 heures précédentes sont faiblement variables l’étalonnage du modèle
se fait à l’aide des paramètres présentés dans le Tableau 7-17 et de la troisième ligne de la
matrice de transition, qui correspond à cette configuration :

160
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

M (3,)  0,02 0,27 0,71

τ Tlong _ mem pond Tshort _ mem pond

Paramètres 5 minutes 12 h 5 min


obtenus 10 minutes 12 h 11,75 min
pondérés 15 minutes 12 h 11,85 min

Tableau 7- 17 : Paramètres pondérés pour les régimes de puissance de type C(3, y)

Les Figures 7-22, 7-23 et 7-24 représentent la moyenne, sur 6 échantillons, des erreurs et des
taux d’améliorations par rapport à la persistance obtenus pour chacune des trois propositions.
Pour chacun des horizons, la proposition visant à pondérer les prévisions obtient des
améliorations par rapport à la persistance plus élevées et des erreurs quadratiques et absolues
normalisées plus faibles. Pour exemple le Tableau 7-18 donne les valeurs obtenues pour
l’horizon de prédiction de 15 minutes.

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE Corr


Plus probable 0,69 % 7,79 % 9,57 % 8,76 % 12,80 % 14,01 % 0.57
Paramètres pondérés 0,89 % 7,80 % 9,61 % 8,79 % 12,64 % 14,40 % 0.55
Prévisions pondérées 0,69 % 7,41 % 9,19 % 8,40 % 16,75 % 18,33 % 0.58

Tableau 7-18 : Comparaison des performances du modèle de prévision en fonction des 3


propositions pour un horizon de prédiction de 15 minutes

161
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

30
Plus probable
28
Paramètres pondérés
26 Prévisions pondérées
24
22
20
18
16
14
12
10
8
6
4
2
0
NBIAIS (%) NMAE (%) NRMSE (%) NSDE (%) ImpRMSE (%) ImpMAE (%) Coeff Corr

Figure 7-22 : Comparaison des résultats obtenus pour les 3 propositions : τ = 5 minutes

24
Plus probable
22 Paramètres pondérés
Prévisions pondérés
20

18

16

14

12

10

2
1
0
NBIAIS (%) NMAE (%) NRMSE (%) NSDE (%) ImpRMSE (%) ImpMAE (%) Coeff Corr

Figure 7-23 : Comparaison des résultats obtenus pour les 3 propositions: τ = 10 minutes

162
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

20
Plus probable
18 Paramètres pondérés
Prévisions pondérées
16

14

12

10

2
1
0
NBIAIS (%) NMAE (%) NRMSE (%) NSDE (%) ImpRMSE (%) ImpMAE (%) Coeff Corr

Figure 7- 24 : Comparaison des résultats obtenus pour les 3 propositions : τ = 15 minutes

Dans le cas ou les 12 heures précédentes sont moyennement variables l’étalonnage du


modèle de prévision se fait à l’aide des paramètres présentés dans le Tableau 7-19 et de la
deuxième ligne de la matrice de transition, qui correspond à ce régime de puissance :

M (2,)  0,11 0,50 0,39

Horizon Tlong _ mem pond Tshort _ mem pond

Paramètres 5 minutes 14,34 h 14,75 min


obtenus 10 minutes 14,34 h 28,05 min
pondérés 15 minutes - -

Tableau 7-19 : Paramètres pondérés pour les régimes de puissance de type C(2, y)

163
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Contrairement aux cas précédent où pour tous les horizons testés, la pondération des
prévisions obtenait les meilleurs résultats, dans le cas des transitions de type C(2, y) les
résultats diffèrent selon les horizons.
Quand l’horizon de prédiction est τ =5 minutes, la proposition qui obtient les meilleurs
résultats est la pondération des prévisions (Figure 7-25). Quand l’horizon de prédiction est
égal à 10 minutes c’est le fait de pondérer les paramètres qui obtient les meilleurs résultats. Le
Tableau 7-20 montre les résultats obtenus pour cet horizon, nous remarquons que l’influence
la plus importante intervient sur les taux d’améliorations par rapport à la persistance.

NBIAIS NMAE NRMSE NSDE improv RMSE improvMAE Corr


Plus probable -0,15 % 3,64 % 4,44 % 4,06 % 15,66 % 13,91 % 0,87
Paramètres pondérés -0,20 % 3,58 % 4,39 % 4,01 % 17,49 % 16,33 % 0,87
Prévisions pondérées -0,12 % 3,66 % 4,45 % 4,04 % 15,44 % 13,42 % 0,86

Tableau 7- 20 : Comparaison des performances du modèle en fonction des trois propositions


pour un horizon de prédiction de 10 minutes

14
Plus probable
Paramètres pondérés
12
Prévisions pondérées

10

0
NBIAIS (%) NMAE (%) NRMSE (%) NSDE (%) ImpRMSE (%) Impmae (%) Coeff Corr

Figure 7-25 : Comparaison des résultats obtenus pour les 3 propositions : τ = 5 minutes

164
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

18

Plus probable
16 Paramètres Pondérés
Prévisions Pondérées
14

12

10

2
1
0
-1
NBIAIS (%) NMAE (%) NRMSE (%) NSDE (%) ImpRMSE (%) ImpMAE (%) Coeff Corr

Figure 7- 26 : Comparaison des résultats obtenus pour les 3 propositions τ = 10 minutes

Dans le cas de l’horizon de 15 minutes, dans la mesure où il n’y pas de somme pondérée des
paramètres (Tableau 7-16), les résultats obtenus avec le choix de la prévision la plus probable
et ceux obtenus par la « pondération des paramètres » sont identiques.

14
Plus probable
12 Paramètres Pondérés
Prévisions Pondérées

10

2
1
0

-2
NBIAIS (%) NMAE (%) NRMSE (%) NSDE (%) ImpRMSE (%) ImpMAE (%) Coeff Corr

Figure 7-27 : Comparaison des résultats obtenus pour les 3 propositions τ = 15 minutes

165
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

7.3.3 Nouveau schéma de prédiction

La possibilité de déterminer en temps réel le couple ( Tshortmem , Tlong _ mem ) optimal et son

utilisation avec la matrice de transition en fonction du régime de transition des 12 dernières


heures, nous permet maintenant de faire évoluer le schéma de prédiction en complétant celui
présenté en Figure 5-1 du Chapitre 5.
Le nouveau schéma consistera dans un premier, à chaque instant t , à déterminer le régime de
variation des 12 dernières heures. En fonction de l’horizon de prévision désirée, il suffira
d’étalonner le modèle avec les valeurs du couple optimal pondérées ou de pondérer les
prévisions.
Ce nouveau schéma peut être séparé en 3 parties, la prévision par la persistance quand les 12
dernière heures sont fortement variable, la prévision par pondération des paramètres optimaux
et la prévision par la pondération des prévisions dans les deux autres configurations.
La Figure 7-28 résume le principe du nouveau schéma de prévision.

166
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

t
Détermination de la classe à laquelle appartient les
12 heures précédentes.

Tableau 7-16

Choix du Modèle

Prédicteur RNB Persistance

Méthode : Pondération Méthode : Pondération


des paramètres optimaux des prévisions

Tableau 7-16 Mat Trans Tableau 7-16


Tableau 7-16
Utilisation des Utilisation des
Paramètres Tshort _ mem pond et Paramètres Tshort _ mem et
Tlong  mem pond Tlongmem optimaux

Prétraitement des données

Apprentissage

Prédicteur Bayesien

Mat Trans

Somme pondérée
des Prévisions

t+τ
Puissance prédite finale

Figure 7-28 : Nouveau processus du schéma de prévision

167
Chapitre 7 : Influence des régimes de variation des séquences de puissance sur le paramétrage
du prédicteur

Conclusion

Après avoir identifié et classé des séquences de puissance électrique d’origine éolienne afin
de déterminer la nature du régime observé sur les 12 dernières heures précédant l’instant de la
prévision et la valeur anticipée du coefficient de variation de l’heure à venir, nous avons, dans
ce chapitre, estimé les paramètres permettant de configurer le modèle de prévision.
Les résultats ont montré qu’il était nécessaire d’opérer au cas par cas. Par exemple la valeur
de Tshort _ mem qui convient pour une combinaison de transition entre un régime faiblement

variable et un régime faiblement variable est de 5 minutes pour un horizon de prédiction de 10


minutes, alors que cette valeur passe à 30 minutes dans le cas de la combinaison de transition
moyennement variable – moyennement variable C2,2).
La fixation de ces paramètres, permettra au prédicteur d’améliorer ces performances. De plus
la matrice de transition est en elle-même un outil de prévision permettant d’estimer la
probabilité d’occurrence de l’heure qui suit d’un régime de puissance (en termes de variation
faible, moyenne ou forte). Cette information supplémentaire contribue à améliorer les
performances du modèle de prédictions proposé au chapitre 5.
Afin d’intégré les informations obtenues grâce la matrice de transition nous avons proposé et
testé 3 possibilités d’utilisation conjointes de la matrice est des paramètres optimaux. Nous
avons comparé les performances du prédicteur en utilisant les paramètres relatifs à la
transition la plus probable, la somme pondérée des paramètres et la pondération des
prévisions obtenue après utilisation des 3 couples de paramètres optimaux se référant au trois
transitions de régimes de puissance possibles. Les résultats montrent, que pour lorsque le
régime de puissance des 12 heures précédentes est faiblement variable, la pondération des
prévisions obtient de meilleurs résultats que les deux autres méthodes proposées. Quand les
12 heures précédentes sont modérément variables, deux résultats sont obtenus, conditionnés
par l’horizon de prédiction. Si l’horizon de prédiction est égal à 5 minutes, les meilleurs
résultats sont obtenus par la méthode de la pondération des prévisions et si les horizons de
prédiction sont égaux à 10 et 15 minutes la méthode de la somme pondérée des paramètres est
meilleure. Ces résultats ont permis d’élaborer un nouveau schéma de prédiction qui décrit le
processus qui intervient maintenant en amont du modèle qui était déjà en place.

168
CHAPITRE 8

APPLICATIONS - perspectives

Introduction

Dans ce chapitre nous présentons deux applications du schéma de prévision. La première


illustre les capacités opérationnelles du prédicteur dans une configuration couplée à un
processus d’acquisition de données mesurées sur site en temps réel. La seconde application
utilise le prédicteur dans un algorithme de gestion dynamique des flux de puissance entre des
fermes éoliennes, une capacité de stockage et le réseau électrique

8.1 Protocole du processus de prédiction en temps réel dans le


cadre du projet ANEMOS Plus.

8.1.1 Le Project ANEMOS.Plus

Le projet ANEMOS.Plus a débuté le 1er janvier 2008 pour prendre fin le 30 Juin 2011. Ce
projet ANEMOS .Plus réunissait un consortium de plusieurs partenaires à travers l’Europe
représenté sur la Figure 8-1.
Il avait pour but de démontrer le caractère opérationnel de différents outils pour la gestion
optimale du réseau électrique intégrant une production électrique d’origine éolienne à grande
échelle. Le projet visait aussi à démonter l’applicabilité de ces outils de prévision à un niveau
opérationnel, tant pour la gestion de la pénétration, à un taux élevé, de la production éolienne
dans les réseaux électriques que pour les négociations sur les marchés de l’électricité.

169
Chapitre 8 : Applications - Perspectives

Figure 8-1 : Consortium ANEMOS.Plus

C’est dans le cadre de ce projet que nous avons, à l’UAG, développé, le modèle de prévision,
présenté au Chapitre 5, et qui a été testé en temps réel. [80]

8.1.2 Modèle de prévision en temps réel

Le modèle utilisait en entrées des données de puissance mesurées sur plusieurs sites de
l’Archipel (Les Saintes, Mahaudière, Petit Canal, Marie Galante, La Désirade). La Figure 8-2
représente un exemple de mesure de puissance du site de Mahaudière.

170
Chapitre 8 : Applications - Perspectives

1.4

1.2

1
Puissance (MW)

0.8

0.6

0.4

0.2

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Temps (Heures)

Figure 8-2 : Mesures de puissance en sortie de ferme sur le site de Mahaudière pour la
journée du 9 septembre 2010

Ces mesures ont été effectuées toutes les minutes et étaient transmises par radio au centre de
commande au gestionnaire du réseau (EDF). La transmission se faisait en continu et un
automate de mesure de type S500 (Lacroix Sofitel) enregistre les données en provenance de
toutes les fermes de l’archipel guadeloupéen. Toutes les 10 minutes la séquence de mesures
des 24 dernières heures est transmise par mail à un serveur situé à l’université où elles sont, là
aussi, enregistrées.
La prédiction de la puissance est calculée sur le serveur UAG à partir de ces séquences de 24
heures et est mise à la disposition d’EDF par le biais d’une page Web réactualisée
automatiquement toutes les 10 minutes. Le schéma (Figure 8-3) résume les différentes étapes
du processus.

171
Chapitre 8 : Applications - Perspectives

Radio Wave
Wind Trades

Mahaudière

Petit-Canal

Désirade

EDF - OCC

Marie-Galante

Les Saintes

Wind Farms raw data (radio wave)

raw data (by mail)


S500

UAG SCADA (by ftp)


ARMINES
Server

Wind power prediction

Secure Web Server

By Browser

EDF-OCC

Infrastructure of the ANEMOS Plus Guadeloupe’s test case

Figure 8-3 : Description du processus de prédiction en ligne [80]

172
Chapitre 8 : Applications - Perspectives

Les prévisions sont effectuées pour le jeu de données décrit précédemment avec les
paramètres définis au chapitre 5 ( nin , Tlong _ mem , Tshort _ mem ). Dans l’application décrite ici, les

paramètres restent fixe quelque soit la nature variable de la séquence utilisée. La Figure 8-4
donne un exemple de prévision pour la journée du 16 Décembre 2010.

18
Intervalle de Confiance
16
Puissance prédite
Puissance réelle
14

12
Puissance (MW)

10

0
12:00:00 18:00:00 00:00:00
Temps (heures)

Figure 8-4 : Prévision de puissance pour la journée du 16 Décembre 2010

NBiais NMAE NRMSE NSDE ImprovRMSE ImprovMAE Corr


-5,37 % 5,83 % 8,43 % 6,54 % -75,87 % -93,32 % 0,93

Tableau 8-1 : Evaluation de la prédiction fournie pour la journée du 16 Décembre 2010

La largeur de l’intervalle de confiance du prédicteur souligne la faible qualité des données


(SCADA) transmises depuis les sites de production. L’hétérogénéité des chaines de mesure en
temps réel sur les sites n’a pas permis de poursuivre sur de longues périodes les prévisions en
temps réel. En effet, la présence de données manquantes dans les séquences de 24 heures, a
réduit la qualité des prévisions.

173
Chapitre 8 : Applications - Perspectives

Toutefois, cette expérience a démontré que le schéma de prévision est fonctionnel pour le
temps réel ; le prédicteur a toujours été en mesure de fournir une prédiction et son intervalle
de confiance, tout en respectant les délais inhérents au temps réel.

8.2 Gestion dynamiques du stockage pour l’intégration de


l’électricité d’origine éolienne au réseau.

L’intégration de l’électricité d’origine éolienne au réseau électrique comporte des risques liés
du au caractère aléatoire de la production. Nous avions évoqué au Chapitre 1, que l’une des
solutions mises en place pour atténuer cet effet, était de limiter le taux d’intégration des
énergies dites fatales (éolien et photovoltaïque) à 30 %. Or l’accroissement rapide de la
capacité photovoltaïque entraîne que nous avons aujourd’hui atteint ces 30 % [7,81].
Le Plan Energétique régional de la Guadeloupe [82] fixe pour objectif, d’atteindre une
puissance éolienne installée de 59 à 118 MW (si les freins au développement de la filière sont
levés) d’ici l’horizon 2020. Cet objectif, s’il est atteint, entrainera un taux d’intégration des
énergies fatales sur le réseau bien supérieur à 30 %. Outre la prévision, le stockage s’impose
comme l’autre solution afin de garantir, au mieux, la fiabilité de cette production d’électricité.
Dans cette application nous démontrons l’avantage d’utiliser la prévision de la puissance
éolienne dans une gestion optimisée du stockage pour réduire l’incertitude sur le niveau de
puissance injecté au réseau.

Blonbou et al. [83,84] propose une gestion dynamique du stockage basée sur l’utilisation du
schéma de prédiction présenté au Chapitre 5. En effet, le prédicteur anticipe la production de
la ferme éolienne, pour un horizon choisi, puis un algorithme calcule le niveau de
puissance, Psched , auquel l’énergie produite va être fournie au réseau. La valeur de la
puissance prévue Psched , est calculée selon les contraintes suivantes :
- L’énergie doit être délivrée au réseau à un niveau qui doit se trouver dans l’intervalle
+/- 5% autour de la valeur de Psched .
- Si la puissance éolienne instantanée est supérieure au maximum de l’intervalle défini
ci-dessus, l’excès d’énergie est envoyé vers le système de stockage. L’algorithme

174
Chapitre 8 : Applications - Perspectives

prend en compte l’efficacité de charge du système de stockage, qui a été fixé à 85 %


dans l’exemple montré ci-dessous.
- Si la puissance éolienne instantanée est inférieure au minimum de l’intervalle défini,
le déficit établi par rapport à la valeur de Psched , est compensé par l’utilisation du
système de stockage d’énergie.
- L’algorithme doit aussi, lors du calcul de Psched , assurer que le niveau d’énergie, dans
le système de stockage, reste suffisant pour compenser les erreurs de prédiction.

Les résultats sont donnés sur les Figures 8-5 et 8-6. La Figure 8-5 montre l’évolution de la
puissance électrique prévue et réellement injectée superposée à la puissance électrique telle
qu’elle est produite par le parc éolien. Remarquons sur la Figure 8-6, qu’au début du test,
nous avons imposé un niveau d’énergie égal à zéro pour le système de stockage.
L’algorithme privilégie donc d’abord la charge du système de stockage ; le niveau de la
puissance injectée est initialement très faible.

Figure 8-5 : Puissance électrique prévue et injectée superposée à la puissance réelle [84,85]

175
Chapitre 8 : Applications - Perspectives

Figure 8-6 : Evolution de la réserve d'énergie du système de stockage [84,85]

La capacité du système stockage requise reste faible, environ 4% (moins de 500 kWh) de
l'énergie totale fournie par le parc éolien pendant toute la durée du test (environ 15 MWh
fournie en 9h).
L’intérêt de la méthode présentée, est qu’elle garanti le niveau de puissance auquel l’énergie
sera envoyée au réseau électrique en répartissant automatiquement les flux de puissance entre
les éoliennes, l’installation de stockage d’énergie et le réseau électrique.

Conclusion

L’accroissement du taux d’électricité produite, par des énergies renouvelables fatales, entraîne
que le gestionnaire du réseau devra s’appuyer sur des outils permettant de garantir le caractère
fluctuant des ces sources d’énergie. Les deux applications présentées, la prévision en temps
réelle et la gestion dynamique du stockage, ouvrent des perspectives dans la recherche de
réponses opérationnelles à cette problématique.

176
CONCLUSION GÉNÉRALE

L’intégration, dans le réseau électrique, de l’énergie électrique d’origine éolienne, a un impact


non négligeable sur le réseau de transport et la qualité de l’électricité fournie. La forte
variabilité de la vitesse du vent fait que l’énergie produite par un parc éolien n’est pas
constante dans le temps et très difficilement prévisible. Du coup, le gestionnaire ne peut
dimensionner son réseau en prenant intégralement ce type de production en compte. Il en va
de même pour toutes l’énergie solaire photovoltaïque. Cette énergies dites fatales, fragilisent
d’autant plus le réseau électrique, que l’on se situe en milieu insulaire ; ces territoires ne sont
pas interconnectés.
L’une des solutions préconisées pour permettre le développement de l’éolien et son
intégration avec une plus grande sureté aux réseaux électriques, est de développer et
d’améliorer les moyens de prévisions couplés, par exemple, à des dispositifs de stockage.

Par exemple, prédire la production en sortie de ferme éolienne pour des horizons de quelque
minutes permet au gestionnaire du réseau électrique de faire démarrer (ou d’arrêter) une
turbine à combustion ou un moteur diesel, pour compenser la baisse (ou la hausse) du vent.
Ceci permet augmenter la sécurité du réseau, notamment dans le cas d’une forte intégration
d’énergies dites fatales.

Dans la première partie du chapitre 2 nous avons rapporté l’analyse des variations de la
vitesse du vent sur 4 sites de l’archipel Guadeloupéen. Cette analyse a notamment montré que
pour des échelles de temps supérieures à 24 heures nous observons une synchronisation des
variations de la vitesse du vent sur les 4 sites.
L’étude a aussi montré que pour des échelles de temps inférieures à l’heure, les évolutions de
la vitesse du vent sont soumises à un effet de site. En d’autres termes, la mesure de la vitesse
du vent en un point du territoire ne pourra être utilisée pour prédire à court terme (horizon de

177
Conclusion générale

prédiction inférieur à l’heure) la puissance produite par toutes les fermes du territoire. Ceci
rend nécessaire d’utiliser une mesure locale (vent ou puissance) pour évaluer la prévision pour
chaque ferme.
Dans la deuxième partie du chapitre 2, nous avons effectué, à l’instar de l’étude mené par
Calif et al. [16], l’analyse fréquentielle de la vitesse du vent et de la puissance électrique en
sortie de ferme. Cette analyse a montré que le vent et la puissance ne sont pas corrélés pour
des échelles de temps inférieures à 5 minutes.
Dans la troisième partie du chapitre 2, nous avons complété des analyses en établissant la
fonction de transfert probabiliste de la puissance permettant d’obtenir une estimation de la
probabilité d’atteindre un niveau donné de puissance électrique produite, conditionnée à la
vitesse du vent.
Le chapitre 3 établi un état de l’art des outils utilisés pour la prévision à court terme de la
vitesse du vent ou de la puissance électrique éolienne.
Grace à leur propriété d’approximation universelle et à leur facilité de mise en œuvre nous
avons développé un schéma de prévision bas sur les réseaux de neurones artificiels. Pour
auto-évaluer la performance du schéma de prévision, à l’instar de MacKay [61, 63, 64], nous
avons utilisé une approche bayesienne pour l’apprentissage du réseau de neurone prédicteur.
Le principe de fonctionnement de ce schéma de prévision adaptatif, qui permet de fournir des
prévisions de la puissance pour différents horizons de prédiction, est détaillé dans le chapitre
4.
La validation des performances du schéma de prévision s’effectue par comparaison avec les
prévisions obtenues à l’aide de la simple application de la persistance. Dans un premier
temps, dans le chapitre 5, nous avons effectué une étude sur l’influence des paramètres
temporels du schéma de prédiction sur ses performances. Le formalisme bayesien, qui permet
l’évaluation a priori de l’intervalle de confiance de la prévision, montre que plus le prédicteur
dispose d’information, plus il considère sa prévision comme étant sure. Or ceci ne traduit pas
systématiquement la pertinence de la prévision ; le taux d’amélioration de l’erreur de
prédiction, obtenue par rapport à la persistance ne répond pas à la même logique. Nous avons
émis l’hypothèse que la qualité de prévision via le modèle pourrait dépendre des conditions de
vent. Ces considérations nous ont conduit à examiner en quoi la nature turbulente de
l’écoulement autour du site de production à une influence sur la qualité de la prévision. En

178
Conclusion générale

d’autre mots, nous avons chercher à mettre en évidence l’influence du régime de vent sur les
principaux paramètres du schéma de prévision ; Tlong _ mem et Tshort _ mem .

Nous avons choisi de qualifier le niveau de turbulence d’une séquence de données à l’aide du
coefficient de variation défini dans la section 5.4 du chapitre 5.

Une première série de test à permis une estimation de la valeur optimale du paramètre
Tlong _ mem correspondant à un compromis au vu des résultats obtenus Chapitre 5, section 5.4.

Ce premier compromis fixe la valeur de Tlong _ mem à 12 heures.

Dans les chapitres 6 et 7 nous avons cherché à affiner cette analyse afin de déterminer, pour
différents régime de variation, le couple ( Tshort _ mem Tlong _ mem ) optimal.

Pour ce faire, dans le chapitre 6, nous avons effectué une classification plus précise, basée sur
le coefficient de variation des échantillons de puissance. Nous distinguons alors 3 classes
suivant que les coefficient de variation calculés sur chaque échantillon soient majoritairement
représentées dans l’un des intervalles définis ci après ]0,15%] ]15,40%] et ]40,+100%[. Ces
intervalles correspondant respectivement à un régime de faiblement variable, moyennement
variable et une fortement variable.
Par la suite, dans une approche inspire des chaines de Markov, nous déterminons la matrice
de transition reflétant les probabilités de passage d’un régime de variation à un autre. Cette
matrice de transition permet d’estimer à l’instant t , la probabilité de se retrouver dans un
régime de variation durant l’heure qui suit sachant la classe dans laquelle on se trouvait au
cours des 12 heures précédentes.
Plusieurs séries de tests de prévisions sur des séquences de 13 heures (12h + 1h) ont permis
de déterminer, pour chacune des 9 combinaisons de transition possibles, la performance du
schéma de prédiction en fonction de la valeur des paramètres Tshort _ mem et Tlong _ mem .

Les résultats ont montré, que lorsque nous étions en présence d’une séquence de puissance
identifiée come appartenant au régime fortement variable, le schéma prédictif ne permettait
pas d’amélioration par rapport à la persistance quelque soit les valeurs Tshort _ mem et Tlong _ mem

testées.

179
Conclusion générale

Les résultats relatifs aux autres combinaisons de transitions ont permis de déterminer dans
chacun de ces cas, les valeurs de Tshort _ mem et Tlong _ mem optimales permettant ainsi d’obtenir,

un taux d’amélioration positif par rapport à la persistance.


Ces résultats nous ont permis d’améliorer le schéma de prédiction. En effet, cette méthode
nous permet de détecter le régime de variation en cours (évaluer sur les 12 heures
précédentes). A partir des éléments de la matrice de transition, nous pouvons évaluer la
probabilité d’occurrence du régime de variation à venir (dans l’heure qui suit). Or, pour
chaque combinaison de transition, nous avons déterminé le couple Tshort _ mem et Tlong _ mem

optimal.

Nous pouvons conditionner le calcul de la prédiction de la puissance électrique, aux


probabilités de transition. Nous avons définis trois approches pour effectuer ce calcul :
1. L’utilisation du couple de paramètres optimal lié à la transition la plus
probable. Compte tenu du fait que la transition la plus probable est de se
maintenir dans le régime de variation en cours, cette approche ne tient pas
compte des autres transitions possibles.
2. La somme pondérée par les coefficients de la matrice, des paramètres
optimaux associés aux trois transitions possibles (à partir du régime de
variation en cours).
3. La somme pondérée par les coefficients de la matrice, des 3 prévisions,
calculées avec les paramètres optimaux à chacune des trois transitions
possibles (à partir du régime de variation en cours).
Les deux dernières approches (n°2 et n°3) proposées permettent de prendre en compte toutes
les transitions possibles. D’ailleurs, l’analyse des résultats obtenus montre qu’il est préférable
d’utiliser l’une de ces deux approches.
Ces résultats ont donc permis de faire évoluer le schéma de prédiction présenté au chapitre 5.
En y ajoutant en amont une phase permettant l’évaluation anticipée des paramètres optimaux
du schéma de prévision.
Le Chapitre 8 illustre, à travers deux applications, les aptitudes opérationnelles du schéma de
prévision.

180
Conclusion générale

Dans le cadre du projet européen ANEMOS PLUS, le schéma de prévision a été testé en
temps réel, ce qui a démontré le caractère opérationnel du schéma de prévision. Toutefois, la
faible qualité des données (dû à des soucis de transmission des données à partir des sites de
production éolienne) n’a pas permis de poursuivre l’expérience suffisamment longtemps pour
que les conclusions soient significatives. Il serait aussi intéressant d’effectuer de nouveau
tests en temps réel en intégrant la procédure proposée dans le chapitre 7, tout en veillant à une
meilleure qualité de la transmission en temps réel de données.
Une autre application consiste à mettre un algorithme de gestion dynamique des flux de
puissance entre des fermes éoliennes, une capacité de stockage et les réseaux électriques.
L’algorithme s’appuie sur une estimation de la quantité d’énergie qui sera disponible pour
définir, à l’avance, le niveau de la puissance qui sera injectée dans le réseau électrique.
L’intérêt de cette méthode est qu’elle garanti, pour un horizon choisi, la puissance délivrée
au réseau électrique, par la combinaison parc éolien – système de stockage.

Nous remarquons que ces dernières années la Martinique et la Guadeloupe ont connues un
fort essor du solaire photovoltaïque, en effet au 30 juin 2011 la puissance du parc
photovoltaïque raccordée au réseau électrique était de 37,98 MW en Martinique et de 28,7
MW en Guadeloupe [81]. Le flux solaire étant une ressource aussi aléatoire que la vitesse du
vent, une extension de l’utilisation du schéma de prévision serait à envisager dans le cas de la
production d’électricité d’origine photovoltaïque. Dans un travail récent [84], nous avons
implémenté une méthode, basée sur la prévision de l’énergie solaire photovoltaïque, pour
étudier la possibilité de garantir l’alimentation électrique à partir d’une installation
photovoltaïque, dans le cadre d’un usage domestique. L’objectif suivi, est de dimensionner au
plus juste, la capacité de stockage tout en maintenant un niveau de service satisfaisant. Le
travail continu pour identifier les paramètres qui influent sur la performance du prédicteur.

181
Annexe 1

Les Filtres de Kalman

On distingue deux types de filtre de Kalman :


 Le filtre de Kalman discret (linéaire)
 Le filtre de Kalman étendu (non linéaire)

Dans les deux cas le but est d’estimer l’état inconnu x , à chaque itération du filtre de Kalman
on actualise l’estimation du vecteur état du système à l’aide de nouvelles observations.
On dispose donc de deux équations : une équation d’état non linéaire stochastique (1) et une
équation de mesure (2).
Arrêtons-nous sur le filtre de Kalman discret.

Welch et Bishop [30] décrivent les équations comme suit :

Equation d’état :
xk  Axk 1  Buk 1  wk 1 (1)
Et l’équation de mesure
zk  Hxk  vk (2)

A représente la matrice de passage entre le moment k  1 et k de l’état x .


H représente la matrice liant l’état à la mesure z k
B représente la matrice liant u à l’état x k

vt et wt sont des bruits blancs gaussiens centrés dont la probabilité de distribution est défini
comme étant :
p(w)  N (0, Q) (3)

p(v)  N (0, R) (4)

182
N représente la loi normale, Q et R représentent respectivement les matrices de covariance
du bruit du processus et de la mesure qui changent à chaque pas et à chaque mesure mais que
l’on supposera constantes.

A.1 Estimation des erreurs

Soit x̂k l’état à priori estimé au temps k donnant connaissance du processus antérieur au pas

k.
Soit x̂k l’état à posteriori estimé au temps k étant donné la mesure z k .On peut alors

déterminer les erreurs d’estimation à priori ek et à posteriori e k ainsi que leurs matrices de
covariance respectives :
ek  xk  xˆk  
Pk  E ek ekT (5)
ek  xk  xˆk Pk  E e e k
T
k

A.2 Résidu du filtre

En dérivant les équations du filtre de Kalman on obtient une équation (6) reliant de façon
linéaire l’estimation à priori x̂ k à la différence pondérée existant entre la mesure z k et la

prédiction de mesure Hˆ
xk .
Cette combinaison linéaire défini alors une estimation de l’état à postériori x̂ :
k


xˆk  xˆk  K z k  Hxˆk  (6)

 
La différence z k  Hxˆ k est appelé Résidu et reflète l’écart entre la mesure actuelle z et la
k

mesure prédite Hˆxk .

183
La matrice K est le gain et à pour but de minimiser Pk en se substituant à ek dans le calcul

de Pk .Le minimum de Pk est atteint pour la valeur de k notée K k solution de la dérivée de la

trace Pk part rapport à K égale zéro (7), on trouve (8) :

 (trPk ) (7)
0
k
Pk H T (8)
Kk 
HPk H T  R

184
185
ANNEXE 2

EVALUATION DU PREDICTEUR

A.1 Les erreurs

 Le Biais
N
1 (1)
BIAS 
N
 ( y(t )  t
t 1
F (t ))

y (t ) représente la sortie du réseau.

 L’erreur absolue

N
1
MAE 
N
 y(t ) _ t
t 1
F (t ) (2)

Statistiquement le Biais et la MAE sont associés au premier moment de l’erreur de prédiction.


[59]

 L’erreur quadratique

 ( y(t )  t F (t )) 2 (3)
RMSE  t 1

 L’erreur relative à l’écart type

Représente une estimation de l’écart type de l’erreur de distribution.

186
tN1 ((Y (t )  Ta (t ))  BIAS )
2
(4)
SDE 
N

La RMSE et la SDE sont associées à la variance de l’erreur de prédiction.[58]

A.2 Le coefficient de corrélation

Le coefficient de corrélation indique la mesure de l’intensité d’un lien qui peut exister entre
deux variables.
Il permet de quantifier la similitude qu’il existe entre deux variables ou deux séries
temporelles. Dans notre cas il permet de comparer points par points la prédiction et le
puissance réellement observée.
N

 ( y(t )  y (t ))  (t F (t )  t F (t ))
corr  t 1
(5)
N N

 ( y(t )  y (t ))
t 1
2
  (t
t 1
F (t )  t F (t )) 2

187
BIBLIOGRAPHIE

[1] Puget JL, Blanchet R, Salençon J, Carpentier A, Académie des sciences, Rapport sur le
changement climatique, 26 Octobre 2010.

[2] Ministère de l’Ecologie du Développement durable des transports et du logement, Chiffres


clés du Climat : France et monde édition 2011.

[3] WWEA, Rapport Mondial 2009 sur l’énergie éolienne, 2010

[4] Robyns B, Davigny A, Saudemont C, Ansel A, Courtecuisse V, François B, Plumel S,


Deuse J, Impact de l’éolien sur le réseau de transport et la qualité de l’énergie, J3eA vol.5-
Hors Série 1, 2006

[5] Georgilakis PS, Technical challenges associated with the integration of wind power into
power systems, Renewable and Sustainable Energy reviews, 852-863 (12), 2006.

[6] EDF : Direction SEI, Bilan prévisionnel de l’équilibre offre/demande : Martinique, Juillet
2011.

[7] EDF : Direction SEI, Bilan prévisionnel de l’équilibre offre/demande : Guadeloupe,


Juillet 2011.

[8] Marin D, Intégration des éoliennes dans les réseaux électriques insulaires, Thèse de
Doctorat Chap 2, 2009.

[9] Perianin J, Etude de la prédictibilité des énergies renouvelables en Guadeloupe, Rapport


de Stage EDF Guadeloupe, 2008.

188
[10] Conseil Général de l’Environnement et du Développement Durable, Conseil Général de
l’Économie, de l’Industrie de l’Énergie et de la Technologie, Rapport conjoint,
Développement de l’Énergie éolienne dans les DOM et en Corse, Septembre 2012

[11] Calif R, Mesure et analyse de la vitesse du vent sur un site de production d’énergies
éolienne en Guadeloupe : Modèle pour la prévision sur les échelles de temps inférieurs à
l’heure. Thèse de Doctorat, 2005

[12] Kavak Akpinar E, Akpinar S, A statistical analysis of wind speed data used in
installation of energy conversion systems, Energy Conversion and Management , 512-
532(46), 2005

[13] Fawzan M.A, Methods for estimating the parameters of the Weibull Distribution, King
Abdulaziz City for science and Technology, Arabie Saoudite, 2000 1-11.

[14] Takle E.S, Brown M, Note on the use of weibull statistics distribution of wind speed near
the surface, Journal of Applied Meteorology 1633-1642 (4) 1978.

[15] Conrasden K, Nielsen L.B, Review of weibull statistics for estimation of wind speed
distributions, Journal of Applied Meteorology 1173-1183(23), 1984.

[16] Justus C.G, Hargraves W.R, Mikhail A, Graber D, Methods for estimating wind speed
frequency distribution, Journal of Applied Meteorology, 350 -3535 (17) , 1978.

[17] Blonbou R, Calif R, Deshaies B, Bouisset S, Albuisson L, Billerey J, A comparative


analysis of wind variability at wind farms of the guadeloupean archipelago, Conférence
EWEC Athènes, 2006

189
[18] Calif R, Blonbou R, Analysis of the power output of a wind turbines cluster in the
Guadeloupean Archipelago . The International Journal for Alternative Energy and Ecology
ISJAEE #5(6)

[19] Bourbonnais R, Terazza M, Analyse des séries temporelles, Dunod Ed, Paris , 2008.

[20] Eilstein D, Zeghnoun A, Letretre A, Cassadou S, Filleul L, Pascal L, Prouvost H,


Declercq C, Saviuc P, Lefranc A, Nunes C, Chardon B, Dhelf M, Jusot JF, Fabre P, Medina
S, Quenel P, Séries temporelles et modèles de régression : Application à l’analyse des
associations à court terme entre la pollution atmosphérique et la santé, Institue de Veille
Sanitaire, 2005.

[21] Wang X, Guo P, Huang X, A review of Wind power forecasting models, Energy
Procedia, 770-778 (12), 2011.

[22] Voyant C, Prédiction de séries temporelles de rayonnement solaire global et de


prédiction d’énergie photovoltaïque à partir de réseaux de neurones artificiels, Thèse de
doctorat, 2011.

[23] Giebel G, Brownsword R, Kariniotakis G, The State of the Art in Short Term Prediction
of Wind Power, Project ANEMOS, August 2003.

[24] Monteiro C, Bessa R, Miranda V, Botterud A, Wang J, Gonzelmann G, Wind Power


Forecasting : State-of-Art 2009, Technical Report, Argonne National Laboratory, 2009

[25] Torres JL, Garcia A, De Blas A, De Francisco A, Forecast of hourly average wind speed
with ARMA models in Navarre (Spain), Solar Energy, 65 -77(79), 2005

[26] Poggi P, Muselli M, Notton G, Cristofari C, Louche A, Forecasting and simulationg


wind speed in Corsica by using an autoregressive model, Energy conversion and
management, 3177-3196(44), 2003

190
[27] Baile R, Poggi P, Muzzy JF, Short Term Forecasting of surface layer wind speed using a
continuous cascade model, Wind Energy, 719-724(14), 2011.

[28] Baile R, Analyse et modélisation multifractales de vitesse de vent. Application à la


prévision de la ressource éolienne, Thèse de doctorat, 2011.

[29] Nielsen TS, Joensen A, Madsen H, Landberg L, Giebel G, A new reference for wind
power forecasting, Wind Energy , 29 -34(1) 1998.
[30] Welch G, Bishop G, An introduction to the Kalman Filter, University of North Carolina
July 2006.

[31] Costa A, Crespo A, Navarro J, Lizcano G, Madsen H, Feitosa E, A review on the young
history of wind power short-term prediction, Renewable and Sustainable Energy Reviews,
1725-1744 (12), 2008

[32] Louka P, Galanis G, Siebert N, Kariniotakis G, Katsafados P, Pytharoulis I, Kallos G .


Improvement in wind speed forecast for wind power prediction purposes using Kalman
Filtering, Journal of wind Engineering and Industrial Aerodynamics, 2348-2362 (96), 2008

[33] Dreyfus G, Martinez JM, Apprentissages statistiques: Réseaux de neurones – cartes


topologiques-Machine à vecteurs supports, Eyrolles Ed, 2008.

[34] Dreyfus G, Les réseaux de neurones, Mécanique industrielle et matériaux n°51, 1998.

[35] Pourmousavi Kani SA, Ardehali, Very Short term wind speed prediction: A new artificial
neural network-Markov chain model, Energy Conversion and Management, 738-745(52),
2011.

[36] Alexiadis MC, Dokopoulos PS, Sahsamanoglou HS, Manousaridis IM, Short-term
forecasting of wind speed and related electrical power, Solar Energy, 61-68(63), 1998.

191
[37] Sfetsos A, A comparison of various forecasting techniques applied to mean hourly wind
speed time series, Renewable Energy, 23-35(21), 2000.

[38] Maqsood I, Riaz Khan M, Guo H, Abdalla R, Application of soft computing models to
hourly weather analysis in southern Saskatchewan Canada, Engineering Applications of
Artificial Intelligence, 115-125(18), 2005.

[39] Cadenas E, Rivera W, Short term wind speed forecasting in La Venta, Oaxaca, Mexico,
using artificial neural networks, Renewable Energy, 274-278(34), 2009.

[40] Li S, Wunsch DC, O’Hair EA, Giesselmann MG, Using neural networks to estimate
wind turbine power generation, IEEE Transactions on Power Systems, 276-282(16), 2001.

[41] Catalão J.P.S, Pousinho H.M.I, Mendes V.M.F. Short-term wind power forecasting in
Portugal by neural networks and wavelet transform, Renewable Energy, 1245-1251(36),
2011

[42] Lei M, Shiyan L, Chuanwen J, Hongling L, Yan Z, A review on the forecasting of wind
speed and generated power, Renewable and Sustainable energy reviews, 915-920 (13), 2009.

[43] De Gooijer JG, Hyndman RJ, 25 years of time series forecasting, International Journal of
Forecasting 443-473 (22), 2006

[44] Landberg L, Short term prediction of the production from wind farm, Journal of Wind
Engineering and Industrial Aerodynamics, 207-220 (80),1999

[45] Nielsen T.S, Madsen H, Nielsen Aa, Landberg L, Giebel G, Prediction of regional wind
power, 2002

192
[46] Giebel G, Landberg L, Nielsen T.S, Madsen H , The zephyr project : the next generation
prediction system, GWEC Paris , 2002.

[47] Landberg L , Giebel G, Nielsen H Aa, Nielsen T, Madsen H, Short-term Prediction – An


Overview, Wind Energy, 273-280 (6), 2003.

[48] Ramirez-Rosado IJ, Fernandez-Jimenez LA, Monteiro C, Sousa J, Bessa R, Comparison


of two new short–term wind power forecasting systems, Renewable Energy, 1848 -1854 (34),
2009.

[49] Foley AM, Leahy PG, Marvuglia A, McKeaogh EJ, Current methods and advances in
forecasting wind power generation, Renewable Energy, 1-8 (37), 2012

[50] Juban J, Kariniotakis G, Probalistic Short-term wind power forecasting base on kernel
density estimators, Deliverable D-1.7 ANEMOS Plus, Septembre 2009

[51] Bremmes JB, Probalistics wind power forecasts using local quantile regression, Wind
Energy , 47-54 (7), 2004

[52] Bremmes JB, A comparison of a few statistical models for making quantile wind power
forecasts, Wind Energy , 3-11(9), 2005

[53] Nielsen HA, Madsen H, Nielsen T.S Using quantile regression to extend an existing
Wind Power Forecasting system with Probablistic Forecast, Wind Energy 95-108 (9) 2006

[54] Pinson P, Kariniotakis G, Nielsen Aa, Nielsen TS, Madsen H, Proprieties of Quantile
and Interval Forecasts of Wind Generation and their Evolution, Proceeding of the European
Wind Energy Conference and Exhibition, Athènes, 2006.

193
[55] Nielsen H Aa, Nielsen TS, Madsen H, Badger J , Giebel G, Landberg L, Sattler K ,
Feddersen H, Wind power ensemble forecasting, Global Wind Power Conference, Chicago,
Mars 2004.

[56] Kalogirou SA, Artificial neural network in renewable energy systems applications: a
review, Renewable and Sustainable Energy Reviews, 373-401 (5), 2001

[57] Jain K, Jianchang M, Mohiuddin KM, Artificial Neural Networks: A tutorial, IEEE
Computer 31-44(29), 1996.

[58] Blonbou R, Very short term forecasting model, Delivrable D-1.6 ANEMOS Plus,
Septembre 2009.

[59] Bishop CM, Neural networks for pattern recognition, Oxford University Press, 1995.

[60] MacKay DJC, Modelling phase transformation in steels - Bayesian non linear modelling
with neural networks, Cambridge University,1995

[61] MacKay DJC, Bayesian nonlinear modelling for the prediction competition, Cambridge
University.

[62] MacKay DJC, Information theory, inference and learning algorithms, Cambridge
University Press 2003.

[63] Lauret P, Fock E, Randrianarivony R.N, Manicom-Ramassamy JF, Bayesian neural


network approach to short time load forecasting , Energy conversion and management, 1156-
1166 (49), 2008

[64] Hippert HS, Taylor JW, An evaluation of bayesian techniques for controlling model
complexity and selecting inputs in a neural network for short-term load forecasting, Neural
Networks 386-395 (23) 2010.

194
[65] Blonbou R, Very short term wind power forecasting with neural network and adaptive
bayesian learning, Renewable Energy, 1118-1124 (36), 2011.

[66] Madsen H , A protocol for standardizing the performance evaluation of short-term wind
power prediction models, Deliverable D2-3, project ANEMOS , 2004

[67] Giebel G, Brownword R, Kariniotakis G, Denhard M, Draxl C, The state of the art in
short term prediction of wind power, Delivrable ANEMOS Plus – Safe Wind, 2011

[68] Sahbani Mahersia H, Hamrouni K, Segmentation d’images textures par transformée en


ondelette et classification C-moyenne floue, 3ème conférence SETIT, Tunisie, 2005

[69] Warren Liao T, Clustering of time series data–a survey, The journal of pattern
recognition society, 1857-1874 (38), 2005.

[70] Chiu S, Fuzzy model identification based on cluster estimation, Journal of intelligent
fuzzy systems, 267-278(2), 1994

[71] Bezdeck JC, Pattern recognition with fuzzy objective function algorithms, Kluwer
Academic Publishers, Norwell, 1981

[72] Shamshad A, Wan Hussin W.M.A, Bawdi M.A, Mohd Sanusi S.A, First and second
Markov chain models for synthetic generation of wind speed time series, Energy, 693-708
(30), 2005.

[73] Logofet D.O, Lesnaya E.V, The mathematics of Markov models: what Markov chains
can really predict in forest successions, Ecological modelling, 285-298(26), 2000.

195
[74] Muselli M, Poggi P, Notton G, Lalouche A, First order Markov chain model for
generating synthetic “typical days” series of global irradiation in order to design
photovoltaic stand alone systems, Energy Conversion and Management, 675-687 (42), 2001.

[75] Flipo D, Chaînes de Markov, Cours agrégation de mathématiques, Université des


Sciences et Technologies de Lille.

[76] Sahin A.D, Sen Z, First order Markov chain approach to wind speed modelling, Wind
Engineering, 263-269(89), 2001.

[77] Nfaoui H, Essiarab H, Saying A.A.M, A stochastic Markov chain model for simulating
wind speed time series at Tangiers Morocco, Renewable Energy, 1407-1418 (29), 2004

[78] Poggi P, Intégration des systèmes énergétiques à sources renouvelables dans les réseaux
électriques insulaires, Mémoire en vue de l’obtention d’une HDR, 2007.

[79] Monjoly S, Blonbou R, Configuration of a wind power forecasting model based on Fuzzy
c-means clustering , Power and Energy System and Application, IASTED International
Conference, Las Vegas, 12-14 Novembre 2012.

[80] Monjoly S, Dorville JF, Blonbou R, Jolivet R, Siebert N, Charlet F, Wind power
forecasting in challenging climate conditions : The case of Guadeloupe Island, European
Wind Energy Association Conference, Bruxelles, Mars 2011.

[81] Groupement français des professionnels du photovoltaïques, Etats des lieux du parc
photovoltaïque français au 30 Juin 2011, Septembre 2011.

[82] Plan Energétique Régional Pluriannuel de Prospection et d’Exploitation des Energies


Renouvelables et d’Utilisation Rationnelle de l’Energie de la Guadeloupe à l’Horizon 2020,
2008.

196
[83] Blonbou R, Monjoly S, Dorville JF, An adaptive short term prediction scheme for wind
energy storage management, Energy conversion and management, 2412-2416 (52), 2011.

[84] Blonbou R, Monjoly S, Bernard JL, Dynamic Energy storage Management for
Dependable Renewable Electricity Generation, Energy Storage (ISBN 979-953-307-768-9),
2012

[85] S Monjoly, JL Bernard, R Blonbou, Simulation of a energy management scheme for a


dependable hybrid wind-photovoltaic domestic power supply system, Conference New Energy
Forum, Chine 2012.

197