These Didavi Fin Bon

No d’ordre : 131
Université d’Abomey-Calavi
École Doctorale des Sciences de l’Ingénieur (ED-SDI)
Thèse de Doctorat
Présentée pour l’obtention du grade de
Docteur de l’Université d’Abomey-Calavi

Spécialité : Génie Electrique : Energies Renouvelables et Informatique
Appliquée
Prévision par l’intelligence artificielle de la variabilité de la puissance

de sortie d’un système PV/Eolien installé à un point géographique :
Application au territoire du BENIN
Présentée par :
DIDAVI Kossoko Babatoundé Audace
Master Professionnel en Automatismes Industriels & Master de Recherche en Génie Electrique
Soutenue publiquement le 05 Octobre 2023

Devant le jury composé de :
Président : M. Mohamed GIBIGAYE Professeur Titulaire Université d’Abomey-Calavi (Bénin)
Rapporteurs : M. Olivier DOUHERET Directeur de recherche Materia Nova/UMONS (Belgique)
: M. Adekunlé Akim SALAMI Professeur Titulaire Université de Lomé (Togo)
: M. Richard Gilles AGBOKPANZO Maître de Conférence Université Nationale des Sciences,

Technologies, Ingénierie et Mathématiques
(Bénin)
Examinateurs : M. Basile KOUNOUHEWA Professeur Titulaire Université d’Abomey-Calavi (Bénin)
: M. Arnaud AHOUANDJINOU Maître de Conférences Université d’Abomey-Calavi (Bénin)
Directeur de thèse : M. Bienvenu Macaire AGBOMAHENA Maître de Conférences Université d’Abomey-Calavi (Bénin)
Laboratoire d’Electrotechnique, de Télécommunications et d’informatique Appliquée (LETIA), UAC, Benin

Summary
Dédicace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
Liste des figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii
Liste des tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii
Liste des algorithmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
Introduction générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1 Prévision de la production des Sources d’Energies Renouvelables Intermit-

tentes et Stochastiques : une nécessité pour une meilleure intégration . . 9
1.1 Utilité de la prévision . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2 Principaux facteurs affectant les prévisions des énergies Eolienne et PV 16
1.3 Classification des techniques de prévision . . . . . . . . . . . . . . . . 23
1.4 Méthodes de prévision des énergies éolienne et solaire basées sur l’ap-
prentissage profond . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.5 Méthodes d’évaluation et de comparaison . . . . . . . . . . . . . . . . 69
2 Technique de modélisation et de prévision développée . . . . . . . . . . . 75

2.1 Présentation du diagramme de recherche . . . . . . . . . . . . . . . . 76
2.2 Choix d’une technique de prévision . . . . . . . . . . . . . . . . . . . 78
2.3 Définition de la zone d’étude . . . . . . . . . . . . . . . . . . . . . . . 80
2.4 Quadrillage et échantillonnage de la zone d’étude . . . . . . . . . . . 81
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace i

Summary
2.5 Acquisition et traitement des données . . . . . . . . . . . . . . . . . . 82

2.6 Réduction de la zone d’étude et formation de sous-zones . . . . . . . 106
2.7 Caractérisation des sous-zones et détermination des périodes de pro-
duction optimale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
2.8 Développement des modèles de prévision des paramètres météorologiques117
2.9 Estimation des puissances de sortie . . . . . . . . . . . . . . . . . . . 128
2.10 Conception de l’outil d’identification des périodes de production opti-
male et de prévision . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
3 Résultats d’application de la technique de prévision développée au territoire

béninois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
3.1 Présentation du Bénin et de ses potentialités en énergies solaire pho-
tovoltaïque et éolienne . . . . . . . . . . . . . . . . . . . . . . . . . . 145
3.2 Présentation de la zone d’étude : le territoire béninois . . . . . . . . . 148
3.3 Résultats de quadrillage et d’échantillonnage . . . . . . . . . . . . . . 149
3.4 Présentation des données acquises et traitées . . . . . . . . . . . . . . 150
3.5 Résultats de clustering . . . . . . . . . . . . . . . . . . . . . . . . . . 156
3.6 Résultats de formation de sous-zones . . . . . . . . . . . . . . . . . . 169
3.7 Résultats de caractérisation des sous-zones . . . . . . . . . . . . . . . 170
3.8 Résultats de prévision des paramètres météorologiques . . . . . . . . 177
3.9 Estimation des puissances de sorties . . . . . . . . . . . . . . . . . . . 190
3.10 Résultats de la validation expérimentale . . . . . . . . . . . . . . . . 193
3.11 Présentation du progiciel conçu . . . . . . . . . . . . . . . . . . . . . 206
Conclusion générale et perspectives . . . . . . . . . . . . . . . . . . . . . . . 221
Références Bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
A Présentation des caractéristiques des constituants de la station météorolo-

gique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
B Présentation des outils logiciels de mise en œuvre des méthodes d’IA . . 269
C Liste des publications et communications . . . . . . . . . . . . . . . . . . 274
Table des manières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace ii

Dédicace
Je dédie cette thèse
A mes parents.
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace iii

Remerciements
« Comme le coureur de fond, le doctorant doit tenir la distance. Mais, à la dif-

férence du marathonien, personne n’a tracé pour lui de ligne d’arrivée. Le plus dur
dans la thèse, c’est de finir. » disait Héloïse Lhérété dans « La solitude du thésard
de fond ». Faire une thèse n’est pas une épreuve facile mais pour un passionné de
recherche cela reste possible. Il m’importe de remercier chaleureusement toutes les
personnes qui ont contribué à la réalisation de ces travaux.
Mes premiers remerciements vont à l’endroit de Dieu Le Tout-Puissant pour
m’avoir accordé la vie, la santé et la force nécessaire pour mener à bien ce travail.
Toute ma reconnaissance va au Professeur Félicien AVLESSI, Recteur de l’Uni-
versité d’Abomey-Calavi pour toutes ses nombreuses actions menées afin de nous
garantir une formation de qualité.
J’exprime toute ma gratitude au Professeur Mohamed GIBIGAYE, Directeur de
l’Ecole Doctorale des Sciences de l’Ingénieur, pour ses conseils et motivations. Qu’il
trouve ici l’expression de ma plus grande reconnaissance.
Mes chaleureux remerciements vont ensuite au Docteur Macaire AGBOMAHENA,
Maître de Conférences des Universités du CAMES et Directeur de cette thèse, sans
qui cette thèse n’aurait pu avoir lieu. Je vous suis infiniment reconnaissant pour vos
soutiens et encouragements. Vous m’avez guidé tout au long de ces trois années de
recherche, qui contre vents et marées, a connu un aboutissement. Je n’ai gardé de
ces moments que de très bons souvenirs tels entre un pére et son fils.
Merci au Docteur Richard AGBOKPANZO, Maître de Conférences des Univer-
sités du CAMES, pour ses nombreux conseils qui m’ont permis de faire de grands
pas en avant toutes les fois que je m’étais relâché. Un grand merci aussi pour les
pressions souvent utiles. Cher Professeur, merci pour tout !
Je n’oublie pas le Docteur Arnaud AHOUANDJINOU, Maître de Conférences
des Universités du CAMES pour tous ses conseils tout au long de ces travaux.
Les travaux de thèse présentés dans ce mémoire ont été réalisés au Laboratoire
d’Electrotechnique de Télécommunications et d’Informatique Appliquée (LETIA).
Ma gratitude va aussi au Directeur du LETIA, le Professeur François-Xavier FIFA-
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace iv

Remerciements
TIN, qui m’a accepté dans son laboratoire.

Mes chaleureux remerciements, vont en direction du Professeur Antoine VIANOU,
du Professeur Aristide HOUNGAN et du Professeur Basile KOUNOUHEWA pour
leurs différents encouragements, orientations et recommandations.
Je voudrais profiter de cette occasion pour remercier les sieurs Florentin GO-
DONOU, Brice SEDAGONDJI, Géraud GOHOUE et Geoffroy NOUKPOKINNOU
pour leur disponibilité durant leurs travaux d’ingénieur que j’ai eu la chance de su-
perviser et pour les échanges pertinents qui ont suscité des questions m’ayant permis
d’évoluer dans le travail.
Une pensée également à tous mes aînés Docteurs avec qui j’ai régulièrement
échangé sur leurs expériences sur les épreuves de la thèse. Merci à vous Dr Mau-
rel AZA-GNANDJI, Dr Hippolyte HOUNNOU et Dr Pierre AGUEMON.
Je tiens à adresser mes meilleurs remerciements à mon père Gabin Télesphore DI-
DAVI, ma mère Christine Mahoussi HOUSSOU, mes frère et sœurs, Prisca, Laetitia
et Romaric DIDAVI. Très chers Parents, comme vous le dites souvent "C’est dans la
pratique qu’il faut que l’homme prouve la vérité.". Je ne saurais jamais exprimer à
sa juste valeur les sentiments qui m’animent au travers de ces quelques lignes.
Mes remerciements vont aussi à ma très chère tante Angèle DIDAVI Épouse
ADJALLA et à Monsieur Virgile TOFFODJI pour leurs soutiens.
Je m’en voudrais de ne pas penser à mes collègues Renaud d’ALMEIDA, Yao
GNANGBOLOU, Faras ISSIAKO, Ibrahim LOPEZ, Taohidi LAMIDI, Idriss ATOU-
NISS, Bosco MITOKPE avec qui de chaleureux moments de travail ont été passés
au laboratoire LETIA. Recevez chers frères en ces lignes ma plus profonde gratitude.
Je pense aussi aux amis Marion HOUNGAN, Sonia ZANNOU, Armel TOSSOU,
Mathurin AYINA pour leurs soutiens.
Pour finir je m’en voudrais de ne pas remercier Mlle Carmelle GBETO dont la
patience, le soutien et l’amour m’ont été indispensables durant ma thèse, qu’elle
trouve ici l’expression de ma reconnaissance !
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace v

Résumé
Le présent travail de recherche vise à proposer une technique de prévision de la va-
riabilité de la puissance de sortie d’un générateur PV et/ou éolien installé à un point
géographique quelconque situé à l’intérieur d’une très grande zone géographique. La
technique de prévision regroupe un modèle de clustering (le k-means), un modèle
d’extraction de caractéristiques (la Transformée de Fourier Rapide), des modèles de
prévision de séries temporelles (le Convolutional Neural Network et le Long Short-
Term Memory) et des modèles mathématiques d’estimation de puissances PV et
éolienne. L’étude débute par l’identification de l’irradiation, la température et la vi-
tesse du vent comme paramètres météorologiques d’influence des puissances de sortie
PV et éolienne. Une fois la zone d’étude définie, elle est quadrillée et échantillonnée.
Les données relatives aux paramètres d’influence sont alors acquises pour tous les
échantillons sur une période d’étude allant du 1er Janvier 2012 au 31 Décembre 2021
dans la base de données de la NASA. Pour chaque paramètre d’influence, les échan-
tillons sont ensuite regroupés par similarité à 90% avec le modèle k-means. Ceci
conduit à la formation de clusters dans lesquels les irradiations, températures et vi-
tesses du vent varient au moins à 90% identiquement. A partir de ces clusters, la zone
d’étude est découpée en sous-zones dans lesquelles tous les paramètres varient iden-
tiquement. Ces sous-zones sont ensuite caractérisées en recherchant les systèmes qui
peuvent y être installés (PV, Eolien, PV-Eolien) ainsi que les périodes dans lesquelles
ils produiraient de manière optimale. Des modèles de prévisions des puissances de
sortie des systèmes caractéristiques sont alors développés pour des horizons de 24h,
48h et 72h en prévoyant les évolutions futures des paramètres météorologiques puis
en estimant la puissance de sortie à partir de modèles mathématiques. L’application
de cette technique au territoire béninois a permis d’aboutir à 207 sous-zones pour
lesquelles des modèles de prévision ont été développés. Une validation expérimentale
et une étude comparative des modèles CNN et LSTM ont montré que le LSTM était
globalement plus performant. Tous ces résultats ont donc conduit au développement
d’un outil capable de prévoir de manière optimale la puissance en sortie d’un système
adapté installé en tout point géographique au Bénin.
Mots-Clés : Prévision indirecte - Puissance PV - Puissance Eolienne - Ponctuelle
- Régionale - K-means - TFR - CNN - LSTM - Validation expérimentale
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace vi

Abstract
The aim of the present research work is to propose a technique for forecasting
the variability of the power output of a photovoltaic and/or wind generator instal-
led at any geographical point within a very large geographical area. The forecasting
technique combines a clustering model (k-means), a feature extraction model (Fast
Fourier Transform), time series forecasting models (Convolutional Neural Network
and Long Short-Term Memory) and mathematical models for photovoltaic and wind
power estimation. The study begins by identifying irradiance, temperature and wind
speed as meteorological parameters influencing PV and wind power output. Once
the study area has been defined, it is gridded and sampled. Data on the influen-
cing parameters are then collected from the NASA database for all samples over the
study period from January 1, 2012 to December 31, 2021. For each influence para-
meter, the samples are then grouped by similarity at 90% with the k-means model.
This leads to the formation of clusters in which irradiances, temperatures and wind
speeds vary at least 90% identically. From these clusters, the study area is split into
sub-areas in which all parameters vary identically. These sub-zones are then charac-
terized by identifying the systems that can be installed (PV, Wind, PV-Wind) and
the periods in which they would produce optimally. Models are then developed to
forecast the power output of the characteristic systems for 24h, 48h and 72h hori-
zons, by forecasting future changes in meteorological parameters and then estimating
the power output using mathematical models. Application of the technique to the
Beninese territory has resulted in 207 sub-zones for which forecasting models have
been developed. Experimental validation and a comparative study of the CNN and
LSTM models showed that the LSTM performed better overall. All these results led
to the development of a tool able to optimally forecast the power output of a suitable
system installed at any geographical point in Benin.
Keywords : Indirect forecasting - PV power - Wind power - Punctual - Regional
- K-means - FFT - CNN - LSTM - Experimental validation
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace vii

Liste des figures
1.1 Échelle de prévision pour la gestion de l’énergie dans un réseau élec-

trique [37, 38]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2 Relation entre les horizons de prévision, les modèles de prévision et
les activités connexes [38, 41]. . . . . . . . . . . . . . . . . . . . . . . 13
1.3 Horizons de prévision dans la prévision de la puissance PV . . . . . . 18
1.4 Horizons de prévision dans la prévision de l’énergie éolienne . . . . . 18
1.5 Nombre de publications sur la prévision de l’énergie solaire et éolienne
à l’aide de l’apprentissage profond (SCOPUS : 2014-2023). . . . . . . 33
1.6 Taxonomie de la prévision de l’énergie solaire et éolienne basée sur
l’apprentissage profond [132] . . . . . . . . . . . . . . . . . . . . . . . 34
1.7 Modèles d’apprentissage profond pour la prévision des énergies solaire
et éolienne utilisés dans les publications de 2022 dans SCOPUS. . . . 67
1.8 Architectures de modèles d’apprentissage profond pour la prévision
des énergies solaire et éolienne (par année : 2014-2023) (SCOPUS) . . 67
2.1 Diagramme de recherche . . . . . . . . . . . . . . . . . . . . . . . . . 77

2.2 Technique de prévision directe . . . . . . . . . . . . . . . . . . . . . . 79
2.3 Technique de prévision indirecte 1 . . . . . . . . . . . . . . . . . . . . 79
2.4 Technique de prévision indirecte 2 . . . . . . . . . . . . . . . . . . . . 80
2.5 Technique de quadrillage et d’échantillonnage . . . . . . . . . . . . . 81
2.6 Étapes de création d’un modèle d’apprentissage automatique . . . . . 84
2.7 Résumé graphique des techniques de traitement de données pour la
prévision de la puissance éolienne . . . . . . . . . . . . . . . . . . . . 87
2.8 Cadre de décomposition et d’intégration de la prévision de l’énergie
éolienne [161] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
2.9 Cadres de base de la sélection de caractéristiques : (a) filtre, (b) wrap-
ping [161] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
2.10 Le cadre général de la modélisation des erreurs résiduelles [161] . . . . 92
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace viii

Liste des figures
2.11 Diagramme de traitement des données . . . . . . . . . . . . . . . . . 95

2.12 Modèle ISA [277] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
2.13 Algorithmes de clustering . . . . . . . . . . . . . . . . . . . . . . . . 107
2.14 Technique de clustering utilisée . . . . . . . . . . . . . . . . . . . . . 109
2.15 Technique d’optimisation de ∆t . . . . . . . . . . . . . . . . . . . . . 113
2.16 Architecture d’un réseau LSTM [300] . . . . . . . . . . . . . . . . . . 118
2.17 Architecture d’un réseau CNN [301] . . . . . . . . . . . . . . . . . . . 120
2.18 Station météorologique . . . . . . . . . . . . . . . . . . . . . . . . . . 126
2.19 Capteur de température atmosphérique RK330-01B [305] . . . . . . . 126
2.20 Pyranomètre RK200-04 [306] . . . . . . . . . . . . . . . . . . . . . . . 127
2.21 Anémomètre RK100-02 [307] . . . . . . . . . . . . . . . . . . . . . . . 127
2.22 Girouette RK110-02 [308] . . . . . . . . . . . . . . . . . . . . . . . . 127
2.23 Enregistreur de données RK600- 07B [309] . . . . . . . . . . . . . . . 128
2.24 Courbe typique de la puissance éolienne [310] . . . . . . . . . . . . . 129
2.25 Catégorisation des modèles de courbes de puissance. . . . . . . . . . . 130
2.26 Circuit électrique équivalent de la représentation d’une cellule PV à
une diode : (a) en considérant les résistances shunt et série ; (b) en
considérant la résistance shunt infinie. . . . . . . . . . . . . . . . . . . 135
2.27 Système PV d’expérimentation . . . . . . . . . . . . . . . . . . . . . 140
2.28 Aérogénérateur d’expérimentation . . . . . . . . . . . . . . . . . . . . 141
2.29 Diagramme de fonctionnement du progiciel . . . . . . . . . . . . . . . 142
3.1 Taux d’accès à l’énergie électrique par commune [342] . . . . . . . . . 145

3.2 Potentiel en énergie photovoltaïque du Bénin [349] . . . . . . . . . . . 146
3.3 Vitesse moyenne du vent à 50m du sol [350] . . . . . . . . . . . . . . 147
3.4 Densité moyenne de puissance à 50m du sol [350] . . . . . . . . . . . 147
3.5 Zone d’étude délimitée . . . . . . . . . . . . . . . . . . . . . . . . . . 148
3.6 Evolution des nombres de clusters en fonction du pas de quadrillage . 149
3.7 Zone d’étude quadrillée et échantillonnée . . . . . . . . . . . . . . . . 150
3.8 Nombres d’échantillons en fonction du pas de quadrillage . . . . . . . 150
3.9 Présentation des fichiers téléchargés pour les 1081 échantillons . . . . 151
3.10 Présentation du contenu d’un des fichiers CSV . . . . . . . . . . . . . 151
3.11 Statistiques des données d’irradiation . . . . . . . . . . . . . . . . . . 152
3.12 Statistiques des données de température . . . . . . . . . . . . . . . . 152
3.13 Statistiques des données de vitesse du vent . . . . . . . . . . . . . . . 153
3.14 Classes de différence entre vitesses moyennes et écarts-types . . . . . 154
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace ix

Liste des figures
3.15 Statistiques des données d’irradiation normalisées . . . . . . . . . . . 155

3.16 Statistiques des données de température normalisées . . . . . . . . . . 155
3.17 Statistiques des données de vitesse du vent normalisées . . . . . . . . 156
3.18 Qualités des clusters d’irradiation . . . . . . . . . . . . . . . . . . . . 157
3.19 Qualités des clusters de température . . . . . . . . . . . . . . . . . . 157
3.20 Qualités des clusters de vitesse du vent . . . . . . . . . . . . . . . . . 158
3.21 Situations géographiques des échantillons du cluster 2 d’irradiation . 159
3.22 Situations géographiques des échantillons du cluster 12 d’irradiation . 160
3.23 Situations géographiques des échantillons des clusters 30, 79, 14 et 62
de température . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
3.24 Situations géographiques des échantillons des clusters 17, 8, 45 et 65
de vitesse du vent à 50m du sol . . . . . . . . . . . . . . . . . . . . . 162
3.25 Évolutions de l’irradiation pour les échantillons du cluster 2 . . . . . 163
3.26 Évolutions de l’irradiation pour les échantillons du cluster 12 . . . . . 163
3.27 Évolutions de la température pour les échantillons du cluster 30 . . . 164
3.31 Évolutions de la vitesse du vent pour les échantillons du cluster 17 . . 166
3.35 Silhouette Score des 1081 échantillons de test pour l’intégration dans
les clusters d’irradiation . . . . . . . . . . . . . . . . . . . . . . . . . 168
les clusters de température . . . . . . . . . . . . . . . . . . . . . . . . 168
les clusters de vitesse du vent . . . . . . . . . . . . . . . . . . . . . . 169
3.38 Échantillons constitutifs de la sous-zone 13 . . . . . . . . . . . . . . . 170
3.39 Rose de vent et Distribution de Weibull de la sous-zone 13 . . . . . . 171
3.40 Périodes de production optimale d’un aérogénérateur dans la sous-
zone 13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
3.41 Périodes de production optimale d’un générateur PV dans la sous-zone
13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
3.42 Périodes de production optimale d’un générateur PV dans la sous-zone
13 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace x

Liste des figures
3.43 Situations géographiques des échantillons des sous-zones 15, 68, 88 et 92174
3.44 Période maximale de production optimale eolienne . . . . . . . . . . . 174
3.45 Situations géographiques des échantillons des sous-zones 39, 40 et 42 . 175
3.46 Situations géographiques des échantillons des sous-zones 67, 68 et 70 . 176
3.47 Période maximale de production optimale PV . . . . . . . . . . . . . 176
3.48 Transformations de Fourier Rapide de l’irradiation, de la température
et de la vitesse du vent . . . . . . . . . . . . . . . . . . . . . . . . . . 178
3.49 Capture du dataset d’irradiation . . . . . . . . . . . . . . . . . . . . . 179
3.50 Capture du dataset de température . . . . . . . . . . . . . . . . . . . 179
3.51 Capture du dataset de vitesse du vent . . . . . . . . . . . . . . . . . . 180
3.52 Résultats de Test des performances de prévision de l’irradiation du
modèle TFR-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
3.53 Résultats de Test des performances de prévision de la température du
modèle TFR-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
3.54 Résultats de Test des performances de prévision des composantes Wx
et Wy de la vitesse du vent du modèle TFR-LSTM . . . . . . . . . . 187
3.55 Directions du vent prévues et réelles . . . . . . . . . . . . . . . . . . . 188
3.56 Vitesses du vent prévues et réelles . . . . . . . . . . . . . . . . . . . . 189
3.57 Courbe de puissance de l’aérogénérateur NE-200s . . . . . . . . . . . 190
3.58 Puissances éoliennes estimées . . . . . . . . . . . . . . . . . . . . . . 191
3.59 Irradiations prévues sur plans horizontal et incliné . . . . . . . . . . . 192
3.60 Puissances estimées et irradiations prévues sur plan incliné . . . . . . 193
3.61 Puissances estimées et températures prévues . . . . . . . . . . . . . . 193
3.62 Irradiations mesurées et filtrées . . . . . . . . . . . . . . . . . . . . . 194
3.63 Températures mesurées et filtrées . . . . . . . . . . . . . . . . . . . . 194
3.64 Puissances PV mesurées et filtrées . . . . . . . . . . . . . . . . . . . . 195
3.65 Vitesses de vent mesurées et filtrées . . . . . . . . . . . . . . . . . . . 195
3.66 Puissances électriques mesurées et filtrées en sortie du NE-200S . . . 196
3.67 Irradiations prévues et mesurées . . . . . . . . . . . . . . . . . . . . . 196
3.68 Températures prévues et mesurées . . . . . . . . . . . . . . . . . . . . 197
3.69 Puissances prévues et mesurées . . . . . . . . . . . . . . . . . . . . . 197
3.70 Paramètres Wx prévus et réels (Cas 1) . . . . . . . . . . . . . . . . . 198
3.71 Paramètres Wy prévus et réels (Cas 1) . . . . . . . . . . . . . . . . . 199
3.72 Vitesses de vent prévues et réelles (Cas 1) . . . . . . . . . . . . . . . 200
3.73 Puissances prévues et réelles en sortie de l’éolienne (Cas 1) . . . . . . 200
3.74 Paramètres Wx prévus et réels (Cas 2) . . . . . . . . . . . . . . . . . 201
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xi

Liste des figures
3.75 Paramètres Wy prévus et réels (Cas 2) . . . . . . . . . . . . . . . . . 201

3.76 Vitesses de vent prévues et réelles (Cas 2) . . . . . . . . . . . . . . . 202
3.77 Puissances prévues et réelles en sortie de l’éolienne (Cas 2) . . . . . . 202
3.78 Accueil de l’application . . . . . . . . . . . . . . . . . . . . . . . . . . 207
3.79 Fenêtre pour la prévision . . . . . . . . . . . . . . . . . . . . . . . . . 207
3.80 Fenêtre pour renseigner les coordonnées géographiques . . . . . . . . 208
3.81 Fenêtre pour la caractérisation du site . . . . . . . . . . . . . . . . . 208
3.82 Fenêtre pour la prévision des différentes puissances . . . . . . . . . . 209
3.83 Fenêtre pour la prévision des différentes puissances . . . . . . . . . . 210
3.84 Fenêtre de présentation des données sauvegardées . . . . . . . . . . . 211
3.85 Coordonnées géographiques du site renseignées . . . . . . . . . . . . . 213
3.86 Lancement de l’intégration à une sous-zone . . . . . . . . . . . . . . . 213
3.87 Résultats d’intégration à une sous-zone . . . . . . . . . . . . . . . . . 214
3.88 Renseignement des informations pour la caractérisation du site . . . . 214
3.89 Distribution de Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . 215
3.90 Rose de vent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
3.91 Périodes de productions optimales . . . . . . . . . . . . . . . . . . . . 216
3.92 Renseignement des informations pour un essai de prévision . . . . . . 216
3.93 Résultats de prévision des irradiation, température, puissance PV
pour 72h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
3.94 Résultats de prévision des vitesse du vent et puissance éolienne pour
12h . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
3.95 Capture d’un essai de supervision . . . . . . . . . . . . . . . . . . . . 218
3.96 Présentation des données archivées . . . . . . . . . . . . . . . . . . . 219
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xii

Liste des tableaux
1.1 Spécifications de la catégorie d’application [34]. . . . . . . . . . . . . 11

1.2 Abréviations couramment utilisées pour les évaluations des perfor-
mances prévisionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.3 Résumé des méthodes de prévision dans lesquelles les modèles basés
sur CNN sont utilisés . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
sur les RNN sont utilisés . . . . . . . . . . . . . . . . . . . . . . . . . 38
sur le DBN sont utilisés . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.6 Résumé des méthodes de prévision dans lesquelles des modèles hy-
brides sont utilisés pour l’énergie éolienne . . . . . . . . . . . . . . . . 51
brides sont utilisés pour l’énergie solaire . . . . . . . . . . . . . . . . 56
brides sont utilisés pour les énergies solaire et éolienne ensemble . . . 59
brides sont utilisés pour les prévisions probabilistes . . . . . . . . . . 62
2.1 Résumé des méthodes de sélection des caractéristiques dans la prévi-

sion de l’énergie éolienne . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.2 Classes et longueurs de rugosité . . . . . . . . . . . . . . . . . . . . . 101
2.3 Hyperparamètres du modèle CNN et plages de variation . . . . . . . 124
2.4 Hyperparamètres du modèle LSTM et plages de variation . . . . . . . 124
2.5 Différents modèles MPP trouvés dans la littérature . . . . . . . . . . 138
3.1 Hyperparamètres optimisés pour la prévision de l’irradiation . . . . . 181

3.2 Hyperparamètres optimisés pour la prévision de la vitesse du vent . . 181
3.3 Hyperparamètres optimisés pour la prévision de la température . . . 182
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xiii

Liste des tableaux
3.4 Performances des modèles pour la prévision de l’irradiation . . . . . . 183

3.5 Performances des modèles pour la prévision de la vitesse du vent . . . 183
3.6 Performances des modèles pour la prévision de la température . . . . 184
3.7 Performances de prévisions des direction et vitesse du vent avec le
modèle TFR-LSTM . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
3.8 Caractéristiques de l’aérogénérateur NE-200S . . . . . . . . . . . . . 191
3.9 Caractéristiques du BP SOLAR 340 . . . . . . . . . . . . . . . . . . . 192
3.10 Performances de prévision de l’irradiation, de la température et de la
puissance PV lors de la validation expérimentale . . . . . . . . . . . . 198
3.11 Performances de prévisions des paramètres Wx, Wy et des vitesses et
puissances (Cas 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
puissances (Cas 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
puissances sur toute la période de mesure . . . . . . . . . . . . . . . . 203
3.14 Comparaison des performances de prévision de l’irradiation . . . . . . 204
3.15 Comparaison des performances de prévision de la puissance PV . . . 205
3.16 Comparaison des performances de prévision de la vitesse du vent . . . 206
3.17 Informations pour le test du progiciel . . . . . . . . . . . . . . . . . . 212
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xiv

Liste des Algorithmes
Liste des Algorithmes
1 Hold-out cross-validation . . . . . . . . . . . . . . . . . . . . . . . . . 104

2 K-fold cross-validation . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xv

Nomenclature
ACM Continuous Ranking Probability Score

ANN Artificial Neural Network
ARIMA AutoRegressive Integrated Moving Average
ARMA AutoRegressive–Moving-Average
BPNN Back Propagation Neural Network
BRT Bagged Regression Trees
CEEMDAN Complete Ensemble Empirical Mode Decomposition with Adaptive Noise
CFS Climate Forecast System
CNN Convolutional Neural Network
COST European Cooperation in Science and Technology
CRPS Continuous Ranking Probability Score
DBN Deep Belief Network
DGF Double Gaussian Function
DGM Discrete Grey Model
DL Deep Learning
DRNN Deep Recurrent Neural Network
DWPD Discrete Wavelet Packet Decomposition
ECMWF European Centre for Medium-Range Weather Forecasts" - ECMWF
EEMD Ensemble Empirical Mode Decomposition
ELM Extreme Learning Machine
EMD Empirical Mode Decomposition
EWMA Exponentially Weighted Moving Average
EWT Empirical Wavelet Transform
FDC Fonction de Distribution Cumulative
FFNN Feed Forward Neural Network
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xvi

Nomenclature
FFT Fast Fourier Transform

FIG Fuzzy Information Granulation
GA Genetic Algorithm
GARCH Generalized Auto-Regressive Conditionally Heteroscedastic
GDAS Global Data Assimilation System
GFS Global Forecast System
GHI Global Horizontal Irradiance
GRU Gated Recurrent Unit
IRENA International Renewable Energy Agency
IS Interval Sharpness
ISO-NE Independent System Operator New England
KELM kernel-Based Extreme Learning Machine
LGBM Light Gradient Boosting Machine
LLSR Linear Least Squares Regression
LSSVM Least-Squares Support Vector Machine Regression
LSTM Long-Short-Term-Memory
MAE Mean Absolute Error
MAPE Mean Absolute Percentage Error
MI Mutual Information
ML Machine Learning
MLP Multilayer Perceptron network
MOMVO Multi-Objective Multi-Verse Optimization
MOPSO Multiobjective particle swarm optimization
NARX Nonlinear AutoRegressive eXogenous
nMAPE Normalized Mean Absolute Percentage Error
NOAA National Oceanic and Atmospheric Administration
NOCT Normal Operang Cell Temperature Photovoltaic
NREL National Renewable Energy Laboratory
nRMSE Normalized Root Mean Square Error
NWP Numerical Weather Prediction
ORELM Outlier Robust Extreme Learning Machine
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xvii

Nomenclature
PNT Prévision Numérique du Temps

PSR Phase Space Reconstruction
PV Photovoltaïque
RBFNN Radial Basis Function Neural Network
RBM Restricted Boltzmann Machine
ReLU Rectified Linear Unit
RF Random Forest
RMSE Root Mean Square Error
RNA Réseaux de Neurones Artificiels
RNN Recurrent Neural Network
SAE Sparse Autoencoder
SARIMA Seasonal Autoregressive Integrated Moving Average
SDE Standard Deviation of Error
SELU Scaled Exponential Linear Units
SER Sources d’Energies Renouvelables
SERIS Sources d’Energies Renouvelables Intermittentes et Stochastiques
SGD Stochastic Gradient Descent
SSA Singular Spectrum Analysis
SVR Support Vector Machine Regression
TFR Transformation de Fourier Rapide
TSF Time series forecasting
TVF-EMD Time-Varying, Filtering-Based Empirical Mode Decomposition
VMD Variational Mode Decomposition
WPD Wavelet Packet Decomposition
WSTD Wavelet Soft Threshold Denoising
WT Wavelet Transform
XGBF eXtreme Gradient Boosting Forest
XGBoost eXtreme Gradient Boosting
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xviii

Introduction générale
Contexte - Problématique - Justification
Au stade actuel du développement technologique, les combustibles fossiles ré-

pondent à la plupart des besoins énergétiques de la planète. Bien que des questions
se posent quant à la disponibilité de ces ressources énergétiques, à la pollution de
l’environnement et aux limites connexes de leur utilisation, on s’attend à ce que les
combustibles fossiles constituent une ressource importante pour la fourniture d’éner-
gie dans les décennies à venir, en particulier l’électricité. Cependant, afin de répondre
aux besoins énergétiques mondiaux croissants tout en préservant l’environnement,
et de laisser la possibilité d’utiliser des combustibles fossiles à l’avenir, des sources
d’énergie alternatives "propres" sont en cours de développement. Elles comprennent
les énergies éolienne, solaire, hydraulique, celle obtenue à partir de la biomasse (ma-
tière végétale), l’énergie géothermique (chaleur de la Terre) et l’énergie des océans.
En Afrique, nous disposons probablement des plus grandes ressources d’énergies
renouvelables de tous les continents. D’une manière homogène, la lumière du soleil est
disponible en abondance partout et les autres types de ressources d’un pays et d’une
région à l’autre se répartissent d’une manière plus hétérogène. Entre autres, il peut
être mentionné dans la Corne de l’Afrique l’énergie éolienne, la géothermie en Afrique
de l’Est, le long de la vallée du Rift. Selon un rapport de IRENA et al. intitulé "La
transition vers les énergies renouvelables en Afrique : Renforcer l’accès, la résilience et
la prospérité" [1], on peut noter des productibles annuels de 1 478 TWh/an, 978 066
TWh/an, 1 449 742 TWh/an, 105 TWh/an et 2 374 TWh/an respectivement pour
l’Hydroélectricité, l’Eolien, le Solaire Photovoltaïque, la Géothermie et la Biomasse.
Il s’agit d’évaluations théoriques qui ne prennent pas en compte le plus souvent les
impacts environnementaux ainsi que les conflits d’utilisation. Néanmoins ce potentiel
théorique de l’Afrique devrait permettre de satisfaire toute sa demande énergétique
[1]. Mais malheureusement, le taux d’accès à l’électricité en Afrique Subsaharienne est
estimé en 2020 à 48,2 % qui chute à 28,5 % en zone rurale [2, 3]. Plus de la moitié de
la population d’Afrique Subsaharienne, soit plus de 600 millions d’habitants dont 58
Thèse de doctorat DIDAVI Kossoko Babatoundé Audace 1

% vivent en zone rurale n’a donc pas accès à l’électricité (statistiques de 2021) [4, 5].
De plus en 2021, la capacité de production nette maximale des centrales électriques
et autres installations qui utilisent des sources d’énergie renouvelables pour produire
de l’électricité en Afrique ne représentait que 2% du total mondial (55 863 MW).
Pourquoi donc ce paradoxe ?
En effet l’intégration de Sources d’Energies Renouvelables (SER) présente certes
de nombreux avantages tels que :
• la protection de l’environnement : elles représentent zéro ou presque zéro pour

cent des émissions de gaz à effet de serre et autres pollutions atmosphériques
[6, 7] ;
• la réduction de la dépendance énergétique ainsi que des importations des
ressources énergétiques fossiles ;
• la création de l’emploi : on considère généralement que les sources d’énergie
renouvelables ont un fort effet sur l’augmentation de l’emploi, en particulier sur
l’emploi de la population locale où se trouve une source renouvelable particu-
lière. Des recherches ont montré que ce n’est pas tout à fait exact, mais que
cela diffère considérablement selon le degré d’activité du cycle de vie de l’instal-
lation qui exploite la source d’énergie renouvelable. Bien que chaque segment
d’énergie renouvelable ait des caractéristiques spécifiques, ils ont tous un cycle
de vie commun qui comprend cinq phases [8] :
1. Recherche et conception
2. Développement et fabrication
3. Construction et installation
4. Exploitation et entretien ou service
5. Mise à jour et/ou démantèlement
• la contribution au développement économique et, en général, à la satisfaction
des besoins en électricité de la civilisation des zones rurales.
Toutefois, il convient de noter que les sources d’énergie renouvelables ne sont pas
toujours la meilleure solution pour fournir des quantités supplémentaires d’électri-
cité et que leur acheminement vers le réseau électrique présente certaines lacunes et
difficultés :
• elles dépendent du temps et de l’espace : c’est principalement en raison de leurs
caractéristiques naturelles que les sources renouvelables dépendent entièrement

de l’emplacement géographique et des conditions météorologiques, à savoir que

la volatilité et l’imprévisibilité de la source renouvelable sont une limitation et
une difficulté importante dans la production d’électricité ;
• elles ont une faible capacité de production d’électricité : lorsque l’on com-
pare les sources d’énergie renouvelables aux ressources traditionnelles d’énergie
fossile, elles ne sont pas en mesure de produire d’aussi grandes quantités d’élec-
tricité que ces dernières ;
• elles ont un faible rapport Puissance installée / Superficie de l’emplacement
occupée : les centrales à énergies renouvelables doivent disposer d’une sur-
face beaucoup plus grande que les centrales thermiques pour produire la même
quantité d’électricité ;
• elles ont un rendement énergétique faible : les sources d’énergie renouvelables
ont un rendement énergétique relativement faible, à l’exception des centrales
hydroélectriques. En outre, les centrales à biomasse et à biogaz ont une efficacité
de 30 à 40%, les centrales à déchets de 22 à 28%, tandis que les centrales
photovoltaïques et géothermiques ont l’efficacité énergétique la plus faible (entre
15% et 20%) [9, 10]. Bien que l’efficacité énergétique d’une centrale éolienne
moyenne soit d’environ 35%, elle peut atteindre 45% dans les éoliennes les plus
modernes ;
En nous tournant uniquement vers les sources solaire photovoltaïque et éolienne qui
sont les plus accessibles et les plus utilisées après l’hydroélectricité, elles sont celles
qui font aussi ressortir le plus les aspects intermittent et stochastique qui constituent
un grand frein à leurs intégrations. En effet, à mesure que la part de l’électricité
produite par les systèmes d’énergie photovoltaïque et éolienne augmente, la nécessité
d’intégrer pleinement ces deux Sources d’Energies Renouvelables Intermittentes et
Stochastiques (SERIS) dans les réseaux électriques se fait sentir. Ainsi, l’un des prin-
cipaux défis pour l’approvisionnement énergétique mondial dans un avenir proche est
la forte intégration des sources d’énergies renouvelables. Le comportement stochas-
tique et intermittent des ressources solaire et éolienne pose de nombreux problèmes
qui ont alors un impact négatif sur le coût de production ainsi que l’efficacité de
l’opérateur du réseau électrique. Entre autres, nous pouvons citer :
• une complication de l’équilibrage du réseau : l’incertitude et la variabilité
des ressources éolienne et solaire posent des problèmes aux gestionnaires de
réseau qui nécessitent des actions supplémentaires et complexes pour équilibrer
le système. Une plus grande flexibilité du système est alors nécessaire pour tenir

compte de la variabilité de l’offre et de la relation avec les niveaux de production

et les charges ;
• la dégradation de la fiabilité du réseau : l’opérateur électrique a souvent des
difficultés à maintenir l’équilibre production/consommation avec des moyens
de production d’énergie conventionnels et gérables, principalement dans les ré-
seaux électriques de petite taille et/ou non interconnectés (comme les réseaux
insulaires). D’ores et déjà, il apparaît qu’un événement prédit et anticipé est
plus facile à gérer. L’opérateur d’énergie électrique a besoin de connaître le fu-
tur de la production et de la consommation électrique avec différents horizons
temporels. L’intégration des SERIS dans un réseau électrique intensifie la com-
plexité de la gestion du réseau [11]. La fiabilité du système électrique dépend
alors de sa capacité à s’adapter aux changements attendus et inattendus (dans
la production et la consommation) et aux perturbations tout en maintenant la
qualité et la continuité du service aux clients ;
• des difficultés de gestion des réserves du réseau : même si aucune SERIS
n’est intégrée dans le réseau électrique, des réserves d’énergie et de puissance
sont nécessaires. Elles peuvent être divisées en deux catégories : les réserves
de contingence, utilisées en cas d’événement spécifique (comme le démarrage
d’une centrale électrique) et les réserves sans événement utilisées en permanence
(en raison, par exemple, d’une prévision de charge peu fiable) [12]. Ces réserves
(contingence et non-événement) sont lancées à différentes échelles de temps : en
moins d’une minute (réserve primaire) en utilisant des générateurs tournants,
entre une minute et une heure (réserves secondaires/tertiaires) et plus d’une
heure [13] ;
• une variation du prix de l’électricité en raison de contraintes techniques :
la variation temporelle de la production d’électricité, plus importante pour les
SERIS, et le travail de l’opérateur du réseau électrique pour équilibrer cette
variation affectent le coût de l’énergie qui varie dans le temps, l’espace et le
délai entre le contrat et la livraison [14]. Dans les trois dimensions (temps,
espace et délai), les écarts de prix se produisent à la fois de manière aléatoire
et saisonnière (et selon des schémas prévisibles) [15]. Ainsi, même dans un
marché de l’énergie classique, utilisant uniquement des moyens énergétiques
contrôlables, le prix du kWh varie fortement et donc variera encore plus avec
l’insertion des SERIS ;
• un coût de l’intermittence : la variabilité du rayonnement solaire se produit à

différentes échelles de temps : saisonnière en raison de la position de la Terre par

rapport au soleil, diurne en raison de la variation de l’angle entre le rayonnement
solaire et le sol terrestre, variable à la minute ou à la seconde en raison des condi-
tions météorologiques locales telles que les nuages et les tempêtes de poussière
[16–18]. Les variations rapides de la puissance et de l’énergie des SERIS sont
très gênantes pour les opérations des services publics [19–22]. Sans connaître la
production des SERIS quelques jours avant, les contrats d’achat d’électricité dé-
cidés à l’avance sont difficiles à mettre en place et sans connaître la production
future des SERIS, il est difficile d’anticiper l’arrêt ou le démarrage des généra-
teurs de secours qui ne sont pas instantanés. Certains des générateurs doivent
alors rester en fonctionnement même s’ils ne produisent pas pour compenser
rapidement les courtes variations de production. Toutes ces intermittences in-
duisent des coûts supplémentaires [23–25]. La production à base des SERIS ne
suit pas la charge et comme le stockage de l’électricité n’est pas illimité et est
coûteux, cette variabilité est coûteuse. De plus cette production est incertaine
jusqu’au dernier moment, et comme le commerce de l’électricité a lieu la veille
de la fourniture, les écarts entre la production prévue et la production réelle
doivent être équilibrés à court terme, ce qui est coûteux [26]. Cette production
dépend aussi de l’emplacement et comme l’électricité ne peut être transportée
facilement, des coûts apparaissent car le transport de l’électricité est coûteux
et les bons sites d’énergie renouvelable sont souvent situés loin des centres de
demande. Ainsi, la valeur économique moyenne de l’électricité produite à base
des SERIS est plus élevée que si la même quantité d’électricité était produite à
toutes les heures de la journée [14].
Ainsi donc une exploitation ou intégration sans précaution des SER et plus particu-
lièrement des SERIS n’offre aucune garantie dans la production, entraîne des coûts
supplémentaires de production et déstabilise l’ensemble du réseau compte tenue des
intermittences et variations aléatoires qu’elles présentent.
De ces avantages et inconvénients nous pouvons retenir donc qu’au vu des dif-
férents potentiels en ressources renouvelables dont dispose l’Afrique, les SER repré-
sentent pour elle une opportunité à saisir pour booster son secteur énergétique. Nous
pouvons comprendre aussi les freins observés face à leurs intégrations. Comment
donc exploiter/intégrer au mieux ces sources variables et/ou intermittentes (so-
laire et éolienne), fortement dépendantes du temps et de l’espace pour répondre à
une demande énergétique croissante, elle aussi variable dans le temps ? Tel un sage,

qui successivement observant une suite d’évènements, prédit l’approche d’un phé-
nomène naturel, ne pouvons-nous pas disposer de systèmes intelligents capables, à
l’image d’un humain d’anticiper sur les variations des puissances de sortie de ces
systèmes ? Telles sont autant de questions auxquelles nous tâcherons de répondre
dans cette thèse.
Objectifs et contributions
Eu égard aux inconvénients susmentionnés, l’intégration des SERIS passe inévi-

tablement par la recherche de solutions aux principaux inconvénients. Ainsi, hormis
l’aspect financier :
• pour tirer d’elles de bonnes productions, la capacité d’identification de tout

lieu géographique adéquat (présentant de bonnes conditions météorologiques)
pouvant permettre leurs installations est nécessaire ;
• leur exploitation efficace passe par la maîtrise des potentialités et des variations
des conditions météorologiques dans les espaces géographiques dans lesquels les
systèmes sont installés ;
• la recherche de solutions efficaces à coûts réduits aux intermittences que cer-

taines sources présentent est indispensable ;
• les recherches pour l’augmentation des rendements des systèmes de production

fonctionnant à base des SER doivent être encouragées ;
• des techniques de la maîtrise efficace de la variabilité des puissances de sortie des

systèmes de production fonctionnant à base des SER doivent être développées
afin de faciliter leurs intégrations dans les mix énergétiques.
Ainsi nous nous sommes donné comme objectif principal de cette thèse de déve-
lopper un outil d’identification des périodes de production optimale et de prévision
de la variabilité de la puissance de sortie d’un système photovoltaïque et/ou éolien
installé à un point géographique quelconque situé à l’intérieur d’une très grande
zone. De façon spécifique, nous visons à :
• identifier les paramètres d’influence de la variabilité de la puissance de sortie ;

• déterminer suivant l’environnement d’installation, les périodes de production

optimale du système ;
• dans ces périodes de production optimale, modéliser les variations temporelles

des paramètres d’influence ;
• suivant les cas d’utilisation, prévoir pour des horizons donnés des valeurs futures
de la puissance de sortie.
La contribution principale de cette thèse est l’élaboration d’un outil d’aide à la

décision capable d’informer sur les périodes de production optimale d’un système
photovoltaïque et/ou éolien installé à un point géographique quelconque situé à l’in-
térieur d’une très grande zone ainsi que sur l’évolution future de sa puissance de
sortie. De façon plus précise, il s’agit d’un progiciel capable, lorsque les coordonnées
d’un site à l’intérieur de la zone d’étude ainsi que les caractéristiques du systèmes
sont renseignées, de délimiter sur une année les périodes d’exploitation optimale du
système puis d’effectuer des prévisions de la variabilité de sa puissance de sortie dans
un futur proche. Cet outil permettra entres autres de manière plus détaillée :
• d’avoir un aperçu du fonctionnement tout au long d’une année du système à

tous les points géographiques de la zone d’étude ;
• d’identifier les points géographiques pour lesquels un système pourrait avoir des
productions pareilles : ceci pourrait permettre un choix plus adéquat de site et
d’éviter de reprendre entièrement les études pour un nouveau site ;
• d’identifier des points géographiques où différents systèmes pourraient être ins-

tallés et produire de manière complémentaire ou non afin de suivre la variation
d’une charge précise ;
• de faire l’acquisition des données pour un système existant et à partir de celles-

ci, estimer des valeurs futures de la puissance de sortie.
Une autre contribution est le développement d’une nouvelle technique de prévi-

sions régionale et ponctuelle des puissances PV et éolienne. Cette technique permet-
tra d’utiliser un même modèle de prévision pour toute une zone délimitée et pour
plusieurs points géographiques.

Au-delà de ces contributions majeures, nous pouvons mentionner aussi le déve-

loppement pour l’ensemble du territoire béninois :
• de modèles de prévision de la variabilité de l’irradiation solaire ;
• de modèles de prévision de la variabilité de la température ambiante ;
• de modèles de prévision de la variabilité de la puissance photovoltaïque ;
• de modèles de prévision de la variabilité de la vitesse du vent ;
• de modèles de prévision de la variabilité de la direction du vent ;
• de modèles de prévision de la variabilité de la puissance éolienne ;
mais aussi pour toutes les localités du Bénin, l’identification des périodes de produc-
tion optimale des générateurs PV et éolien.
Organisation de la thèse
Le plan de développement suivi dans cette thèse s’articule autour de trois cha-
pitres.
Dans le premier chapitre, nous faisons ressortir en premier lieu l’importance d’une
bonne prévision puis à travers des études bibliographique et bibliométrique, nous dé-
gageons les méthodes et modèles de prévision les plus utilisés parmi lesquels des choix
justifiés sont effectués. A travers l’étude bibliographique, les paramètres d’entrée ainsi
que les méthodes d’évaluation et de comparaison des modèles de prévision des puis-
sances photovoltaïque et éolienne sont aussi identifiées. Un attention particulière est
portée aux modèles de prévision du Deep Learning.
Dans le second chapitre, la technique de prévision développée est présentée. Pour
toutes les étapes de prévision, comportant la définition de la zone d’étude, l’acqui-
sition des données, le traitement des données, la réduction de la zone d’étude, la
caractérisation de la zone d’étude, le développement des modèles de prévision et la
validation expérimentale, les méthodologies ainsi que le matériel utilisés sont présen-
tés.
Le troisième chapitre présente les résultats d’application de la technique de pré-
vision développée au territoire béninois. Au terme de ce chapitre, le progiciel conçu
à partir de ces différents résultats est présenté.

CHAPITRE 1
Prévision de la production des Sources

d’Energies Renouvelables Intermittentes et
Stochastiques : une nécessité pour une
meilleure intégration


Prévision de la production des SERIS : une nécessité pour une meilleure intégration
Introduction
La nature intermittente des Sources d’Energies Renouvelables pose plusieurs pro-

blèmes lorsqu’elles sont intégrées au mix énergétique sans précaution, tels que la
fiabilité, la qualité de l’énergie et l’équilibre entre l’offre et la demande. Ainsi, la pré-
vision de la production d’énergie à partir de sources renouvelables avec des systèmes
tels que les éoliennes et les panneaux solaires, devient essentielle pour le fonction-
nement efficace et permanent du réseau électrique et permet également d’atteindre
une utilisation optimale des sources renouvelables. Ce chapitre couvre les techniques
importantes pour concevoir des modèles de prévision des puissances de sortie PV et
Eolienne. Sont passés en revue les techniques et modèles les plus utilisés afin de faire
un choix de technique et modèles à adopter pour nos travaux.
1.1 Utilité de la prévision
Dans cette section est fait un état de l’art des bienfaits d’une bonne prévision des
Sources d’Energies Renouvelables Intermittentes et Stochastiques.
1.1.1 Prévoir pour mieux intégrer et exploiter
La prévision de la sortie des systèmes électriques utilisant les SERIS est néces-
saire pour un bon fonctionnement du réseau électrique et pour une gestion optimale
des flux d’énergie se produisant dans les systèmes SERIS [27]. Elle est nécessaire
pour l’estimation des réserves, pour la programmation du système électrique, pour
la gestion de la congestion, pour la gestion optimale du stockage et pour les échanges
sur le marché de l’électricité [28, 29].
En raison de la forte augmentation de la production d’électricité à base de SERIS,
la prévision des productions solaires et éoliennes devient de plus en plus importante.
Une petite erreur de prévision induit deux effets négatifs : l’opérateur du réseau
peut recevoir des pénalités élevées parce que la prévision inexacte n’a pas permis
d’atteindre le profil de production prévu et l’utilisation de générateurs de secours
est plus importante pour compenser l’écart entre les productions prévue et réelle
[30, 31]. Une solution consiste à utiliser le stockage local en combinaison avec les
SERIS afin de compenser les écarts entre les prévisions et la production d’électricité
[30, 31] ou à combiner plusieurs SERIS réparties sur une grande zone de manière à
ce que les erreurs de prévision individuelles de chaque SERIS soient indépendantes
et que l’erreur de prévision globale soit réduite (effet d’agrégation) [32].

Différents systèmes de stockage ont été développés et constituent une solution

viable pour absorber l’excès de puissance et d’énergie produit à base des SERIS (et
le restituer en période de pointe de consommation), pour apporter des fluctuations
très courtes et pour maintenir une continuité de la qualité de l’énergie.
Ces moyens de stockage sont généralement classés en 3 catégories [33, 34] (Ta-
bleau 1.1) :
• le stockage d’énergie brute ou stockage de gestion de l’énergie utilisé pour dé-

coupler le moment de la production et de la consommation ;
• le stockage utilisé pendant la production distribuée ou pour l’obtention d’une
puissance de transition, pour l’écrêtement des pointes ; ce stockage est utilisé
pendant quelques secondes ou minutes et assure la continuité du service lors du
passage d’une source d’énergie à une autre ;
• le stockage pour assurer la qualité de l’énergie ou la fiabilité de l’utilisation
finale. L’énergie stockée n’est utilisée que pendant quelques secondes ou moins
pour assurer la continuité d’une alimentation de qualité.
Tableau 1.1 – Spécifications de la catégorie d’application [34].
Catégorie Puissance de Temps de dé- Énergie sto- Application représentative

décharge charge ckée
Énergie brute 10–1000 MW 1–8 h 10–8000 MWh Nivellement de la charge, réserve
tournante
Production dis- 0.1–2 MW 0.5–4 h 50–8000 kWh Economie de pointe, report de trans-
tribuée mission
Qualité de 0.1–2 MW 1–30 s 0,03–16,7 kWh Qualité/fiabilité de l’alimentation de
l’énergie l’utilisateur final
Le tableau 1.1 montre que les moyens de stockage d’énergie agissent à différents
niveaux temporels et leur gestion nécessite de connaître la puissance ou l’énergie
produite à base des SERIS à différents horizons temporels : de très court à court pour
la catégorie qualité de l’énergie à horaire ou quotidien pour les stockages d’énergie
de masse [35]. Une bonne prévision est alors utile pour la gestion du stockage : elle
permet de diminuer le montant des réserves de flexibilité [31, 36] et d’optimiser la
gestion du stockage d’énergie en anticipant les phases de charge et de décharge.

Figure 1.1 – Échelle de prévision pour la gestion de l’énergie dans un réseau élec-
trique [37, 38].
De même, l’opérateur électrique a besoin de connaître la production future (Fi-

gure 1.1 ) à différents horizons de temps : de un à trois jours pour préparer les moyens
de production (et programmer les maintenances préventives), de quelques minutes à
quelques heures pour planifier le démarrage des centrales en réserve (entre 5 min et
40 h selon les moyens de production d’énergie [39]).
Par conséquent, les horizons de prévision pertinents peuvent et doivent s’étendre
de 5 min à plusieurs jours comme l’ont confirmé Diagne et al [38]. Elliston et MacGill
[40] ont passé en revue toutes les raisons de prévoir le rayonnement solaire pour divers
systèmes solaires (PV, thermique, centrale solaire thermique à concentration...) en
insistant sur l’horizon de prévision. Il est donc évident que le pas de temps des
données prévues (énergie journalière ou horaire, énergie 10-min ou 20-min...) varie
en fonction des objectifs et de l’horizon de prévision. La Figure 1.2 [38, 41] résume
les méthodes existantes en fonction de l’horizon de prévision, de l’objectif et du pas
de temps.

Figure 1.2 – Relation entre les horizons de prévision, les modèles de prévision et
les activités connexes [38, 41].
Que ce soit donc pour la gestion du stockage ou pour les négociations sur le marché
de l’électricité, la prévision des puissances de sorties des systèmes qui intègrent les
SERIS s’avère indispensable pour d’abord pouvoir les intégrer en grand nombre puis
pour pouvoir gérer de manière efficace le réseau. Dans la sous-section suivante, à
partir toujours de la littérature est présenté comment une bonne prévision peut faire
augmenter les bénéfices de la production à base des SERIS.
1.1.2 Prévoir pour augmenter le bénéfice de la production des systèmes à base

des SERIS
Comme il a été dit précédemment, la production aléatoire des systèmes fonction-

nant à base de SERIS exerce des pressions sur les générateurs à combustible fossile,
ce qui augmente leur cycle, réduit leur efficacité à faible régime de fonctionnement
et augmente le coût de production de l’électricité. Les centrales thermiques au char-
bon ont les coûts de cyclage les plus élevés et de nombreuses turbines à combustion
peuvent également avoir des coûts importants. Les turbines hydroélectriques, les mo-
teurs à combustion interne et les turbines à combustion spécialement conçues ont les
coûts de cyclage les plus faibles [42]. Les turbines à combustion sont bien adaptées
à la production de pointe et peuvent être démarrées rapidement.
La prévision des énergies éolienne et solaire permet de réduire l’incertitude de la
production renouvelable variable. L’utilisation de prévisions aide les opérateurs de
réseau à engager ou désengager plus efficacement les générateurs pour s’adapter aux

changements de la production à base de SERIS et réagir aux événements extrêmes

(consommation de charge inhabituellement élevée ou faible). Les prévisions réduisent
également la quantité de réserves d’exploitation nécessaires au système, ce qui réduit
les coûts d’équilibrage du système.
Ainsi, en utilisant les prévisions de production variable, les opérateurs de réseau
peuvent programmer et exploiter efficacement d’autres capacités de production, en
réduisant la consommation de carburant, les coûts d’exploitation et d’entretien, ainsi
que les émissions, par rapport à la situation où l’on laisse simplement la production
variable "se manifester" [43].
Une étude bibliographique a été réalisée dans le cadre d’une activité du COST
(European Cooperation in Science and Technology) [44] sur l’intelligence météorolo-
gique pour les énergies renouvelables ; concernant la prévision du vent, le document
final souligne que "même si la nécessité et les avantages de la prévision de l’énergie éo-
lienne sont généralement acceptés, il n’y a pas beaucoup d’analyses qui ont examiné
en détail les avantages de la prévision pour un service public". Cependant, certains
impacts positifs et importants ont été trouvés dans la littérature. L’incertitude et/ou
l’erreur de prévision est un paramètre important dans les coûts d’intégration [45].
L’absence d’une bonne prévision implique l’utilisation de réserves d’énergie plus im-
portantes qui ne peuvent être utilisées pour d’autres usages [46].
Les erreurs de prévision se situent généralement entre 3 et 6 % de la capacité
nominale pour une prévision d’une heure à l’avance et entre 6 et 8 % pour une
journée à l’avance sur une base régionale (erreurs plus élevées pour une seule centrale
en raison de l’effet d’agrégation). En comparaison, les erreurs de prévision de la
charge se situent généralement entre 1 % et 3 % pour les prévisions à un jour [47].
Les prévisions à court terme sont utilisées pour prendre des décisions d’engagement
d’unités à court terme et ainsi favoriser l’efficacité opérationnelle et les économies de
coûts. Elles sont aussi utilisées pour prendre des décisions concernant un générateur
à démarrage rapide, une réponse à la demande ou une autre option d’atténuation, ce
qui favorise la fiabilité. Lorsque les erreurs de prévision sont réduites, la production
à base des SERIS est prévue avec plus de confiance, alors moins de réserves seront
nécessaires, ce qui réduit les coûts d’intégration [48, 49].
L’importance de bonnes prévisions a été énoncée par le directeur des opérations,
Carl Hilger, d’Eltra [50] : " Si seulement nous améliorions la qualité des prévisions de
vent d’un point de pourcentage, nous aurions un bénéfice de deux millions de Danish
crowns". De même, pour le projet de prévision de Xcel Energy, Parks [51] a fait état
d’une économie de 6 millions de dollars US pour une seule année pour trois régions

différentes, un montant qui dépasse largement leur investissement. Ces deux phrases,
à elles seules, illustrent, en quelques mots, tout l’intérêt de prévoir.
Pour GE Energy [52], l’utilisation des prévisions de production a permis de réduire
les coûts d’exploitation jusqu’à 14%, soit 5 milliards de dollars/an correspondant à
une réduction du coût d’exploitation de 12-20$/MWh de la production à base des
SERIS.
En Écosse, en 2008 [53], une enquête auprès des exploitants de parcs éoliens a
montré que seule la moitié d’entre eux prévoient leur production au jour le jour et
qu’ils perçoivent les bénéfices autour de 4,50£/MWh. La taille minimale pour justifier
les dépenses de prévision était de 100 MW mais pourra descendre rapidement à 10
MW.
Pour une pénétration des SERIS de 35%, l’utilisation d’une prévision de la pro-
duction à un jour près réduit les coûts d’exploitation annuels jusqu’à 5G$ par an, ou
12-17$ par MWh d’énergie renouvelable [47].
L’influence d’une amélioration de la fiabilité des prévisions sur le coût d’intégra-
tion a été étudiée dans de nombreux articles :
• Une amélioration de 1% de l’erreur absolue moyenne (MAE) dans une prévision
de 6 heures à l’avance a eu une influence relativement modeste avec une réduc-
tion de 972k$ sur 6 mois (0,05% du coût total du système) et une diminution
des écrêtements de l’énergie éolienne d’environ 35 GWh [54].
• Une étude similaire, réalisée sur la base du système électrique irlandais avec
une pénétration éolienne de 33% [55], a conclu qu’une amélioration de 8% à 4%
du MAE permettait d’économiser 0,5 à 1,64% des coûts totaux du système et
induisait une réduction des coupures de 9%.
• Une amélioration de 20% de la prévision du vent a doublé les économies par
rapport à une amélioration de 10% [56]. De plus, à de faibles niveaux de pé-
nétration (jusqu’à 15 %), les économies sont modestes et pour des niveaux de
pénétration plus élevés (par exemple, 24 %), les économies ne sont pas linéaires
par rapport à l’amélioration de la prévision, comme cela a également été noté
dans [56].
Pour les systèmes PV, en utilisant les données sur l’énergie solaire du National
Renewable Energy Laboratory (NREL) pour les études d’intégration, une étude si-
milaire a été réalisée en considérant 7 scénarios : (1) Pas d’énergie solaire, (2) pas
de prévision de l’énergie solaire, (3) avec prévision de l’énergie solaire, (4) amélio-
ration de 25%, (5) amélioration de 50%, (6) amélioration de 75% et (7) prévision

parfaite de l’énergie solaire - amélioration de 100%. Les principales conclusions sont

les suivantes :
• avec un taux d’intégration de l’énergie solaire de 25 % dans l’Independent Sys-

tem Operator New England (ISO-NE) et l’utilisation de méthodes de prévision,
les coûts de production nets sont réduits de 22,9 % ; Coûts de production nets
= Coûts du combustible + Coûts variables d’exploitation et de maintenance +
Coûts de démarrage et d’arrêt + Coûts d’importation - Revenus d’exportation ;
• sans prévision, cette réduction n’est que de 12,3 % avec un surengagement de
la production et une réduction plus importante de l’énergie solaire ;
• avec une prévision améliorée de 25 %, les coûts de production nets ne sont
encore réduits que de 1,56 % et aucune économie significative n’est réalisée
pour une amélioration supplémentaire ;
• une meilleure prévision de l’énergie solaire ou une échelle de temps infra-horaire
pourrait encore permettre de réaliser des économies supplémentaires.
Ainsi il peut être retenu qu’une bonne politique de prévision permet aussi de
rentabiliser l’intégration des SERIS.
1.2 Principaux facteurs affectant les prévisions des énergies Eo-

lienne et PV
Différents facteurs affectent la précision des modèles de prévision, faisant de cette

prévision un processus sophistiqué. Elle dépend de facteurs tels que les horizons
de prévision, les entrées du modèle de prévision ainsi que la métrique d’estimation
des performances. Pour obtenir une meilleure précision, l’optimisation de l’analyse
corrélationnelle et l’estimation de l’incertitude des modèles doivent être effectuées de
manière adaptée. Ces principaux facteurs sont détaillés dans cette section.
1.2.1 Horizons de prévision
La période de temps future pour la prévision de la production ou la durée entre le

moment présent et le moment effectif de la prévision est l’horizon de prévision [57–59].
Certains chercheurs préfèrent trois catégories d’horizon de prévision : court terme,
moyen terme et long terme, comme dans [60, 61]. D’autres ont ajouté une "quatrième"
catégorie basée sur les exigences du processus décisionnel pour les réseaux intelligents
ou les micro-réseaux, appelée à juste titre "horizon de prévision à très court terme

ou à ultra-court terme". Cependant, il n’existe pas encore de critère de classification

universellement reconnu [62]. L’horizon de prévision est donc l’intervalle de temps
pour lequel un modèle peut prévoir les valeurs futures. Cette période peut aller de
quelques secondes à des heures, des jours, des semaines, des mois, voire des années
[63].
Dans le cas de la prévision de l’irradiation solaire, différents horizons de prévision
peuvent être trouvés dans la littérature, tels que le très court terme, le court terme,
le moyen terme et le long terme. Dans [64], le très court terme est défini comme un
intervalle inférieur à 5 minutes. Caldas et Alonso-Suárez [65] définissent le très court
terme comme un intervalle de temps compris entre 5 minutes et quelques heures.
Dans [66], il s’agit de quelques minutes à quelques heures, tandis que dans [67], il
s’agit de quelques secondes à 1h. Dans l’horizon à court terme, l’intervalle de temps
pour l’horizon de prévision va de quelques heures à plusieurs heures ou jours. Par
exemple, dans [68], l’horizon à court terme est défini de 1 h à 5 h de prévisions.
D’autres chercheurs comme Voyant et Notton dans [69] et Marzouq et al. dans [70]
considèrent que le court terme va de 1 à 6 h. De plus, l’étude de Voyant et al. dans
[71] considère que le court terme peut être divisé en deux sous-classes : le now-casting
(de 0 à 3 h d’avance) qui présente le domaine temporel très court, et la prévision à
court terme (de 3 à 6 h d’avance). Pour le moyen terme, il existe peu d’études. Dans
[72] et [66] le moyen terme est pour une semaine à l’avance et dans [67] il est plus long
que 48 h à l’avance. Pour Ozoegwu, le long terme est une période de quelques mois
à plusieurs années [73]. Dans [74], il s’agit d’une anticipation allant jusqu’à un an.
Cependant, dans [72] et dans [66], le long terme est une prévision pour des mois ou
des années à venir. L’exigence de l’horizon de prévision change selon les applications.
Une synthèse des articles étudiés de la littérature peut être résumée dans les
Figures 1.3 et 1.4, qui montrent l’utilité de chaque horizon du très court au très
long terme pour une prévision des puissance PV et Eolienne respectivement. Les
prévisions à très court terme sont utilisées dans la planification des réseaux électriques
et des réseaux intelligents avec une période de prévision allant de quelques secondes
à moins de 30 minutes. Ces prévisions sont très utiles pour la commercialisation ou la
tarification de l’électricité, les processus de lissage de la puissance, la surveillance de
la répartition de l’électricité en temps réel et le contrôle des stockages PV et Eolien.
Les prévisions à court terme sont populaires sur le marché de l’électricité, où les
décisions comprennent la répartition économique de la charge et le fonctionnement
du système électrique. Elle est également utile pour le contrôle des systèmes de
gestion de l’énergie intégrés aux énergies renouvelables.

La prévision à moyen terme est essentielle pour la programmation de la mainte-

nance des systèmes électriques intégrés conventionnels ou à énergies renouvelables,
composés de transformateurs haut de gamme et de différents types de machines
électromécaniques.
Figure 1.3 – Horizons de prévision dans la prévision de la puissance PV
Figure 1.4 – Horizons de prévision dans la prévision de l’énergie éolienne

Les prévisions à long terme quant à elles conviennent pour la production, la trans-
mission et la distribution d’électricité à long terme et le rationnement de l’énergie
solaire, ainsi que pour la prise en compte des tendances saisonnières. Cependant,
ces modèles ont une précision réduite car les fluctuations météorologiques d’un ou
de quelques jours ne peuvent pas être prévues en utilisant des horizons aussi longs.
Les différents horizons temporels ajoutent de la complexité ; ainsi, une alternative
consiste à utiliser des méthodes de prévision à court terme à des horizons étendus,
c’est-à-dire des prévisions à long et moyen terme. Cependant, cela peut gravement
dégrader la précision de la prévision. Pourtant, les chercheurs [75, 76] ont développé
des modèles à moyen terme et à l’horizon d’un an pour la programmation mensuelle
du système électrique, la tarification de l’électricité et la prévision de la charge. Les
problèmes de prévision évoqués ci-dessus ont incité de nombreux chercheurs à déve-
lopper une approche de classification des horizons de prévision spécifiquement pour
les Systèmes de Production à base de Sources d’Energies Renouvelables Intermit-
tentes et Stochastiques : intra-heure, intra-journalier et jour à venir. Ces catégories
recoupent souvent les catégories à court, moyen et long terme décrites précédemment.
Dépendance de la précision du modèle de prévision par rapport à l’horizon tem-

porel
De nombreuses études ont porté sur les horizons de prévision, et l’on observe que
si le modèle de prévision et les autres paramètres restent constants, la précision de
la prévision varie avec la modification de l’horizon temporel [77]. Lonij et al. [78]
ont développé un modèle de prévision de la puissance PV avec un horizon temporel
de 15-90 minutes et ont conclu que la précision du modèle variait avec la longueur
de l’horizon, en gardant tous les autres facteurs constants. D’autres ont évalué des
modèles de prévision hybrides multi-échelles disparates pour l’irradiance solaire avec
différents horizons de prévision. Des horizons allant de 5 à 30 min par incréments de
5 min et de 1 à 6 h par incréments horaires ont été étudiés. Il a été constaté que,
quel que soit le type de modèle, les erreurs augmentent avec la durée de l’horizon
de prévision. En outre, il a été déduit que des échelles de temps plus courtes des
données d’apprentissage par rapport à celles des données de test n’ont pas augmenté
la précision de la prévision.
L’interaction de nombreux facteurs interdépendants affecte également la précision
des modèles de prévision. Par exemple, le mouvement des nuages affecte gravement
l’irradiation solaire et donc la prévision de la puissance PV, en particulier à l’échelle

de la minute ou à des horizons à très court terme (intra-horaire). La classification

et la prévision du mouvement des nuages sont donc cruciales. Les travaux antérieurs
[79–82] ne tenaient pas compte du mouvement des nuages, ce qui réduisait la précision
dans des conditions nuageuses et ne répondait pas aux exigences de répartition du
réseau en temps réel. Par conséquent, les prévisions à très court terme ne sont efficaces
qu’en combinaison avec des techniques de classification météorologique.
1.2.2 Indicateurs de performance de l’évaluation de la précision
La précision de l’estimation et de la prévision étant un facteur critique dans la

sélection de tout modèle de prévision, de nombreux indicateurs bien connus ont été
utilisés dans la littérature. L’estimation des performances est essentielle pour évaluer
la précision de la prévision d’un modèle. Les outils courants comprennent : l’er-
reur absolue moyenne ("Mean Absolute Error" - MAE), l’erreur absolue moyenne en
pourcentage ("Mean Absolute Percentage Error" - MAPE) et l’erreur quadratique
moyenne ("Root Mean Square Error" - RMSE) [83, 84] (voir Tableau 1.2). Le MAE
estime l’importance moyenne des erreurs dans un ensemble de données de prévisions
en faisant la moyenne des différences entre les observations réelles et les résultats
prévus de l’ensemble de l’échantillon testé, en donnant à toutes les divergences in-
dividuelles le même poids. De même, la RMSE estime la valeur moyenne de l’erreur
en utilisant la racine carrée de la moyenne des différences au carré entre les valeurs
prévues et les observations réelles. Par conséquent, elle est plus robuste pour traiter
les écarts importants qui sont particulièrement indésirables, donnant au chercheur
la possibilité d’identifier et d’éliminer les valeurs aberrantes. De même, la RMSE
normalisée (nRMSE) est utilisée dans les grands ensembles de données pour éva-
luer les déviations globales. Les deux métriques moyennes (MAE et RMSE) peuvent
toutefois varier de zéro à l’infini [85, 86]. En revanche, la MAPE est une métrique
standard qui mesure la précision de la prévision et justifie la diversité de la prévision
pour les ensembles de données réels.

Tableau 1.2 – Abréviations couramment utilisées pour les évaluations des perfor-
mances prévisionnelles
Abréviation Métrique Description

MAE Mean Absolute Error Évalue les erreurs de prévision uniformes des
modèles
RMSE Root Mean Square Error Mesure la précision globale des modèles
de prévision. Cependant, l’ordre carré aug-
mente le taux d’erreur de prévision.
nRMSE Normalized Root Mean Mesure la précision globale dans un grand
Square Error ensemble de données. Cependant, l’ordre
carré augmente le taux d’erreur de prévi-
sion.
MAPE Mean Absolute Percentage Évalue les erreurs de prévision uniformes en
Error pourcentage pour les modèles de prévision.
nMAPE Normalized Mean Absolute Évalue les erreurs de prévision uniformes en
Percentage Error pourcentage pour les grands ensembles de
données
nMAP Identique au nMAPE
rMAPE Identique au nMAPE
NRMSE Identique au nRMSE
2
R Coefficient of determination Indique la variance de la prévision par rap-
port aux données mesurées.
De même, pour les grands ensembles de données, la MAPE normalisée (nMAPE)

est utilisée pour évaluer les prévisions. Les équations de ces métriques sont les sui-
vantes [87] :
1 N
M AE = (1.1)
X
|yi − ti |
N i=1
s
1 N
2
RM SE = (yi − ti ) (1.2)
X
N i=1
»P
2
i=1 (yi − ti )
N
nRM SE = »P (1.3)
N 2
i=1 yi
1 N
|yi − ti |
Å ã
M AP E = × 100% (1.4)
X
N i=1 yi
1
Ç å
N
|yi − ti |
nM AP E = × 100% (1.5)
X
N 1 PN
i=1 N i=1 yi

2
i=1 (yi − ti )
PN
R =1−
2
PN 2 (1.6)
1 PN
i=1 y i − N i=1 yi
où yi et ti sont les valeurs mesurées et prévues correspondantes de la puissance PV

ou Eolienne et N est le nombre d’échantillons d’essai [87].
Indépendamment de la mesure de performance utilisée, l’objectif du chercheur
doit être l’évaluation objective d’un modèle de prévision particulier afin que les pra-
ticiens puissent prendre la meilleure décision en termes de conception, d’installation
et d’utilisation de l’énergie photovoltaïque/Eolienne pour les applications de réseau.
1.2.3 Entrées des modèles de prévision
Les entrées des modèles de prévision ont une influence directe sur la précision
des prévisions ; c’est un facteur clé pour déterminer la performance du modèle. En
général, une sélection imprudente des entrées peut entraîner des erreurs de prévision
qui augmentent les délais, les coûts et la complexité de calcul. Ainsi, un faible taux
de précision pourrait apparaître sur des modèles de prévision à haute fonctionnalité
[88].
Dans la prévision directe de la production d’énergie éolienne et solaire, on utilise
les données historiques de production d’énergie recueillies dans un parc éolien ou
solaire spécifique. Près de la moitié des études incluses dans la littérature parcourue
concerne la prévision directe de la puissance. Il est à noter que dans presque 60%
de ces études, en plus des données historiques de puissance, des données météorolo-
giques, telles que la température, l’humidité, les précipitations, la pression atmosphé-
rique et la direction du vent, sont utilisées pour améliorer la précision du modèle.
D’autre part, lorsque les parcs éoliens ou solaires sont nouveaux et que les données
historiques de puissance ne sont pas disponibles, ou dans le cas où les chercheurs
veulent préparer une étude de faisabilité pour un emplacement potentiel de parc
éolien ou solaire, ils prévoient la production d’énergie indirectement en prédisant la
vitesse du vent ou le rayonnement solaire. La puissance est ensuite calculée selon des
formules spécifiques. Cette méthode indirecte est plus flexible. Par exemple, puisque
l’électricité produite dépend des spécifications de l’éolienne, telles que la hauteur du
moyeu et l’angle d’inclinaison de la pale, la prévision de la vitesse du vent peut être
ajustée en conséquence. Il est noté dans [89] que la vitesse du vent est plus facile
à prévoir que la puissance éolienne car cette dernière dépend des caractéristiques
spécifiques de l’éolienne. De plus, avec les méthodes indirectes, d’autres données mé-

téorologiques en plus de la vitesse du vent et de l’irradiation solaire peuvent être

utilisées comme entrées pour améliorer encore les modèles de prévision. L’utilisation
de variables météorologiques est particulièrement utile lorsque les données sont ir-
régulières car elle permet d’atténuer l’effet de l’irrégularité sur les performances de
prévision du modèle. Par exemple, dans [90], Zhang et al. ont utilisé uniquement les
données historiques de la puissance PV comme entrée pour prévoir la composante
régulière, tandis que pour la composante irrégulière, les données historiques de la
puissance PV en plus de l’intensité du rayonnement solaire et de la température de
l’air sont introduites pour générer la prévision. Une étude sur les paramètres d’entrée
pertinents pour la prévision de la puissance PV a été proposée aussi par Agbokpanzo
et al. dans [91].
Selon [92], les variables fortement corrélées positivement avec la puissance PV sont
l’irradiation solaire, la température de l’air et le point de rosée, tandis que l’humidité
relative et le type de nuage ont une corrélation plutôt négative. D’autre part, l’angle
d’inclinaison des pales affecte la prévision de la puissance éolienne plus que la vitesse
du vent et le cisaillement du vent, selon les résultats de [93]. Il a également été noté
que la température ambiante, l’orientation de la nacelle et l’erreur de lacet ont un
faible impact sur la prévision de la puissance éolienne et peuvent être supprimées des
entrées. Dans [66], les quatre caractéristiques les plus importantes pour la prévision
de l’irradiation Globale Horizontale selon les valeurs de corrélation de Pearson sont
la température, l’indice de ciel clair, l’humidité relative et l’heure du jour, tandis que
la pression, la vitesse et la direction du vent sont moins importantes. Cependant, la
corrélation entre la production d’électricité et les données météorologiques dépend de
l’emplacement des données et de son climat. Par conséquent, les chercheurs devraient
inclure une méthode de sélection des caractéristiques pour valider l’importance des
variables en tant qu’étape de prétraitement avant de former leurs modèles. Cela
permet également de déterminer combien de valeurs précédentes (pas de temps) de
chaque caractéristique doivent être incluses en entrée.
1.3 Classification des techniques de prévision
Plusieurs approches de modélisation : physique, statistique, intelligence artifi-

cielle (y compris l’apprentissage profond ("Deep Learning",DL), ensemble et modèles
de prévision hybrides ont été utilisées pour les prévisions des productions PV et
Eolienne dans la littérature. Certains chercheurs ont comparé différents modèles de
prévision. Almonacid, et al. [94] ont comparé un modèle de Réseaux de Neurones

Artificiels (Artificial Neural Network (ANN)) pour la prévision de la production PV

à trois méthodes de caractérisation des modules PV. La précision des prévisions du
modèle ANN était bien supérieure. De même, d’autres chercheurs [95, 96], ont com-
paré les techniques de prévision entre le modèle ANN et un modèle de régression
pour une centrale PV en Algérie. Là encore, le modèle ANN s’est révélé plus pré-
cis. D’autres encore [97] ont comparé plusieurs approches de prévision différentes
en tenant compte des techniques, des horizons spatio-temporels, de l’évaluation des
métriques employées, des paramètres d’entrée et de sortie modélisés, du temps de
calcul, des modèles de référence mentionnés, des avantages et des inconvénients, etc.
De ces comparaisons exhaustives, il ressort clairement que la précision de la prévision
de la production dépend du type de modélisation utilisé, et par conséquent, certains
des modèles importants sont discutés dans cette section.
1.3.1 La méthode de la persistance
Le modèle de persistance est populaire pour les prévisions à très court terme et
à court terme. Il présente un coût de calcul réduit, un faible délai et une précision
raisonnable. Cette technique adopte le concept "today equals tomorrow", en d’autres
termes, les conditions climatiques (c’est-à-dire l’irradiation solaire, la vitesse du vent)
d’un jour à venir devraient rester similaires à celles du jour précédent [98]. L’équation
du modèle de prévision utilisant cette approche est décrite comme suit [98] :
1 n−1
P (t + k|t) = P (t − i∆t) (1.7)
X
T i=0
où k est la période de prévision et P (t + k|t) est la puissance prévue pour le temps

t + k à l’instant t. La période d’intervalle de prévision est T et n est le nombre de
mesures historiques. P (t − i∆t) est la puissance réelle mesurée pour l’instant t et les
pas de temps i dans T et ∆t est la différence de temps de pas de la série temporelle
mesurée.
Dans cette méthode, qui est normalement utilisée comme référence, la puissance
PV ou éolienne dans le futur sera donc considérée comme égale à la puissance mesu-
rée à l’instant présent. Cette approche a été couramment utilisée pour être comparée
à de nouvelles méthodes de prévision à court terme [99–101]. Ce modèle avalise gé-
néralement les performances des autres paradigmes de prévision. Par conséquent,
différents modèles sont comparés à lui lorsque les conditions climatiques restent per-
sistantes jusqu’au lendemain ; cependant, avec l’augmentation de l’horizon temporel,

la précision de ce modèle diminue radicalement [102]. En plus d’être simple et écono-

mique, le principal avantage de cette méthode est qu’elle ne nécessite ni évaluation
de paramètres ni variables externes.
1.3.2 Les méthodes physiques
La prévision physique fait intervenir : la pression atmosphérique, la rugosité de

surface, la température, l’orographie, les obstacles, les perturbations et les obstruc-
tions, de la basse atmosphère pour les prévisions futures [103, 104]. Cette technique
est généralement plus fiable pour les prévisions à long terme [105]. Sur la base de
cette méthode, la technique de Prévision Numérique du Temps (PNT) fusionne les
informations météorologiques et les équations du modèle atmosphérique pour obtenir
des prévisions. Ce modèle est généralement classé en deux catégories en fonction de
son échelle, à savoir le modèle à méso-échelle et le modèle global. Le modèle à méso-
échelle traite des caractéristiques de l’atmosphère pour une zone restreinte telle que
les régions, les pays ou les continents [106], tandis que le modèle global délimite les
caractéristiques de l’atmosphère à l’échelle mondiale. En outre, pour ce modèle global
de prévision numérique du temps, il existe environ 15 services météorologiques ac-
tifs dans l’acquisition de données : Global Forecast System (GFS), Climate Forecast
System (CFS) et Global Data Assimilation System (GDAS), etc., qui sont gérés par
des organisations gouvernementales telles que l’Administration nationale Américaine
des affaires océaniques et atmosphériques ("National Oceanic and Atmospheric Ad-
ministration" - NOAA) et le Centre européen pour les prévisions météorologiques à
moyen terme ("European Centre for Medium-Range Weather Forecasts" - ECMWF).
Les modèles PNT peuvent prévoir l’état du climat plus de 15 jours à l’avance [107] et
utilisent un ensemble d’équations numériques pour l’état physique et les caractéris-
tiques dynamiques de l’atmosphère, simultanément. Mathématiquement, le modèle
PNT peut être représenté comme suit :
∆A
= F (A) (1.8)
∆t
où, ∆A est le changement de la valeur de la réponse prévue à un emplacement
spatial particulier ; ∆t est le changement de temps ou d’horizon temporel ; et F (A)
représente les variables qui changent la valeur de A.
Cependant, pour la prévision de la puissance de sortie du générateur PV, le modèle
utilise des caractéristiques météorologiques particulières telles que le GHI (Global
Horizontal Irradiance), l’humidité relative, la vitesse et la direction du vent. Ainsi,

la qualité de la prévision est donc meilleure si les variables météorologiques restent

stables [108]. En revanche, des prévisions erronées se produisent lorsqu’il existe des
changements brusques dans les valeurs des variables météorologiques.
Ces méthodes physiques utilisent une caractérisation physique détaillée pour mo-
déliser les turbines/éoliennes. Cet effort de modélisation a souvent été réalisé en
réduisant l’échelle des données de prévision numérique du temps, ce qui nécessite
une description de la zone, telle que la rugosité et les obstacles, ainsi que des données
de prévision météorologique de température, de pression, etc. Ces variables sont uti-
lisées dans des modèles mathématiques complexes qui prennent beaucoup de temps
pour déterminer la vitesse du vent. Ensuite, la vitesse du vent prévue est associée
à la courbe de puissance de l’éolienne correspondante (normalement fournie par le
fabricant de l’éolienne) pour prévoir la puissance du vent. Un entraînement n’est
pas nécessaire pour cette méthode, mais elle dépend de données physiques [100]. Au
cours des dernières décennies, de nombreuses méthodes physiques ont été proposées.
Par exemple, Focken et al. [109] ont créé une approche physique de la prévision de la
puissance éolienne pour des échelles de temps allant jusqu’à 48 heures. La méthode
était fondée sur une approche physique qui recevait des données d’entrée d’un modèle
de prévision météorologique. La couche limite a d’abord été formée en tenant compte
de la rugosité, du terrain et de l’effet de sillage. En outre, les changements quotidiens
de la stratification thermique de l’atmosphère ont été pris en compte pour estimer
la vitesse du vent à la hauteur du moyeu [109]. De Felice et al. [110] ont utilisé un
modèle physique pour prévoir la demande d’électricité en Italie en considérant 14
mois de température horaire comme données d’entrée. Les résultats de la comparai-
son de leur méthode proposée avec l’approche naïve par l’erreur moyenne absolue
ont montré que les modèles PNT peuvent améliorer les performances de prévision,
en particulier pour les régions les plus chaudes. Bien que cette méthode soit peut-
être le meilleur choix pour la prévision de l’énergie éolienne à moyen et long terme,
elle est complexe sur le plan informatique et nécessite donc des ressources de calcul
considérables [111].
1.3.3 Les méthodes statistiques
Les modèles statistiques sont plus appropriés pour les prévisions à court terme.
Ces méthodes utilisent des données historiques pour prévoir l’irradiance solaire et la
vitesse du vent. La précision de la prévision de ces modèles est inférieure à celle d’un
modèle physique, mais les besoins en calcul sont moindres. Un très haut niveau de

précision n’est pas exigé dans l’application de planification de la production. C’est

pourquoi les modèles statistiques ont été adoptés, où des modèles de séries chrono-
logiques sont développés à partir des données passées et où la prévision du futur
est effectuée. Une série chronologique de données représente une série de mesures
périodiques d’une variable. Les mesures peuvent être horaires, quotidiennes, hebdo-
madaires, mensuelles, annuelles ou correspondre à tout autre intervalle périodique.
L’information principale requise pour analyser le comportement passé des données
de séries temporelles est le modèle de données. Le modèle passé peut être facile-
ment projeté pour prévoir l’avenir à l’aide d’un modèle de prévision approprié si les
données sont censées se comporter de manière similaire. Les deux principales classi-
fications des modèles de séries chronologiques sont les modèles paramétriques et non
paramétriques. Dans le modèle paramétrique, on suppose que la série de données
stationnaire de base est structurée et peut être caractérisée à l’aide d’un nombre
minimum de paramètres. Dans un modèle non paramétrique, la structure du modèle
ne peut pas être décidée à priori et dépend entièrement de la quantité de données
[112]. Les différents types de modèles statistiques sont présentés ci-après.
1.3.3.1 Modèles de régression
Dans l’analyse de régression, une ligne de tendance est ajustée aux points de
données statistiques, et la ligne est projetée dans le futur. Des équations de tendance
linéaires ou non linéaires peuvent être développées. En évaluant et en analysant
un modèle de tendance, on peut déterminer un modèle historique qui peut ensuite
être projeté dans le futur. Le modèle de régression permet également de séparer le
modèle de tendance de la série de données. Cette méthode est normalement utilisée
avec les techniques de décomposition. Dans les modèles de régression, la relation
mathématique entre deux variables ou plus est évaluée à partir d’un tracé des données
historiques [113]. L’équation du modèle de régression linéaire multivariée est donnée
par l’équation 1.9. Pour la régression à variation unique, seuls les coefficients β0 et
β1 existent. Tous les autres coefficients βn sont nuls.
yi = β0 + β1 xi1 + β2 xi2 + ... + βn xip (1.9)
Il existe un nombre n d’observations de la variable dépendante et un nombre p

d’observations de la variable indépendante. L’équation du modèle de régression non

linéaire multivariée est donnée par l’équation 1.10.
y = b × mx1 x2
1 × m2 (1.10)
Dans l’équation, la variable dépendante est y et les variables indépendantes sont x1,
x2, etc.
1.3.3.2 Techniques de prévision basées sur les séries temporelles
Les séries temporelles fournissent des informations statistiques permettant de pré-

voir la nature de l’élément quantifié. Ces observations sont généralement enregistrées
dans le temps à des points successifs à intervalles réguliers tels que trimestriels,
mensuels, hebdomadaires, quotidiens ou même horaires et minutes et exprimés en
fonction de la réponse de la variable dans le temps [114]. La motivation de l’ana-
lyse des séries temporelles est de prévoir la valeur à venir en évaluant le modèle
des informations passées. Par exemple, Cornaro et al. [115] ont utilisé des méthodes
statistiques pour établir les corrélations entre les données météorologiques passées
et l’irradiation solaire horaire. Les techniques établies sont : le lissage exponentiel,
la moyenne mobile autorégressive ("AutoRegressive–Moving-Average" - ARMA) et
la moyenne mobile intégrée autorégressive ("AutoRegressive Integrated Moving Ave-
rage" - ARIMA).
Ces modèles, qui ont été proposés par Box-Jenkins, appliquent des données his-
toriques pour générer un modèle mathématique, en estimant les paramètres et en
vérifiant la caractéristique de la simulation. La forme générale du modèle peut être
décrite comme suit :
p q
Xt = φi Xt−i + αt − (1.11)
X X
θj αt−j
i=1 j=1
où φi représente le paramètre autorégressif, θj est le paramètre de moyenne mobile,

αt est le bruit blanc, p est l’ordre du modèle autorégressif, q est l’ordre du modèle
de moyenne mobile et le Xt sera la puissance prévue au temps t.
L’équation entière représente le modèle ARMA, mais si p est supposé être zéro,
il représentera le modèle de moyenne mobile (MA). Dans le même temps, lorsque
q est supposé être égal à zéro, il représentera le modèle autorégressif (AR) [100].
Les méthodes statistiques basées sur cette approche sont faciles à formuler et très
applicables dans la prévision à court terme des énergies PV et éolienne [116]. Elles
ne nécessitent qu’un faible temps de calcul. Cependant, elles peuvent ne pas fournir

des performances de prévision adéquates, en particulier lorsque les séries temporelles

sont non stationnaires [117].
Firat et al. [118] ont proposé un modèle statistique basé sur l’analyse en compo-
santes indépendantes et le modèle AR pour la prévision de la vitesse du vent. En
utilisant la vitesse horaire du vent sur six ans dans un parc éolien aux Pays-Bas,
les auteurs ont affirmé que le modèle proposé pouvait donner une plus grande pré-
cision que les méthodes de prévision directe pour une période de 2 à 14 heures. De
Felice et al. [110] ont utilisé les données NWP et les modèles ARIMA pour prévoir
la demande en électricité en Italie. Les températures des 14 mois des années 2003 à
2009 ont été utilisées comme principales valeurs d’entrée. Une comparaison des MAE
a montré que le modèle proposé était plus performant que les méthodes de persis-
tance, en particulier dans les endroits les plus chauds. Duran et al. [119] ont conçu
un modèle AR avec variable exogène (ARX). En utilisant la vitesse du vent comme
variable exogène, ils ont comparé l’erreur moyenne de leur modèle avec les modèles
AR traditionnels et de persistance et ont montré une amélioration significative de la
précision.
1.3.3.2.1 Lissage exponentiel

La méthode de lissage exponentiel ou moyenne mobile pondérée exponentielle-
ment ("Exponentially Weighted Moving Average" - EWMA) est une technique unique
qui adopte la fonction de fenêtre exponentielle pour l’analyse statistique de données
historiques de séries temporelles afin de faire des prévisions. En général, elle alloue
un ensemble de poids inégaux par rapport aux poids nominaux aux observations
historiques, réduisant ainsi exponentiellement les données des points de données les
plus récents aux plus éloignés. Cependant, elle peut facilement apprendre et se pro-
noncer à partir d’hypothèses. La technique a été formulée pour la première fois par
Brown [120] et a connu depuis de nombreuses applications. Au fil du temps, elle a
été étendue par Holt en 1957 et par Winter en 1960. Elle est donc appelée méthode
de Holt-Winter [121]. L’équation gouvernante est la suivante :
Ä ä
“t+1 = αYt + (1 − α) Y
Y “t = Y
“t + α Yt − Y
“t (1.12)
où, l’observation courante est Yt , la valeur prévue est Y

“t et la constante de lissage est
α, qui varie entre 0 et 1. Par conséquent, l’équation de prévision produit la valeur
prévue à t + 1 qui est égale à la somme de la dernière valeur prévue Y “t et du facteur
Ä ä
d’ajustement prévu α Yt − Y “t .

1.3.3.2.2 Le modèle de moyenne mobile autorégressive (ARMA)

ARMA est une analyse statistique de séries temporelles fréquemment utilisée dans
la prévision. Le modèle a été évalué par de nombreux chercheurs dans différentes
applications de prévision (prévisions solaires et éoliennes) et il a toujours donné
de bons résultats en matière de précision des prévisions. Le modèle incorpore deux
polynômes : AR et MA pour prévoir la production PV à partir de données historiques.
L’expression mathématique est la suivante :
p q
X(t) = αi X(t − i) + (1.13)
X X
βj e(t − j)
i=1 j=1
où :
• X(t) est la sortie prévue qui est une combinaison de fonctions AR et MA ;
• p et q indiquent le nombre de processus ou l’ordre ;
• αi et βj sont les coefficients des modèles AR et MA respectivement ;
• e(t) est un bruit blanc généré aléatoirement qui n’est pas corrélé avec les pré-
visions d’un modèle.
Les modèles ARMA sont très flexibles et peuvent représenter plusieurs séries tempo-
relles différentes en utilisant différents ordres. De plus, ce modèle peut reconnaître
lorsqu’il existe une structure d’auto-corrélation linéaire sous-jacente. Mora-Lopez et
Sidrach-de-Cardona [122] ont adopté dans leurs recherches des modèles ARMA pour
étudier les caractéristiques stationnaires et séquentielles de la série temporelle d’ir-
radiation globale et prévoir son modèle. De même, Hansen [123] a constaté que le
modèle ARMA convenait à l’analyse des données stationnaires. Cependant, cette
approche nécessite des données de séries temporelles statiques, ce qui constitue un
inconvénient majeur.
1.3.3.2.3 Autoregressive integrated moving average (ARIMA)

ARIMA est également connu sous le nom de modèle de Box-Jenkins et a été dé-
veloppé par George Box et Gwilym Jenkins en 1976 [124]. Le modèle ARIMA est une
version étendue du modèle ARMA est une technique d’analyse des séries temporelles
populaire car elle permet d’obtenir un niveau standard de précision des prévisions à

court terme. En outre, ce modèle a la capacité d’écrêter les valeurs non stationnaires
des données analysées. Sa structure consiste en une autorégression (AR), une inté-
gration (I) et une moyenne mobile (MA) pour évaluer et prévoir les caractéristiques
des séries temporelles [125]. Hansen [122] a intégré la méthode ARIMA pour prévoir
l’irradiation globale et pour résumer la procédure de couplage entre les modèles AR
et MA ainsi que la façon dont elle traite les séries non stationnaires. Reikard [126]
a utilisé la méthode ARIMA pour prévoir le rayonnement solaire et a comparé les
résultats prévus avec ceux d’un modèle basé sur les réseaux de neurones artificiels
(RNA). Le résultat a indiqué que le modèle ARIMA à 24 heures de temps estimait
avec plus de précision que les autres modèles étudiés. De même, Cadenas, et al.
[127] ont trouvé que le modèle ARIMA avait un taux de précision très proche de
celui des modèles basés sur les RNA. Dans une autre approche, une technique d’en-
semble a été utilisée pour combiner des modèles statistiques avec d’autres modèles
pour générer un hybride et ainsi exploiter les forces de tous les modèles membres.
Ces modèles composés ont généralement de meilleures performances par rapport aux
modèles RNA ou statistiques conventionnels.
1.3.4 Techniques intelligentes
Les techniques intelligentes de prévision sont appropriées lorsque les données des
séries temporelles sont non stationnaires et erratiques. L’avantage de ces méthodes est
leur complexité de calcul réduite par rapport aux modèles statistiques. Ces méthodes
peuvent être classées en deux catégories :
• celles basées sur les réseaux neuronaux ("Neural Networks" - NN),
• celles basées sur des algorithmes évolutionnaires comme l’algorithme génétique
("Genetic Algorithm", GA).
Dans la littérature des algorithmes évolutionnaires comme les arbres de décision, le
random forest ou encore le XGBoost (eXtreme Gradient Boosting) ont été récement
utilisé comme dans [128, 129] pour la prévision de la puissance PV. Les différentes
méthodes basées sur les réseaux neuronaux résolvent le problème en imitant le cer-
veau humain. Le réseau conçu est entraîné avec les données historiques. Le réseau
formé est ensuite validé et testé avec les données connues. Dans les algorithmes évo-
lutionnaires, le problème est résolu en imitant le processus d’évolution biologique.
Certains modèles hybrides combinent les avantages de deux ou plusieurs modèles.
Comme mentionné plus haut, les méthodes physiques ou les modèles de prévision
numérique du temps ("Numerical Weather Prediction" - NWP) sont des modèles ma-
thématiques qui simulent la dynamique de l’atmosphère selon des principes physiques

et mécaniques et comme elles dépendent de la simulation informatique, elles néces-

sitent des ressources informatiques importantes et sont donc utilisés pour des prévi-
sions à long terme. D’autre part, les modèles statistiques sont utilisés pour découvrir
la relation mathématique entre les entrées et les sorties en supposant des relations
linéaires. Ils sont largement utilisés dans la littérature, mais leurs performances n’ont
pas répondu aux attentes car ils ne sont pas adaptés à la découverte de relations non
linéaires [130]. Le modèle NARX a été utilisé par exemple par Agbokpanzo et al.
dans [131] pour prévoir la puissance PV. Les méthodes d’intelligence artificielle, y
compris les algorithmes d’apprentissage automatique ("Machine Learning", ML) et
récemment les modèles d’apprentissage profond ("Deep Learning", DL), ont attiré
l’attention des chercheurs en raison de leur capacité à découvrir des relations non
linéaires et de leurs performances supérieures. L’apprentissage profond a un avenir
prometteur en raison de sa capacité de généralisation et de son apprentissage non
supervisé des caractéristiques. Il a déjà connu un succès considérable dans de nom-
breuses applications, telles que la reconnaissance d’images, les tâches de classification
et le traitement du langage naturel. La prévision de l’énergie solaire et éolienne n’est
pas une exception : le nombre de publications faisant état de méthodes basées sur
l’apprentissage profond a rapidement augmenté au cours des dernières années. Dans
les sections suivantes, sont détaillées donc plus en profondeur, les applications faites
des méthodes de l’apprentissage profond pour les prévisions des puissances PV et
éolienne.
1.4 Méthodes de prévision des énergies éolienne et solaire basées

sur l’apprentissage profond
Le nombre de publications faisant état de méthodes basées sur l’apprentissage

profond a rapidement augmenté au cours des dernières années. C’est ce que montre
la figure 1.5, qui indique le nombre d’articles sur la recherche en matière d’énergie
solaire et éolienne basée sur l’apprentissage profond trouvés dans la base de données
SCOPUS pour la période 2014-2023 (les dix dernières années). La figure montre que
la plupart des articles dans SCOPUS sont publiés au cours des trois dernières années,
5898 articles sur un total de 9891 ayant été publiés de Janvier 2014 à février 2023.
Cette croissance exponentielle montre l’importance des prévisions et l’intérêt qui
leur est porté actuellement dans la communauté scientifique. Dans cette section, sont
présentés les techniques et modèles basés sur l’apprentissage profond rencontrés dans
la littérature.

Figure 1.5 – Nombre de publications sur la prévision de l’énergie solaire et éolienne

à l’aide de l’apprentissage profond (SCOPUS : 2014-2023).
1.4.1 Taxonomie des prévisions d’énergie éolienne et solaire utilisant l’apprentis-

sage profond
Il est proposé dans cette section une classification des méthodes de prévision
de l’énergie éolienne et solaire utilisant l’apprentissage profond (voir Figure 1.6).
Cette taxonomie couvre l’horizon de prévision, l’approche, les données utilisées, les
méthodes de prétraitement, les méthodes d’apprentissage profond, les méthodes hy-
brides, les méthodes d’optimisation et les méthodes d’évaluation. L’horizon de pré-
vision, comme déjà mentionné en début de ce chapitre comprend quatre catégories :
ultra-court terme, court terme, moyen terme et long terme. L’approche de prévision
pourrait être déterministe ou probabiliste ciblant le prochain pas de temps ou plu-
sieurs pas de temps. Les données utilisées pour la prévision peuvent être spatiales,
des séries chronologiques ou des images du ciel.

Figure 1.6 – Taxonomie de la prévision de l’énergie solaire et éolienne basée sur l’apprentissage profond [132]
Il peut s’agir des valeurs historiques de la vitesse ou de la puissance du vent

pour la prévision de l’énergie éolienne et de la puissance solaire ou de l’irradiation
solaire pour la prévision de l’énergie solaire. Ces données peuvent être utilisées avec
ou sans autres données météorologiques. Les méthodes de prétraitement des données
comprennent la normalisation des données, l’imputation des données, le traitement
des valeurs aberrantes, le changement de résolution des données, la transformation
des données, l’augmentation des données, l’analyse de corrélation, le regroupement
des données, la modélisation des données sous forme de graphique ou de grille, la
décomposition des données et la sélection des caractéristiques.
Les modèles d’apprentissage profond fréquemment utilisés sont les réseaux neu-
ronaux convolutifs ("Convolutional Neural Network", CNN), les réseaux neuronaux
récurrents ("Recurrent Neural Network", RNN), les auto-encodeurs épars ("Sparse
Autoencoder", SAE), les réseaux de croyance profonds ("Deep Belief Network", DBN)
et d’autres modèles profonds. Ces méthodes d’apprentissage profond peuvent être
combinées avec des méthodes de décomposition des données, des méthodes d’ex-
traction de caractéristiques ou des méthodes de correction des données dans des
modèles hybrides. Des techniques d’optimisation peuvent être utilisées pour les hy-
perparamètres ou le réglage des paramètres, pour éviter le surajustement ou pour
accélérer la vitesse d’apprentissage. Les méthodes d’évaluation du modèle de prévi-
sion comprennent l’utilisation de mesures d’évaluation, l’étalonnage des modèles, la
comparaison des temps de calcul, les tests statistiques, la comparaison des types de
temps, la comparaison des pas de temps d’entrée et de la résolution des données, la
fusion des données et la comparaison des méthodes de décomposition. La figure 1.6
illustre cette taxonomie.
1.4.2 Méthodes de prévision déterministes
Les modèles de prévision déterministes développés pour les énergies solaire et

éolienne sont diverses selon les architectures utilisées. Certaines les plus utilisées
sont discutées dans les sous-sections suivantes.
1.4.2.1 Modèles basés sur les réseaux neuronaux convolutifs
Les modèles de prévision basés sur les CNN dépendent des couches convolution-
nelles pour extraire les caractéristiques des données, tandis que la tâche de régression
est effectuée dans la dernière couche entièrement connectée. Le tableau 1.3 résume
les informations importantes d’études qui proposent des modèles de prévision basés

sur les CNN, notamment les objectifs de prévision, les horizons de prévision, les mé-
thodes de prétraitement, les méthodes d’optimisation, les ensembles de données et
les méthodes d’évaluation et de comparaison. Le CNN est la première option lorsque
les données d’entrée comprennent des images, comme dans [133] où les images du
ciel ont été utilisées pour capturer les informations utiles sur la couverture nuageuse,
ce qui aide les modèles de prévision à atteindre une plus grande précision. Sun et al.
ont mené de nombreuses expériences pour étudier la sensibilité de plusieurs struc-
tures CNN et la résolution des images d’entrée sur la prévision de la sortie PV.
Les modèles développés offrent une grande précision dans des conditions ensoleillées
et une précision moindre dans des conditions partiellement nuageuses et couvertes.
Comme mentionné précédemment, le CNN est généralement utilisé lorsque les don-
nées peuvent être représentées en deux ou trois dimensions, comme dans le cas des
images et des vidéos, mais il est possible de l’utiliser avec des entrées unidimension-
nelles comme dans [134]. Huang et Kuo ont proposé un modèle basé sur un CNN
unidimensionnel pour la prévision de la puissance photovoltaïque à 24 heures. Ils
ont remodelé les données en dimension (90,3) pour représenter les trois variables :
température, rayonnement solaire et puissance de sortie du système PV en 90 enregis-
trements. Ils ont évalué leur modèle par rapport à d’autres modèles d’apprentissage
automatique, notamment la mémoire à long terme (LSTM), et ont constaté que leur
modèle est plus précis en moyenne et que son temps d’apprentissage est plus rapide
que celui du LSTM.
Certains chercheurs prévoient la production d’énergie éolienne dans une zone spé-
cifique en développant des modèles de prévision qui utilisent les caractéristiques spa-
tiales et temporelles des éoliennes de cette zone. Par exemple, Yu et al. [89] ont étudié
l’effet de ces caractéristiques sur la vitesse du vent et la précision de la prévision de
la puissance éolienne. Les données collectées à partir des turbines éoliennes ont été
cartographiées puis ils ont développé un modèle de prévision basé sur le CNN pour
extraire les caractéristiques de ces images. Les résultats montrent que le modèle pro-
posé atteint une meilleure précision que les méthodes existantes et que la vitesse du
vent est plus facile à prévoir que la puissance éolienne car cette dernière dépend des
caractéristiques spécifiques de l’éolienne. Hong et al. [135] ont également utilisé des
données bidimensionnelles qui représentent plusieurs vitesses de vent temporelles sur
plusieurs sites comme entrées pour leur modèle de prévision de la vitesse du vent
pour la journée. La structure et les hyperparamètres de leur modèle CNN ont été
optimisés par la méthode Taguchi, ce qui s’est traduit par une grande précision du
modèle.

Tableau 1.3 – Résumé des méthodes de prévision dans lesquelles les modèles basés
sur CNN sont utilisés
SUN Yuchi et al. C. -J. Huang et P. -H. Kuo Ruiguo Yu et al. Ying-Yi Hong et al.
Ref.
[133] [134] [89] [135]
Cible Puissance PV Puissance PV Vitesse et puissance Vitesse du vent
du vent spatio- spatio-temporelle
temporelles
Horizon de prévi- Très-court Court Court Court
sion
Prétraitement Modification Normalisation des Construction de la Construction
de la réso- données, reformatage grille d’images 2D, ana-
lution de des données d’entrée lyse de corrélation
l’image, sup- croisée
pression des
données erro-
nées
Optimisation ReLU, batch SGD, SELU, ReLU - Taguchi, Adam,
normalization, dropout
Adam, early
stopping
Dataset (Entrées, Vidéo du ciel, Température du mo- Puissance éolienne ; Vitesse du vent ; 1
résolution, pé- puissance PV ; dule, rayonnement so- 10 mn ; 3 Ans ; - ; h ; 1 An ; 8760 ×
riode, échantillons, 1 mn ; 7 Mois ; laire, puissance PV ; 1 USA 7 ; Taiwan, Chine,
localisation) 39 000 ; USA h ; 5 Jours ; - ; Taiwan Corée du Sud,
Philippines
Evaluation et com- Conditions Benchmarking mo- Benchmarking mo- Benchmarking
paraison météorolo- dels dels models
giques
1.4.2.2 Modèles basés sur les réseaux neuronaux récurrents
Les données de séries temporelles sont des données séquentielles enregistrées à

un intervalle de temps spécifique, qui va généralement de quelques secondes à une
heure pour les données de prévision. Le traitement des données séquentielles se fait
généralement à l’aide d’un modèle basé sur le RNN et ses variantes avancées LSTM
et GRU. Cette sous-section traite d’études qui proposent le RNN, le LSTM et le
GRU pour la prévision de l’énergie éolienne ou solaire, et ces travaux sont résumés
dans le tableau 1.4.

Thèse de doctorat
Tableau 1.4 – Résumé des méthodes de prévision dans lesquelles les modèles basés sur les RNN sont utilisés
Ref. Cible Horizon de Prétraitement Modèles Dataset Evaluation et

prévision Comparaison
[136] Vitesse Court (1h) Normalisation des données, Stacked Vitesse du vent ; 1 h ; 1an ; - ; USA Modèles de ré-
du vent construction de graphes LSTM férence
spatio-
temporelle
[137] Vitesse du Court (5mn) Normalisation des données, analyse Stacked Vitesse du vent à 10 et 2 mètres, direction Modèles de ré-
vent de corrélation LSTM du vent, température, humidité, pression, férence
point de rosée, rayonnement solaire ; 5 mn ;
1 Mois ; 8353 ; USA
[138] Puissance Court (6, 12, Normalisation des données, analyse LSTM Température, vitesse du vent, humidité, Modèles de ré-
PV multi- 24h) de corrélation, regroupement de don- type de ciel, irradiance solaire, puissance férence
pas nées PV ; 1 h ; 3 ans ; - ; USA
[139] Énergie Court Normalisation des données, change- GRU Puissance, vitesse et direction du vent, tem- Modèles de ré-
éolienne ment de résolution pérature, pression atmosphérique et den- férence
multi-pas sité ; 5 mn, 1 an ; 8760×3 ; USA
[140] Puissance Court (7 à 60 Normalisation des données LSTM PV power, PV module temperature ; 7 mn ; Modèles de ré-
PV mn) 4Y ; – ; China férence
[141] Irradiation Court Aucun LSTM, GHI ;1-h ; 10Y ; - ; France Modèles de ré-
solaire GRU férence
[86] Irradiation Court (1h) Normalisation des données LSTM Données météorologiques, puissance PV ;1 Modèles de ré-
solaire h ; 2 mois ; - ; Australie férence
[142] Charge et Court (1h) Normalisation des données DRNN Données météorologiques, puissance PV ;1 Modèles de ré-
puissance + h ; 2 mois ; - ; Australie férence
PV LSTM
[143] Puissance Court (1h) Aucun LSTM Sortie PV ; 1 h ; 1an ; - ; Égypte Modèles de ré-
PV férence
38
Thèse de doctorat
Ref. Cible Horizon de Prétraitement Modèles Dataset Evaluation et
prévision Comparaison
[144] Irradiation Court Modification de la résolution des LSTM Température air-sèche-bulbe ; 2 mn ; Modèles de ré-
solaire données 8Jours ; - ; USA férence
[145] Irradiation Court (1 Jour) Normalisation des données LSTM GHI, température, point de rosée, humidité, Modèles de ré-
solaire visibilité, vitesse du vent, type de temps ; 1 férence
h ; 18 mois, 12 mois ; - ; Cap-Vert
[146] Puissance Court (1, 2, 3 Suppression des valeurs aberrantes LSTM Puissance PV ; 15 mn ; 10 mois ; 3640 ; Chine Modèles de ré-
PV h) bidi- férence
rec-
tionnel
[147] Irradiation Court Suppression des valeurs aberrantes LSTM Irradiance solaire, température ; 1 h, 10 mn ; Modèles de ré-
solaire 10 ans, 3 ans ; 87 672+ 61 404 ; Espagne, férence
Brésil
[148] Puissance Court Normalisation des données LSTM Vitesse et direction du vent, composantes Modèles de ré-
Eolienne zonale et méridionale ; 1 h ; 3 ans ; - ; Europe férence
[149] Puissance Court (10 mn) Normalisation des données LSTM Irradiation, température du module, puis- Modèles de ré-
PV sance ; 10 m ; 1Y ; - ; Pologne férence
39
Dans les LSTM empilés, la sortie de chaque couche LSTM est l’entrée de la
couche LSTM suivante. Cette architecture profonde permet une représentation plus
complexe des données séquentielles dans le temps. Des modèles basés sur des LSTM
empilés sont proposés dans les références [136] et [137] pour la prévision de la vitesse
du vent. Dans [136], l’information spatio-temporelle est modélisée comme un graphe
dont les nœuds sont des entités génératrices de données et dont les arêtes repré-
sentent l’interaction entre ces nœuds. Le modèle proposé fournit des prévisions de la
vitesse du vent de tous les nœuds du graphe en même temps. Dans [137], les entrées
météorologiques sont utilisées pour entraîner le modèle LSTM empilé, qui se traduit
par des prévisions plus précises qu’un seul LSTM. Dans [138], un modèle LSTM à
deux couches cachées est utilisé pour la prévision de la puissance photovoltaïque. Des
variables météorologiques prévues et historiques, ainsi que des données historiques
sur la puissance photovoltaïque, ont été utilisées pour former et tester le modèle, qui
atteint une plus grande précision que le RNN, le Extreme Learning Machine (ELM)
et le réseau neuronal à régression généralisée.
Le mécanisme d’attention permet aux modèles d’apprentissage profond de se
concentrer sur les caractéristiques les plus importantes d’une séquence d’entrées.
De nouveaux modèles basés sur les LSTM avec le mécanisme d’attention ont été
développés dans [139] et [140]. Niu et al. [139] ont proposé un modèle de séquence
à séquence pour la prévision de l’énergie éolienne à plusieurs étapes. Leur modèle
est basé sur une stratégie à entrées et sorties multiples, qui, contrairement à une
stratégie récursive, fournit des sorties multiples à différents pas de temps en utilisant
un vecteur de valeurs comme entrées dans une simulation. Les performances de leur
modèle sur des étapes à trois temps ont été comparées à quatre autres modèles et les
résultats prouvent sa supériorité en termes de précision. De plus, les caractéristiques
les plus importantes pour prévoir la puissance du vent, telles que sélectionnées par le
mécanisme d’attention, sont la puissance et la vitesse du vent. D’autre part, Zhou et
al. [140] ont proposé un modèle de prévision à court terme de la puissance photovol-
taïque. Leur modèle se compose de deux réseaux LSTM pour les entrées de données
de température et de puissance photovoltaïque. Pour tester le modèle proposé, les
auteurs ont comparé ses performances avec celles de quatre autres modèles en uti-
lisant des jeux de données sur quatre saisons et avec différents horizons temporels.
Les expériences montrent que le modèle proposé et le LSTM traditionnel sont plus
performants que les autres modèles comparés dans un horizon temporel de plus de
15 minutes.
Une comparaison de la performance du LSTM et du GRU sur la prévision de

l’irradiation solaire est faite dans [141]. Les performances de ces modèles profonds à
une et deux couches ont été comparées à celles des modèles RNN et naïfs simples.
Les résultats montrent que les modèles LSTM et GRU fournissent tous deux de bons
résultats, en particulier avec les architectures à deux couches.
Les performances des modèles de prévision basés sur le LSTM ont été compa-
rées à celles de plusieurs modèles d’apprentissage automatique, tels que la régression
par machine à vecteur de support ("Support Vector Machine Regression" - SVR),
les arbres de régression par sac ("Bagged Regression Trees" - BRT), le réseau neu-
ronal à action directe ("Feed Forward Neural Network" - FFNN), la méthode de
régression linéaire des moindres carrés ("Linear Least Squares Regression" - LLSR),
le réseau neuronal à rétropropagation ("Back Propagation Neural Network" - BPNN)
et le réseau de perceptrons multicouches ("Multilayer Perceptron network" - MLP)
pour la prévision du rayonnement solaire et de la puissance photovoltaïque dans les
études [142–145]. Les résultats de toutes ces études confirment la supériorité du mo-
dèle LSTM. De même, une comparaison entre trois méthodes statistiques : ARMA,
ARIMA, SARIMA, et deux modèles basés sur le LSTM est fournie dans [146]. Les ré-
sultats indiquent que le modèle LSTM bidirectionnel utilisant les données historiques
de la puissance PV ne peut réaliser une prévision fiable que pour une heure à l’avance
et pas plus. Dans [111], Zhanga et al. ont utilisé un modèle LSTM pour la prévi-
sion à court terme de la puissance d’une éolienne et ont comparé ses performances
avec celles de plusieurs autres modèles. Les résultats des expériences montrent que
le modèle LSTM a la meilleure performance pour la prévision à un à cinq pas de
temps. En outre, Lima et al. [147] ont comparé les performances du modèle LSTM
avec l’ensemble des algorithmes d’apprentissage automatique pour la prévision de
l’irradiance solaire. Ils ont constaté que, bien que la précision du modèle LSTM soit
compétitive, le modèle d’ensemble obtient une meilleure précision.
Les chercheurs ont essayé d’améliorer les modèles de prévision basés sur les LSTM
en modifiant leur structure. Par exemple, dans [148], Shahid et al. ont utilisé quatre
noyaux d’activation d’ondelettes différents dans les couches LSTM au lieu d’utiliser
la fonction d’activation sigmoïde : Gaussienne, Morelet, Ricker et Shannon. Le mo-
dèle qu’ils proposent pour la prévision de l’énergie éolienne à court terme fournit des
prévisions plus précises que le réseau neuronal profond (DNN), la machine à vecteur
de support (SVM), l’ARIMA et les méthodes d’ensemble basées sur la programma-
tion génétique. En outre, Li et al. [150] ont ajouté une méthode d’estimation des
limites supérieure et inférieure au modèle LSTM pour la prévision par intervalle de
la puissance éolienne. Les résultats prouvent la supériorité du modèle proposé par

rapport à ELM, SVM et ANN.
1.4.2.3 Modèles basés sur les DBN "Deep belief networks"
Le DBN est un modèle génératif dans lequel les neurones de différentes couches
sont connectés alors qu’il n’existe aucune connexion entre eux dans la même couche.
Dans cette section, deux modèles de prévision basés sur le DBN sont examinés et
leurs détails sont fournis dans le tableau 1.5.
Un modèle basé sur DBN pour la prévision de la puissance photovoltaïque est
proposé dans [151]. D’après les résultats, le nombre optimal de RBM (restricted
Boltzmann machine) dans le modèle DBN est de deux avec 500 nœuds cachés, et
cette structure permet d’obtenir une meilleure précision de prévision que le modèle
ELM. D’autre part, le modèle DBN avec l’algorithme génétique (" Genetic Algorithm
") est utilisé pour la prévision de la vitesse du vent dans [152]. L’algorithme génétique
a été utilisé pour sélectionner les paramètres du DBN. Les résultats démontrent
que le modèle proposé est plus précis que le modèle SARIMA et que le modèle de
régression par machine vectorielle de soutien des moindres carrés ("Least-Squares
Support Vector Machine Regression", LSSVM) avec un algorithme génétique.
Tableau 1.5 – Résumé des méthodes de prévision dans lesquelles les modèles basés
sur le DBN sont utilisés
Ref. [151] [152]

Cible Puissance PV Puissance Eolienne
Horizon de prévision Court Court (1h)
Méthode d’optimisation Cross-validation Algorithme Génétique
Dataset Température du panneau, tem- Vitesse du vent, pression à la station et pres-
pérature ambiante, énergie accu- sion de la mer, température, point de ro-
mulée, irradiance ; 15 mois ; 14 sée, humidité relative, direction du vent, ra-
jours ; 1339 ; Singapour. fales maximales et leur direction, quantité
et heures de précipitations, heures d’enso-
leillement ; 1 h ; 1An + 14Jours ; - ; Taiwan
Méthode d’évaluation Benchmarking models Benchmarking models
1.4.2.4 Modèles hybrides et d’ensemble
La combinaison de plusieurs modèles d’apprentissage profond ou d’un modèle

d’apprentissage profond avec d’autres méthodes, telles que la décomposition des don-
nées ou la sélection des caractéristiques, a permis d’améliorer la précision des prévi-
sions, comme le détaillent les tableaux 1.6 à 1.8. Le tableau 1.6 présente des études
de modèles de prévision hybrides pour l’énergie éolienne, tandis que le tableau 1.7

présente des études pour l’énergie solaire. Le tableau 1.8 présente les études qui
ciblent à la fois l’énergie solaire et l’énergie éolienne. Tous ces tableaux présentent
le numéro de référence, l’objectif de prévision, l’horizon de prévision, les méthodes
de prétraitement, le modèle d’apprentissage profond utilisé, les méthodes d’optimisa-
tion, les informations sur l’ensemble de données (entrées, résolution, période, nombre
d’échantillons, emplacement) et les méthodes d’évaluation ou de comparaison.
Certains chercheurs ont proposé des modèles d’ensemble qui combinaient un mo-
dèle d’apprentissage profond avec de puissants algorithmes d’apprentissage automa-
tique. Par exemple, Chen et al. [153] ont développé un modèle d’ensemble basé sur
des LSTM et des SVR pour la prévision de la vitesse du vent. Tout d’abord, un clus-
ter de six modèles LSTM avec un nombre différent de couches cachées et de neurones
est utilisé pour effectuer la prévision. La raison de l’utilisation de six LSTM au lieu
d’un seul est d’améliorer la capacité de généralisation et la robustesse du modèle.
Ensuite, les résultats de la prévision des LSTM sont utilisés pour entraîner le modèle
SVR. Hu et al. [154] ont également proposé un modèle hybride pour la prévision de la
vitesse du vent. Leur modèle se compose de trois modèles ELM différents et de trois
modèles LSTM différents optimisés. En outre, les prévisions des six modèles sont
combinées par un autre modèle LSTM. D’autres chercheurs ont utilisé des modèles
d’ensemble comme l’apprentissage par transfert. Par exemple, Qureshi et al. [84] ont
proposé un modèle d’ensemble pour la prévision de l’énergie éolienne, qui contient
neuf auto-encodeurs profonds comme régresseurs de base et un DBN comme méta-
régresseur. Kumari et Toshniwal [66] ont développé un modèle d’ensemble composé
d’un eXtreme Gradient Boosting Forest (XGBF) et d’un DNN pour la prévision ho-
raire du GHI. Ils ont testé leur modèle en utilisant des données collectées à partir de
3 endroits qui ont un climat différent et les résultats montrent que le modèle a des
performances supérieures à celles du SVM et du Random Forest (RF).
1.4.2.4.1 Modèles hybrides avec des méthodes de décomposition des données

Les données de séries chronologiques se composent généralement de quatre élé-
ments : le niveau, la tendance, la saisonnalité et le bruit. Pour obtenir des prévisions
précises, il faut utiliser l’une des méthodes de décomposition des données pour sépa-
rer les quatre composantes ou au moins séparer le niveau et le bruit. Dans les modèles
hybrides, les chercheurs utilisent l’une des méthodes de décomposition comme étape
de traitement des données pour décomposer les séries chronologiques en plusieurs
sous-séries avant d’entraîner un modèle de prévision pour chacune d’elles. Le résul-

tat final de la prévision est la combinaison des résultats donnés par tous les modèles
de prévision. De nombreuses méthodes sont utilisées dans la littérature. Toutes les
études de ce paragraphe s’accordent sur l’effet de l’utilisation d’une méthode de
décomposition sur l’augmentation de la précision des modèles de prévision hybrides.
Les méthodes de décomposition basées sur les ondelettes peuvent séparer les si-
gnaux en plusieurs composantes ayant des fréquences différentes et donc des réso-
lutions plus élevées. Une technique basée sur les ondelettes est la transformation
en ondelettes ("Wavelet Transform" - WT), qui est utilisée dans [155–157]. Mishra
et al. [158] ont utilisé le WT discret pour décomposer les données de puissance so-
laire et un modèle LSTM pour la prévision de la puissance PV. De même, WT
est utilisé dans [155–157] pour décomposer les données de vitesse du vent en sous-
séries. Dans [155], un ensemble de quatre modèles LSTM est entraîné pour générer
les résultats de prévision de chaque sous-série, tandis que dans [156], Yu et al. ont
comparé les performances des réseaux RNN, LSTM et GRU, qui sont utilisés pour
l’extraction des caractéristiques des sous-séries de basse fréquence uniquement et la
prévision est effectuée par un SVM. Pour les sous-séries à haute fréquence, les don-
nées ont été introduites directement dans le SVM en sautant l’étape d’extraction des
caractéristiques. Dans [157], avec le WT, le modèle DBN est utilisé pour extraire
les caractéristiques. Cependant, les nouveaux échantillons de données fournis par le
DBN sont utilisés différemment pour la prévision. Le premier modèle prévoit la vi-
tesse du vent en utilisant le Light Gradient Boosting Machine (LGBM) tandis que
le second modèle utilise le Random Forest (RF). Les deux méthodes sont des algo-
rithmes d’apprentissage d’ensemble. Dans [159], Fei Li et al. utilisent le WT discret
pour décomposer les données de vitesse du vent en vitesse moyenne et en intensité
de la turbulence. L’intensité de la turbulence peut être utilisée comme une mesure
de l’incertitude de la vitesse du vent. Ensuite, le LSTM est entraîné et testé avec
deux stratégies d’ensemble pour fusionner le résultat final de la prévision. Les résul-
tats montrent que la fonction d’intensité de la turbulence a amélioré la prévision à
plusieurs étapes, en particulier avec une résolution de données plus élevée. En outre,
une nouvelle méthode de débruitage ("Wavelet Soft Threshold Denoising" ou WSTD)
est proposée dans [160] pour le traitement des données de vitesse du vent, qui est
une technique de traitement du signal capable de filtrer les signaux de bruit sans
déformer l’information. En plus de cette méthode, le modèle GRU est utilisé pour
extraire les caractéristiques et faire la prévision.
La décomposition en paquets d’ondelettes ("Wavelet Packet Decomposition", WPD)
est une version de la WT qui fournit une meilleure décomposition que celle-ci [161].

Liu et al. ont utilisé la WPD dans [162] dans le cadre de modèles hybrides de prévision
de la vitesse du vent. Un modèle CNN avec opérateur de convolution à 1 dimension
est utilisé avec les sous-séries haute fréquence, tandis qu’un autre modèle CNN avec
une couche LSTM est utilisé avec les sous-séries basse fréquence. De même, Dola-
tabadi et al. ont utilisé la méthode WPD discrète dans [163] pour la décomposition
des données de vitesse du vent. Les sous-séries résultantes ont été reconstruites en
utilisant la théorie de la reconstruction dynamique et ont ensuite été introduites dans
le réseau LSTM bidirectionnel pour effectuer la prévision de la vitesse du vent.
La méthode EMD (Empirical Mode Decomposition) peut décomposer les don-
nées en de nombreuses fonctions de mode intrinsèques. Contrairement à la TSF,
cette méthode est adaptative et il n’est donc pas nécessaire de choisir une fonction,
une structure ou un niveau de décomposition pour optimiser ses performances [161].
Dans les deux références [164] et [165], l’EMD est utilisé avec trois modèles : LSTM,
GRU, et DNN pour la prévision de la production d’énergie renouvelable. Les expé-
riences montrent que le modèle hybride avec DNN a les erreurs les plus faibles dans
[164] tandis que le modèle hybride avec GRU atteint la meilleure performance de
prévision dans [165]. Dans [166], un modèle hybride de prévision de la vitesse du
vent est proposé, qui utilise l’EMD pour traiter les données, et le SAE pour extraire
les caractéristiques en plus de l’ELM pour la prévision. Les résultats montrent que le
modèle proposé est le plus performant pour les prévisions à 12 heures. He et al. dans
[167] ont utilisé la décomposition en modes empiriques d’ensemble ("Ensemble Em-
pirical Mode Decomposition" - EEMD) pour analyser les données de vitesse du vent,
puis la SSA pour reconstruire les données. La prévision est générée par un ensemble
de trois modèles, MLP, LSTM et ARIMA. Pour obtenir le poids de chaque modèle,
l’algorithme MOPSO (Multiobjective particle swarm optimization) est utilisé.
La décomposition en modes variationnels ("Variational Mode Decomposition",
VMD) est une méthode de décomposition plus récente que l’EMD, mais ses per-
formances dépendent de la définition de certains paramètres, tels que le nombre de
modes [161]. Zhang et al. [90] ont développé un modèle hybride pour la prévision
de la puissance PV, qui inclut la VMD pour séparer les données en composantes
régulières et irrégulières. La prévision de la composante régulière est traitée par le
modèle ARIMA, tandis que la prévision de la composante irrégulière est effectuée
par le modèle DBN. De même, Wang et Li [168] ont utilisé le VMD pour décomposer
les données de vitesse du vent dans leur modèle hybride tandis qu’un réseau LSTM
est entraîné pour générer la prévision. Wang et al. [169] et Yildiz et al. [170] ont
également utilisé le VMD pour décomposer les données de puissance éolienne avant

de les introduire dans leur modèle hybride proposé pour la prévision de la puissance
éolienne.
Dans certaines études, les chercheurs ont combiné plus d’une méthode de dé-
composition pour obtenir des composantes plus détaillées de la série chronologique
d’origine et donc une prévision plus précise. Par exemple, Zang et al. [171] ont décom-
posé les séries historiques de puissance PV en composantes saisonnières, tendancielles
et aléatoires en utilisant la VMD. Ensuite, l’EWT est utilisé pour décomposer da-
vantage la composante aléatoire en plusieurs composantes stationnaires. Les données
obtenues après décomposition ont été ajoutées aux données météorologiques des deux
dernières semaines pour reconstruire des cartes de caractéristiques bidimensionnelles.
Le type de temps (ensoleillé, partiellement nuageux, couvert/pluvieux) a également
été encodé sous la forme de cartes bidimensionnelles. Les cartes bidimensionnelles
ont été utilisées comme entrées pour entraîner deux modèles CNN : Le réseau neu-
ronal résiduel (ResNet) et le réseau convolutif dense (DenseNet) pour la prévision
de la puissance photovoltaïque à un jour. De plus, Fu et al. [172] ont d’abord uti-
lisé la méthode de décomposition des modes empiriques basée sur un filtre temporel
(TVF-EMD) pour décomposer les données de vitesse du vent en plusieurs fonctions
de mode intrinsèques avec différentes fréquences. Les valeurs obtenues sont soumises
à la méthode SSA pour les diviser en composantes haute fréquence et basse fré-
quence. Ensuite, pour les séries haute fréquence, le KELM (kernel-based extreme
learning machine) est utilisé comme prédicteur. Pour les séries à basse fréquence,
un modèle basé sur les modèles CNN et LSTM a permis de prévoir la vitesse du
vent. En outre, Mi et al. [173], dans leur modèle hybride de prévision de la vitesse
du vent, ont d’abord utilisé le SSA pour réduire le bruit dans les données de vitesse
du vent. Ensuite, ils ont utilisé l’EMD pour décomposer les données en sous-couches
et extraire les caractéristiques. La prévision est effectuée par un modèle qui com-
bine CNN et SVM. Liu et al. [174] ont d’abord utilisé la DMV pour décomposer
les données de vitesse du vent. Ensuite, les informations sur les tendances ont été
extraites à l’aide de SSA. Pour les sous-séries à basse fréquence, un réseau LSTM a
été formé pour effectuer la prévision, tandis que le modèle ELM a été utilisé pour la
prévision des sous-séries à haute fréquence. D’autre part, Xiang et al. dans [175] ont
d’abord utilisé le SSA, puis appliqué le VMD aux sous-séries de vitesse du vent. La
prévision dans leur modèle hybride est effectuée par un ensemble de réseaux GRU
bidirectionnels. Yin et al. [176] ont utilisé l’EMD pour décomposer la série de vitesse
du vent en plusieurs fonctions de mode intrinsèques, puis ont appliqué la VMD pour
décomposer uniquement la première fonction de mode intrinsèque. Dans leur modèle

hybride. Le modèle CNN est utilisé pour l’extraction de caractéristiques tandis que
le LSTM est utilisé pour la prévision. Ma et al. [177] ont d’abord décomposé les
séries temporelles de vitesse du vent, puis ont appliqué VMD pour décomposer les
séries temporelles d’erreur. Les données obtenues sont utilisées pour entraîner un
modèle LSTM et obtenir la prévision. Les résultats des expériences prouvent que
cette stratégie de double décomposition a amélioré la précision du modèle LSTM.
D’autre part, Chen et al. [178] ont d’abord utilisé SSA pour séparer les données en
ensembles d’entraînement et de test. Une combinaison de réseaux CNN et LSTM est
utilisée pour extraire la caractéristique et effectuer la prévision.
1.4.2.4.2 Méthodes hybrides avec extraction ou sélection de caractéristiques

De nombreux chercheurs utilisent les avantages des modèles d’apprentissage pro-
fond pour l’extraction de caractéristiques non linéaires à partir de données, tels que
le CNN ou le LSTM, et d’autres chercheurs préfèrent utiliser différentes méthodes de
sélection de caractéristiques dans leur approche de prévision hybride, comme détaillé
dans ce paragraphe.
Le modèle CNN est largement utilisé pour l’extraction de caractéristiques pro-
fondes dans les modèles de prévision des énergies renouvelables, en particulier lorsque
les données contiennent des informations spatiales. Lee et al. [179] ont utilisé un CNN
doublé avec des filtres de différentes tailles pour extraire des caractéristiques à court
terme des données. La caractéristique de sortie des CNN est ensuite introduite dans
un réseau LSTM pour produire la prévision de la puissance photovoltaïque. D’autre
part, dans [180], le résultat de la prévision de la puissance PV est la combinaison de
la sortie du CNN et de la sortie du LSTM. De plus, Ray et al. [181] ont proposé un
modèle hybride de CNN et de LSTM pour la prévision annuelle de la puissance PV.
Ghimire et al. [182], Zang et al. [183], Wu et al. [184], Zhu et al. [185], et Wang et al.
[186] ont également combiné le CNN pour l’extraction de caractéristiques et le LSTM
pour les tâches de prévision suivantes : prévision du GHI, prévision de la puissance
éolienne, prévision simultanée de la vitesse du vent de plusieurs sites, et prévision
de la puissance PV. De même, Qin et al. [187] ont utilisé un CNN pour représenter
la construction régionale (tendance spatiale) de la série temporelle du courant éolien
et un LSTM pour extraire les caractéristiques dynamiques de la série temporelle du
vent. De même, Wang et al. [188] ont développé un modèle hybride pour la prévision
de la puissance thermique. Il se compose d’un CNN pour l’extraction des caracté-
ristiques spatiales, d’un LSTM pour l’extraction des caractéristiques temporelles et

d’un réseau MLP pour la prévision. Par ailleurs, Woo et al. [189] ont utilisé quatre
réseaux LSTM convolutifs pour capturer les caractéristiques spatio-temporelles des
champs de vent et prévoir la réponse des éoliennes. Un modèle LSTM convolutif est
également proposé dans [190] pour la prévision de la puissance PV de plusieurs sites
simultanément. De plus, Afrasiabi et al. [191], dans leur cadre de prévision de l’énergie
éolienne et photovoltaïque, ont converti les données de séries temporelles en vecteurs
bidimensionnels, puis ont utilisé le bloc CNN et le bloc GRU pour extraire les carac-
téristiques, suivis d’un bloc dense pour produire les sorties de prévision. Un modèle
hybride de CNN et de GRU est également proposé dans [192] par Liu et al. pour
extraire les caractéristiques spatio-temporelles de la matrice de la grille des éoliennes
qui a été construite en utilisant les données de vitesse du vent et les informations sur
l’emplacement des éoliennes. De plus, Ju et al. [193], dans leur modèle de prévision
de l’énergie éolienne, ont utilisé un CNN pour l’extraction des caractéristiques et
l’algorithme LightGBM pour générer les résultats de la prévision. LightGBM est un
algorithme de boosting qui peut accélérer considérablement la prévision et réduire
l’utilisation de la mémoire. Avant de former le modèle, ils ont combiné les données
des éoliennes adjacentes pour améliorer la précision des prévisions. Cette étape s’est
avérée utile dans les résultats. Par ailleurs, Chen et al. [194] ont d’abord structuré
les données en une matrice tridimensionnelle pour représenter les trois aspects des
corrélations des données de vitesse du vent : entre plusieurs sites, entre plusieurs
facteurs météorologiques et entre sites et facteurs. Ensuite, ils ont utilisé un CNN
pour extraire la relation spatiale entre les facteurs météorologiques d’un site cible et
de son site adjacent et un LSTM pour extraire les caractéristiques temporelles. Hong
et al. [195] ont également proposé un modèle hybride de CNN et de RBFNN pour
la prévision de l’énergie éolienne à un jour. La partie CNN du modèle extrait les
caractéristiques des données d’énergie éolienne tandis que la partie RBFNN génère
la prévision. Le RBFNN avec la fonction gaussienne double (DGF) peut filtrer les
pics dans les données et améliorer la précision.
Dans certaines études, une méthode de sélection des caractéristiques est utili-
sée après avoir utilisé une technique de décomposition. Par exemple, Memarzadeh
et Keynia [155] ont utilisé la méthode d’information mutuelle ("Mutual informa-
tion" - MI) sur les sous-séries décomposées avant l’étape de reconstruction, qui classe
les entrées candidates en fonction de leur valeur d’information pour la prévision de
la vitesse du vent. Une méthode de sélection des caractéristiques peut également
constituer une étape de prétraitement des données avant l’entraînement du modèle
de prévision. Par exemple, Yu et al. [196] ont essayé quatre méthodes de regrou-

pement pour regrouper les données d’éoliennes similaires à l’éolienne cible et filtrer
les caractéristiques de corrélation séquentielle : K-means, le clustering hiérarchique
agglomératif, le clustering réducteur itératif équilibré utilisant des hiérarchies, et le
clustering spectral. Ils ont constaté que cette dernière méthode ainsi que la structure
améliorée du modèle LSTM donnent une meilleure précision et une plus grande vi-
tesse de convergence que le LSTM traditionnel. Une méthode de regroupement fait
également partie du modèle de Wang et al. [197] pour la prévision de l’énergie éo-
lienne. Plus précisément, ils ont utilisé l’algorithme de regroupement k-means pour
analyser les données de la PNT et identifier les plus grands échantillons historiques
qui ont le plus grand impact sur la précision de la prévision. Ils ont ensuite utilisé un
modèle DBN à cinq couches pour la prévision. Zhang et al. [198] ont également utilisé
le clustering k-means pour diviser les échantillons en 3 clusters et ont ensuite formé
un réseau encodeur-décodeur basé sur LSTM avec un mécanisme d’attention pour la
prévision de l’énergie éolienne. Zhen et al. [199] ont utilisé des images du ciel comme
entrées pour leur modèle de prévision de la puissance photovoltaïque. Ils ont donc
utilisé un modèle auto-codeur convolutif pour convertir les images du ciel en vecteurs
de caractéristiques. Ensuite, ils ont appliqué le clustering K-means sur les vecteurs
obtenus. Ils ont constaté que les images sont regroupées de manière optimale en trois
classes. Les données classées sont introduites dans un modèle hybride composé d’un
CNN, d’un LSTM et d’un ANN pour être transposées en valeurs d’irradiance.
1.4.2.4.3 Méthodes hybrides avec correction des données

Dans certains modèles de prévision hybrides, l’erreur obtenue lors de la prévision
en plus des résultats de la prévision sont introduits dans le modèle pour produire la
sortie finale de la prévision. Par exemple, dans [177], la série d’erreurs est décomposée
à l’aide du VMD, puis un modèle LSTM est entraîné pour générer la prévision des er-
reurs. Les résultats sont utilisés pour corriger la prévision de la vitesse du vent. Dans
[200], la méthode adaptative de corrections multiples des erreurs est utilisée pour
filtrer les composantes prévisibles restantes dans les résidus de prévision. Le modèle
ARIMA est utilisé pour corriger les résidus si les résultats du test Q de Ljung-Box
montrent qu’il existe une autocorrélation. En outre, dans [168], une stratégie de
correction des erreurs appelée GARCH (Generalized Auto-Regressive Conditionally
Heteroscedastic) est utilisée. S’il existe une corrélation et une hétéroscédasticité dans
la composante d’erreur, le modèle hybride LSTM-GARCH est appliqué. Si seule l’hé-
téroscédasticité existe, le modèle GARCH seul est appliqué pour la correction. En

outre, Liu et Chen [201] ont développé un modèle hybride de prévision de la vi-
tesse du vent en plusieurs étapes avec correction des erreurs. Ils ont d’abord utilisé
deux méthodes différentes pour transformer la résolution des données : la méthode
de moyennage et l’autoencodage. Ensuite, deux modèles LSTM bidirectionnels (BiL-
STM) sont entraînés : l’un utilisant les données moyennées et l’autre utilisant la
sortie de l’autoencodeur. Les modèles BiLSTM génèrent des prévisions en 10 étapes.
La méthode MOMVO (Multi-Objective Multi-Verse Optimization) est utilisée pour
trouver les poids de combinaison optimaux des deux prévisions. Ensuite, l’erreur ré-
siduelle est calculée, puis analysée par les méthodes EWT et ORELM pour éliminer
les valeurs aberrantes des sous-séries d’erreurs.
Les chercheurs ont également essayé d’utiliser les informations sur le type de
temps pour corriger ou améliorer les résultats des prévisions. Par exemple, dans
[202], Wang et al. ont proposé un modèle de prévision d’ensemble de la puissance
photovoltaïque qui se compose de deux sous-modèles : un modèle LSTM et un modèle
de corrélation temporelle, qui sont intégrés dans le cadre de la prévision partielle du
modèle quotidien. Les entrées du modèle LSTM sont les données de puissance PV des
trois jours précédant le jour de la prévision et la sortie est la puissance PV du jour de
la prévision. Les résultats sont modifiés à l’aide du modèle de corrélation temporelle.
Ensuite, un cadre de prévision de modèle quotidien partiel est appliqué pour prévoir
le modèle quotidien du jour de prévision, qui est utilisé pour optimiser le modèle
de corrélation temporelle. De plus, dans [203], Gao et al. ont développé plusieurs
modèles de prévision de la puissance PV pour des conditions météorologiques idéales
et non idéales. Les données métrologiques ont été utilisées comme entrées pour les
modèles de prévision des conditions météorologiques idéales, qui sont basés sur le
LSTM. D’autre part, seules les données de production d’énergie de jours similaires
et de jours adjacents ont été utilisées pour les modèles de prévision de conditions
météorologiques non idéales, qui sont basés sur le LSTM et le modèle gris discret
("Discrete grey model" - DGM). Le DGM est utilisé pour corriger les données horaires
de puissance PV avant de les introduire dans le LSTM.

Thèse de doctorat
Tableau 1.6 – Résumé des méthodes de prévision dans lesquelles des modèles hybrides sont utilisés pour l’énergie éolienne
Ref. Cible Horizon de Méthode de Modèle Méthode d’optimisa- Dataset Méthode d’évaluation
prévision prétraitement tion ou de comparaison
[153] Vitesse du Très court Aucun LSTM +SVR Optimisation extrême Vitesse du vent ; 10 mn, 1 h ; 6Jours, Modèles d’évaluation
vent (10mn, 1h) 30Jours ; 738+720 ; Chine. de référence
[154] Vitesse du Très court Aucun LSTM+ ELM Évolution diffé- Vitesse du vent ; 10 mn, 1 h ; - ;720 Modèles d’évaluation
vent (10mn, 1h) rentielle, fonction × 2 ; Chine de référence, tests sta-
hystérétique tistiques
[84] Énergie éo- Court MI AE + DBN Ajout de la sparsité Puissance éolienne, composante zo- Modèles d’évaluation
lienne au modèle AE nale et méridionale, vitesse et direc- de référence
tion du vent ; 12 h ; 3 ans ; - ; Europe
[155] Vitesse du Court MI, WT WT+ Recherche de cor- Vitesse du vent, 10 mn, 1 h ; 80Jour, Modèles d’évaluation
vent FS+LSTM beaux 1an ; 1200 × 2 ; Espagne, Iran de référence
[156] Vitesse du Court (1h) WT WT+ Aucun Vitesse du vent ; 1 h ; 2 mois, 5 mois ; Modèles d’évaluation
vent RNN+SVM, - ; Chine de référence
WT+
LSTM+
SVM, WT+
GRU+ SVM
[157] Vitesse du Très court WT WT+DBN Aucun Vitesse du vent ; - ; - ;1000 × 4 ; Modèles d’évaluation
vent multi-pas +LGBM, Chine de référence
WT+DBN+
RF
[159] Vitesse du Court (10 à DWT DWT +LSTM Dropout Vitesse du vent moyenne et de la tur- Modèles d’évaluation
vent multi-pas 12h) bulence ; 10 mn ; 1 an ; 52 560 ; Chine de référence
[160] Vitesse du Court WSTD WSTD+ GRU Recherche par grille Vitesse du vent ; 1 h ; 42 jours ; 1000 Modèles d’évaluation
vent multi-pas validée par recoupe- × 4 ; USA de référence, compa-
ment, dropout raison des décomposi-
tions
51
Thèse de doctorat
[162] Vitesse du Court WPD WPD+CNNLSTM

Adam, ReLU Vitesse du vent ; 10 mn ; 1Y ; 700 × Modèles d’évaluation
vent multi-pas 4 ; Chine de référence
[163] Vitesse du Court (10mn, Discrete WPD DWPD+ BiL- Adam Vitesse du vent ; 10 mn, 1 h ; 2 ans ; Modèles d’évaluation
vent 1h) STM - ; USA, Canada de référence, temps de
calcul
[166] Vitesse du Court (12h, EMD EMD+SAE+ Aucun Vitesse et direction du vent ; 15 mi- Modèles d’évaluation
vent 24h) ELM nutes ; 2 ans ; - ; UK de référence
[167] Vitesse du Court EEMD EEMD+ Adam, RelU, Vitesse du vent ; 10 mn ; - ; 3600 × Modèles d’évaluation
vent MLP+LSTM+ MOPSO 3 ; Chine de référence
ARIMA+
MOPSO
[168] Vitesse du Court VMD, KLD+ VMD+ Aucun Vitesse du vent ;1 h ; - ; 43,824 3 ; Modèles d’évaluation
vent multi-pas EM+SA KLD+EM+LSTM+ Chine de référence
stratégie de
correction des
erreurs
[169] Vitesse du Court (1h, 3h) VMD VMD+ Re- Adam, ReLU Vitesse du vent, puissance éolienne ; Modèles d’évaluation
vent current au- 1 h ; 1 an ; - ; Belgique, Espagne, USA de référence
toencoder
[170] Vitesse du Court (1h, 3h) VMD, norma- VMD+ resi- Leaky ReLU, SGD Puissance, vitesse et direction du Modèles d’évaluation
vent lisation des dual CNN vent ; 1 h ; 1 an ; 8760 ; Turquie de référence
données
[204] Vitesse du Court EWT EWT + SE+ Slime mould algo- Énergie éolienne ; 10 mn ; 22 J ; 1704 ; Modèles d’évaluation
vent KELM+GRU rithm Espagne de référence
[205] Vitesse du Court EWT EWT + Aucun Vitesse du vent ; 10 mn ; - ; 1000 × Modèles d’évaluation
vent multi-pas LSTM+RELM+IEWT 4 ; Chine de référence
[206] Vitesse du Court EWT EWT+LSTM Adam, Mini batch Vitesse du vent ; 15 mn ; 60 jours ; - ; Modèles d’évaluation
vent Chine de référence
52
Thèse de doctorat
[207] Vitesse du Court EWT EWT, LSTM, Aucun Vitesse du vent ; 1 h ; - ; 700 × 4 ; Modèles d’évaluation
vent multi-pas Elman NN Chine de référence
[201] Vitesse du Court EWT SAE+BiLSTM Regularization, cross- Vitesse du vent ; 3 s ; 1 jour ; 30 000 ; Modèles d’évaluation
vent multi-pas + MOMVO + validation, Adam, Chine de référence
ORELM MOMVO
[208] Vitesse du Court (16 mn, CEEMDAN CEEMDAN+ Improved Bat algo- Vitesse du vent ; 15 mn, 1 h ; 20 J, Modèles d’évaluation
vent 1h) PE+ rithm 80 J ; 1920 × 2 ; Chine de référence

GRU+RBFNN
[208] Vitesse du Court SSA SSA+CNN+ Adam, grid search, Vitesse du vent ; 15 mn ; 2 mois, 2 Modèles d’évaluation
vent multi-pas GRU+SVR ReLU mois, 1 mois ; 2688 × 3 ; Chine. de référence
[139] Vitesse du Court SSA SSA+LSSVM+DBN+

10-fold cross- Puissance éolienne ; 10 mn ; - ; 3400 ; Modèles d’évaluation
vent LSH validation, LSH Chine de référence
[209] Vitesse du Très court (10 SSA SSA+MADANETDropout Vitesse du vent ; 10 mn ; - ; 700 × 4 ; Modèles d’évaluation
vent multi-pas à 30 mn) Chine de référence
[210] Vitesse du Court (1 à 4h) ISSA ISSA+LSTM+DBN

Grasshopper optimi- Vitesse du vent ; 1 h ; 1 mois ; 720 ; Modèles d’évaluation
vent multi-pas zation Chine de référence
[172] Vitesse du Court (10mn, TVF-EMD, TVF- Adam, MHHOGWO Vitesse du vent ; 10 mn, 1 h ; 73 J ; Modèles d’évaluation
vent multi-pas 1h) FE, SSA, PSR EMD+ FE+ 1008, 744 ; Espagne, Australie de référence
+SSA+PSR
KELM+
ConvLSTM
[173] Vitesse du Court SSA +EMD SSA+EMD+ ReLU, Adam, dro- Vitesse du vent ; 10 mn ; - ; 700 × 4 ; Modèles d’évaluation
vent multi-pas CNN+ SVM pout, grid search re- Chine. de référence
gularization,
[174] Vitesse du Court VMD+ SSA VMD+SSA+ Aucun Vitesse du vent ;1 h ; 8 mois ; 700 × Modèles d’évaluation
vent multi-pas LSTM+ELM 4 ; Chine de référence
53
Thèse de doctorat
[176] Vitesse du Court EMD +VMD EMD+VMD+CNN+LSTM

ReLU, Adam Puissance et vitesse du vent, sinus et Modèles d’évaluation
vent multi-pas cosinus de la direction du vent ; 1 h ; de référence
- ; 720 ; Espagne
[177] Vitesse du Court CEEMDAN, Conv- Aucun Vitesse du vent ; 15 m, 1 h ; 30 J, 90 Modèles d’évaluation
vent VMD LSTM+BPNN J ; 2880 × 2 + 2160 × 2 ; USA de référence
[178] Vitesse du Court SSA+ CEEM- CNN et LSTM ReLU, Modified Vitesse du vent ; 15 mn ; - ; 2000 × Modèles d’évaluation
vent DAN whale optimization 3 ; Chine de référence
[185] Vitesse du Court (10m-3 MI CNN et LSTM RMSProp, early stop- Vitesse du vent ; 5 mn ; 1 an ; 52 704 ; Modèles d’évaluation
vent spatio- h) ping USA de référence
temporelle
multi-pas
[187] Puissance Ultra-court Modélisation CNN et LSTM SGD, Adam, early Vitesse du vent ; 10 s ; 12 h ; 22 000 Modèles d’évaluation
éolienne et (10s-1 mn) des données stopping de référence
charge par logiciel
[189] Vitesse du Ultra-court Modification LSTM Aucun Champs de vent ; 0,4 s ; 12 h ; 158 Modèles d’évaluation
vent (10s-1 mn) de la réso- 400 de référence
lution des
données
[193] Vitesse du Ultra-court Combinaison CNN+ ReLU, dropout, early État du générateur, température, Modèles d’évaluation
vent des données LightGBM stopping puissance et vitesse du vent, vitesse de référence
des éoliennes du moteur, direction du vent, puis-
adjacentes sance journalière, angle d’inclinai-
son ; 5 mn ; 1 an ; - ; Chine
[194] Vitesse du Court Analyse de CNN+LSTM ReLU, Adam Vitesse et direction du vent, tempé- Modèles d’évaluation
vent corrélation rature, point de rosée, rafales, ca- de référence
lage altimétrique, humidité ; 5 mn ;
6 mois ; 25 918 +25 920 ; USA
54
Thèse de doctorat
[195] Énergie éo- Court (24 h) Normalisation CNN + Dropout, Adam Énergie éolienne ; 1 h ; 1 an ; 8760 ; Modèles d’évaluation
lienne des données RBFNN Taiwan de référence, types de
temps
[211] Vitesse du Court (10 mn- Construction LSTM + Conv ReLU Vitesse et direction du vent ; 5 mn ; Modèles d’évaluation
vent spatio- 3 h) de graphes layers+ Rough 6 ans ; 105 ,120 × 6 ; USA de référence
temporelle layers
multi-pas
[196] Énergie éo- Court (90 mn) 4 méthodes de Regroupement LSTM Vitesse et puissance du vent ; 10 mn ; Modèles d’évaluation
lienne clustering spectral + 3 ans ; - ; USA de référence
LSTM
[197] Énergie éo- Court (1 jour) Classification Classification GD, greedy algorithm Vitesse et direction du vent, puis- Modèles d’évaluation
lienne K-means k-means sance du vent, pression atmosphé- de référence, types de
+DBN rique, humidité, température ; 10 temps
mn, 1 h ; 1an ; - ; Espagne
[198] Énergie éo- Court (1 jour) Réduction de Classification Aucun Vitesse et direction du vent, tempé- Modèles d’évaluation
lienne la dimension, k-means + rature, humidité, pression ; 10 mn, 1 de référence
classification LSTM h ; 1 an ; 50 688 ; Espagne.
K-means
[212] Énergie éo- Court (24 h) PCA PCA+ LSTM Aucun Puissance du vent, densité de l’air, Modèles d’évaluation
lienne pression, température, vitesse et di- de référence
rection du vent ; 5 mn ; 14 mois ; - ;
Royaume-Uni.
[213] Énergie éo- Court Clustering AE+ORELM MODWPT, MO- Vitesse du vent ; 1 mois ; - ; 2000 ; Modèles d’évaluation
lienne FEPSO Chine. de référence
[214] Vitesse et Moyen (1 se- Classification Classification Cross-validation Puissance et vitesse du vent ; 1 h ; - ; Modèles d’évaluation
puissance du maine) K-means K-Means+ - ; Canada de référence
vent WNN+ RKF
55
Thèse de doctorat
[215] Énergie éo- Court (24-72 Aucun SDAE Min-batch SGD, Vitesse du vent, sin et cos de la di- Modèles d’évaluation
lienne h) MLR rection du vent, puissance du vent ; de référence
10 mn ; 1 an ; - ; Chine
Tableau 1.7 – Résumé des méthodes de prévision dans lesquelles des modèles hybrides sont utilisés pour l’énergie solaire
[66] GHI Court (1h) Analyse corré- XGBF+ DNN Adam, ReLU GHI, température, vitesse et direc- Modèles d’évaluation
lationnelle tion du vent, humidité, pression, inde référence, condi-
dice de ciel clair ; 1 h ; 10 ans ; - ; Inde tions météorologiques
[158] Puissance PV 1 à 60 Jours DWT DWT+LSTM Dropout Indice nuageux, visibilité, tempéra- Modèles d’évaluation
Multi-pas ture, point de rosée, humidité, vide référence
tesse du vent, pression, altimètre,
puissance ; 1 h ; 2 ans ; - ; USA
[216] Puissance PV Court (30 mn) SWT SWT+ Cross-validation Puissance PV, température prévue, Modèles d’évaluation
LSTM+ irradiance, statistiques PV ; 30 mn ; de référence
DNN 2 ans ; 35 089 ; USA
[217] Puissance PV Court (1h) WPD WPD + Aucun Puissance PV, GHI, DHI, vitesse du Modèles d’évaluation
LSTM vent, température, humidité ; 5 mn ; de référence, condi-
2 ans ; - ; Australie tions météorologiques
[90] Puissance PV Court (1J) VMD VMD+ Algorithme adaptatif Puissance PV, irradiance solaire, Modèles d’évaluation
DBN+ de colonies de fourmis température de l’air ; 5 mn ; - ; - ; de référence, condi-
ARIMA Australie tions météorologiques
56
Thèse de doctorat
[218] Irradiation so- Court (1h) CEEMDAN CEEMDAN+ Grid search Irradiance solaire ; 1 h ; 6 ans ; 230 Modèles d’évaluation
laire CNN+LSTM 336 ; USA, Algérie. de référence, condi-
tions météorologiques
[179] Puissance PV Court (1J) Normalisation CNN+ LSTM ReLU, early stopping, Puissance, irradiation, température, Modèles d’évaluation
des données batch normalization vitesse du vent, humidité ; 10 mn, 1 de référence, condi-
h ; 4 ans ; 18 620 ; Corée du Sud. tions météorologiques
[180] Irradiation so- Court (15 mn Analyse corré- CNN+ LSTM Aucun Puissance PV ; 15 mn ; 1 an ; - ; Bel- Modèles d’évaluation
laire à 3h) lationnelle gique de référence, condi-
[181] Puissance PV Long (1 an) Analyse corré- CNN+ LSTM ReLU, early stopping, Puissance PV, GHI, DNI, DHI, Modèles d’évaluation
lationnelle batch normalization bulbe humide, point de rosée, tempé- de référence
rature ; 1 h ; 25 ans ; 5271 ; Australie.
[182] Irradiation so- 1J, 1 semaine, Normalisation CNN+LSTM Grid search, Adam, GSI ; 1 mn ; 13 ans ; 60 743 ; Austra- Modèles d’évaluation
laire Multi-pas 2 semaines, 1- des données ReLU, early stopping, lie. de référence
8 mois dropout, regulariza-
tion
[183] GHI spatio- Court (1h) Reconstruction CNN-LSTM Aucun GHI, point de rosée, angle zéni- Modèles d’évaluation
temporel des caracté- thal solaire, vitesse et direction du de référence, condi-
ristiques vent, précipitations, humidité relations météorologiques
spatiales et tive, température ; 1 h ; 7 An ; - ;
temporelles USA
[186] Puissance PV Court (1J) Suppression CNN+LSTM Dropout Moyenne de la phase en cours, puis- Modèles d’évaluation
des valeurs sance active, vitesse du vent, tem- de référence, pas de
aberrantes, pérature, humidité relative, GHR, temps d’entrée
augmentation DHR, sinus et cosinus de la direction
des données du vent ; 5 mn ; 4 ans ; - ; Australie
57
Thèse de doctorat
[188] Puissance Court (30 mn) Aucun CNN+ ReLU, dropout GHI, DHI, GTI, DNI, angle d’alti- Modèles d’évaluation
thermique LSTM+ tude solaire, angle d’azimut solaire, de référence, condi-
MLP pression, humidité, température, vi- tions météorologiques
tesse du vent, puissance ; 30 mn ;
1an ;- ; Chine
[190] Puissance Court (15 à 60 Modification LSTM Grid search Puissance PV ; 15 mn ; 1 an ; 16 060 ; Modèles d’évaluation
PV spatio- mn) de la réso- USA de référence, condi-
temporelle lution des tions météorologiques

données
[184] L’énergie so- Court (24h à Normalisation AE+ LSTM ReLU, early stopping Données NWP, énergie solaire ; 3 h ; Modèles d’évaluation
laire 48h) des données 990 J ; - ; Allemagne de référence, condi-
[219] Puissance PV Court Suppression LSTM + CNN Dropout Puissance active, vitesse du vent, Modèles d’évaluation
des valeurs température, humidité relative, de référence
aberrantes GHI, DHI, direction du vent ; 5 mn ;
6 mois ; 53 280 ; Australie.
[85] Puissance PV Très-court Classification CNN Aucun Images du ciel, irradiance ; 15 mn ; 1 Modèles d’évaluation
K-means +LSTM+ an ; 25 000 ; USA. de référence
ANN
[220] Rayonnement Court (1h, 1 à Suppression Embedding Algorithme d’élimina- Température, vitesse moyenne du Modèles d’évaluation
solaire global 3J) des valeurs clustering + tion à rebours vent, humidité relative moyenne, du- de référence
("Global solar aberrantes functional rée d’ensoleillement, GSR ; 1 J ; 22
radiation", DBN ans ; - ; Chine
GSR)
[221] Puissance PV Court (24h) Grey theory AGO + Aucun Puissance PV ; 1 mn ; 1 an ; 5760 ; Modèles d’évaluation
DBN+ FFNN Taiwan de référence, condi-
[202] Puissance PV Court (1J) Regroupement LSTM Aucun Puissance PV ; 15 mn ; 6 ans ; - ; USA Modèles d’évaluation
de données de référence
58
Thèse de doctorat
[203] Puissance PV Court (1J) Modification LSTM+ DGM Algorithme géné- Puissance PV, irradiance solaire, Modèles d’évaluation
de la réso- tique, Adam, dropout température de l’air, humidité rela- de référence, condi-
lution des tive, vitesse du vent, nuages, pres- tions météorologiques
données sion atmosphérique, type de temps ;
15 mn ; 1 an ; - ; Chine.
[222] Classification Court (1J) Augmentation GAN + CNN Adam, ReLU Rayonnement solaire ; 1 mn ; 1 an ; - ; Modèles d’évaluation
météorolo- des données USA de référence, condi-
gique pour la tions météorologiques

puissance PV
Tableau 1.8 – Résumé des méthodes de prévision dans lesquelles des modèles hybrides sont utilisés pour les énergies solaire
et éolienne ensemble
[164] Energies Eo- Court (6h) EMD EMD + Adam, RelU Distribution d’électricité renouve- Modèles d’évaluation
lienne et PV (LSTM, GRU, lable pendant 24 heures ; 1 h ; 1000 de référence
DNN) h ; - ; Corée du Sud
[165] Energies Eo- Moyen (7 EMD EMD + ReLU, dropout 21 J de demande et d’offre passés ; 1 Modèles d’évaluation
lienne et PV Jours) (LSTM, GRU, J ; 5 ans ; - ; Corée du Sud. de référence
DNN)
[191] Vitesse du Court (1 Jour) Aucun CNN+GRU ReLU, Adam, dro- Vitesse du vent, irradiance solaire ; Modèles d’évaluation
vent et rayon- pout 30 mn ; 1 an ; - ; Royaume-Uni de référence
nement solaire
59
1.4.3 Méthodes de prévision probabilistes
La prévision probabiliste vise à trouver les intervalles de prévision dans lesquels

se situent les valeurs réelles ou à attribuer une probabilité à un résultat de prévision.
La quantification de l’incertitude associée à la prévision de la puissance des énergies
renouvelables est essentielle pour aider à la planification et à la gestion des systèmes
électriques. Cela a incité les chercheurs à développer des modèles de prévision proba-
bilistes. Par exemple, Zhang et al. ont utilisé les résultats de leur modèle LSTM de
prévision de la puissance des éoliennes pour effectuer une analyse d’incertitude, dans
laquelle le modèle gaussien mixte est appliqué. Ce modèle fournit des prévisions pro-
babilistes sous forme d’intervalles de confiance. Les résultats montrent que le modèle
gaussien mixte est plus précis que deux méthodes d’analyse d’incertitude : Réseaux
neuronaux à densité de mélange et Machine vectorielle à pertinence. Dans [223],
Zhang et al. ont développé un modèle de prévision probabiliste directe de l’énergie
éolienne en utilisant un réseau de densité de mélange gaussien profond. Pour amé-
liorer le modèle, la distribution Beta est supposée et la fonction ReLU modifiée est
utilisée dans la couche de sortie. En outre, Zhu et al. [224] ont développé un modèle
pour la prévision probabiliste de la vitesse du vent, qui combine GPR et LSTM.
De même, Li et al. [150] ont utilisé la méthode d’estimation de la limite supérieure
inférieure ("Lower upper bound estimation" - LUBE) et le modèle LSTM pour la pré-
vision des intervalles de puissance éolienne, tandis que Wang et al. [225] ont utilisé
la même méthode avec une technique d’ensemble, dans laquelle les résultats de la
prévision ponctuelle sont utilisés pour construire les intervalles de prévision. La mé-
thode d’estimation de la limite supérieure inférieure est également utilisée dans [175].
Dans ce modèle hybride, les données de vitesse du vent, après avoir été décomposées
par la VMD, passent par le processus de granulation d’informations floues ("Fuzzy
Information Granulation", FIG), où elles sont divisées en trois composantes : mini-
mum, moyenne et maximum. Ensuite, ces trois composantes sont introduites dans un
ensemble de trois réseaux PSR (Phase Space Reconstruction) - GRU bidirectionnels
pour générer l’intervalle de prévision. Khodayar et al. [226] ont développé un modèle
de prévision probabiliste de la vitesse du vent basé sur l’apprentissage de la distri-
bution de probabilité d’intervalle. Leur modèle utilise des réseaux DBN d’intervalle
pour extraire les caractéristiques temporelles des séries chronologiques de la vitesse
du vent, ainsi qu’un système d’inférence flou de type 2 pour générer les valeurs de
prévision. De plus, Hu et al. [227] ont proposé un modèle de prévision de densité pour
la prévision de la vitesse et de la puissance du vent qui consiste en un réseau d’ap-

proximation de distribution, qui estime les fonctions de densité cumulative réelles

de la sortie de la prévision, et un réseau de prévision, qui prévoit les paramètres du
réseau précédent. D’autre part, Wu et al. [184] ont analysé l’erreur de leur modèle
hybride pour la prévision de la puissance éolienne et ont constaté qu’elle ne suit pas
la distribution bêta ou gaussienne. Ils ont donc décidé de supposer une distribution
empirique et de formuler un ensemble de conditions. Ils ont ensuite utilisé la méthode
de regroupement pour diviser l’ensemble des conditions et former la fonction de den-
sité de probabilité empirique de l’erreur, qui peut être utilisée pour estimer l’erreur.
En outre, QR est utilisé dans [85] dans le cadre des modèles hybrides développés.
De même. Liu et al. [200] ont utilisé le modèle de mélange de processus de Dirichlet
bivarié (BDPMM) dans le cadre de leur modèle hybride. L’entrée de ce modèle est
constituée des résidus de la prévision déterministe corrigée et la sortie est constituée
des résultats de la prévision probabiliste de l’hétéroscédasticité avec des distributions
non paramétriques. De plus, Zang et al. [171] ont appliqué l’apprentissage par trans-
fert à la prévision probabiliste en initialisant les paramètres des modèles CNN avec les
mêmes paramètres de prévision ponctuelle et en les réentraînant selon des fonctions
de perte quantile. Ensuite, les résultats sont fusionnés en utilisant l’estimation de la
densité du noyau. De plus, Khodayar et al. [228] ont développé un nouveau modèle
pour la prévision probabiliste spatio-temporelle de l’irradiation solaire. Les données
spatio-temporelles, collectées à partir de 75 sites solaires, sont modélisées sous la
forme d’un graphe où chaque nœud représente un site solaire, et chaque arête reflète
la corrélation entre les sites correspondants. Le modèle se compose d’un réseau ANN
d’extraction de caractéristiques de graphe convolutif, qui extrait les caractéristiques
spatio-temporelles des observations GHI, ainsi que d’un ANN encodeur et décodeur,
qui produit des échantillons tirés des densités de probabilité apprises à chaque nœud.
De plus, Liu et al. [229] ont d’abord construit une grille pour représenter les don-
nées PV et leurs informations d’emplacement. Ils ont ensuite développé un GRU
avec un opérateur convolutif pour extraire les caractéristiques spatio-temporelles de
cette grille. Ensuite, l’inférence bayésienne variationnelle est utilisée pour effectuer
la prévision probabiliste de l’irradiation solaire d’une région entière. Dans [192], ils
ont également utilisé l’inférence bayésienne variationnelle dans le cadre du modèle
proposé pour fournir des prévisions probabilistes à l’aide de l’estimation de la densité
du noyau. Le tableau 1.9 donne plus de détails sur les études mentionnées dans cette
section.

Thèse de doctorat
Tableau 1.9 – Résumé des méthodes de prévision dans lesquelles des modèles hybrides sont utilisés pour les prévisions
probabilistes
[111] Energie Eo- Court Normalisation LSTM+ Adam Vitesse et puissance du vent, don- Modèles d’évaluation
lienne des données Gaussian Mix- nées PNT ; 15 mn ; 3 M ; 3072 ; Chine de référence
ture
[223] Energie Eo- Court Normalisation Deep Gaus- Adam, SGD, batch Vitesse du vent, direction, vecteur, Modèles d’évaluation
lienne des données sian Mixture normalization puissance, ; 1 h ; 4 ans ; 18 757 ; Eu- de référence, temps de
Density Net- rope calcul
work
[224] Vitesse du Court (15 mn Normalisation Gaussian Semi-stochastic alter- Vitesse moyenne et maximale du Modèles d’évaluation
vent multi-pas à 60 mn) des données Process Re- nating GD vent, température, point de rosée, de référence
gression + humidité relative et spécifique, pres-
LSTM sion à la station et au niveau de
la mer, précipitations accumulées ; 1
mn ; 1 mois ; 2880 +2976 ; USA
[150] Energie Eo- Court (10 mn) Aucun LSTM RMSProp, RelU Énergie éolienne ; 10 mn ; 1 an ; - ; Modèles d’évaluation
lienne USA de référence
[230] Energie Eo- Court (15 mn WT WT+CNN SGD Énergie éolienne ; 5 mn, 15 mn ; 2 Modèles d’évaluation
lienne à 8h) ans ; - ; Chine de référence
[175] Vitesse du Court SSA+ VMD, SSA+ VMD+ Optimisation de l’es- Vitesse du vent ; 10 mn ; 2 mois ; Modèles d’évaluation
vent multi-pas FIG, PSR FIG+ PSR+ saim de poulets 8784 × 2 ; Chine de référence
bidirectional
GRU+ CSO
[226] Vitesse du Court (1h à MI DBN SGD, L2 regulariza- Vitesse du vent ; 10 mn ; 3 ans ; 52 Modèles d’évaluation
vent multi-pas 24h) tion 560 × 3 ; USA de référence
62
Thèse de doctorat
[227] Vitesse du Très court (5 Aucun Cumulative Grid search Puissance, vitesse et direction du Modèles d’évaluation
vent multi-pas mn) density func- vent ; 5 mn ; 3 ans, 12 ans ; - ; Aus- de référence
tions+ LSTM tralie, USA
[184] Energie Eo- Court (4h) Normalisation CNN +LSTM ReLU Puissance et vitesse du vent à 70 m, Modèles d’évaluation
lienne des données prévisions météorologiques ; 15 mn ; de référence
1 an ; - ; Chine
[225] Vitesse du Court (15 mn WT WT+ DBN+ SGD Vitesse du vent ; 1 h, 5 mn ; 2 ans ; Modèles d’évaluation
vent à 8h) QR - ; Chine, Australie de référence, condi-
[85] Puissance PV Court (15 mn WT WT+ DBN+ SGD Puissance PV ; 15 mn ; 1 an ; - ; Bel- Modèles d’évaluation
à 2h) QR gique de référence, condi-
[231] Vitesse du Court WPD WPD+ CNN Blocked cross valida- Vitesse du vent ; 1 mn ; - ; 4500 × 3 ; Modèles d’évaluation
vent tion Chine de référence
[171] Puissance PV Court (1 Jour) VMD+ EWT VMD+ Sigmoid & ReLU Production PV, vitesse du vent, Modèles d’évaluation
EWT+CNN+ température, humidité, GHI, DHI, de référence, fusion de
QR précipitations, type de temps réel et données
prévu ; 1 h ; 10 ans+2 mois ; 89 000 ;
Australie.
[228] Rayonnement Court (30mn à MI Convolutional SGD, ReLU Coordonnées des sites solaires, GHI ; Modèles d’évaluation
solaire spatio- 6h) Graph Au- 30 mn ; 19 ans ; - ; USA de référence
temporel toencoder
[192] Vitesse du Court (3h) Construction 3D CNN+ ReLU, dropout, L2 Vitesse et direction du vent, tempé- Modèles d’évaluation
vent spatio- de grilles GRU regularization, Adam, rature, pression atmosphérique, hu- de référence
temporelle grid search midité relative, point de rosée, pré-
cipitation ; 1 h ; 2 ans ; - ; USA
63
Thèse de doctorat
[229] Rayonnement Court (3h) Construction Convolutional Monte Carlo, Adam, GHI, Angle Zénith, température, Modèles d’évaluation
solaire spatio- de grilles GRU+ Va- ReLU, dropout, batch point de rosée, humidité relative, eau de référence
temporel riational normalization précipitable, vitesse et direction du
Bayesian infe- vent ; 1 h ; 2 ans ; 17 520 ; Chine.
rence
64
1.4.4 Orientations issues des discussions
Une revue des modèles de prévision basés sur l’apprentissage profond pour les
énergies éolienne et solaire a été présentée dans cette section. Les articles inclus dans
cette revue sont classés d’abord selon les méthodes déterministes et probabilistes,
puis, selon l’architecture profonde utilisée, en modèles basés sur le CNN, modèles
basés sur les RNN incluant le LSTM et le GRU, modèles basés sur le DBN et modèles
hybrides. L’analyse des travaux couverts est résumée comme suit :
• Données de prévision : dans certaines des études examinées, la prévision di-
recte est effectuée en utilisant les données historiques de production d’électricité
seules ou avec des données météorologiques, tandis que dans d’autres articles,
la prévision indirecte est effectuée en prédisant la vitesse du vent et le rayonne-
ment solaire en utilisant leurs valeurs historiques ou avec des données météorolo-
giques également. La plupart des chercheurs pensent que l’inclusion de données
météorologiques améliore la précision des prévisions. Cependant, la corrélation
entre ces caractéristiques et les résultats des prévisions diffère d’un endroit à
l’autre. Par conséquent, des études comparatives supplémentaires devraient être
menées pour montrer l’effet de l’inclusion de caractéristiques météorologiques
spécifiques sur les performances des modèles afin de tirer une conclusion à ce
sujet. De plus pour le développement des modèles de prévision régionaux, les
auteurs font usage d’images satellitaires ce qui limite souvent le déploiement
de ces modèles. Il serait intéressant donc de trouver une technique de prévision
basée sur l’utilisation des données météorologiques plus accessibles.
• Horizon de prévision : L’horizon de prévision est un facteur important qui dé-
termine le choix de la résolution des données ainsi que la structure du modèle.
Il peut être ultra-court, court, moyen ou long terme en fonction de l’application
ou du processus décisionnel que la prévision va soutenir. Il n’y a pas d’accord
sur la classification des horizons et les catégories peuvent se chevaucher. Cepen-
dant, une classification commune trouvée dans de nombreux articles considère
les prévisions de quelques secondes à 30 minutes comme très courtes, de 30 mi-
nutes à 6 heures comme courtes, de 6 heures à 1 jour comme moyennes, et tout
ce qui est au-delà comme long terme [161]. Les prévisions à très court terme
et à court terme aident les négociants en énergie et les gestionnaires de réseau
à prendre des décisions concernant la tarification de l’électricité, la répartition
économique de l’électricité et les programmes de maintenance. Par conséquent,
les prévisions à court et moyen terme soutiennent toute tâche liée à la gestion et

à l’exploitation du réseau, tandis que l’horizon à long terme est bénéfique pour
les tâches liées à la planification des systèmes énergétiques [232]. La plupart des
études incluses dans cette revue ont proposé des modèles de prévision pour les
prochaines 24 heures ou moins. Le soutien aux décisions liées à la gestion et à
l’exploitation des réseaux est le principal moteur de cette tendance. En outre,
la baisse de précision qui accompagne les horizons de prévision plus longs en
raison de la nature variable des conditions météorologiques, comme la couver-
ture nuageuse, décourage les chercheurs de les cibler. L’horizon le plus court
dans cette revue est de 10 s [187, 189] et l’horizon le plus long est d’un an [181].
Plus particulièrement pour des applications de gestion du réseau électrique les
horizons vont de quelques heures à quelques jours.
• Classement de la popularité des modèles : Récemment, les modèles hybrides
ont suscité un intérêt accru. Près de la moitié des articles publiés dans SCO-
PUS en 2022 concernent des modèles de prévision hybrides. Cette tendance
s’explique par la supériorité de ces modèles sur les modèles d’apprentissage
profond simples, comme le montrent toutes les expériences comparatives. Sur
ces modèles hybrides rencontrés, la majorité comprend des CNN, des LSTM ou
des GRU. Les RNN et toutes leurs nouvelles versions, telles que LSTM et GRU,
sont les modèles les plus populaires après les modèles hybrides, ce qui est logique
car les données sur les énergies renouvelables sont des séries temporelles, et les
modèles RNN sont connus pour leur capacité à extraire des caractéristiques
temporelles. C’est pourquoi les chercheurs les utilisent seuls ou en combinai-
son avec d’autres méthodes. La figure 1.7 montre le pourcentage d’utilisation
de chaque architecture d’apprentissage profond dans les articles publiés dans
SCOPUS en 2022 (pour la prévision des énergies éolienne et solaire).

Figure 1.7 – Modèles d’apprentissage profond pour la prévision des énergies solaire
et éolienne utilisés dans les publications de 2022 dans SCOPUS.
Le pourcentage est calculé sur la base du total des articles publiés cette année-
là. D’autre part, la figure 1.8 montre le nombre total d’articles publiés dans
SCOPUS de Janvier 2014 à Février 2023 pour chaque architecture de modèle
profond proposée pour la prévision de l’énergie éolienne et solaire.
Figure 1.8 – Architectures de modèles d’apprentissage profond pour la prévision des

énergies solaire et éolienne (par année : 2014-2023) (SCOPUS)

• Complexité du modèle : Bien que les performances des modèles hybrides soient
supérieures à celles des modèles simples, leur temps de calcul est relativement
élevé. Il faut donc trouver un compromis entre la précision du modèle, son temps
de calcul et sa complexité. L’existence de structures de big data et d’ordinateurs
à haute performance peut également influencer cette décision.
• Cas expérimentaux et évaluation : Pour tenir compte des différentes condi-
tions météorologiques et des saisons, les chercheurs divisent les ensembles de
données et entraînent le modèle plusieurs fois, par exemple pour chaque saison,
ou ils ajoutent le type de temps comme entrée pour entraîner le modèle. En
outre, certaines simulations prévoient de tester le modèle à l’aide d’ensembles
de données collectés à différents endroits afin de montrer la capacité de générali-
sation du modèle. Cependant, les chercheurs envisagent rarement d’utiliser des
ensembles de données collectées dans des climats différents ou de comparer les
performances du modèle avec et sans l’utilisation de données météorologiques
dans le cas d’une prévision directe. Ces deux lacunes devraient être prises en
compte dans les études futures.
• Prévision multipas : plusieurs études publiées en 2022 ont proposé des modèles
de prévision multipas. Il existe deux approches pour la prévision à plusieurs
étapes : l’approche récursive et l’approche directe. Dans l’approche récursive,
la première valeur prévue est utilisée comme entrée de l’étape suivante et ainsi
de suite, ce qui entraîne l’accumulation de l’erreur. D’autre part, l’approche
directe peut être mise en œuvre de deux manières : construire des modèles sé-
parés pour chaque étape de prévision ou construire un modèle qui peut prendre
plusieurs entrées et générer plusieurs sorties de prévision. Cette dernière est ap-
pelée la méthode séquence à séquence, qui nécessite moins de temps de calcul
et constitue la tendance future.
• Modèles généraux : Il n’est pas possible de construire un modèle de prévision
pour chaque lieu. Quelques études ont proposé des modèles de prévision pour
une région entière et d’autres études ont suggéré l’apprentissage par transfert
comme une solution pour gagner du temps où les modèles développés précé-
demment peuvent être rapidement entraînés pour faire une prévision pour de
nouveaux lieux. Il serait donc intéressant de penser à l’avenir développer des
modèles de prévision régionaux capables de prévoir pour différents points sans
avoir besoin d’être entraînés à nouveau.
• Mise en œuvre : L’entraînement de modèles d’apprentissage profond pour trou-

ver la solution optimale reste un processus difficile et long, surtout en l’absence

de règles d’orientation pour la structure des modèles et la sélection des pa-
ramètres. Le choix est généralement dicté par la nature des données et les
connaissances préalables des chercheurs dans ce domaine. Dans la plupart des
cas, les chercheurs s’appuient sur des essais et des erreurs pour trouver des so-
lutions quasi-optimales. Cependant, dans certaines études, il a été mentionné
l’utilisation d’algorithmes et de méthodes d’optimisation pour le réglage des
hyperparamètres et la prévention de problèmes, tels que l’overfitting et le un-
derfitting. Il convient de préciser que de telles méthodes ont pu être utilisées
dans les études incluses dans cette revue, mais ne sont pas mentionnées spéci-
fiquement.
1.5 Méthodes d’évaluation et de comparaison
Pour comparer deux différentes techniques de prévision il est nécessaire de dispo-

ser de bonnes métriques applicables aux deux techniques. Les méthodes d’estimation
des puissances PV et éolienne peuvent être comparées sous différents aspects, tels
que la précision, les caractéristiques d’entrée, le temps de calcul, etc. Dans cette sec-
tion, les facteurs d’évaluation et de comparaison rencontrés dans la littérature sont
présentés.
1.5.1 Précision
La précision de la prévision est le facteur le plus important pour comparer les

différentes méthodes de prévision, qui peut être déterminé par une certaine métrique
d’évaluation. Habituellement, des niveaux sont fournis pour ces facteurs d’évaluation
dans différents systèmes, sur la base desquels il est possible de s’assurer que le modèle
a une précision suffisante. Par exemple, dans certaines références, il a été mentionné
que le taux de RMSE devrait se situer dans les 10% de la capacité installée pour la
plupart des modèles. En Chine, la State Grid Corporation a défini un taux de RMSE
maximum acceptable de 20 % pour la prévision de l’énergie éolienne à court terme
et de 15 % pour la valeur prévue 4 heures à l’avance. Les méthodes présentant une
erreur quadratique moyenne plus élevée ne permettent pas d’obtenir les performances
requises. En Irlande, les gestionnaires du système (EirGrid et SONI) exigent une
précision cible de 6-8% [233].
Les trois mesures courantes pour les prévisions déterministes sont l’erreur quadra-

tique moyenne ("Root Mean Square Error", RMSE), l’erreur absolue moyenne ("Mean
Absolute Error", MAE) et l’erreur absolue moyenne en pourcentage ("Mean Abso-
lute Percentage Error", MAPE). Le coefficient de détermination (R2) et l’écart-type
d’erreur ("Standard Deviation of Error", SDE) sont également fréquemment utilisés.
D’autre part, les résultats des prévisions probabilistes sont généralement rapportés
à l’aide de l’erreur de couverture moyenne ("Average Coverage Error"), ACM), du
score de probabilité du classement continu ("Continuous Ranking Probability Score",
CRPS) et de la netteté de l’intervalle ("interval sharpness", IS).
Dans [90], le SDE est utilisé pour mesurer la stabilité du modèle de prévision
tandis que le MAE, le MAPE et le RMSE sont utilisés pour mesurer la précision.
Dans [171], Zang et al. ont utilisé huit fonctions de perte pour mettre à jour les
paramètres des couches convolutives : l’erreur quadratique moyenne, la MAE, l’er-
reur logarithmique quadratique moyenne, l’erreur absolue moyenne mise à l’échelle,
l’indice négatif d’accord, la statistique U de Theil 1, la statistique U de Theil 2 et
l’erreur moyenne de Huber. Toutes ces mesures ont été utilisées pour rendre compte
des résultats de la prévision déterministe. En revanche, pour la prévision probabiliste,
ils ont utilisé trois métriques : l’ACE, l’IS et la perte de flipper. Dans [227], pour
le modèle de prévision probabiliste proposé, l’écart de proportion moyen est utilisé
pour mesurer la fiabilité du modèle tandis que la largeur moyenne des intervalles de
prévision est utilisée pour mesurer sa précision. Le score de compétence est également
utilisé pour présenter les deux mesures en une seule valeur. Parfois, les chercheurs
utilisent le critère de promotion du pourcentage d’erreur pour comparer les perfor-
mances de deux modèles et montrer le degré d’amélioration, comme le PMAE, le
PMAPE et le PRMSE. De même, la MAE normalisée et la RMSE normalisée sont
utilisées dans [212, 234] et [183]. Dans [184], pour comparer les résultats de la pré-
vision probabiliste, la valeur moyenne des scores de compétence d’intervalle de tous
les intervalles de prévision est utilisée en plus de l’ACE, tandis que dans [200], la
probabilité de couverture de l’intervalle de prévision, la largeur moyenne normalisée
de l’intervalle de prévision et le critère basé sur la largeur de couverture sont utilisés.
1.5.2 Modèles de référence
Pour valider la supériorité des modèles de prévision, les chercheurs comparent

généralement les performances du modèle d’apprentissage profond proposé avec le
modèle Persistence d’abord, parce qu’il s’agit du modèle de référence, puis avec
d’autres modèles d’apprentissage automatique, tels que SVR, RF, DT et ELM, en

plus des réseaux neuronaux peu profonds, tels que MLP et FFNN, ou des méthodes
statistiques, telles que ARMA, ARIMA et SARIMA. Cependant, ils incluent parfois
des modèles physiques dans la comparaison, comme c’est le cas dans [170, 235] et
[171]. Dans [220], le modèle proposé a été comparé à trois modèles empiriques, le
modèle SVR, le modèle GPR, le modèle ANFIS, le modèle DBN et les modèles DBN
fonctionnels. Le modèle proposé obtient les meilleures performances en moyenne pour
tous les lieux et horizons de prévision.
1.5.3 Pas de temps d’entrée
L’influence des différents pas de temps d’entrée ou de la séquence temporelle sur la

précision de la prévision n’est examinée que dans quelques études. Par exemple, dans
[169], Wang et al. ont étudié l’effet de différentes séquences d’entrée sur la précision
de leur modèle de prévision de la puissance PV. Ils ont entraîné leur modèle avec
des séquences d’entrée allant de 0,5 an à 4 ans. Ils ont constaté que la plus grande
précision est obtenue avec 3 ans de données. Dans [163], Dolatabadi et al. ont comparé
la performance de leur modèle hybride avec différents vecteurs d’entrée et ont trouvé
que le meilleur résultat était obtenu avec une dimension d’intégration égale à 7 et
un délai d’intégration égal à 18.
1.5.4 Résolution des données
L’effet de différentes résolutions de données ou fréquences d’échantillonnage est

étudié dans de nombreux articles. Dans [179], Lee et al. ont expérimenté différents
intervalles de données allant de 1 heure à 6 heures. Ils ont constaté que le modèle de
prévision de l’énergie solaire atteint la plus grande précision en divisant la séquence
d’entrée d’un jour par 1 heure plutôt qu’en utilisant des intervalles plus longs. Dans
[146], Sharadga et al. ont comparé l’effet de l’utilisation des données de résolution de
15 minutes et des données après le calcul de la moyenne à une résolution d’une heure
sur la précision du modèle. Ils ont constaté que la prévision de leur modèle s’est amé-
liorée avec les données horaires. Toujours dans [144], Pang et al. ont étudié l’impact
de différentes résolutions de données sur les résultats de la prévision du rayonne-
ment solaire (c’est-à-dire 10 minutes, une demi-heure et une heure). Ils ont constaté
que la précision du modèle s’améliore lorsque la résolution des données augmente.
Dans [195], une résolution de données d’une heure et une résolution de données d’un
jour ont été utilisées pour la prévision suivante de 24 heures. Les résultats montrent
que la performance du modèle proposé avec un intervalle de données d’un jour s’est

améliorée.
1.5.5 Fusion de données
L’impact de l’utilisation de données météorologiques en plus des données de puis-

sance sur la précision du modèle est analysé dans certaines études. Dans [179], Lee et
al. ont étudié l’effet de l’utilisation d’informations météorologiques en plus des don-
nées de puissance PV comme entrées sur la précision du modèle qu’ils proposent. Les
résultats montrent que cela a permis au modèle d’atteindre la plus grande précision
par rapport aux neuf autres algorithmes inclus dans les expériences.
1.5.6 Temps de calcul
Le temps de calcul des prévisions (temps requis pour la formation/l’apprentissage)

est considéré comme un autre facteur important pour la sélection de modèles de pré-
vision appropriés, en particulier pour les prévisions à court terme. Il est également
utile de comprendre si le modèle peut être appliqué en temps réel. Par exemple,
l’approche proposée par Marcos et al. [236], qui nécessitait un temps de calcul d’en-
viron 60-70 minutes pour chaque simulation de 72 heures du modèle NWP, a prouvé
qu’elle pouvait être utilisée en temps réel pour l’exploitation du système électrique.
Le temps de calcul dépend des méthodes utilisées, de la précision requise, du volume
et du taux d’échantillonnage des données d’entrée, de l’ordinateur utilisé, etc. Il dé-
pend également de l’algorithme d’apprentissage. Par exemple, comme l’ont expliqué
Zhao et al. [117], le moteur d’apprentissage extrême ("Extreme Learning Machine" -
ELM) avec un réseau neuronal de type feed-forward est plus rapide que les réseaux
basés sur l’algorithme de rétropropagation.
Singh et al. [237] ont montré que la formation et le test des données d’entrée
de deux mois avec un taux d’échantillonnage de 10 minutes pour le réseau MLP
proposé pouvaient être terminés en 30 minutes sur un ordinateur Pentium 150 MHz.
Les auteurs ont également affirmé que l’utilisation d’un réseau neuronal distinct pour
chaque éolienne plutôt que pour le parc éolien garantit une formation rapide, car la
taille et la complexité du réseau seront réduites. Un autre avantage de ce schéma est
que les modèles séparés ne seront pas affectés par les turbines hors ligne.
Lin et Liu [93], dans un effort de réduction du temps de calcul, ont supprimé des
caractéristiques influentes mineures dans le modèle proposé, notamment la tempéra-
ture de l’air, l’orientation de la nacelle et l’erreur de lacet. Même si cette réduction
n’a entraîné qu’une faible économie de temps de traitement (0,77 min) pour une seule

éolienne, le temps de simulation économisé peut être pris en compte dans le cas d’un
parc éolien typique comprenant plus de 100 éoliennes.
Pour aider à trouver un compromis entre la précision du modèle et sa complexité
de calcul, le temps d’exécution du modèle proposé est indiqué et comparé au temps
d’exécution de modèles comparatifs dans de nombreux articles. Cette pratique cou-
rante est suivie dans [139, 146, 238] et [216] pour montrer la faisabilité du modèle
proposé. Dans [156], trois modèles hybrides ont été comparés en termes de temps de
calcul. Dans les trois modèles, la WT est la technique de décomposition et le SVM
est le modèle de régression, mais pour l’extraction de caractéristiques, on utilise soit
le RNN, soit le LSTM, soit le GRU. Par ordre d’importance des modèles en termes
de temps de calcul, le RNN arrive en premier, suivi du GRU, puis du LSTM. Ce-
pendant, ils ont tous pris un temps relativement long pour l’entraînement, allant de
211 à 571 s. Dans [186], un modèle LSTM, un modèle CNN et un modèle hybride
CNN et LSTM ont été comparés en termes de temps d’entraînement. Il s’avère que le
LSTM est le plus rapide alors que le modèle hybride est le plus long. Yu et al. dans
[196] ont comparé la vitesse de convergence de leur modèle LSTM amélioré et du
modèle LSTM traditionnel. Dans [160], il est rapporté que le temps CPU du modèle
hybride de WSTD et GRU est au moins 20 fois plus rapide que celui du modèle
hybride de WSTD, LSTM, et GRU. Dans [211], le temps de formation en ligne du
modèle proposé est montré pour différentes tailles de graphes. On note que le temps
d’apprentissage augmente lorsque l’horizon de prévision est étendu car des horizons
plus longs impliquent des graphes plus grands avec plus de nœuds. Le temps de calcul
du modèle ANN et du modèle RNN a été comparé dans [144]. Les résultats montrent
que le temps de calcul du modèle RNN est significativement plus long que celui du
modèle ANN dans tous les scénarii. Dans [178], le temps d’exécution moyen du mo-
dèle hybride proposé est d’environ 153 s. Dans [93], le temps CPU avant et après
réduction de certaines variables d’entrée est comparé. Le temps d’exécution total en
minutes pour tous les modèles comparatifs est fourni dans [192]. Selon les résultats,
le modèle hybride de CNN et GRU nécessite 83 minutes de temps d’exécution. Dans
[209], le temps d’exécution du modèle hybride proposé avec les quatre ensembles de
données est fourni, il varie de 194 s à 211 s. Dans [239], le temps d’exécution du mo-
dèle hybride proposé est de 155 s tandis que dans [220], il est de 382 s. Dans [189],
le temps de calcul a été calculé pour différentes tailles d’entrée. Avec 15 entrées (pas
de temps), le temps de calcul était inférieur à une demi-seconde, ce qui montre la
faisabilité du modèle pour les applications en temps réel.

Conclusion partielle
Les énergies renouvelables et l’apprentissage profond sont considérés comme les

technologies les plus essentielles et les plus prometteuses pour l’avenir. L’utilisation
de l’apprentissage profond pour la prévision des énergies renouvelables s’est révélée
très prometteuse, comme en témoignent par exemple la richesse des méthodes propo-
sées et le nombre croissant de publications. Ce chapitre passe en revue les recherches
sur les prévisions de l’énergie solaire et éolienne basées sur l’apprentissage profond
et publiées au cours des dix dernières années. Il examine en détail les données et les
ensembles de données utilisés dans les travaux examinés, les méthodes déterministes
et probabilistes, ainsi que les méthodes d’évaluation et de comparaison. Les prin-
cipales caractéristiques de tous les travaux examinés sont résumées sous forme de
tableaux afin de permettre des comparaisons méthodologiques. Une large taxonomie
de la recherche est proposée. Les tendances et orientations futures de la recherche
identifiées comprennent des études sur les effets de l’inclusion de caractéristiques
météorologiques spécifiques sur les performances des modèles, la généralisation ou
l’utilisabilité des modèles proposés dans différents lieux, conditions météorologiques
et saisons, la prévision à plusieurs étapes, la prévision probabiliste, les méthodes
d’optimisation auto-adaptatives, et d’autres encore.

CHAPITRE 2
Technique de modélisation et de prévision

développée


Technique de modélisation et de prévision développée
Introduction
Après un tour dans la littérature afin de cerner les différents contours du sujet,
dans ce chapitre la technique de modélisation et de prévision proposée est développée
en détaillant étape par étape la méthodologie.
2.1 Présentation du diagramme de recherche
Notre objectif principal étant de développer un outil d’identification des périodes

de production optimale et de prévision de la variabilité de la puissance de sortie d’un
système photovoltaïque et/ou éolien installé à un point géographique quelconque
situé à l’intérieur d’une très grande zone, le diagramme de recherche suivi est présenté
à la Figure 2.1.
Ce diagramme découle de quelques questions successives de recherche que sont :
• quels sont les paramètres d’influence des variabilités des puissances de sortie de
ces systèmes (solaire photovoltaïque et éolienne) ?
• à partir des variations de ces paramètres, comment identifier pour une large
superficie et plus particulièrement un site donné les périodes de production et
d’exploitation optimale de ces systèmes ?
• dans ces périodes de productions optimales, comment avoir une idée des évolu-
tions futures des productivités de ces systèmes ?
Comme le montre la figure 2.1, les premières étapes sont celles d’identification
d’une technique de prévision adaptée à notre cas d’étude ainsi que des paramètres qui
rendent les variations des puissances de sortie des systèmes PV et éolienne aléatoires.
L’idée ici est alors de maîtriser les variations de ces paramètres afin de maîtriser celles
des puissances de sortie. Après ces deux premières étapes, la zone d’étude définie
est alors quadrillée puis échantillonnée afin de récupérer un nombre d’échantillons
représentatifs pour lesquels les données des paramètres d’influence sont acquises sur
une certaine période d’étude bien définie. Une fois ces échantillons obtenus, la zone
d’étude est découpée en sous-zones composées d’échantillons (points géographiques)
pour lesquels tous les paramètres d’influence identifiés varient sur la période d’étude
identiquement ou presque.

Figure 2.1 – Diagramme de recherche

Ces sous-zones formées, il est alors possible de prendre un échantillon par sous-
zone comme représentant de tous les échantillons de celle-ci : l’étude des variabilités
des paramètres d’influence sur toute la zone d’étude se résume alors à étudier les
variabilités de ces paramètres pour les échantillons retenus par sous-zones. A l’aide
des données de ces échantillons retenus, chaque sous-zone est ensuite caractérisée :
il est recherché à cette étape les comportements probables des différents systèmes
(PV, Éolienne, PV/Éolienne) dans chaque sous-zone puis les périodes de production
optimale. Ces périodes de production optimale correspondent alors aux périodes dont
les données sont utilisées pour développer les modèles de prévision : il est inutile de
développer des modèles de prévision capables de faire des prévisions pour des périodes
où les systèmes ne seraient pas vraiment exploités. Toutes ces étapes conduisent alors
à:
• la connaissance du/des système(s) adapté(s) à chaque sous-zone ainsi que les

périodes de production optimale ;
• un développement pour chaque échantillon retenu par sous-zone d’un modèle

de prévision adapté. Ce modèle est donc exploitable ensuite pour tous les autres
échantillons de la même sous-zone et donc pour la sous-zone entière.
Les sections qui suivent décrivent en profondeur la méthodologie adoptée.
2.2 Choix d’une technique de prévision
Le choix d’une technique adaptée pour une tâche de prévision est importante
pour l’atteinte des objectifs visés. Deux principales méthodes sont utilisées pour les
prévisions PV et éolienne : la méthode directe et la méthode indirecte.
La figure 2.2 présente le principe de la prévision directe. Pour ce type de prévi-
sion, des observations passées de la puissance sont utilisées pour estimer ses valeurs
futures en se basant sur les données de puissance enregistrées pendant la période
d’exploitation du système. Pour cela, un modèle d’apprentissage automatique est
entraîné avec l’historique des données de puissance puis lorsque l’entraînement est
réussi, est utilisé pour effectuer les prévisions. Cette technique a l’avantage d’être
simple en terme d’architecture et en temps de calcul mais n’est appliquée que pour
des systèmes déjà installés et exploités. De plus le modèle de prévision doit être
reconstruit lorsque le système ou le site d’installation change. Ce type de prévision

peut s’avérer compliqué comme indiqué dans la littérature car prenant en compte
indirectement l’architecture des systèmes concernés.
Figure 2.2 – Technique de prévision directe
Les figures 2.3 et 2.4 présentent les deux principes utilisés pour la prévision in-
directe. Ces techniques font un lien indirect entre les paramètres météorologiques
d’influence de la puissance de sortie et celles-ci.
Figure 2.3 – Technique de prévision indirecte 1
Le principe présenté à la figure 2.3 associe un modèle d’apprentissage automa-

tique et un modèle de régression. Le modèle d’apprentissage automatique permet à
partir d’observations passées des paramètres météorologiques d’influence d’en esti-
mer des valeurs futures. Ces valeurs prévues sont ensuite exploitées pour estimer les
puissances correspondantes à partir d’un modèle de régression construit à partir d’un
historique de données de puissance et des paramètres d’influence. Cette technique a
l’avantage de prendre en compte les évolutions des paramètres météorologiques du
site d’installation mais présente une architecture complexe et n’est applicable que

pour des systèmes existants. Donc le modèle doit aussi être reconstruit entièrement
lorsque la configuration du système change.
Figure 2.4 – Technique de prévision indirecte 2
La troisième possibilité présentée à la figure 2.4 utilise aussi un modèle d’appren-

tissage automatique pour faire la prévision des paramètres d’influence mais estime les
puissances associées à celles-ci à l’aide d’un modèle mathématique du système. Cette
technique impose les paramètres d’influence à prendre en compte car ils doivent
correspondre aux entrées des modèles mathématiques d’estimation de puissance à
utiliser. Elle présente l’avantage d’être plus flexible car pour un même site le modèle
n’a pas besoin d’être entraîné à nouveau : il suffit juste de modifier les paramètres du
système dans les modèles mathématiques. Néanmoins il faut préciser que les modèles
mathématiques d’estimation de puissance peuvent aussi présenter des erreurs d’esti-
mation. Cette technique est la seule pour laquelle il n’y a pas nécessité de disposer
d’un système existant et donc d’un historique des données de puissance. C’est elle
qui est donc retenue pour l’étude.
2.3 Définition de la zone d’étude
Une fois une technique de prévision identifiée, la zone d’étude à laquelle elle doit
être appliquée doit être définie. Bien que les espaces géographiques aient rarement des
formes régulières, pour décrire la méthodologie, une zone d’étude régulière de forme
rectangulaire est définie et délimitée par quatre points A, B, C et D de longitudes
respectives LA , LB , LC , LD et de latitudes respectives lA , lB , lC et lD (Figure 2.5).

2.4 Quadrillage et échantillonnage de la zone d’étude
Une fois la zone d’étude définie, elle est quadrillée puis échantillonnée. Comme le
montre la figure 2.5, sont définis un pas de quadrillage ∆t en longitude comme en
latitude et deux types d’échantillons : ceux en bleu et ceux en rouge. Les échantillons
représentent ici des points géographiques appartenant à la zone d’étude. Ceux en
bleu sont exploités lors de l’étude et ceux en rouge sont utilisés après l’étude pour
vérifier l’applicabilité des résultats sur tous points géographiques de la zone d’étude.
Ainsi un pas d’échantillonnage ∆t sépare deux échantillons ’bleus’ en latitude ou
en longitude ainsi que deux échantillons ’rouges’. Un pas ∆t optimal permet donc
de définir un nombre d’échantillons vraiment représentatif de toute la zone d’étude.
Plus loin dans ce chapitre, il sera présenté la technique d’optimisation du pas ∆t
utilisée.
Figure 2.5 – Technique de quadrillage et d’échantillonnage

2.5 Acquisition et traitement des données
Une fois les échantillons obtenus, il faut à présent acquérir les données d’étude
(paramètres météorologiques) puis les traiter pour qu’elles soient exploitables. La
technique de prévision retenue (figure 2.4) impose de faire la prévision de paramètres
météorologiques puis d’estimer les puissances en sortie à base de celles-ci. Il faut donc
à priori les identifier.
2.5.1 Identification des paramètres météorologiques d’influence
Comme mentionné dans le chapitre 1 à la sous-section 1.2.3, les variables corrélées

avec la puissance PV sont l’irradiation solaire, la température de l’air, le point de
rosée, l’humidité relative et le type de nuage et celles corrélées avec la puissance
éolienne sont la vitesse du vent, la pression atmosphérique, la température ambiante.
Il faut noter que pour la puissance éolienne, la direction du vent est ajoutée pour
une orientation optimale des pales. De toutes ces variables,ne sont retenues que
celles qu’imposent les modèles d’estimation de puissance à utiliser. La plupart des
modèles d’estimation de la puissance PV utilisent en entrée l’irradiation globale sur
plan des panneaux ainsi que la température ambiante [240–242]. Pour l’estimation
de la puissance éolienne, les modèles de courbes de puissance existants exploitent
majoritairement uniquement la vitesse du vent [243, 244].
Ainsi, de toutes ces variables d’influence sus-mentionnées, ne sont retenues que
l’irradiation globale, la température, la vitesse et la direction du vent pour le déve-
loppement des modèles de prévision.
2.5.2 Acquisition des données
Une fois les paramètres recensés, une base de données pouvant fournir les données
relatives à ceux-ci pour tous les échantillons est identifiée. Pour nos travaux, la base
de données POWER | Data Access Viewer de la NASA a été identifiée et exploitée
[245]. Les informations relatives aux données qui y sont téléchargées sont présentées
ci-dessous :
• Période : 1er Janvier 2012 au 31 Décembre 2021 ;
• Satellite : MERRA-2 ;
◦ ◦
• Résolution : 12 × 58 latitude/longitude ;
• Longitude : de LA à LB par pas de ∆t 2 ;
• Latitude : de lA à lD par pas de 2 ;
∆t

• Pas des données : horaire ;

• Paramètres :
• Temperature2M : Température à 2 mètres du sol en (°C) ;
• Irradiation : Irradiation de l’ensemble du ciel en (MJ/h) ;
• Vitesse50M : Vitesse du vent à 50 mètres du sol en (m/s) ;
• Direction50M : Direction du vent à 50 mètres du sol en (◦ ) ;
2.5.3 Traitement des données
Pour obtenir des modèles de prévision de bonnes performances, les données d’en-
trée doivent la plupart du temps être pré-traitées. Cette étape est la plus importante
et constitue généralement la plus grande partie d’une tâche de prévision car un mo-
dèle de prévision ne tire les informations que des données qu’on lui présente [246–248].
Dans cette sous-section, sont présentées les différentes méthodes de prétraitement des
données d’entrée pour les prévisions PV et Eolienne puis celles retenues dans notre
méthodologie.
Le prétraitement des données est un processus qui consiste à préparer les données
brutes et à les rendre adaptées à un modèle d’apprentissage automatique. Il s’agit de
la première étape cruciale de la création d’un modèle d’apprentissage automatique
(Figure 2.6).
Lors d’un projet d’apprentissage automatique, il n’est pas toujours possible de
trouver des données propres et formatées. Et lorsqu’on effectue une opération avec
des données, il est obligatoire de les nettoyer et de les mettre en forme. Les étapes
utilisées dans le prétraitement des données sont les suivantes :
1. Profilage des données. Le profilage des données est le processus d’examen,
d’analyse et de révision des données afin de recueillir des statistiques sur leur
qualité. Il commence par une étude des données existantes et de leurs caracté-
ristiques. Les spécialistes des données identifient les ensembles de données qui
sont pertinents pour le problème à résoudre, inventorient leurs attributs impor-
tants et formulent une hypothèse sur les caractéristiques qui pourraient être
pertinentes pour la tâche d’analyse ou d’apprentissage automatique proposée.
Ils établissent également un lien entre les sources de données et les concepts
commerciaux pertinents et examinent quelles bibliothèques de prétraitement
pourraient être utilisées.
2. Nettoyage des données. Le nettoyage des données est particulièrement effectué
dans le cadre du prétraitement des données pour nettoyer les données en rem-

Figure 2.6 – Étapes de création d’un modèle d’apprentissage automatique
plissant les valeurs manquantes, en filtrant les données parasites, en résolvant

les incohérences et en supprimant les valeurs aberrantes.
3. Réduction des données. Les ensembles de données brutes comprennent souvent
des données redondantes qui proviennent de la caractérisation des phénomènes
de différentes manières ou des données qui ne sont pas pertinentes pour une
tâche particulière d’apprentissage automatique ou d’analyse. La réduction des
données utilise des techniques telles que l’analyse en composantes principales
pour transformer les données brutes en une forme plus simple adaptée à des
cas d’utilisation particuliers.
4. Transformation des données. Ici, les scientifiques des données réfléchissent à la
façon dont les différents aspects des données doivent être organisés pour avoir
le plus de sens possible pour l’objectif. Cela peut inclure la structuration de
données non structurées, la combinaison de variables saillantes lorsque cela a
du sens ou l’identification de plages importantes sur lesquelles se concentrer.
5. Enrichissement des données. Au cours de cette étape, les scientifiques des don-
nées appliquent les diverses bibliothèques d’ingénierie des fonctionnalités aux

données pour effectuer les transformations souhaitées. Le résultat doit être un

ensemble de données organisé de manière à obtenir un équilibre optimal entre
le temps de formation d’un nouveau modèle et les calculs nécessaires.
6. Validation des données. À ce stade, les données sont divisées en deux ensembles.
Le premier ensemble est utilisé pour former un modèle d’apprentissage automa-
tique ou d’apprentissage profond. Le second ensemble est constitué des données
de test qui sont utilisées pour évaluer la précision et la robustesse du modèle
résultant.
2.5.3.1 Stratégies de traitement des données dans les modèles de prévision de la

puissance PV
La qualité des données d’entrée est cruciale pour des prévisions précises et fiables.
De nombreux projets de recherche ont utilisé des données historiques de séries tem-
porelles de la production photovoltaïque ainsi que des informations météorologiques
sur des centrales électriques spécifiques et leurs emplacements géographiques à des
fins de modélisation. Cependant, ces ensembles de données comportent souvent des
éléments statiques intermittents ou des pics causés par les variations météorologiques
ou saisonnières, les fluctuations de la demande d’électricité et les défaillances du sys-
tème électrique. Il s’agit de valeurs aberrantes qui ne suivent aucune tendance, sont
influencées par des événements fortuits et affectent considérablement les prévisions.
En outre, les données peuvent parfois être corrompues ou manquantes en raison de
défauts des capteurs ou d’enregistrements erronés. Par conséquent, il est impéra-
tif de prétraiter les données d’entrée déformées en les reconstruisant à l’aide de la
décomposition, de l’interpolation ou des ajustements saisonniers [249] (c’est-à-dire
le nettoyage des données et le changement de structure). Pour ce faire, plusieurs
techniques sont mentionnées dans la littérature existante, telles que la transformée
en ondelettes ("Wavelet Transform" - WT), la décomposition en mode empirique,
la normalisation et l’analyse du spectre singulier [250], chacune ayant ses propres
forces et faiblesses. Reikard [251] a utilisé un outil statistique pour éliminer la ten-
dance saisonnière des données d’irradiation solaire. Son étude a démontré un taux
d’apprentissage modifié avec une précision de prédiction améliorée pour le modèle
développé. De même, Baig, et al. [252] et Kaplanis [253] ont utilisé une technique de
tendance pour l’ensemble des données d’irradiation solaire car il est assez compliqué
de déterminer précisément la tendance du rayonnement solaire quotidien en raison du
comportement météorologique quotidien. Dans [254], Boland a trouvé une faible er-

reur de prédiction pour le modèle périodique de l’ensemble des données d’irradiation

solaire en utilisant la Transformation en Série de Fourier (TSF).
Actuellement, parmi les techniques de prétraitement des données, la normalisation
et la transformée en ondelettes sont largement utilisées car elles peuvent convertir
de grandes données d’entrée en une gamme plus petite, améliorant ainsi les perfor-
mances de calcul. Dans la normalisation, un grand nombre de données est comprimé
et transformé en une plage plus petite. Les données condensées sont confinées entre 0
et 1 pour limiter l’erreur de régression et maintenir la corrélation entre les ensembles
de données. Alomari et al. [255] ont appliqué la normalisation à leurs données pour
développer des modèles de prévision de la puissance PV pour 24h. Ils affirment que
la normalisation a permis d’obtenir des données homogènes et des expériences d’ap-
prentissage automatique fiables. En outre, le filtrage et l’association des données ont
été utilisés pour les données météorologiques et de puissance PV. Ce prétraitement a
permis de filtrer toutes les données météorologiques dont la valeur de puissance PV
associée est manquante ou tout enregistrement de puissance PV dont les données
météorologiques sont manquantes [222] :
1. Un rayonnement solaire négatif et des valeurs de production associées man-

quantes sont souvent observés en début et en fin de journée, en raison du dé-
calage des capteurs de rayonnement solaire et des défaillances de l’onduleur,
respectivement. Il est recommandé de définir les valeurs de rayonnement et de
production PV à zéro (0).
2. Les données manquantes de rayonnement solaire, de température et de puis-
sance de sortie, en milieu de journée, peuvent provenir d’un dysfonctionnement
des capteurs de rayonnement solaire et de température, et de perturbations de
l’onduleur ou du réseau, respectivement. L’étape recommandée est d’exclure
ces données de l’analyse.
3. La normalisation des données [plage : 0, 1] augmente la vitesse de calcul, pré-
serve les corrélations d’entrée et assure une convergence rapide des Réseaux de
Neurones Artificiels [256].
2.5.3.2 Stratégies de traitement des données dans les modèles de prévision de la

puissance Eolienne
Un résumé graphique des techniques de traitement de données pour la prévision

de la puissance éolienne est présenté à la Figure 2.11. Sept catégories de méthodes de

traitement des données ont été recensées :la décomposition, la sélection des caracté-
ristiques, l’extraction des caractéristiques, le débruitage, la modélisation des erreurs
résiduelles, la détection des aberrations et la correction basée sur les filtres. Elles
sont adoptées dans les modèles de prévision à des fins différentes. En général, la dé-
composition est adoptée pour transformer la série originale en plusieurs sous-séries
relativement stationnaires, de manière à réduire la difficulté de la prévision. La sélec-
tion et l’extraction de caractéristiques sont utilisées pour réduire la dimensionnalité.
Et les quatre autres méthodes sont employées pour corriger les ensembles de données
d’entrée ou les résultats de la prévision.
Figure 2.7 – Résumé graphique des techniques de traitement de données pour la

prévision de la puissance éolienne
2.5.3.2.1 Décomposition des données

Ces dernières années, plus de 100 articles de recherche ont porté sur les modèles
hybrides basés sur la décomposition [257, 258]. Dans la littérature publiée, les modèles
hybrides basés sur la décomposition adoptent fondamentalement le même cadre, que
l’on peut appeler le cadre de décomposition et d’intégration, comme le montre la
Figure 2.8.

Figure 2.8 – Cadre de décomposition et d’intégration de la prévision de l’énergie

éolienne [161]
Ce cadre utilise des méthodes de décomposition pour décomposer les séries tempo-
relles originales non stationnaires en plusieurs sous-séries relativement stationnaires,
puis construit un modèle de prévision sur chaque sous-série pour obtenir plusieurs
résultats de prévision individuels. Le résultat final de la prévision est obtenu en addi-
tionnant tous les résultats individuels de la prévision. En prévoyant indépendamment
chaque sous-série à l’aide du prédicteur, on peut améliorer la précision de la prévi-
sion des séries d’énergie éolienne. L’efficacité de la décomposition peut également
être expliquée sous l’angle de la fréquence. Les sous-séries ont des bandes de fré-
quence plus concentrées, ce qui fait que les prédicteurs n’ont besoin de se concentrer
que sur les composants d’une seule bande de fréquence et réduit la difficulté de la
prévision. Après une analyse exhaustive de la littérature, les principales méthodes
de décomposition utilisées dans la prévision de l’énergie éolienne peuvent être divi-
sées en cinq catégories : décomposition par ondelettes [259], décomposition par EMD
(Empirical Mode Decomposition) [260], décomposition par mode variationnel [261],
décomposition auto-adaptative [262] et décomposition hybride [263].
2.5.3.2.2 Réduction de la dimensionnalité

Outre l’amélioration de la précision des prévisions par la décomposition de la série
originale d’énergie éolienne, la gestion des données d’entrée est également considérée
comme un moyen potentiel d’améliorer les performances des modèles hybrides. La
réduction de la dimensionnalité des données d’entrée peut réduire considérablement

la complexité du calcul et l’erreur de prévision causée par les informations redon-

dantes. La sélection et l’extraction de caractéristiques sont deux moyens principaux
de réduire la dimensionnalité. Mais elles présentent certaines différences. La sélection
de caractéristiques fait référence à la sélection d’un sous-ensemble à partir de l’en-
semble des caractéristiques existantes en fonction de certains critères, tandis que les
caractéristiques obtenues par l’extraction de caractéristiques sont une mise en cor-
respondance de l’ensemble des caractéristiques d’origine, c’est-à-dire que l’extraction
de caractéristiques peut produire de nouvelles caractéristiques à partir des données
d’origine.
Il a été reconnu que les combinaisons de caractéristiques individuellement bonnes
ne conduisent pas nécessairement à de bonnes performances [264]. Les méthodes de
sélection de caractéristiques sont utilisées pour trouver le sous-ensemble minimal de
l’ensemble de caractéristiques d’entrée, afin d’améliorer l’efficacité du calcul du mo-
dèle. Il existe deux cadres de base pour réaliser la sélection des caractéristiques : la
technique de wrapping et le filtrage [265], comme le montre la Figure 2.9. L’approche
de wrapping utilise les performances d’apprentissage comme critère d’évaluation de
l’ensemble des caractéristiques pour la sélection des caractéristiques. L’approche par
filtrage utilise des critères d’évaluation pour améliorer la corrélation entre les ca-
ractéristiques et les classes, et pour réduire la corrélation entre les caractéristiques.
Comme son nom l’indique, cette technique filtre les caractéristiques inutiles.
Figure 2.9 – Cadres de base de la sélection de caractéristiques : (a) filtre, (b)

wrapping [161]

La principale différence entre les deux façons de sélectionner les caractéristiques

mentionnées ci-dessus est l’utilisation ou non d’algorithmes d’apprentissage. En géné-
ral, l’approche par filtrage a une bonne rapidité, tandis que l’approche par wrapping
a une meilleure précision. Selon les méthodes adoptées, la sélection de caractéris-
tiques dans la prévision de l’énergie éolienne peut être divisée en cinq catégories : les
techniques basées sur la corrélation, sur le clustering, sur l’information, sur l’opti-
misation métaheuristique et d’autres méthodes de sélection de caractéristiques ren-
contrées dans la littérature. Dans la plupart des cas, les méthodes de sélection des
caractéristiques basées sur la corrélation, le clustering et l’information sont des mé-
thodes par filtrage, tandis que les méthodes basées sur des algorithmes d’optimisation
sont des méthodes par wrapping. Une classification des méthodes de sélection des
caractéristiques sont présentées dans le tableau 2.1.
Tableau 2.1 – Résumé des méthodes de sélection des caractéristiques dans la pré-
vision de l’énergie éolienne
Sous-catégories Caractéristiques ou détails de mise en œuvre Algorithmes utilisés

Basé sur la corréla- Considérer la corrélation entre les caracté- DWT assisté par corrélation, ACF et
tion ristiques ou la corrélation entre les caracté- PACF, GSO, GCA
ristiques et la sortie.
Basé sur le clustering Agrégation des données d’entrée en plu- DBSCAN, KFCM, K-means, SC
sieurs clusters, Forte interprétabilité
Basé sur l’information En se basant sur les données chiffrées, il MI, CMI
n’est pas nécessaire de faire des hypothèses
sur la relation entre les données.
Optimisation méta- Recherche aléatoire de combinaisons opti- BPSOGSA, BBSA, CRO, GA, PSO,
heuristique males à partir des variables d’entrée, Bonne DE
applicabilité, Non soumis à des caractéris-
tiques de données spécifiques.
Autres Quelques autres méthodes populaires de sé- RF, PSR, KLD-EM-SE
lection de caractéristiques, y compris l’hy-
bridation de plusieurs algorithmes
En dehors des méthodes de sélection de caractéristiques, les techniques de réduc-

tion de la dimensionnalité incluent aussi les méthodes d’extraction de caractéristiques
qui sont soit linéaires ou non linéaires. La méthode d’extraction de caractéristiques
la plus couramment utilisée est l’analyse en composantes principales (ACP). Il s’agit
d’une méthode linéaire d’extraction de caractéristiques. De nombreuses applications
de l’ACP ont été réalisées dans la prévision de l’énergie éolienne [266]. Kong et al.
ont utilisé l’ACP pour extraire les principales variables affectant réellement la vitesse
du vent [267]. Les taux de contribution des composantes principales ont été classés

comme la vitesse du vent, la température, la pression atmosphérique, la direction du

vent par ordre décroissant. Si toutes les composantes principales étaient concernées
et choisies en entrée, les indices d’erreur de prévision n’étaient pas les meilleurs, ce
qui articulait la redondance des facteurs n’apportant rien de bon aux modèles de
prévision. En outre, la prévision basée sur la combinaison de la vitesse du vent, de la
température et de la pression atmosphérique a obtenu les meilleures performances.
Leur expérience démontre que considérer tous les facteurs affectant la vitesse du
vent est inutile et sans profit. Dans [268], un vecteur original de 47 dimensions a
été réduit à un espace de 18 dimensions en utilisant l’ACP généralisée. Une conclu-
sion intéressante est que le modèle basé sur l’ACP a surpassé le modèle basé sur le
clustering, démontrant l’effectivité de l’extraction de caractéristiques. L’analyse en
composantes principales par noyau ("Kernel principal component analysis", KPCA)
est une version non linéaire de l’ACP. Elle applique d’abord la transformation non
linéaire à l’échantillon, puis adopte l’ACP dans l’espace de transformation. La KPCA
généralise l’ACP aux conditions non linéaires par le biais de la fonction noyau. Sun
et al. ont développé une approche intégrée pour la prévision de la vitesse du vent,
en combinant la reconstruction de l’espace de phase ("Phase Space Reconstruction",
PSR) avec le KPCA [269]. Le PSR a été utilisé pour sélectionner les vecteurs d’entrée
et la KPCA a été utilisée pour réduire la dimension. Les résultats expérimentaux ont
montré que le modèle hybride proposé était nettement plus performant que les autres
modèles de référence.
2.5.3.2.3 Correction des données

Cette sous-section passe en revue les méthodes de traitement des données qui
sont utilisées pour corriger les ensembles de données d’entrée ou les résultats des
prévisions. Quatre méthodes de correction des données totalement différentes ont
été adoptées dans les articles publiés, notamment le débruitage, la modélisation des
erreurs résiduelles, la détection des aberrations et la correction par filtrage.
Le débruitage des données d’entrée est un moyen important pour augmenter la
performance des modèles de prévision. L’objectif du débruitage est de trier et de
renforcer l’information effective des données d’entrée et de supprimer le bruit qui
interfère avec la formation du modèle.
La modélisation de l’erreur résiduelle est la méthode de post-traitement la plus
couramment utilisée dans la prévision de l’énergie éolienne. La figure 2.10 montre
son cadre général. Il établit un modèle de prévision pour calculer l’erreur résiduelle

de prévision, et le modèle de prévision de l’erreur résiduelle formé est utilisé sur le

jeu de données de test. La série d’erreurs de prévision est superposée aux résultats
de la prévision préliminaire pour corriger les erreurs systématiques. En conséquence,
les modèles construits pour la série originale et l’erreur résiduelle sont notés comme
prédicteur principal et prédicteur subordonné, respectivement. La modélisation des
erreurs résiduelles est un processus qui utilise un prédicteur subordonné pour ap-
prendre la tendance changeante des erreurs et corriger le résultat de la prévision
préliminaire obtenu par le prédicteur principal. Li et al. ont choisi la mémoire à long
terme ("Long short-term memory" - LSTM) et le moteur d’apprentissage extrême ré-
gularisé ("Regularized extreme learning machine" - RELM) comme prédicteurs prin-
cipaux et subordonnés, respectivement [205]. Les résultats ont montré que le modèle
d’erreur résiduelle pouvait améliorer considérablement les performances de prévision.
Figure 2.10 – Le cadre général de la modélisation des erreurs résiduelles [161]
En général, les valeurs aberrantes des séries temporelles sont des points de don-
nées qui ne suivent pas un modèle général de changement ou une tendance historique.
Lorsque les données sont affectées par des valeurs aberrantes, les modèles basés sur les
données peuvent apprendre par erreur les informations anormales des données elles-
mêmes, et il est difficile d’obtenir une grande précision dans la prédiction basée sur
l’ensemble des données. Deux solutions principales sont utilisées pour réduire l’im-
pact négatif des aberrations sur le modèle, notamment les méthodes de détection des
valeurs aberrantes et les modèles de régression robustes [92, 161, 270]. Les méthodes
de détection des valeurs aberrantes servent de méthode de prétraitement pour détec-
ter et corriger les valeurs aberrantes. Les modèles de régression robuste ne détectent
ou ne traitent pas directement les valeurs aberrantes, mais contrôlent l’influence de
l’anomalie par le biais de la fonction de perte ou des distributions d’erreurs. Plus de
détails sur les modèles de régression robuste pour la prévision de la vitesse du vent
peuvent être trouvés dans les références [270–273]. Nous nous concentrons ici sur les

méthodes de prétraitement de la détection des valeurs aberrantes. Les publications

relatives à la prévision de l’énergie éolienne sont relativement rares. Cependant, les
étapes générales des méthodes de traitement de détection des valeurs aberrantes sont
cohérentes. Elles modifient des points spécifiques dans les séries de prévisions selon
certaines règles. Le processus de mise en œuvre comprend deux étapes : la détection
et la correction ou la suppression.
Le filtrage quant à lui est une opération qui consiste à filtrer la fréquence d’une
bande spécifique dans le signal. Il s’agit d’une mesure importante pour supprimer
et prévenir les interférences. L’hypothèse de base des méthodes de correction basées
sur le filtrage est que la bande de fréquence des séries de prévision est cohérente avec
celle des séries originales. Le segment de spectre de la série originale est pris comme
référence pour filtrer l’erreur, de manière à éliminer les composantes supplémentaires
générées par la prévision. Le filtre à ondelettes ("wavelet filter" - WF) a été utilisé
pour corriger les résultats de la prévision de la série de vitesse du vent [274]. Les
auteurs ont supprimé la composante fréquentielle excroissante en utilisant des seuils
appropriés pour disposer des coefficients d’ondelettes, ce qui a montré une grande
performance dans les résultats de prévision à plusieurs étapes. En outre, plutôt que
de simplement additionner les sous-séries de prévision comme le font généralement
la plupart des modèles basés sur la décomposition [257], certaines méthodes inverses
ont été appliquées avec succès, notamment la transformée inverse WT ("reverse WT",
IWT) et la transformée inverse EWT ("inverse EWT", IEWT) [205, 275]. Les trans-
formations inverses sont effectuées en fonction du banc de filtres. Les résultats de la
prévision des sous-séries sont retransformés dans le domaine d’origine, afin d’obtenir
les séries reconstruites. Ils sont considérés comme des méthodes de filtrage des points
anormaux dans les séries de prévision, qui ont été signalés pour éviter les valeurs de
prévision inattendues et améliorer la stabilité du modèle, ainsi que la précision de la
prévision [275, 276].
2.5.3.3 Stratégies de traitement des données utilisées
Dans cette sous-section la technique adoptée pour le traitement des données mé-
téorologiques des échantillons acquises est présentée. Elle est présentée par le dia-
gramme de la Figure 2.11 et débute par l’étape de visualisation des données. A cette
étape, les données sont représentées puis observées afin de détecter d’éventuelles
anomalies (absence de données, données aberrantes, tendance anormale...). A cette
étape, il est parfois difficile d’identifier toutes les anomalies juste en observant les

données. On fait recourt alors aux calculs statistiques :

• le calcul des moyennes, maxima, minima, écart-types permet de vérifier la
conformité des données météorologiques aux données habituelles de la zone
géographique correspondante ;
• les données météorologiques étant des séries temporelles, il est important de
s’assurer que leurs caractéristiques ne changent pas au cours du temps ou si
elles changent s’assurer de les rendre stationnaires. Plus précisément, une série
temporelle stationnaire est une série dont la moyenne, la variance et la structure
d’autocorrélation sont constantes dans le temps. Il s’agit d’une hypothèse im-
portante car de nombreuses techniques d’analyse des séries temporelles, telles
que celles utilisées pour les prévisions, reposent sur l’idée que les modèles et les
relations sous-jacents des données sont stables dans le temps. Il existe plusieurs
façons de tester la stationnarité d’une série temporelle. Une méthode courante
est le test de Dickey-Fuller augmenté (ADF). Il teste l’hypothèse nulle selon
laquelle une série temporelle a une racine unitaire (c’est-à-dire qu’elle est non
stationnaire). Rejeter l’hypothèse nulle revient à considérer la série temporelle
comme stationnaire. Une autre méthode est le test de Kwiatkowski-Phillips-
Schmidt-Shin (KPSS), qui teste l’hypothèse nulle qu’une série temporelle est
stationnaire. L’inspection d’un graphique séquentiel des données peut égale-
ment permettre de vérifier l’hypothèse. Si les données ne présentent pas de
tendance à la hausse ou à la baisse et si la variance semble constante dans le
temps, elles peuvent être considérées comme stationnaires.

Figure 2.11 – Diagramme de traitement des données
2.5.3.3.1 Identification et transformation des données de séries temporelles non

stationnaires
Si une série temporelle s’avère être non stationnaire, il peut être possible de la
transformer en une série temporelle stationnaire grâce à un processus appelé "diffé-
rentiation". Il s’agit de soustraire des observations consécutives les unes des autres,

ce qui peut aider à éliminer toute tendance ou saisonnalité dans les données. Prendre
le logarithme népérien des données peut rendre stationnaires certaines séries tempo-
relles non stationnaires.
Il convient de noter que toutes les séries temporelles ne sont pas stationnaires.
De nombreuses séries temporelles du monde réel sont non stationnaires. Il est im-
portant d’être conscient de cette hypothèse dans l’analyse des séries temporelles et
de prendre les mesures appropriées pour tenir compte de la non-stationnarité. En
outre, la non-stationnarité peut être due à de multiples raisons, telles que la ten-
dance, la saisonnalité et l’irrégularité. Par conséquent, pour la rendre stationnaire, il
est important d’identifier le type de non-stationnarité.
Modèle de marche aléatoire ("Random walk model", RWM) .

La série différenciée est la variation entre les observations consécutives de la série
originale, et peut s’écrire comme suit :
′
yt = yt − yt−1 (2.1)
Les modèles de marche aléatoire sont largement utilisés pour les données non station-
naires, en particulier les données de longues périodes de tendances apparentes à la
hausse ou à la baisse ou ayant des changements de direction soudains et imprévisibles.
Différenciation du second ordre (" Second Order Differencing ", SOD) .

Il arrive que les données différenciées ne soient pas stationnaires et qu’il soit nécessaire
de les différencier une seconde fois pour obtenir une série stationnaire :
′′ ′ ′
yt = yt − yt−1 (2.2)
Nous modéliserions alors le "changement dans les changements" des données d’origine.
Dans la pratique, il n’est presque jamais nécessaire d’aller au-delà des différences de
second ordre.
Différences saisonnières (" Seasonal Differencing ", SD) .

Une différence saisonnière est la différence entre une observation et l’observation
précédente de la même saison :
′
yt = yt − yt−m (2.3)

où m est le nombre de saisons. Ces différences sont également appelées " lag-m
differences ", car nous soustrayons l’observation après un décalage de m périodes.
2.5.3.3.2 Nettoyage des données

Le nettoyage des données est particulièrement effectué dans le cadre du prétraite-
ment des données afin de nettoyer les données en remplissant les valeurs manquantes,
en lissant les données bruyantes, en résolvant les incohérences et en supprimant les
valeurs aberrantes.
Valeurs manquantes .
Pour gérer les valeurs manquantes, il faut soit les ignorer ou soit les remplacer. Les
ignorer est envisagé lorsque l’ensemble de données est volumineux et que de nom-
breuses valeurs manquantes sont présentes dans un tuple. Dans le cas contraire, il
est possible de les remplacer soit manuellement soit en les prévoyant à l’aide d’une
méthode de régression ou de méthodes numériques telles que la moyenne des attri-
buts.
Données bruitées .
Il s’agit d’éliminer une erreur aléatoire ou une variance dans une variable mesurée.
Cette opération peut être réalisée à l’aide des techniques suivantes :
• Regroupement : Il s’agit d’une technique qui fonctionne sur des valeurs de don-
nées triées afin de lisser tout bruit présent dans celles-ci. Les données sont divi-
sées en bacs de taille égale et chaque bac est traité indépendamment. Toutes les
données d’un segment peuvent être remplacées par leur moyenne, leur médiane
ou leurs valeurs limites.
• Régression : Cette technique d’exploration de données est généralement utilisée
pour la prédiction. Elle permet de lisser le bruit en ajustant tous les points de
données dans une fonction de régression. L’équation de régression linéaire est
utilisée s’il n’y a qu’un seul attribut indépendant ; dans le cas contraire, des
équations polynomiales sont utilisées.
• Classification : Création de groupes/clusters à partir de données ayant des va-
leurs similaires. Les valeurs qui ne se trouvent pas dans un cluster peuvent être
traitées comme des données bruitées et peuvent être supprimées.
Suppression des valeurs aberrantes .

Les techniques de clustering regroupent des points de données similaires. Les tuples

qui se trouvent en dehors de la grappe sont des données aberrantes/inconsistantes.
2.5.3.3.3 Conversion des données

Dans notre cas d’étude il est nécessaire de convertir au besoin certaines données
météorologiques pour qu’elles soient exploitables dans certaines applications.
Conversion de la température suivant la hauteur des installations .

La température ambiante obtenue dans les bases de données météorologiques sont
souvent données à une hauteur fixe (généralement à 2m du sol). Il peut donc être
nécessaire de la convertir lorsque le champ solaire est installé à des hauteurs plus
élevées.
Figure 2.12 – Modèle ISA [277]
L’un des modèles décrivant l’atmosphère terrestre est le modèle ISA [277], Inter-
national Standard Atmosphere, qui utilise l’altitude géopotentielle pour obtenir la
température. Selon ce modèle, la température augmente, diminue ou reste constante

à mesure que l’on s’élève dans l’atmosphère, contrairement à la pression, qui ne di-
minue qu’avec l’altitude et la densité de l’air. Comme il peut être remarqué sur la
figure 2.12, dans la Troposphère (0 à 12 km), la partie la plus basse de l’atmosphère
terrestre, qui est chauffée par la surface de la Terre, la température diminue d’environ
6,5°C par km. Ainsi on a :
T2 = T1 − L × h (2.4)
où T1 est la température à l’altitude h1 et T2 la température à l’altitude h2 , h = h2 −h1

est l’écart entre les deux altitudes et L = 0, 0065◦ C/m est le taux de déchéance.
Conversion de l’irradiation sur plan incliné .
Dans la plupart des bases de données météorologiques, l’irradiation globale est

fournie sur plan horizontal. Or dans la réalité les panneaux solaires sont inclinés
afin de capter de maximum de rayons. Il est dont crucial de disposer d’un modèle
de conversion de l’irradiation globale horizontale sur le plan des panneaux. Dans la
littérature, il existe plusieurs modèles de conversions qui sont utilisés : le modèle de
Bernard [278], le modèle Capderou [279], le modèle HDKR (Hay, Davies, Klucher,
Reindl) [280], le modèle de Olmo [281], le modèle Climed2/Klucher [282, 283], le
modèle de de Jimenez [284], le modèle de Circum Solar [285] ou encore le modèle de
Climed2/Bernard. Une étude comparative de différents modèles de conversion a été
réalisée dans [286]. De cette étude, il ressort que les modèles d’Olmo, de Capderou, de
Climed2/Klucher, de Jimenez, Circum Solar, Climed2/Bernard se révèlent les plus
précis avec une erreur quadratique moyenne variant entre 11% et 15%. Le modèle de
Climed2/Klucher est le plus rencontré dans la littérature. Ci-dessous sont décrites
les étapes de conversion de la méthode Climed2/Klucher :
• Étape 1 : l’irradiation diffuse horaire horizontale est calculée à partir de l’ir-
radiation globale horizontale. La méthode CLIMED2 consiste à déterminer la
partie diffuse de l’irradiation globale G en utilisant le système d’équations 2.5.

f = 0, 995 − 0, 081MT si MT ⩽ 0, 21






f = 0, 724 + 2, 738MT − 8, 32MT2 + 4, 967MT3 si 0, 21 ⩽ MT ⩽ 0, 76 (2.5)



f = 0, 180 MT > 0, 76

si


où f = Gd /G, Gd est l’irradiation diffuse horaire horizontale, G l’irradiation globale

horaire horizontale et MT est l’indice de clarté pour l’heure, qui présente le rapport de

l’irradiation globale mesurée sur un plan horizontal et l’irradiation hors atmosphère.

• Étape 2 : l’irradiation globale inclinée est calculée à partir des irradiations glo-
bale et diffuse horizontales. Pour trouver l’irradiation solaire directe sur un plan
incliné d’un angle β (Gb,β ), on calcule d’abord l’irradiation directe horizontale
Gb (Équation 2.6), puis Gb,β (Équation 2.7) [285] :
Gb = G − Gd (2.6)
cos θ
Gb,β = Gb × (2.7)
cos θz
où θ et θz sont respectivement l’angle d’incidence et l’angle zénithal. On déter-
mine ensuite à partir de l’équation 2.8 l’irradiation diffuse réfléchie par le sol
sur un plan incliné d’un angle β (Gr,β .
1
Gr,β = ρ × G × (1 − cos β) (2.8)
2
avec ρ le coefficient de réflexion (albédo du sol) le plus souvent pris égal à 0,2.
• Étape 3 : Pour finir, on estime la composante diffuse sur un plan incliné en
utilisantï le modèle
Å deÅKlucher
ããò ï (Équation Å2.9).
ãò
β 3 β
Gd,β = Gd 0, 5 1 + cos 1 + F sin 1 + F cos2 (θ) sin3 (θz ) (2.9)

2 2
2
où F = 1 − (Gd /G) . L’irradiation totale Gβ , reçue sur un plan incliné à un angle β
pour une heure, s’exprime par :
Gβ = Gb,β + Gr,β + Gd,β (2.10)
Conversion de la vitesse du vent suivant l’altitude .

De même que pour la température ambiante, la vitesse du vent n’est fournie que pour
certaines hauteurs dans les bases de données météorologiques. Comme les moyeux
des éoliennes ont différentes hauteurs suivant les puissances, un modèle de conversion
des vitesses de vents suivant l’altitude est alors nécessaire. Pour ce faire, le modèle
présenté par l’équation 2.11 est utilisé.
Ä ä
ln h2
z
v2 = v1 Ä h0 ä (2.11)
ln z01

Avec v1 la vitesse de référence mesurée à la hauteur de référence h1 , v2 est la vitesse

du vent à la hauteur h2 . z0 est la longueur de rugosité présentée dans le tableau 2.2
[287].
Tableau 2.2 – Classes et longueurs de rugosité
Classe de rugosité Longueur de rugosité z0 Types de surfaces

0 0.0002 m Eau : mers, lacs
0,5 0.0024 m Terrains découverts avec surfaces nues, p. ex : béton, pistes d’at-
terrissage, gazon tondu, etc.
1 0.03 m Terrains agricoles découverts, sans clôtures ni haies, év. avec des
constructions éparpillées et des collines peu profilées
1,5 0.055 m Terrains agricoles avec quelques bâtiments et des haies de 8 m de
hauteur distantes de plus de 1 km
2 0.1 m Terrains agricoles avec quelques bâtiments et des haies de 8 m de
hauteur distantes d’env. 500 m
2,5 0.2 m Terrains agricoles avec de nombreux bâtiments, des buissons et
des plantes ou des haies de 8 m de hauteur distantes d’env. 250 m
3 0.4 m Villages, petites villes, terrains agricoles avec de nombreuses haies
ou de hauts arbres, forêts, terrains très accidentés
3,5 0.6 m Grandes villes avec de hauts bâtiments
4 1.6 m Grandes villes avec de hauts bâtiments et des gratte-ciel
2.5.3.3.4 Détermination des fréquences les plus importantes des paramètres mé-
téorologiques
.
Comme il s’agit ici de séries temporelles météorologiques, elles ont souvent par
exemple de claires périodicités journalières, annuelles. Pour faciliter la prévision, il
est important de faire comprendre ces notions de fréquence aux modèles. Pour cela la
Transformation de Fourier Rapide (TFR) sous Python 3 est utilisée pour déterminer
dans ces séries les fréquences importantes.
2.5.3.3.5 Création et ajout de nouvelles variables au dataset

Il est rarement possible d’exploiter les paramètres ainsi que leurs données tels que
téléchargés ou acquis dans une tâche de prévision. Généralement ces paramètres sont
soit transformés, associés ou complétés pour créer un nouveau jeu de données afin
de faire comprendre précisément aux modèles l’information visée.

Ajout des variables liées aux fréquences importantes .

Les premières variables ajoutées au jeu de données sont celles créées à partir des fré-
quences importantes identifiées précédemment. Pour cela, par fréquence importante,
deux variables décrites par les équations 2.12 et 2.13 sont ajoutées :
2π
Å Å ãã
xsin = sin t ∗ (2.12)
T
2π
Å Å ãã
xcos = cos t ∗ (2.13)
T
où xsin et xcos sont les nouvelles variables ajoutées, t le temps en seconde et T la
période importante identifiée.
Association de la vitesse et de la direction du vent .

Il est également important dans notre cas de faire comprendre aux modèles le concept
de direction du vent. En effet, les directions du vent sont des angles et les modèles
doivent comprendre par exemple que 0° et 360° sont identiques. De plus, la direction
du vent n’est pas très utile si le vent est faible. Deux variables (vitesse et direction
du vent) sont donc associées pour créer deux nouvelles variables comme le montrent
les équations 2.14 et 2.15.
Wx = Ws sin (Wd ) (2.14)
Wy = Ws cos (Wd ) (2.15)
Wx et Wy sont les deux nouvelles variables créées, Ws les vitesses de vent en m/s et
Wd les directions de vent en radian.
2.5.3.3.6 Transformation des données

Une fois le nettoyage des données effectué ainsi que les nouvelles variables ajou-
tées, les données de qualité doivent être consolidées sous d’autres formes en modifiant
la valeur, la structure ou le format des données à l’aide des stratégies de transforma-
tion des données présentées dans ce paragraphe.
Normalisation Min-Max .
La normalisation, souvent simplement appelée mise à l’échelle Min-Max, réduit l’éten-
due des données de manière à ce qu’elle soit fixée entre 0 et 1 (ou entre -1 et 1 s’il y
a des valeurs négatives). Elle est plus efficace dans les cas où la standardisation ne
fonctionne pas aussi bien. Si la distribution n’est pas gaussienne ou si l’écart-type est

très faible, l’échelle min-max fonctionne mieux. La normalisation est généralement

effectuée à l’aide de l’équation suivante :
x − min (x)
xnorm = (2.16)
max (x) − min (x)
Standardisation .
La standardisation (ou normalisation du score Z) est le processus de remise à l’échelle
des caractéristiques afin qu’elles aient les propriétés d’une distribution gaussienne
avec µ = 0 et σ = 1 où µ est la moyenne et σ l’écart type par rapport à la moyenne ;
les scores standards (également appelés scores z) des échantillons sont calculés comme
suit :
x−µ
xstand = (2.17)
σ
2.5.3.3.7 Validation croisée

Les techniques de validation croisée [288] font partie des approches convention-
nelles utilisées pour garantir une bonne généralisation et éviter le surentraînement.
L’idée de base est de diviser l’ensemble de données D en deux sous-ensembles - un
sous-ensemble est utilisé pour la formation tandis que l’autre sous-ensemble est laissé
de côté et la performance du modèle final est évaluée sur celui-ci. L’objectif principal
de la validation croisée est d’obtenir une estimation stable et fiable de la performance
du modèle. Les techniques de validation croisée peuvent également être utilisées pour
évaluer et comparer mutuellement plusieurs modèles, divers algorithmes d’apprentis-
sage ou pour rechercher les paramètres optimaux d’un modèle. Dans ce paragraphe
sont présentés les deux types de validation croisée les plus couramment utilisés : la va-
lidation croisée avec arrêt (arrêt précoce) (hold-out cross-validation (early stopping))
et la validation croisée k-fold (k-fold cross-validation).
Hold-out cross-validation (early stopping) .

La validation croisée avec arrêt est une technique de validation croisée largement uti-
lisée et appréciée pour son efficacité et sa facilité. Elle sépare l’ensemble de données D
(de taille n) en trois sous-ensembles mutuellement disjoints - formation Dtr , valida-
tion Dv et test Dt de tailles ntr , nv et nt successivement. L’avantage de cette méthode
est que la proportion de ces trois sous-ensembles de données n’est pas strictement
limitée. Le modèle est entraîné sur le sous-ensemble d’entraînement Dtr , tandis que
le sous-ensemble de validation Dv est périodiquement utilisé pour évaluer les per-
formances du modèle pendant l’entraînement afin d’éviter un entraînement excessif.

La formation est interrompue lorsque les performances sur Dv sont suffisamment

bonnes ou lorsqu’elles cessent de s’améliorer. Lors de la comparaison mutuelle de
m > 1 modèles de calcul, le sous-ensemble de test Dt est utilisé pour obtenir une
estimation fiable de la performance des modèles. L’algorithme 1 décrit ce processus
plus en détail.
Algorithm 1: Hold-out cross-validation

Entrées: Dataset D, erreur de la fonction de performance, modèles de calcul
L1 , ..., Lm , m ⩾ 1
Diviser D en trois sous-ensembles disjoints Dtr (formation), Dv (validation)
et Dt (test)
for j ← 1 to m do
• Entraîner le modèle Lj sur Dtr et utiliser périodiquement Dv pour évaluer la
performance du modèle : Evj = error (Lj (Dv ))
• Arrêter la formation lorsqu’un critère d’arrêt basé sur Evj est satisfait
end
for j ← 1 to m do
• Évaluer la performance des modèles finaux sur Dt : Etj = error (Lj (Dt ))
end
K-fold cross-validation .
La validation croisée k-fold [Mitchell, 1997] utilise une combinaison de plusieurs tests
pour obtenir une estimation stable de l’erreur du modèle. Elle est utile si l’on ne
dispose pas de suffisamment de données pour la validation croisée de retenue.
L’ensemble de données D est divisé en k parties de même taille. Une partie consti-
tue l’ensemble de validation (test) Dv , les autres parties forment l’ensemble d’appren-
tissage Dtr . Ce processus est répété pour chaque partie des données. L’algorithme 2
décrit cette méthode plus en détail. Contrairement à la méthode précédente, il n’y
a pas d’ensemble de test séparé et la proportion des sous-ensembles de formation et
de validation est strictement limitée par le nombre de plis k.

Algorithm 2: K-fold cross-validation

Entrées: Dataset D, nombre de plis k, erreur de la fonction de performance,
modèles de calcul L1 , ..., Lm , m ⩾ 1
Diviser D en k sous-ensembles disjoints D1 , ..., Dk de même taille.
for i ← 1 to k do
• Dv ← Di
• Dtr ← {D \ Di }
for j ← 1 to m do
• Entraîner le modèle Lj sur Dtr et utiliser périodiquement Dv pour évaluer la
performance du modèle : Evj (i) = error (Lj (Dv ))
• Arrêter la formation lorsqu’un critère d’arrêt basé sur Evj (i) est satisfait
end
end
for j ← 1 to m do
• Évaluer la performance des modèles par : Evj = k1 ki=1 Evj (i)
P
end
2.5.3.3.8 Fractionnement des données

Le fractionnement des données consiste à diviser les données en deux ou plu-
sieurs sous-ensembles. Trouver les bonnes proportions pour chaque partie lors du
fractionnement des données est donc très important pour aboutir à de bonnes per-
formances de prévision. Dans la littérature, il existe plusieurs techniques de fraction-
nement telles que : le Simple random sampling (SRS), le Trial-and-error methods,
le Systematic sampling, le Convenience sampling, CADEX-DUPLEX, le Stratified
sampling. Le fractionnement des données de séries temporelles est un type particu-
lier de fractionnement formation-test. L’objectif du fractionnement des données de
séries temporelles est similaire à celui du fractionnement aléatoire, à savoir valider la
prévisibilité du modèle indépendamment de la manière dont les ensembles de don-
nées de formation-test sont fractionnés. Toutefois, la répartition en séries temporelles
garantit que les ensembles de données de test sont plus récents ou plus anciens que
les ensembles de données de formation, ce qui est plus réaliste puisque nous ne se-
rons pas en mesure de nous entraîner sur des données "futures". Nous retenons un
fractionnement en trois parties Formation, Validation et Test avec respectivement
comme pourcentage 70%, 20% et 10%.
Dans cette section, l’irradiation et la température ont été identifiées comme pa-
ramètres d’influence de la variabilité de la puissance PV et les vitesse et direction
du vent comme celles de la variabilité de la puissance éolienne. Ensuite la méthodo-

logie d’acquisition et de traitement des données a été présentée. Ainsi la méthode

Climed2/Klucher a été retenue pour la conversion de l’irradiation globale sur plan
horizontal vers le plan des panneaux et les vitesse et température ambiante seront
aussi converties suivant les hauteurs des installations. La Transformation de Fourier
Rapide a été retenue pour extraire les fréquences les plus importantes des séries tem-
porelles et la Normalisation MinMax pour la mise à une même échelle des données.
2.6 Réduction de la zone d’étude et formation de sous-zones
Nous rappelons que l’objectif visé est de pouvoir développer un outil d’identi-
fication des périodes de productions optimales et de prévision des variabilités des
puissances de sortie PV et Éolienne dans une très grande zone. Une fois donc que
les données sont acquises et traitées l’idée est de réduire le plus possible la zone
d’étude tout en ne perdant aucune information. Pour ce faire nous partons de l’hy-
pothèse selon laquelle les paramètres météorologiques d’étude identifiés (vitesse du
vent, irradiation, température ambiante) ne varieraient pas différemment pour tous
les échantillons. Ainsi donc il y auraient des points géographiques où ces paramètres
varieraient identiquement ou presque dans sur toute la période d’étude. La première
étape dans cette phase de réduction est donc de regrouper pour chaque paramètre
ces points géographiques sus-mentionnés.
2.6.1 Algorithmes de clustering des séries temporelles
Le clustering est une solution pour classer d’énormes données lorsqu’il n’y a pas
de connaissances préalables sur les classes. Avec l’émergence de nouveaux concepts
tels que l’informatique dématérialisée (cloud computing) et les données volumineuses
(big data) et leurs vastes applications au cours des dernières années, les travaux de re-
cherche se sont multipliés sur des solutions non supervisées telles que les algorithmes
de classification afin d’extraire des connaissances à partir de cette avalanche de don-
nées. Le clustering est une technique d’exploration de données qui consiste à placer
des données similaires dans des groupes apparentés ou homogènes sans connaissance
préalable des définitions des groupes. Plus précisément, les grappes sont formées en
regroupant les objets qui présentent une similitude maximale avec d’autres objets du
groupe et une similitude minimale avec des objets d’autres groupes. Il s’agit d’une
approche utile pour l’analyse exploratoire des données, car elle permet d’identifier
des structures dans un ensemble de données non étiquetées en organisant objecti-

vement les données en groupes similaires. En outre, le clustering est utilisé pour
l’analyse exploratoire des données afin de générer des résumés et en tant qu’étape de
prétraitement pour d’autres tâches d’exploration de données ou en tant que partie
d’un système complexe.
Un type particulier de clustering est le clustering de séries temporelles. Une sé-
quence composée d’une série de symboles nominaux issus d’un alphabet particulier
est généralement appelée séquence temporelle, et une séquence d’éléments continus
à valeur réelle est appelée série temporelle. Une série temporelle est essentiellement
classée comme une donnée dynamique parce que les valeurs de ses caractéristiques
changent en fonction du temps, ce qui signifie que la ou les valeurs de chaque point
d’une série temporelle est/sont une ou plusieurs observations qui sont faites chronolo-
giquement. Les données de séries temporelles sont un type de données temporelles qui
sont naturellement de haute dimension et de grande taille. Elles sont intéressantes en
raison de leur omniprésence dans divers domaines tels que la science, l’ingénierie, les
affaires, la finance, l’économie, les soins de santé et l’administration publique. Bien
que chaque série temporelle soit constituée d’un grand nombre de points de données,
elle peut également être considérée comme un objet unique.
Comme le montre la figure 2.13, le clustering peut généralement être classé en six
groupes : Algorithmes de partitionnement, hiérarchiques, basés sur une grille, basés
sur un modèle, de clustering basé sur la densité et de clustering en plusieurs étapes.
Figure 2.13 – Algorithmes de clustering

En général, les algorithmes hiérarchiques sont faibles en termes de qualité de per-

formance car ils ne peuvent pas ajuster les clusters après avoir divisé un cluster dans
une méthode de division (clustering hiérarchique de division), ou après avoir fusionné
des clusters dans une méthode d’agglomération (clustering hiérarchique d’agglomé-
ration). Par conséquent, les algorithmes de clustering hiérarchique sont généralement
combinés à un autre algorithme sous la forme d’une approche de clustering hybride
afin de remédier à ce problème [289]. Dans les algorithmes de clustering par parti-
tionnement, le nombre de clusters, k, doit être pré-attribué, ce qui est une tâche très
compliquée pour le clustering de données non temporelles. La tâche est encore plus
ardue avec les données de séries temporelles, car les ensembles de données sont très
volumineux et les contrôles diagnostiques pour déterminer le nombre de clusters ne
sont pas faciles. Toutefois, ces algorithmes sont très rapides par rapport au clustering
hiérarchique, ce qui les rend très adaptés au clustering de séries temporelles, comme
l’ont montré de nombreux travaux[290].
Le clustering basé sur un modèle suppose que les données ont été générées par
un modèle et tente de récupérer le modèle original à partir des données. Dans la
littérature, il y a assez peu de publications de recherche qui démontrent la valeur
de ces méthodes. La plupart du temps, les auteurs construisent leur clustering avec
des modèles polynomiaux, des modèles mixtes gaussiens, des approches ARIMA, des
chaînes de Markov, des modèles de Markov cachés ou des réseaux neuronaux. En
général, le clustering basé sur un modèle présente deux inconvénients : tout d’abord,
son temps de traitement est lent sur les grands ensembles de données. Deuxièmement,
et plus important encore, le clustering basé sur un modèle nécessite des paramètres
d’entrée et des hypothèses qui peuvent ne pas être corrects pour le cas d’utilisation
et peuvent donner lieu à des clusters inexacts. Cette méthode n’est presque jamais
utilisée dans la pratique [291–294]. Le clustering basé sur la densité fait référence
aux méthodes d’apprentissage non supervisées qui identifient des groupes/clusters
distinctifs dans les données, en se basant sur l’idée qu’un cluster dans un espace
de données est une région contiguë de densité ponctuelle élevée, séparée d’autres
clusters de ce type par des régions contiguës de faible densité ponctuelle. L’un des
algorithmes les plus connus basés sur ce concept de densité est DBSCAN. Toutefois,
une analyse de la littérature révèle que le clustering basé sur la densité n’a pas
été largement appliqué au clustering de données de séries temporelles en raison de
la grande complexité de cette tâche [295–297]. Dans la pratique, en combinant les
approches, on peut exploiter les principaux avantages des différentes méthodes, à
savoir :

• La possibilité d’analyser un grand nombre de séries temporelles individuelles,

ce qui est le point fort des méthodes non hiérarchiques (pour un certain nombre
d’observations, il devient difficile d’appliquer directement les méthodes hiérar-
chiques) ;
• Le choix d’un nombre optimal de classes, rendu possible par la classification
hiérarchique.
De cette analyse des différentes méthodes de clustering, nous retenons les algo-
rithmes de clustering hiérarchique compte tenue de leur capacité à regrouper les
séries temporelles, leur rapidité et leur simplicité.
2.6.2 Présentation de la technique de clustering
A titre illustratif, la figure 2.14 présente le principe de clustering utilisé. Nous par-
tons d’un ensemble d’échantillons (bonhommes de différentes couleurs) pris au sein
d’une certaine population. Si l’objectif ici est d’étudier les couleurs au sein de cette
population de bonhommes, notre technique constitue à grouper les échantillons par
couleurs puis de prendre un échantillon par groupe pour former une sous-population
constituée d’un échantillon par couleur. Ainsi nous partons d’un nombre assez grand
d’échantillons pour aboutir à un nombre d’échantillons égale au nombre de modalités
de la caractéristique étudiée.
Figure 2.14 – Technique de clustering utilisée

Par analogie donc, les paramètres météorologiques étudiés étant des séries tem-
porelles, notre objectif est d’identifier pour chaque paramètre le nombre de profils
différents dans toute la zone d’étude. Nous regroupons donc par exemple pour la tem-
pérature les échantillons (points géographiques) pour lesquels la température varie
identiquement ou presque sur toute la période d’étude puis par groupe nous retenons
un échantillon comme représentatif de tout son groupe. Ainsi finalement nous avons
autant d’échantillons représentatifs que de profils différents dans la zone d’étude. Cet
exercice de clustering est effectué pour chaque paramètre météorologique.
2.6.3 Mesures d’évaluation du clustering des séries temporelles
L’évaluation correcte des performances d’une procédure de clustering est toujours

un casse-tête, en général et spécifiquement pour le clustering des séries temporelles.
Dans les problèmes non supervisés, il n’existe en tant que tel d’étiquettes pour établir
des mesures de performance. La définition d’un "bon" clustering dépend du problème
et est souvent subjective. Le nombre de clusters, la taille des clusters, la définition
des valeurs aberrantes et la définition de la similarité entre les séries temporelles
d’un problème sont autant de concepts qui dépendent de la tâche à accomplir. Les
résultats peuvent être évalués à l’aide de différentes mesures. La visualisation et
les mesures scalaires sont les principales techniques d’évaluation de la qualité du
clustering, également appelée validité du clustering. Les fonctions "objectif" typiques
du clustering formalisent l’objectif d’atteindre une similarité intra-groupe élevée (les
objets d’un même cluster sont similaires) et une similarité inter-groupes faible (les
objets de différents clusters sont dissemblables).
Certaines méthodes développées pour tester la qualité des solutions de clustering
sont classées en deux types : l’indice externe et l’indice interne.
• L’indice externe est la méthode d’évaluation du clustering la plus couramment
utilisée, également connue sous le nom de validation externe, critère externe. La
vérité de base est constituée par les clusters cibles, généralement créés par des
experts. Cet indice mesure le degré de chevauchement entre les clusters cibles
et les clusters résultants. L’entropie, l’indice de Rand ajusté ("Adjusted Rand
Index", ARI), la mesure F, le score de Jaccard, l’indice de Fowlkes et Mallows
(" Fowlkes and Mallows Index ", FM) et la mesure de similarité des clusters ("
Cluster Similarity Measure ", CSM) sont les indices externes les plus connus.
• Les index internes évaluent les résultats du clustering en utilisant les caractéris-
tiques des ensembles de données et des métadonnées sans aucune information

externe. Ils sont souvent utilisés dans les cas où les solutions correctes ne sont
pas connues. La somme des erreurs quadratiques est l’une des méthodes in-
ternes les plus utilisées, dans laquelle la distance par rapport au cluster le plus
proche détermine l’erreur. Ainsi, les clusters dont les séries temporelles sont si-
milaires devraient donner des valeurs d’erreur plus faibles. L’indice de distance
entre deux clusters ("Distance between two clusters"), l’écart-type quadratique
("Root Mean Mean Square Standard Deviation"), l’indice de Silhouette, l’in-
dice R-carré, l’indice Hubert-Levin, l’indice R-carré semi-partiel (SPR), l’in-
dice inter-intra pondéré, l’indice d’homogénéité et l’indice de séparation sont
les indices internes les plus répandus.
Comme nous n’avons aucune idée des nombres de clusters (nombres de profils
différents), nous optons pour une indice interne : le silhouette score. Le coefficient
de silhouette ou score de silhouette est une métrique utilisée pour calculer la qualité
d’une technique de clustering. La classification est mauvaise lorsque l’on obtient un
coefficient négatif. L’élément classé est proche de la frontière de décision ou est seul
dans le cluster lorsque nous obtenons un coefficient égal à zéro. La classification est
bonne lorsque l’on obtient un coefficient positif. Son expression est donnée par la
formule (2.18) :
b (x) − a (x)
Ssil = (2.18)
max [a (x) , b (x)]
Où :
1
a(x) = d (u, x) (2.19)
X
|Ck | − 1 u∈Ck ,u̸=x
1 X
Ç å
b (x) = minl̸=k d (u, x) (2.20)
|Cl | u∈Cl
a(x) représente la distance moyenne de x par rapport à tous les autres points du
cluster Ck auquel il appartient et b(x) la plus petite valeur que a(x) pourrait prendre,
si x était assigné à un autre cluster.
2.6.4 Présentation de la technique de formation de sous-zones
Une fois que pour chaque paramètre météorologique des clusters sont formés, nous
formons des sous-zones constituées d’échantillons pour lesquels tous les paramètres
d’études varient identiquement. Ainsi, dans chaque sous-zone l’irradiation, la tempé-
rature, la vitesse du vent varient identiquement pour tous les échantillons. Autrement
dit, tous les échantillons de chaque sous-zone appartiennent aux mêmes clusters pour

chaque paramètre. Il sera alors possible de caractériser chaque sous-zone et de dé-

velopper un seul modèle de prévision fonctionnel pour tous les échantillons de la
sous-zone.
2.6.5 Optimisation du pas d’échantillonnage ∆t
Dans la section 2.4, la technique de quadrillage et d’échantillonnage a été présen-

tée. Dans cette technique, le pas d’échantillonnage qui représente l’écart en latitude
ou en longitude entre deux échantillons d’étude ou de test a été défini. Afin de trou-
ver un nombre d’échantillons vraiment représentatif de toute la zone d’étude, le pas
∆t doit être optimisé. Cette optimisation revient à trouver le nombre d’échantillons
maximum qu’il faut pour que tous les profils différents d’irradiation, de température
et de vitesse de vent soient pris en compte. Le diagramme de la figure 2.15 présente
le principe d’optimisation.

Figure 2.15 – Technique d’optimisation de ∆t
• Nous fixons un score de silhouette minimum de 0,9 : tous les éléments d’un
même cluster doivent se ressembler à 90% ;
• Nous dédoublons le pas d’échantillonnage puis reformons les clusters tant que
les nombres de clusters augmentent : l’augmentation des nombres de clusters
traduit une non-suffisance du nombre d’échantillons pour représenter toute la
zone d’étude ;

Dans cette section, la technique de réduction de la zone d’étude a été présentée.

Le modèle de clustering K-Means a été retenu et le Silhouette Score comme métrique
d’évaluation.
2.7 Caractérisation des sous-zones et détermination des périodes

de production optimale
Une fois les sous-zones formées, elles sont ensuite caractérisées en identifiant les
types de systèmes qui peuvent y être installés (PV, Éolienne, Hybride PV-Éolienne)
pour une production optimale.
2.7.1 Possibilité d’exploitation optimale d’un générateur PV
Pour la décision d’installation d’un système photovoltaïque, seuls les aspects qua-
litatifs de la météo sont pris en compte ici (la disponibilité d’espace ainsi que les
aspects d’ombrage sur le terrain ne sont pas pris en compte). Une production opti-
male serait donc obtenue à partir de :
• une irradiation solaire de qualité et un productible annuel élevé,
• une température adéquate pour le fonctionnement optimal des modules : les
panneaux solaires sont testés à une température d’environ 25°C et sont conçus
pour fonctionner de manière optimale entre 15°C et 35°C.
2.7.2 Identification des périodes de production PV optimale
Une fois l’assurance d’exploitation optimale d’un générateur PV obtenue, les pé-
riodes de l’année où cette production optimale peut être obtenue peuvent être déter-
minées en vérifiant les mois dans lesquels ces conditions sont réunies. Ainsi pendant
les mois à retenir pour une production PV optimale :
• le ciel doit être moyennement clair (indice de clarté moyen élevé) pour garantir
une irradiation de qualité,
• la température ambiante doit être comprise entre 15°C et 35°C.
2.7.3 Possibilité d’exploitation optimale d’un aérogénérateur
L’estimation de l’énergie disponible dans le vent sur un site où l’on se propose

d’implanter une éolienne est l’une des étapes préliminaires de la planification d’un

projet d’énergie éolienne. Wais [298] décrit la technique d’évaluation du vent et ex-
plique sa relation avec la production d’énergie. La puissance disponible du flux d’air
libre qui traverse la section transversale AR , à une vitesse constante v, est :
1
Pv = ρAR v 3 (2.21)
2
2
où ρ est la densité de l’air, AR = πD 4 est la section transversale du rotor et D
est le diamètre du rotor de la turbine. L’équation (2.21) montre que les facteurs
qui influencent la puissance disponible dans le flux éolien sont la surface du rotor
éolien, la densité de l’air et la vitesse du vent. L’effet de la vitesse du vent sur la
valeur de la puissance éolienne est plus important en raison de sa relation cubique.
La détermination des conditions de vent sur le site prévu pour l’implantation de
l’éolienne est une tâche importante, car de petites variations de la vitesse du vent
peuvent entraîner une variation significative de la production d’énergie. Comme la
vitesse du vent varie, il est nécessaire de connaître la distribution des fréquences et
de donner des informations sur le nombre d’heures pendant lesquelles la vitesse se
situe dans une fourchette spécifique.
Le calcul statistique de l’énergie éolienne nécessite la connaissance de la distri-
bution des vitesses du vent sur un site donné. Une détermination correcte de la
distribution de probabilité des valeurs de la vitesse du vent est très importante pour
évaluer l’énergie éolienne dans une région. Bien que différents modèles de distribution
de la vitesse du vent soient appliqués pour ajuster la vitesse du vent sur une période
donnée, la fonction de Weibull à deux paramètres est considérée comme la technique
la plus populaire. Elle est largement utilisée par les chercheurs impliqués dans l’ana-
lyse de la vitesse du vent et de l’énergie éolienne depuis de nombreuses années. En
outre, selon les normes internationales [299], la production annuelle d’énergie est esti-
mée en appliquant une distribution de Rayleigh, qui est identique à une distribution
de Weibull avec un facteur de forme de 2. La procédure mentionnée est utilisée pour
mesurer les caractéristiques de puissance d’un seul système de générateur éolien et
fournit une méthodologie uniforme garantissant la cohérence et la précision de la
mesure et de l’analyse de la puissance d’une turbine éolienne.
La fonction de densité de probabilité de Weibull à deux paramètres est exprimée
par : Å ã k−1
k v
e−( A )
v k
p (v) = (2.22)
A A
où v est la vitesse du vent et v > 0, k > 0, A > 0.

Le facteur sans dimension k détermine la forme de la courbe et est appelé fac-

teur de forme. Le paramètre A, en m/s, est le paramètre d’échelle. Les distributions
prennent des formes différentes selon les valeurs de k et de A. L’énergie disponible
dans le vent peut également être estimée à l’aide de la fonction de densité de proba-
bilité de Weibull. Une fois que l’on dispose des vitesses du vent et de sa distribution,
on connaît la probabilité p(v) pour laquelle la vitesse du vent est v , la puissance
éolienne totale disponible peut s’écrire comme suit :
Z ∞
Pdisponible = Pv × p (v) dv (2.23)
0
En introduisant les équations (2.21) et (2.22), l’équation (2.23) s’écrit comme

suit :
1 1 Z ∞ k+2 −( Av )k
Pdisponible = ρAR k k (v) e dv (2.24)
2 A 0
et :
Edisponible = Pdisponible × tAnnee (2.25)
Les équations (2.24) et (2.36) permettent de calculer la puissance et l’énergie éo-

liennes disponibles pour un site donné. Ainsi il peut facilement être déduit si un
aérogénérateur peut y être installé ou pas.
Afin d’orienter optimalement les pâles du rotor de l’aérogénérateur au cas où il
est installé, la rose de vent aussi doit être représentée pour déterminer les directions
de vent prédominantes.
2.7.4 Identification des périodes de production Éolienne optimale
Une fois rassuré de l’utilisation d’un aérogénérateur dans une sous-zone, la déter-
mination des mois pendant lesquels on peut en faire usage est conditionnée par :
• une vitesse moyenne mensuelle supérieure à la vitesse de démarrage de l’aéro-
générateur à installer,
• une variance faible de la vitesse de vent.
La technique de caractérisation des sous-zones a été présentée dans cette section.
Les critères de définition des configurations des systèmes et d’identification de leurs
périodes de production optimale ont été présentés.

2.8 Développement des modèles de prévision des paramètres mé-

téorologiques
Selon la caractérisation faite de chaque sous-zone, un modèle adapté sera donc

développé. Ainsi les modèles seront soit développés pour effectuer la prévision de la
puissance PV, soit la prévision de la puissance Éolienne ou les deux. De plus ces
modèles ne seront entraînés qu’avec les données des périodes de production optimale
délimitées : il ne servira pas à grande chose une prévision lorsque le système de
production ne sera pas de grande utilité.
Conformément à la technique de prévision retenue (Figure 2.4), un modèle de
prévision des paramètres météorologiques liés à la caractérisation est donc associé à
un modèle d’estimation de la puissance PV.
2.8.1 Modèles de prévision des paramètres météorologiques
Comme montré dans le chapitre 1, plusieurs modèles de l’apprentissage profond

ont été utilisés dans des tâches de prévision des énergies solaire photovoltaïque et
éolienne. Pour notre étude, nous retenons compte tenue de leur performance de pré-
vision, leur simplicité d’implémentation ainsi que leur demande en ressource informa-
tique les réseaux LSTM (Long-Short-Term-Memory) et les réseaux CNN (Convolutio-
nal neural network) combinés avec des méthodes d’extraction et de transformation de
données présentées dans les sections 2.5.3.3.4, 2.5.3.3.5 et 2.5.3.3.6. Une comparaison
des performances de ces deux modèles hybrides que nous nommons TFR-LSTM et
TFR-CNN sera faite afin de choisir pour chaque cas d’application le modèle adéquat.
2.8.1.1 Présentation du réseau LSTM
Le modèle de mémoire à long terme ("Long Short-Term Memory", LSTM) est un

sous-type de réseaux neuronaux récurrents ("Recurrent Neural Networks", RNN). Il
est utilisé pour reconnaître des modèles dans des séquences de données, comme celles
qui apparaissent dans les données des capteurs. Les RNN y parviennent car, outre la
valeur réelle, ils intègrent également sa position dans la séquence dans la prévision.
Le problème des réseaux neuronaux récurrents est qu’ils se contentent de stocker
les données précédentes dans leur "mémoire à court terme". Une fois la mémoire
épuisée, ils suppriment simplement les informations conservées de longue date et
les remplacent par de nouvelles données. Le modèle LSTM tente d’échapper à ce
problème en conservant les informations sélectionnées dans la mémoire à long terme.

Cette mémoire à long terme est stockée dans l’état cellulaire. En outre, il existe
également un état caché dans lequel sont stockées les informations à court terme des
étapes de calcul précédentes. L’état caché est la mémoire à court terme du modèle.
À chaque étape du calcul, l’entrée actuelle x(t) est utilisée, de même que l’état
précédent de la mémoire à court terme c(t − 1) et l’état précédent de l’état caché
h(t − 1). L’architecture d’un réseau LSTM est présentée à la figure 2.16. Une unité
LSTM est alors constituée d’une cellule, d’une mémoire dynamique C et de trois
portes : Forget Gate, Input Gate, Output Gate. En effet, la Forget Gate est une
opération qui amène l’unité à oublier ou à diminuer le poids d’une information qui
était utile à l’instant t − 1 mais qui ne l’est plus à l’instant t alors que l’Input
Gate permet le stockage de nouvelle information inexistante ou de très faible poids à
l’instant t − 1. Enfin, l’output Gate pilote l’information qui sera transmise au temps
t + 1 en fonction de la mémoire dynamique C et de la fonction d’activation. La
cellule LSTM, grâce à ce vecteur mémoire C, mémorise les valeurs sur des intervalles
de temps arbitraires et les trois portes régulent le flux d’informations entrant et
sortant de la cellule.
Figure 2.16 – Architecture d’un réseau LSTM [300]
Mathématiquement, les opérations dans un LSTM sont définies comme suit, où

xt est l’entrée à l’instant t, ht est l’état caché à l’instant t, ct est l’état de la cellule à
l’instant t, σ est la fonction sigmoid, et tanh est la fonction tangente hyperbolique :

• Calcul de la porte d’oubli (ft ) :
ft = σ (Wf ∗ [ht−1 , xt ] + bf ) (2.26)
• Calcul de la porte d’entrée (it ) :
it = σ (Wi ∗ [ht−1 , xt ] + bi ) (2.27)

′
ct = tanh (Wc ∗ [ht−1 , xt ] + bc ) (2.28)
• Mise à jour de l’état de la cellule (ct ) :
′
ct = ft ∗ ct−1 + it ∗ cf (2.29)
• Calcul de la porte de sortie (ot ) :
ot = σ (Wo ∗ [ht−1 , xt ] + bo ) (2.30)
• Calcul de la porte d’oubli (ht ) :
ht = ot ∗ tanh (ct ) (2.31)
Dans ces équations, Wf , Wi , Wc et Wo sont les matrices de poids pour les diffé-
rentes portes, et bf , bi , bc et bo sont les vecteurs de biais correspondants.
2.8.1.2 Présentation du réseau CNN
Les réseaux neuronaux convolutionnels ("Convolutional Neural Networks" - CNN)

ont été développés et sont restés très populaires dans le domaine de la classification
d’images. Cependant, ils peuvent également être appliqués à des problèmes unidimen-
sionnels, tels que la prédiction de la valeur suivante dans la séquence, qu’il s’agisse
d’une série temporelle ou du mot suivant dans une phrase.
Dans le diagramme suivant (Figure 2.17), nous présentons un schéma simplifié
d’un CNN 1D. De façon globale, les CNN en dehors des couches d’entrées et de
sortie sont constitués de trois types de couches : convolutional layers, pooling layers
et fully-connected layers.

Figure 2.17 – Architecture d’un réseau CNN [301]
Un modèle CNN est structuré comme suit :

• Couche de Convolution : La première couche d’un CNN est généralement une
couche de convolution. Elle applique un certain nombre de filtres (kernels) sur
la donnée d’entrée pour extraire des caractéristiques pertinentes. Chaque filtre
parcourt la donnée et produit une "carte d’activation" en appliquant une opé-
ration de convolution. Soit I la donnée d’entrée, K le filtre de convolution, et
B le biais associé. L’opération de convolution pour un élément de sortie O est
donnée par :
O (i, j) = I (i + m, j + n) ∗ K (m, n) + B (2.32)

XX
m n
• Fonction d’Activation : Après chaque opération de convolution, une fonction

d’activation (comme ReLU - Rectified Linear Unit) est appliquée élément par
élément sur la carte d’activation résultante. Cela introduit la non-linéarité dans
le modèle, ce qui lui permet d’apprendre des motifs complexes.
ReLU (x) = max (0, x) (2.33)
• Couche de Pooling : Après certaines couches de convolution, des opérations

de pooling (comme le max-pooling) sont effectuées pour réduire la dimension
spatiale de la carte d’activation et le nombre de paramètres dans le modèle. Le
pooling conserve les caractéristiques essentielles. Pour une région donnée de la

carte d’activation, le max-pooling conserve la valeur maximale :
M ax − P ooling (X) = max (region) (2.34)
• Couches Fully Connected (Denses) : Une ou plusieurs couches fully connected

peuvent suivre les couches de convolution et de pooling. Ces couches effectuent
des opérations linéaires sur les caractéristiques extraites pour effectuer la classi-
fication finale ou d’autres tâches. Soit X la sortie de la couche précédente et W
la matrice de poids et b le biais associé. L’opération fully connected est donnée
par :
Y = X.W + b (2.35)
• Couche de Sortie : La dernière couche du CNN produit les résultats de sortie,

généralement en utilisant une fonction d’activation appropriée (comme softmax
pour la classification) pour obtenir des probabilités ou des scores de classe.
2.8.2 Optimisation des hyperparamètres et développement des modèles
2.8.2.1 Hyperparamètres des modèles du Deep Learning et Technique d’optimi-

sation
Comme montré par les figures 2.16 et 2.17, les réseaux LSTM et CNN sont consti-
tués de plusieurs couches dont les configurations influent sur leurs performances d’ap-
prentissage. Ainsi pour une tâche de prévision donnée, le paramétrage optimal pour
aboutir à de bonnes performances de prévision avec un temps de calcul réduit doit
être recherché.
En général, l’élaboration d’un modèle d’apprentissage automatique efficace est un
processus complexe et fastidieux qui implique de déterminer l’algorithme approprié et
d’obtenir une architecture de modèle optimale en réglant ses hyperparamètres (HP).
Il existe deux types de paramètres dans les modèles d’apprentissage automatique :
l’un peut être initialisé et mis à jour par le processus d’apprentissage des données,
appelé paramètres du modèle ; l’autre, appelé hyperparamètres, ne peut pas être
estimé directement à partir de l’apprentissage des données et doit être défini avant
l’entraînement d’un modèle d’apprentissage automatique car il définit l’architecture
d’un modèle d’apprentissage automatique. Les hyperparamètres sont les paramètres
utilisés pour configurer un modèle ML ou pour spécifier l’algorithme utilisé pour
minimiser la fonction de perte.
Pour construire un modèle optimal, il faut explorer un éventail de possibilités.

Le processus de conception de l’architecture idéale du modèle avec une configuration

optimale des hyperparamètres est appelé réglage des hyperparamètres. Le réglage des
hyperparamètres est considéré comme un élément clé de la construction d’un modèle
efficace, en particulier pour les modèles à base d’arbres et les réseaux neuronaux
profonds qui comportent de nombreux hyperparamètres. Ce processus diffère d’un
algorithme à un autre en raison des différents types d’hyperparamètres. Le test ma-
nuel est une méthode traditionnelle de réglage des hyperparamètres et est encore très
répandu bien qu’il nécessite une compréhension approfondie des algorithmes et des
valeurs de leurs hyperparamètres. Cependant, le réglage manuel est inefficace pour
de nombreux problèmes en raison de certains facteurs, notamment un grand nombre
d’hyperparamètres, des modèles complexes, des évaluations de modèles fastidieuses
et des interactions non linéaires entre les hyperparamètres. Ces facteurs ont sus-
cité une intensification des recherches sur les techniques d’optimisation automatique
des hyperparamètres, appelées optimisation des hyperparamètres (OHP). L’objectif
principal de l’optimisation des hyperparamètres est d’automatiser le processus de ré-
glage des hyperparamètres et de permettre aux utilisateurs d’appliquer efficacement
les modèles d’apprentissage automatique à des problèmes pratiques. L’architecture
optimale d’un modèle d’apprentissage automatique est donc censée être obtenue à
l’issue d’un processus d’optimisation des hyperparamètres.
2.8.2.1.1 Hyperparamètres des modèles du Deep Learning

Par rapport à d’autres modèles du Machine Learning, les modèles du Deep Lear-
ning bénéficient davantage de l’OHP car ils ont souvent de nombreux hyperpara-
mètres qui doivent être réglés. Le premier ensemble d’hyperparamètres est lié à la
construction de la structure d’un modèle d’apprentissage profond. Étant donné que
tous les modèles de réseaux neuronaux comportent une couche d’entrée et une couche
de sortie, la complexité d’un modèle d’apprentissage profond dépend principalement
du nombre de couches cachées et du nombre de neurones de chaque couche, qui
sont les deux principaux hyperparamètres de construction des modèles d’appren-
tissage profond. Ces deux hyperparamètres sont définis et réglés en fonction de la
complexité des ensembles de données ou des problèmes. Les modèles du DL doivent
avoir une capacité suffisante pour modéliser les fonctions objectives (ou les tâches de
prédiction) tout en évitant l’ajustement excessif. À l’étape suivante, certains types
de fonctions doivent être définis ou réglés. Le premier type de fonction à configurer
est le type de fonction de perte, qui est choisi principalement en fonction du type de

problème (par exemple, l’entropie croisée binaire pour les problèmes de classification
binaire, l’entropie croisée multi-classes pour les problèmes de multi-classification et
la RMSE pour les problèmes de régression). Un autre hyperparamètre important est
le type de fonction d’activation utilisé pour modéliser les fonctions non linéaires, qui
peut être réglé sur "softmax", "rectified linear unit (ReLU)", "sigmoïde", "tanh" ou
"softsign". Enfin, le type d’optimiseur peut être défini comme suit : descente sto-
chastique du gradient ("stochastic gradient descent", SGD), estimation adaptative
des moments ("adaptive moment estimation", Adam), propagation de la moyenne
quadratique ("root mean square propagation", RMSprop), etc.
D’autre part, d’autres hyperparamètres sont liés au processus d’optimisation et
d’apprentissage des modèles du DL ; ils sont donc classés dans la catégorie des hy-
perparamètres d’optimisation. Le taux d’apprentissage est l’un des hyperparamètres
les plus importants dans les modèles du DL. Il détermine la taille du pas à chaque
itération, ce qui permet à la fonction objectif de converger. Un taux d’apprentissage
élevé accélère le processus d’apprentissage, mais le gradient peut osciller autour de la
valeur minimale locale, voire ne pas converger. En revanche, un taux d’apprentissage
faible converge en douceur, mais augmente considérablement la durée d’apprentis-
sage du modèle en exigeant davantage le nombre de sessions d’apprentissage. Un taux
d’apprentissage approprié permet à la fonction objective de converger vers un mini-
mum global en un temps raisonnable. Un autre hyperparamètre courant est le taux
d’abandon. L’abandon est une méthode de régularisation standard pour les modèles
DL, proposée pour réduire l’ajustement excessif. Dans cette méthode, une proportion
de neurones est sélectionnée et supprimée de manière aléatoire, et le pourcentage de
neurones à supprimer doit être ajusté.
La taille du mini-lot et le nombre de cycles sont les deux autres hyperparamètres
des modèles du DL qui représentent respectivement le nombre d’échantillons traités
avant la mise à jour du modèle et le nombre de passages complets sur l’ensemble de
données de formation. La taille du mini-lot est affectée par les besoins en ressources
du processus de formation, la vitesse et le nombre d’itérations. Le nombre de cycles
dépend de la taille de l’ensemble d’apprentissage et doit être ajusté en augmentant
lentement sa valeur jusqu’à ce que la précision de validation commence à diminuer,
ce qui indique un surajustement. D’autre part, les modèles DL convergent souvent
en quelques cycles, et les cycles suivants peuvent entraîner un temps d’exécution
supplémentaire inutile et un surajustement, ce qui peut être évité grâce à la mé-
thode d’arrêt anticipé. L’arrêt anticipé est une forme de régularisation par laquelle
l’apprentissage du modèle s’arrête à l’avance lorsque la précision de la validation

n’augmente pas après un certain nombre de cycles consécutifs. Le nombre de cycles

d’attente, appelé patience d’arrêt précoce, peut également être réglé pour réduire le
temps d’apprentissage du modèle.
2.8.2.1.2 Techniques d’optimisation

Dans la littérature, de nombreuses techniques d’optimisation des hyperparamètres
sont utilisées : le Babysitting [302], le Grid Search, l’algorithme de recherche aléa-
toire, l’Optimisation basée sur le gradient, l’Optimisation bayésienne et des tech-
niques hybrides. Pour nos travaux nous faisons recourt à KerasTuner qui est une
bibliothèque python open-source développée exclusivement pour l’ajustement des
hyperparamètres des réseaux neuronaux artificiels [303]. KerasTuner intègre les al-
gorithmes d’optimisation bayésienne, d’hyperbande et de recherche aléatoire. Il est
également conçu pour être facilement extensible par les chercheurs afin d’expérimen-
ter de nouveaux algorithmes de recherche.
2.8.2.2 Hyperparamètres des modèles CNN et LSTM
Les tableaux 2.3 et 2.4 présentent respectivement les hyperparamètres à optimiser

pour les réseaux CNN et LSTM ainsi que leurs plages de variation.
Tableau 2.3 – Hyperparamètres du modèle CNN et plages de variation
Hyperparamètres du modèle CNN Plages de variation

Taille des données d’entrée 72 heures
Taille des données de sortie 24 à 72 heures par pas de 24h
Nombre de Filtre 10 à 300 par pas de 10
Nombre d’unité 10 à 1000 par pas de 10
Learning_rates Entre 10−2 , 10−3 et 10−4
Tableau 2.4 – Hyperparamètres du modèle LSTM et plages de variation
Hyperparamètres du modèle LSTM Plages de variation

Taille des données d’entrée 72 heures
Taille des données de sortie 24 à 72 heures par pas de 24h
Nombre d’unité 10 à 1000 par pas de 10
Learning_rates Entre 10−2 , 10−3 et 10−4

• Nous fixons la taille des données passées à renseigner à 72h ;

• Nous faisons varier la taille de l’horizon de prévision entre 24h et 72h par pas
de 24 heures. Ceci nous permet de développer plusieurs modèles selon l’objectif
de prévision (suivant les horizons de prévision, des applications différentes sont
possibles) ;
• Les nombres d’unités des deux modèles sont variés entre 10 et 1000 par pas de
10 ;
• Le nombre de filtres du modèle CNN est varié entre 10 et 300 par pas de 10 ;
• Trois rythmes d’apprentissage sont testés : 10−2 , 10−3 et 10−4 ;
2.8.3 Entraînement des modèles
Une fois les paramètres optimaux des modèles déterminés, ils sont ensuite entraî-
nés avec les données des périodes de production optimales identifiées pour chaque
sous-zone. Ceci nous conduira au développement de modèles de prévision efficaces
pour la prévision des puissances de sortie des systèmes caractéristiques de toutes
les sous-zones. Le développement et l’entraînement des modèles sont faits avec Ten-
sorflow sous python. TensorFlow est une plateforme open source de pointe pour
l’apprentissage automatique. Elle dispose d’un écosystème complet et flexible d’ou-
tils, de bibliothèques et de ressources communautaires qui permet aux chercheurs
de faire progresser l’apprentissage automatique et aux développeurs de créer et de
déployer facilement des applications basées sur l’apprentissage automatique [304].
2.8.4 Validation expérimentale des performances de prévision des paramètres

météorologiques
Une fois les modèles développés, pour valider leurs performances, une deuxième
validation cette fois ci expérimentale est prévue. Leurs prévisions (irradiation, tem-
pérature et vitesse du vent prévues) sont comparées à des valeurs mesurées sur site.
Pour cela une station météorologiques à été acquise (Figure 2.18).
Elle est composée d’un capteur de température atmosphérique RK330-01B (Fi-
gure 2.19), un pyranomètre RK200-04 (Figure 2.20), un anémomètre RK100-02 (Fi-
gure 2.21), une girouette RK110-02 (Figure 2.22) et un enregistreur de données
RK600-07B (Figure 2.23).

Figure 2.18 – Station météorologique
Figure 2.19 – Capteur de température atmosphérique RK330-01B [305]

Figure 2.20 – Pyranomètre RK200-04 [306]
Figure 2.21 – Anémomètre RK100-02 [307]
Figure 2.22 – Girouette RK110-02 [308]

Figure 2.23 – Enregistreur de données RK600- 07B [309]
Une documentation détaillée sur chaque capteur ainsi que sur l’enregistreur de
données utilisé est fournie en ANNEXE A.
Dans cette section la méthodologie de développement des modèles de prévision
des paramètres météorologiques d’influence a été présentée. Ainsi les modèles CNN
et LSTM ont été retenus et la librairie python Keras Tuner a été retenue pour l’op-
timisation de leurs hyperparamètres. La librairie python Tensorflow à été retenue
pour le développement et l’entrainement des modèles. Pour la validation expérimen-
tale des performances de prévision, des capteurs sont prévus pour mesurer sur site
les données météorologiques afin d’être comparées aux prévisions.
2.9 Estimation des puissances de sortie
Une fois les prévisions des paramètres météorologiques effectuées, il est alors pos-
sible d’estimer les puissances de sorties à l’aide de modèles mathématiques appro-
priés.
2.9.1 Modèles d’estimation de la puissance électrique d’un aérogénérateur
La figure 2.24 présente une courbe typique de la puissance éolienne. Elle peut être
divisée en quatre régions en fonction de la vitesse du vent à l’entrée (VI ), de la vitesse
du vent nominale (VR ) et de la vitesse du vent à la sortie (VO ). Lorsque la vitesse du
vent (V ) est inférieure à VI (c’est-à-dire dans l’intervalle [0; VI ] ; Région I), l’éolienne
est à l’arrêt et aucune énergie éolienne n’est produite. Par ailleurs, aucune énergie éo-
lienne n’est produite lorsque la vitesse du vent dépasse VO (région IV), car l’éolienne

est arrêtée pour éviter les défauts et les dommages. Lorsque VR < V < VO , l’éolienne
produit la puissance éolienne nominale. Pour la courbe de puissance théorique, four-
nie par le fabricant de l’éolienne et estimée dans des conditions météorologiques et
topographiques idéales, la puissance éolienne (P ) dans l’intervalle VI ≤ V ≤ VR (ré-
gion II) est exprimée par 12 Cp ρπR2 V 3 , où Cp ; ρ ; R représentent respectivement le
coefficient de puissance de l’éolienne, la densité de l’air et le rayon du rotor éolien.
Figure 2.24 – Courbe typique de la puissance éolienne [310]
Actuellement, beaucoup d’efforts sont consacrés au développement de modèles de

courbes de puissance appropriés. Ces courbes peuvent être classées en deux grandes
catégories : les modèles de courbes de puissance déterministes et les modèles de
courbes de puissance probabilistes comme le montre la figure 2.25.
Les modèles déterministes de courbe de puissance peuvent être divisés en mo-
dèles d’ajustement de courbe et en approches basées sur l’intelligence artificielle et
fondées sur la théorie de la modélisation. Pour faire usage des approches basées
sur l’intelligence artificielle, des données de puissance doivent être relevées sur l’ins-
tallation. Dans la suite nous ne détaillons donc que les modèles d’ajustement. Les
modèles d’ajustement de courbe sont construits sur la base de la forme de la courbe
de puissance, une courbe en S lisse. Selon les expressions mathématiques des modèles
d’ajustement de courbe, ils peuvent également être divisés en deux sous-groupes : les
modèles d’ajustement de courbe de puissance segmentée et les modèles d’ajustement
de courbe de puissance intégrée. Les premiers divisent généralement la courbe de
puissance en différentes régions, comme le montre la figure 2.24.

Figure 2.25 – Catégorisation des modèles de courbes de puissance.
L’expression des modèles d’analyse de la courbe de puissance segmentée peut

alors être résumée comme suit :

p1 (V ) si 0 < V < VI ou V > VO






P (V ) = p2 (V ) si V I ≤ V ≤ VR (2.36)



p3 (V ) si

VR < V < VO

où p1 (V ) et p3 (V ) sont généralement égaux à 0 et à la puissance éolienne nominale PR ,

respectivement. Pour les modèles d’estimation de la courbe de puissance intégrée, des
fonctions en forme de S avec plusieurs paramètres sont généralement utilisées pour
modéliser directement l’ensemble de la courbe de puissance. Les modèles d’ajuste-
ment des courbes segmentées comprennent le modèle segmenté linéarisé, la courbe
de puissance polynomiale, la courbe de puissance basée sur la fonction sigmoïde et
la courbe de puissance basée sur la FDC (fonction de distribution cumulative) gaus-
sienne.
2.9.1.1 Modèle segmenté linéarisé
En général, un modèle segmenté linéarisé divise la courbe de puissance avec la

vitesse du vent correspondante située dans l’intervalle [VI ; VR ] en une ou plusieurs
parties, ce qui peut être obtenu par une approximation par morceaux de l’équation
d’une ligne droite [311, 312].
p2 (V ) = mV + c (2.37)
où m est la pente du segment et c une constante dans le segment. Lorsqu’il n’y a

qu’un seul segment, m = VRP−V
R
I
et c = 0. Ainsi,
V − VI
p2 (V ) = PR (2.38)
VR − VI
Cependant, pour plusieurs segments, un modèle plus général semble donner des ré-
sultats plus précis, comme l’exprime l’équation (2.39) [313–315] :
V k − VIk
p2 (V ) = PR (2.39)
VRk − VIk
où k est la constante de proportionnalité de la puissance du vent [313–315].

D’autres auteurs ont divisé la courbe de puissance en n parties distinctes et ont

utilisé le modèle linéaire par morceaux suivant, qui peut être écrit comme un sys-
tème d’équations linéaires, pour décrire la courbe de puissance [316]. L’expression
correspondante peut être exprimée comme suit :

p1 (V ) = b1 V + a1



 si c0 < V < c1



p2 (V ) = b2 V + a1 + (b1 − b2 ) c1

si c1 < V < c2


P (V ) = (2.40)
.. .. ..
. . .







pn (V ) = bn V + a1 + n̸=1 (bn−1 − bn ) cn−1 si cn−1 < V < cn

 Pn−1

où c1 ; · · · ; cn sont les points de rupture, c0 = 0, a1 est l’ordonnée à l’origine du

premier segment de droite, et pi le ième segment linéaire à la pente bi sur la plage
ci−1 < V < ci .
2.9.1.2 Courbe de puissance polynomiale
Les modèles polynomiaux sont généralement utilisés pour modéliser la relation

non linéaire entre la vitesse du vent et la puissance éolienne lorsque la vitesse du vent
est comprise entre la vitesse d’enclenchement et la vitesse nominale. Pour garantir une
meilleure précision de la modélisation, la région 2 est parfois segmentée en plusieurs
parties indépendantes en fonction de la vitesse du vent [317–319]. La région 2 est
subdivisée en n blocs indépendants, et la courbe de puissance dans chaque bloc est
modélisée par un modèle polynomial cubique. La courbe de puissance complète peut
être exprimée comme suit :

0 si 0 < V < VI ou V > VO







p1 (V ) = a1 V 3 + b1 V 2 + c1 V + d1 VI ≤ V ≤ V1



 si



 p2 (V ) = a2 V 3 + b2 V 2 + c2 V + d2

si V1 ≤ V ≤ V2

P (V ) = (2.41)
.. .. ..
. . .







pn (V ) = an V 3 + bn V 2 + cn V + dn si

Vn−1 ≤ V ≤ VR







PR si V R ≤ V ≤ VO


où a1 ; · · · ; an , b1 ; · · · ; bn , c1 ; · · · ; cn , d1 ; · · · ; dn sont les paramètres du modèle.

2.9.1.3 Courbe de puissance basée sur la fonction sigmoïde
En raison de l’apparente symétrie de rotation de la courbe de puissance, la courbe

de puissance de la région 2 est ajustée par la fonction sigmoïde [320, 321], à savoir :
s
p2 (V ) = −m (2.42)
1 + e−a(V −c)
où s est l’échelle, a est l’exposant, c et m représentent le centre et un décalage,

respectivement. Dans la fonction sigmoïde ci-dessus, c et m sont inclus pour rendre
le modèle plus flexible.
2.9.1.4 Courbe de puissance gaussienne basée sur la FDC
La première version d’une courbe de puissance basée sur une fonction de distri-
bution cumulative gaussienne (FDC) est donnée dans [321].
2
1 (x − c) 1 1
ñ ô
V −c
Z V Å ã
p2 (V ) = √ exp − dx = + erf √ (2.43)
−∞ 2πa 2a2 2 2 2a
où c et a sont la moyenne et l’écart-type de la FDC gaussienne, la fonction erf (·)

est disponible dans divers logiciels et est définie comme suit :
2 Zz
erf (z) = √ exp −u2 du (2.44)

π 0
En raison de la forme non exacte de la symétrie de rotation de la courbe de

puissance, la courbe de puissance gaussienne originale basée sur la FDC est améliorée
par l’ajout de deux paramètres afin d’accroître la flexibilité du modèle. Ainsi, la
courbe de puissance gaussienne améliorée basée sur la FDC est donnée par [321] :
2
1 (x − c)
ñ ô
V −c
Z V s s Å ã
p2 (V ) = −m+s √ exp − dx = − m + erf √ (2.45)
−∞ 2πa 2a2 2 2 2a
où m est un décalage supplémentaire et s est le facteur d’échelle.

Pour une simplicité d’application, le modèle segmenté linéarisé est retenu pour la
suite des travaux.

2.9.2 Modèles d’estimation de la puissance PV
Les modèles de puissance sont basés sur une représentation de l’efficacité du

module PV en un seul point. Ils estiment la puissance fournie par le module PV
lorsqu’il fonctionne au point de puissance maximale ("Maximum Power Point", MPP)
et, en fonction de la complexité du modèle, ils peuvent estimer la puissance de sortie
dans des conditions opérationnelles variables avec une précision acceptable. Nous
présentons ci-dessous les modèles de puissance mis en œuvre dans le cadre du présent
travail.
2.9.2.1 Modèles physiques ou de courbes I-V complètes
Les modèles de puissance sont uniquement capables d’estimer la puissance de sor-

tie du réseau PV lorsqu’il fonctionne à son point de puissance maximale. Mais lors-
qu’il est nécessaire de connaître la courbe caractéristique complète courant/tension
(I-V) de la cellule photovoltaïque, des modèles permettant de calculer les caractéris-
tiques électriques de la cellule photovoltaïque dans des conditions de fonctionnement
variables sont nécessaires. Différentes approches ont été proposées pour approximer la
courbe I-V, allant de modèles empiriques à des techniques d’interpolation. Mais l’ap-
proche la plus utilisée consiste à représenter la cellule photovoltaïque par un circuit
électrique équivalent. En fonction du type de dispositif, de la précision requise et/ou
de la disponibilité des informations, différents modèles mathématiques peuvent être
adoptés. Le modèle à double diode, initialement proposé par Wolf et Rauschenbach
[322], est particulièrement précis lorsqu’il s’agit de conditions de faible éclairage, mais
n’est pas intéressant pour simuler des modules solaires dans des conditions d’exploita-
tion réelles, lorsque le système PV fonctionne principalement à des niveaux élevés de
rayonnement solaire [323]. L’examen de la littérature révèle que le modèle de circuit
à une diode est le plus couramment utilisé dans les applications d’ingénierie, car il
offre un bon compromis entre la simplicité et la précision [324, 325]. Par conséquent,
ce type de modèle de cellule PV est adopté dans le présent travail.
Le circuit équivalent à une diode est illustré à la figure 2.26(a) et l’équation carac-
téristique correspondante est l’équation (2.46). Dans ce cas, cinq paramètres doivent
être déterminés pour caractériser complètement l’équation : le courant lumineux (IL ),
le courant de saturation de la diode (Io ), la résistance en série (Rs ), la résistance en
dérivation (Rsh ) et le facteur d’idéalité de la diode (n). Vt = Nc Tc k/q est la tension
thermique du module avec Nc cellules connectées en série, Tc [K] est la température
de la cellule, k est la constante de Boltzmann (1, 381 × 10−23 J/K) et q est la charge

électronique (1, 605 × 10−19 C).
V + IRs V + IRs
ï Å ã ò
I = IL − ID − Ish = IL − Io exp −1 − (2.46)
nVt Rsh
Figure 2.26 – Circuit électrique équivalent de la représentation d’une cellule PV à

une diode : (a) en considérant les résistances shunt et série ; (b) en considérant la
résistance shunt infinie.
Dans la pratique, la résistance shunt présente une valeur élevée, certains auteurs
la considèrent donc comme infinie et la négligent. Cette simplification conduit à la
deuxième version du circuit équivalent à une diode illustré à la figure 2.26(b) et à sa
caractéristique (Équation 2.47), où seuls quatre paramètres doivent être déterminés.
V + IRs
ï Å ã ò
I = IL − ID − Ish = IL − Io exp −1 (2.47)
nVt
Afin d’utiliser les modèles de circuits électriques, les paramètres de l’équation carac-
téristique (IL , Io , Rs , Rsh et n), qui sont différents pour chaque type de module photo-
voltaïque, doivent être déterminés. Il s’agit d’une tâche non triviale car les équations
simultanées sont généralement non linéaires et comprennent des termes exponentiels.
Plusieurs méthodes d’extraction des paramètres ont été proposées ces dernières an-
nées ; ces méthodes peuvent être classées en trois catégories, à savoir les méthodes
analytiques, itératives et évolutionnaires. Les méthodes analytiques [323, 326, 327]
introduisent une série de simplifications et d’approximations qui permettent un cal-
cul rapide. Néanmoins, leur précision dans des conditions de fonctionnement non
standard s’avère médiocre. Les méthodes itératives [324, 328, 329] utilisent des mé-
thodes numériques pour résoudre les équations non linéaires associées au modèle PV.
Les méthodes numériques sont largement utilisées car elles offrent un compromis rai-
sonnable entre la simplicité, la précision et la vitesse de calcul. D’un autre côté, ces
méthodes dépendent largement des conditions initiales, ce qui affecte leur précision

et leur convergence. Ces dernières années, des algorithmes d’intelligence artificielle

ont été utilisés pour l’extraction des paramètres des modèles PV [330–332]. Bien
qu’elles permettent d’obtenir des résultats plus précis, les techniques d’intelligence
artificielle nécessitent des temps de simulation importants.
2.9.2.2 Modèles empiriques ou de type MPP (Maximum Power Point)
La modélisation de la puissance de sortie maximale d’un générateur PV en fonc-

tion des conditions de fonctionnement nécessite la résolution de la fonction donnée
par l’équation 2.48.
PM P P = PM P P (G, Tc ) (2.48)
Où PM P P est la puissance de sortie du générateur PV au point de puissance

maximale et G et Tc représentent les conditions de fonctionnement, c’est-à-dire l’ir-
radiation effective dans le plan et la température du module PV. Il convient de noter
que le point particulier correspondant aux conditions d’essai standard ("Standard
Test Conditions", STC) (irradiation = 1000W/m2 ; spectre AM 1, 5 ; température de
la cellule = 25 °C) correspond simplement à la puissance nominale du générateur
photovoltaïque. Un astérisque (*) sera utilisé pour se référer aux paramètres mesu-
rés dans ces conditions. Par conséquent, PM ∗
P P = PM P P (G , Tc ) et les valeurs de
∗ ∗
puissance, de rendement, d’irradiation et de température seront liées au STC comme

indiqué dans 2.49 :
′ PM P P ′ η ′ G ′
p = ∗ ; η = ∗ ; G = ∗ ; T = Tc − Tc∗ (2.49)
PM P P η G
Le modèle MPP le plus simple consiste à supposer une relation linéaire entre la
puissance et l’irradiation. C’est l’équation (2.50) :
′ ′ ′
p = G ou η = C ste (2.50)
Cependant, la constance du rendement dans toute la gamme des conditions de fonc-

tionnement n’est guère réaliste. Un premier raffinement consiste à considérer que le
rendement est affecté par la température, diminuant à un taux constant, pour donner
l’équation 2.51 :
′ ′
Ä ä
η = 1 + γT (2.51)
où γ, le coefficient de température de puissance, est considéré comme une valeur

constante. Cette valeur est presque toujours indiquée dans les fiches techniques. Cette

formule est bien établie [333, 334] et est encore largement utilisée.
Au lieu d’utiliser un coefficient forfaitaire pour la puissance, un modèle similaire
peut être écrit à partir des coefficients de température pour le courant de court-
circuit, la tension en circuit ouvert et le facteur de remplissage, α, β (toujours trouvé
dans les fiches techniques) et ξ, respectivement. On déduit de l’équation 2.51 l’équa-
tion 2.52 qui suit :
′ ′ ′ ′
Ä äÄ äÄ ä
η = 1 + αT 1 + βT 1 + ξT (2.52)
Où γ répond à l’équation suivante :
γ =α+β+ξ (2.53)
Étant donné que, dans la pratique, le facteur de remplissage ("Filling factor",FF)

est beaucoup moins sensible à la température que la tension en circuit ouvert (Voc ),
certains auteurs ont suggéré de le considérer comme une constante, soit ξ = 0 [335].
Avec ces modèles, il peut être légèrement compliqué de prendre en compte l’effi-
cacité dépendant de l’irradiation. Bien que cela ait été tenté initialement en ajoutant
un logarithme de base 10 [336], il est préférable d’utiliser un modèle proposé il y a
plus de dix ans [337, 338] et déjà utilisé par un certain nombre d’auteurs [339, 340].
Il s’agit de l’équation (2.54) :
′ ′ ′ ′
Ä äÄ ä
η = 1 + γT a1 + a2 G + a3 ln G (2.54)
où a1 , a2 et a3 sont des paramètres ajustés empiriquement. Étant donné que la

particularisation de cette équation pour le STC conduit à la condition donnée par
l’équation (2.56),
a1 + a2 = 1 (2.55)
ils peuvent être déterminés à partir de deux valeurs de la relation entre l’efficacité
et l’irradiation. Les fiches techniques ne donnent souvent que la valeur pour 200
′
W/m2 , η (0, 2). Il convient de noter que l’efficacité augmente avec la diminution
′
de l’irradiation, en raison de la résistance en série, représentée par le terme a2 G ,
donnant a2 ≤ 0, tandis que l’efficacité diminue avec la diminution de l’irradiation,
′
en raison de la résistance en dérivation, représentée par le terme a3 ln G , donnant
a3 ≥ 0. Par conséquent, une approximation prudente uniquement basée sur cette

valeur suppose l’équation suivante :

′
η (0, 2) − 1
a1 = 1; a2 = 0; a3 = (2.56)
ln (0, 2)
Le tableau 2.5 contient une liste chronologique d’une variété de modèles MPP pro-
posés depuis le milieu des années quatre-vingt-dix - Équations 2.57 à 2.68. Notons
que les modèles diffèrent en ce qui concerne le nombre de paramètres empiriques
impliqués, allant de seulement deux (Équations 2.57 et 2.59) - jusqu’à six - Equa-
tions 2.62 et 2.67. Les propositions sont souvent justifiées par l’amélioration de la
précision, principalement pour les couches minces et les faibles irradiations, ainsi que
par le traitement du logarithme dans le cas où G = 0. Cependant, il est étonnam-
ment troublant de constater que les comparaisons avec les propositions de modèles
précédentes sont pratiquement absentes des publications décrivant la plupart de ces
modèles (de nombreux modèles n’ont été présentés qu’à des conférences, mais pas
dans des revues évaluées par des pairs). Il est intéressant de noter que des essais
circulaires de différentes méthodes de prédiction de l’énergie basées sur certains de
ces modèles dans le cadre des projets européens "PV-Catapult" et "Performance", qui
portent sur l’établissement de normes pour l’industrie photovoltaïque, ont conclu que
"toutes les méthodes étaient capables de prédire très bien la production d’énergie de
modules connus dans différents environnements" [341] et que "toutes les méthodes
de prédiction de l’énergie ont donné des résultats similaires, ce qui ne permet pas
d’effectuer une sélection préférentielle" [342].
Tableau 2.5 – Différents modèles MPP trouvés dans la littérature
Référence Formulation
Evans [336]
′
Ä ′ ′ä ′ ′
η G , T = 1 + a1 T + a2 log10 G (2.57)
Taylor [343]
′
Ä ′ ′ä ′ ′
η G , T = A + BG + CT (2.58)
Randall [337]
′
Ä ′ä ′
η G = 1 + a ln G (2.59)

Référence Formulation
Willians [59]
′
Ä ′ä ′ ′
η G = a1 + a2 G + a3 ln G (2.60)
Willians [338]
′
Ä ′ ′ä Ä ′
äÄ ′
Ä ′ä ′
ä
η G , T = 1 + αT 1 + c0 ln G + c1 ln2 G + βT (2.61)
Rosell [344]
PDC (Gef f , Tc ) = D1 Gef f + D2 Tc + D3 (ln Gef f )D5 + D4 Tc (ln Gef f )D5 (2.62)
Durisch [242]
Ä ′ ä î ′ Ä ′ äó Å Tc
ã
η G , Tc = a bG + G 1+d +e (2.63)
25
Heydenreich ï Å ã ò
G+e
[345] η (G) = aG + b ln (G + 1) + c ln2 −1 (2.64)
G+1
Montgareuil
′
Ä ′ä Ä ′ ä ′
Ä ′ ä2 Ä ′ä
[346] η G = 1 + a G − 1 + b ln G + c G − 1 + d ln2 G (2.65)
Reich [340]
′
Ä ′ä ′
Ä ′ ä
η G = a1 + a2 G + a3 ln G + a4 (2.66)
Huld [347]
Ä ′ ′ä ′
Ä ′ ′
ä ′ ′ ′ ′ ′
Ä ′ ä2
∗
PM P P G , T = G PM P P + k1 ln G + k2 ln G + k3 T + k4 T ln G + k5 T ln G + k6 T (2.67)
Silva [348]
′ 1 äÄ 1
Ä ä
η (G) = 1 + b ln G∗ − c (G∗ ) 2 1 + b ln G − cG 2 (2.68)
′
Ä ′ä Ä ′ä
Les formulations pour seulement η G et η G supposent implicitement que
la dépendance de l’efficacité par rapport à la température est donnée par un facteur
′
Ä ä
supplémentaire 1 + γT . Toutes les lettres autres que G, T et P représentent des
paramètres non dimensionnels ajustés empiriquement. Une idée immédiate qui se

dégage de ces comparaisons est que seuls trois paramètres indépendants, un pour la
température et deux pour l’irradiation, suffisent à décrire avec précision les perfor-
mances photovoltaïques des modules photovoltaïques en termes relatifs au STC.
Pour nos travaux, nous retenons le modèle d’Evans pour sa simplicité d’applica-
tion et sa prise en compte de l’irradiation et de la température pour l’estimation de
la puissance PV.
2.9.3 Validation expérimentale des techniques d’estimation des puissances de sor-

tie
Afin de valider les techniques d’estimation de puissances PV et éolienne retenues,

des systèmes PV (Figure 2.27) et éolien (Figure 2.28) ont été mis en place. Sur
ces systèmes, les puissances de sorties sont relevées puis comparées aux puissances
estimées à partir des valeurs prévues des paramètres météorologiques.
Figure 2.27 – Système PV d’expérimentation

Figure 2.28 – Aérogénérateur d’expérimentation
Plus de détails sont donnés sur les différents systèmes ainsi que leurs constituants
en ANNEXE A.
Dans cette section les choix des modèles les modèles d’estimation des puissances
éolienne et PV ont été présentés ainsi que les bancs d’essai pour la validation des
puissances prévues. Ces bancs sont constitués essentiellement d’un panneaux PV,
d’un aérogénérateur et des dispositifs d’acquisition de données. Le modèle d’Evans a
été retenu pour l’estimation de la puissance PV et le modèle segmenté linéarisé pour
l’approximation des courbes de puissance d’éoliennes.
2.10 Conception de l’outil d’identification des périodes de produc-

tion optimale et de prévision
Une fois les modèles optimaux développés et validés, le progiciel, livrable de cette
thèse peut être développé. Les différentes fonctionnalités de ce progiciel sont listées
ci-dessous :
• L’application communique à distance avec un système d’acquisition installé sur
le système de production et affiche en temps réel les mesures ;

• L’application, à partir des coordonnées géographiques renseignées du site, iden-

tifie la configuration adaptée, les périodes de production optimale ainsi que les
modèles de prévision adaptés au site ;
• L’application à partir de valeurs mesurées sur le site, fait des prévisions de tous
les paramètres météorologiques ;
• A partir des paramètres du système installé, l’application estime les puissances
futures.
Le diagramme du fonctionnement de l’application est présenté à la figure 2.29.
Pour développer cette application, nous utilisons l’outil App Designer de MATLAB
qui est un environnement de développement interactif permettant de concevoir une
application et de programmer son comportement.
Figure 2.29 – Diagramme de fonctionnement du progiciel
Enfin dans cette dernière section, les étapes de conception du progiciel sont pré-
sentées ainsi que ses différentes fonctionnalités.

Dans ce chapitre, le diagramme de recherche suivi dans ces travaux a été présenté.
Partant de l’acquisition des données, leur traitement en passant par la subdivision de
la zone d’étude, la caractérisation des sous-zones, le développement des modèles de
prévision et d’estimation de puissances pour finir par les validations expérimentales,
toutes les étapes de la méthodologie suivie ont été présentées en détail. Dans le
chapitre suivant les résultats d’application de cette démarche seront présentés.

CHAPITRE 3
Résultats d’application de la technique de

prévision développée au territoire béninois


Résultats d’application de la technique de prévision développée au territoire béninois
Introduction
Dans ce chapitre, les résultats d’application de la méthodologie présentée dans le

chapitre 2 au territoire béninois sont présentés.
3.1 Présentation du Bénin et de ses potentialités en énergies solaire

photovoltaïque et éolienne
Le Bénin est un pays de l’Afrique de l’Ouest dont la superficie est estimée à

112 622 km2 . Avec une population estimée en 2020 à 12 864 634 habitants dont 52%
vivaient en zone rurale, le taux d’accès à l’électricité y était estimé à 41,4% avec une
vingtaine de communes ayant un taux d’accès inférieur à 5 % (Figure 3.1). Celui en
zone rurale quant à lui était estimé à 18,2 %.
Figure 3.1 – Taux d’accès à l’énergie électrique par commune [342]

Comme le montre la Figure 3.2, le potentiel énergétique photovoltaïque annuel

au Bénin varie entre 1350 kW h/kW c et 1665 kW h/kW c. Un potentiel pouvant
permettre l’installation des champs photovoltaïques sur toute l’étendue du territoire.
Figure 3.2 – Potentiel en énergie photovoltaïque du Bénin [349]
En ce qui concerne le potentiel éolien, la vitesse moyenne annuelle à 50m du sol

varie entre 3,8 m/s et 6,31 m/s (Figure 3.3) avec une densité de puissance de 73
W/m2 sur 100% des zones les plus ventées (Figure 3.4).

Figure 3.3 – Vitesse moyenne du vent à 50m du sol [350]
Figure 3.4 – Densité moyenne de puissance à 50m du sol [350]

3.2 Présentation de la zone d’étude : le territoire béninois
Afin d’appliquer la méthodologie développée et présentée dans le chapitre 2, une

zone d’étude est définie. Comme le montre la Figure 3.5, nous inscrivons la carte du
Bénin dans une zone que nous supposons plane à forme régulière.
Figure 3.5 – Zone d’étude délimitée
La latitude y varie de 5,6° à 12,6° et la longitude de 0,7° à 4,07°.

3.3 Résultats de quadrillage et d’échantillonnage
Une fois la zone d’étude délimitée, elle est quadrillée et échantillonnée. Conformé-
ment à la technique de quadrillage et d’échantillonnage présentée à la figure 2.5, deux
échantillons (d’étude et de validation) sont définis et le pas de quadrillage optimisé à
l’aide d’un algorithme dont le logigramme a été présenté à la Figure 2.15. La figure 3.6
présente l’évolution des nombres de clusters en fonction du pas de quadrillage ∆t.
Figure 3.6 – Evolution des nombres de clusters en fonction du pas de quadrillage
Comme nous pouvons le constater, les nombres de clusters n’évoluent plus à partir
d’un pas de quadrillage de 0,15°. Ainsi, un pas de quadrillage de 0,15° en latitude et
en longitude est utilisé pour échantillonner toute la zone d’étude comme le montre
la figure 3.7. Ce pas de quadrillage nous conduit alors à un nombre d’échantillons
de 1081 pour l’étude et 1081 (Figure 3.8) pour la validation conformément à la
technique d’échantillonnage présentée au chapitre 2. Cette technique de quadrillage
et d’échantillonage a été publiée dans [351, 352]

Figure 3.7 – Zone d’étude quadrillée et échantillonnée
Figure 3.8 – Nombres d’échantillons en fonction du pas de quadrillage
3.4 Présentation des données acquises et traitées
3.4.1 Présentation des données acquises
Une fois les coordonnées des échantillons (points géographiques) connues, les don-
nées sur les paramètres météorologiques retenus (irradiation, température, vitesse

et direction du vent) sont téléchargées pour tous les échantillons sur toute la pé-
riode d’étude. Elles sont contenues dans des fichiers CSV (Comma Separated Values)
comme le montrent les figures 3.9 et 3.10.
Figure 3.9 – Présentation des fichiers téléchargés pour les 1081 échantillons
Figure 3.10 – Présentation du contenu d’un des fichiers CSV
Toutes les données acquises sont accessibles à la référence [353].
3.4.2 Statistiques des données
Afin de s’assurer d’éventuels erreurs, sauts ou données aberrantes les calculs des
maxima, minima, moyennes et écart-type sont faits. Les figures 3.11, 3.12 et 3.13

présentent respectivement les statistiques des données d’irradiation, de température

et de vitesse du vent pour tous les échantillons.
Figure 3.11 – Statistiques des données d’irradiation
Figure 3.12 – Statistiques des données de température

Figure 3.13 – Statistiques des données de vitesse du vent
Ces différentes statistiques nous indiquent qu’il n’y a pas d’apparentes anomalies :
• Pour l’irradiation, les moyennes sur 24h se retrouvent entre 185 W/m2 et 242
W/m2 , les maxima entre 945 W/m2 et 1078 W/m2 et les minima à 0 W/m2 .
Les écart-types entre 254 W/m2 et 319 W/m2 se justifient par une dispersion de
l’irradiation entre 0 et 1078 W/m2 autour des moyennes. Ces différentes valeurs
montrent globalement qu’un champ PV peut être exploité sur toute l’étendue
du territoire béninois ;
• Les températures moyennes sont entre 25 °C et 28 °C avec des maxima entre
30 °C et 45 °C. Ces plages de températures sont conformes aux climats du
Bénin ;
• Les moyennes de vitesse à 50 m du sol sont entre 3,35 m/s et 5,26 m/s avec
des maxima pouvant atteindre les 15 m/s. Les écarts-types varient entre 1,2
et 2,2 m/s. Comme le montre la figure 3.14, la différence entre les moyennes
de vitesse et les écarts-types varie entre 2,17 m/s et 3,68 m/s pour l’ensemble
des échantillons. Ceci nous conforte dans la prise de tout le territoire béninois
comme zone d’étude. En général, il faut au moins 2 m/s pour faire tourner la
plupart des petites éoliennes, et 3 m/s est la vitesse d’enclenchement typique,
lorsqu’une petite éolienne commence à produire de l’électricité [354, 355].

Figure 3.14 – Classes de différence entre vitesses moyennes et écarts-types
Plus de détails sont donnés sur les statistiques des données à la référence [356].
3.4.3 Présentation des données standardisées
Une fois la vérification d’absence d’anomalies dans les données effectuée, il faut
les ramener à une même échelle. Pour cela, nous utilisons la normalisation MinMax
présentée à l’équation 2.16. Les figures 3.15, 3.16 et 3.17 nous montrent respecti-
vement les statistiques des données normalisées d’irradiation, de température et de
vitesse du vent. Nous pouvons remarquer que toutes les données ont à présent pour
maxima 1 et minima 0.

Figure 3.15 – Statistiques des données d’irradiation normalisées
Figure 3.16 – Statistiques des données de température normalisées

Figure 3.17 – Statistiques des données de vitesse du vent normalisées
3.5 Résultats de clustering
Une fois les données normalisées, l’identification des nombres de profils différents
pour chaque paramètre météorologique est faite grâce aux échantillons d’étude. Le
nombre maximum de profil est obtenu lorsque les nombres d’échantillons augmentent
mais que les nombres de clusters n’augmentent plus (figure 3.6) conformément au logi-
gramme d’optimisation présenté à la figure 2.15. Ainsi comme le montre la figure 3.6,
48 clusters d’irradiation, 90 clusters de température et 90 clusters de vitesse du vent
sont obtenus. Autrement dit, sur le territoire béninois, 48 profils différents d’irradia-
tion, 90 profils différents de température et 90 profils différents de vitesse du vent
existent et permettent d’y décrire les comportements de l’irradiation, la température
ambiante ainsi que de la vitesse du vent.
Les figures 3.18, 3.19 et 3.20 montrent les silhouettes scores des clusters formés
pour l’irradiation, la température et la vitesse de vent respectivement. Nous pouvons
remarquer que les silhouettes scores sont très proches de 1 hormis pour les clusters
N°90 de température et N°90 de vitesse du vent pour lesquels les silhouettes scores
sont de 0. Ces scores de zéro traduisent le fait que ces clusters soient constitués d’un
seul échantillon.

Figure 3.18 – Qualités des clusters d’irradiation
Figure 3.19 – Qualités des clusters de température

Figure 3.20 – Qualités des clusters de vitesse du vent
Les échantillons constitutifs de tous les clusters d’irradiation, de température et

de vitesse du vent sont accessibles à la référence [357].
Les figures 3.21 et 3.22 présentent respectivement les situations géographiques des
échantillons des clusters 2 et 12 d’irradiation à titre d’exemple. Ainsi le cluster 2 d’ir-
radiation prend partiellement en compte les communes de Natitingou, Boukoumbé,
Cobly, Péhunco, Toucountouna, Tanguiéta, Matéri, Kouandé et Kérou et l’irradia-
tion y varie identiquement à 99%. Le cluster 12 d’irradiation quant à lui prend en
compte en partie les communes de Ouidah, Allada, Sakété, Tori-Bossiti, Toffo, Zê,
Abomey-Calavi, Bonou, Adjohoun, Adja-Ouèrè, Ifangni, Avrankou, Porto-Novo, Co-
tonou, Sèmè-Kpodji, Dangbo, Missérété, Toffo, Aguégués et la zone maritime.
La figure 3.23 présente à titre indicatif les situations géographiques des échan-
tillons constitutifs des clusters 30, 79, 14 et 62 de température. Il peut être remarqué
que le cluster 30 regroupe en partie les communes de Ouaké, Copargo, Kouandé,
Natitingou et Boukoumbé, le cluster 79 les communes de Toucountouna, Natitingou,
Kouandé, Péhunco et Kérou. Le cluster 14 quant à lui regroupe en partie les com-
munes de Cobly, Tanguiéta, Toucountouna, Boukoumbé et Natitingou et le cluster
62 les communes de Djougou, Copargo, Kouandé et Péhunco.

Figure 3.21 – Situations géographiques des échantillons du cluster 2 d’irradiation

Figure 3.22 – Situations géographiques des échantillons du cluster 12 d’irradiation

Figure 3.23 – Situations géographiques des échantillons des clusters 30, 79, 14 et
62 de température

La figure 3.24 présente à titre indicatif les situations géographiques des échan-
tillons constitutifs des clusters 17, 8, 45 et 65 de vitesse du vent à 50m. Il peut
être remarqué que le cluster 17 regroupe en partie les communes de Savè, Ouèssè et
Glazoué, le cluster 8 les communes de Dassa-Zoumè, Glazoué et Savè. Le cluster 45
regroupe en partie les communes de Bantè et Bassila et le cluster 65 les communes
de Bantè et Savalou.
Figure 3.24 – Situations géographiques des échantillons des clusters 17, 8, 45 et 65

de vitesse du vent à 50m du sol
Les figures 3.25 et 3.26 montrent respectivement les allures pour le mois de Janvier
2020 de l’irradiation pour les échantillons des clusters 2 et 12.

Figure 3.25 – Évolutions de l’irradiation pour les échantillons du cluster 2
Figure 3.26 – Évolutions de l’irradiation pour les échantillons du cluster 12
Les figures 3.27, 3.28, 3.29 et 3.30 montrent respectivement les allures pour le
mois de Janvier 2020 de la température pour les échantillons des clusters 30, 79, 14

et 62.
Figure 3.27 – Évolutions de la température pour les échantillons du cluster 30

Les figures 3.31, 3.32, 3.33 et 3.34 montrent respectivement les allures pour le mois
d’Août 2020 de la vitesse du vent à 50 m du sol pour les échantillons des clusters 17,
8, 45 et 65.

Figure 3.31 – Évolutions de la vitesse du vent pour les échantillons du cluster 17

Nous pouvons remarquer une parfaite ou quasi superposition des courbes au sein
de tous les clusters, ce qui confirme la qualité du clustering réalisé. Les figures illus-
trant les évolutions au sein des autres clusters sont accessibles à la référence [357].
Ainsi donc un point géographique peut être pris par cluster pour représenter toutes
les localités concernées. Il suffit de 48 points géographiques pour étudier les variations

de l’irradiation à l’intérieur de toute la zone d’étude, 90 points pour la température

et la vitesse du vent à 50 m du sol.
Pour vérifier l’intégrabilité de tout autre échantillon à l’intérieur de la zone d’étude,
les échantillons de test sont utilisés. Les figures 3.35, 3.36, et 3.37 montrent respec-
tivement les silhouettes scores des 1081 échantillons de test dans l’intégration des
clusters d’irradiation, de température et de vitesse de vent respectivement.
Figure 3.35 – Silhouette Score des 1081 échantillons de test pour l’intégration dans
les clusters d’irradiation
les clusters de température

les clusters de vitesse du vent
Il peut être remarqué que tous les silhouettes scores sont compris entre 0,96 et
0,99, ce qui veut dire que tous les 1081 échantillons de test s’intègrent parfaitement
dans tous les clusters au moins à 96%. Ceci nous permet de confirmer la prise des 1081
échantillons d’étude comme représentatifs de toute la zone d’étude. La technique de
clustering et ces différents résultats ont été valorisés dans [351, 352, 358].
3.6 Résultats de formation de sous-zones
Nous rappelons que l’objectif visé c’est de pouvoir dire pour tout site géogra-
phique choisi à l’intérieur de la zone d’étude, quel système serait adapté (PV, Eolien,
PV-Eolien) pour une production optimale d’électricité ainsi que comment pourrait
évoluer sa puissance de sortie. Une fois donc les clusters formés, les échantillons ayant
les mêmes clusters d’irradiation, de température et de vitesse du vent sont regroupés
pour former ce que nous appelons sous-zones. Ainsi cette fois ci, il suffit de prendre
un seul site géographique pour étudier tous les paramètres météorologiques au sein
de chaque sous-zone.
Dans [359] sont présentés les échantillons constitutifs de chaque sous-zone ainsi
que les clusters d’irradiation, de température et de vitesse du vent pris en compte
par celles-ci. Au total 207 sous-zones ont été formées. La technique de formation des
sous-zones a été valorisée dans [351, 352].

3.7 Résultats de caractérisation des sous-zones
Une fois les sous-zones formées, les configurations (PV, Eolienne, PV-Eolienne)
des systèmes de production qui peuvent y être exploités dans un contexte d’exploi-
tation optimale sont déterminées. Compte tenue du nombre de sous-zones formées,
seuls les rérultats de caractérisation de la sous-zone 13 incluant le site de validation
expérimentale sont présentés. Les résultats de caractérisation des autres sous-zones
sont accessibles à la référence [360].
La figure 3.38 présente les échantillons constitutifs de la sous-zone 13. Les fi-
gures 3.39a et 3.39b présentent respectivement les rose de vent et distribution de
Weibull relatives à la sous-zone 13 qui permettent de déterminer les directions pré-
dominantes du vent pour l’orientation des pâles des éoliennes ainsi que les vitesses
de vent les plus fréquentes pour la détermination des périodes de production op-
timale. Il peut être remarqué que l’orientation des pâles d’un aérogénérateur devra
être vers le Nord-Est, le vent soufflant majoritairement vers le Sud-Ouest. Dans cette
sous-zone, la vitesse de vent la plus fréquente est de 4,4 m/s, ce qui est acceptable
pour l’installation d’un aérogénérateur. Ainsi en minimisant les différences entre les
moyennes de vent et les écart-types à 2,5 m/s (vitesse minimale de démarrage de la
plupart des éoliennes) les périodes de production optimale sont obtenues.
Figure 3.38 – Échantillons constitutifs de la sous-zone 13

(a) Rose de vent (b) Distribution de Weibull
Figure 3.39 – Rose de vent et Distribution de Weibull de la sous-zone 13
Il peut être remarqué sur la figure 3.40 que la période de production optimale
pour un aérogénérateur dans cette sous-zone est de Février à Octobre. Cette période
peut toute fois être réajustée suivant la vitesse de démarrage de l’aérogénérateur à
installer.
Figure 3.40 – Périodes de production optimale d’un aérogénérateur dans la sous-

zone 13

Les roses de vent et distributions de weibull des autres sous-zones sont accessibles
respectivement aux références [361] et [362].
En ce qui concerne l’utilisation d’un générateur PV dans la sous-zone 13, les
périodes de production optimale sont déterminées pour un ensoleillement acceptable
(> 400 W/m2 ), un ciel clair (indice de clarté > 0, 42) et une température optimale
pour un bon fonctionnement des panneaux (entre 15 ◦ C et 35 ◦ C). Sur la figure 3.41
représentant les moyennes mensuelles d’irradiation et d’indice de clarté, la période
de production optimale dans la sous-zone 13 va d’Octobre à Mai et s’étend au mois
d’Août sur la figure 3.42 représentant les moyennes mensuelles d’irradiation et de
température. Il sera donc retenue comme période de production optimale pour un
champ PV installé dans la sous-zone 13, les mois d’Octobre à Mai.
Ainsi donc dans cette sous-zone pour un indice de clarté moyen mensuel minimum
de 0,42, une irradiation moyenne mensuelle d’au moins 400W/m2 et une vitesse de
vent moyenne mensuelle d’au moins 2,5 m/s :
• un générateur PV pourra être utilisé seul d’Octobre à Février pour une exploi-
tation optimale ;
• un aérogénérateur pourra être utilisé seul de Mai à Octobre pour une exploita-
tion optimale ;
• et un système hybride PV-Eolienne de Février à Mai.
Une analyse plus large des périodes de production optimale dans toutes les sous-
zone permet d’identifier les sous-zones qui offrent une plus large période de produc-
tion :
• les sous-zones 15, 68, 88 et 92 (figure 3.43) offrent la plus large période de
production optimale pour une éolienne (Janvier à Novembre) (figure 3.44) ;
• plusieurs sous-zones offrent une période de production optimale PV annuelle
(figure 3.45 et 3.46) dont la 39, la 40, la 42, la 67, la 68, ou encore la 70
(figure 3.47) ;

Figure 3.41 – Périodes de production optimale d’un générateur PV dans la sous-

zone 13
Figure 3.42 – Périodes de production optimale d’un générateur PV dans la sous-

zone 13

Figure 3.43 – Situations géographiques des échantillons des sous-zones 15, 68, 88
et 92
Figure 3.44 – Période maximale de production optimale eolienne

Figure 3.45 – Situations géographiques des échantillons des sous-zones 39, 40 et

42

Figure 3.46 – Situations géographiques des échantillons des sous-zones 67, 68 et

70
Figure 3.47 – Période maximale de production optimale PV

Il faut noter que suivant l’utilisation les limites fixées pour l’indice de clarté, la
vitesse minimale de démarrage et l’irradiation peuvent changer, ce qui peut agir sur
les largeurs des périodes sans modifier les classements des sous-zones.
3.8 Résultats de prévision des paramètres météorologiques
Une fois toutes les sous-zones caractérisées, les modèles de prévision des para-
mètres météorologiques relatifs aux systèmes caractéristiques sont développés. Ainsi
par cluster un modèle de prévision adapté est développé, soit 48 modèles de pré-
vision des variabilités des irradiations, 90 modèles de prévision des variabilités des
températures et 90 modèles de prévision des variabilités des vitesses de vent. Dans
cette partie, seuls les résultats relatifs à la sous-zone 13 intégrant le site de validation
expérimentale sont présentés.
3.8.1 Présentation des données de prévision
Comme annoncé dans la section 2.8.1, deux modèles hybrides ont été retenus : le
TFR-CNN et le TFR-LSTM pour lesquels certaines transformations sont effectuées
sur les données.
3.8.1.1 Résultats d’extraction des fréquences par Transformation de Fourier Dis-

crète
Les figures 3.48a, 3.48b et 3.48c présentent respectivement les Transformations de

Fourier Discrètes de l’irradiation, de la température et de la vitesse de vent prises sur
toute la période d’étude. Nous pouvons y remarquer les périodes annuelle, journalière,
demi-journalière qui sont les plus connues et perceptibles mais aussi celles du tiers
et quart de journée. Celles les plus importantes sont l’annuelle, la journalière et la
demi-journalière. Conformément aux équations 2.12 et 2.13, de nouvelles variables
sont donc créées et ajoutées aux jeux de données.
Toutes autres TFR relatives aux autres sous-zones sont accessibles à la référence
[363].

(a) TFR de l’irradiation sous-zone 13 (b) TFR de la température sous-zone 13
(c) TFR de la vitesse du vent sous-zone 13
Figure 3.48 – Transformations de Fourier Rapide de l’irradiation, de la température

et de la vitesse du vent
3.8.1.2 Présentation des jeux de données
Les figures 3.49, 3.50 et 3.51 présentent respectivement les jeux de données nor-
malisées après ajout des nouvelles variables pour la journée du 01-01-2012 de 00h à
13h.

Figure 3.49 – Capture du dataset d’irradiation
Figure 3.50 – Capture du dataset de température

Figure 3.51 – Capture du dataset de vitesse du vent
Ces jeux de données prises dans la période de production optimale déterminée

dans la section 3.7 pour la sous-zone 13 sont donc utilisés par suite pour entraîner
les modèles de prévision.
3.8.2 Résultats d’optimisation des hyperparamètres
Selon la complexité de la variation de la série temporelle les hyperparamètres des

modèles de prévision changent. Ils sont donc optimisés pour trouver la combinaison
d’hyperparamètres adéquate au cas d’étude. Les tableaux 3.1, 3.3 et 3.2 présentent
les hyperparamètres optimisés des modèles TFR-CNN et TFR-LSTM respectivement
pour les prévisions des irradiation, température et vitesse du vent. Tous les résultats
relatifs aux hyperparamètres des modèles de toutes les sous-zones sont présentés dans
[364].
D’une manière générale il peut être remarqué que pour chaque modèle, plus l’ho-
rizon de prévision devient grand plus les hyperparamètres augmentent. Ceci traduit
que les architectures des modèles deviennent plus complexes pour répondre à la com-
plexité de la tâche. Pour la prévision des composantes Wx et Wy, les hyperparamètres
ont été optimisés uniquement pour la prévision de 12h de temps, limite à laquelle de
bonnes performances ont été obtenues.

Tableau 3.1 – Hyperparamètres optimisés pour la prévision de l’irradiation
Prévision 72_24
Modèle TFR-CNN Modèle TFR-LSTM
Hyperparamètre Valeur Temps Optimisation Hyperparamètre Valeur Temps Optimisation
Nombre d’Unités 200
Nombre de Filtres 30 6,9 h 7,1 h
Learning rate 0,01 Learning rate 0,01
Prévision 72_48
Nombre de Filtres 210 7,4 h 8h
Prévision 72_72
Tableau 3.2 – Hyperparamètres optimisés pour la prévision de la vitesse du vent
Prévision Wx 18_12
Prévision Wy 18_12

Tableau 3.3 – Hyperparamètres optimisés pour la prévision de la température
Prévision 72_24
Prévision 72_48
Prévision 72_72
Nombre de Filtres 200 6,6 h 11 h
Les temps d’optimisation vont d’un minimum de 5h de temps à 11h de temps

en général suivant le modèle et la tâche. L’optimisation des hyperparamètres des
modèles LSTM prennent plus de temps que celle des modèles CNN et pour le même
modèle, plus l’horizon de prévision augmente, plus l’optimisation dure. L’optimisa-
tion de tous les modèles pour toutes les sous-zones a duré en moyenne six mois. Les
caractéristiques principales de l’ordinateur sur lequel l’optimisation a été effectuée
sont : un processeur Intel(R) Core(TM) i5-4570T CPU @ 3.10 GHz avec une mémoire
RAM de 12Go.
3.8.3 Résultats de prévision avec les modèles entraînés avec les hyperparamètres
optimisés
Une fois les hyperparamètres optimisés obtenus, les modèles sont alors entraînés
avec ces paramétrages. Les tableaux 3.4, 3.6 et 3.5 présentent les performances de
prévisions pour les modèles TFR-CNN et TFR-LSTM pour la prévision des irradia-
tion, température et vitesse du vent respectivement pour la sous-zone 13.

Tableau 3.4 – Performances des modèles pour la prévision de l’irradiation
Prévision 72_24
Métrique Valeur Temps d’entrainement Métrique Valeur Temps d’entrainement
RMSE (W/m ) 2
28,71 RMSE (W/m ) 2
26,61
MAE (W/m2 ) 16,32 193 s MAE (W/m2 ) 19,18 338 s
R2 0,992 R2 0,987
Prévision 72_48
RMSE (W/m ) 2
47,41 RMSE (W/m ) 2
46,01
MAE (W/m2 ) 25,03 216 s MAE (W/m2 ) 23,53 386 s
R2 0,979 R2 0,979
Prévision 72_72
RMSE (W/m ) 2
47,96 RMSE (W/m ) 2
34,55
MAE (W/m2 ) 27,07 225 s MAE (W/m2 ) 40,88 390 s
R2 0,979 R2 0,989
Tableau 3.5 – Performances des modèles pour la prévision de la vitesse du vent
Prévision Wx 18_12
RMSE (m/s) 0,46 RMSE (m/s) 0,34
MAE (m/s) 0,49 152 s MAE (m/s) 0,37 213 s
R2 0,931 R2 0,925
Prévision Wy 18_12
RMSE (m/s) 0,33 RMSE (m/s) 0,34
MAE (m/s) 0,44 212 s MAE (m/s) 0,38 183 s
R2 0,878 R2 0,891

Tableau 3.6 – Performances des modèles pour la prévision de la température
Prévision 72_24
RMSE ( C)
◦
1,24 RMSE ( C)◦
1,03
MAE (◦ C) 0,92 201 s MAE (◦ C) 1,13 284 s
R2 0,953 R2 0,971
Prévision 72_48
RMSE ( C)
◦
1,56 RMSE ( C)◦
0,99
MAE (◦ C) 1,56 169 s MAE (◦ C) 0,64 263 s
R2 0,943 R2 0,979
Prévision 72_72
RMSE ( C)
◦
1,29 RMSE ( C)◦
1,03
MAE (◦ C) 1,39 190 s MAE (◦ C) 0,61 263 s
R2 0,932 R2 0,958
Nous pouvons remarquer que globalement le modèle TFR-LSTM est le plus per-
formant. Dans la grande majorité des cas il présente une erreur quadratique moyenne
plus faible avec un coefficient de détermination plus élevé. La RMSE mesure la pré-
cision globale des modèles de prévision. Plus il est faible, plus le modèle est précis.
Le coefficient de détermination indique la variance de la prévision par rapport aux
données réelles. Plus il tend vers 1 plus la variance est faible et plus le modèle est
précis. Pour tous les modèles, plus les horizons de prévision augmentent moins le
modèle devient précis (les erreurs de prévision augmentent). Les performances de
prévision pour la prévision des irradiations, températures et vitesse du vent dans les
autres sous-zones sont présentées dans [364].
Les figures 3.52, 3.53, et 3.54 montrent respectivement les résultats de prévision
du modèle TFR-LSTM après entraînement sur trois portions du Testset pris aléatoi-
rement.

(a) Prévision 72-24
(b) Prévision 72-48
(c) Prévision 72-72
Figure 3.52 – Résultats de Test des performances de prévision de l’irradiation du

modèle TFR-LSTM

(a) Prévision 72-24
(b) Prévision 72-48
(c) Prévision 72-72
Figure 3.53 – Résultats de Test des performances de prévision de la température

du modèle TFR-LSTM

(a) Prévision Wx 18-12
(b) Prévision Wy 18-12
Figure 3.54 – Résultats de Test des performances de prévision des composantes Wx

et Wy de la vitesse du vent du modèle TFR-LSTM

Il peut être remarqué que les prévisions sont globalement bonnes pour l’irradia-
tion et la température et moins bonnes pour la vitesse du vent compte tenue de
sa variation plus aléatoire. Néanmoins les prévisions peuvent parfois être faussées
comme sur les figures 3.52c et 3.53c où les allures prévues se sont éloignées des al-
lures réelles. Ceci peut être observé lorsque des évènements météorologiques difficiles
à prévoir surviennent (déplacement des nuages par exemple [79–82]).
Des paramètres Wx et Wy prévus peuvent être alors déduites les vitesse et direc-
tion du vent prévues par les relations 3.1 et 3.2 suivantes.
Å ã
Wy
Wd = tan −1
(3.1)
Wx
Wy
Wv = Ä Ä
Wy
ää (3.2)
sin tan−1 Wx
où Wd et Wv sont respectivement les direction et vitesse prévues déduites des prévi-

sions de Wx et Wy.
Les figures 3.55 et 3.56 montrent respectivement les allures des direction et vitesse
prévues et réelles.
Figure 3.55 – Directions du vent prévues et réelles

Figure 3.56 – Vitesses du vent prévues et réelles
Les performances de prévisions des direction et vitesse du vent sont résumées

dans le tableau 3.7.
Tableau 3.7 – Performances de prévisions des direction et vitesse du vent avec le

modèle TFR-LSTM
Performances de prévision de la vitesse du vent

RMSE 0.34 m/s
R2 93%
Performances de prévision de la direction du vent
RMSE 7.8 rad
R2 70%
En résumé dans cette sous-zone l’irradiation et la température peuvent être pré-

vues pour 72h maximum à partir de 72h d’observations. Suivant l’objectif de prévi-
sion, les modèles 72_24 seront préférés pour des horizons de prévision allant d’une
heure à 24h, les modèles 72_48 pour des horizons de prévision allant jusqu’à 48h et
les modèles 72_72 pour des horizons allant jusqu’à 72h. Ceci, compte tenue du fait
de la diminution des performances de prévision avec l’augmentation des horizons de
prévision remarquée à travers les résultats présentés dans [364] et confirmés dans la
littérature ([77, 78, 365, 366]). La prévision de la vitesse du vent ne peut quant à
elle être faite pour 12h maximum (horizon de prévision maximum atteint dans nos
travaux) à partir de 18h d’observation.
3.9 Estimation des puissances de sorties
A partir des prévisions des paramètres météorologiques, les puissances électriques

en sortie des systèmes peuvent être estimées.
3.9.1 Estimation de la puissance éolienne
Pour estimer la puissance de sortie de l’aérogénérateur, le modèle segmenté li-

néarisé est utilisé. Nous faisons cette estimation pour l’aérogénérateur acquise dans
le cadre de nos travaux et dont les caractéristiques principales sont données dans le
tableau 3.8 et la courbe de puissance à la figure 3.57.
Figure 3.57 – Courbe de puissance de l’aérogénérateur NE-200s
La figure 3.58 présente les puissances estimées alors à partir des 12 vitesses prévues
par le modèle TFR-LSTM. Ces différents résultats ont été valorisés dans [351].

Tableau 3.8 – Caractéristiques de l’aérogénérateur NE-200S
Puissance (W) 220

Puissance nominale (W) 200
Diamètre (m) 1,2
Vitesse d’enlenchement (m/s) 2
Vitesse de déclenchement (m/s) 55
Vitesse nominale (m/s) 12
Tension nominale 24V
Générateur Triphasé à aimant permanent
Systéme de contrôle A Électro-aimant
Régulation de vitesse Ajustement automatique de la vitesse au vent
Figure 3.58 – Puissances éoliennes estimées
3.9.2 Estimation de la puissance PV
Pour estimer la puissance PV, le modèle d’Evans est utilisé. Nous faisons cette
estimation pour le module PV BP Solar 340 dont les caractéristiques sont présentées
dans le tableau 3.9. Nous faisons à titre d’exemple cette estimation pour 24h à partir
de 24 prévisions d’irradiation et de température.

Tableau 3.9 – Caractéristiques du BP SOLAR 340
Caractéristiques du BP SOLAR 340

Puissance maximale 40W
Rendement du module 11,30%
Tension nominale 12V
Puissance minimale garantie 36W
Tension à Pmax (Vmp) 17,3V
Courant à Pmax (Imp) 2,31A
Courant de court-circuit (Isc) 2,54A
Tension en circuit ouvert (Voc) 21,8V
Coefficient de température de courant (0.065(0.015) %/K
Coefficient de température de tension (0.065(0.015) %/K
Coefficient de température de puissance (0.065(0.015) %/K
NOCT 47(2°C)
Avant de faire l’estimation de la puissance PV, les irradiations prévues sont

converties sur plan des modules PV (ici 15°) avec le modèle de Climed2/Klucher
(figure 3.59). Les figures 3.60 et 3.61 montrent les évolutions de l’irradiation, de la
température et de la puissance PV. Ces différents résultats ont été valorisés dans
[367].
Figure 3.59 – Irradiations prévues sur plans horizontal et incliné

Figure 3.60 – Puissances estimées et irradiations prévues sur plan incliné
Figure 3.61 – Puissances estimées et températures prévues
3.10 Résultats de la validation expérimentale
Afin de vérifier la conformité des prévisions avec la réalité, les paramètres météo-
rologiques ainsi que les puissances ont été mesurés sur site et comparés à celles-ci.
Nous avons effectué à Godomey Houédonou (Longitude 2,346° ; Latitude 6,39°) dans

la commune d’Abomey-Calavi au Bénin, une acquisition de l’irradiation, de la tem-

pérature et de la puissance PV sur quatre jours allant du 10 Octobre 2022 au 13
Octobre 2022 puis des vitesse, direction du vent et de la puissance éolienne sur 10
jours allant du 1er Mai 2023 au 10 Mai 2023.
3.10.1 Présentation des données mesurées
Les figures 3.62, 3.63 et 3.64 présentent respectivement les allures des irradiations,
températures et puissances PV mesurées et filtrées.
Figure 3.62 – Irradiations mesurées et filtrées
Figure 3.63 – Températures mesurées et filtrées

Figure 3.64 – Puissances PV mesurées et filtrées
Les figures 3.65 et 3.66 présentent respectivement les allures des vitesses de vent
et puissances de l’éolienne mesurées et filtrées. Ces données ont été mesurées à une
hauteur d’environ 10m du sol. Les valeurs filtrées ont été obtenues par lissage expo-
nentielle.
Figure 3.65 – Vitesses de vent mesurées et filtrées

Figure 3.66 – Puissances électriques mesurées et filtrées en sortie du NE-200S
3.10.2 Résultats de prévision des irradiations, températures et puissances PV
Les données du 10, 11 et 12 Octobre 2022 sont utilisées pour prévoir celles du 13
Octobre 2022. Les figures 3.67, 3.68 et 3.69 présentent respectivement les irradiations,
températures et puissances PV prévues avec le modèle et mesurées.
Figure 3.67 – Irradiations prévues et mesurées

Figure 3.68 – Températures prévues et mesurées
Figure 3.69 – Puissances prévues et mesurées
Le tableau 3.10 présente les performances de prévisions de l’irradiation, de la

température et de la puissance PV. Les valeurs de RMSE renseignent sur les écarts
moyens entre valeurs mesurées et prévues et le coefficient de détermination R2 ren-
seigne sur le pourcentage de bonnes prévisions effectuées. Globalement, nous pouvons
dire que les prévisions sont bonnes et donc que les modèles entraînés sont précis et
peuvent être utilisés dans des situations réelles de prévision. Néanmoins, plusieurs
facteurs peuvent justifier les erreurs de prévision hormis les erreurs de prévision de
base des modèles comme les erreurs de mesures des capteurs et les bruits qui se
superposent aux vrais signaux lors de l’acquisition des données.

Tableau 3.10 – Performances de prévision de l’irradiation, de la température et de

la puissance PV lors de la validation expérimentale
RMSE R2
Irradiation (W/m2 ) 31 ,75 0,98
Température (°C) 0 ,97 0 ,91
Puissance (W) 1 ,58 0,95
3.10.3 Résultats de prévision des vitesses du vent et de la puissance en sortie de

l’aérogénérateur
Pour cette validation deux différentes prévisions ont été faites sur deux parties
des données mesurées. Les figures 3.70 et 3.71 montrent respectivement les allures
des prévisions et mesures des paramètres Wx, Wy ainsi que les courbes de tendance
(en traits discontinus).
Figure 3.70 – Paramètres Wx prévus et réels (Cas 1)

Figure 3.71 – Paramètres Wy prévus et réels (Cas 1)
Ces prévisions sont faites à partir des données du 1er Mai 2023 (de 05h à 22h).
De ces valeurs des paramètres Wx et Wy prévues sont déduites celles des vitesses
de vent prévues. La figure 3.72 présente les allures des vitesses de vent prévues et
réelles.
A partir de ces vitesses de vent prévues sont déduites les puissances en sortie
de l’éolienne qui sont alors comparées aux puissances mesurées aux mêmes instants
(figure 3.73).
Le tableau 3.11 résume les performances de prévisions des paramètres Wx et Wy
ainsi que celles des vitesses du vent et puissances en sortie de l’éolienne pour le cas
1.
Tableau 3.11 – Performances de prévisions des paramètres Wx, Wy et des vitesses

et puissances (Cas 1)
Wx (m/s) Wy (m/s) Vitesses du vent (m/s) Puissance Eolienne (W)

RMSE 0,25 0,49 0,47 12,25
MAE 0,22 0,45 0,42 11,25

Figure 3.72 – Vitesses de vent prévues et réelles (Cas 1)
Figure 3.73 – Puissances prévues et réelles en sortie de l’éolienne (Cas 1)
Dans le second cas, les prévisions ont été faites à partir des données du 09 Mai
2023. Les figures 3.74 et 3.75 présentent les allures des paramètres Wx et Wy prévus

et vrais respectivement. La figure 3.76 présente les vitesses prévues et mesurées pour
le cas 2 et la figure 3.77 présente les puissances prévues et mesurées.
Figure 3.74 – Paramètres Wx prévus et réels (Cas 2)
Figure 3.75 – Paramètres Wy prévus et réels (Cas 2)

Figure 3.76 – Vitesses de vent prévues et réelles (Cas 2)
Figure 3.77 – Puissances prévues et réelles en sortie de l’éolienne (Cas 2)

Le tableau 3.12 résume les performances de prévisions des paramètres Wx et Wy

ainsi que celles des vitesses du vent et puissances en sortie de l’éolienne pour le cas
2.

et puissances (Cas 2)

RMSE 0,91 3,19 1,22 41,78
MAE 0,71 3,12 0,97 31,25
De ces deux essais de prévision, il peut être retenu globalement que les tendances
sont bien prévues : les droites de tendances ont des coefficients directeurs de mêmes
signes et sont dans certains cas presque parallèles. Ainsi grâce aux modèles développés
, il peut être prévu une variation à la baisse ou à la hausse des vitesses ou puissances
en sortie de l’éolienne. Néanmoins les écarts entre prévisions et valeurs réelles sont
parfois assez grands (figure 3.75). Globalement les résultats de prévision dans le cas 1
sont meilleurs à ceux obtenus dans le cas 2 (plus faibles RMSE et MAE). Le tableau
3.13 présentent les performances de prévision sur toute la période de mesure.

et puissances sur toute la période de mesure

RMSE 0,56 0,86 0,38 15,60
MAE 0,58 0,82 0,42 16,20
RMSE relative (Puissance) 7,80%
Ainsi, sur toute la période de mesure, des RMSE de 0,38 et 15,6, des MAE de 0,42
et 16,20 sont obtenues respectivement pour les prévisions des vitesses et puissances
en sortie de l’éolienne et une erreur relative de 7,8% est obtenue pour la prévision de
la puissance.

3.10.4 Étude comparative des performances obtenues avec des résultats récents
obtenus dans la littérature
Dans cette section, les performances de prévision obtenues lors de la validation

expérimentale sont comparées à des résultats récents trouvés dans la littérature. Il
faut dire que les horizons de prévision, les jeux de données et les ordinateurs utilisés
sont rarement les mêmes. Il est donc difficile de comparer les performances en termes
de précision et de temps de calcul.
Dans le tableau 3.14 sont listés quelques résultats trouvés dans la littérature pour
la prévision de l’irradiation et dans le tableau 3.15, quelques résultats récents de
prévision de la puissance PV trouvés dans la littérature. De ces différents résultats le
constat général est que la plupart des prévisions sont effectuées à court terme. Il faut
rappeler que les modèles que nous avons développés prévoient pour des horizons allant
de 24 à 72h. Pour la prévision de l’irradiation, en terme de paramètres d’entrée nous
avons utilisé le moins possible de paramètres (seulement l’irradiation) tout comme
dans [368]. Comparés aux résultats obtenus dans [369], [368] et [370] nous pouvons
dire que nos performances de prévision de l’irradiation sont meilleures en tenant
compte des horizons de prévisions : 31,71 W/m2 dans notre cas contre 47.826 W/m2
pour 1h de prévision, 0,0183 W/m2 pour 90 mn de prévision et 34,89 W/m2 pour 90
mn de prévision.
Tableau 3.14 – Comparaison des performances de prévision de l’irradiation
Ref. Horizon de Modèle Paramètres RMSE

prévision
[369] 1h LSTM-CNN Température ; Vitesse du vent ; Los Angeles : 57.983
Direction du vent ; Humidité re- W/m2 , San Diego :
lative ; Précipitation ; Angle zé- 47.826 W/m2 , San Fran-
nital ; Point de rosée ; Pression ; cisco : 66.023 W/m2
Type de ciel ; GHI
[368] 15 mn, 30 mn, LSTM GHI Columbus : 0.0177
45 mn, 60 mn, W/m2 , San Antonio :
75 mn, 90 mn 0,0183 W/m2 , Detroit :
0,0183 W/m2
[370] 15 mn, 30 mn, LSTM-CNN GHI ; Température ; Humidité Entre 5,79 et 34,89 W/m2
45 mn, 60 mn,
75 mn, 90 mn
Modèle 24h TRF-LSTM GHI 31,71 W/m2
proposé
Les constats restent les mêmes pour la prévision de la puissance PV. En terme
de paramètres d’entrées, nous en avons utilisé le moins possible (Irradiation sur plan

incliné et température ambiante) dans le cas d’une prévision indirecte, les horizons
de prévisions sont aussi majoritairement à court terme (jusqu’à 1h30 sauf dans [371]
où ils sont allés jusqu’à 24h de prévision).
Tableau 3.15 – Comparaison des performances de prévision de la puissance PV
Ref. Horizon de Modèle Paramètres d’entrée Taille du RMSE

prévision champ
(kW)
[372] 7,5 mn, 15 mn, CNN- Puissance PV, Température N/A 1,3 W ; 1,4 W ;
30 mn LSTM des modules, Courant, Ten- 2,04 W
sion
[373] 10 mn ; 30 CNN- Irradiation globale directe ; 1,7 0,083 W;
mn ; 60 mn ; LSTM Irradiation diffuse ; Tempéra- 0,2257 W;
90 mn ; 120 ture ; Humidité ; Vitesse du 0,4593 W;
mn ; 150 mn ; vent ; Pression barométrique ; 0,7289 W;
180 mn Puissance active 1,0588 W;
1,4438 W;
2,057 W
[371] 24h LSTM Données de prévision numé- N/A 0,1075 kW
rique du temps
[217] 1h LSTM Puissance PV,Irradiation 2,6 0,2357 kW
globale réfléchie, Irradiation
globale diffuse, Température
ambiante, Vitesse du vent,
Humidité relative
[146] 1h LSTM Puissance PV 20 0,841 kW
[374] 1h LSTM Vitesse du vent, Température 2; 1,87 ; 26,85 W;
des modules, Irradiation so- 2,7 19,78 W ; 39,2
laire W
[375] 1h CNN- Puissance PV 3 4,58 W (Enso-
LSTM leillée) ; 25,57
W (Nuageuse)
Modèle 24h TFR- Irradiation sur plan incliné, 0,04 1,58 W
proposé LSTM Température ambiante
Le tableau 3.16 présente les résultats de comparaison des prévisions de la vitesse

du vent. Dans la littérature, les prévisions sont le plus souvent à très court terme
ou à court terme avec une erreur quadratique moyenne supérieure à 0,7 m/s avec
les réseaux d’apprentissage profond [376–383]. Nous pouvons remarquer que pour
la plupart des modèles proposés pour la prévision de la vitesse du vent, malgré un
horizon allant jusqu’à 12 heures, notre modèle TFR-LSTM proposé reste plus efficace.

Tableau 3.16 – Comparaison des performances de prévision de la vitesse du vent
Précisions obtenues
Ref. Type de prévision Modèle Horizon
RMSE MAPE (%) R2
Vitesse du vent - 4,9 -
[376] ARIMA 6h
Direction du vent - 15,6 -
[377] Vitesse du vent SWD-ANFIS, ANN 3h 0,3842 m/s - -
[378] Vitesse du vent ICEEMDAN-MMODA 3h 0,35 m/s 5,02
[379] Vitesse du vent Jaya-SVM 3h 1,01 m/s 15,34 0,85
[380] Vitesse du vent ICEEMDAN-GRU-ARIMA 15 mn 0,09 m/s 2,34
[381] Vitesse du vent ED-HGNDO-BiLSTM 1h 1,57 m/s 0,91
CNN 0,73 9,84 0,96

[382] Vitesse du vent 1h
LSTM 0,77 10,51 0,95
[383] Vitesse du vent HTD- MOBBSA- Seq2Seq 1h 1,58 m/s
Vitesse du vent 0,38 m/s 8,22 0,81

Modèle proposé TFR-LSTM 12 h
Direction du vent 7,8 rad 6,09 0,7
3.11 Présentation du progiciel conçu
3.11.1 Fonctionnalités du progiciel
La figure 3.78 présente la page d’accueil de l’application conçue. Elle a trois

fonctions principales : la supervision ,la prévision et l’archivage des données. La
figure 3.79 présente la fenêtre à laquelle mène un clic sur le bouton "FORECASTING"
à l’accueil.

Figure 3.78 – Accueil de l’application
Figure 3.79 – Fenêtre pour la prévision
Cette fenêtre est subdivisée en deux parties :

• celle du haut comportant quatre boutons "SITE LOCALISATION", "INCLU-
SION", "CHARACTERIZATION" et "PREVISION" pour respectivement ren-
seigner les coordonnées géographiques du site d’étude (Figure 3.80), identifier

à quelle sous-zone appartient le site, caractériser le site (Figure 3.81) puis ef-
fectuer d’éventuelles prévisions (Figure 3.82) ;
• la partie du bas permet d’avoir le résumé des différentes informations rensei-
gnées tout au long du processus de prévision ;
Figure 3.80 – Fenêtre pour renseigner les coordonnées géographiques
Figure 3.81 – Fenêtre pour la caractérisation du site

Figure 3.82 – Fenêtre pour la prévision des différentes puissances
Sur la page de renseignement des coordonnées géographiques (figure 3.80), l’uti-

lisateur doit renseigner la longitude et la latitude du site. Ensuite en cliquant sur le
bouton "INCLUSION", l’application recherche et intègre le site à l’une des sous-zones
constituées. Ainsi à l’étape de caractérisation (figure 3.81), une fois que l’utilisateur
renseigne les seuils d’irradiation, de température et de vitesse, l’application lui re-
tourne les différentes périodes de production optimale conformément aux seuils ren-
seignés. De plus une fois la sous-zone appropriée identifiée, l’application sélectionne
en backend les modèles de prévision d’irradiation, de température et de vitesse du
vent adaptés. Une fois donc à l’étape de prévision (figure 3.82), ces modèles sont

exploités pour faire la prévision des différents paramètres météorologiques et l’esti-

mation des puissances est effectuée à partir de celles-ci, des modèles d’estimation
choisis par l’utilisateur ainsi que les caractéristiques du système.
La figure 3.83 présente la fenêtre de supervision. Un clic sur le bouton "On" lance
la visualisation instantanée des évolutions de l’irradiation, la température, les vitesse
et direction du vent collectées sur le site. Ces informations serviront comme données
d’entrée pour une prévision temps réel des puissances en sortie du système.
Figure 3.83 – Fenêtre pour la prévision des différentes puissances
L’option archivage de l’application renseigne sur les données téléchargées pour

l’intégration du site dans une sous-zone, les données prévues ainsi que les données
collectées depuis le site d’installation comme le montre la figure 3.84.

Figure 3.84 – Fenêtre de présentation des données sauvegardées
3.11.2 Résultats d’exploitation du progiciel
Dans cette sous-section les résultats issus de l’utilisation du progiciel pour une
tâche de prévision sont présentés. Le tableau 3.17 ci-dessous présente les différentes
informations exploitées tout au long du processus de prévision.

Tableau 3.17 – Informations pour le test du progiciel
Situation géographique du site

Longitude 2,34
Latitude 6,39
Caractérisation du site
Irradiation moyenne mensuelle minimale 400 W/m2
Température minimale pour un fonctionnement optimal des panneaux 15 °C
Température maximale pour un fonctionnement optimal des panneaux 35 °C
Indice de clarté minimal 0,4
Vitesse minimale de démarrage des éoliennes 3 m/s
Caractéristiques du panneaux
Référence BP Solar 340
Puissance maximale 40 W
Rendement du module 11,30 %
Tension nominale 12 V
Puissance minimale garantie 36 W
Tension à Pmax (Vmp) 17,3 V
Courant à Pmax (Imp) 2,31 A
Courant de court-circuit (Isc) 2,54 A
Tension en circuit ouvert (Voc) 21,8 V
Coefficient de température de courant (0.065(0.015) %/K
Coefficient de température de tension (0.065(0.015) %/K
Coefficient de température de puissance (0.065(0.015) %/K
NOCT 47 (2°C)
Inclinaison des panneaux 15 °C
Surface du panneau 0,35 m^2
Caractéristiques de l’aérogénérateur
Puissance 220 W
Puissance nominale 200 W
Diamètre 1,2 m
Vitesse d’enlenchement 2 m/s
Vitesse de déclenchement 55 m/s
Vitesse nominale 12 m/s
Tension nominale 24 V
Hauteur d’installation 10 m
Longueur de rugosité 0,2
Générateur Triphasé à aimant permanent
Régulation de vitesse Ajustement automatique de la vitesse au vent
La figure 3.85 présente la page de renseignement des coordonnées conformément

au tableau 3.17.

Figure 3.85 – Coordonnées géographiques du site renseignées
Ces informations sont alors affichées sur la fenêtre principale de prévision et

l’étape de recherche de sous-zone peut être lancée (figure 3.86).
Figure 3.86 – Lancement de l’intégration à une sous-zone
A la fin de cette étape, les différents numéros des clusters sont affichés ainsi que
les éléments de la sous-zone en rouge sur une carte géographique renseignant les
localités concernées (figure 3.87).

Figure 3.87 – Résultats d’intégration à une sous-zone
Les informations nécessaires pour la caractérisation du site sont alors renseignées

comme l’indique la figure 3.88 conformément au tableau 3.17.
Figure 3.88 – Renseignement des informations pour la caractérisation du site
Les figures 3.89, 3.90 et 3.91 renseignent respectivement sur les vitesses les plus
fréquentes sur le site, la direction du vent la plus prédominante et sur les périodes
de production optimale. Ces résultats sont conformes à ceux présentés en 3.7. Il peut
y être remarqué un vent soufflant majoritairement vers le Sud-Ouest, des vitesses
de vent les plus fréquentes entre 3,6 m/s et 4,8 m/s, des périodes de productions

optimales allant d’Octobre à Mai pour le PV et de Mars à Avril puis de Juin à

Septembre pour l’éolienne
Pour la prévision, nous choisissons donc un système PV + Eolienne. La figure 3.92
présente la fenêtre de renseignement des différentes informations conformément au
tableau 3.17.
Figure 3.89 – Distribution de Weibull
Figure 3.90 – Rose de vent

Figure 3.91 – Périodes de productions optimales
Figure 3.92 – Renseignement des informations pour un essai de prévision

Les figures 3.93 et 3.94 présentent respectivement des résultats de prévision des
irradiation, température, puissance PV pour 72h et vitesse du vent et puissance
éolienne pour 12h.
Figure 3.93 – Résultats de prévision des irradiation, température, puissance PV

pour 72h
Figure 3.94 – Résultats de prévision des vitesse du vent et puissance éolienne pour
12h

Pour la supervision des paramètres météorologiques sur le site d’installation, la

figure 3.95 présente une capture lors d’un essai d’acquisition.
Figure 3.95 – Capture d’un essai de supervision
Pour finir, toutes ces données (prévues, acquises, téléchargées) sont sauvegardées
et accessibles dans la base de données de l’application comme montré sur la figure
3.96.

Figure 3.96 – Présentation des données archivées
Dans ce chapitre, les résultats d’application de la technique de prévision présentée

dans le chapitre 2 au territoire béninois ont été présentés. De ces résultats il peut
être retenu essentiellement que le Bénin peut être subdivisé en 207 sous-zones dans
lesquelles l’irradiation, la température et la vitesse du vent varient identiquement ou
presque en tout point géographique. Ainsi pour chaque sous zone les types de sys-
tèmes pouvant y être exploités optimalement on été déterminés et pour ces systèmes,
des modèles de prévision de la puissance de sortie ont été développés. Les modèles de
prévision de l’irradiation, de la température et de la puissance PV ont été développés
pour des horizons de prévision allant de 24h à 72h. Les modèles de prévision de la
vitesse du vent et de la puissance en sortie d’aérogénérateur ont été développés pour
un horizon de prévision de 12h. En général les modèles sont précis comparés à des
résultats obtenus dans la littérature et sont capables de faire des prévisions à moyen
terme.

Conclusion générale et perspectives
Conclusion
Les caprices de la météo donnent l’impression que les réseaux électriques hybrides
basés sur les énergies renouvelables, en particulier ceux qui intègrent le photovol-
taïque et l’éolienne, sont difficiles à réaliser. Cependant, les progrès de la modélisa-
tion mathématique, des représentations physiques, de l’analyse statistique et de la
puissance de calcul ont fait de la prévision une option viable. De nombreuses agences
ont pris l’initiative de soutenir la recherche dans cette direction et, en conséquence,
des résultats de recherche considérables sont disponibles. Cependant, les modèles de
prévision existants sont soit trop spécifiques à un horizon spatio-temporel, soit li-
mités à une région particulière. Le besoin actuel est donc celui d’une approche de
prévision plus polyvalente qui ne soit pas limitée par de telles contraintes et qui
puisse être reproduite pour des conditions initiales variables dans des conditions géo-
climatiques différentes. C’est à ces préoccupations que nous avons essentiellement
essayé de répondre dans cette thèse.
Ainsi après avoir montré l’importance d’une prévision efficace pour l’intégration
des Sources d’Energies Renouvelables Intermittentes et Stochastiques, une revue bi-
bliométrique a permise de montrer l’importance qu’accorde aussi la communauté
scientifique à cette thématique. Cette étude bibliométrique nous a permise de dé-
gager des publications pertinentes à travers lesquelles des techniques et modèles de
prévision ont été dégagés ainsi que les paramètres météorologiques d’influence de ces
puissances de sortie. Ainsi une nouvelle technique de prévision indirecte des puis-
sances de sortie des systèmes PV et éolienne basée sur l’identification des périodes
de production optimale a été proposée. Cette technique combine une méthode de
clustering (le k-means), une méthode d’extraction de caractéristiques (la Transfor-
mation de Fourier Rapide), une méthode de prévision des paramètres d’influence (le
CNN ou le LSTM) et une méthode d’estimation de la puissance de sortie.
L’application de cette technique de prévision au territoire béninois a permise de
la découper en 207 sous-zones dans lesquelles les paramètres d’influence (irradiation,

température et vitesse du vent) varient presque identiquement en tous points géo-

graphiques. Ainsi des modèles ont été développés pour la prévision des puissances de
sortie des systèmes caractéristiques des sous-zones. Cette approche a donc permis de
pouvoir caractériser tout point géographique pris de manière aléatoire et situé sur le
territoire béninois et donner un aperçu du comportement probable d’un système s’il
y était installé. Une validation expérimentale a ensuite permis de faire une compa-
raison entre prévisions et mesures sur site. Tous ces résultats nous ont conduits au
développement d’un outil d’aide à la décision.
Au terme de ces travaux, nous pouvons affirmer que les différents résultats obtenus
sont satisfaisants et que tous les objectifs fixés sont atteints.
Perspectives
La présente technique de prévision développée apporte effectivement les solutions

souhaitées. Néanmoins les performances de prévision pourraient être améliorées.
Des techniques de décomposition de données peuvent être appliquées pour dé-
composer les séries temporelles originales non stationnaires en plusieurs sous-séries
relativement stationnaires. Puis on pourrait construire un modèle de prévision sur
chaque sous-série pour obtenir plusieurs résultats de prévision individuels. Le résul-
tat final de la prévision sera obtenu en additionnant tous les résultats individuels de
la prévision. En prévoyant indépendamment chaque sous-série à l’aide du prédicteur,
on peut améliorer la précision de la prévision.
On pourrait aussi penser aux techniques de réduction de la dimensionnalité. La
réduction de la dimensionnalité des données d’entrée pourrait réduire considérable-
ment la complexité du calcul et l’erreur de prévision causée par les informations
redondantes. Dans nos travaux, nous avons utilisé en entrée 72h successives de don-
nées. Grâce aux techniques de réduction de dimensionnalité, on pourrait sélectionner
les heures en arrière les plus pertinentes pour une meilleure prévision.
Aussi pour nos travaux, nous avons été limités dans la variation des plages lors
de l’optimisation des hyperparamètres en raison des performances du système in-
formatique utilisé. Toujours pour améliorer les performances de prévision, il serait
intéressant d’élargir ces plages de valeurs d’hyperparamètres afin d’obtenir peut-être
des configurations de modèles plus performantes.
Les réalités sur le terrain étant rarement les mêmes, il serait nécessaire de prendre
en compte les facteurs environnementaux spécifiques à chaque point géographique
(présence de cimenterie par exemple) pouvant influer aussi sur les performances des

systèmes.
De plus, pour que les résultats soient directement exploitables, il faudrait aussi
prendre en compte les espaces occupés ou réservés. Il serait donc indispensable et
intéressant d’identifier dans chaque sous-zone les espaces vraiment exploitables.

Références Bibliographiques
[1] IRENA. The Renewable Energy Transition in Africa, . URL https://www.irena.org/Publications/2021/March/

The-Renewable-Energy-Transition-in-Africa.
[2] Banque Mondiale. Accès à l’électricité (% de la population) - Sub-Saharan Africa | Data,

. URL https://donnees.banquemondiale.org/indicator/EG.ELC.ACCS.ZS?end=2020&locations=ZG&name_
desc=false&start=2000&view=chart&year=2020.
[3] Banque Mondiale. Accès à l’électricité, zones rurales (% de la population rurale) - Sub-Saharan Africa |
Data, . URL https://donnees.banquemondiale.org/indicator/EG.ELC.ACCS.RU.ZS?end=2020&locations=
ZG&name_desc=false&start=2000&view=chart&year=2020.
[4] Banque Mondiale. Population, total - Sub-Saharan Africa | Data, . URL https://donnees.banquemondiale.
org/indicator/SP.POP.TOTL?locations=ZG.
[5] Banque Mondiale. Population rural (% de la population totale) - Sub-Saharan Africa | Data, . URL https:
//donnees.banquemondiale.org/indicateur/SP.RUR.TOTL.ZS?locations=ZG.
[6] IRENA. World Energy Transitions Outlook 1-5C Pathway 2022 edition, . URL https://www.irena.org/
publications/2022/Mar/World-Energy-Transitions-Outlook-2022.
[7] Roberto Dones, Thomas Heck, and Stefan Hirschberg. Greenhouse gas emissions from energy systems : Com-
parison and overview.
[8] Eva Llera Sastresa, Alfonso Aranda Usón, Ignacio Zabalza Bribián, and Sabina Scarpellini. Local impact of
renewables on employment : Assessment methodology and case study. 14(2) :679–690.
[9] S. Martín-Martínez, M. Cañas-Carretón, A. Honrubia-Escribano, and E. Gómez-Lázaro. Performance evalua-

tion of large solar photovoltaic power plants in Spain. 183 :515–528. ISSN 0196-8904. doi : 10.1016/j.enconman.
2018.12.116. URL https://www.sciencedirect.com/science/article/pii/S0196890419300378.
[10] Federico Bizzarri, Angelo Brambilla, Lorenzo Caretta, and Carlo Guardiani. Monitoring performance and
efficiency of photovoltaic parks. 78 :314–321. ISSN 0960-1481. doi : 10.1016/j.renene.2015.01.002. URL
https://www.sciencedirect.com/science/article/pii/S0960148115000099.
[11] Robert Gross, Philip Heptonstall, Matthew Leach, Jim Skea, Dennis Anderson, and Tim Green. The UK
Energy Research Centre review of the costs and impacts of intermittency. In Renewable Electricity and the
Grid, pages 94–114. Routledge, .
[12] Anne Sjoerd Brouwer, Machteld Van Den Broek, Ad Seebregts, and André Faaij. Impacts of large-scale
Intermittent Renewable Energy Sources on electricity systems, and how these can be modeled. 33 :443–466.
[13] Michael Milligan, Pearl Donohoo, Debra Lew, Erik Ela, Brendan Kirby, Hannele Holttinen, Eamonn Lannoye,
Damian Flynn, Mark O’Malley, and Nicholas Miller. Operating reserves and wind power integration : An
international comparison, .

[14] Severin Borenstein. The private and public economics of renewable electricity generation. 26(1) :67–92.
[15] Lion Hirth. The economics of wind and solar variability. How the variability of wind and solar power affects
their marginal value, optimal deployment, and integration costs.
[16] Gregor Czisch and Bernhard Ernst. High wind power penetration by the systematic use of smoothing effects
within huge catchment areas shown in a European example.
[17] G. Luther. The regional function energy. In Actes Du 11th Photovoltaic EC Solar Energy Conference,
Montreux, Suisse, pages 1313–1316.
[18] John E. Hay. An assessment of the mesoscale variability of solar radiation at the earth’s surface. 32(3) :
425–434.
[19] Robert Gross, Philip Heptonstall, Dennis Anderson, Tim Green, Matthew Leach, and Jim Skea. The Costs and
Impacts of Intermittency : An assessment of the evidence on the costs and impacts of intermittent generation
on the British electricity network, .
[20] Benoit Robyns, Arnaud Davigny, Christophe Saudemont, Aymeric Ansel, Vincent Courtecuisse, B. François,
Sophie Plumel, and J. Deuse. Impact de l’éolien sur le réseau de transport et la qualité de l’énergie. 5 :003.
[21] Dirk Van Hertem. The Use of Power Flow Controlling Devices in the Liberalized Market (Het gebruik van
vermogencontrolerende toestellen in de vrijgemaakte elektriciteitsmarkt).
[22] J. Pestourie. Les EnR intermittentes : Cas des réseaux insulaires, IEEE P&ES.
[23] Paul L. Joskow. Capacity payments in imperfect electricity markets : Need and design. 16(3) :159–170.
[24] Michael Milligan, Erik Ela, Bri-Mathias Hodge, Brendan Kirby, Debra Lew, Charlton Clark, Jennifer DeCesaro,
and Kevin Lynn. Integration of variable generation, cost-causation, and integration costs. 24(9) :51–63, .
[25] Ralph Sims, Pedro Enrique Mercado, and Wolfram Krewitt. Integration of renewable energy into present and
future energy systems.
[26] Impacts of large amounts of wind power on design and operation of power systems, results of IEA collaboration.
doi : 10.1002/we.410. URL https://onlinelibrary.wiley.com/doi/10.1002/we.410.
[27] Marius Paulescu, Eugenia Paulescu, and Viorel Badescu. Weather Modeling and Forecasting of PV Systems
Operation | SpringerLink, . URL https://link.springer.com/book/10.1007/978-1-4471-4649-0.
[28] Bella Espinar, José-Luis Aznarte, Robin Girard, Alfred Mbairadjim Moussa, and Georges Kariniotakis. Pho-
tovoltaic Forecasting : A state of the art. In 5th European PV-hybrid and Mini-Grid Conference, pages
Pages–250. OTTI-Ostbayerisches Technologie-Transfer-Institut.
[29] A. Moreno-Munoz, prefix=de la useprefix=true family=Rosa, given=J. J. G., R. Posadillo, and F. Bellido.
Very short term forecasting of solar radiation. In 2008 33rd IEEE Photovoltaic Specialists Conference, pages
1–5. doi : 10.1109/PVSC.2008.4922587.
[30] Gaudenz Koeppel and Magnus Korpås. Improving the network infeed accuracy of non-dispatchable generators
with energy storage devices. 78(12) :2024–2036.
[31] Daniel Masa-Bote, Manuel Castillo-Cagigal, E. Matallanas, Estefanía Caamaño-Martín, A. Gutiérrez,

F. Monasterio-Huelín, and J. Jiménez-Leube. Improving photovoltaics grid integration through short time
forecasting and self-consumption. 125 :103–113.
[32] Joao Gari da Silva Fonseca Junior, Takashi Oozeki, Hideaki Ohtake, Ken-ichi Shimose, Takumi Takashima,
and Kazuhiko Ogimoto. Regional forecasts and smoothing effect of photovoltaic power generation in Japan :
An approach with principal component analysis. 68 :403–413.

[33] Energy Storage Association Homepage | ESA, . URL https://energystorage.org/.
[34] Paula A. Taylor, Jennifer L. Miller, and Paul C. Butler. Energy Storage Opportunities Analysis Phase II Final
Report : A Study for the DOE Energy Storage Systems Program. URL https://www.osti.gov/biblio/800956.
[35] Gilles Notton, Marie-Laure Nivet, Cyril Voyant, Christophe Paoli, Christophe Darras, Fabrice Motte, and
Alexis Fouilloy. Intermittent and stochastic character of renewable energy sources : Consequences, cost of
intermittence and benefit of forecasting. 87 :96–105. ISSN 1364-0321. doi : 10.1016/j.rser.2018.02.007. URL
[36] D. K. Chaturvedi and I. Isha. Solar power forecasting : A review. 145(6) :28–50.
[37] V. Lara-Fanego, J. A. Ruiz-Arias, D. Pozo-Vázquez, F. J. Santos-Alamillos, and J. Tovar-Pescador. Evaluation

of the WRF model solar irradiance forecasts in Andalusia (southern Spain). 86(8) :2200–2217.
[38] Maimouna Diagne, Mathieu David, Philippe Lauret, John Boland, and Nicolas Schmutz. Review of solar
irradiance forecasting methods and a proposition for small-scale insular grids. 27 :65–76, .
[39] M. Saguan. The economic analysis of power market architectures : Application to real-time market design.
[40] Ben Elliston and Iain MacGill. The potential role of forecasting for integrating solar generation into the
Australian national electricity market. In Proceedings of the Solar.
[41] Hadja Maïmouna Diagne, Philippe Lauret, and Mathieu David. Solar irradiation forecasting : State-of-the-art
and proposition for future developments for small-scale insular grids. In WREF 2012-World Renewable Energy
Forum, .
[42] Lori Bird, Michael Milligan, and Debra Lew. Integrating variable renewable energy : Challenges and solutions.
[43] Kevin Porter and J. Rogers. Survey of variable generation forecasting in the west : August 2011-June 2012.
[44] COST. Action ES1002 - Weather Intelligence for Renewable Energies (WIRE). Current state report. URL
https://www.cost.eu/news/.
[45] Edgar A. DeMeo, Gary A. Jordan, Clint Kalich, Jack King, Michael R. Milligan, Cliff Murley, Brett Oakleaf,
and Matthew J. Schuerger. Accommodating wind’s natural behavior. 5(6) :59–67.
[46] Patrick J. Luickx, Erik D. Delarue, and William D. D’haeseleer. Impact of large amounts of wind power on
the operation of an electricity generation system : Belgian case study. 14(7) :2019–2028. ISSN 1364-0321. doi :
10.1016/j.rser.2010.03.018. URL https://www.sciencedirect.com/science/article/pii/S1364032110000730.
[47] Debra Lew, Michael Milligan, Gary Jordan, and Richard Piwko. Value of wind power forecasting.
[48] Timothy Robert Rudd. Benefits of near-term cloud location forecasting for large solar PV.
[49] Cong Wu, Xiao-Ping Zhang, and Michael Sterling. Solar power generation intermittency and aggregation.
12(1) :1363, . ISSN 2045-2322. doi : 10.1038/s41598-022-05247-2. URL https://www.nature.com/articles/
s41598-022-05247-2.
[50] Carl Hilger. Eltra, at the Fuel and Energy Technical Association Conference on “.
[51] Keith Parks. Xcel energy/NCAR wind energy forecasting system. In Talk on the UWIG Forecasting Workshop,
Albany (US), pages 23–24.
[52] Western Wind and Solar Integration Study. URL https://www.osti.gov/biblio/981991.
[53] R. J. Barthelmie, F. Murray, and S. C. Pryor. The economic benefit of short-term forecasting for wind energy
in the UK electricity market. 36(5) :1687–1696.

[54] Kirsten Orwig, Bri-Mathias Hodge, Greg Brinkman, Erik Ela, Michael Milligan, Venkat Banunarayanan, Saleh
Nasir, and Jeffrey Freedman. Economic evaluation of short-term wind power forecasts in ERCOT : Preliminary
results.
[55] Edward V. Mc Garrigle and Paul G. Leahy. Quantifying the value of improved wind energy forecasts in a
pool-based electricity market. 80 :517–524.
[56] D Lew and M Milligan. The Value of Wind Power Forecasting.
[57] Mamadou Dione. Machine learning for short term wind power forecasting. URL https://theses.hal.science/
tel-02913708.
[58] Vincent Le Guen. Deep learning for spatio-temporal forecasting - application to solar energy. URL https:
//theses.hal.science/tel-03590356.
[59] Utpal Kumar Das, Kok Soon Tey, Mehdi Seyedmahmoudian, Saad Mekhilef, Moh Yamani Idna Idris, Willem
Van Deventer, Bend Horan, and Alex Stojcevski. Forecasting of photovoltaic power generation and model
optimization : A review. 81 :912–928, . ISSN 1364-0321. doi : 10.1016/j.rser.2017.08.017. URL https://www.
sciencedirect.com/science/article/pii/S1364032117311620.
[60] Muhammad Qamar Raza and Abbas Khosravi. A review on artificial intelligence based load demand forecasting
techniques for smart grid and buildings. 50 :1352–1372. ISSN 13640321. doi : 10.1016/j.rser.2015.04.065. URL
https://linkinghub.elsevier.com/retrieve/pii/S1364032115003354.
[61] prefix=de useprefix=true family=Marcos, given=Rodrigo A., Antonio Bello, and Javier Reneses. Electri-
city price forecasting in the short term hybridising fundamental and econometric modelling. 167 :240–251.
ISSN 0378-7796. doi : 10.1016/j.epsr.2018.10.034. URL https://www.sciencedirect.com/science/article/pii/
S0378779618303572.
[62] Alfredo Nespoli, Emanuele Ogliari, Sonia Leva, Alessandro Massi Pavan, Adel Mellit, Vanni Lughi, and Alberto
Dolara. Day-Ahead Photovoltaic Forecasting : A Comparison of the Most Effective Techniques. 12(9) :1621, .
doi : 10.3390/en12091621. URL https://www.mdpi.com/1996-1073/12/9/1621.
[63] Anuj Gupta, Kapil Gupta, and Sumit Saroha. A review and evaluation of solar forecasting technologies. 47 :
2420–2425. ISSN 2214-7853. doi : 10.1016/j.matpr.2021.04.491. URL https://www.sciencedirect.com/science/
article/pii/S2214785321034167.
[64] Dazhi Yang, Zhen Ye, Li Hong Idris Lim, and Zibo Dong. Very short term irradiance forecasting using the
lasso. 114 :314–326. ISSN 0038-092X. doi : 10.1016/j.solener.2015.01.016. URL https://www.sciencedirect.
com/science/article/pii/S0038092X15000304.
[65] M. Caldas and R. Alonso-Suárez. Very short-term solar irradiance forecast using all-sky imaging and real-
time irradiance measurements. 143 :1643–1658. ISSN 0960-1481. doi : 10.1016/j.renene.2019.05.069. URL
[66] Pratima Kumari and Durga Toshniwal. Extreme gradient boosting and deep neural network based ensemble
learning approach to forecast hourly solar irradiance. 279 :123285, . ISSN 0959-6526. doi : 10.1016/j.jclepro.
2020.123285. URL https://www.sciencedirect.com/science/article/pii/S0959652620333308.
[67] Diego J. Pedregal and Juan R. Trapero. Adjusted combination of moving averages : A forecasting system
for medium-term solar irradiance. 298 :117155. ISSN 0306-2619. doi : 10.1016/j.apenergy.2021.117155. URL
[68] Hadja Diagne, Philippe Lauret, and Mathieu David. Solar irradiation forecasting : State-of-the-art and pro-
position for future developments for small-scale insular grids. .

[69] Cyril Voyant and Gilles Notton. Solar irradiation nowcasting by stochastic persistence : A new parsimonious,
simple and efficient forecasting tool. 92 :343–352. ISSN 1364-0321. doi : 10.1016/j.rser.2018.04.116. URL
[70] Manal Marzouq, Hakim El Fadili, Khalid Zenkouar, Zakia Lakhliai, and Mohammed Amouzg. Short term
solar irradiance forecasting via a novel evolutionary multi-model framework and performance assessment for
sites with no solar irradiance data. 157 :214–231. ISSN 0960-1481. doi : 10.1016/j.renene.2020.04.133. URL
[71] Cyril Voyant, Gilles Notton, Soteris Kalogirou, Marie-Laure Nivet, Christophe Paoli, Fabrice Motte, and
Alexis Fouilloy. Machine learning methods for solar radiation forecasting : A review. 105 :569–582.
ISSN 0960-1481. doi : 10.1016/j.renene.2016.12.095. URL https://www.sciencedirect.com/science/article/
pii/S0960148116311648.
[72] Amandeep Sharma and Ajay Kakkar. Forecasting daily global solar irradiance generation using machine
learning. 82 :2254–2269. ISSN 1364-0321. doi : 10.1016/j.rser.2017.08.066. URL https://www.sciencedirect.
com/science/article/pii/S1364032117312121.
[73] Chigbogu Godwin Ozoegwu. Artificial neural network forecast of monthly mean daily global solar radiation of
selected locations based on time series and month number. 216 :1–13. ISSN 0959-6526. doi : 10.1016/j.jclepro.
[74] Muhammad Aslam, Jae-Myeong Lee, Hyung-Seung Kim, Seung-Jae Lee, and Sugwon Hong. Deep Learning
Models for Long-Term Solar Radiation Forecasting Considering Microgrid Installation : A Comparative Study.
13(1) :147. ISSN 1996-1073. doi : 10.3390/en13010147. URL https://www.mdpi.com/1996-1073/13/1/147.
[75] Shahab Shariat Torbaghan, Amir Motamedi, Hamidreza Zareipour, and Le Anh Tuan. Medium-term electricity
price forecasting. In 2012 North American Power Symposium (NAPS), pages 1–8. doi : 10.1109/NAPS.2012.
6336424.
[76] Iivo Vehviläinen and Tuomas Pyykkönen. Stochastic factor model for electricity spot price—the case of the
Nordic market. 27(2) :351–367. ISSN 0140-9883. doi : 10.1016/j.eneco.2005.01.002. URL https://www.
optimization : A review. 81 :912–928, . ISSN 1364-0321. doi : 10.1016/j.rser.2017.08.017. URL http://www.
[78] Vincent P. A. Lonij, Adria E. Brooks, Alexander D. Cronin, Michael Leuthold, and Kevin Koch. Intra-hour
forecasts of solar power production using measurements from a network of irradiance sensors. 97 :58–66.
ISSN 0038-092X. doi : 10.1016/j.solener.2013.08.002. URL https://www.sciencedirect.com/science/article/
pii/S0038092X13003125.
[79] Jie Shi, Wei-Jen Lee, Yongqian Liu, Yongping Yang, and Peng Wang. Forecasting Power Output of Photovoltaic
Systems Based on Weather Classification and Support Vector Machines. 48(3) :1064–1069. ISSN 1939-9367.
doi : 10/f3zsxk.
[80] A. Mellit, A. Massi Pavan, and V. Lughi. Short-term forecasting of power production in a large-scale photo-
voltaic plant. 105 :401–413. ISSN 0038-092X. doi : 10/f57xn4. URL http://www.sciencedirect.com/science/
article/pii/S0038092X14001522.
[81] Marcelo Pinho Almeida, Oscar Perpiñán, and Luis Narvarte. PV power forecast using a nonparametric PV
model. 115 :354–368. ISSN 0038-092X. doi : 10.1016/j.solener.2015.03.006. URL https://www.sciencedirect.
com/science/article/pii/S0038092X15001218.

[82] Zhao Zhen, Shuaijie Pang, Fei Wang, Kangping Li, Zhigang Li, Hui Ren, Miadreza Shafie-khah, and João P. S.
Catalão. Pattern Classification and PSO Optimal Weights Based Sky Images Cloud Motion Speed Calculation
Method for Solar PV Power Forecasting. 55(4) :3331–3342, . ISSN 1939-9367. doi : 10.1109/TIA.2019.2904927.
[83] Qinghua Hu, Rujia Zhang, and Yucan Zhou. Transfer learning for short-term wind speed prediction with
deep neural networks. 85 :83–95, . ISSN 0960-1481. doi : 10.1016/j.renene.2015.06.034. URL https://www.
[84] Aqsa Saeed Qureshi, Asifullah Khan, Aneela Zameer, and Anila Usman. Wind power prediction using deep
neural network based meta regression and transfer learning. 58 :742–755. ISSN 1568-4946. doi : 10.1016/j.
asoc.2017.05.031. URL https://www.sciencedirect.com/science/article/pii/S1568494617302946.
[85] Huaizhi Wang, Haiyan Yi, Jianchun Peng, Guibin Wang, Yitao Liu, Hui Jiang, and Wenxin Liu. Deterministic
and probabilistic forecasting of photovoltaic power based on deep convolutional neural network. 153 :409–422, .
ISSN 0196-8904. doi : 10.1016/j.enconman.2017.10.008. URL https://www.sciencedirect.com/science/article/
pii/S019689041730910X.
[86] Ahmad Alzahrani, Pourya Shamsi, Cihan Dagli, and Mehdi Ferdowsi. Solar Irradiance Forecasting Using
Deep Neural Networks. 114 :304–313. ISSN 1877-0509. doi : 10.1016/j.procs.2017.09.045. URL http://www.
[87] Manoja Kumar Behera, Irani Majumder, and Niranjan Nayak. Solar photovoltaic power forecasting using
optimized modified extreme learning machine technique. 21(3) :428–438. ISSN 2215-0986. doi : 10.1016/j.
jestch.2018.04.013. URL https://www.sciencedirect.com/science/article/pii/S2215098617316063.
[88] Muhammad Qamar Raza, Mithulananthan Nadarajah, and Chandima Ekanayake. On recent advances in
PV output power forecast. 136 :125–144. ISSN 0038-092X. doi : 10.1016/j.solener.2016.06.073. URL http:
//www.sciencedirect.com/science/article/pii/S0038092X16302547.
[89] Ruiguo Yu, Zhiqiang Liu, Xuewei Li, Wenhuan Lu, Degang Ma, Mei Yu, Jianrong Wang, and Bin Li. Scene
learning : Deep convolutional networks for wind power prediction by embedding turbines into grid space.
238 :249–257, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.01.010. URL https://www.sciencedirect.com/
science/article/pii/S030626191930011X.
[90] Jinliang Zhang, Zhongfu Tan, and Yiming Wei. An adaptive hybrid model for day-ahead photovoltaic output
power prediction. 244 :118858, .
[91] Agbokpanzo Richard Gilles, Didavi Audace, Houngan Aristide, Oloulade Arouna, and Espanet Christophe.
Evaluation of the photovoltaic power prediction performance of a neural network based on input data. In
2020 IEEE 2nd International Conference on Smart Cities and Communities (SCCIC), pages 1–6. doi :
10.1109/SCCIC51516.2020.9377334.
[92] Razin Ahmed, V. Sreeram, Y. Mishra, and M. D. Arif. A review and evaluation of the state-of-the-art in PV
solar power forecasting : Techniques and optimization. 124 :109792.
[93] Zi Lin and Xiaolei Liu. Wind power forecasting of an offshore wind turbine based on high-frequency SCADA
data and deep learning neural network. 201 :117693.
[94] F. Almonacid, C. Rus, L. Hontoria, and F. J. Muñoz. Characterisation of PV CIS module by artificial neural
networks. A comparative study with other methods. 35(5) :973–980. ISSN 0960-1481. doi : 10.1016/j.renene.
[95] S. H. Oudjana, A. Hellal, and I. Hadj Mahammed. Power Forecasting of Photovoltaic Generation. 7(6) :
627–631. URL https://publications.waset.org/7156/power-forecasting-of-photovoltaic-generation.

[96] Wahyudi Imam, Ardyono Priyadi, Hery Mauridhi, Muhammad Abdillah, Anang Tjahjono, and Naoto Yorino.
Advanced Extreme Learning Machine for An Hour PV Forecast Using General Weather Data. 20232 :134.
doi : 10.15199/48.2023.01.26.
[97] Sobrina Sobri, Sam Koohi-Kamali, and Nasrudin Abd. Rahim. Solar photovoltaic generation forecasting me-
thods : A review. 156 :459–497. ISSN 0196-8904. doi : 10.1016/j.enconman.2017.11.019.
[98] Shreya Dutta, Yanling Li, Aditya Venkataraman, Luis M. Costa, Tianxiang Jiang, Robert Plana, Philippe
Tordjman, Fook Hoong Choo, Chek Fok Foo, and Hans B. Puttgen. Load and Renewable Energy Forecasting
for a Microgrid using Persistence Technique. 143 :617–622. ISSN 1876-6102. doi : 10.1016/j.egypro.2017.12.736.
URL https://www.sciencedirect.com/science/article/pii/S1876610217365001.
[99] Rahul Sharma and Diksha Singh. A Review of Wind Power and Wind Speed Forecasting. 8(7) :10.
[100] Jaesung Jung and Robert P. Broadwater. Current status and future advances for wind speed and power
forecasting. 31 :762–777. ISSN 1364-0321. doi : 10.1016/j.rser.2013.12.054. URL https://www.sciencedirect.
[101] Wen-Yeau Chang. A literature review of wind forecasting methods. 2(04) :161.
[102] Yuan-Kang Wu and Jing-Shan Hong. A literature review of wind forecasting technology in the world. In 2007
IEEE Lausanne Power Tech, pages 504–509. IEEE.
[103] Jing Zhao, Zhen-Hai Guo, Zhong-Yue Su, Zhi-Yuan Zhao, Xia Xiao, and Feng Liu. An improved multi-
step forecasting model based on WRF ensembles and creative fuzzy systems for wind speed. 162 :808–826, .
ISSN 0306-2619. doi : 10.1016/j.apenergy.2015.10.145. URL https://www.sciencedirect.com/science/article/
pii/S0306261915013872.
[104] Aneela Zameer, Junaid Arshad, Asifullah Khan, and Muhammad Asif Zahoor Raja. Intelligent and robust
prediction of short term wind power using genetic programming based ensemble of neural networks. 134 :361–
372. ISSN 0196-8904. doi : 10.1016/j.enconman.2016.12.032. URL https://www.sciencedirect.com/science/
article/pii/S0196890416311189.
[105] Zhongshan Yang and Jian Wang. A hybrid forecasting approach applied in wind speed forecasting based on a
data processing strategy and an optimized artificial intelligence algorithm. 160 :87–100. ISSN 0360-5442. doi :
10.1016/j.energy.2018.07.005. URL https://www.sciencedirect.com/science/article/pii/S0360544218312933.
[106] Claudio Monteiro, Tiago Santos, L. Alfredo Fernandez-Jimenez, Ignacio J. Ramirez-Rosado, and M. Sonia
Terreros-Olarte. Short-term power forecasting model for photovoltaic plants based on historical similarity. 6
(5) :2624–2643. ISSN 1996-1073. doi : 10.3390/en6052624. URL https://www.mdpi.com/1996-1073/6/5/2624.
[107] E. Lorenz and D. Heinemann. 1.13 - Prediction of Solar Irradiance and Photovoltaic Power. In
Ali Sayigh, editor, Comprehensive Renewable Energy, pages 239–292. Elsevier. ISBN 978-0-08-087873-
7. doi : 10.1016/B978-0-08-087872-0.00114-1. URL https://www.sciencedirect.com/science/article/pii/
B9780080878720001141.
[108] Saurabh S. Soman, Hamidreza Zareipour, Om Malik, and Paras Mandal. A review of wind power and wind
speed forecasting methods with different time horizons. In North American Power Symposium 2010, pages
1–8. IEEE.
[109] Ulrich Focken, Matthias Lange, and Hans-Peter Igor Waldl. Previento-A wind power prediction system with
an innovative upscaling algorithm.
[110] Matteo De Felice, Andrea Alessandri, and Paolo M. Ruti. Electricity demand forecasting over Italy : Potential
benefits using numerical weather prediction models. 104 :71–79. ISSN 0378-7796. doi : 10.1016/j.epsr.2013.06.
004. URL https://www.sciencedirect.com/science/article/pii/S0378779613001545.

[111] Jinhua Zhang, Jie Yan, David Infield, Yongqian Liu, and Fue-sang Lien. Short-term forecasting and uncertainty
analysis of wind turbine power based on long short-term memory network and Gaussian mixture model. 241 :
229–244, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.03.044. URL https://www.sciencedirect.com/science/
article/pii/S0306261919304532.
[112] Hang Cheng, Wu-shun Cao, and Peng-jiang Ge. Forecasting research of long-term solar irradiance and output
power for photovoltaic generation system. In 2012 Fourth International Conference on Computational and
Information Sciences, pages 1224–1227. IEEE.
[113] Chien-Chang Chou, Ching-Wu Chu, and Gin-Shuh Liang. A modified regression model for forecasting the
volumes of Taiwan’s import containers. 47(9-10) :797–807.
[114] Alfredo Nespoli, Emanuele Ogliari, Sonia Leva, Alessandro Massi Pavan, Adel Mellit, Vanni Lughi, and Alberto
Dolara. Day-ahead photovoltaic forecasting : A comparison of the most effective techniques. 12(9), . ISSN
1996-1073. doi : 10.3390/en12091621. URL https://www.mdpi.com/1996-1073/12/9/1621.
[115] Umut Firat, Seref Naci Engin, Murat Saraclar, and Aysin Baytan Ertuzun. Wind Speed Forecasting Based
on Second Order Blind Identification and Autoregressive Model. In 2010 Ninth International Conference on
Machine Learning and Applications, pages 686–691. doi : 10.1109/ICMLA.2010.106.
[116] Sungmoon Jung and Soon-Duck Kwon. Weighted error functions in artificial neural networks for improved
wind energy potential estimation. 111 :778–790. ISSN 0306-2619. doi : 10.1016/j.apenergy.2013.05.060. URL
https://www.sciencedirect.com/science/article/pii/S030626191300473X.
[117] Yongning Zhao, Lin Ye, Zhi Li, Xuri Song, Yansheng Lang, and Jian Su. A novel bidirectional mechanism
based on time series model for wind power forecasting. 177 :793–803, . ISSN 0306-2619. doi : 10.1016/j.
apenergy.2016.03.096. URL https://www.sciencedirect.com/science/article/pii/S0306261916304263.
[118] Umut Fırat, Seref Naci Engin, Murat Saraçlar, and Aysin Ertüzün. Wind speed forecasting based on second
order blind identification and autoregressive model. pages 686–691.
[119] Mario Javier Durán, Daniele Cros, and Jesús Riquelme. Short-term wind power forecast based on ARX models.
133 :172–180.
[120] Giacomo Sbrana and Andrea Silvestrini. Random switching exponential smoothing and inventory forecasting.
156 :283–294. ISSN 0925-5273. doi : 10.1016/j.ijpe.2014.06.016. URL https://www.sciencedirect.com/science/
article/pii/S0925527314001996.
[121] Liljana Ferbar Tratar and Ervin Strmčnik. The comparison of Holt–Winters method and Multiple regression
method : A case study. 109 :266–276. ISSN 0360-5442. doi : 10.1016/j.energy.2016.04.115. URL https:
//www.sciencedirect.com/science/article/pii/S0360544216305357.
[122] given-i=Ll family=Mora López, given=Ll. and M. Sidrach-de Cardona. Multiplicative ARMA models to
generate hourly series of global irradiation. 63(5) :283–291. ISSN 0038-092X. doi : 10.1016/S0038-092X(98)
00078-4. URL https://www.sciencedirect.com/science/article/pii/S0038092X98000784.
[123] Bruce E. Hansen. Time series analysis. 11(3) :625–630.
[124] Rina Haiges, Y. D. Wang, A. Ghoshray, and A. P. Roskilly. Forecasting Electricity Generation Capacity in
Malaysia : An Auto Regressive Integrated Moving Average Approach. 105 :3471–3478. ISSN 1876-6102. doi :
10.1016/j.egypro.2017.03.795. URL https://www.sciencedirect.com/science/article/pii/S1876610217308639.
[125] Fei Wang, Kangping Li, Lidong Zhou, Hui Ren, Javier Contreras, Miadreza Shafie-khah, and João P. S. Catalão.
Daily pattern prediction based classification modeling approach for day-ahead electricity price forecasting. 105 :
529–540, . ISSN 0142-0615. doi : 10.1016/j.ijepes.2018.08.039. URL https://www.sciencedirect.com/science/
article/pii/S0142061518305301.

[126] A. Sfetsos and A. H. Coonick. Univariate and multivariate forecasting of hourly solar radiation with artificial
intelligence techniques. 68(2) :169–178. ISSN 0038-092X. doi : 10.1016/S0038-092X(99)00064-X. URL https:
//www.sciencedirect.com/science/article/pii/S0038092X9900064X.
[127] Erasmo Cadenas, Wilfrido Rivera, Rafael Campos-Amezcua, and Christopher Heard. Wind speed prediction
using a univariate ARIMA model and a multivariate NARX model. 9(2). ISSN 1996-1073. doi : 10.3390/
en9020109. URL https://www.mdpi.com/1996-1073/9/2/109.
[128] Da Liu and Kun Sun. Random forest solar power forecast based on classification optimization. 187 :115940.
ISSN 0360-5442. doi : 10.1016/j.energy.2019.115940. URL https://www.sciencedirect.com/science/article/pii/
S036054421931624X.
[129] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Comparative study of Decision
Tree, Random Forest and XGBoost performance in forecasting the power output of a photovoltaic system.
In 2021 IEEE 4th International Conference on Bio-Engineering for Smart Technologies (BioSMART), pages
1–5, . doi : 10.1109/BioSMART54244.2021.9677566.
[130] Huaizhi Wang, Zhenxing Lei, Xian Zhang, Bin Zhou, and Jianchun Peng. A review of deep learning for
renewable energy forecasting. 198 :111799, . ISSN 0196-8904. doi : 10.1016/j.enconman.2019.111799. URL
[131] Richard Agbokpanzo, Audace Didavi, Aristide Comlan Houngan, and Christophe Espanet. Application of
neural networks to forecast photovoltaic power in the framework of the valorisation of renewable energies in
Benin republic. 16 :2204–2208. ISSN 1819-6608. URL http://www.arpnjournals.org/jeas/research_papers/
rp_2021/jeas_1121_8732.pdf.
[132] Ghadah Alkhayat and Rashid Mehmood. A review and taxonomy of wind and solar energy forecasting methods
based on deep learning. page 100060.
[133] Yuchi Sun, Gergely Sz\ Hucs, and Adam R. Brandt. Solar PV output prediction from video streams using
convolutional neural networks. 11(7) :1811–1818, .
[134] Chiou-Jye Huang and Ping-Huan Kuo. Multiple-Input Deep Convolutional Neural Network Model for Short-
Term Photovoltaic Power Forecasting. 7 :74822–74834. ISSN 2169-3536. doi : 10.1109/ACCESS.2019.2921238.
[135] Ying-Yi Hong and Thursy Rienda Aulia Satriani. Day-ahead spatiotemporal wind speed forecasting using
robust design-based deep learning neural network. 209 :118441. ISSN 0360-5442. doi : 10.1016/j.energy.2020.
[136] Amir Ghaderi, Borhan M. Sanandaji, and Faezeh Ghaderi. Deep Forecast : Deep Learning-based Spatio-
Temporal Forecasting. URL http://arxiv.org/abs/1707.08110.
[137] Sisheng Liang, Long Nguyen, and Fang Jin. A Multi-variable Stacked Long-Short Term Memory Network for
Wind Speed Forecasting. In 2018 IEEE International Conference on Big Data (Big Data), pages 4561–4564,
. doi : 10.1109/BigData.2018.8622332.
[138] Mohammad Safayet Hossain and Hisham Mahmood. Short-Term Photovoltaic Power Forecasting Using an
LSTM Neural Network and Synthetic Weather Forecast. 8 :172524–172533. ISSN 2169-3536. doi : 10.1109/
ACCESS.2020.3024901.
[139] Zhewen Niu, Zeyuan Yu, Wenhu Tang, Qinghua Wu, and Marek Reformat. Wind power forecasting using
attention-based gated recurrent unit network. 196 :117081.
[140] Hangxia Zhou, Yujin Zhang, Lingfan Yang, Qian Liu, Ke Yan, and Yang Du. Short-Term Photovoltaic Power
Forecasting Based on Long Short Term Memory Neural Network and Attention Mechanism. 7 :78063–78074,
. ISSN 2169-3536. doi : 10.1109/ACCESS.2019.2923006.

[141] Murat Cihan Sorkun, Christophe Paoli, and Özlem Durmaz Incel. Time series forecasting on solar irradia-
tion using deep learning. In 2017 10th International Conference on Electrical and Electronics Engineering
(ELECO), pages 151–155.
[142] Lulu Wen, Kaile Zhou, Shanlin Yang, and Xinhui Lu. Optimal load dispatch of community microgrid with
deep learning based solar power and load forecasting. 171 :1053–1065. ISSN 0360-5442. doi : 10.1016/j.energy.
[143] Mohamed Abdel-Nasser and Karar Mahmoud. Accurate photovoltaic power forecasting models using deep
LSTM-RNN. 31(7) :2727–2740. ISSN 1433-3058. doi : 10.1007/s00521-017-3225-z. URL https://doi.org/10.
1007/s00521-017-3225-z.
[144] Zhihong Pang, Fuxin Niu, and Zheng O’Neill. Solar radiation prediction using recurrent neural network and
artificial neural network : A case study with comparisons. 156 :279–289. ISSN 0960-1481. doi : 10.1016/j.
renene.2020.04.042. URL https://www.sciencedirect.com/science/article/pii/S0960148120305747.
[145] Xiangyun Qing and Yugang Niu. Hourly day-ahead solar irradiance prediction using weather forecasts by
LSTM. 148 :461–468. ISSN 0360-5442. doi : 10.1016/j.energy.2018.01.177. URL https://www.sciencedirect.
[146] Hussein Sharadga, Shima Hajimirza, and Robert S. Balog. Time series forecasting of solar power generation
for large-scale photovoltaic plants. 150 :797–807. ISSN 0960-1481. doi : 10.1016/j.renene.2019.12.131. URL
[147] Marcello Anderson F. B. Lima, Paulo C. M. Carvalho, Luis M. Fernández-Ramírez, and Arthur P. S.
Braga. Improving solar forecasting using Deep Learning and Portfolio Theory integration. 195 :117016, .
ISSN 0360-5442. doi : 10.1016/j.energy.2020.117016. URL https://www.sciencedirect.com/science/article/pii/
S0360544220301237.
[148] Farah Shahid, Aneela Zameer, Ammara Mehmood, and Muhammad Asif Zahoor Raja. A novel wavenets
long short term memory paradigm for wind power prediction. 269 :115098. ISSN 0306-2619. doi : 10.1016/j.
apenergy.2020.115098. URL https://www.sciencedirect.com/science/article/pii/S0306261920306103.
[149] Vishnu Suresh, Przemyslaw Janik, Josep M. Guerrero, Zbigniew Leonowicz, and Tomasz Sikorski. Microgrid
Energy Management System With Embedded Deep Learning Forecaster and Combined Optimizer. 8 :202225–
202239. ISSN 2169-3536. doi : 10.1109/ACCESS.2020.3036131.
[150] Chaoshun Li, Geng Tang, Xiaoming Xue, Xinbiao Chen, Ruoheng Wang, and Chu Zhang. The short-term
interval prediction of wind power using the deep learning model with gradient descend optimization. 155 :
197–211, . ISSN 0960-1481. doi : 10.1016/j.renene.2020.03.098. URL https://www.sciencedirect.com/science/
article/pii/S0960148120304304.
[151] Y. Q. Neo, T. T. Teo, W. L. Woo, T. Logenthiran, and A. Sharma. Forecasting of photovoltaic power using
deep belief network. In TENCON 2017 - 2017 IEEE Region 10 Conference, pages 1189–1194. doi : 10.1109/
TENCON.2017.8228038.
[152] Kuo-Ping Lin, Ping-Feng Pai, and Yi-Ju Ting. Deep Belief Networks With Genetic Algorithms in Forecasting
Wind Speed. 7 :99244–99253. ISSN 2169-3536. doi : 10.1109/ACCESS.2019.2929542.
[153] Jie Chen, Guo-Qiang Zeng, Wuneng Zhou, Wei Du, and Kang-Di Lu. Wind speed forecasting using nonlinear-
learning ensemble of deep learning time series prediction and extremal optimization. 165 :681–695, . ISSN
0196-8904. doi : 10.1016/j.enconman.2018.03.098. URL https://www.sciencedirect.com/science/article/pii/
S0196890418303261.
[154] Ya-Lan Hu and Liang Chen. A nonlinear hybrid wind speed forecasting model using LSTM network, hysteretic
ELM and Differential Evolution algorithm. 173 :123–142. ISSN 0196-8904. doi : 10.1016/j.enconman.2018.07.

[155] Gholamreza Memarzadeh and Farshid Keynia. A new short-term wind speed forecasting method based on
fine-tuned LSTM neural network and optimal input sets. 213 :112824. ISSN 0196-8904. doi : 10.1016/j.
enconman.2020.112824. URL https://www.sciencedirect.com/science/article/pii/S0196890420303629.
[156] Chuanjin Yu, Yongle Li, Yulong Bao, Haojun Tang, and Guanghao Zhai. A novel framework for wind
speed prediction based on recurrent neural networks and support vector machine. 178 :137–145, . ISSN
S0196890418311087.
[157] He Jiajun, Yu Chuanjin, Li Yongle, and Xiang Huoyue. Ultra-short term wind prediction with wavelet trans-
form, deep belief network and ensemble learning. 205 :112418. ISSN 0196-8904. doi : 10.1016/j.enconman.
[158] Manohar Mishra, Pandit Byomakesha Dash, Janmenjoy Nayak, Bighnaraj Naik, and Subrat Kumar Swain.
Deep learning and wavelet transform integrated approach for short-term solar PV power prediction. 166 :
108250. ISSN 0263-2241. doi : 10.1016/j.measurement.2020.108250. URL https://www.sciencedirect.com/
science/article/pii/S0263224120307892.
[159] Fei Li, Guorui Ren, and Jay Lee. Multi-step wind speed prediction based on turbulence intensity and hybrid
deep neural networks. 186 :306–322, . ISSN 0196-8904. doi : 10.1016/j.enconman.2019.02.045. URL https:
[160] Zhiyun Peng, Sui Peng, Lidan Fu, Binchun Lu, Junjie Tang, Ke Wang, and Wenyuan Li. A novel deep
learning ensemble model with data denoising for short-term wind speed forecasting. 207 :112524, . ISSN
0196-8904. doi : 10.1016/j.enconman.2020.112524. URL https://www.sciencedirect.com/science/article/pii/
S0196890420300601.
[161] Hui Liu and Chao Chen. Data processing strategies in wind energy forecasting models and applications : A
comprehensive review. 249 :392–408, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.04.188. URL https:
[162] Hui Liu, Xiwei Mi, and Yanfei Li. Smart deep learning based wind speed prediction model using wavelet packet
decomposition, convolutional neural network and convolutional long short term memory network. 166 :120–
131, . ISSN 0196-8904. doi : 10.1016/j.enconman.2018.04.021. URL https://www.sciencedirect.com/science/
article/pii/S019689041830356X.
[163] Amirhossein Dolatabadi, Hussein Abdeltawab, and Yasser Abdel-Rady I. Mohamed. Hybrid Deep Learning-
Based Model for Wind Speed Forecasting Based on DWPT and Bidirectional LSTM Network. 8 :229219–
229232. ISSN 2169-3536. doi : 10.1109/ACCESS.2020.3047077.
[164] Soonho Hwangbo, KiJeon Nam, SungKu Heo, and ChangKyoo Yoo. Hydrogen-based self-sustaining in-
tegrated renewable electricity network (HySIREN) using a supply-demand forecasting model and deep-
learning algorithms. 185 :353–367. ISSN 0196-8904. doi : 10.1016/j.enconman.2019.02.017. URL https:
[165] KiJeon Nam, Soonho Hwangbo, and ChangKyoo Yoo. A deep learning-based forecasting model for renewable
energy scenarios to guide sustainable energy policy : A case study of Korea. 122 :109725. ISSN 1364-0321. doi :
10.1016/j.rser.2020.109725. URL https://www.sciencedirect.com/science/article/pii/S1364032120300228.
[166] Hao-Fan Yang and Yi-Ping Phoebe Chen. Representation learning with extreme learning machines and
empirical mode decomposition for wind speed forecasting methods. 277 :103176. ISSN 0004-3702. doi :
10.1016/j.artint.2019.103176. URL https://www.sciencedirect.com/science/article/pii/S000437021930181X.
[167] Xiaohui He, Ying Nie, Hengliang Guo, and Jianzhou Wang. Research on a Novel Combination System on
the Basis of Deep Learning and Swarm Intelligence Optimization Algorithm for Wind Speed Forecasting. 8 :
51482–51499. ISSN 2169-3536. doi : 10.1109/ACCESS.2020.2980562.

[168] Jujie Wang and Yaning Li. Multi-step ahead wind speed prediction based on optimal feature extraction,
long short term memory neural network and error correction strategy. 230 :429–443. ISSN 0306-2619. doi :
10.1016/j.apenergy.2018.08.114. URL https://www.sciencedirect.com/science/article/pii/S0306261918312844.
[169] Lin Wang, Rui Tao, Huanling Hu, and Yu-Rong Zeng. Effective wind power prediction using novel deep
learning network : Stacked independently recurrent autoencoder. 164 :642–655, . ISSN 0960-1481. doi :
10.1016/j.renene.2020.09.108. URL https://www.sciencedirect.com/science/article/pii/S0960148120315330.
[170] Ceyhun Yildiz, Hakan Acikgoz, Deniz Korkmaz, and Umit Budak. An improved residual-based convolutional
neural network for very short-term wind power forecasting. 228 :113731. ISSN 0196-8904. doi : 10.1016/j.
enconman.2020.113731. URL https://www.sciencedirect.com/science/article/pii/S0196890420312553.
[171] Haixiang Zang, Lilin Cheng, Tao Ding, Kwok W. Cheung, Zhinong Wei, and Guoqiang Sun. Day-ahead
photovoltaic power forecasting approach based on deep convolutional neural networks and meta learning. 118 :
105790, . ISSN 0142-0615. doi : 10.1016/j.ijepes.2019.105790. URL https://www.sciencedirect.com/science/
article/pii/S0142061519307409.
[172] Wenlong Fu, Kai Wang, Jiawen Tan, and Kai Zhang. A composite framework coupling multiple feature
selection, compound prediction models and novel hybrid swarm optimizer-based synchronization optimization
strategy for multi-step ahead short-term wind speed forecasting. 205 :112461. ISSN 0196-8904. doi : 10.1016/
j.enconman.2019.112461. URL https://www.sciencedirect.com/science/article/pii/S0196890419314694.
[173] Xiwei Mi, Hui Liu, and Yanfei Li. Wind speed prediction model using singular spectrum analysis, empirical
mode decomposition and convolutional support vector machine. 180 :196–205. ISSN 0196-8904. doi : 10.1016/
j.enconman.2018.11.006. URL https://www.sciencedirect.com/science/article/pii/S0196890418312421.
[174] Hui Liu, Xiwei Mi, and Yanfei Li. Smart multi-step deep learning model for wind speed forecasting based on
variational mode decomposition, singular spectrum analysis, LSTM network and ELM. 159 :54–64, . ISSN
S0196890418300104.
[175] Ling Xiang, Jingxu Li, Aijun Hu, and Yue Zhang. Deterministic and probabilistic multi-step forecasting for
short-term wind speed based on secondary decomposition and a deep learning method. 220 :113098. ISSN
S0196890420306427.
[176] Hao Yin, Zuhong Ou, Shengquan Huang, and Anbo Meng. A cascaded deep learning wind power prediction
approach based on a two-layer of mode decomposition. 189 :116316. ISSN 0360-5442. doi : 10.1016/j.energy.
[177] Zherui Ma, Hongwei Chen, Jiangjiang Wang, Xin Yang, Rujing Yan, Jiandong Jia, and Wenliang Xu. Ap-
plication of hybrid model based on double decomposition, error correction and deep learning in short-term
wind speed prediction. 205 :112345, . ISSN 0196-8904. doi : 10.1016/j.enconman.2019.112345. URL
[178] Gonggui Chen, Lijun Li, Zhizhong Zhang, and Shuaiyong Li. Short-Term Wind Speed Forecasting With
Principle-Subordinate Predictor Based on Conv-LSTM and Improved BPNN. 8 :67955–67973, . ISSN 2169-
3536. doi : 10.1109/ACCESS.2020.2982839.
[179] Woonghee Lee, Keonwoo Kim, Junsep Park, Jinhee Kim, and Younghoon Kim. Forecasting Solar Power
Using Long-Short Term Memory and Convolutional Neural Networks. 6 :73068–73080. ISSN 2169-3536. doi :
10.1109/ACCESS.2018.2883330.
[180] Gangqiang Li, Sen Xie, Bozhong Wang, Jiantao Xin, Yunfeng Li, and Shengnan Du. Photovoltaic Power
Forecasting With a Hybrid Deep Learning Approach. 8 :175871–175880, . ISSN 2169-3536. doi : 10.1109/
ACCESS.2020.3025860.

[181] Biplob Ray, Rakibuzzaman Shah, Md. Rabiul Islam, and Syed Islam. A New Data Driven Long-Term Solar
Yield Analysis Model of Photovoltaic Power Plants. 8 :136223–136233. ISSN 2169-3536. doi : 10.1109/
ACCESS.2020.3011982.
[182] Sujan Ghimire, Ravinesh C. Deo, Nawin Raj, and Jianchun Mi. Deep solar radiation forecasting with convo-
lutional neural network and long short-term memory network algorithms. 253 :113541. ISSN 0306-2619. doi :
10.1016/j.apenergy.2019.113541. URL https://www.sciencedirect.com/science/article/pii/S0306261919312152.
[183] Haixiang Zang, Ling Liu, Li Sun, Lilin Cheng, Zhinong Wei, and Guoqiang Sun. Short-term global horizontal
irradiance forecasting based on a hybrid CNN-LSTM model with spatiotemporal correlations. 160 :26–41, .
ISSN 0960-1481. doi : 10.1016/j.renene.2020.05.150. URL https://www.sciencedirect.com/science/article/pii/
S0960148120308557.
[184] Wenzu Wu, Kunjin Chen, Ying Qiao, and Zongxiang Lu. Probabilistic short-term wind power forecasting
based on deep neural networks. In 2016 International Conference on Probabilistic Methods Applied to Power
Systems (PMAPS), pages 1–8, . doi : 10.1109/PMAPS.2016.7764155.
[185] Qiaomu Zhu, Jinfu Chen, Dongyuan Shi, Lin Zhu, Xiang Bai, Xianzhong Duan, and Yilu Liu. Learning
Temporal and Spatial Correlations Jointly : A Unified Framework for Wind Speed Prediction. 11(1) :509–523,
. ISSN 1949-3037. doi : 10.1109/TSTE.2019.2897136.
[186] Kejun Wang, Xiaoxia Qi, and Hongda Liu. A comparison of day-ahead photovoltaic power forecasting models
based on deep learning neural network. 251 :113315, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.113315.
URL http://www.sciencedirect.com/science/article/pii/S0306261919309894.
[187] Yong Qin, Kun Li, Zhanhao Liang, Brendan Lee, Fuyong Zhang, Yongcheng Gu, Lei Zhang, Fengzhi Wu, and
Dragan Rodriguez. Hybrid forecasting model based on long short term memory network and deep learning
neural network for wind signal. 236 :262–272. ISSN 0306-2619. doi : 10.1016/j.apenergy.2018.11.063. URL
[188] Jianxing Wang, Lili Guo, Chengying Zhang, Lei Song, Jiangyong Duan, and Liqiang Duan. Thermal power
forecasting of solar power tower system by combining mechanism modeling and deep learning method. 208 :
118403, . ISSN 0360-5442. doi : 10.1016/j.energy.2020.118403. URL https://www.sciencedirect.com/science/
article/pii/S0360544220315103.
[189] Seongcheol Woo, Junyoung Park, Jinkyoo Park, and Lance Manuel. Wind Field-Based Short-Term Turbine
Response Forecasting by Stacked Dilated Convolutional LSTMs. 11(4) :2294–2304. ISSN 1949-3037. doi :
10.1109/TSTE.2019.2954107.
[190] Songjian Chai, Zhao Xu, Youwei Jia, and Wai Kin Wong. A Robust Spatiotemporal Forecasting Framework
for Photovoltaic Generation. 11(6) :5370–5382. ISSN 1949-3061. doi : 10.1109/TSG.2020.3006085.
[191] Mousa Afrasiabi, Mohammad Mohammadi, Mohammad Rastegar, and Amin Kargarian. Multi-agent microgrid
energy management based on deep learning forecaster. 186 :115873. ISSN 0360-5442. doi : 10.1016/j.energy.
[192] Yongqi Liu, Hui Qin, Zhendong Zhang, Shaoqian Pei, Zhiqiang Jiang, Zhongkai Feng, and Jianzhong Zhou.
Probabilistic spatiotemporal wind speed forecasting based on a variational Bayesian deep learning model. 260 :
114259, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.114259. URL https://www.sciencedirect.com/science/
article/pii/S0306261919319464.
[193] Yun Ju, Guangyu Sun, Quanhe Chen, Min Zhang, Huixian Zhu, and Mujeeb Ur Rehman. A Model Combining
Convolutional Neural Network and LightGBM Algorithm for Ultra-Short-Term Wind Power Forecasting. 7 :
28309–28318. ISSN 2169-3536. doi : 10.1109/ACCESS.2019.2901920.

[194] Yong Chen, Shuai Zhang, Wenyu Zhang, Juanjuan Peng, and Yishuai Cai. Multifactor spatio-temporal cor-
relation model based on a combination of convolutional neural network and long short-term memory neural
network for wind speed forecasting. 185 :783–799, . ISSN 0196-8904. doi : 10.1016/j.enconman.2019.02.018.
[195] Ying-Yi Hong and Christian Lian Paulo P. Rioflorido. A hybrid deep learning-based neural network for 24-h
ahead wind power forecasting. 250 :530–539. ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.05.044. URL
https://www.sciencedirect.com/science/article/pii/S030626191930889X.
[196] Ruiguo Yu, Jie Gao, Mei Yu, Wenhuan Lu, Tianyi Xu, Mankun Zhao, Jie Zhang, Ruixuan Zhang, and Zhuo
Zhang. LSTM-EFG for wind power forecasting based on sequential correlation features. 93 :33–42, .
[197] Kejun Wang, Xiaoxia Qi, Hongda Liu, and Jiakang Song. Deep belief network based k-means cluster ap-
proach for short-term wind power forecasting. 165 :840–852, . URL https://ideas.repec.org/a/eee/energy/
v165y2018ipap840-852.html.
[198] Yu Zhang, Yanting Li, and Guangyao Zhang. Short-term wind power forecasting approach based on Seq2Seq
model using NWP data. 213 :118371, . ISSN 0360-5442. doi : 10.1016/j.energy.2020.118371. URL https:
//www.sciencedirect.com/science/article/pii/S036054422031478X.
[199] Zhao Zhen, Jiaming Liu, Zhanyao Zhang, Fei Wang, Hua Chai, Yili Yu, Xiaoxing Lu, Tieqiang Wang, and
Yuzhang Lin. Deep learning based surface irradiance mapping model for solar PV power forecasting using sky
image. 56(4) :3385–3396, .
[200] Hui Liu, Zhu Duan, Chao Chen, and Haiping Wu. A novel two-stage deep learning wind speed forecasting
method with adaptive multiple error corrections and bivariate Dirichlet process mixture model. 199 :111975, .
ISSN 0196-8904. doi : 10.1016/j.enconman.2019.111975. URL https://www.sciencedirect.com/science/article/
pii/S0196890419309811.
[201] Hui Liu and Chao Chen. Multi-objective data-ensemble wind speed forecasting model with stacked sparse
autoencoder and adaptive decomposition-based error correction. 254 :113686, . ISSN 0306-2619. doi : 10.1016/
j.apenergy.2019.113686. URL https://www.sciencedirect.com/science/article/pii/S030626191931373X.
[202] Fei Wang, Zhiming Xuan, Zhao Zhen, Kangping Li, Tieqiang Wang, and Min Shi. A day-ahead PV power
forecasting method based on LSTM-RNN model and time correlation modification under partial daily pattern
prediction framework. 212 :112766, .
[203] Mingming Gao, Jianjing Li, Feng Hong, and Dongteng Long. Day-ahead power forecasting in a large-scale
photovoltaic plant based on weather classification using LSTM. 187 :115838, . ISSN 0360-5442. doi : 10.1016/
j.energy.2019.07.168. URL https://www.sciencedirect.com/science/article/pii/S0360544219315105.
[204] Hua Yan and Zhengping Wu. A Hybrid Short-Term Wind Power Prediction Model Combining Data Processing,
Multiple Parameters Optimization and Multi-Intelligent Models Apportion Strategy. 8 :227126–227140. ISSN
2169-3536. doi : 10.1109/ACCESS.2020.3046001.
[205] Yanfei Li, Haiping Wu, and Hui Liu. Multi-step wind speed forecasting using EWT decomposition, LSTM
principal computing, RELM subordinate computing and IEWT reconstruction. 167 :203–219, . ISSN
S0196890418304308.
[206] Shaoqian Pei, Hui Qin, Zhendong Zhang, Liqiang Yao, Yongqiang Wang, Chao Wang, Yongqi Liu, Zhiqiang
Jiang, Jianzhong Zhou, and Tailai Yi. Wind speed prediction method based on Empirical Wavelet Transform
and New Cell Update Long Short-Term Memory network. 196 :779–792. ISSN 0196-8904. doi : 10.1016/j.
enconman.2019.06.041. URL https://www.sciencedirect.com/science/article/pii/S0196890419307125.

[207] Hui Liu, Xi-wei Mi, and Yan-fei Li. Wind speed forecasting method based on deep learning strategy using
empirical wavelet transform, long short term memory neural network and Elman neural network. 156 :498–
514, . ISSN 0196-8904. doi : 10.1016/j.enconman.2017.11.053. URL https://www.sciencedirect.com/science/
article/pii/S0196890417311056.
[208] Tao Liang, Gaofeng Xie, Shurui Fan, and Zhaochao Meng. A Combined Model Based on CEEMDAN, Permu-
tation Entropy, Gated Recurrent Unit Network, and an Improved Bat Algorithm for Wind Speed Forecasting.
8 :165612–165630, . ISSN 2169-3536. doi : 10.1109/ACCESS.2020.3022872.
[209] Xiwei Mi and Shuo Zhao. Wind speed prediction based on singular spectrum analysis and neural network
structural learning. 216 :112956. ISSN 0196-8904. doi : 10.1016/j.enconman.2020.112956. URL https://www.
[210] Xiaoan Yan, Ying Liu, Yadong Xu, and Minping Jia. Multistep forecasting for diurnal wind speed ba-
sed on hybrid deep learning model with improved singular spectrum decomposition. 225 :113456, . ISSN
S0196890420309900.
[211] Mahdi Khodayar and Jianhui Wang. Spatio-Temporal Graph Deep Neural Network for Short-Term Wind
Speed Forecasting. 10(2) :670–681. ISSN 1949-3037. doi : 10.1109/TSTE.2018.2844102.
[212] Qu Xiaoyun, Kang Xiaoning, Zhang Chao, Jiang Shuai, and Ma Xiuda. Short-term prediction of wind power
based on deep Long Short-Term Memory. In 2016 IEEE PES Asia-Pacific Power and Energy Engineering
Conference (APPEEC), pages 1148–1152. doi : 10.1109/APPEEC.2016.7779672.
[213] Zhu Duan and Hui Liu. An evolution-dependent multi-objective ensemble model of vanishing moment with
adversarial auto-encoder for short-term wind speed forecasting in Xinjiang wind farm, China. 198 :111914.
ISSN 0196-8904. doi : 10.1016/j.enconman.2019.111914. URL https://www.sciencedirect.com/science/article/
pii/S0196890419309057.
[214] Hamed H. H. Aly. A novel deep learning intelligent clustered hybrid models for wind speed and power fore-
casting. 213 :118773. ISSN 0360-5442. doi : 10.1016/j.energy.2020.118773. URL https://www.sciencedirect.
[215] Jie Yan, Hao Zhang, Yongqian Liu, Shuang Han, Li Li, and Zongxiang Lu. Forecasting the High Penetration
of Wind Power on Multiple Scales Using Multi-to-Multi Mapping. 33(3) :3276–3284, . ISSN 1558-0679. doi :
10.1109/TPWRS.2017.2787667.
[216] Juan Ospina, Alvi Newaz, and M. Omar Faruque. Forecasting of PV plant output using hybrid wavelet-based
LSTM-DNN structure model. 13(7) :1087–1095. ISSN 1752-1424. doi : 10.1049/iet-rpg.2018.5779. URL
https://onlinelibrary.wiley.com/doi/abs/10.1049/iet-rpg.2018.5779.
[217] Pengtao Li, Kaile Zhou, Xinhui Lu, and Shanlin Yang. A hybrid deep learning model for short-term PV power
forecasting. 259 :114216, .
[218] Bixuan Gao, Xiaoqiao Huang, Junsheng Shi, Yonghang Tai, and Jun Zhang. Hourly forecasting of so-
lar irradiance based on CEEMDAN and multi-strategy CNN-LSTM neural networks. 162 :1665–1683, .
ISSN 0960-1481. doi : 10.1016/j.renene.2020.09.141. URL https://www.sciencedirect.com/science/article/
pii/S0960148120315652.
[219] Kejun Wang, Xiaoxia Qi, and Hongda Liu. Photovoltaic power forecasting based LSTM-Convolutional Network.
189 :116225, . ISSN 0360-5442. doi : 10.1016/j.energy.2019.116225. URL https://www.sciencedirect.com/
science/article/pii/S0360544219319206.

[220] Haixiang Zang, Lilin Cheng, Tao Ding, Kwok W. Cheung, Miaomiao Wang, Zhinong Wei, and Guoqiang Sun.
Application of functional deep belief network for estimating daily global solar radiation : A case study in
China. 191 :116502, . ISSN 0360-5442. doi : 10.1016/j.energy.2019.116502. URL https://www.sciencedirect.
[221] Gary W. Chang and Heng-Jiu Lu. Integrating Gray Data Preprocessor and Deep Belief Network for Day-Ahead
PV Power Output Forecast. 11(1) :185–194. ISSN 1949-3037. doi : 10.1109/TSTE.2018.2888548.
[222] Fei Wang, Zhanyao Zhang, Chun Liu, Yili Yu, Songling Pang, Neven Duić, Miadreza Shafie-khah, and João
P. S. Catalão. Generative adversarial networks and convolutional neural networks based weather classification
model for day ahead short-term photovoltaic power forecasting. 181 :443–462, . ISSN 0196-8904. doi : 10.
1016/j.enconman.2018.11.074. URL https://www.sciencedirect.com/science/article/pii/S0196890418313268.
[223] Hao Zhang, Yongqian Liu, Jie Yan, Shuang Han, Li Li, and Quan Long. Improved Deep Mixture Density
Network for Regional Wind Power Probabilistic Forecasting. 35(4) :2549–2560, . ISSN 1558-0679. doi :
10.1109/TPWRS.2020.2971607.
[224] Shuang Zhu, Xiaohui Yuan, Zhanya Xu, Xiangang Luo, and Hairong Zhang. Gaussian mixture model coupled
recurrent neural networks for wind speed interval forecast. 198 :111772, . ISSN 0196-8904. doi : 10.1016/j.
enconman.2019.06.083. URL https://www.sciencedirect.com/science/article/pii/S019689041930754X.
[225] H. Z. Wang, G. B. Wang, G. Q. Li, J. C. Peng, and Y. T. Liu. Deep belief network based deterministic and
probabilistic wind speed forecasting approach. 182 :80–93, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2016.
[226] Mahdi Khodayar, Jianhui Wang, and Mohammad Manthouri. Interval Deep Generative Neural Network for
Wind Speed Forecasting. 10(4) :3974–3989. ISSN 1949-3061. doi : 10.1109/TSG.2018.2847223.
[227] Tianyu Hu, Qinglai Guo, Zhengshuo Li, Xinwei Shen, and Hongbin Sun. Distribution-Free Probability Density
Forecast Through Deep Neural Networks. 31(2) :612–625, . ISSN 2162-2388. doi : 10.1109/TNNLS.2019.
2907305.
[228] Reihaneh Haji Mahdizadeh Zargar and Mohammad Hossein Yaghmaee Moghaddam. Development of a Markov-
Chain-Based Solar Generation Model for Smart Microgrid Energy Management System. 11(2) :736–745. ISSN
1949-3037. doi : 10.1109/TSTE.2019.2904436.
[229] Yongqi Liu, Hui Qin, Zhendong Zhang, Shaoqian Pei, Chao Wang, Xiang Yu, Zhiqiang Jiang, and Jianzhong
Zhou. Ensemble spatiotemporal forecasting of solar irradiation using variational Bayesian convolutional gate
recurrent unit network. 253 :113596, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2019.113596. URL https:
//www.sciencedirect.com/science/article/pii/S030626191931270X.
[230] Huai-zhi Wang, Gang-qiang Li, Gui-bin Wang, Jian-chun Peng, Hui Jiang, and Yi-tao Liu. Deep learning
based ensemble approach for probabilistic wind power forecasting. 188 :56–70, . ISSN 0306-2619. doi :
10.1016/j.apenergy.2016.11.111. URL https://www.sciencedirect.com/science/article/pii/S0306261916317421.
[231] Han Liu, Peng Li, Juan Lin, Wenpei Chen, Haibiao Guo, Jianyun Lin, Jin Liu, Ziqi Lu, Xiaolan Yao, Yang
Chen, and Baoqin Lin. Danhong Huayu Koufuye prevents venous thrombosis through antiinflammation via
Sirtuin 1/NF-B signaling pathway. 241 :111975, . ISSN 0378-8741. doi : 10.1016/j.jep.2019.111975. URL
[232] Tanveer Ahmad, Hongcai Zhang, and Biao Yan. A review on renewable energy and electricity requirement
forecasting models for smart grid and buildings. 55 :102052. ISSN 2210-6707. doi : 10.1016/j.scs.2020.102052.
[233] Aoife M. Foley, P.G. Leahy, Antonino Marvuglia, and E.J. McKeogh. Current methods and advances in
forecasting of wind power generation. 37(1) :1–8. ISSN 0960-1481. doi : 10.1016/j.renene.2011.05.033.

[234] Ronald K. Pearson, Yrjö Neuvo, Jaakko Astola, and Moncef Gabbouj. Generalized Hampel Filters. 2016(1) :
87. ISSN 1687-6180. doi : 10.1186/s13634-016-0383-6. URL https://doi.org/10.1186/s13634-016-0383-6.
[235] André Gensler, Janosch Henze, Bernhard Sick, and Nils Raabe. Deep Learning for solar power forecasting —
An approach using AutoEncoder and LSTM Neural Networks. In 2016 IEEE International Conference on
Systems, Man, and Cybernetics (SMC), pages 002858–002865. doi : 10.1109/SMC.2016.7844673.
[236] João Marcos Lima, Alexandre K. Guetter, Saulo R. Freitas, Jairo Panetta, and prefix=de useprefix=true
family=Mattos, given=João GZ. A meteorological–statistic model for short-term wind power forecasting. 28 :
679–691, .
[237] Shikha Singh, T. S. Bhatti, and D. P. Kothari. Wind Power Estimation Using Artificial Neural Network. 133
(1) :46–52. ISSN 0733-9402. doi : 10.1061/(ASCE)0733-9402(2007)133:1(46). URL https://ascelibrary.org/
doi/10.1061/%28ASCE%290733-9402%282007%29133%3A1%2846%29.
[238] Qian Li, Zhou Wu, Rui Ling, Liang Feng, and Kai Liu. Multi-reservoir echo state computing for solar irradiance
prediction : A fast yet efficient deep learning approach. 95 :106481, . ISSN 1568-4946. doi : 10.1016/j.asoc.
[239] Hui Liu, Xiwei Mi, Yanfei Li, Zhu Duan, and Yinan Xu. Smart wind speed deep learning based multi-
step forecasting model using singular spectrum analysis, convolutional Gated Recurrent Unit network and
Support Vector Regression. 143 :842–854, . ISSN 0960-1481. doi : 10.1016/j.renene.2019.05.039. URL https:
[240] Ludmil Stoyanov. Etude de différentes structures de systèmes hybrides à sources d’énergie renouvelables.
[241] Jukka V. Paatero and Peter D. Lund. Effects of large-scale photovoltaic power integration on electricity
distribution networks. 32(2) :216–234. ISSN 0960-1481. doi : 10.1016/j.renene.2006.01.005. URL https:
[242] Wilhelm Durisch, Bernd Bitnar, Jean-C. Mayor, Helmut Kiess, King-hang Lam, and Josie Close. Efficiency
model for photovoltaic modules and demonstration of its application to energy yield estimation. 91(1) :79–84.
ISSN 0927-0248. doi : 10.1016/j.solmat.2006.05.011. URL https://www.sciencedirect.com/science/article/pii/
S0927024806003345.
[243] Yun Wang, Qinghua Hu, Linhao Li, Aoife M. Foley, and Dipti Srinivasan. Approaches to wind power curve
modeling : A review and discussion. 116 :109422, . ISSN 1364-0321. doi : 10.1016/j.rser.2019.109422. URL
[244] Yun Wang, Qinghua Hu, Dipti Srinivasan, and Zheng Wang. Wind Power Curve Modeling and Wind Power
Forecasting With Inconsistent Data. 10(1) :16–25, . ISSN 1949-3037. doi : 10.1109/TSTE.2018.2820198.
[245] POWER | Data Access Viewer. URL https://power.larc.nasa.gov/data-access-viewer/.
[246] Data Preprocessing in Machine learning - Javatpoint, . URL https://www.javatpoint.com/

data-preprocessing-machine-learning.
[247] Data Preprocessing in Machine Learning : 7 Easy Steps To Follow, . URL https://www.upgrad.com/blog/
data-preprocessing-in-machine-learning/.
[248] Data Preprocessing in Machine Learning [Steps & Techniques], . URL https://www.v7labs.com/blog/
data-preprocessing-guide,https://www.v7labs.com/blog/data-preprocessing-guide.
[249] Marius Paulescu, Marek Brabec, Remus Boata, and Viorel Badescu. Structured, physically inspired (gray box)
models versus black box modeling for forecasting the output power of photovoltaic plants. 121 :792–802, .
ISSN 0360-5442. doi : 10.1016/j.energy.2017.01.015. URL https://www.sciencedirect.com/science/article/pii/
S0360544217300154.

optimization : A review. 81 :912–928, .
[251] Gordon Reikard. Predicting solar radiation at high resolutions : A comparison of time series forecasts. 83(3) :
342–349. ISSN 0038-092X. doi : 10.1016/j.solener.2008.08.007. URL https://www.sciencedirect.com/science/
article/pii/S0038092X08002107.
[252] A. Baig, P. Akhter, and A. Mufti. A novel approach to estimate the clear day global radiation. 1(1) :119–123.
ISSN 0960-1481. doi : 10.1016/0960-1481(91)90112-3. URL https://www.sciencedirect.com/science/article/
pii/0960148191901123.
[253] S. N. Kaplanis. New methodologies to estimate the hourly global solar radiation ; Comparisons with existing
models. 31(6) :781–790. ISSN 0960-1481. doi : 10.1016/j.renene.2005.04.011. URL https://www.sciencedirect.
[254] John Boland. Time Series Modelling of Solar Radiation. In Viorel Badescu, editor, Modeling Solar Radiation
at the Earth’s Surface : Recent Advances, pages 283–312. Springer. ISBN 978-3-540-77455-6. doi : 10.1007/
978-3-540-77455-6_11. URL https://doi.org/10.1007/978-3-540-77455-6_11.
[255] Mohammad H. Alomari, Ola Younis, and Sofyan MA Hayajneh. A Predictive Model for Solar Photovoltaic
Power using the Levenberg-Marquardt and Bayesian Regularization Algorithms and Real-Time Weather Data.
9(1) :347–353. URL http://dx.doi.org/10.14569/ijacsa.2018.090148.
[256] Utpal Kumar Das, Kok Soon Tey, Mehdi Seyedmahmoudian, Mohd Yamani Idna Idris, Saad Mekhilef, Ben
Horan, and Alex Stojcevski. SVR-Based Model to Forecast PV Power Generation under Different Weather
Conditions. 10(7) :876, . ISSN 1996-1073. doi : 10.3390/en10070876. URL https://www.mdpi.com/1996-1073/
10/7/876.
[257] Zheng Qian, Yan Pei, Hamidreza Zareipour, and Niya Chen. A review and discussion of decomposition-based
hybrid models for wind energy forecasting applications. 235 :939–953.
[258] Naima El-Amarty, Manal Marzouq, Hakim El Fadili, Saad Dosse Bennani, and Antonio Ruano. A com-
prehensive review of solar irradiation estimation and forecasting using artificial neural networks : Data,
models and trends. ISSN 1614-7499. doi : 10.1007/s11356-022-24240-w. URL https://doi.org/10.1007/
s11356-022-24240-w.
[259] Fudong Li and Huan-yu Liao. An intelligent method for wind power forecasting based on integrated power
slope events prediction and wind speed forecasting. 13(8) :1099–1105. ISSN 1931-4981. doi : 10.1002/tee.22671.
URL https://onlinelibrary.wiley.com/doi/abs/10.1002/tee.22671.
[260] Lili Wang, Xin Li, and Yulong Bai. Short-term wind speed prediction using an extreme learning machine
model with error correction. 162 :239–250, . ISSN 0196-8904. doi : 10.1016/j.enconman.2018.02.015. URL
[261] Jianzhong Zhou, Han Liu, Yanhe Xu, and Wei Jiang. A Hybrid Framework for Short Term Multi-Step Wind
Speed Forecasting Based on Variational Model Decomposition and Convolutional Neural Network. 11(9) :2292,
. ISSN 1996-1073. doi : 10.3390/en11092292. URL https://www.mdpi.com/1996-1073/11/9/2292.
[262] Hui Liu, Xiwei Mi, and Yanfei Li. An experimental investigation of three new hybrid wind speed forecasting
models using multi-decomposing strategy and ELM algorithm. 123 :694–705, . ISSN 0960-1481. doi : 10.1016/
j.renene.2018.02.092. URL https://www.sciencedirect.com/science/article/pii/S0960148118302362.
[263] Jianzhou Wang, Pei Du, Haiyan Lu, Wendong Yang, and Tong Niu. An improved grey model optimized by
multi-objective ant lion optimization algorithm for annual electricity consumption forecasting. 72 :321–337,
. ISSN 1568-4946. doi : 10.1016/j.asoc.2018.07.022. URL https://www.sciencedirect.com/science/article/pii/
S1568494618304101.

[264] Thomas M. Cover. The Best Two Independent Measurements Are Not the Two Best. SMC-4(1) :116–117.
ISSN 2168-2909. doi : 10.1109/TSMC.1974.5408535.
[265] Hanchuan Peng, Fuhui Long, and Chris Ding. Feature selection based on mutual information criteria of max-
dependency, max-relevance, and min-redundancy. 27(8) :1226–1238, .
[266] Federica Davò, Stefano Alessandrini, Simone Sperati, Luca Delle Monache, Davide Airoldi, and Maria T.
Vespucci. Post-processing techniques and principal component analysis for regional wind power and solar
irradiance forecasting. 134 :327–338. ISSN 0038-092X. doi : 10.1016/j.solener.2016.04.049. URL https:
//www.sciencedirect.com/science/article/pii/S0038092X16300962.
[267] Xiaobing Kong, Xiangjie Liu, Ruifeng Shi, and Kwang Y. Lee. Wind speed prediction using reduced support
vector machines with feature selection. 169 :449–456. ISSN 0925-2312. doi : 10.1016/j.neucom.2014.09.090.
[268] Qinghua Hu, Pengyu Su, Daren Yu, and Jinfu Liu. Pattern-based wind speed prediction based on generalized
principal component analysis. 5(3) :866–874, .
[269] Shaolong Sun, Han Qiao, Yunjie Wei, and Shouyang Wang. A new dynamic integrated approach for wind
speed forecasting. 197 :151–162, .
[270] Yun Wang, Haibo Wang, Dipti Srinivasan, and Qinghua Hu. Robust functional regression for wind speed
forecasting based on Sparse Bayesian learning. 132 :43–60, . ISSN 0960-1481. doi : 10.1016/j.renene.2018.07.083.
[271] Qinghua Hu, Shiguang Zhang, Zongxia Xie, Jusheng Mi, and Jie Wan. Noise model based -support vector
regression with its application to short-term wind speed forecasting. 57 :1–11, . ISSN 0893-6080. doi :
10.1016/j.neunet.2014.05.003. URL https://www.sciencedirect.com/science/article/pii/S0893608014000938.
[272] Shiguang Zhang, Qinghua Hu, Zongxia Xie, and Jusheng Mi. Kernel ridge regression for general noise model
with its application. 149 :836–846, . ISSN 0925-2312. doi : 10.1016/j.neucom.2014.07.051. URL https:
[273] Carlos D. Zuluaga, Mauricio A. Álvarez, and Eduardo Giraldo. Short-term wind speed prediction based on
robust Kalman filtering : An experimental comparison. 156 :321–330. ISSN 0306-2619. doi : 10.1016/j.apenergy.
[274] Hui Liu, Zhu Duan, Feng-ze Han, and Yan-fei Li. Big multi-step wind speed forecasting model based on secon-
dary decomposition, ensemble method and error correction algorithm. 156 :525–541, . ISSN 0196-8904. doi : 10.
1016/j.enconman.2017.11.049. URL https://www.sciencedirect.com/science/article/pii/S0196890417311019.
[275] Hui Liu, Haiping Wu, and Yanfei Li. Smart wind speed forecasting using EWT decomposition, GWO evolu-
tionary optimization, RELM learning and IEWT reconstruction. 161 :266–283, . ISSN 0196-8904. doi : 10.
1016/j.enconman.2018.02.006. URL https://www.sciencedirect.com/science/article/pii/S019689041830102X.
[276] Shahram Hanifi, Xiaolei Liu, Zi Lin, and Saeid Lotfian. A critical review of wind power forecasting me-
thods—past, present and future. 13(15) :3764.
[277] Mustafa Cavcar. The international standard atmosphere (ISA). 30(9) :1–6.
[278] Jacques Bernard. Energie solaire calcul et optimisation Berneoud. 106 :17.
[279] Michel Capderou. Atlas Solaire de l’Algérie, modèles théorique et Expérimentaux Tome I ; OPU.
[280] John A. Duffie and William A. Beckman. Solar Engineering of Thermal Processes. John Wiley & Sons.

[281] F. J. Olmo, J. Vida, I. Foyo, Y. Castro-Diez, and L. Alados-Arboledas. Prediction of global irradiance on
inclined surfaces from horizontal global irradiance. 24(8) :689–704.
[282] Thomas M. Klucher. Evaluation of models to predict insolation on tilted surfaces. 23(2) :111–114.
[283] given-i=ABJARKH family=De Miguel, given=ABJARKH, J. Bilbao, R. Aguiar, H. Kambezidis, and E. Negro.
Diffuse solar irradiation model evaluation in the north Mediterranean belt area. 70(2) :143–153.
[284] J. I. Jimenez and Y. Castro. National assembly of geophysics and geodesy, vol.
[285] Muhammad Iqbal. An Introduction to Solar Radiation. Elsevier.
[286] Michaël Bressan. Estimation de production des installations pv pour différentes inclinaisons basée sur un modèle
d’ensoleillement. (77) :https ://www.see.asso.fr/en/node/11096. URL https://hal.science/hal-01077761.
[287] Windenergie-Daten der Schweiz. URL https://wind-data.ch/tools/profile.php?lng=fr.
[288] Payam Refaeilzadeh, Lei Tang, and Huan Liu. Cross-Validation. In given-i=LING family=LIU, given=LING
and M. TAMER ÖZSU, editors, Encyclopedia of Database Systems, pages 532–538. Springer US. ISBN 978-0-
387-39940-9. doi : 10.1007/978-0-387-39940-9_565. URL https://doi.org/10.1007/978-0-387-39940-9_565.
[289] Tian Zhang, Raghu Ramakrishnan, and Miron Livny. BIRCH : An efficient data clustering method for very
large databases. 25(2) :103–114, .
[290] Leonard Kaufman and Peter J. Rousseeuw. Finding Groups in Data : An Introduction to Cluster Analysis.
John Wiley & Sons.
[291] Jude W. Shavlik, Thomas Dietterich, and Thomas Glen Dietterich. Readings in Machine Learning. Morgan
Kaufmann.
[292] Douglas H. Fisher. Knowledge acquisition via incremental conceptual clustering. 2 :139–172.
[293] Gail A. Carpenter and Stephen Grossberg. A massively parallel architecture for a self-organizing neural pattern
recognition machine. 37(1) :54–115.
[294] Teuvo Kohonen. The self-organizing map. 78(9) :1464–1480.
[295] M. Ester, H. P. Kriegel, J. Sander, and Xu Xiaowei. A density-based algorithm for discovering clusters in large
spatial databases with noise. (CONF-960830-). URL https://www.osti.gov/biblio/421283.
[296] Mihael Ankerst, Markus M. Breunig, Hans-Peter Kriegel, and Jörg Sander. OPTICS : Ordering points to
identify the clustering structure. 28(2) :49–60.
[297] S. Chandrakala and C. Chandra Sekhar. A density based method for multivariate time series clustering in
kernel feature space. In 2008 IEEE International Joint Conference on Neural Networks (IEEE World Congress
on Computational Intelligence), pages 1885–1890. IEEE.
[298] Xiaohang Zhang, Jiaqi Liu, Yu Du, and Tingjie Lv. A novel clustering method on time series data. 38(9) :
11891–11900, .
[299] SIST EN 61400-12 :1999 - Wind turbine generator systems – Part 12 : Wind turbine power performance
testing. URL https://standards.iteh.ai/catalog/standards/sist/93357524-9cba-4cc9-abe8-e1431f994e8a/
sist-en-61400-12-1999.
[300] Long Short-Term Memory Networks (LSTM)- simply explained ! | Data Basecamp. URL https://
databasecamp.de/en/ml/lstms.

[301] Convolutional Neural Network Architecture | CNN Architecture. URL https://www.analyticsvidhya.com/

blog/2020/10/what-is-the-convolutional-neural-network-architecture/.
[302] Anjir Ahmed Chowdhury, Argho Das, Khadija Kubra Shahjalal Hoque, and Debajyoti Karmaker. A Compa-
rative Study of Hyperparameter Optimization Techniques for Deep Learning. In Mohammad Shorif Uddin,
Prashant Kumar Jamwal, and Jagdish Chand Bansal, editors, Proceedings of International Joint Conference on
Advances in Computational Intelligence, Algorithms for Intelligent Systems, pages 509–521. Springer Nature.
ISBN 978-981-19033-2-8. doi : 10.1007/978-981-19-0332-8_38.
[303] Tom O’Malley, Elie Bursztein, James Long, François Chollet, Haifeng Jin, Luca Invernizzi, et al. KerasTuner.
URL https://github.com/keras-team/keras-tuner.
[304] Martín Abadi, Ashish Agarwal, Paul Barham, Eugene Brevdo, Zhifeng Chen, Craig Citro, Greg S. Corrado,
Andy Davis, Jeffrey Dean, Matthieu Devin, Sanjay Ghemawat, Ian Goodfellow, Andrew Harp, Geoffrey Irving,
Michael Isard, Yangqing Jia, Rafal Jozefowicz, Lukasz Kaiser, Manjunath Kudlur, Josh Levenberg, Dandelion
Mané, Rajat Monga, Sherry Moore, Derek Murray, Chris Olah, Mike Schuster, Jonathon Shlens, Benoit Steiner,
Ilya Sutskever, Kunal Talwar, Paul Tucker, Vincent Vanhoucke, Vijay Vasudevan, Fernanda Viégas, Oriol
Vinyals, Pete Warden, Martin Wattenberg, Martin Wicke, Yuan Yu, and Xiaoqiang Zheng. TensorFlow :
Large-Scale Machine Learning on Heterogeneous Systems. URL https://www.tensorflow.org/.
[305] Rk330-01b Atmospheric Temperature, Humidity & Pressure Sensor | Rika Sensors. URL https://www.
rikasensor.com/rk330-01b-atmospheric-temperature-humidity-pressure-sensor.html.
[306] Rk200-04 Solar Radiation Sensor Solar Irradiance Sensor | Rika Sensors. URL https://www.rikasensor.com/
rk200-04-solar-radiation-sensor-solar-irradiance-sensor.html.
[307] Rk100-02 Cheap Plastic Wind Speed Sensor / Detector, 3 Cup Wind Anemometer | Rika, . URL https:
//www.rikasensor.com/rk100-02-wind-speed-sensor-wind-speed-detector.html.
[308] Rk110-02 Wind Direction Sensor Wind Vane Sensor | Rika Sensors, . URL https://www.rikasensor.com/
rk110-02-wind-direction-sensor-wind-vane-sensor.html.
[309] Rk600-07 Data Logger | Rika Sensors. URL https://www.rikasensor.com/rk600-07-data-logger.html.
[310] Énergie Éolienne : De son gisement à ses aérogénérateurs - Encyclopédie de l’énergie, . URL https://www.
encyclopedie-energie.org/en/energie-eolienne-de-son-gisement-a-ses-aerogenerateurs/.
[311] M. Lydia, A. Immanuel Selvakumar, S. Suresh Kumar, and G. Edwin Prem Kumar. Advanced algorithms for
wind turbine power curve modeling. 4(3) :827–835.
[312] Mohammed G. Khalfallah and Aboelyazied M. Koliub. Suggestions for improving wind turbines power curves.
209(1-3) :221–229.
[313] Qinghua Hu, Yun Wang, Zongxia Xie, Pengfei Zhu, and Daren Yu. On estimating uncertainty of wind energy
with mixture of distributions. 112 :935–962, .
[314] J. L. Torres, E. Prieto, A. Garcia, M. De Blas, F. Ramirez, and A. De Francisco. Effects of the model selected
for the power curve on the site effectiveness and the capacity factor of a pitch regulated wind turbine. 74(2) :
93–102.
[315] Lin Lu, Hongxing Yang, and John Burnett. Investigation on wind power potential on Hong Kong islands—an
analysis of wind power and wind turbine characteristics. 27(1) :1–12.
[316] Milad Javadi, Alexander M. Malyscheff, Di Wu, Chongqing Kang, and John N. Jiang. An algorithm for
practical power curve estimation of wind turbines. 4(1) :93–102.

[317] Vinay Thapar, Gayatri Agnihotri, and Vinod Krishna Sethi. Critical analysis of methods for mathe-
matical modelling of wind turbines. 36(11) :3166–3177. URL https://ideas.repec.org//a/eee/renene/
v36y2011i11p3166-3177.html.
[318] Fatih O. Hocaoğlu, Ömer N. Gerek, and Mehmet Kurban. A novel hybrid (wind–photovoltaic) system sizing
procedure. 83(11) :2019–2028.
[319] Said Diaf, Djamila Diaf, Mayouf Belhamel, Mourad Haddadi, and Alain Louche. A methodology for optimal
sizing of autonomous hybrid PV/wind system. 35(11) :5708–5718.
[320] Yanjun Yan, Lisa Ann Osadciw, Glen Benson, and Eric White. Inverse data transformation for change detection
in wind turbine diagnostics. In 2009 Canadian Conference on Electrical and Computer Engineering, pages
944–949. IEEE, .
[321] Lisa Ann Osadciw, Yanjun Yan, Xiang Ye, Glen Benson, and Eric White. Wind turbine diagnostics based on
power curve using particle swarm optimization. pages 151–165.
[322] Martin Wolf and Hans Rauschenbach. Series resistance effects on solar cell measurements. 3(2) :455–479.
[323] M. A. De Blas, J. L. Torres, E. Prieto, and A. Garcıa. Selecting a suitable model for characterizing photovoltaic
devices. 25(3) :371–380.
[324] Marcelo Gradella Villalva, Jonas Rafael Gazoli, and Ernesto Ruppert Filho. Comprehensive approach to
modeling and simulation of photovoltaic arrays. 24(5) :1198–1208.
[325] Tao Ma, Hongxing Yang, and Lin Lu. Solar photovoltaic system modeling and performance prediction. 36 :
304–315, .
[326] Ali Naci Celik and Nasır Acikgoz. Modelling and experimental verification of the operating current of mono-
crystalline photovoltaic modules using four-and five-parameter models. 84(1) :1–15.
[327] Adelmo Ortiz-Conde, Francisco J. García Sánchez, and Juan Muci. New method to extract the model pa-
rameters of solar cells from the explicit analytic solutions of their illuminated I–V characteristics. 90(3) :
352–361.
[328] Widalys De Soto, Sanford A. Klein, and William A. Beckman. Improvement and validation of a model for
photovoltaic array performance. 80(1) :78–88.
[329] Giuseppina Ciulla, Valerio Lo Brano, Vincenzo Di Dio, and Giovanni Cipriani. A comparison of different
one-diode models for the representation of I–V characteristic of a PV cell. 32 :684–696.
[330] M. U. Siddiqui and M. Abido. Parameter estimation for five-and seven-parameter photovoltaic electrical models
using evolutionary algorithms. 13(12) :4608–4621.
[331] Anis Sellami and Mongi Bouaïcha. Application of the Genetic Algorithms for Identifying the Electrical Para-
meters of PV Solar Generators. InTech.
[332] Mohamed Azab, Fawzan Salem, and Mohamed I. Mossad. PV parameter estimation using different evolutionary
algorithms. 13 :187–196.
[333] Geoff Walker. Evaluating MPPT converter topologies using a MATLAB PV model. 21(1) :49–55.
[334] Olivier Gergaud, Bernard Multon, and Hamid Ben Ahmed. Analysis and experimental validation of various
photovoltaic system models. In Electrimacs, page 6p.
[335] M. Fuentes, G. Nofuentes, J. Aguilera, D. L. Talavera, and M. Castro. Application and validation of algebraic
methods to predict the behaviour of crystalline silicon PV modules in Mediterranean climates. 81(11) :1396–
1408.

[336] D. L. Evans. Simplified method for predicting photovoltaic array output. 27(6) :555–560.
[337] J. F. Randall and J. Jacot. Is AM1. 5 applicable in practice ? Modelling eight photovoltaic materials with
respect to light intensity and two spectra. 28(12) :1851–1864.
[338] Sheryl R. Williams, Thomas R. Betts, T. Helf, R. Gottschalg, H. G. Beyer, and D. G. Infield. Modelling
long-term module performance based on realistic reporting conditions with consideration to spectral effects. In
3rd World Conference onPhotovoltaic Energy Conversion, 2003. Proceedings Of, volume 2, pages 1908–1911.
IEEE, .
[339] Hans Georg Beyer, J. Betcke, Anja Drews, Detlev Heinemann, Elke Lorenz, Gerd Heilscher, and Stefan Bofinger.
Identification of a general model for the MPP performance of PV-modules for the application in a procedure
for the performance check of grid connected systems. In 19th European Photovoltaic Solar Energy Conference
and Exhibition, Paris, France, volume 7, page 2004. Citeseer.
[340] given-i=NH-prefix=v useprefix=false family=Reich, given=NH, given-i=WGJHM family=Van Sark, gi-

ven=WGJHM, E. A. Alsema, R. W. Lof, R. E. I. Schropp, W. C. Sinke, and W. C. Turkenburg. Crystalline
silicon cell performance at low light intensities. 93(9) :1471–1481.
[341] S. R. Williams, Thomas R. Betts, Ralph Gottschalg, D. G. Infield, H. De Moor, N. Van Der Borg, A. R. Burgers,
Gabi Friesen, D. Chianese, and A. Guerin De Montgareuil. Accuracy of energy prediction methodologies. In
2006 IEEE 4th World Conference on Photovoltaic Energy Conference, volume 2, pages 2206–2209. IEEE, .
[342] Gabi Friesen, Sebastian Dittmann, S.R. Williams, Ralph Gottschalg, Hans Georg Beyer, Antoine Guerin de
Montgareuil, N.J.C.M. Borg, Antonius Burgers, Robert Kenny, Thomas Huld, Björn Müller, Christian Reise,
J. Kurnik, and Marko Topic. Intercomparison of Different Energy Prediction Methods within the European
Project PERFORMANCE - Results on the 2nd Round Robin. doi : 10.4229/24thEUPVSEC2009-4CO.1.2.
[343] Roger W. Taylor. System and module rating : Advertised versus actual capability. 18.
[344] J. I. Rosell and M. Ibanez. Modelling power output in photovoltaic modules for outdoor operating conditions.
47(15-16) :2424–2430.
[345] Wolfgang Heydenreich, Björn Müller, and Christian Reise. Describing the world with three parameters : A
new approach to PV module power modelling. In 23rd European PV Solar Energy Conference and Exhibition
(EU PVSEC), pages 2786–2789.
[346] J. Merten, Y. Delesse, F. Mezzasalma, J. L. Martin, L. Sicot, and prefix=de-useprefix=true fa-

mily=Montgareuil, given=A. Guérin. A new tool for the MotherPV method : Modeling of the Irradiance
Coefficient of Photovoltaic Modules. In 24th European Photovoltaic Solar Energy Conference, Hamburg, pages
3305–3309.
[347] Thomas Huld, Gabi Friesen, Artur Skoczek, Robert P. Kenny, Tony Sample, Michael Field, and Ewan D.
Dunlop. A power-rating model for crystalline silicon PV modules. 95(12) :3359–3369.
[348] J. Silva, B. Asenjo, N. Vela, and F. Chenlo. Caracterización de módulos fotovoltaicos de diversas tecnologías
en el marco del proyecto INNDISOL. In Proceedings of the XV Congreso Ibérico y X Congreso Iberoamericano
de Energía Solar, Vigo, Spain, pages 19–22.
[349] Global Solar Atlas, . URL https://globalsolaratlas.info/detail?c=9.329831,2.307129,7&r=BEN.
[350] Global Wind Atlas, . URL https://globalwindatlas.info.
[351] Bienvenu Macaire Agbomahena, Kossoko Babatoundé Audace Didavi, and Richard Gilles Agbokpanzo. A
novel technique for forecasting the optimal production of a wind generator installed at any geographical point
located within a very large area. 10(1) :23. ISSN 2314-7172. doi : 10.1186/s43067-023-00091-4. URL https:
//doi.org/10.1186/s43067-023-00091-4.

[352] Taohidi A. Lamidi, Nounangnonhou C. Télesphore, Macaire B. Agbomahena, and Audace B. K. Didavi. K-
Means Algorithm to Identify The Optimal Production Period of A Photovoltaic Array Installed at Any Point
in a Very Large Area. In 2022 International Conference on Electrical Engineering, Computer and Information
Technology (ICEECIT), pages 187–192. doi : 10.1109/ICEECIT55908.2022.10030306.
[353] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Datasets, . URL https://drive.
google.com/drive/folders/1QTwxkW-GMF7DrlG00bp00tzKerI6xfIV.
[354] Where wind power is harnessed - U.S. Energy Information Administration (EIA). URL https://www.eia.gov/
energyexplained/wind/where-wind-power-is-harnessed.php.
[355] given-i=BRANZ family=Ltd, given=BRANZ. Wind turbine systems and Renewable energy. URL http://
www.level.org.nz/energy/renewable-electricity-generation/wind-turbine-systems/.
[356] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Statistiques, . URL https:
//drive.google.com/drive/folders/1jzYkLUXOA_J0iZBgOau7MJnCC7mgOpBI.
[357] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Résultats de Clustering, . URL
https://drive.google.com/drive/folders/1IBKDdPVGDBcLF6tmxkGasfuscxHw-U4M.
[358] Didavi K. B. Audace, Agbokpanzo G. Richard, and Agbomahena B. Macaire. LSTM and K-means Algorithm
for Irradiation and Temperature Clustering to Forecast Power Output of a PV Array Installed in Benin. In
2022 International Conference on Green Energy, Computing and Sustainable Technology (GECOST), pages
248–252, . doi : 10.1109/GECOST55694.2022.10010366.
[359] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Formation Sous-Zones, . URL
https://drive.google.com/drive/folders/12dBsKYNK5fbCtrEfzyMV9vNP_swAt0en.
[360] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Caractérisation Sous-Zones, .
URL https://drive.google.com/drive/folders/10T32SZfxAE8jjDbSCXByZHMCvGFk_r9V.
[361] Audace B. K. Didavi, Macaire Agbomahena, and Richard Gilles Agbokpanzo. Roses de vent, . URL https:
//drive.google.com/drive/folders/1oajD9ydvXL_WBDWulNUnv1lsi6uohb7v.
[362] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Distributions de Weibull, . URL
https://drive.google.com/drive/folders/1Z7IjFVcr8eKZaDNGNf5laO2L95USl9AY.
[363] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Transformation de Fourier
Rapide, . URL https://drive.google.com/drive/folders/1bM42I34KbVy6aWDs-HFMVxwNSqmhFc3_.
[364] Audace B. K. Didavi, Richard Gilles Agbokpanzo, and Macaire Agbomahena. Résultats Op-
timisation Hyperparamètres - Google Drive, . URL https://drive.google.com/drive/folders/
1sNzQ14ZVA1yS43SpmQqdct40eFEvRGVM.
[365] A. G. R. Vaz, B. Elsinga, prefix=van useprefix=true family=Sark, given=W. G. J. H. M., and M. C. Brito.
An artificial neural network to assess the impact of neighbouring photovoltaic systems in power forecasting
in Utrecht, the Netherlands. 85 :631–641. ISSN 0960-1481. doi : 10.1016/j.renene.2015.06.061. URL https:
[366] Stéphanie Monjoly, Maina André, Rudy Calif, and Ted Soubdhan. Forecast Horizon and Solar Variability
Influences on the Performances of Multiscale Hybrid Forecast Model. 12(12) :2264. ISSN 1996-1073. doi :
10.3390/en12122264. URL https://www.mdpi.com/1996-1073/12/12/2264.
[367] Didavi B. K. Audace, Agbokpanzo G. Richard, and Agbomahena B. Macaire. LSTM and Evans model for next
24 hours solar photovoltaic power output forecasting. In 2022 IEEE 8th International Conference on Smart
Instrumentation, Measurement and Applications (ICSIMA), pages 74–78, . doi : 10.1109/ICSIMA55652.2022.
9929217.

[368] Seyed Mohammad Jafar Jalali, Sajad Ahmadian, Abdollah Kavousi-Fard, Abbas Khosravi, and Saeid Naha-
vandi. Automated Deep CNN-LSTM Architecture Design for Solar Irradiance Forecasting. 52(1) :54–65. ISSN
2168-2232. doi : 10.1109/TSMC.2021.3093519.
[369] Pratima Kumari and Durga Toshniwal. Long short term memory–convolutional neural network based deep
hybrid approach for solar irradiance forecasting. 295 :117061, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2021.
[370] Ankit Bhatt, Weerakorn Ongsakul, Nimal Madhu M., and Jai Govind Singh. Sliding window approach with
first-order differencing for very short-term solar irradiance forecasting using deep learning models. 50 :101864.
ISSN 2213-1388. doi : 10.1016/j.seta.2021.101864. URL https://www.sciencedirect.com/science/article/pii/
S221313882100878X.
[371] Cai Tao, Junjie Lu, Jianxun Lang, Xiaosheng Peng, Kai Cheng, and Shanxu Duan. Short-term forecasting
of photovoltaic power generation based on feature selection and bias compensation–LSTM network. 14(11) :
3086.
[372] Hangxia Zhou, Qian Liu, Ke Yan, and Yang Du. Deep learning enhanced solar energy forecasting with AI-driven
IoT. 2021 :1–11, .
[373] Mario Tovar, Miguel Robles, and Felipe Rashid. PV power prediction, using CNN-LSTM hybrid neural network
model. Case of study : Temixco-Morelos, México. 13(24) :6512.
[374] Muhammad Naveed Akhter, Saad Mekhilef, Hazlie Mokhlis, Ziyad M. Almohaimeed, Munir Azam Muhammad,
Anis Salwa Mohd Khairuddin, Rizwan Akram, and Muhammad Majid Hussain. An Hour-Ahead PV Power
Forecasting Method Based on an RNN-LSTM Model for Three Different PV Plants. 15(6) :2243. ISSN
1996-1073. doi : 10.3390/en15062243. URL https://www.mdpi.com/1996-1073/15/6/2243.
[375] Su-Chang Lim, Jun-Ho Huh, Seok-Hoon Hong, Chul-Young Park, and Jong-Chan Kim. Solar Power Forecasting
Using CNN-LSTM Hybrid Model. 15(21) :8233. ISSN 1996-1073. doi : 10.3390/en15218233. URL https:
//www.mdpi.com/1996-1073/15/21/8233.
[376] Eddie Yatiyana, Sumedha Rajakaruna, and Arindam Ghosh. Wind speed and direction forecasting for wind
power generation using ARIMA model. In 2017 Australasian Universities Power Engineering Conference
(AUPEC), pages 1–6. doi : 10.1109/AUPEC.2017.8282494.
[377] Hasan Hüseyin Çevik, Mehmet Çunkaş, and Kemal Polat. A new multistage short-term wind power forecast
model using decomposition and artificial intelligence methods. 534 :122177.
[378] Zhenkun Liu, Ping Jiang, Lifang Zhang, and Xinsong Niu. A combined forecasting model for time series :
Application to short-term wind speed forecasting. 259 :114137, . ISSN 0306-2619. doi : 10.1016/j.apenergy.
[379] Mingshuai Liu, Zheming Cao, Jing Zhang, Long Wang, Chao Huang, and Xiong Luo. Short-term wind speed
forecasting based on the Jaya-SVM model. 121 :106056, . ISSN 0142-0615. doi : 10.1016/j.ijepes.2020.106056.
URL https://www.sciencedirect.com/science/article/pii/S014206151931837X.
[380] Jikai Duan, Hongchao Zuo, Yulong Bai, Jizheng Duan, Mingheng Chang, and Bolong Chen. Short-term wind
speed forecasting using recurrent neural networks with error correction. 217 :119397.
[381] Mehdi Neshat, Meysam Majidi Nezhad, Ehsan Abbasnejad, Seyedali Mirjalili, Lina Bertling Tjernberg, Da-
vide Astiaso Garcia, Bradley Alexander, and Markus Wagner. A deep learning-based evolutionary model for
short-term wind speed forecasting : A case study of the Lillgrund offshore wind farm. 236 :114002.
[382] Yun Wang, Runmin Zou, Fang Liu, Lingjun Zhang, and Qianyi Liu. A review of wind speed and wind power
forecasting with deep neural networks. 304 :117766, . ISSN 0306-2619. doi : 10.1016/j.apenergy.2021.117766.

[383] Sheng-Xiang Lv and Lin Wang. Deep learning combined wind speed forecasting with hybrid time series
decomposition and multi-objective parameter optimization. 311 :118674. ISSN 0306-2619. doi : 10.1016/j.
apenergy.2022.118674. URL https://www.sciencedirect.com/science/article/pii/S0306261922001404.

ANNEXE A
Présentation des caractéristiques des

constituants de la station météorologique

RK600-07 Data Logger of Automatic Weather Station
www.rikasensor.com.cn
RK600-07 Data Logger with data acquisition, storage, transmission and management, and other functions, is
the core component of automatic weather station, which can connect 32 parameter at the same time, has the
settings and color LCD display, can communication with PC via cable or wireless connection, provide
communication protocol, convenient for secondary development.
FEATURES
 Real-time display
 Multiple sensor interface
 Large storage
 Types of communication interface
 Udisk external storage optional
 Wireless optional
 Self-contained clock chip
 Solar power supply optional
RK600-07A RK600-07B
 HMI app & Software
SPECIFICATION
Item Details
LCD 7” color touch screen
Storage type Internal storage or external U_disk is optional
48M (If set to store every 1 hours can store data for more than 6 years;
Internal storage If set to store every 10 minutes can store data for approx. 1 years;
If set to store every 1 minute can store data for 3 months)
Data interface RS232 or RS485(customized)
Ethernet(add RS232 to ethernet converter);
Communication mode GPRS(add RS232 to GPRS converter),data flow consumption: <100MB/month
WIFI(add RS232 to WIFI converter)
MODBUS-RTU(Open communication protocol, the user can convenient for
Communication protocol
secondary development)
Supply 12VDC with 100-240VAC adapter, solar power supply system optional
Record interval 1min-240min adjustable
Measurement parameters 32 Max.
Power consumption <5W
Operating temperature -40-+75℃
Internal protection Built-in power isolation protection

HMI processor ARM RISC 528MHz
HMI app & Mobile phone or PC operation and Monitor(Remote download of historical
Software(RK600-07B) data)
Data Rose Map and Trend Chart Customization according to customer product
(RK600-07A)
PAGE 1 OF 6
Guidelines for the Selection of Data logger:

If solar power supply is needed, RK600-07 is recommended, data logger, solar controller and battery can be
installed in protective box.
INTERFACE DESCRIPTION
Same Sensor of wind speed Interface
Same Sensor of Leaf wetness & temperature Interface
weather station Interface
PAGE 2 OF 6
Data Rose Map and Trend Chart
PAGE 3 OF 6
Mobile App Remote control
PAGE 4 OF 6
(1)When the channel receives data normally, the channel indicator is green, and when the channel receives
data abnormally, the indicator becomes red(Check whether the wire connection is good when receiving
abnormal data).
(2)Backlight progress bar moved to the left backlight darkest, moved to the right brightest, in order to reduce
power consumption, keep the progress bar on the leftmost side.
(3)Local ID default: 1(Decimal), you can modify it via MODBUS RTU command
(4)Screen Saver time default: 1min, in order to reduce power consumption, no modification is recommended.
(5) Record interval default:10 min, it can be modified by touch screen.First storage time is 10 minutes by
default
(6) Adjust the interface according to the type and number of sensors.
COMMUNICATION MODE
 The AWS can communicate with the center workstation by RS232 or RS485.
If the communication distance is less than 20m, RS232 communication is recommended;
if communication distance is within 20 to 800m, RS485 communication is recommended.
 GPRS wireless communication, when cable routing is inconvenient, data can be transferred by GPRS
wireless communication, the center workstation can network with several RK900-01 AWS.
 LAN access, RK900-01 AWS is worked as a LAN node communication in the local network by
transferring the RS232 with a LAN module. This mode can work under the network interface, the AWS
 Ethernet:You can choose to take software with you by Ethernet.and download APP to Mobile phone
And You can view and set it on your mobile phone.Also you can download Software to PC,and view and
set it on your PC(Only one account login is valid for operation)This needs to be customized.
PAGE 5 OF 6
SYSTEM CONNECTION DIAGRAM

LOGICAL MONITORING SOFTWARE INSTRUCTIONS
Complies with applicable CE directives.

Specifications subject to change without notice. Version 3.0
Copyright © 2015 Hunan Rika Electronic Technology Co.,Ltd
Hunan Rika Electronic Technology Co., Ltd

Add:No 499# of Yingxin Road, +86-731-85132979
Yuhua District,Changsha, info@rikasensor.com
Hunan,China www.rikasensor.com.cn
PAGE 6 OF 6
RK330-01B Atmospheric Temperature Sensor
www.rikasensor.com
RK330-01B Atmospheric Temperature Sensor is a professional measurement of air temperature, relative

humidity & barometric pressure. Sensors are built-in the water-proof and anti-UV shelter. It is widely used in
agriculture, forestry, meteorology as well as a climate chamber, warehousing and other places.This model
also can be equipped with 11 plates radiation shield(RK95-01) to protect the sensors from solar radiation and
rain.
FEATURES
 According for WMO NO:8 I,III(2018)
 Fast response time
 Long service life
 Low consumption
 Good stability of output
 PT100 temperature and high humidity
environment for long-term use
 Can integrated temperature humidity
air pressure at the same time
APPLICATIONS
 Environmental monitoring
 Livestock farm
 Storage
 Forestry
 Greenhouse
 Agriculture
TECHNICAL SPECIFICATION
Technical Specification
Item
Temperature RTD/PT100
Range –40°C to +60°C
Resolution ± 0.1°C
Accuracy ±0.3℃
Supply 5VDC, 12-24VDC
Output Signal 4-20mA,0-5V,0-10V,RS485(MODBUS),IIC

Current Consumption <20mA
Operating Temperature -40℃-+80℃
Ingress Protection IP65

Storage 10-60℃@20%-90%RH
Weight(unpacked) 120g
Probe material ABS

Radiation Shield(optional) RK95-01,11 plates
Analog output only is proper for one or two measurement parameters.
PAGE 1 OF 3
www.rikasensor.com
DIMENSION
Unit:mm
MOUNTING
1. Install the product in stable environment area, avoid direct sunlight, away from windows air-conditioning,
heating and other equipment. Otherwise it will cause measurement inaccuracies.
2. Fixing rail is optional.
3. If you use indoor, recommends clamp to install, as shown on the right picture.
PARAMETER SELECTION TABLE
Remark Series Type Parameter Output Accessory Cable Length

RK
330
01
A Temperature & Humidity
B Temperature,Humidity,Pressure
C Temperature
D Humidity
A 4-20mA
B 0-5V
C 0-10V
D RS485
E IIC
F SDI-12
PAGE 2 OF 3
www.rikasensor.com
A
B With clamp
N Without any accessory
3000 Units:mm（typ）
... Units:mm
Example: RK330-01AAN3000 Parameter: temperature & humidity Output: 4-20mA Without any accessory Cable Length:3m.

Copyright © 2015 Hunan Rika Electronic Tech Co.,Ltd
Hunan Rika Electronic Tech Co., Ltd +86-731-85132979

Add: Building B5, Taskin, Yuhua District,
info@rikasensor.com
Changsha City, Hunan Province,
www.rikasensor.com
China
PAGE 3 OF 3
RK110-02 Wind Direction Sensor
The RK110-02 wind direction sensor is a sensitive wind direction indicator that gives a visual indication of
wind direction. High precision magnetic sensitive chips are built in the housing shell. The wind vane is
constructed on low inertia light metal to show wind directions. The product is wide range, good linearity,
strong anti- lightning strike, good performance.
FEATURES
 Low starting threshold
 Great dynamic characteristics
 Overall carbon fiber material
 Strong corrosion resistant ability
 Light structure
 Various output signals optional
 Easy Installation
APPLICATIONS
 Weather monitoring stations
 Ports
 Solar and wind power generation
 Mobile weather monitoring vehicles
 Remote airports & helipads
SPECIFICATIONS
Output 4-20mA 0-5V RS485

Supply Voltage 5V,12V-24V 5V,12V,24V 5V,12V-24V
Load Capacity <500Ω(typ 250Ω) >1kΩ
Range 0~360°
Accuracy ±3°
Resolution 1°
Starting Threshold <0.5m/s
Limit wind speed 50m/s
Operating Temperature -40℃~+50℃
Cable Grade Nominal voltage:300V ,Temperature grade:80℃
Dimension Turning Radius:147mm,Height:199mm
Main material Carbon fiber
Storage Condition 10℃-50℃@20%-90%RH
PAGE 1 OF 3
OUTPUT CHARACTERISTICS
 Current（4-20mA） Voltage（0-5V）
 RS485
If the transmission distance is over 100m, please add a 120Ω terminal matching resistances on the front end
and back end of bus interface respectively.See the modbus communication protocol specification.
DIMENSION & MOUNTING

Flange mounted, fix the four screws on the bracket and keep the product horizontal.
There is a arrow marker on the label. Please make sure the marker is pointed to the south during
installation (you can use a compass for positioning).
Connector dimension：ø15mm (recommended reserving ø 25mm for wiring)
Unit:mm
PAGE 2 OF 3
Remark Series Type Supply Output Cable Length
RK
110
02
A 5V
B
C 12-24V
X Other
A 4-20mA
B 0-5V
C RS485
X Other
2500 Units:mm(typ)
3000 Units:mm
... Units:mm
Example: RK110-02CA2500 Supply:12-24V,Output:4-20mA,Cable Length:2.5m.


PAGE 3 OF 3
RK100-02 Wind Speed Sensor
The RK100-02 Wind Speed Sensor uses a sensitive 3-cup anemometer designed to measure wind speed and
wind run. The cups are made of carbon fiber material, with high intensity and low starting threshold. The signal
processing units are built in the housing shell. It can be widely used in meteorology, marine, environmental
monitoring, airport, harbor, laboratory, industrial and agricultural areas.
FEATURES
 Low starting threshold
 Overall carbon fiber material
 Strong corrosion resistant ability
 Light structure
 Various output signals optional
 Easy Installation
APPLICATIONS
 Weather monitoring stations
 Safety monitoring of high altitude equipment
 Ports
 Solar and wind power generation
 Mobile weather monitoring vehicles
 Marine vessels
 Remote airports & helipads
 Road & rail tunnels
SPECIFICATIONS
Output Pulses 4-20mA 0-5V RS485
Supply Voltage 5V,12V-24V 5V,12V-24V 5V,12V-24V 5V,12V-24V
Load Capacity >1kΩ <500Ω(typ 250Ω) >1kΩ
Range 0-45m/s 0-45m/s 0-45m/s 0-45m/s
Accuracy ±(0.3+0.03V)m/s; (V is the current wind speed)
Starting Threshold <0.5m/s
Limit wind speed 50m/s
Operating Temperature -40℃~ +50℃
Cable Grade Nominal voltage:300V ,Temperature grade:80℃
Dimension Cup rotor:ø179mm,Height:160mm
Main material Carbon fiber
PAGE 1 OF 3
OUTPUT CHARACTERISTICS
 Pulses
Characteristic transfer function:
F=0,V=0;
F≠0,V=0.1+0.0875×F
(where V = wind speed (m/s),
F = output frequency(Hz))
 Current Voltage
 RS485
If the transmission distance is over 100m, please add a 120Ω terminal matching resistances on the front end
and back end of bus interface respectively.See the modbus communication protocol specification.
DIMENSION & MOUNTING
Flange mounted, fix four screws on the bracket and keep the product horizontal.
Connector dimension：
ø15mm (recommended reserving ø 25mm for wiring)
PAGE 2 OF 3
Remark Series Type Supply Output Cable Length

RK
100
02
A 5V
B
C 12-24V
X Other
A 4-20mA
B 0-5V
C RS485
D Pulses
X Other
2500 Units:mm(typ)
3000 Units:mm
... Units:mm
Example: RK100-02CA2500 Supply:12-24V,Output:4-20mA,Cable Length:2.5m.


PAGE 3 OF 3
RK200-04 Solar Radiation Sensor
RK200-04 Solar Radiation Sensor is designed on basis of silicon-cell principle. It is mainly used for measuring
solar radiation within 300-3000nm wavelength. If the sensing face is downwards, it can test the reflected
radiation and solar radiation on the incident to the inclined plane. If shad is added, it can test the
scattered radiation. It is widely used to monitor the solar radiation in meteorology, solar energy, agriculture,
construction materials aging and atmospheric pollution and etc..
FEATURES
 Designed on silicon-cell principle
 No moving parts, no maintenance,

can work in any altitude
 High sensitivity
 Low power consumption
 Light weight, long service life
 Used as sunshine duration sensor
APPLICATIONS
 Meteorology
 Agriculture
 Construction materials aging monitoring
 Air pollution monitoring
 Solar energy
SPECIFICATIONS
Item SPECIFICATIONS
Spectral range 300～1100nm
Supply 5V,12-24VDC
Range 0-1500W/m2
Resolution 1W/m2
Output 0-5V,4-20mA,RS485
Response time ≤5s
Cosine correction ≤±10%(Solar elevation angle=10°)
Non-linear ≤±3%
Temperature effect ±0.08%/℃
Stability ≤±2%/year
Operating Temperature -40℃-+80℃
Shell material Aluminum alloy
 The product can be used as a sunshine time sensor

Sunshine hours is the sum of time periods that the sun direct irradiance intensity to reach or exceed 120W/m2 time , hour as a unit, a
decimal. Sunshine hours is also known as actual irradiance time.
PAGE 1 OF 3
DIMENSION
Unit:mm
MOUNTING
In order to the accuracy of the measurement,

please ensure that the sensor mounted
horizontally as much as possible.
SPECTRAL RESPONSE
PAGE 2 OF 3
Remark Series Type Shell material Supply Output Cable Length

RK
200
04
M Metal(Aluminum alloy)
A 5V
B 12-24V
X Other
A 4-20mA
B 0-5V
C
D RS485
X Other
2500 Units:mm（typ）
3000 Units:mm
... Units:mm
Example: RK200-04MBA2500 Shell material: Aluminum alloy, Supply:12-24V,Output:4-20mA,Cable Length:2.5m.


+86-731-85132979
Add:No 499# of Yingxin Road,
info@rikasensor.com
Yuhua District,Changsha,
PAGE 3 OF 3
ANNEXE B
Présentation des outils logiciels de mise en

œuvre des méthodes d’IA
Parmi la panoplie de d’outils permettant l’apprentissage automatique, on peut

retenir les plus célèbres qui sont : R, python et SAS. De par sa simplicité de pro-
grammation, python s’est retrouvé doté d’une communauté énorme de développeurs
qui travaillent à le rendre complet pour l’exploration de données et l’apprentissage
automatique, raison pour laquelle nous avons opter pour ce language pour l’atteinte
de nos objectifs.
Python
Loin d’avoir un rapport avec le serpent portant ce nom, python est un langage
de programmation open source multiplateforme dont la première version parut le 20
février 1991. Son auteur Guido Van Rossum le baptisa python en s’inspirant de la
série télévisée Monty Python’s Flying Circus dont il était un fan. Python est très
apprécié des programmeurs à cause de la simplicité de sa syntaxe de programmation
et des outils qu’il intègre dans ses différents modules. Existant en plusieurs versions,
la plus récente est la version 3.10.2.
En plus d’être utilisé comme langage de programmation directe, python est aussi
utilisé comme langage de script pour automatiser des tâches simples mais fastidieuses
comme la récupération d’informations météorologiques sur le net ou intégrer dans
des logiciels de CAO (Conception Assistée par Ordinateur) pour la prise en charge
d’enchainement d’actions répétitives. Le langage n’intègre pas au préalable tous les
outils nécessaires à la programmation pour les diverses tâches possibles. Il est ce-
pendant simple d’ajouter grâce à l’invite de commande de windows par exemple, des
bibliothèques supplémentaires contenant des outils dont nous aurions besoins. Ces

Annexe B : Présentation des outils logiciels de mise en œuvre des méthodes d’IA
bibliothèques sont très bien documentées sur leur sites web officiels.
Des distributions de pythons ont été mis aux points pour faciliter l’analyse des
données et l’apprentissage automatique. Les distributions de python présentent en
effet des outils qui facilitent la tâche dans la programmation. Parmi ces dernières,
nous avons la distribution anaconda.
Anaconda
Anaconda est une distribution de python qui intègre plusieurs outils nécessaires
à la science des données. Sa particularité est de pouvoir faire interagir ces différents
outils parfois d’horizons différentes entre eux pour des possibilités plus élargies. Elle
intègre des outils tels que DataLore et IBM Studio Watson pour l’analyse de données
avec des outils en ligne et offrant la possibilité de travailler directement avec ses
collaborateurs en partageant interactivement ses résultats. Il intègre aussi pycharm
et spyder pour le développement pur de python. Nous pouvons aussi y retrouver
Rstudio pour la programmation dans le langage R et bien d’autres outils. L’un des
outils les plus intéressants présents dans cette distribution de python est le notebook
jupyter.
Notebook jupyter
Le notebook en programmation informatique désigne une interface disposant de

sections dans lesquelles nous pouvons au besoin écrire en langage naturel (afin de
présenter, commenter ou discuter sur un résultat) ou en langage informatique pour
l’atteinte de nos divers objectifs. Le notebook jupyter dont une page est présentée à l
permet de programmer dans les langages de programmation Julia, Python et R. C’est
en effet de la combinaison de ces trois noms que vient l’appellation Jupyter pour cette
notebook. Nous pouvons exporter le notebook jupyter sous format standard JSON
avec l’extension ‘’.ipynb ‘’ ou au format d’une page web (.html), au format PDF
ou encore au format Python avec l’extension ‘’.py”. La programmation en python
du notebook jupyter se fait comme pour le python natif. Les syntaxes et les outils
restent inchangés.
Les librairies python pour la science des données
Python n’inclus pas au préalable les bibliothèques nécessaires à l’exploration et

l’analyse de données aussi bien que pour l’apprentissage machine. Il faut les compléter

selon ses besoins. Pour l’atteinte de nos objectifs, nous avons fait usage de plusieurs
bibliothèques spécialisées à savoir : Numpy, Pandas, Matplotlib et Scikit-learn.
Numpy
Le langage python n’ayant pas été conçu à la base pour effectuer des calculs
numériques, il a fallu construire certaines bibliothèques spéciales contenant les outils
nécessaires pour l’atteinte de cet objectif. Numpy (contraction de Numeric Python)
est l’une d’elle. Cette dernière est une bibliothèque libre qui se charge de fournir les
outils nécessaires à la manipulation de tableaux multidimensionnels ou matrices et
au calculs portant sur ces derniers. Numpy a été séparé de la bibliothèque de base
pour les calculs numériques appelé SciPy. En effet les développeurs ont jugé non
pertinent d’avoir à importer tout l’arsenal de calcul numérique dans son code juste
pour avoir accès aux outils de manipulations de vecteurs et matrices. Une fois intégré
dans le logiciel à travers l’invite de commande, il suffit de l’importer dans son code
à travers la commande ‘’import numpy”. La documentation est très bien fournie et
disponible sur la toile.
Pandas
La bibliothèque python Pandas est spécialement conçu pour la manipulation et

l’analyse de données. Bibliothèque libre comme Numpy, Pandas dont le nom vient
du terme d’économétrie ‘’Panel Data” ou encore d’un jeu de mot sur l’expression
‘’Python Data Analysis”, est conçue pour gérer des structures de données tels que
les séries, les DataFrames, les Panels, les panels4D. Les séries sont des données à une
dimension (un vecteur par exemple). A partir de données à deux dimensions ou plus,
nous parlons de DataFrames. Les panels sont des cas particuliers de DataFrames à
3 dimensions (Panels) ou à 4 dimensions (Panel4D).
La bibliothèque Pandas inclue des outils permettant de prendre en charge des
données sous forme de fichiers CSV (.csv), de fichiers textuels (.txt), de fichier Excel
(.xlsx), les bases de données SQL ou les données au format HDF5 qui est un format
permettant la gestion de gros volume de données. Avec pandas nous pouvons lire et
écrire des données structurées en mémoire sous les différents formats cités ci-dessus,
les redimensionner et gérer de façon intelligente les valeurs manquantes (NAN : Not
A Number). Elle permet aussi la fusion et la jointure de large volume de données.
La bibliothèque s’intègre facilement à python à travers l’invite de commande et une
fois intégrée, on l’importe dans son code à travers l’instruction ‘’Import pandas”. On

a ainsi accès aux multiples outils qui la constitue et qu’on peut trouver sur sa page
officiel pandas.
Matplotlib et Seaborn
Matplotlib est la bibliothèque python de base qui se charge de la représenta-

tion graphique des données pour l’analyse statistique. Nous pouvons réaliser des
graphiques comme des histogrammes, des diagrammes circulaires, des boxplot pour
la représentation de boite à moustaches afin de détecter et éliminer d’éventuelles
valeurs aberrantes, les violinplot, etc. Nous pouvons en observer quelques-uns. Les
graphiques peuvent être exportés aux formats matriciels (PNG, JPEG, ) ou aux
formats vectoriels (PDF, SVG, ). Matplotlib souffrant de quelques lacunes, Seaborn
vient le compléter et lui ajoute de nouvelles fonctionnalités. Trois défauts majeurs
sont en effet corrigés par seaborn à savoir :
— le manque d’esthétique au niveau des courbes de matplotlib surtout dans les
versions avant la 2.0,
— l’absence de fonction permettant de créer facilement des analyses statistiques
sophistiqués et finalement
— le fait que les fonctions de matplotlib n’ont pas été conçues pour interagir di-
rectement avec les DataFrames de Pandas. Seaborn est toujours basé sur mat-
plotlib juste qu’elle lui ajoute des fonctionnalités palliant les lacunes abordées
précédemment.
Scikit-learn
Scikit-learn est la bibliothèque python spécialement conçu pour l’apprentissage

machine. On y retrouve donc des outils permettant la mise en œuvre des algorithmes
d’apprentissage comme l’analyse discriminante linéaire, les machines à vecteurs de
support, les forêts aléatoires, les régressions linéaires et logistiques, etc. Elle inter-
agit parfaitement avec les bibliothèques d’analyse et de manipulation de données
présenter ci-dessus. En plus des outils permettant la mise en œuvre des algorithmes
d’apprentissage, scikit-learn intègre aussi les outils renseignant sur la performance
du modèle d’apprentissage tels que la matrice de confusion, le rapport contenant les
valeurs telles que le rappel, la précision, le score, etc. Scikit-learn n’intègre cepen-
dant pas les outils pour l’apprentissage profond (le deep learning) ou les réseaux de
neurones. La bibliothèque est très bien documentée sur sa page officielle et s’intègre
facilement au code à travers l’instruction ‘’import sklearn”.

La bibliothèque d’apprentissage profond en Python TensorFlow
TensorFlow est une bibliothèque open-source pour le calcul numérique rapide. Elle
a été créée et est maintenue par Google et a été publiée sous la licence open source
Apache 2.0. L’API est nominalement pour le langage de programmation Python, bien
qu’il y ait un accès à l’API C++ sous-jacente. Contrairement à d’autres bibliothèques
numériques destinées à l’apprentissage profond, comme Theano, TensorFlow a été
conçu pour être utilisé à la fois dans la recherche et le développement et dans les
systèmes de production, notamment RankBrain dans la recherche Google et le projet
amusant DeepDream. Il peut fonctionner sur des systèmes à CPU unique et des
GPU, ainsi que sur des appareils mobiles et des systèmes distribués à grande échelle
composés de centaines de machines.
La librairie Keras
Keras est une API d’apprentissage profond écrite en Python, fonctionnant au-
dessus de la plateforme d’apprentissage automatique TensorFlow. Elle a été dévelop-
pée dans le but de permettre une expérimentation rapide. Pouvoir passer d’une idée
à un résultat aussi rapidement que possible est essentiel pour effectuer de bonnes
recherches.
Keras est :
Simple - mais pas simpliste. Keras réduit la charge cognitive du développeur pour
lui permettre de se concentrer sur les parties du problème qui comptent vraiment.
Flexible - Keras adopte le principe de la divulgation progressive de la complexité :
les flux de travail simples doivent être rapides et faciles, tandis que les flux de travail
arbitrairement avancés doivent être possibles via un chemin clair qui s’appuie sur ce
que vous avez déjà appris.
Puissant - Keras offre des performances et une évolutivité à la hauteur de l’in-
dustrie : il est utilisé par des organisations et des entreprises telles que la NASA,
YouTube ou Waymo.

ANNEXE C
Liste des publications et communications
Durant ces travaux de thèse, cinq (6) publications et huit (8) communications ont
été effectuées autour de certains de nos résultats. Deux autres articles résultant des
travaux de recherches sont en cours de soumission.
Publications
1. A. B. K. DIDAVI, R. G. AGBOKPANZO and M. AGBOMAHENA, "Comparative

study of Decision Tree, Random Forest and XGBoost performance in fore-
casting the power output of a photovoltaic system," 2021 4th International
Conference on Bio-Engineering for Smart Technologies (BioSMART), Paris /
Créteil, France, 2021, pp. 1-5. Indexé IEEE Xplore, INSPEC, SCOPUS.
2. A. B. K. DIDAVI, R. G. AGBOKPANZO and M. B. AGBOMAHENA, "LSTM
and K-means Algorithm for Irradiation and Temperature Clustering to Fo-
recast Power Output of a PV Array Installed in Benin," 2022 International
Conference on Green Energy, Computing and Sustainable Technology (GECOST),
Miri Sarawak, Malaysia, 2022, pp. 248-252. Indexé IEEE Xplore, INSPEC,
SCOPUS.
3. T. A. LAMIDI, T. C. NOUNANGNONHOU, M. B. AGBOMAHENA and
A. B. K. DIDAVI, "K-Means Algorithm to Identify The Optimal Production
Period of A Photovoltaic Array Installed at Any Point in a Very Large Area,"
2022 International Conference on Electrical Engineering, Computer and Infor-
mation Technology (ICEECIT), Jember, Indonesia, 2022, pp. 187-192. Indexé
IEEE Xplore, INSPEC, SCOPUS.

Annexe C : Liste des publications et communications
4. A. B. K. DIDAVI, R. G. AGBOKPANZO and M. B. AGBOMAHENA, "LSTM

and Evans model for next 24 hours solar photovoltaic power output fore-
casting" ,2022 IEEE 8th International Conference on Smart Instrumentation,
Measurement and Applications (ICSIMA), Melaka, Malaysia, 2022, pp. 74-78.
Indexé IEEE Xplore, INSPEC, SCOPUS.
5. AGBOMAHENA, B.M., DIDAVI, K.B.A. and AGBOKPANZO, R.G. A novel
technique for forecasting the optimal production of a wind generator instal-
led at any geographical point located within a very large area. SPRINGER
Journal of Electrical Systems and Inf Technol 10, 23 (2023). Indexé SPRIN-
GER
6. A. B. K. DIDAVI, R. G. AGBOKPANZO and M. B. AGBOMAHENA, LSTM
and XGBoost models for 24-hour photovoltaic power forecasting from direct
irradiation data, (Renewable Energy Research and Applications), (2023). In-
dexé Web Of Science.
Travaux actuels et soumission d’articles
1. A. B. K. DIDAVI, R. G. AGBOKPANZO and M. B. AGBOMAHENA", Com-

parative study of LSTM, CNN and DBN models for direct photovoltaic power
forecasting," En cours.
2. A. B. K. DIDAVI, R. G. AGBOKPANZO and M. B. AGBOMAHENA", Com-
parative study of LSTM, CNN, DBN and SAE models for wind power fore-
casting," En cours.
Communications
1. DOCTORIALES DES CEA DU BENIN 07 au 09 juin 2021 à l’Hôtel Célébrité

à Ouidah, Bénin ;
2. 1er symposium du réseau WASEND organisé le 03 Septembre 2021 au Ghana
et en ligne.
3. 2ème JOURNEES SCIENTIFIQUES ANNUELLES DU RESER (RESER-JSA02-
2021) à Lomé.
4. 3ème symposium du réseau WASEND organisé le 29 Avril 2022 au Ghana et
en ligne.

Annexe C : Liste des publications et communications
5. DOCTORIALES DES CEA DU BENIN du 03 au 05 Novembre 2022 à l’UAC,

Bénin.
6. 1er Colloque Scientifique International et 1ères Journées Métiers de L’Université
Nationale des Sciences, Technologies, Ingénierie et Mathématiques Abomey en
hommage au Professeur Gérard DEGAN 1er Recteur UNSTIM du 22 au 25
Novembre 2022 à Abomey, Bénin.
7. 8ème conférence internationale de l’IEEE sur l’instrumentation intelligente, les
mesures et les applications (ICSIMA) les 27 et 28 Septembre 2022 en ligne.
8. Conférence internationale de l’IEEE sur l’énergie verte, l’informatique et les
technologies durables (GECOST) les 27 et 28 Octobres 2022.

Table des manières
Dédicace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iii
Remerciements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . iv
Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vi
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
Liste des figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii
Liste des tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii
Liste des algorithmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv
Introduction générale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1 Prévision de la production des Sources d’Energies Renouvelables Intermit-

tentes et Stochastiques : une nécessité pour une meilleure intégration . . 9
1.1.1 Prévoir pour mieux intégrer et exploiter . . . . . . . . . . . . 10
1.1.2 Prévoir pour augmenter le bénéfice de la production des sys-
tèmes à base des SERIS . . . . . . . . . . . . . . . . . . . . . 13
1.2.1 Horizons de prévision . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.2 Indicateurs de performance de l’évaluation de la précision . . . 20
1.2.3 Entrées des modèles de prévision . . . . . . . . . . . . . . . . 22
1.3.1 La méthode de la persistance . . . . . . . . . . . . . . . . . . 24
1.3.2 Les méthodes physiques . . . . . . . . . . . . . . . . . . . . . 25
1.3.3 Les méthodes statistiques . . . . . . . . . . . . . . . . . . . . 26

Table des manières
1.3.3.1 Modèles de régression . . . . . . . . . . . . . . . . . 27

1.3.3.2 Techniques de prévision basées sur les séries temporelles 28
1.3.3.2.1 Lissage exponentiel . . . . . . . . . . . . . . 29
1.3.3.2.2 Le modèle de moyenne mobile autorégres-
sive (ARMA) . . . . . . . . . . . . . . . . . 30
1.3.3.2.3 Autoregressive integrated moving average (ARIMA) 30
1.3.4 Techniques intelligentes . . . . . . . . . . . . . . . . . . . . . . 31
1.4.1 Taxonomie des prévisions d’énergie éolienne et solaire utilisant
l’apprentissage profond . . . . . . . . . . . . . . . . . . . . . . 33
1.4.2 Méthodes de prévision déterministes . . . . . . . . . . . . . . 35
1.4.2.1 Modèles basés sur les réseaux neuronaux convolutifs 35
1.4.2.2 Modèles basés sur les réseaux neuronaux récurrents . 37
1.4.2.3 Modèles basés sur les DBN "Deep belief networks" . . 42
1.4.2.4 Modèles hybrides et d’ensemble . . . . . . . . . . . . 42
1.4.2.4.1 Modèles hybrides avec des méthodes de dé-
composition des données . . . . . . . . . . . 43
1.4.2.4.2 Méthodes hybrides avec extraction ou sélec-
tion de caractéristiques . . . . . . . . . . . . 47
1.4.2.4.3 Méthodes hybrides avec correction des données 49
1.4.3 Méthodes de prévision probabilistes . . . . . . . . . . . . . . . 60
1.4.4 Orientations issues des discussions . . . . . . . . . . . . . . . . 65
1.5.1 Précision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
1.5.2 Modèles de référence . . . . . . . . . . . . . . . . . . . . . . . 70
1.5.3 Pas de temps d’entrée . . . . . . . . . . . . . . . . . . . . . . 71
1.5.4 Résolution des données . . . . . . . . . . . . . . . . . . . . . . 71
1.5.5 Fusion de données . . . . . . . . . . . . . . . . . . . . . . . . . 72
1.5.6 Temps de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2 Technique de modélisation et de prévision développée . . . . . . . . . . . 75


Table des manières

2.5.1 Identification des paramètres météorologiques d’influence . . . 82
2.5.2 Acquisition des données . . . . . . . . . . . . . . . . . . . . . 82
2.5.3 Traitement des données . . . . . . . . . . . . . . . . . . . . . . 83
2.5.3.1 Stratégies de traitement des données dans les modèles
de prévision de la puissance PV . . . . . . . . . . . . 85
2.5.3.2 Stratégies de traitement des données dans les modèles
de prévision de la puissance Eolienne . . . . . . . . . 86
2.5.3.2.1 Décomposition des données . . . . . . . . . 87
2.5.3.2.2 Réduction de la dimensionnalité . . . . . . . 88
2.5.3.2.3 Correction des données . . . . . . . . . . . . 91
2.5.3.3 Stratégies de traitement des données utilisées . . . . 93
2.5.3.3.1 Identification et transformation des données
de séries temporelles non stationnaires . . . 95
2.5.3.3.2 Nettoyage des données . . . . . . . . . . . . 97
2.5.3.3.3 Conversion des données . . . . . . . . . . . 98
2.5.3.3.4 Détermination des fréquences les plus im-
portantes des paramètres météorologiques . 101
2.5.3.3.5 Création et ajout de nouvelles variables au
dataset . . . . . . . . . . . . . . . . . . . . 101
2.5.3.3.6 Transformation des données . . . . . . . . . 102
2.5.3.3.7 Validation croisée . . . . . . . . . . . . . . . 103
2.5.3.3.8 Fractionnement des données . . . . . . . . . 105
2.6.1 Algorithmes de clustering des séries temporelles . . . . . . . . 106
2.6.2 Présentation de la technique de clustering . . . . . . . . . . . 109
2.6.3 Mesures d’évaluation du clustering des séries temporelles . . . 110
2.6.4 Présentation de la technique de formation de sous-zones . . . . 111
2.6.5 Optimisation du pas d’échantillonnage ∆t . . . . . . . . . . . 112
2.7.1 Possibilité d’exploitation optimale d’un générateur PV . . . . 114
2.7.2 Identification des périodes de production PV optimale . . . . . 114
2.7.3 Possibilité d’exploitation optimale d’un aérogénérateur . . . . 114
2.7.4 Identification des périodes de production Éolienne optimale . . 116

Table des manières
2.8.1 Modèles de prévision des paramètres météorologiques . . . . . 117

2.8.1.1 Présentation du réseau LSTM . . . . . . . . . . . . . 117
2.8.1.2 Présentation du réseau CNN . . . . . . . . . . . . . . 119
2.8.2 Optimisation des hyperparamètres et développement des modèles121
2.8.2.1 Hyperparamètres des modèles du Deep Learning et
Technique d’optimisation . . . . . . . . . . . . . . . 121
2.8.2.1.1 Hyperparamètres des modèles du Deep Lear-
ning . . . . . . . . . . . . . . . . . . . . . . 122
2.8.2.1.2 Techniques d’optimisation . . . . . . . . . . 124
2.8.2.2 Hyperparamètres des modèles CNN et LSTM . . . . 124
2.8.3 Entraînement des modèles . . . . . . . . . . . . . . . . . . . . 125
2.8.4 Validation expérimentale des performances de prévision des
paramètres météorologiques . . . . . . . . . . . . . . . . . . . 125
2.9.1 Modèles d’estimation de la puissance électrique d’un aérogéné-
rateur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
2.9.1.1 Modèle segmenté linéarisé . . . . . . . . . . . . . . . 131
2.9.1.2 Courbe de puissance polynomiale . . . . . . . . . . . 132
2.9.1.3 Courbe de puissance basée sur la fonction sigmoïde . 133
2.9.1.4 Courbe de puissance gaussienne basée sur la FDC . . 133
2.9.2 Modèles d’estimation de la puissance PV . . . . . . . . . . . . 134
2.9.2.1 Modèles physiques ou de courbes I-V complètes . . . 134
2.9.2.2 Modèles empiriques ou de type MPP (Maximum Po-
wer Point) . . . . . . . . . . . . . . . . . . . . . . . . 136
2.9.3 Validation expérimentale des techniques d’estimation des puis-
sances de sortie . . . . . . . . . . . . . . . . . . . . . . . . . . 140
3 Résultats d’application de la technique de prévision développée au territoire

béninois . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144

Table des manières
3.4.1 Présentation des données acquises . . . . . . . . . . . . . . . . 150

3.4.2 Statistiques des données . . . . . . . . . . . . . . . . . . . . . 151
3.4.3 Présentation des données standardisées . . . . . . . . . . . . . 154
3.8.1 Présentation des données de prévision . . . . . . . . . . . . . . 177
3.8.1.1 Résultats d’extraction des fréquences par Transfor-
mation de Fourier Discrète . . . . . . . . . . . . . . . 177
3.8.1.2 Présentation des jeux de données . . . . . . . . . . . 178
3.8.2 Résultats d’optimisation des hyperparamètres . . . . . . . . . 180
3.8.3 Résultats de prévision avec les modèles entraînés avec les hy-
perparamètres optimisés . . . . . . . . . . . . . . . . . . . . . 182
3.9.1 Estimation de la puissance éolienne . . . . . . . . . . . . . . . 190
3.9.2 Estimation de la puissance PV . . . . . . . . . . . . . . . . . . 191
3.10.1 Présentation des données mesurées . . . . . . . . . . . . . . . 194
3.10.2 Résultats de prévision des irradiations, températures et puis-
sances PV . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
3.10.3 Résultats de prévision des vitesses du vent et de la puissance
en sortie de l’aérogénérateur . . . . . . . . . . . . . . . . . . . 198
3.10.4 Étude comparative des performances obtenues avec des résul-
tats récents obtenus dans la littérature . . . . . . . . . . . . . 204
3.11.1 Fonctionnalités du progiciel . . . . . . . . . . . . . . . . . . . 206
3.11.2 Résultats d’exploitation du progiciel . . . . . . . . . . . . . . 211
Conclusion générale et perspectives . . . . . . . . . . . . . . . . . . . . . . . 221
Références Bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 224
A Présentation des caractéristiques des constituants de la station météorolo-

gique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
B Présentation des outils logiciels de mise en œuvre des méthodes d’IA . . 269

Table des manières
C Liste des publications et communications . . . . . . . . . . . . . . . . . . 274
Table des manières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

These Didavi Fin Bon

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

These Didavi Fin Bon

Transféré par

Droits d'auteur :

Formats disponibles

No d’ordre : 131

École Doctorale des Sciences de l’Ingénieur (ED-SDI)

Docteur de l’Université d’Abomey-Calavi

Prévision par l’intelligence artificielle de la variabilité de la puissance

Soutenue publiquement le 05 Octobre 2023

Président : M. Mohamed GIBIGAYE Professeur Titulaire Université d’Abomey-Calavi (Bénin)

Rapporteurs : M. Olivier DOUHERET Directeur de recherche Materia Nova/UMONS (Belgique)

: M. Adekunlé Akim SALAMI Professeur Titulaire Université de Lomé (Togo)

: M. Richard Gilles AGBOKPANZO Maître de Conférence Université Nationale des Sciences,

Examinateurs : M. Basile KOUNOUHEWA Professeur Titulaire Université d’Abomey-Calavi (Bénin)

: M. Arnaud AHOUANDJINOU Maître de Conférences Université d’Abomey-Calavi (Bénin)

Laboratoire d’Electrotechnique, de Télécommunications et d’informatique Appliquée (LETIA), UAC, Benin

Liste des figures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . viii

Liste des tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xiii

Liste des algorithmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . xv

1 Prévision de la production des Sources d’Energies Renouvelables Intermit-

2 Technique de modélisation et de prévision développée . . . . . . . . . . . 75

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace i

2.5 Acquisition et traitement des données . . . . . . . . . . . . . . . . . . 82

3 Résultats d’application de la technique de prévision développée au territoire

Conclusion générale et perspectives . . . . . . . . . . . . . . . . . . . . . . . 221

Références Bibliographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . 224

A Présentation des caractéristiques des constituants de la station météorolo-

C Liste des publications et communications . . . . . . . . . . . . . . . . . . 274

Table des manières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace ii

Je dédie cette thèse

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace iii

« Comme le coureur de fond, le doctorant doit tenir la distance. Mais, à la dif-

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace iv

TIN, qui m’a accepté dans son laboratoire.

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace v

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace vi

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace vii

1.1 Échelle de prévision pour la gestion de l’énergie dans un réseau élec-

2.1 Diagramme de recherche . . . . . . . . . . . . . . . . . . . . . . . . . 77

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace viii

2.11 Diagramme de traitement des données . . . . . . . . . . . . . . . . . 95

3.1 Taux d’accès à l’énergie électrique par commune [342] . . . . . . . . . 145

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace ix

3.15 Statistiques des données d’irradiation normalisées . . . . . . . . . . . 155

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace x

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xi

3.75 Paramètres Wy prévus et réels (Cas 2) . . . . . . . . . . . . . . . . . 201

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xii

1.1 Spécifications de la catégorie d’application [34]. . . . . . . . . . . . . 11

2.1 Résumé des méthodes de sélection des caractéristiques dans la prévi-

3.1 Hyperparamètres optimisés pour la prévision de l’irradiation . . . . . 181

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xiii

3.4 Performances des modèles pour la prévision de l’irradiation . . . . . . 183

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xiv

Liste des Algorithmes

1 Hold-out cross-validation . . . . . . . . . . . . . . . . . . . . . . . . . 104

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xv

ACM Continuous Ranking Probability Score

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xvi

FFT Fast Fourier Transform

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xvii

PNT Prévision Numérique du Temps

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace xviii

Contexte - Problématique - Justification

Au stade actuel du développement technologique, les combustibles fossiles ré-

Thèse de doctorat DIDAVI Kossoko Babatoundé Audace 1