Académique Documents
Professionnel Documents
Culture Documents
Travail-Liberté-Patrie
SUPERIEUR ET DE LA RECHERCHE
No d’ordre : 2018/MP/GE-
UNIVERSITE DE LOME
(UL)
ECOLE NATIONALE SUPERIEURE D’INGENIEURS
(E.N.S.I)
Jury:
Président : Dr KODJO Koffi Mawugno, Maitres de conférences, Chef du département
Génie Electrique.
Directeur : Dr SALAMI Adékunle Akim, Maitres de conférences, Directeur Adjoint
de l’ENSI.
Membre 1 : M. GUENOUKPATI Agbassou, Enseignant-chercheur à l’ENSI
Membre 2 : M. DOTCHE A. Koffi, Enseignant à l’ENSI
© Juillet 2018
DEDICACES
Dédicaces
Je dédie ce travail :
En leur exprimant mon amour, mon respect et mes vives gratitudes pour leur patience,
leur amour et leurs prières, qui m’encouragent toujours à la réussite tout le long de mes
A toutes nos grandes familles et tous nos chers amis et amis de classe, tous ceux que
Remerciements
Pour finir, je voudrais remercier les membres de ma famille pour leurs soutiens sans failles
qu’ils m’ont apportés tout au long de ces années.
Résumé
Afin de rendre le plus précis possible les prédictions de vitesse du vent sur le site de Lomé,
cette étude, faisant suite à d’autres études entreprises à l’ENSI, a pour objectif de prédire
la moyenne horaire de la vitesse du vent en utilisant un modèle des SVM (Support Vector
Machine) pour la régression.
Les SVM sont une technique de Machine Learning supervisé pour la prédiction des séries
chronologiques, qui se révèlent très efficaces dans ces dernières décennies.
A cet effet, nous disposons d’une base de données horaire recueillie sur le site, dont 70%
ont été dédiés à l’apprentissage, et 30% à la validation. Plusieurs configurations de ce
modèle ont été développées et testées. Les résultats obtenus avec une erreur quadratique
moyenne (MSE) de 0,128 et un coefficient de détermination (R2) de 0,962 montrent
clairement qu’il est possible de prédire la moyenne horaire de la vitesse du vent par un
modèle SVR.
DEDICACES ......................................................................................................................... i
REMERCIEMENTS ............................................................................................................ii
RESUME ............................................................................................................................. iv
3.2.2. Pandas............................................................................................................. 53
3.2.3. NumPy............................................................................................................ 53
3.2.5. SciPy............................................................................................................... 54
3.5.4. Bilan des meilleurs performances pour chaque configuration et choix des
entrées ............................................................................................................ 67
CHAPITRE 2 :
Figure 2.1 : Quatre types de problèmes de discrimination binaire ..................................... 38
Figure 2.2: Hyperplan optimal séparant les points de 2 classes ......................................... 39
Figure 2.3: Marge souple .................................................................................................... 42
Figure 2.4: Séparation linéaire des exemples après redescription dans un espace de
dimension plus grande ..................................................................................... 43
Figure 2.5 : Redescription des données pour permettre une séparation linéaire ................ 43
Figure 2.6 : ɛ-insensible...................................................................................................... 47
CHAPITRE 3 :
Figure 3.1 : La courbe des vitesses du vent de 2015 à 2018 .............................................. 60
Figure 3.2 : Histogramme des données de vitesses ............................................................ 62
Figure 3.3: Courbe de la variable de sortie du modèle ....................................................... 69
Figure 3.4 : Courbes des variables d’entrée du modèle ..................................................... 70
Figure 3.5: Résultats de prédiction ..................................................................................... 71
Figure 3.6: Vitesses mesurées et vitesses prédites ............................................................. 72
Figure 3.7: Corrélation vitesses mesurées-vitesses prédites .............................................. 72
Figure 3.8: Vitesse de vent réelle et prédite pour différents noyaux sur 24 heures ........... 73
Figure 3.9: Histogramme des erreurs au cours de la validation ......................................... 74
Figure 3.10 : Puissances prédites correspondantes ............................................................ 75
CHAPITRE : 2
Tableau 2.1: Horizons et applications de la prévision........................................................ 31
Tableau 2.2: Les fonctions noyaux ..................................................................................... 45
CHAPITRE : 3
Tableau 3.1: fiche des données ........................................................................................... 59
Tableau 3.2 : Les statistiques du vent ................................................................................. 62
Tableau 3.3: Matrice de corrélation des variables d'entrées ............................................... 63
Tableau 3.4: Variables d'entrée .......................................................................................... 63
Tableau 3.5: les différentes configurations d'entrée ........................................................... 64
Tableau 3.6: Performances SVR; configuration 1.............................................................. 65
Tableau 3.7: Performances SVR; configuration 2.............................................................. 66
Tableau 3.8 : Performances SVR; configuration 3............................................................. 66
Tableau 3.9: Performances SVR; configuration 4.............................................................. 66
Tableau 3.10: Performances SVR; configuration 5............................................................ 66
Tableau 3.11 : Performances SVR; configuration 6........................................................... 66
Tableau 3.12 : Performances SVR; configuration 7........................................................... 67
Tableau 3.13 : Performances SVR; configuration 8........................................................... 67
Tableau 3.14 : Récapitulatif des performances de différentes configurations ................... 68
Tableau 3.15:Les principales caractéristiques du model choisi ......................................... 70
Tableau 3.16: Coûts du matériel et du logiciel utilisés ...................................................... 76
Tableau 3.17: Estimation financière du temps de travail ................................................... 76
Tableau 3.18 : Estimation du coût total du projet .............................................................. 76
𝑟 : Coefficient de corrélation
ℜ : Constante de BOLTZMANN
σ : Ecart-type
He : Helium
H : Hydrogène
𝐶 : La constante de régulation
𝛼𝑖 : Les multiplicateurs de Lagrange
max : Maximisation
min : Minimisation
ℒ : Operateur lagrangien
∑ : Operateur de sommation
𝜀 : Taux d’erreur
𝜙 : Transformation non-linéaire
𝜆 : Rapport de vitesse de pointe
𝜉𝑖 : Variable de relâchement
ALADIN : Aire Limitée Adaptation dynamique Développement
international
BF : Beaufort
Passer le plus rapidement possible aux énergies renouvelables devient ainsi essentiel, tant
pour des raisons économiques qu’environnementales. Parmi les nombreuses énergies
renouvelables crédibles, l’énergie éolienne est l’une des plus prometteuses.
Depuis plusieurs dizaines d’années, l’énergie éolienne connaît une croissance considérable,
particulièrement en Europe. Cependant, la production d’énergie éolienne est dépendante de
l’intensité du vent, fortement volatile, et donc caractérisée par un haut degré d’incertitude.
Cette méconnaissance de la production future d’énergie a tendance à rendre la gestion du
réseau électrique plus difficile. Afin d’optimiser l’exploitation de cette forme d’énergie (par
une meilleure intégration dans le réseau et une réduction des coûts de production en vue
d’une concurrence avec les autres sources d’énergie), la prévision à court terme de la
ressource, et ainsi de la puissance en sortie d’un champ éolien, est donc essentielle.
La prévision à court terme de de la vitesse du vent joue un rôle important dans la production
et la distribution de l’énergie éolienne. L’objectif des chercheurs est de fournir un outil
fiable de prédiction. Les recherches dans ce domaine se basent sur les approches statistiques
et celles de l’intelligence artificielle. Ces dernières sont les plus utilisées pour rendre
prévisibles la production d’énergie d’un parc éolien.
C’est dans cet optique d’obtenir un modèle de prédiction qu’il nous a été confié dans le
cadre de notre mémoire de fin d’étude pour l’obtention du diplôme d’Ingénieur Génie
Electrique/ Master professionnel le thème intitulé : « ‘SUPPORT VECTOR MACHINE’
POUR LA PREDICTION DE LA VITESSE DU VENT : CAS DU SITE DE LOME ».
Le second chapitre présente une revue de littérature sur la prédiction des données de vitesse
du vent puis nous poserons les bases théoriques et pratiques des méthodes des SVM que
nous utiliserons dans ce travail.
Estimée à environ 1,8 × 1011 MW, l'énergie solaire totale reçue par la terre, seulement 2%
(c'est-à-dire 3,6 × 109 MW) est convertie en énergie éolienne et environ 35% de l'énergie
éolienne est dissipée à moins de 1000 m de la surface terrestre [36]. Par conséquent,
l'énergie éolienne disponible qui peut être convertie en d'autres formes d'énergie est environ
1,26 × 109 MW. Parce que cette valeur représente 20 fois le taux de consommation d'énergie
mondiale actuelle, l'énergie éolienne pourrait en principe répondre à l'ensemble des besoins
énergétiques du monde.
En tant que source d'énergie inépuisable et gratuite, il est disponible et abondante dans la
plupart des régions de la terre. En outre, une utilisation plus étendue de l’énergie du vent
Ainsi, en tant que source d'énergie la plus prometteuse, on pense que l'énergie éolienne joue
un rôle crucial dans l'approvisionnement énergétique mondial au XXIe siècle.
La relation de Van Der Walls (1.1) [1], [4], [12] montre qu'en raison des gradients de
pression résultant essentiellement des différences de températures d'un point à un autre du
globe, les masses d'air se déplacent dans toutes les directions constituant ainsi le phénomène
du vent.
n 2
2
v
P v n nT
v (1.1)
Où :
- 𝑃𝑣 est la pression dans le volume 𝑣 ;
- 𝑛 est le nombre total de moles ;
- 𝑣 est le volume total de gaz ;
- 𝛼 et 𝛽 sont des caractéristiques du gaz ;
- ℜ est la constante de BOLTZMANN des gaz parfaits ;
- 𝑇 est la température de l’ensemble du volume 𝑣.
- L’équateur reçoit une quantité plus importante d’énergie solaire par unité de
surface que les pôles, du fait que la terre est une sphère qui tourne autour du soleil
dans le même plan que son équateur. Il en résulte un gradient de pression des
pôles à l’équateur, et donc un mouvement d’air.
- L’inclinaison de l’axe de la terre d’environ 23.5 par rapport à son plan écliptique.
- La différence du taux d’absorption ou de réflexion du rayonnement solaire des
matériaux sur la surface de la terre.
- La surface topographique de la terre entraine un rayonnement solaire différent
sur les côtés ensoleillés et ombragés.
Dans l’hémisphère nord, le vent est dévié à droite et dans l’hémisphère sud à gauche. La
force de Coriolis dépend de la latitude ; il est nul à l'équateur et atteint les valeurs maximales
aux pôles. De plus, la déformation du vent dépend aussi de la vitesse du vent ; plus le vent
souffle fort, plus il est dévié [52].
1 2
Pw mv (1.3)
2
Cependant, seule une petite partie de l'énergie éolienne peut être convertie en puissance
électrique. Lorsque le vent traverse une éolienne et entraîne les lames, le débit massique du
vent correspondant est donné par la relation (1.4).
m Av (1.4)
Où :
- est la densité de l'air ;
- A est la surface balayée par les pales ;
1
Pw Av 3 (1.5)
2
La relation (1.5) révèle qu’une grande puissance éolienne nécessite une vitesse de vent plus
élevée, une plus grande longueur des pales pour obtenir une plus grande zone de balayage,
et une densité de l'air plus élevée. On voit également que la production d'énergie éolienne
est proportionnelle à la puissance cubique de la vitesse moyenne du vent, une petite
variation de la vitesse du vent peut entraîner un grand changement dans l'énergie éolienne.
A l r r 2 l 2 2r
2
(1.6)
Où :
- 𝑙 est la longueur des pales ;
- 𝑟 est le rayon du moyeu.
Ainsi, en doublant la longueur des lames de vent, la zone balayée peut être augmentée par
le facteur 4.
pV nRT (1.7)
où :
- 𝑝 est la pression d'air locale en pascal ;
- V est le volume en m3 ;
- R est la constante de gaz (287 J / kg.K pour l'air) ;
- T est la température de l'air locale en K.
La densité, nombre de moles par unité de volume est donnée par la relation (1.8).
p
(1.8)
RT
k v k 1 v
k
. exp v0
f(v) c c c (1.9)
0 v0
où :
- 𝑐 est le facteur d'échelle qui est étroitement lié à la vitesse moyenne du vent ;
- 𝑘 est le facteur de forme qui est une mesure de la largeur de la distribution.
Ces deux paramètres peuvent être déterminés à partir de l'analyse statistique des données
de vitesses du vent mesurées sur le site [52].
1.4.2.3. La turbulence
La turbulence du vent est la fluctuation de la vitesse du vent dans des échelles de temps
courtes, en particulier pour la composante de vitesse horizontale.
1.5. Aérogénérateurs
Un aérogénérateur, encore appelé une éolienne est une machine de conversion d'énergie qui
convertit l’énergie cinétique du vent en énergie mécanique, puis cette dernière en énergie
électrique. Dans les trois dernières décennies, des progrès remarquables dans la conception
des éoliennes ont été réalisés avec les développements technologiques modernes.
Divers concepts d'éoliennes ont été développés et construits pour maximiser la production
d'énergie éolienne, minimisant le coût de la turbine, et augmentant l’efficacité et la fiabilité
des turbines.
Il est accepté qu'une turbine dont la puissance nominale est inférieure à plusieurs kilowatts
puisse être catégorisée comme micro-éolienne [17]. Les micro-éoliennes ont besoin de
vitesses de démarrage relativement bas et fonctionnent à des vitesses de vent modérées, les
petites éoliennes se réfèrent généralement aux turbines avec une puissance de sortie
inférieure à 100 kW [14], les éoliennes les plus courantes ont des tailles moyennes avec des
puissances nominales de 100 kW à 1 MW, les éoliennes de type 1 MW jusqu'à 10 MW
peuvent être classées en tant que grandes éoliennes et enfin Les éoliennes de très grande
taille sont référées aux éoliennes d'une capacité supérieure à 10 MW.
Dans les aérogénérateurs à entrainement direct, l'arbre de générateur est directement relié
au rotor Par conséquent, le concept d'entraînement direct est plus supérieur en termes
d'efficacité énergétique, de fiabilité et de conception simplifié.
Les éoliennes en mer ont une excellente ressource éolienne en termes d'intensité de l'énergie
éolienne et de continuité. Une éolienne installée en mer peut produire une puissance plus
élevée et fonctionner plus d'heures chaque année par rapport à la même turbine installée sur
terre.
Pmec Pmec
Cp (1.11)
Pw 1
Av 3
2
L’existence de diverses pertes aérodynamiques dans les systèmes d'éoliennes, entraine un
coefficient de puissance Cp beaucoup plus bas que sa limite théorique, allant généralement
de 30 à 45% [49].
Dans la deuxième étape, l'énergie mécanique capturée par les pales est encore convertie en
énergie électrique via un générateur. A ce stade, l'efficacité de conversion est déterminée
par plusieurs paramètres dus aux pertes de puissance dans la boite de vitesse, pertes
mécaniques et électriques dans le générateur.
En supposant que la vitesse du vent traversant le rotor est égale à la moyenne entre
la vitesse du vent non perturbé à l'avant de l'éolienne 𝑣1 et la vitesse du vent après
𝑣1 +𝑣2
passage à travers le rotor 𝑣2 , soit , la masse d'air en mouvement de densité 𝜌 traversant
2
la surface 𝐴 balayée des pales en une seconde est donnée par la relation (1.12).
A v1 v2
m
2 (1.12)
m v12 v22
Pm
2 (1.13)
Soit en remplaçant 𝑚 par son expression (1.12), la relation (1.13) devient (relation (1.14)).
A v1 v2 v12 v22
Pm
4 (1.14)
v1 v1
2
1 1
Pm v2 v2
Pmt 2 (1.15)
l r
(1.16)
v
où :
- 𝑙 est la longueur des pales ;
- 𝑟 est le rayon du moyeu ;
- 𝜔 est la vitesse angulaire des pales.
Si la vitesse angulaire 𝜔 de la pale est trop petite, la plus grande partie du vent peut passer
sans être perturbée bien que la lame ait balayé la zone, rendant peu le travail utile sur les
pales. Au contraire, si 𝜔 est trop grand, les lames en rotation rapide peuvent bloquer le flux
de vent réduisant l'extraction de puissance. Par conséquent, il existe une vitesse angulaire
optimale à laquelle l'extraction de la puissance maximale est atteinte. Pour une éolienne à
𝑛 pales, la vitesse angulaire optimale peut être approximativement déterminée par la
relation (1.17), [37].
2 v
opt (1.17)
nL
Où :
En remplaçant la relation 1.17 dans la relation 1.16, le rapport optimal de vitesse de pointe
devient la relation (1.18).
2 l r
opt (1.18)
n L
Empiriquement, le rapport (𝑙 + 𝑟) / 𝐿 est égal à environ 2. Ainsi, pour les éoliennes à trois
pales (c'est-à-dire n = 3), 𝜆𝑜𝑝𝑡 ≈ 4 𝜋 / 3 [52].
Dans des conditions de vitesse de vent élevée, la puissance de sortie d'une éolienne peut
dépasser sa valeur nominale. Ainsi, le contrôle de puissance est nécessaire pour maintenir
la puissance de sortie dans les fluctuations admissibles afin éviter des dommages à
l’éolienne et stabiliser la puissance de sortie. Il y a deux stratégies de contrôle principales
dans le contrôle de puissance : contrôle d’orientation des pales et contrôle de décrochage.
La technique de contrôle de décrochage actif a été développée pour les grandes éoliennes.
Une éolienne à décrochage actif comporte des pales de décrochage associées à un système
d’orientation des pales (pitch). Comparé au contrôle de décrochage passif, le contrôle actif
fournit plus de précision dans le contrôle de la puissance de sortie et maintient la puissance
nominale à des vitesses de vent élevées. Cependant, avec l'ajout du mécanisme de contrôle
de tangage, le contrôle de calage actif augmente le coût de la turbine et diminue la fiabilité
du fonctionnement.
Le vent est caractérisé par sa direction et sa vitesse qui sont toutes des variables aléatoires,
imprévisibles et non linéaires.
Les systèmes de conversion de l’énergie du vent sont dotés des dispositifs pour mesurer la
direction du vent et adapter rapidement la direction de l’axe du rotor pour se placer face au
vent [28]. La direction du vent n’a donc que fort peu d’influence sur la production
d’électricité, d’autant plus que généralement, les vents ont tendance à avoir une ou deux
directions dominantes pour lesquelles la majeure partie de l’énergie est produite. Ainsi les
caractères aléatoire et imprévisible de la puissance électrique d’origine éolienne à la sortie
d’un système de conversion d’énergie du vent sont liés à la variation de la vitesse du vent.
Ainsi la question insidieuse est la suivante : « Que se passe-t-il lorsque le vent cesse de
souffler ?».
Il existe plusieurs méthodes qui abordent le problème de prévision des données de la vitesse
du vent par des approches statistiques. Ces dernières reposent sur une modélisation
mathématique de la série. Nous pouvons citer les travaux de Box & Jenkins [9], [23] comme
des références pour ces méthodes. Puis viennent des outils de l’apprentissage artificiel, en
anglais Machine Learning qui ont contribué dans l’appréhension des problèmes de
prédictions [8], [35].
Les outils de l’apprentissage artificiel les plus utilisés pour rendre plus prévisible la vitesse
du vent sur un site sont les réseaux de neurones, la logique floue, et le neuroflou [3], [40].
Cependant plus récemment, la technique des machines à vecteurs supports (SVM) a
également été envisagée [24], [29], [45].
Dans ce mémoire on s’intéresse à la technique des Support Vector Régression qui sont une
adaptation de l’algorithme SVM aux problèmes de régression. Les SVM (ainsi que les
SVR) sont une classe d’algorithme d’apprentissage supervisé destinée à résoudre des
problèmes de discrimination et de régression (SVR). Ils sont basés sur les mêmes principes
d’apprentissage que les réseaux de neurones, toutefois ils possèdent l’avantage d’être plus
simple à configurer. Les SVM ont rapidement été adoptés pour leur capacité à travailler
avec des données de grandes dimensions, le faible nombre d'hyper paramètres, leurs
garanties théoriques, et leurs bons résultats en pratique.
1.7. Conclusion
Ce premier chapitre, somme toute nous a permis de comprendre les techniques
d’implantation et d’exploitation d’une éolienne. Nous avons vu que pour une exploitation
optimale d’un parc éolien il faut non seulement un bon dimensionnement des
aérogénérateurs mais aussi une bonne maitrise du vent sur le site, surtout la vitesse de ce
dernier.
2.1. Introduction
Au cours de ces dernières années, une forte augmentation de l'énergie éolienne peut être
observée. En 2015, 12 800 MW de capacité éolienne ont été installés en Europe. Il y a
maintenant 142 GW de capacité installée, dont 131 GW sont onshore et 11 GW offshore
[47]. Avec des capacités croissantes, il y a aussi une demande croissante de fiabilité et de
précision des prédictions pour diverses fins.
Dans ce chapitre, nous décrivons les applications de prédiction de la puissance éolienne,
les méthodes usuelles utilisées pour la prédiction de la vitesse du vent, nous terminerons
par les techniques des SVM qui sont celles utilisées dans le cadre de notre travail.
Une application importante des prévisions est le commerce de l'énergie éolienne sur les
marchés de l'électricité, ce qui n'est possible qu'avec de bonnes prévisions car l'énergie est
vendue pour des points futurs dans le temps. Sur les marchés de l'électricité, il y a tendance
vers des horizons de prévision plus courts. Il existe une demande pour les prévisions
d'horizons de quelques minutes à quelques jours.
Pour équilibrer le réseau, des prévisions précises sont également nécessaires. La tâche
primordiale de maintien en stabilité de la tension et de la fréquence dans le réseau ne peut
être gérée que lorsque les décisions concernant la capacité de réserve et de la distribution
peuvent être prises rapidement. Les parties prenantes sont les fournisseurs d’énergie ainsi
que chaque producteur d'énergie qui injecte du jus dans le réseau. Pour la planification de
l'équilibrage du réseau, de bonnes prévisions sont aussi nécessaires. En général, l'énergie
d'équilibrage ou de contrôle est utilisée pour régler les événements inattendus sur le réseau.
Un fournisseur par conséquent a besoin de savoir combien d'énergie il peut offrir pour un
certain point dans le proche avenir.
Les différents horizons de prévision sont classés dans le tableau 2.1 et des exemples
d'applications y sont donnés. Les méthodes actuellement disponibles pour ces prévisions
sont présentées au paragraphe suivant.
La méthode de la persistance est en quelque sorte plus précise que d'autres méthodes de
prévision du vent à très court terme. Mais la précision de la méthode de persistance se
dégrade rapidement avec l'échelle de temps de prévision en augmentation [55].
La méthode de la persistance est non seulement la plus simple mais aussi la méthode la plus
économique en matière de prévision de vitesse du vent ou de prévision de puissance.
L'électricité utilise la méthode de la persistance pour les prévisions à très court terme. Par
conséquent, toute méthode de prévision développée doit d'abord être testée par rapport à la
méthode de référence classique de la persistance afin de vérifier si elle peut s'améliorer par
rapport aux prévisions dérivées de la persistance.
Cependant, les prévisions obtenues par les modèles de prévision numérique du temps
dépendent fortement des conditions initiales ; donc fournir une prévision d'ensemble
augmente la fiabilité de la prédiction.
Étant donné que la méthode de NPW sert de plate-forme pour la prévision de l'état
météorologique futur, la sortie pourrait être traitée davantage pour obtenir des estimations
plus fines en ce qui concerne les attributs du vent. À cet égard, Cassola et Burlando [11]
appliquent la méthode de filtrage de Kalman pour améliorer les prévisions de vitesse du
vent et d'énergie éolienne à très court terme.
Un certain nombre d'approches physiques ont été introduites. Le Prediktor est développé
par Risoe National Laboratory au Danemark. Il utilise WAsP (Wind Atlas Analysis and
Application Program) et le programme PARK pour prendre en compte les conditions
locales en utilisant les NPW de HIRLAM (High Resolution Limited Area Model). Le
Previento, développé par l'Université d'Oldenburg en Allemagne a un approche physique
similaire, mais utilise les NPW de Lakelmodell du Service météorologique allemand. Le
LocalPred est développé par CENER (National Renewable Energy Centre) en Espagne. Le
eWind, développé par AWS TrueWind Inc. aux États-Unis, a une approche physique
similaire avec Prediktor mais utilise un modèle de couche limite à haute résolution
(ForeWind) comme modèle de NPW pour prendre en compte les conditions locales [19].
Liu et al. [32] développent deux approches où le modèle ARMA est lié au réseau de
neurones artificiels (ANN) et aux méthodes basées sur le filtre de Kalman. Shi combinent
ARMA avec ANN et des machines vectorielles de support (SVM) dans le même but. On
conclut que ces modèles fonctionnent bien pour la prévision de la vitesse du vent non
stationnaire dans les systèmes éoliens [44]. Les méthodes basées sur des statistiques ne sont
pas seulement limitées aux modèles ARMA. Par exemple, Liu adopte le modèle modifié de
Taylor Kriging et compare la qualité de la prévision aux approches basées sur l'ARMA
[33].
Les chercheurs ont également étudié la possibilité de mettre en œuvre des modèles ARCH
et GARCH pour modéliser la variabilité de la vitesse du vent [53]. Liu compare 10
approches ARMA-GARCH différentes pour modéliser la volatilité et conclure qu'aucun
modèle ne surpasse l'autre, et indiquer que lorsque la hauteur augmente, la puissance du
modèle diminue. Ces études sont importantes pour fournir la prévision d'intervalle et
calculer la probabilité d'exploitation des éoliennes et la production éolienne conditionnelle
prévue.
D'autre part, ANN est une technique qui a été utilisée pour mapper le (s) vecteur (s) d'entrée
aléatoire (s) aux sorties sans suppositions préalables d'une relation fixe. Le réseau de
neurones peut apprendre en fonction des données existantes, découvrir les modèles cachés
et utiliser les données passées pour en prédire les futures. Des implémentations réussies des
ANN pour la prévision de la vitesse du vent existent dans la littérature [46] [36] [42]. Li et
Shi [31] ont comparé trois ANN différents, à savoir l'élément linéaire adaptatif
(ADALINE), la rétro-propagation directe (FFBP) et la fonction de base radiale (RBF)
pendant 1 heure avant les prévisions de vitesse du vent. Le modèle a surpassé tous les autres,
et que les sites éoliens devraient être évalués en fonction de la performance de différents
ANN selon une approche au cas par cas. Bilgili et al., Utilisant une fonction de transfert
sigmoïde logistique, une fonction de transfert linéaire comme fonction d'activation, et la
propagation élastique comme approche d'apprentissage, ont développé un modèle de
prévision de la vitesse du vent basé sur les données provenant des sites voisins [7]. Kani et
Ardehali ont combiné les ANN et les modèles de chaînes de Markov pour développer une
Mémoire d’ingénieur/Master Professionnel 35 Hadnane OURO-AGBAKE
CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT
approche combinée pour la prévision à très court terme de la vitesse du vent. L'approche
fondée sur les chaînes de Markov est utilisée pour saisir les tendances à long terme [27].
Fadare a utilisé des données sur 200 ans obtenues à partir de 28 stations au sol et a
développé un réseau de rétro propagation à trois couches, à action directe, avec différentes
configurations pour prévoir la vitesse du vent au Nigeria [20]. Il existe également d'autres
méthodes d'intelligence artificielle développées pour la prédiction de la vitesse du vent
telles que les approches basées sur la corrélation spatiale, les approches basées sur la
logique floue, les approches basées sur les transformées en ondelettes et les approches SVM
[57].
Ils ont été ensuite généralisés à la prévision de variables quantitatives. Dans le cas de la
discrimination d’une variable dichotomique, ils sont basés sur la recherche de l’hyperplan
de marge optimale qui, lorsque c’est possible, classe ou sépare correctement les données
tout en étant le plus éloigné possible de toutes les observations. Le principe est donc de
trouver un classifieur, ou une fonction de discrimination, dont la capacité de généralisation
(qualité de prévision) est la plus grande possible.
Cet outil devient largement utilisé dans de nombreux types d’applications et s’avère un
concurrent sérieux des algorithmes les plus performants (agrégation de modèles).
L’introduction de noyaux, spécifiquement adaptés à une problématique donnée, lui confère
une grande flexibilité pour s’adapter à des situations très diverses (reconnaissance de
formes, de séquences génomiques, de caractères, détection de spams, diagnostics...). À
noter que, sur le plan algorithmique, ces algorithmes sont plus pénalisés par le nombre
d’observations, c’est-à-dire le nombre de vecteurs supports potentiels, que par le nombre
de variables. Néanmoins, des versions performantes des algorithmes permettent de prendre
en compte des bases de données volumineuses dans des temps de calcul acceptables.
Une généralisation des SVM au cas des observations non séparables et non linéaires se fait
par introduction de variables d’écart et de noyaux. Ces différents types de problèmes sont
illustrés sur la figure 2.1.
A toute fonction de décision et donc aux fonctions de décision linéaire on associe une
frontière de décision (l’hyperplan) exprimée par la relation (2.1).
v, a x p
| vT x a 0 (2.1)
où :
- x est le vecteur d’entrée ;
- v le vecteur des paramètres (ou poids) ;
- a une constante.
Dans le cas le plus simple de discrimination de deux classes (discrimination binaire), il est
alors décidé que x est de classe 1 si D(x) ≥ 0 et de classe -1 sinon.
L’idée est de chercher l’hyperplan le « plus sûr », celui qui passe au milieu des points des
2 classes d’exemples (le moins sensible à de petites variations des exemples), celui qui
maximalise la distance minimum (marge) à chacune des 2 classes.
La marge est la distance entre l'hyperplan et les échantillons les plus proches. Ces derniers
sont appelés vecteurs supports.
vT xi a
Avec dist xi , v, a la distance d’un point quelconque xi de l’échantillon à
v
1
max
w ,b w (2.4)
avec yi w xi b 1; i i, n
T
1
La marge vaut désormais ‖𝑤‖
, il s'agit donc de maximiser ‖𝑤‖−1 . La formulation dite
1 2
min 2 w
w ,b (2.5)
avec y w x b 1;
T
i i , n
i i
n 1 n
max i i j yi y j xi .x j
i 1 2 i , j 1
(2.7)
n
avec i 0; i yi 0; i 1, n
i 1
n
i 1
f( x) sign yi i xi .x j b
(2.8)
Elle est influencée par les points correspondant à des 𝛼𝑖 ≥ 0. Ce sont les vecteurs de
support. Ils sont exactement sur la marge. Leur nombre est généralement petit devant le
nombre de données d’entrainement.
Le principe de la marge souple est d’autoriser des erreurs de classification. Des variables
ressorts (ou variables d’écart) sont introduites comme le montre la figure 2.3.
1 n
min w C i , C 0
2
w ,b 2 i 1 (2.9)
i
avec y wT x b 1 ; 0; i i, n
i i i
n 1 n
max i i j yi y j xi .x j
i 1 2 i , j 1 (2.10)
avec C i 0; i 1, n
L’idée des SVM est de reconsidérer le problème dans un espace de dimension supérieure,
éventuellement de dimension infinie. Dans ce nouvel espace, il est alors probable qu'il
existe un séparateur linéaire comme le montre la figure 2.4.
Figure 2.4: Séparation linéaire des exemples après redescription dans un espace de dimension
plus grande
Figure 2.5 : Redescription des données pour permettre une séparation linéaire
La forme duale du problème non linéaire est exprimée par la relation (2.11).
n
max i
1 n
2 i , j 1
i j yi y j xi . x j (2.11)
i 1
avec C i 0; i 1, n
Le problème de cette formulation est qu'elle implique un produit scalaire entre vecteurs
dans l'espace de redescription, de dimension élevée, ce qui est couteux en termes de calculs.
Pour résoudre ce problème, on utilise une fonction noyau k donnée la relation (2.12).
k xi , x j xi . x j avec xi , x j p
(2.12)
Ainsi il n’est pas nécessaire de faire la projection 𝜙, l’espace de redescription reste virtuel.
La fonction noyau (plus facile à calculer) donne le même résultat dans l’espace d’entrée.
Ceci est appelé ’the kernel trick’. Cette fonction peut être vue comme une mesure de
similarité non linéaire.
n 1 n
max i i j yi y j k xi .x j
i 1 2 i , j 1
(2.13)
n
n
i 1
f( x) sign yi i k xi .x j b
(2.14)
La difficulté qui reste à l’utilisateur est celle de choisir une fonction noyau. Il existe
quelques familles paramétrables connues (voir tableau 2.2). L’utilisateur va pouvoir choisir
une fonction par essai-erreur ou essayer de s’appuyer sur des fonctions déjà définies dans
le domaine considéré [43]. Plus la fonction prendra en compte les informations disponibles
sur le problème considéré, meilleurs devraient être les résultats.
Sigmoïde tanh(𝑎(𝑥𝑖 . 𝑥𝑗 ) − 𝑏)
de classes, puis à décider la classe gagnante soit par un vote majoritaire soit en post
traitant les résultats grâce à l’estimation de probabilités a posteriori. Le nombre de
classifieurs SVM à entrainer peut être réduit en utilisant un codage astucieux pour
les classes à travers un code correcteur d’erreur ou un graphe direct acyclique.
3- L’approche globale consiste à traiter le problème en une seule fois. Le dual de ce
problème est un programme quadratique de même nature que celui des SVM et de
taille n*c. L’estimateur associé est non consistant mais donne de bons résultats en
pratique.
L’idée consiste à minimiser le terme w tout en étant sous la contrainte de ne pas dépasser
un taux d’erreur 𝜀. Du point de vue graphique, ceci revient à trouver une zone du plan qui
contient tous les exemples xi de largeur 2ε appelé tube, (voir figure 2.6). Si on considère la
minimisation de ‖𝑤‖2 on obtient le problème quadratique de la relation (2.16).
1 2
min 2 w
avec yi w xi b
T
T
w xi b yi
(2.16)
Cette description du problème considère donc qu’une fonction linéaire f qui approxime tous
les exemples avec une précision " existe. Dans la pratique, ce n’est pas toujours le cas. En
présence de bruit trop important ou de valeurs aberrantes, il est aussi plus important
d’autoriser certaines erreurs. Dans ce cas, le concept de marge souple est utilisé. Il consiste
à introduire des variables de relâchement 𝜉𝑖 , 𝜉𝑖∗ pour rendre faisables les contraintes du
problème d’optimisation qui devient la relation (2.17).
1 *
min w C i i
n
2
2 i 1
(2.17)
avec yi w xi b i
T
T
w xi b yi i
*
0, pour y f x
y f x (2.18)
y f x , pour y f x
On peut interpréter cette fonction comme créant un tube d’insensibilité de rayon ε autour
de la fonction f(x). Les variables 𝜉𝑖 ou 𝜉𝑖∗ représentent alors la distance selon l’axe y entre
le point (xi; yi) et le bord du tube.
En passant par la formulation duale et l’équation de Lagrange, la fonction obtenue peut être
écrite sous la forme de la relation (2.19).
f x i i* xiT x b
n
(2.19)
i 1
La résolution d’un problème de régression non linéaire se fait de la même façon que dans
le cas de classification. C’est-à-dire en faisant une projection des donnes d’entrées dans un
espace de dimension supérieure dans lequel le problème devient linéaire. Une projection
implicite par fonction noyaux est utilisée pour les mêmes raisons de cout en temps de calcul.
Le modèle dans le cas général est donné par la relation (2.20).
f x i i* k xi , x b
n
(2.20)
i 1
D’autres approches permettent d’optimiser le réglage des hyper paramètres. Certaines sont
basées sur des méthodes évolutionnistes, d’autres sur une recherche par descente de
gradient.
Il existe néanmoins une technique, appelée υ-SVR, permettant de construire un SVM qui
ajuste automatiquement la largeur du tube d’insensibilité. Elle consiste à ajouter un terme
dans la formulation du problème d’optimisation pour tenter de minimiser l’erreur. Le
problème est donc reformulé ainsi par la relation (2.21).
1 n
min w
2
C i i* N
2 i 1
yi wT xi b i
avec wT x b y *
i i i
i , i 0
*
(2.21)
Avec υ > 0.
En plus, l’algorithme ne fait aucune opération matricielle et n’a pas besoin de maintenir la
matrice du noyau en mémoire. Divers packages d’implémentation du SMO peuvent être
trouvés dans la littérature, particulièrement LIBSVM [13].
2.5. Conclusion
Nous avons, dans ce chapitre, vu quelques méthodes utilisées pour prédire la vitesse du
vent. De la méthode de la persistance aux méthodes de Machine Learning, plusieurs études
ont été consacrées à la prédiction de la vitesse du vent prouvant ainsi la nécessité de
prédiction pour les centrales éoliennes. Nous avons vu les bases théoriques et pratiques des
techniques de SVR.
3.1. Introduction
Dans ce chapitre, il sera question dans un premier temps de faire une application des
algorithmes des SVM vus chapitre précédant pour prédire la vitesse du vent. Ensuite, les
performances des différents modèles seront présentées en vue de dégager le meilleur
modèle à partir de la base des critères de performance qui sont présentés plus loin. Enfin,
nous ferons une analyse suivie d’une discussion des résultats.
3.2. Environnement
Cette étude a été fait en utilisant les outils suivants : les programmes ont été écrits en python,
en utilisant des librairies tels que, NumPy pour la gestion de grands tableaux, matplotlib
pour générer les graphiques, scikit-learn pour les fonctions d’apprentissage automatique…
3.2.1. Pythons
Depuis sa première apparition en 1991, créé par Guido van Rossum, Python est devenu l'un
des langages de programmation interprétés les plus populaires, avec Perl, Ruby, et d'autres.
Python et Ruby sont devenus particulièrement populaire depuis 2005 ou plus pour la
création de sites Web utilisant leur nombreux frameworks web, comme Rails (Ruby) et
Django (Python). Ces langues sont souvent appelés langages de script, car ils peuvent être
utilisés pour écrire rapidement de petits programmes, ou des scripts pour automatiser
d'autres tâches. À la fin de ses 10 ans d’existence, Python est passé d'un point de vue
scientifique à la pointe de la technologie faisant du langage l'une des langages les plus
importantes pour la science des données, le Machine Learning, et le développement de
logiciels généraux dans les universités et l'industrie.
Au cours ces dernières années, le développement des bibliothèques (telles que pandas et
scikit-learn) a fait de python un choix populaire pour les tâches d'analyse de données.
Pour notre travail nous avons utilisé l’environnement de développement Anaconda dans sa
version 4.4.0 disponible à l’adresse http//continuum.io/downloads. Anaconda 4.4.0 offre la
possibilité de programmer dans deux versions de python soit Python 2.7 et Python 3.6.
3.2.2. Pandas
La librairie pandas fournit des structures de données de haut niveau et des fonctions conçues
pour rendre le travail avec des données structurées ou tabulaires rapide, facile et expressif.
Cela a permis à Python d'être un environnement d'analyse de données puissant et productif.
Les objets primaires de pandas sont le DataFrame, une structure de données tabulaire,
orientée colonne, avec des étiquettes de ligne et de colonne.
Pandas allie les idées performantes de NumPy en matière de calcul matriciel et les capacités
de manipulation de données de tableurs et de bases de données relationnelles (telles que
SQL). Il fournit une fonctionnalité d'indexation sophistiquée pour le rendre facile à
remodeler, découper, effectuer des agrégations et sélectionner des sous-ensembles de
données. Depuis la manipulation des données, la préparation et le nettoyage est une étape
importante dans l'analyse des données, pandas est l'un des les principaux outils que nous
avons utilisés.
3.2.3. NumPy
NumPy, abréviation de Numerical Python, a longtemps été la pierre angulaire des calculs
numériques en Python. Il fournit les structures de données, les algorithmes et la colle de
bibliothèque nécessaires pour la plupart des applications scientifiques impliquant des
données numériques en Python. NumPy contient, entre autres :
- Un objet tableau multidimensionnel rapide et efficace ndarray.
- Fonctions pour effectuer des calculs par éléments avec des tableaux ou des
opérations mathématiques entre les tableaux.
- Outils pour lire et écrire des ensembles de données sur disque.
- Opérations d'algèbre linéaire, transformée de Fourier et génération de nombres
aléatoires.
Au-delà des capacités de traitement de tableaux rapides que NumPy ajoute à Python, l'un
de ses utilisations principales dans l'analyse des données sont comme un conteneur pour les
données à transmettre entre algorithmes et bibliothèques. Pour les données numériques, les
tableaux NumPy sont plus efficaces pour le stockage et la manipulation des données que
les autres structures de données Python intégrées. Aussi, les bibliothèques écrites dans un
langage de niveau inférieur, comme C ou Fortran, peuvent fonctionner sur les données
stockées dans un tableau NumPy sans copier les données dans une autre représentation de
la mémoire.
3.2.4. Matplotlib
Matplotlib est la bibliothèque Python la plus populaire pour la production de graphiques et
d'autres visualisations de données bidimensionnelles. Il est conçu pour créer des courbes
adaptées pour la publication. Bien qu'il existe d'autres bibliothèques de visualisation
disponibles sous Python, matplotlib est le plus largement utilisé et en tant que tel a
généralement une bonne intégration avec le reste de l'écosystème.
3.2.5. SciPy
SciPy est une collection de paquets abordant un certain nombre de problèmes standard de
différents domaines scientifiques. Voici un échantillon des paquets inclus :
- scipy.integrate : Routines d'intégration numérique et solveurs d'équations
différentielles.
- scipy.linalg : Les routines d'algèbre linéaire et les décompositions matricielles
qui s'étendent au-delà de celles incluses dans numpy.linalg.
- scipy.optimize : Optimiseurs de fonction (minimiseurs) et algorithmes de
recherche de racine.
- scipy.signal : Outils de traitement du signal
3.2.6. Statsmodels
Statsmodels est un paquet d'analyse statistique. Comparé à scikit-learn, statsmodels
contient des algorithmes de statistiques et économétrie classiques. Cela inclut des sous-
modules tels que :
- Modèles de régression : régression linéaire, modèles linéaires généralisés,
linéaires robustes modèles, modèles d'effets mixtes linéaires, etc.
- Analyse de variance (ANOVA).
- Analyse de séries chronologiques : AR, ARMA, ARIMA, VAR et autres
modèles.
- Méthodes non paramétriques : estimation de la densité du noyau, régression du
noyau.
- Visualisation des résultats du modèle statistique.
Statsmodels est plus axé sur l'inférence statistique, fournissant des estimations d'incertitude
et p-valeurs pour les paramètres. En revanche, scikit-learn est davantage axé sur la
prédiction.
3.2.7. scikit-learn
scikit-learn est le premier outil d'apprentissage automatique polyvalent pour les
programmeurs Python. Il comprend des sous-modules pour des modèles comme :
- Classification : SVM, voisins les plus proches, forêt aléatoire, régression
logistique, etc.
- Régression : Lasso, régression de crête, etc.
- Clustering: k-means, clustering spectral, etc.
- Réduction de dimensionnalité : sélection de caractéristiques, factorisation
matricielle, etc.
Avec pandas, statsmodels et IPython, scikit-learn a été essentiel pour Python pour être un
langage de programmation de science de données productif.
3.4. Méthodologie
Pour atteindre nos objectifs nous devons donc avoir une méthodologie de travail qui nous
permettra de pouvoir effectuer une évaluation du modèle à la fin.
Erreur absolue moyenne (MAE) : l’erreur moyenne absolue est la moyenne des résidus
(c’est-à-dire la différence entre la valeur cible et la valeur prédite). Elle est exprimée par
la relation (3.1).
1 n 1
MAE y, yˆ yi yˆi
n i 0
(3.1)
Où :
- 𝑦𝑖 est la valeur cible ;
- 𝑦̂𝑖 est la valeur prédite ;
- n le nombre de valeur.
1 n 1
MSE y , yˆ yi yˆi
2
(3.2)
n i 0
La racine carre du MSE donne La racine carre de l'erreur quadratique moyenne (RMSE).
n 1
y yˆ
2
i i
R2 1 i 0
n 1
(3.3)
y y
2
i i
i 0
Toute transformation des données sera inversée avant que le calcul des erreurs ne soit
effectué, ceci afin de rendre la performance entre différentes méthodes directement
comparable.
Les séries chronologiques sont une suite de nombre ordonnée d’après une fréquence de
temps donnée. Les données d’une série temporelle se présentent en une liste d’une colonne.
L’apprentissage supervisé comme présenté au chapitre 2 est l’apprentissage où on a une
ou plusieurs variables d’entrée (X) et une variable de sortie (Y) et où on utilise un
algorithme pour apprendre la fonction de mappage de ou des entrées à la sortie Y = f(X).
Dans un premier temps nous avons exprimé les données de séries chronologiques dont nous
disposons sous forme d’apprentissage supervisé en utilisant la technique de « sliding
Window » ou méthode de décalage ou de retard qui consiste à utiliser la valeur de vitesse
du vent au temps t comme variable d’entrée et la valeur de vitesse du vent au temps t +δt
comme variable de sortie de l’entrée t.
La matrice de décalage ainsi obtenue a ensuite été découpée en ensemble de test (testing
set) et d’apprentissage (training set) de façon non aléatoire sur lequel nous avons appliqué
l’algorithme des SVR.
Notre objectif est de prédire la moyenne horaire de la vitesse du vent en prenant, en plus de
la vitesse du vent à l’instant t-1, des variables physiques exogènes et endogènes du
processus comme les paramètres d’entrée de notre modèle. L’utilisation de toutes les
variables d’entrée sera coûteuse en temps de calcul. Toutefois certains paramètres sont
dépendants et fortement corrélés entre eux, ainsi il n’est pas nécessaire d’utiliser toutes les
variables comme paramètres d’entrée. Nous allons utiliser le test de corrélation linéaire
entre variables définie par la relation (3.4) dans laquelle x et y sont des variables.
xy x . y
r (3.4)
x2 x 2 y2 y 2
3.5. Modélisation de la vitesse du vent par les SVM
Dans cette section nous exposons le travail effectué.
L’analyse univariée permet d’explorer une seule feature à la fois. Cette analyse se base sur
les statistiques descriptives. Ces dernières permettent de tirer des indicateurs concis sur une
feature donnée. Parmi ces indicateurs on retrouve la moyenne, la médiane ainsi que les
mesures de dispersion de données.
La moyenne : la moyenne est la somme des valeurs de vitesses divisée par le nombre de
valeurs de vitesses. Elle est donnée par la relation (3.5).
1 n
moy xi
n 1
(3.5)
x n 1 si n est impair
2
med x n x n (3.6)
2 2 1
si n est pair
2
1 n
xi moy
2
2 (3.7)
n 1
1 n
xi moy
2
(3.8)
n 1
Les quantiles : Un quantile d’ordre α (0< α <1) est la plus petite valeur de la série tel qu’au
moins α% des autres valeurs lui sont inférieures.
Le tableau 3.2 donne un résumé des indices statistiques des données de vitesses du vent du
01 janvier 2015 au 10 Avril 2018. La vitesse du vent de Lomé a une moyenne de 4.249
m/s dans ces dernières années. Les valeurs de l’écart-type et de la variance suggèrent que
la plupart du temps la vitesse du vent à Lomé est autour cette moyenne.
3.5.1.3. Corrélation
Le rôle de l’analyse de corrélation est de déterminer les coefficients de corrélation linéaire
entre variables afin de faire un bon choix des variables d'entrée du modèle.
Il s’agit donc de prédire les vitesses du vent à partir des combinaisons des variables
explicatives mentionnées dans le tableau 3.4 afin de déceler le cas de configuration le plus
performant sur la base d’un critère bien défini. Nous avons testé les différents cas de
configurations qui sont mentionnés dans le tableau 3.5.
Traiter les données manquantes revient à « réparer » le jeu de données pour qu’il puisse
être utilisable parle les algorithmes. Cette réparation peut prendre plusieurs formes : comme
supprimer les données manquantes ou les remplacer par des valeurs artificielles (on parle
d’imputation).
Pour notre étude nous avons opté pour la suppression complète des observations contenants
des données manquantes.
Où :
- 𝑥𝑚𝑖𝑛 est la plus petite valeur observée pour le feature x ;
- 𝑥𝑚𝑎𝑥 la plus grande valeur observée ;
- x la valeur de la feature que l’on recherche à normaliser.
3.5.4. Bilan des meilleurs performances pour chaque configuration et choix des
entrées
L’analyse des performances des différentes configurations nous a permis de détecter pour
chaque approche le meilleur modèle. Le tableau 3.14 donnent le récapitulatif des
performances des différents configurations. Les meilleurs performances sont obtenues pour
la configuration 5 et ce pour le noyau linéaire. Ceci nous permet de choisir les variables
d’entrées du modèle SVR.
En définitif, les variables d’entrées du modèle sont constituée par la vitesse du vent
(SPED(t-1)), la pression atmosphérique (ALTM(t-1)) et la température de rosée (DWPC(t-
1)), le tout à l’instant t-1; soit au total trois variables d’entrées. La sortie du modèle étant la
vitesse du vent (SPED(t)) à l’instant t. sur la figure 3.3 et 3.4 nous présentons
respectivement la représentation temporelle de la variable de sortie et celles des variables
d’entrées.
a) b)
Modèle SVR
Noyau linaire
Cas 5
configuration SPED(t-1)- ALTM(t-1)-DWPC(t-1)
C 1000
ɛ 0.1
MSE 0.128
RMSE 0.357
MAE 0.295
R2 0.962
La représentation temporelle est la meilleure manière de présenter les résultats. A cet effet
la figure 3.6 nous présentons le résultat en superposant la représentation temporelle des
données de vitesse mesurées et celle des données de vitesses prédites. On note bien une
corrélation presque linéaire entre les vitesses de vent prédites et celles mesurées.
Cette corrélation entre les données de vitesses mesurées et prédites est bien plu visible avec
la figure 3.7 où nous visualisons un nuage de point ayant pour abscisse les données de
vitesses mesurées et pour ordonnée celles prédites qui suit presque linéairement la première
bissectrice.
Pour valider les résultats nous choisissons d’observer les résultats de prédiction obtenus
pour les différentes méthodes. La figure 3.8 permet d’observer la force de modélisation des
SVR avec différents noyaux (linéaire, fonction a base radial, polynomial) sur 24 heures. On
remarque donc que le modèle avec le noyau linéaire modélise mieux la vitesse du vent à
Lomé (R2=0,962 ; MSE= 0.128).
Figure 3.8: Vitesse de vent réelle et prédite pour différents noyaux sur 24 heures
L’histogramme des erreurs au cours de la validation du modèle (figure 3.9) montre que plus
de 70% des données sont prédites avec une erreur nulle.
Il s’avère aussi important d’observer les puissances prédites correspondantes aux vitesses
prédites. Pour cela nous prenons une éolienne du fabricant Indien AUROVILLE ENERGY
PRODUCT (puissance nominale = 5 kW, vitesse nominale = 14 m/s, vitesse
d’enclenchement = 3.3 m/s). Cette dernière s’est avéré le choix optimal pour le site de Lomé
dans [41]. Sa courbe de puissance a été modélisée par la relation 3.10.
0 si V 3.3m / s
3 3 1 2 1
4.8.10 V 1.495.10 V 9.162.10 V 1.8 si 3.3m / s V 14m / s
P(V ) (3.10)
5 si 14m / s V 25m / s
0 si V 25m / s
L’étude du projet est facturée suivant le nombre d’heures de travail par jour. La
réalisation du projet a nécessité en moyenne 6 heures de temps par jour. Le projet a duré
au total 3 mois et nous avons travaillé en moyenne 22 jours par mois (voir tableau 3.17),
ce qui fait au total 396 heures de travail. Le coût de facturation par unité de temps utilisé
pendant l’étude du projet est cinq mille francs (5000) FCFA [58].
Le coût total du projet est composé du coût du matériel utilisé, du coût du temps de travail
et de la taxe sur la valeur ajoutée. Le coût total du projet est présenté dans le tableau 3.18.
Le coût total du projet est alors de quatre millions six cent dix-neuf mille cinquante francs
CFA (2 631 400 CFA).
3.8. Conclusion
Ce chapitre a été consacré à la modélisation de la vitesse du vent de Lomé par les SVR.
Dans un premier temps nous avons réalisé une analyse exploratoire des données de vitesse
du vent, étape importante de toute modélisation. Ensuite nous avons présenté l’outil qui a
servi à la modélisation (Anaconda). Puis enfin les différents cas de prédictions ont étés
développés et testés. L’indicateur statique MSE a été utilisé pour évaluer les performances
des différentes configurations. Les résultats obtenus sont satisfaisants comparés aux
résultats de A.A. Salami et al. [3] où il est obtenu un MSE de 1.0293.
Dans le deuxième chapitre, nous avons commencé par introduire une revue de littérature
complète sur la prédiction de la vitesse du vent à l’issue de laquelle nous avons jugé
intéressant la méthode de modélisation de la vitesse du vent par les SVM. Puis nous avons
expose les bases théoriques des SVM et de sa variantes pour la régression (SVR).
Les résultats issus de la modélisation ont été présentés au troisième chapitre. Plusieurs
configurations ont été développées et testées en faisant varier les différentes variables
explicatives, l’objectif étant de trouver la configuration qui modélise le mieux les données
de vitesses de notre base de données. Toutes les configurations ont été implémentées dans
le logiciel Anaconda 4.4.2.
L’indicateur MSE (Mean Squarred Error) a été utilisé pour évaluer les différents cas de
configuration. Le cas le plus performant de tous est le cas 5 (configuration SPED(t-1)-
ALTM(t-1)-DWPC(t-1)) avec le noyau linéaire, avec un MSE de 0.128. Les variables
explicatives SPED(t-1), ALTM(t-1), et DWPC(t-1) désignent respectivement la vitesse du
vent, la pression atmosphérique et la température de rosée, le tout à l’instant t-1. Ce modèle
pourra donc être utilisé pour les prédictions futures de la vitesse du vent sur le site de Lomé.
Cependant, du travail, il en reste encore dans ce contexte afin d'améliorer les résultats
obtenus. Cette amélioration peut être obtenue en développant différents aspects. Ainsi
comme perspectives il faut tenir compte des recommandations suivantes :
- les données utilisées dans ce projet comportent plusieurs anomalies, il serait plus
intéressant de trouver d’autres sources de données plus fiables, ou même de
développer des moyens d’enregistrement de la vitesse ;
[1] AHMET D. SAHIN, Progress and recent trends in wind energy, Progress in Energy
and Combustion Science 30, pp.501–543, 2004.
[4] BABUSKA R., Fuzzy Modeling and Identification Toolbox for the user’s guide,
Delft University of technology, Delft, the Netherlands, August 1998.
[6] BETZ, A., Das maximum der theoretisch möglichen ausnützung des windes
durch windmotoren. Zeitschrift für das gesamte Turbinewesen, pp. 307–309,
September 20, 1920.
[7] BILGILI M, SAHIN B, YASAR A., Application of artificial neural networks for
the wind speed prediction of target station using reference stations data, Renewable
Energy 2007; 32(14):235060.
[11] CASSOLA F, BURLANDO M., Wind speed and wind energy forecast through
Kalman filtering of Numerical Weather Prediction model output, Appl Energy 2012;
99: 15466.
[12] CARLIN P.W., A.S. LAXSON, E.B. MULJADI, the History and State of Art of
Variable-Speed Wind Turbine Technology, NREL/TP-500-28607, Février 2001.
[13] C.C. CHANG AND C.J LIN, LIBSVM: A library for support vector machines. ACM
Transactions on Intelligent Systems and Technology, 2:27:1–27:27, 2011.
[15] EL-ALI, A., MOUBAYED, N. & OUTBIB, R., Comparison between solar and wind
energy in Lebanon, Proc. of 9th Int. Conf. on Electrical Power Quality and
Utilisation, Barcelona, 2007.
[16] ERDEM E, SHI J., ARMA based approaches for forecasting the tuple of wind speed
and direction. Appl Energy 2011; 88(4):140514.
[17] EUROPEAN WIND ENERGY ASSOCIATION, Wind energy – the facts, part I:
Technology, 2009, http://www.wind-energy-the-facts.org/en.
[19] FOLEY, A.M., LEAHY, P.G., MARVUGLIA, A. AND MCKEOGH, E.J., Current
Methods and Advances in Forecasting of Wind Power Generation, Renewable
Energy, 37, 1-8, 2012.
[20] FADARE DA, The application of artificial neural networks to mapping of wind
speed profile for energy application in Nigeria, Appl Energy 2010; 87(3):93442.
[21] GAN H. H., PASQUALI S., SCHLICK T, Exploring the repertoire of RNA
secondary motifs using graph theory; implications for RNA design NAR, 31(11):
2926-43, 2003.
[23] HAMILTON, J. D. (1994). Time Series Analysis, volume 3, Princeton Univ Pr.
[25] HUANG Z, CHALABI ZS, Use of time-series analysis to model and forecast wind
speed, J Wind Eng Ind Aerodyn 1995; 56(2):31122.
[26] KAVASSERI RG, SEETHARAMAN K., Day-ahead wind speed forecasting using
f-ARIMA models, Renewable Energy 2009; 34(5):138893.
[27] KANI SP, ARDEHALI MM., Very short-term wind speed prediction: a new
artificial neural network Markov chain model, Energy Convers Manage 2011;
52(1):73845.
[28] KODJO M. K., BÉDJA K., AJAVON A. S. A., FAYE R. M., LISHOU C., Neural
network for predictive control of the mechanism of orientation of wind turbine,
Mémoire d’ingénieur/Master Professionnel 84 Hadnane OURO-AGBAKE
ANNEXES
[31] LI G, SHI J., on comparing three artificial neural networks for wind speed
forecasting, Appl Energy 2010; 87(7):231320.
[32] LIU H, TIAN HQ, LI YF., Comparison of two new ARIMA-ANN and ARIMA-
Kalman hybrid methods for wind speed prediction, Appl Energy 2012; 98:41524.
[33] LIU H, SHI J, ERDEM E., Prediction of wind speed time series using modified
Taylor Kriging method, Energy 2010; 35(12):48709.
[34] MA, L., LUAN, S.Y., JIANG, C.W., LIU, H L. AND ZHANG, Y., A Review on the
Forecasting of Wind Speed and Generated Power, Renewable and Sustainable
Energy Reviews, 13, 915-920, 2009.
[36] NELSON, V., Wind Energy Renewable Energy and the Environment, CRC Press,
2009.
[39] R.J. VANDERBEI, An interior point code for quadratic programming. Optimization
methods and software, 11(1):451–484, 1999.
[40] SALAMI A. A., TIEM S., LISHOU C., BEDJA K., La logique floue pour la
prédiction de la moyenne horaire de la vitesse du vent sur le site de Lomé, Journal
des Sciences Pour l’Ingénieur (JSPI), Presses Universitaires de Dakar, N° 8, pp. 88-
96, 2007.
[41] SALAMI, A.A, AJAVON, A.S.A, KODJO, M.K. AND BEDJA, K. evaluation of
wind potential for an optimum choice of wind turbine generator on the sites of Lomé,
Accra, and Cotonou located in the gulf of guinea, int. Journal of Renawable Energy
Development, 2016.
[43] SCHOLKOPF B., TSUDA K., VERT J.-P., Kernel Methods in Computational
Biology, MIT Press, 2004.
[44] SHI J, ZENG S., Evaluation of hybrid forecasting approaches for wind speed and
power generation time series, Renewable Sustainable Energy Rev 2012;
16(5):347180.
[49] ULGEN, K. & HEPBASLI, A., Determination of Weibull parameters for wind
energy analysis of Izmir, Turkey, International Journal of Energy Research, 26(6),
pp. 495–506, 2002.
[50] VAPNIK V. N., The nature of statistical learning theory, Springer, 2000.
[52] WEI TONG, Wind Power Generation and Wind Turbine Design, Koll morgen Corp.,
USA, 2010.
[54] Wikistat.fr
[55] WU, Y.K. AND HON, J.S., A Literature Review of Wind Forecasting Technology
in the World, Proceedings of the IEEE Conference on Power Tech, Lausanne, 1-5
July 2007, 504-509, 2007.
[56] ZHAO, X., WANG, S.X. AND LI, T, Review of Evaluation Criteria and Main
Methods of Wind Power Forecasting. Energy Procedia, 12, 761-769, 2011.
[57] ZHOU J, SHI J, LI G, Fine tuning support vector machines for short-term wind
speed forecasting, Energy Convers Manage 2011; 52(4):1990.