Memoire Ouro Agbake

MINISTERE DE L’ENSEIGNEMENT REPUBLIQUE TOGOLAISE
Travail-Liberté-Patrie
SUPERIEUR ET DE LA RECHERCHE
No d’ordre : 2018/MP/GE-
UNIVERSITE DE LOME
(UL)
ECOLE NATIONALE SUPERIEURE D’INGENIEURS
(E.N.S.I)
DEPARTEMENT DE GENIE ELECTRIQUE
"SUPPORT VECTOR MACHINE" POUR

LA PREDICTION DE LA VITESSE DU
VENT : CAS DU SITE DE LOME
MEMOIRE DE FIN D’ETUDES POUR L’OBTENTION DU DIPLOME MASTER

PROFESSIONNEL/ INGENIEUR DE CONCEPTION GENIE ELECTRIQUE
Rédigé et soutenu par : Hadnane OURO-AGBAKE
Jury:
Président : Dr KODJO Koffi Mawugno, Maitres de conférences, Chef du département
Génie Electrique.
Directeur : Dr SALAMI Adékunle Akim, Maitres de conférences, Directeur Adjoint
de l’ENSI.
Membre 1 : M. GUENOUKPATI Agbassou, Enseignant-chercheur à l’ENSI
Membre 2 : M. DOTCHE A. Koffi, Enseignant à l’ENSI
© Juillet 2018
DEDICACES
Dédicaces
Je dédie ce travail :
A Allah, le très haut.
A mes chers parents:
En leur exprimant mon amour, mon respect et mes vives gratitudes pour leur patience,
leur amour et leurs prières, qui m’encouragent toujours à la réussite tout le long de mes
études, qu’Allah les protège et les bénisse.
A toutes nos grandes familles et tous nos chers amis et amis de classe, tous ceux que
nous aimons et qui nous sont très chers.
Mémoire d’ingénieur/Master Professionnel i Hadnane OURO-AGBAKE

REMERCIEMENTS
Remerciements
Je tiens à adresser mes vifs et sincères remerciements :
au Professeur BEDJA Koffi-Sa, Professeur Titulaire, Ingénieur des Télécommunications,

Directeur de l’Enseignement Supérieur Technique, Directeur de l’ERSI et de la Formation
Doctorale de l’ENSI-UL, pour ses conseils et encouragements pendant notre formation ;
au Dr. AJAVON Ayité Sénah, Maître de Conférences, Ingénieur Electro-énergéticien,

Directeur de l’ENSI ;
au Dr. KODJO Koffi Mawugno, Maître de Conférences, Ingénieur Automaticien,

Enseignant Chercheur à l’ENSI, et chef de département Génie Electrique ;
au Dr. SALAMI Adekunle Akim, Maître de Conférences, Ingénieur Génie Electrique,

Directeur Adjoint de l’ENSI, Directeur de ce mémoire pour sa disponibilité et ses conseils;
au Dr. BAYOR Sibiri Wourè-Nadiri, Maître-Assistant, Ingénieur Génie Electrique,

Enseignant-Chercheur à l’ENSI ;
au Dr. DEFLY Koffi, Maître-Assistant, Enseignant-Chercheur à l’ENSI ;
au Dr. BOKOVI Yao, Maître-Assistant, Ingénieur Génie Electrique, Enseignant chercheur

à l’ENSI ;
à M EGBEKU Edem, Ingénieur Génie Electrique, Enseignant-chercheur à l’ENSI ;
à M. KPOGLI Komlan, Ingénieur, Enseignant chercheur à l’ENSI ;
Mémoire d’ingénieur/Master Professionnel ii Hadnane OURO-AGBAKE

REMERCIEMENTS
à tout le personnel enseignant, administratif et technique de l’ENSI pour leur

dévouement au bien-être de tous les étudiants de l’ENSI;
Pour finir, je voudrais remercier les membres de ma famille pour leurs soutiens sans failles
qu’ils m’ont apportés tout au long de ces années.
Mémoire d’ingénieur/Master Professionnel iii Hadnane OURO-AGBAKE

RESUME
Résumé
La production de l’énergie éolienne dépend fortement de la variation de la vitesse du vent

sur le site de production. Cependant, si l’énergie éolienne doit concurrencer les autres
sources d’énergie, la prédiction de la vitesse du vent est alors indispensable.
Afin de rendre le plus précis possible les prédictions de vitesse du vent sur le site de Lomé,
cette étude, faisant suite à d’autres études entreprises à l’ENSI, a pour objectif de prédire
la moyenne horaire de la vitesse du vent en utilisant un modèle des SVM (Support Vector
Machine) pour la régression.
Les SVM sont une technique de Machine Learning supervisé pour la prédiction des séries
chronologiques, qui se révèlent très efficaces dans ces dernières décennies.
A cet effet, nous disposons d’une base de données horaire recueillie sur le site, dont 70%
ont été dédiés à l’apprentissage, et 30% à la validation. Plusieurs configurations de ce
modèle ont été développées et testées. Les résultats obtenus avec une erreur quadratique
moyenne (MSE) de 0,128 et un coefficient de détermination (R2) de 0,962 montrent
clairement qu’il est possible de prédire la moyenne horaire de la vitesse du vent par un
modèle SVR.
Mots clés : apprentissage automatique, Support Vector Machine, Support Vector

Régression, vitesse du vent, prédiction.
Mémoire d’ingénieur/Master Professionnel iv Hadnane OURO-AGBAKE

TABLE DES MATIERES
Table des matières

Pages
DEDICACES ......................................................................................................................... i
REMERCIEMENTS ............................................................................................................ii
RESUME ............................................................................................................................. iv
TABLE DES MATIERES .................................................................................................... v
LISTE DES FIGURES ..................................................................................................... viii
LISTE DES TABLEAUX ................................................................................................... ix
LISTE DES ABREVIATIONS ET ACRONYMES ............................................................ x
INTRODUCTION GENERALE ....................................................................................... 1
CHAPITRE 1 : LE PROCESSUS ENERGETIQUE EOLIEN ..................................... 4
1.1. Introduction ............................................................................................................. 5

1.2. Energie éolienne ...................................................................................................... 5
1.3. Les origines du vent ................................................................................................ 6
1.3.1. Ensoleillement inégal de la terre ...................................................................... 7
1.3.2. La force de Coriolis .......................................................................................... 7
1.3.3. La géographie locale ........................................................................................ 7
1.4. Les caractéristiques de l’énergie éolienne .............................................................. 8

1.4.1. Puissance éolienne ........................................................................................... 8
1.4.2. Les caractéristiques du vent ........................................................................... 11
1.4.3. Les classes de vent ......................................................................................... 13
1.5. Aérogénérateurs .................................................................................................... 15
Mémoire d’ingénieur/Master Professionnel v Hadnane OURO-AGBAKE

TABLE DES MATIERES
1.5.1. Configuration d’une éolienne ......................................................................... 15
1.5.2. Classification des aérogénérateurs ................................................................. 16
1.5.3. Les paramètres de l’énergie éolienne ............................................................. 19
1.5.4. Commandes de l’éolienne .............................................................................. 24
1.6. Problématique de la prédiction de la vitesse du vent ............................................ 27

1.7. Conclusion ............................................................................................................ 28
CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU
VENT ..................................................................................................... 29
2.1. Introduction ........................................................................................................... 30

2.2. Les applications de la prédiction de la vitesse du vent ......................................... 30
2.3. Revue littéraire de la prédiction de la vitesse du vent .......................................... 31
2.3.1. Méthode de persistance .................................................................................. 31
2.3.2. Modèles de prévision numérique ................................................................... 32
2.3.3. Prévision d'ensemble ...................................................................................... 33
2.3.4. Méthodes physiques ....................................................................................... 33
2.3.5. Méthodes d'approche statistique et d'apprentissage ....................................... 34
2.4. Machines à Vecteurs Support (SVM) ................................................................... 36

2.4.1. Le problème de discrimination binaire .......................................................... 37
2.4.2. Les SVM linéaires .......................................................................................... 37
2.4.3. Le cas non linéaire : les noyaux ..................................................................... 42
2.4.4. Les SVM multiclasses .................................................................................... 45
2.4.5. Support Vector Régression ............................................................................ 45
2.4.6. Les SVM par la pratique ................................................................................ 47
2.5. Conclusion ............................................................................................................ 50

CHAPITRE 3 : ANALYSE ET DISCUSSIONS DES RESULTATS ET ETUDE
ECONOMIQUE .................................................................................... 51
Mémoire d’ingénieur/Master Professionnel vi Hadnane OURO-AGBAKE

TABLE DES MATIERES
3.1. Introduction ........................................................................................................... 52

3.2. Environnement ...................................................................................................... 52
3.2.1. Pythons ........................................................................................................... 52
3.2.2. Pandas............................................................................................................. 53
3.2.3. NumPy............................................................................................................ 53
3.2.4. Matplotlib ....................................................................................................... 54
3.2.5. SciPy............................................................................................................... 54
3.2.6. Statsmodels .................................................................................................... 55
3.2.7. scikit-learn ...................................................................................................... 55
3.3. Description du problème ....................................................................................... 56

3.4. Méthodologie ........................................................................................................ 56
3.4.1. Mesure de performance .................................................................................. 56
3.4.2. Stratégie d’apprentissage ............................................................................... 57
3.5. Modélisation de la vitesse du vent par les SVM ................................................... 58

3.5.1. Analyse exploratoire des données de vitesse ................................................. 59
3.5.2. Prétraitement des données du vent ................................................................. 64
3.5.3. Les performances des configurations ............................................................. 65
3.5.4. Bilan des meilleurs performances pour chaque configuration et choix des
entrées ............................................................................................................ 67
3.6. Prédiction avec le modèle choisi........................................................................... 70

3.7. Coût du projet ...................................................................................................... 75
3.8. Conclusion ............................................................................................................ 76
CONCLUSION GENERALE.......................................................................................... 78
RÉFÉRENCES BIBLIOGRAPHIQUES ........................................................................... 81
Mémoire d’ingénieur/Master Professionnel vii Hadnane OURO-AGBAKE

LISTE DES FIGURES
LISTE DES FIGURES

Pages
CHAPITRE 1 :
Figure 1.1: Surface de balayage des pales .......................................................................... 10
Figure 1.2: Configuration d'un aérogénérateur................................................................... 16
Figure 1.3: Tube de courant d’air autour d’un aérogénérateur........................................... 20
Figure 1.4: Coefficient de puissance .................................................................................. 21
Figure 1.5: Courbe de puissance ........................................................................................ 22
CHAPITRE 2 :
Figure 2.1 : Quatre types de problèmes de discrimination binaire ..................................... 38
Figure 2.2: Hyperplan optimal séparant les points de 2 classes ......................................... 39
Figure 2.3: Marge souple .................................................................................................... 42
Figure 2.4: Séparation linéaire des exemples après redescription dans un espace de
dimension plus grande ..................................................................................... 43
Figure 2.5 : Redescription des données pour permettre une séparation linéaire ................ 43
Figure 2.6 : ɛ-insensible...................................................................................................... 47
CHAPITRE 3 :
Figure 3.1 : La courbe des vitesses du vent de 2015 à 2018 .............................................. 60
Figure 3.2 : Histogramme des données de vitesses ............................................................ 62
Figure 3.3: Courbe de la variable de sortie du modèle ....................................................... 69
Figure 3.4 : Courbes des variables d’entrée du modèle ..................................................... 70
Figure 3.5: Résultats de prédiction ..................................................................................... 71
Figure 3.6: Vitesses mesurées et vitesses prédites ............................................................. 72
Figure 3.7: Corrélation vitesses mesurées-vitesses prédites .............................................. 72
Figure 3.8: Vitesse de vent réelle et prédite pour différents noyaux sur 24 heures ........... 73
Figure 3.9: Histogramme des erreurs au cours de la validation ......................................... 74
Figure 3.10 : Puissances prédites correspondantes ............................................................ 75
Mémoire d’ingénieur/Master Professionnel viii Hadnane OURO-AGBAKE

LISTE DES TABLEAUX
LISTE DES TABLEAUX

Pages
CHAPITRE 1 :
Tableau 1.1: Densité de puissance...................................................................................... 11
Tableau 1.2 : Les classes de vent........................................................................................ 13
CHAPITRE : 2
Tableau 2.1: Horizons et applications de la prévision........................................................ 31
Tableau 2.2: Les fonctions noyaux ..................................................................................... 45
CHAPITRE : 3
Tableau 3.1: fiche des données ........................................................................................... 59
Tableau 3.2 : Les statistiques du vent ................................................................................. 62
Tableau 3.3: Matrice de corrélation des variables d'entrées ............................................... 63
Tableau 3.4: Variables d'entrée .......................................................................................... 63
Tableau 3.5: les différentes configurations d'entrée ........................................................... 64
Tableau 3.6: Performances SVR; configuration 1.............................................................. 65
Tableau 3.8 : Performances SVR; configuration 3............................................................. 66
Tableau 3.10: Performances SVR; configuration 5............................................................ 66
Tableau 3.11 : Performances SVR; configuration 6........................................................... 66
Tableau 3.14 : Récapitulatif des performances de différentes configurations ................... 68
Tableau 3.15:Les principales caractéristiques du model choisi ......................................... 70
Tableau 3.16: Coûts du matériel et du logiciel utilisés ...................................................... 76
Tableau 3.17: Estimation financière du temps de travail ................................................... 76
Tableau 3.18 : Estimation du coût total du projet .............................................................. 76
Mémoire d’ingénieur/Master Professionnel ix Hadnane OURO-AGBAKE

LISTE DES ABREVIATIONS ET ACRONYMES

𝐶𝑝 : Coefficient de puissance
𝑟 : Coefficient de corrélation
ℜ : Constante de BOLTZMANN
σ : Ecart-type
He : Helium
H : Hydrogène
𝐶 : La constante de régulation
𝛼𝑖 : Les multiplicateurs de Lagrange
max : Maximisation
min : Minimisation
ℒ : Operateur lagrangien
∑ : Operateur de sommation
𝜀 : Taux d’erreur
𝜙 : Transformation non-linéaire
𝜆 : Rapport de vitesse de pointe
𝜉𝑖 : Variable de relâchement
ALADIN : Aire Limitée Adaptation dynamique Développement
international
ALTM : La pression atmosphérique
ANN : Artificial Neural Network
ARCH : Auto-Regressive Conditional Heteroscedasticity
ARIMA : Moyenne mobile intégrée régressive
ARMA : Moyenne mobile auto régressive

Mémoire d’ingénieur/Master Professionnel x Hadnane OURO-AGBAKE
BF : Beaufort
CENER : National Renewable Energy Centre
CO2 : Dioxyde de carbone
DWPC : La température de la rosée
GARCH : Generalized Auto-Regressive Conditional Heteroscedasticity
HIRLAM : High Resolution Local Area
MAE : Mean Absolute Error

MSE : Mean Squared Error
NPW : Numeric Weather Prediction
RBF : Fonction de base radiale
RELH : Humidité relative du vent
RMSE : Root Mean Squared Error

R2 : Coefficient de détermination
SO2 : Dioxyde de soufre
SVM : Support Vector Machine
SVR : Support Vector Regression
TIME : Date et l’heure d’enregistrement des données
TMPC : La température ambiante
WAsP : Wind Atlas Analysis and Application Program
Mémoire d’ingénieur/Master Professionnel xi Hadnane OURO-AGBAKE

Introduction générale
INTRODUCTION GENERALE
Le développement des sources d’énergie renouvelables doit tout, ou presque, aux
préoccupations écologiques liées au réchauffement climatique ainsi qu’au prix des
combustibles fossiles et aux inquiétudes nées de leur probable épuisement. Les énergies
fossiles conventionnelles auront une fin relativement proche et leur utilisation contribue à
une dramatique dérive climatique.
Passer le plus rapidement possible aux énergies renouvelables devient ainsi essentiel, tant
pour des raisons économiques qu’environnementales. Parmi les nombreuses énergies
renouvelables crédibles, l’énergie éolienne est l’une des plus prometteuses.
Depuis plusieurs dizaines d’années, l’énergie éolienne connaît une croissance considérable,
particulièrement en Europe. Cependant, la production d’énergie éolienne est dépendante de
l’intensité du vent, fortement volatile, et donc caractérisée par un haut degré d’incertitude.
Cette méconnaissance de la production future d’énergie a tendance à rendre la gestion du
réseau électrique plus difficile. Afin d’optimiser l’exploitation de cette forme d’énergie (par
une meilleure intégration dans le réseau et une réduction des coûts de production en vue
d’une concurrence avec les autres sources d’énergie), la prévision à court terme de la
ressource, et ainsi de la puissance en sortie d’un champ éolien, est donc essentielle.
La prévision à court terme de de la vitesse du vent joue un rôle important dans la production
et la distribution de l’énergie éolienne. L’objectif des chercheurs est de fournir un outil
fiable de prédiction. Les recherches dans ce domaine se basent sur les approches statistiques
et celles de l’intelligence artificielle. Ces dernières sont les plus utilisées pour rendre
prévisibles la production d’énergie d’un parc éolien.
C’est dans cet optique d’obtenir un modèle de prédiction qu’il nous a été confié dans le
cadre de notre mémoire de fin d’étude pour l’obtention du diplôme d’Ingénieur Génie
Electrique/ Master professionnel le thème intitulé : « ‘SUPPORT VECTOR MACHINE’
POUR LA PREDICTION DE LA VITESSE DU VENT : CAS DU SITE DE LOME ».
Mémoire d’ingénieur/Master Professionnel 2 Hadnane OURO-AGBAKE

INTRODUCTION GENERALE
Afin d’atteindre nos objectifs, nous divisons notre travail en trois chapitres. Le
premier sera consacré au processus énergétique éolien et à la problématique de la prédiction
de la vitesse du vent.
Le second chapitre présente une revue de littérature sur la prédiction des données de vitesse
du vent puis nous poserons les bases théoriques et pratiques des méthodes des SVM que
nous utiliserons dans ce travail.
Le troisième chapitre présentera les résultats de la modélisation, et de la prédiction. Nous y

analyserons et discuterons les résultats obtenus.

1. Chapitre 1 : Le processus
énergétique éolien
CHAPITRE 1 : LE PROCESSUS ENERGIQUE EOLIEN
1.1. Introduction
L'utilisation de l'énergie éolienne élimine essentiellement les émissions de CO2, SO2, et
autres déchets issus des centrales à charbon traditionnelles ou les déchets radioactifs dans
les centrales nucléaires. En diversifiant davantage l'approvisionnement en énergie, l'énergie
éolienne réduit la dépendance aux combustibles fossiles soumis à l'instabilité des prix et de
l'offre, renforçant ainsi la sécurité énergétique mondiale. La plus prometteuse des sources
d'énergie renouvelable, propre et fiable, l'énergie éolienne prend une part importante dans
la production d'électricité dans les décennies à venir.
Le but de ce chapitre est d’exposer les principes fondamentaux de l'énergie éolienne et la

conception moderne des éoliennes, ainsi que quelques idées concernant la production
d'énergie éolienne. Nous finirons ce chapitre par la problématique liée à la prédiction de la
vitesse du vent.
1.2. Energie éolienne

L'énergie éolienne est une forme convertie d'énergie solaire qui est produite par la fusion
nucléaire de l'hydrogène (H) en hélium (He) dans son noyau. Le processus de fusion de H
en He crée de la chaleur et le rayonnement électromagnétique sort du soleil, dans l'espace
dans tous les sens. Bien que seule une petite partie du rayonnement solaire soit interceptée
par la terre, elle fournit presque tous les besoins énergétiques de la terre.
Estimée à environ 1,8 × 1011 MW, l'énergie solaire totale reçue par la terre, seulement 2%
(c'est-à-dire 3,6 × 109 MW) est convertie en énergie éolienne et environ 35% de l'énergie
éolienne est dissipée à moins de 1000 m de la surface terrestre [36]. Par conséquent,
l'énergie éolienne disponible qui peut être convertie en d'autres formes d'énergie est environ
1,26 × 109 MW. Parce que cette valeur représente 20 fois le taux de consommation d'énergie
mondiale actuelle, l'énergie éolienne pourrait en principe répondre à l'ensemble des besoins
énergétiques du monde.
En tant que source d'énergie inépuisable et gratuite, il est disponible et abondante dans la
plupart des régions de la terre. En outre, une utilisation plus étendue de l’énergie du vent

aiderait à réduire la demande de combustibles fossiles, qui pourrait s'épuiser au cours de ce
siècle, selon leurs consommations actuelles. De plus, le coût du kWh d'énergie éolienne est
très inférieur à celui de l'énergie solaire photovoltaïque [15].
Ainsi, en tant que source d'énergie la plus prometteuse, on pense que l'énergie éolienne joue
un rôle crucial dans l'approvisionnement énergétique mondial au XXIe siècle.
1.3. Les origines du vent

Le vent résulte du mouvement de l'air dû aux gradients de pression atmosphérique. Le vent
s'écoule des régions de haute pression vers les régions de basse pression. Plus le gradient
de pression atmosphérique est grand, plus la vitesse du vent est élevée et plus la puissance
éolienne qui peut être captée du vent au moyen de machines de conversion d'énergie.
La relation de Van Der Walls (1.1) [1], [4], [12] montre qu'en raison des gradients de
pression résultant essentiellement des différences de températures d'un point à un autre du
globe, les masses d'air se déplacent dans toutes les directions constituant ainsi le phénomène
du vent.
 n 2 
2 
 v
P  v  n   nT
 v  (1.1)
Où :
- 𝑃𝑣 est la pression dans le volume 𝑣 ;
- 𝑛 est le nombre total de moles ;
- 𝑣 est le volume total de gaz ;
- 𝛼 et 𝛽 sont des caractéristiques du gaz ;
- ℜ est la constante de BOLTZMANN des gaz parfaits ;
- 𝑇 est la température de l’ensemble du volume 𝑣.
La génération et le mouvement du vent sont compliqués en raison d'un certain nombre de

facteurs. Parmi eux, les facteurs les plus importants sont l’ensoleillement inégal de la terre,
la force de Coriolis dû à la rotation de la terre, et les conditions géographiques locales.

1.3.1. Ensoleillement inégal de la terre
Parmi tous les facteurs affectant la production d'énergie éolienne, le rayonnement solaire
inégal sur la surface de la terre est le plus important et le plus critique. L'inégalité du
rayonnement solaire peut être attribuée à quatre raisons qui sont :
- L’équateur reçoit une quantité plus importante d’énergie solaire par unité de
surface que les pôles, du fait que la terre est une sphère qui tourne autour du soleil
dans le même plan que son équateur. Il en résulte un gradient de pression des
pôles à l’équateur, et donc un mouvement d’air.
- L’inclinaison de l’axe de la terre d’environ 23.5 par rapport à son plan écliptique.
- La différence du taux d’absorption ou de réflexion du rayonnement solaire des
matériaux sur la surface de la terre.
- La surface topographique de la terre entraine un rayonnement solaire différent
sur les côtés ensoleillés et ombragés.
1.3.2. La force de Coriolis

La rotation de la Terre est un autre facteur important affectant la direction du vent et sa
vitesse. La force de Coriolis, qui est générée par la rotation de la Terre, dévie la direction
des mouvements atmosphériques.
Dans l’hémisphère nord, le vent est dévié à droite et dans l’hémisphère sud à gauche. La
force de Coriolis dépend de la latitude ; il est nul à l'équateur et atteint les valeurs maximales
aux pôles. De plus, la déformation du vent dépend aussi de la vitesse du vent ; plus le vent
souffle fort, plus il est dévié [52].
1.3.3. La géographie locale

Dans les basses couches de l’atmosphère (au-dessous de 1000m), la friction de l’air contre
la surface du terrain influence la vitesse du vent. L’écoulement de celui-ci dépend alors des
obstacles rencontrés (rugosité du terrain) et des contours du paysage, lesquels peuvent créer
des turbulences et dégrader la productivité ou, au contraire, donner lieu à des effets

accélérateurs : effet de tunnel ou de colline.
1.4. Les caractéristiques de l’énergie éolienne

L'énergie éolienne est une forme particulière d'énergie cinétique dans l'air lorsqu'il s'écoule.
L'énergie éolienne peut être soit converti en énergie électrique par des machines de
conversion de puissance ou directement utilisé pour pomper l'eau…
1.4.1. Puissance éolienne

L'énergie cinétique existe chaque fois qu'un objet d'une masse donnée est en mouvement
de translation ou de rotation. Lorsque l'air est en mouvement, l'énergie cinétique de l'air
peut être déterminée par la relation (1.2).
1 2
Ec  mv (1.2)
2
Où :
- 𝑚 est la masse d'air ;

- 𝑣 la vitesse moyenne du vent sur une période de temps appropriée.
La puissance éolienne peut être obtenue en différenciant l'énergie cinétique de la relation

(1.2) du vent par rapport au temps. On obtient la relation (1.3).
1 2
Pw  mv (1.3)
2
Cependant, seule une petite partie de l'énergie éolienne peut être convertie en puissance
électrique. Lorsque le vent traverse une éolienne et entraîne les lames, le débit massique du
vent correspondant est donné par la relation (1.4).
m   Av (1.4)
Où :
-  est la densité de l'air ;
- A est la surface balayée par les pales ;

En substituant (1.4) dans (1.3), la puissance disponible dans le vent 𝑃𝑤 peut être exprimée
par la relation (1.5).
1
Pw   Av 3 (1.5)
2
La relation (1.5) révèle qu’une grande puissance éolienne nécessite une vitesse de vent plus
élevée, une plus grande longueur des pales pour obtenir une plus grande zone de balayage,
et une densité de l'air plus élevée. On voit également que la production d'énergie éolienne
est proportionnelle à la puissance cubique de la vitesse moyenne du vent, une petite
variation de la vitesse du vent peut entraîner un grand changement dans l'énergie éolienne.
1.4.1.1. Zone de balayage des pales

Comme le montre la Figure 1.1, la zone balayée par les pales peut être calculée à partir de
la relation (1.6).
A    l  r   r 2    l 2  2r 
2
 
(1.6)
Où :
- 𝑙 est la longueur des pales ;
- 𝑟 est le rayon du moyeu.
Ainsi, en doublant la longueur des lames de vent, la zone balayée peut être augmentée par
le facteur 4.

Figure 1.1: Surface de balayage des pales [52]
1.4.1.2. Densité de l’air

Un autre paramètre important qui affecte directement la production d'énergie éolienne est
la densité de l'air, qui peut être calculée à partir de l'équation d’état exprimée par la relation
(1.7).
pV  nRT (1.7)
où :
- 𝑝 est la pression d'air locale en pascal ;
- V est le volume en m3 ;
- R est la constante de gaz (287 J / kg.K pour l'air) ;
- T est la température de l'air locale en K.
La densité, nombre de moles par unité de volume est donnée par la relation (1.8).
p
 (1.8)
RT
1.4.1.3. Densité de puissance éolienne

La densité de l'énergie éolienne est un indice complet de l'évaluation de la ressource
éolienne sur un site particulier. C'est la puissance éolienne disponible dans le flux d'air à

travers une zone d'unité transversale perpendiculaire dans une période de temps unitaire.
Les classes de la densité de puissance du vent à deux hauteurs de mesure de vent standard
sont énumérées dans Tableau 1.1.
Tableau 1.1: Densité de puissance
Classe de 10 m de hauteur 50 m de hauteur

densité de Densité de Vitesse Densité de Vitesse
puissance puissance moyenne du puissance moyenne du
éolienne vent (m/s) éolienne vent (m/s)
(W/m2) (W/m2)
1 <100 <4,4 <200 <5,6
2 100-150 4,4-5,1 200-300 5,6-6,4
3 150-200 5,1-5,6 300-400 6,4-7,0
4 200-250 5,6-6,0 400-500 7,0-7,5
5 250-300 6,0-6,4 500-600 7,5-8,0
6 300-350 6,4-7,0 600-800 8,0-8,8
7 >400 >7,0 >800 >8,8
1.4.2. Les caractéristiques du vent

Le vent varie avec les emplacements géographiques, l'heure du jour, la saison et la hauteur
au-dessus la surface de la terre, la météo et les formes de relief locales. La compréhension
des caractéristiques du vent aidera à optimiser la conception des éoliennes, à développer
des techniques de mesure de vent, et à sélectionner des sites de parcs éoliens.
1.4.2.1. La vitesse du vent

La vitesse du vent est l'une des caractéristiques les plus critiques de la production d'énergie
éolienne. En fait, la vitesse du vent varie à la fois dans le temps et dans l'espace, déterminée
par de nombreux facteurs tels que les conditions géographiques et météorologiques. Les
données de vitesse du vent mesurées sont généralement traitées par les méthodes
statistiques.
1.4.2.2. Distribution de Weibull
La variation de la vitesse du vent sur un site particulier peut être mieux décrite en utilisant
la fonction distribution de Weibull [51], qui illustre la probabilité de différentes vitesses
moyennes du vent se produisant sur le site pendant une période de temps. La distribution
de Weibull est donnée par la relation (1.9).
 k   v k 1   v 
k
 . exp      v0
f(v)   c   c    c  (1.9)

0 v0
où :
- 𝑐 est le facteur d'échelle qui est étroitement lié à la vitesse moyenne du vent ;
- 𝑘 est le facteur de forme qui est une mesure de la largeur de la distribution.
Ces deux paramètres peuvent être déterminés à partir de l'analyse statistique des données
de vitesses du vent mesurées sur le site [52].
1.4.2.3. La turbulence
La turbulence du vent est la fluctuation de la vitesse du vent dans des échelles de temps
courtes, en particulier pour la composante de vitesse horizontale.
La turbulence du vent a un fort impact sur la fluctuation de la puissance de l’aérogénérateur.

La turbulence lourde peut générer de grandes charges de fatigue dynamiques agissant sur
l’aérogénérateur et ainsi réduire la durée de vie prévue de ce dernier.
Dans la sélection des sites de parcs éoliens, la connaissance de l'intensité de la turbulence

éolienne est cruciale pour la stabilité de la production d'énergie éolienne.
1.4.2.4. La direction du vent

La direction du vent est l'une des caractéristiques du vent. Les données statistiques des
directions du vent sur une longue période de temps sont très importantes dans la sélection
du site du parc éolien et la disposition des éoliennes dans le parc éolien.

1.4.2.5. Le cisaillement du vent
Le cisaillement du vent est un phénomène météorologique dans lequel la vitesse du vent
augmente avec l’altitude. L'effet de la hauteur sur la vitesse du vent est principalement dû
à la rugosité à la surface de la Terre et peut être estimée en utilisant l’équation de puissance
de Hellmann exprimée par la relation (1.10), équation qui relie les vitesses du vent à deux
hauteurs différentes [46].

 z 
v( z )  v( z0 ).   (1.10)
 z0 
où :
- 𝑧 est la hauteur au-dessus de la surface de la terre ;

- 𝑧0 est la hauteur de référence pour laquelle 𝑣 (𝑧0 )vitesse du vent est connue ;
- 𝛼 est le coefficient de cisaillement du vent.
En pratique, 𝛼 dépend d'un certain nombre de facteurs, y compris la rugosité de

l'environnement, le paysage, la hauteur, l'heure du jour, la saison et les lieux. Le coefficient
de cisaillement du vent est généralement plus faible le jour et plus élevé la nuit. Les résultats
empiriques indiquent que le cisaillement du vent suit souvent la "loi de puissance 1/7"
(c'est-à-dire 𝛼 = 1/7) [49].
1.4.3. Les classes de vent

On catégorise les vents selon diverses échelles (tableau 1.2). Il est à noter que les vitesses
terrestres et maritimes ne sont pas équivalentes. La vitesse s’exprime en kilomètre à
l’heure ou en nœuds.
Tableau 1.2 : Les classes de vent
Vitesse
Force Vitesse
Termes en Etat de la mer Effets à terre
(BF) en km/h
nœuds
La mer est comme un La fumée monte
0 Calme <1 <1
miroir verticalement

Très légère La fumée indique la
1 1-3 1-5 Quelques rides
brise direction du vent
On sent le vent sur le
Vaguelettes ne
2 Légère brise 4-6 6-11 visage, les feuilles
déferlant pas
bougent
Les drapeaux flottent
Petite brise Les moutons bien. Les feuilles sont
3 7-10 12-19
(vent faible) apparaissent sans cesse en
mouvement
Les poussières
Jolie brise (vent Petites vagues,
4 11-15 20-28 s’envolent, les petites
modéré) nombreux moutons
branches plient
Vagues modérées, Les petits arbres
Bonne brise moutons, balancent. Les
5 16-20 29-38
(vent assez fort) éventuellement sommets de tous les
embruns arbres sont agités
Crête d’écume
Vent frais (vent On entend siffler le
6 21-26 39-49 blanche, lame,
fort) vent
embruns
Tous les arbres
Grand vent frais Trainées d’écume,
7 27-33 50-61 s’agitent. Efforts pour
(vent très fort) lames déferlantes
marcher contre le vent
Quelques branches
Coup de vent Tourbillons d’écumes
cassent. La marche
8 (vent 34-40 62-74 à la crête des lames,
contre le vent est
tempétueux) trainées d’écume
difficile
Lames déferlantes
Le vent peut
Fort coup de grosses à énormes,
9 41-47 75-88 endommager les
vent visibilité réduite par
bâtiments
les embruns
Très grosses lames à
Rare sur les terres.
10 Tempête 48-55 89-102 longue crête en
Gros dégâts
panache. Surface des

eaux blanches.
Visibilité réduite
Lames
exceptionnellement
Violente hautes. Mer recouverte Très rare sur les terres.
11 56-63 103-117
tempête de bancs d’écume Très gros dégâts
blanche. Visibilité
réduite
Air plein d’écume et
d’embruns. Mer
Très rare sur les terres.
12 Ouragan > 63 > 117 entièrement blanche.
Dégâts très importants
Visibilité fortement
réduite
1.5. Aérogénérateurs
Un aérogénérateur, encore appelé une éolienne est une machine de conversion d'énergie qui
convertit l’énergie cinétique du vent en énergie mécanique, puis cette dernière en énergie
électrique. Dans les trois dernières décennies, des progrès remarquables dans la conception
des éoliennes ont été réalisés avec les développements technologiques modernes.
Divers concepts d'éoliennes ont été développés et construits pour maximiser la production
d'énergie éolienne, minimisant le coût de la turbine, et augmentant l’efficacité et la fiabilité
des turbines.
1.5.1. Configuration d’une éolienne

La plupart des grandes éoliennes modernes sont des turbines à axe horizontal, à trois pales.
Comme le montre la figure 1.2, une éolienne est composée d'une nacelle positionnée au-
dessus d'un mat, abritant la plupart des composants de l’éolienne. Trois pales (non
illustrées) montées sur le moyeu. L’ensemble pales et moyeu forme le rotor. Ce dernier est
connecté via l'arbre principal à la boîte de vitesse.

Le rotor du générateur est connecté à l'arbre de sortie de la boîte de vitesses. Ainsi, la vitesse
de rotation lente du moyeu est élevée à une vitesse de rotation élevée désirée du rotor du
générateur.
En utilisant le système de contrôle de tangage, chaque pale est inclinée individuellement

pour optimiser l'angle d'attaque de la pale pour permettre une capture d'énergie plus élevée
en fonctionnement normale et pour protéger les composants de la turbine (pales, mat, etc.)
contre les dommages dans les situations d'urgence. Avec les informations de retour telles
que la direction instantanée du vent et la vitesse de la girouette, le système de contrôle de
lacet fournit le contrôle d'orientation du lacet pour garder constamment la turbine face au
vent.
Figure 1.2: Configuration d'un aérogénérateur [52]
1.5.2. Classification des aérogénérateurs

Les aérogénérateurs peuvent être classés en fonction de la configuration du générateur, du
chemin d'écoulement de l'air par rapport au rotor de la turbine, de la capacité de la turbine,
du mode d'alimentation et de l'emplacement de l'installation de l’aérogénérateur.
1.5.2.1. Eoliennes à axe horizontal et a axe vertical

En considérant la configuration de l'axe de rotation des pales de rotor, les éoliennes peuvent
être classées à axe horizontal ou à axe vertical. La plupart des éoliennes commerciales
appartiennent aujourd'hui au type à axe horizontal, dans lequel l'axe de rotation des pales
est parallèle au flux du vent. Les avantages de ce type d'éoliennes comprennent le
rendement élevé de la turbine, haute densité de puissance et faible coût par unité de
puissance de sortie. Les pales des éoliennes à axe vertical tournent par rapport à leurs axes
verticaux perpendiculaires au sol. Un avantage significatif de l'éolienne à axe vertical est
que la turbine peut accepter le vent de n'importe quelle direction et donc aucun contrôle de
lacet n'est nécessaire.
1.5.2.2. Eoliennes à vent ascendant et descendant

Selon sur la configuration du rotor par rapport à la direction du vent, les éoliennes à axe
horizontal peuvent être classées à vent ascendant ou descendant. La majorité des éoliennes
à axe horizontal sont des éoliennes à vent ascendant. Le principal avantage des conceptions
à vent ascendant est d'éviter la distorsion du champ d'écoulement comme le vent passe à
travers le mat et la nacelle. Pour une éolienne descendant, le vent souffle d'abord à travers
la nacelle et le mat puis les pales du rotor.
1.5.2.3. Capacité de l’éolienne

Les éoliennes peuvent être divisées en un certain nombre de grandes catégories en vue de
leur capacité nominale : micro, petites, moyennes, grandes et très grandes éoliennes.
Il est accepté qu'une turbine dont la puissance nominale est inférieure à plusieurs kilowatts
puisse être catégorisée comme micro-éolienne [17]. Les micro-éoliennes ont besoin de
vitesses de démarrage relativement bas et fonctionnent à des vitesses de vent modérées, les
petites éoliennes se réfèrent généralement aux turbines avec une puissance de sortie
inférieure à 100 kW [14], les éoliennes les plus courantes ont des tailles moyennes avec des
puissances nominales de 100 kW à 1 MW, les éoliennes de type 1 MW jusqu'à 10 MW
peuvent être classées en tant que grandes éoliennes et enfin Les éoliennes de très grande
taille sont référées aux éoliennes d'une capacité supérieure à 10 MW.

1.5.2.4. Eoliennes à entrainement direct et à engrenages
Selon la condition d’entrainement dans un système de générateur, les éoliennes peuvent
être classées comme éolienne à entraînement direct ou à engrenages. Pour augmenter la
vitesse de rotation du rotor afin d’obtenir une puissance plus élevée, une éolienne à
engrenages utilise généralement une boîte de vitesses. Les avantages du générateur à
engrenages incluent un coût inférieur, une taille et un poids plus petits. Cependant,
l'utilisation d’une boîte de vitesses peut réduire considérablement la fiabilité de l'éolienne
et augmenter le niveau de bruit de l’éolienne et les pertes mécaniques.
Dans les aérogénérateurs à entrainement direct, l'arbre de générateur est directement relié
au rotor Par conséquent, le concept d'entraînement direct est plus supérieur en termes
d'efficacité énergétique, de fiabilité et de conception simplifié.
1.5.2.5. Éoliennes en réseau et hors réseau

Les éoliennes peuvent être utilisées pour des applications en réseau ou hors réseau. La
plupart des éoliennes de taille moyenne et presque toutes les grandes éoliennes sont utilisées
dans des applications liées au réseau. L'un des avantages évidents pour les systèmes
d'éoliennes en réseau est qu'il n'y a pas de problème de stockage d'énergie.
1.5.2.6. Éoliennes terrestres et marines

Les éoliennes terrestres ont une longue histoire de développement. Leurs avantages sont, le
coût inférieur des fondations, l'intégration plus facile avec le réseau électrique, le coût
inférieur dans la construction du tour et de l’aérogénérateur, l’installation, et un accès plus
commode pour les opérations et la maintenance.
Les éoliennes en mer ont une excellente ressource éolienne en termes d'intensité de l'énergie
éolienne et de continuité. Une éolienne installée en mer peut produire une puissance plus
élevée et fonctionner plus d'heures chaque année par rapport à la même turbine installée sur
terre.

1.5.3. Les paramètres de l’énergie éolienne
Le dimensionnement des parcs éoliens doit tenir compte de certains paramètres : le
coefficient de puissance, la limite de Lanchester-Betz, la courbe de puissance des
aérogénérateurs…
1.5.3.1. Coefficient de puissance

La conversion de l'énergie éolienne en énergie électrique implique principalement deux
étapes : dans la première étape, l'énergie cinétique dans le vent est convertie en énergie
mécanique pour mouvoir l'arbre de l’éolienne. Les dispositifs de conversion à ce stade sont
les pales. Pour maximiser la capture de l'énergie éolienne, les pales doivent être
soigneusement conçues.
Le coefficient de puissance 𝐶𝑝 traite de l'efficacité de conversion dans cette première étape,

défini comme le rapport de la puissance mécanique réellement capturée par les pales à la
puissance disponible dans le vent comme la relation (1.11).
Pmec Pmec
Cp   (1.11)
Pw 1
 Av 3
2
L’existence de diverses pertes aérodynamiques dans les systèmes d'éoliennes, entraine un
coefficient de puissance Cp beaucoup plus bas que sa limite théorique, allant généralement
de 30 à 45% [49].
Dans la deuxième étape, l'énergie mécanique capturée par les pales est encore convertie en
énergie électrique via un générateur. A ce stade, l'efficacité de conversion est déterminée
par plusieurs paramètres dus aux pertes de puissance dans la boite de vitesse, pertes
mécaniques et électriques dans le générateur.
1.5.3.2. Limite de Betz

L'efficacité maximale théorique d'une éolienne idéale a été déterminée par l’allemand
Albert Betz [6] en 1920. Il a été révélé qu'aucune éolienne ne pouvait convertir plus de
16/27 (59,26%) de l'énergie cinétique du vent en énergie mécanique.
En effet, Considérons le système éolien à axe horizontal représenté sur la figure 1.3 sur
lequel on a représenté la vitesse 𝑣1 du vent en amont de l'aérogénérateur et la vitesse 𝑣2 en
aval.
En supposant que la vitesse du vent traversant le rotor est égale à la moyenne entre
la vitesse du vent non perturbé à l'avant de l'éolienne 𝑣1 et la vitesse du vent après
𝑣1 +𝑣2
passage à travers le rotor 𝑣2 , soit , la masse d'air en mouvement de densité 𝜌 traversant
2
la surface 𝐴 balayée des pales en une seconde est donnée par la relation (1.12).
 A  v1  v2 
m
2 (1.12)
Figure 1.3: Tube de courant d’air autour d’un aérogénérateur [2]
La puissance 𝑃𝑚 [relation (1.13)] alors extraite, s'exprime par la moitié du produit de

la masse et de la diminution de la vitesse du vent (seconde loi de Newton).
m  v12  v22 
Pm 
2 (1.13)
Soit en remplaçant 𝑚 par son expression (1.12), la relation (1.13) devient (relation (1.14)).
 A  v1  v2   v12  v22 
Pm 
4 (1.14)

Un vent théoriquement non perturbé traverserait cette même surface 𝐴 sans
diminution de vitesse, soit à la vitesse 𝑣1 , la puissance 𝑃𝑚𝑡 correspondante serait
alors la puissance obtenue par la relation (1.5), soit :
1
 Av13 avec v1  v
2
Le ratio entre la puissance extraite du vent et la puissance totale théoriquement disponible
est alors donné par la relation (1.15).
 v1    v1  
2
1   1    
Pm  v2    v2  

Pmt 2 (1.15)
La représentation de la caractéristique correspondante à l'équation (1.15), sur la figure 1.4,

montre que le ratio (relation (1.15)) appelé aussi coefficient de puissance 𝐶𝑝 présente un
maxima de 16/27 soit 0,59 [2]. C'est cette limite théorique appelée limite de Lanchester-
Betz qui fixe la puissance maximale extractible pour une vitesse de vent donnée.
Figure 1.4: Coefficient de puissance

1.5.3.3. Courbe de puissance
La courbe de puissance d'une éolienne affiche la puissance de sortie de l’éolienne en
fonction de la vitesse moyenne du vent. Les courbes de puissance sont généralement
déterminées à partir des mesures sur le terrain. Comme le montre la figure 1.5, l'éolienne
commence à produire de l'énergie utilisable à un minimum de vitesse du vent, définie
comme la vitesse d'enclenchement. La puissance augmente continuellement avec
l'augmentation de la vitesse du vent jusqu'à atteindre un point saturé, auquel la puissance
de sortie atteint sa valeur maximale, définie comme la puissance de sortie nominale. En
conséquence, la vitesse à ce stade est définie comme la vitesse nominale. À la vitesse
nominale, l'augmentation de la vitesse du vent n'augmentera pas la puissance de sortie en
raison de l'activation de la commande de puissance. Lorsque la vitesse du vent devient trop
grande pour potentiellement endommager l'éolienne, l'éolienne doit s’arrêter
immédiatement. Cette vitesse du vent est définie comme la vitesse de coupure. Ainsi, les
vitesses d'enclenchement et de coupure définissent les limites de fonctionnement de
l'éolienne.
Figure 1.5: Courbe de puissance [52]

1.5.3.4. Rapport de vitesse de pointe
Le rapport de vitesse de pointe est un facteur extrêmement important dans la conception
des éoliennes, défini comme le rapport de la vitesse tangentielle à l'extrémité de la pale et
la vitesse réelle du vent, soit la relation (1.16).

l  r 
(1.16)
v
où :
- 𝑙 est la longueur des pales ;
- 𝑟 est le rayon du moyeu ;
- 𝜔 est la vitesse angulaire des pales.
Si la vitesse angulaire 𝜔 de la pale est trop petite, la plus grande partie du vent peut passer
sans être perturbée bien que la lame ait balayé la zone, rendant peu le travail utile sur les
pales. Au contraire, si 𝜔 est trop grand, les lames en rotation rapide peuvent bloquer le flux
de vent réduisant l'extraction de puissance. Par conséquent, il existe une vitesse angulaire
optimale à laquelle l'extraction de la puissance maximale est atteinte. Pour une éolienne à
𝑛 pales, la vitesse angulaire optimale peut être approximativement déterminée par la
relation (1.17), [37].
2 v
opt  (1.17)
nL
Où :
- 𝐿 est la longueur du courant d'air ascendant et descendant fortement perturbé du

rotor.
En remplaçant la relation 1.17 dans la relation 1.16, le rapport optimal de vitesse de pointe
devient la relation (1.18).
2  l  r 
opt    (1.18)
n  L 
Empiriquement, le rapport (𝑙 + 𝑟) / 𝐿 est égal à environ 2. Ainsi, pour les éoliennes à trois
pales (c'est-à-dire n = 3), 𝜆𝑜𝑝𝑡 ≈ 4 𝜋 / 3 [52].

Si la pale aérodynamique est conçue avec soin, le rapport de vitesse de pointe optimal peut
être environ 25-30% plus élevé que la valeur optimale calculée ci-dessus. Par conséquent,
une éolienne à trois pales aurait un rapport de vitesse de pointe optimal.
1.5.3.5. Facteur de capacité de l'éolienne

En raison de la nature intermittente du vent, les éoliennes ne produisent pas de la puissance
tout le temps. Ainsi, un facteur de capacité d'une éolienne est utilisé pour fournir une mesure
de la puissance réelle de l'éolienne pendant une période de temps donnée. Un facteur de
capacité raisonnable serait de 0,25-0,30 et un très bon facteur de capacité serait d'environ
0,40 [38].
1.5.4. Commandes de l’éolienne

Les systèmes de contrôle des éoliennes jouent un rôle important pour assurer le
fonctionnement fiable et sûr de l’aérogénérateur et pour optimiser la capture de l'énergie
éolienne. Les principaux systèmes de contrôle dans une éolienne sont : système
d’orientation des pales « pitch », le contrôle de décrochage « stall » (passive et active), le
contrôle de lacet « yaw ».
Dans des conditions de vitesse de vent élevée, la puissance de sortie d'une éolienne peut
dépasser sa valeur nominale. Ainsi, le contrôle de puissance est nécessaire pour maintenir
la puissance de sortie dans les fluctuations admissibles afin éviter des dommages à
l’éolienne et stabiliser la puissance de sortie. Il y a deux stratégies de contrôle principales
dans le contrôle de puissance : contrôle d’orientation des pales et contrôle de décrochage.
1.5.4.1. Système d’orientation des pales « pitch »

Le système de contrôle de tangage est une partie essentielle de l'éolienne car système règle
non seulement continuellement l’orientation des pales de l'éolienne pour améliorer
l'efficacité de la conversion de l'énergie éolienne et la stabilité de la production d'énergie,
mais sert également de système de sécurité en cas de vents forts ou situations d'urgence. Il
est nécessaire que même en cas de panne de courant du réseau, les pales du rotor soient
toujours orientées dans leurs positions optimales en utilisant soit la puissance des batteries
de secours ou des condensateurs.
Les premières techniques de contrôle actif de l’orientation des pales utilisaient des vérins
hydrauliques pour contrôler toutes les pales simultanément. Cependant, ces techniques de
contrôle de pas collectif n’ont pas pu satisfaire complètement à toutes les exigences de la
régulation de l'angle d'inclinaison des pales, en particulier pour les éoliennes de l’ordre des
MW car chaque pale subit différentes charges à différentes positions de rotation. Par
conséquent, des techniques de contrôle plus précis de chaque pale ont été développées et
mises en œuvre, permettant de contrôler les charges aérodynamiques asymétriques sur les
pales, ainsi que les charges structurelles dans les structures non rotatives tel que la flexion
latérale du mat. Dans un tel système de contrôle, chaque pale est équipée de son propre
actionneur de pas, capteurs et contrôleur.
Dans l'industrie de l'énergie éolienne d'aujourd'hui, il existe principalement deux types de

systèmes de contrôle de l’orientation des pales : systèmes à commande hydraulique et à
commande électrique.
1.5.4.2. Contrôle de décrochage « stall »

Outre le contrôle de l’orientation des pales, le contrôle du décrochage est une autre
approche pour contrôler et protéger les éoliennes. Le concept de contrôle de décrochage
repose sur la régulation de la puissance en calant les pales une fois la vitesse nominale
atteinte.
Le contrôle de décrochage peut être divisé en approches de contrôle passif et actif. Le

contrôle de décrochage passif est essentiellement utilisé dans les éoliennes dans lesquelles
les pales sont boulonnées au moyeu à un angle d'installation fixe. Dans une éolienne à
régulation passive, la régulation de puissance repose sur les caractéristiques
aérodynamiques des pales. A vitesse basse et modérée du vent, la turbine fonctionne près
de l'efficacité maximale. A vitesse haute, la turbine est automatiquement contrôlée au
moyen de pales calées à limiter la vitesse de rotation et la puissance de sortie, protégeant la

turbine des vitesses excessives du vent.
Par rapport à la commande d’orientation des pales, un système de contrôle de décrochage

passif a une structure simple et évite d'utiliser un système de contrôle complexe, conduisant
à une grande fiabilité du système de contrôle. En outre les fluctuations de puissance sont
plus faibles pour les turbines à contrôle de décrochage. Cependant, cette méthode de
contrôle présente certains inconvénients, tels que faible efficacité, l'exigence d'équipement
externe au démarrage de la turbine, plus de charges dynamiques agissant sur les pales, la
nacelle et le mat, dépendance à des freins fiables pour la sécurité de l'opération. Par
conséquent, cette technique de contrôle a été principalement utilisée pour les petites et
moyennes éoliennes. Depuis que la capacité des éoliennes est entrée dans la gamme de
puissance multi-mégawatts au cours des dernières années, le contrôle de l’orientation
(pitch) est devenu dominant sur le marché des aérogénérateurs.
La technique de contrôle de décrochage actif a été développée pour les grandes éoliennes.
Une éolienne à décrochage actif comporte des pales de décrochage associées à un système
d’orientation des pales (pitch). Comparé au contrôle de décrochage passif, le contrôle actif
fournit plus de précision dans le contrôle de la puissance de sortie et maintient la puissance
nominale à des vitesses de vent élevées. Cependant, avec l'ajout du mécanisme de contrôle
de tangage, le contrôle de calage actif augmente le coût de la turbine et diminue la fiabilité
du fonctionnement.
1.5.4.3. Contrôle du lacet

Afin de maximiser la production d'énergie éolienne et de minimiser les charges
asymétriques agissant sur les pales et le mat, une éolienne à axe horizontal doit être orientée
de sorte à avoir le rotor contre le vent en utilisant un système de contrôle de lacet actif.
Comme les systèmes de tangage (pitch), les systèmes de lacet peuvent être entraînés
électriquement ou hydrauliquement. Dans les éoliennes modernes, le contrôle du lacet est
effectué par des moteurs électriques.

1.6. Problématique de la prédiction de la vitesse du vent
D’après tout ce qui précède, on conçoit aisément que la puissance électrique d’origine
éolienne produite par un système de conversion d’énergie cinétique du vent en énergie
électrique est liée aux caractéristiques du système de conversion et à la variation temporelle
du vent [3].
Pour une bonne caractérisation du site d’exploitation de l’énergie électrique d’origine

éolienne, le choix optimal des caractéristiques du système de conversion de cette énergie
est facile.
Cependant, si les caractéristiques du système de conversion de l’énergie du vent en énergie

électrique sont connues, seule une maîtrise des variations du vent est indispensable pour
une exploitation optimale de cette énergie.
Le vent est caractérisé par sa direction et sa vitesse qui sont toutes des variables aléatoires,
imprévisibles et non linéaires.
Les systèmes de conversion de l’énergie du vent sont dotés des dispositifs pour mesurer la
direction du vent et adapter rapidement la direction de l’axe du rotor pour se placer face au
vent [28]. La direction du vent n’a donc que fort peu d’influence sur la production
d’électricité, d’autant plus que généralement, les vents ont tendance à avoir une ou deux
directions dominantes pour lesquelles la majeure partie de l’énergie est produite. Ainsi les
caractères aléatoire et imprévisible de la puissance électrique d’origine éolienne à la sortie
d’un système de conversion d’énergie du vent sont liés à la variation de la vitesse du vent.
Ainsi la question insidieuse est la suivante : « Que se passe-t-il lorsque le vent cesse de
souffler ?».
La production d’énergie éolienne, dépendante de l’intensité du vent, fortement volatile,

caractérisée par un haut degré d’incertitude, et donc une méconnaissance de la production
future d’énergie, a tendance à rendre la gestion du réseau électrique plus difficile. Afin
d’optimiser l’exploitation de cette forme d’énergie, la prévision de la ressource, et ainsi de
la puissance en sortie d’un champ éolien, est donc essentielle et ce à des horizons allant de

l’instant immédiat à quelques heures.
Il existe plusieurs méthodes qui abordent le problème de prévision des données de la vitesse
du vent par des approches statistiques. Ces dernières reposent sur une modélisation
mathématique de la série. Nous pouvons citer les travaux de Box & Jenkins [9], [23] comme
des références pour ces méthodes. Puis viennent des outils de l’apprentissage artificiel, en
anglais Machine Learning qui ont contribué dans l’appréhension des problèmes de
prédictions [8], [35].
Les outils de l’apprentissage artificiel les plus utilisés pour rendre plus prévisible la vitesse
du vent sur un site sont les réseaux de neurones, la logique floue, et le neuroflou [3], [40].
Cependant plus récemment, la technique des machines à vecteurs supports (SVM) a
également été envisagée [24], [29], [45].
Dans ce mémoire on s’intéresse à la technique des Support Vector Régression qui sont une
adaptation de l’algorithme SVM aux problèmes de régression. Les SVM (ainsi que les
SVR) sont une classe d’algorithme d’apprentissage supervisé destinée à résoudre des
problèmes de discrimination et de régression (SVR). Ils sont basés sur les mêmes principes
d’apprentissage que les réseaux de neurones, toutefois ils possèdent l’avantage d’être plus
simple à configurer. Les SVM ont rapidement été adoptés pour leur capacité à travailler
avec des données de grandes dimensions, le faible nombre d'hyper paramètres, leurs
garanties théoriques, et leurs bons résultats en pratique.
1.7. Conclusion
Ce premier chapitre, somme toute nous a permis de comprendre les techniques
d’implantation et d’exploitation d’une éolienne. Nous avons vu que pour une exploitation
optimale d’un parc éolien il faut non seulement un bon dimensionnement des
aérogénérateurs mais aussi une bonne maitrise du vent sur le site, surtout la vitesse de ce
dernier.

2. Chapitre 2 : Généralités sur la
prédiction de la vitesse du
vent
CHAPITRE 2 : GENERALITES SUR LA PREDICTION DE LA VITESSE DU VENT
2.1. Introduction
Au cours de ces dernières années, une forte augmentation de l'énergie éolienne peut être
observée. En 2015, 12 800 MW de capacité éolienne ont été installés en Europe. Il y a
maintenant 142 GW de capacité installée, dont 131 GW sont onshore et 11 GW offshore
[47]. Avec des capacités croissantes, il y a aussi une demande croissante de fiabilité et de
précision des prédictions pour diverses fins.
Dans ce chapitre, nous décrivons les applications de prédiction de la puissance éolienne,
les méthodes usuelles utilisées pour la prédiction de la vitesse du vent, nous terminerons
par les techniques des SVM qui sont celles utilisées dans le cadre de notre travail.
2.2. Les applications de la prédiction de la vitesse du vent

Diverses applications nécessitent de bonnes prédictions pour différents horizons. De
l’instant actuel t0, l'horizon de prévision ∆𝑡 indique le décalage temporel, pour lequel la
valeur de la puissance ou de la vitesse du vent doit être prédite à l'avance.
Une application importante des prévisions est le commerce de l'énergie éolienne sur les
marchés de l'électricité, ce qui n'est possible qu'avec de bonnes prévisions car l'énergie est
vendue pour des points futurs dans le temps. Sur les marchés de l'électricité, il y a tendance
vers des horizons de prévision plus courts. Il existe une demande pour les prévisions
d'horizons de quelques minutes à quelques jours.
Pour équilibrer le réseau, des prévisions précises sont également nécessaires. La tâche
primordiale de maintien en stabilité de la tension et de la fréquence dans le réseau ne peut
être gérée que lorsque les décisions concernant la capacité de réserve et de la distribution
peuvent être prises rapidement. Les parties prenantes sont les fournisseurs d’énergie ainsi
que chaque producteur d'énergie qui injecte du jus dans le réseau. Pour la planification de
l'équilibrage du réseau, de bonnes prévisions sont aussi nécessaires. En général, l'énergie
d'équilibrage ou de contrôle est utilisée pour régler les événements inattendus sur le réseau.
Un fournisseur par conséquent a besoin de savoir combien d'énergie il peut offrir pour un
certain point dans le proche avenir.

Les différents horizons de prévision sont classés dans le tableau 2.1 et des exemples
d'applications y sont donnés. Les méthodes actuellement disponibles pour ces prévisions
sont présentées au paragraphe suivant.
Tableau 2.1: Horizons et applications de la prévision [53]
Horizon Plage de temps Applications

Trading
Très court terme Quelques secondes – 30 minutes
Equilibrage réseau
Régulation de charge
Court terme 30 minutes – 6 heures Trading intra journalier
Régulation
Moyen terme 6 heures – 1 jour Optimization des prix
Planification les réserves
Long terme 1 jour-1 semaine ou plus
d’énergie, la maintenance
2.3. Revue littéraire de la prédiction de la vitesse du vent

Plusieurs méthodes ont été employées pour la prévision de l'énergie éolienne. De
nombreuses littératures ont été consacrées à l'amélioration des approches de prévision de
l'énergie éolienne par des chercheurs. Un certain nombre de méthodes de prévision de
l'énergie éolienne ont été développées et lancées sur des sites éoliens.
2.3.1. Méthode de persistance

Les modèles basés sur la persistance utilisent une hypothèse simple que la vitesse du vent
ou la puissance éolienne à un certain moment futur sera la même chose que lorsque la
prévision est faite [56].
La méthode de la persistance est en quelque sorte plus précise que d'autres méthodes de
prévision du vent à très court terme. Mais la précision de la méthode de persistance se
dégrade rapidement avec l'échelle de temps de prévision en augmentation [55].

La méthode de la persistance est non seulement la plus simple mais aussi la méthode la plus
économique en matière de prévision de vitesse du vent ou de prévision de puissance.
L'électricité utilise la méthode de la persistance pour les prévisions à très court terme. Par
conséquent, toute méthode de prévision développée doit d'abord être testée par rapport à la
méthode de référence classique de la persistance afin de vérifier si elle peut s'améliorer par
rapport aux prévisions dérivées de la persistance.
2.3.2. Modèles de prévision numérique

Les méthodes numériques basées sur la prévision météorologique sont généralement
utilisées pour prévoir la météo locale et les attributs du vent. Plusieurs progiciels de
prévision numérique du temps (NPW) ont été développés : le modèle HIRLAM (High
Resolution Local Area), le modèle hydrostatique ETA, le modèle ALADIN (Aire Limitée
Adaptation dynamique Développement international) [30] [10].
Cependant, les prévisions obtenues par les modèles de prévision numérique du temps
dépendent fortement des conditions initiales ; donc fournir une prévision d'ensemble
augmente la fiabilité de la prédiction.
Malheureusement, l'utilisation de méthodes basées sur la prévision numérique exige une

grande puissance de calcul, et même avec de bonnes données d'entrées, en raison du
comportement chaotique, il n'est habituellement pas possible de prévoir les attributs du vent
au-delà de quelques semaines. En général, ce modèle fonctionne bien à long terme, mais
les prédictions à court terme sont inférieures à celles d'autres méthodes.
Étant donné que la méthode de NPW sert de plate-forme pour la prévision de l'état
météorologique futur, la sortie pourrait être traitée davantage pour obtenir des estimations
plus fines en ce qui concerne les attributs du vent. À cet égard, Cassola et Burlando [11]
appliquent la méthode de filtrage de Kalman pour améliorer les prévisions de vitesse du
vent et d'énergie éolienne à très court terme.

2.3.3. Prévision d'ensemble

La prévision d'ensemble utilise un certain nombre d'exécutions de différents modèles pour
prédire un large échantillon de résultats météorologiques futurs possibles. Les résultats sont
ensuite évalués en examinant la distribution de tous les « membres » de l'ensemble des
variables de prévision. Une autre approche d'ensemble est l'approche multi modèle, qui
utilise un certain nombre de modèles de prévision numérique du temps pour produire un
ensemble [22]. Il est appelé une méthode multi-NWP. Les membres de l'ensemble
proviennent de différentes variantes du même modèle de NPW (comme différents
paramétrages physiques des processus physiques de la sous-grille, ou différentes conditions
initiales, ou différentes techniques d'assimilation des données). Ils peuvent également
provenir de modèles de NPW complètement différents. Une caractéristique intéressante de
la prévision d'ensemble réside dans le fait qu'elle fournit également une estimation de la
fiabilité de la prévision. L'idée est que lorsque les différents membres de l'ensemble
diffèrent largement, la prévision est affectée par une grande incertitude ; quand il y a un
accord plus étroit entre les prévisions des membres de l'ensemble, l'incertitude dans la
prédiction est plus faible.
2.3.4. Méthodes physiques

La méthode physique est basée sur la prévision numérique du temps (NPW) en utilisant la
prévision météorologique des données telles que la température, la pression, la rugosité de
surface et les obstacles. Le modèle de NPW est développé par les météorologues pour les
prévisions météorologiques à grande échelle [34]. Les méthodes physiques sont à
augmenter la résolution réelle du modèle de NPW afin d'obtenir une prévision précise. Les
méthodes physiques sont effectuées sur les supercalculateurs car ils ont besoin de beaucoup
de calculs.
Les systèmes physiques utilisent des paramètres basés sur une description physique
détaillée de l'atmosphère, pour atteindre la meilleure précision de prédiction.
Habituellement, la vitesse du vent donnée par le service météorologique sur une grille
grossière est transformée aux conditions sur place à l'emplacement du parc éolien.

Les méthodes actuelles de prévision de l'énergie éolienne commerciale utilisent les

prévisions de vent de la NPW comme données d'entrée. Les systèmes physiques, en utilisant
les données d'entrée de la NPW, effectuent le raffinement nécessaire de ces données de
sortie (vitesse du vent prévision) aux conditions sur site par des méthodes basées sur la
physique de la limite atmosphérique inférieure couche.
Un certain nombre d'approches physiques ont été introduites. Le Prediktor est développé
par Risoe National Laboratory au Danemark. Il utilise WAsP (Wind Atlas Analysis and
Application Program) et le programme PARK pour prendre en compte les conditions
locales en utilisant les NPW de HIRLAM (High Resolution Limited Area Model). Le
Previento, développé par l'Université d'Oldenburg en Allemagne a un approche physique
similaire, mais utilise les NPW de Lakelmodell du Service météorologique allemand. Le
LocalPred est développé par CENER (National Renewable Energy Centre) en Espagne. Le
eWind, développé par AWS TrueWind Inc. aux États-Unis, a une approche physique
similaire avec Prediktor mais utilise un modèle de couche limite à haute résolution
(ForeWind) comme modèle de NPW pour prendre en compte les conditions locales [19].
2.3.5. Méthodes d'approche statistique et d'apprentissage

Les approches basées sur les statistiques intègrent généralement des techniques appliquées
aux données de séries chronologiques, telles que les méthodes basées sur la moyenne
mobile intégrée régressive (ARIMA). Il existe diverses implémentations de modèles basés
sur ARIMA dans la littérature, tels que des modèles fractionnaires basés sur ARIMA et des
modèles de moyenne mobile auto régressive (ARMA) pour prédire les attributs du vent
simultanément [16], [26]. Les modèles basés sur ARMA sont basés sur les vitesses ou
puissances de vent et les termes d'erreur passés.
En plus des modèles ARMA statiques traditionnels, les chercheurs ont développé des
versions dynamiques pour capturer les vitesses de vent non stationnaires inhérentes. À cet
égard, Huang et Chalabi [25] utilisent les processus de marche aléatoire intégrée lissée pour
modéliser les coefficients des paramètres du modèle. Récemment, on s'intéresse de plus en
plus à combiner les modèles ARMA traditionnels avec d'autres approches. Dans cette veine,
Liu et al. [32] développent deux approches où le modèle ARMA est lié au réseau de
neurones artificiels (ANN) et aux méthodes basées sur le filtre de Kalman. Shi combinent
ARMA avec ANN et des machines vectorielles de support (SVM) dans le même but. On
conclut que ces modèles fonctionnent bien pour la prévision de la vitesse du vent non
stationnaire dans les systèmes éoliens [44]. Les méthodes basées sur des statistiques ne sont
pas seulement limitées aux modèles ARMA. Par exemple, Liu adopte le modèle modifié de
Taylor Kriging et compare la qualité de la prévision aux approches basées sur l'ARMA
[33].
Les chercheurs ont également étudié la possibilité de mettre en œuvre des modèles ARCH
et GARCH pour modéliser la variabilité de la vitesse du vent [53]. Liu compare 10
approches ARMA-GARCH différentes pour modéliser la volatilité et conclure qu'aucun
modèle ne surpasse l'autre, et indiquer que lorsque la hauteur augmente, la puissance du
modèle diminue. Ces études sont importantes pour fournir la prévision d'intervalle et
calculer la probabilité d'exploitation des éoliennes et la production éolienne conditionnelle
prévue.
D'autre part, ANN est une technique qui a été utilisée pour mapper le (s) vecteur (s) d'entrée
aléatoire (s) aux sorties sans suppositions préalables d'une relation fixe. Le réseau de
neurones peut apprendre en fonction des données existantes, découvrir les modèles cachés
et utiliser les données passées pour en prédire les futures. Des implémentations réussies des
ANN pour la prévision de la vitesse du vent existent dans la littérature [46] [36] [42]. Li et
Shi [31] ont comparé trois ANN différents, à savoir l'élément linéaire adaptatif
(ADALINE), la rétro-propagation directe (FFBP) et la fonction de base radiale (RBF)
pendant 1 heure avant les prévisions de vitesse du vent. Le modèle a surpassé tous les autres,
et que les sites éoliens devraient être évalués en fonction de la performance de différents
ANN selon une approche au cas par cas. Bilgili et al., Utilisant une fonction de transfert
sigmoïde logistique, une fonction de transfert linéaire comme fonction d'activation, et la
propagation élastique comme approche d'apprentissage, ont développé un modèle de
prévision de la vitesse du vent basé sur les données provenant des sites voisins [7]. Kani et
Ardehali ont combiné les ANN et les modèles de chaînes de Markov pour développer une
approche combinée pour la prévision à très court terme de la vitesse du vent. L'approche
fondée sur les chaînes de Markov est utilisée pour saisir les tendances à long terme [27].
Fadare a utilisé des données sur 200 ans obtenues à partir de 28 stations au sol et a
développé un réseau de rétro propagation à trois couches, à action directe, avec différentes
configurations pour prévoir la vitesse du vent au Nigeria [20]. Il existe également d'autres
méthodes d'intelligence artificielle développées pour la prédiction de la vitesse du vent
telles que les approches basées sur la corrélation spatiale, les approches basées sur la
logique floue, les approches basées sur les transformées en ondelettes et les approches SVM
[57].
2.4. Machines à Vecteurs Support (SVM) [54]

Les Support Vector Machines souvent traduit par l’appellation de Séparateur à Vaste Marge
(SVM) sont une classe d’algorithmes d’apprentissage initialement définis pour la
discrimination.
Ils ont été ensuite généralisés à la prévision de variables quantitatives. Dans le cas de la
discrimination d’une variable dichotomique, ils sont basés sur la recherche de l’hyperplan
de marge optimale qui, lorsque c’est possible, classe ou sépare correctement les données
tout en étant le plus éloigné possible de toutes les observations. Le principe est donc de
trouver un classifieur, ou une fonction de discrimination, dont la capacité de généralisation
(qualité de prévision) est la plus grande possible.
Le principe de base des SVM consiste de ramener le problème de la discrimination à celui,

linéaire, de la recherche d’un hyperplan optimal. Deux idées ou astuces permettent
d’atteindre cet objectif :
- la première consiste à définir l’hyperplan comme solution d’un problème
d’optimisation sous contraintes dont la fonction objectif ne s’exprime qu’à l’aide de
produits scalaires entre vecteurs et dans lequel le nombre de contraintes “actives” ou
vecteurs supports contrôle la complexité du modèle.

- le passage à la recherche de surfaces séparatrices non linéaires est obtenu par

l’introduction d’une fonction noyau (kernel) dans le produit scalaire induisant
implicitement une transformation non linéaire des données vers un espace intermédiaire
(feature space) de plus grande dimension. D’où l’appellation couramment rencontrée de
machine à noyau ou kernel machine. Sur le plan théorique, la fonction noyau définit un
espace hilbertien, dit auto-reproduisant et isométrique par la transformation non linéaire de
l’espace initial et dans lequel est résolu le problème linéaire.
Cet outil devient largement utilisé dans de nombreux types d’applications et s’avère un
concurrent sérieux des algorithmes les plus performants (agrégation de modèles).
L’introduction de noyaux, spécifiquement adaptés à une problématique donnée, lui confère
une grande flexibilité pour s’adapter à des situations très diverses (reconnaissance de
formes, de séquences génomiques, de caractères, détection de spams, diagnostics...). À
noter que, sur le plan algorithmique, ces algorithmes sont plus pénalisés par le nombre
d’observations, c’est-à-dire le nombre de vecteurs supports potentiels, que par le nombre
de variables. Néanmoins, des versions performantes des algorithmes permettent de prendre
en compte des bases de données volumineuses dans des temps de calcul acceptables.
2.4.1. Le problème de discrimination binaire

Le problème abordé est celui de la discrimination binaire. Il s’agit de trouver un moyen
permettant de construire une fonction de décision associant à chaque observation sa classe.
Posons que les formes à discriminer sont des vecteurs x ϵ ℝP. Le problème de discrimination
vise à construire un estimateur de la fonction de décision idéale D : ℝP → {-1,1},
minimisant pour toutes les observations x la probabilité d’erreur. Pour construire cet
estimateur, on suppose l’existence d’un échantillon {(xi, yi), i = 1, n} (aussi appelé ensemble
d’apprentissage).
2.4.2. Les SVM linéaires

Un problème de discrimination est dit linéairement séparable lorsqu’il existe une fonction
de décision linéaire (appelé aussi séparateur linéaire), de la forme D(x) = signe (f(x)) avec
𝑓 (𝑥) = 𝑣 𝑇 𝑥 + 𝑎; v ϵ ℝP et a ϵ ℝ, classant correctement toutes les observations de

l’ensemble d’apprentissage (D (xi) = yi, i ϵ [1, n]). La fonction f est appelée fonction
caractéristique.
Une généralisation des SVM au cas des observations non séparables et non linéaires se fait
par introduction de variables d’écart et de noyaux. Ces différents types de problèmes sont
illustrés sur la figure 2.1.
A toute fonction de décision et donc aux fonctions de décision linéaire on associe une
frontière de décision (l’hyperplan) exprimée par la relation (2.1).
  v, a   x  p
| vT x  a  0 (2.1)
où :
- x est le vecteur d’entrée ;
- v le vecteur des paramètres (ou poids) ;
- a une constante.
Figure 2.1 : Quatre types de problèmes de discrimination binaire [54]
Dans le cas le plus simple de discrimination de deux classes (discrimination binaire), il est
alors décidé que x est de classe 1 si D(x) ≥ 0 et de classe -1 sinon.

L’idée est de chercher l’hyperplan le « plus sûr », celui qui passe au milieu des points des
2 classes d’exemples (le moins sensible à de petites variations des exemples), celui qui
maximalise la distance minimum (marge) à chacune des 2 classes.
2.4.2.1. Maximisation de la marge

Lorsque des observations sont linéairement séparables, il existe dans le cas général une
infinité de frontières de décision linéaires séparant cet échantillon. La notion de marge offre
un critère de choix parmi toutes ces solutions en admettant que maximiser la marge c’est
aussi maximiser la confiance et donc minimiser la probabilité d’erreur associée au
classifieur. Il existe donc un unique hyperplan optimal, [50] défini comme l'hyperplan qui
maximise la marge entre les échantillons et l'hyperplan séparateur illustré sur la figure 2.2.
Figure 2.2: Hyperplan optimal séparant les points de 2 classes
La marge est la distance entre l'hyperplan et les échantillons les plus proches. Ces derniers
sont appelés vecteurs supports.
Le problème se met sous la forme de la relation (2.2) suivante :

 
max min  dist  x ,   v, a    
i (2.2)
v ,a  i 1, n 

vT xi  a
Avec dist  xi ,   v, a    la distance d’un point quelconque xi de l’échantillon à
v
l’hyperplan et min 𝑑𝑖𝑠𝑡(𝑥𝑖 , ∆(𝑣, 𝑎)) = 𝑚 est la marge.

𝑖∈[1,𝑛]
En introduisant explicitement la marge comme une variable, ce problème se réécrit comme

un problème d’optimisation sous contraintes exprime par la relation (2.3).
max  m 
 v ,a

  vT xi  a  (2.3)
avec min  m
 i1, n   v 
 
C’est un problème mal posé dans le sens où si (v, a) est une solution, (kv, ka), pour tout
k>0 l’est aussi. Une manière de traiter cette difficulté est d’effectuer le changement de
𝑣 𝑎
variable : 𝑤 = et 𝑏 = Le problème se réécrit suivant la relation (2.4).
𝑚‖𝑣‖ 𝑚‖𝑣‖
  1 
max  
 w ,b  w  (2.4)

avec yi  w xi  b   1; i  i, n 
T
1
La marge vaut désormais ‖𝑤‖
, il s'agit donc de maximiser ‖𝑤‖−1 . La formulation dite
primale des SVM s'exprime alors sous la forme de la relation (2.5).
 1 2 
min  2 w 
 w ,b   (2.5)
avec y  w x  b   1;
T
i  i , n 
 i i
Ce problème d’optimisation peut se résoudre par la méthode classique des multiplicateurs

de Lagrange, où le lagrangien est donné par la relation (2.6).
1

w    i yi  wT xi  b   1 
n
 w, b,   
2
(2.6)
2 i 1
où les 𝛼𝑖 ≥ 0 sont les multiplicateurs de Lagrange associés aux contraintes.
Le lagrangien doit être minimisé par rapport à w et b, et maximisé par rapport à α. La

formulation duale du problème est alors exprimée par la relation (2.7).
  n 1 n 
max   i    i j yi y j  xi .x j  
  i 1 2 i , j 1 
 (2.7)
 n
avec  i  0;   i yi  0; i  1, n 
 i 1
La solution ne dépend plus alors de p mais du nombre d’exemples n et même 𝑛𝑐 le nombre

d’exemples critiques, b est calculé avec les variables primales.
La fonction de décision s’exprime alors par la relation (2.8).
 n 

 i 1

f( x)  sign   yi i  xi .x j   b 

(2.8)
Elle est influencée par les points correspondant à des 𝛼𝑖 ≥ 0. Ce sont les vecteurs de
support. Ils sont exactement sur la marge. Leur nombre est généralement petit devant le
nombre de données d’entrainement.
2.4.2.2. Le cas de données non séparables

En pratique, il est assez rare d’avoir des données linéairement séparables. Afin de traiter
également des données non linéairement séparables, la notion de la marge souple (soft
margin), a été introduite dans les SVM.
Le principe de la marge souple est d’autoriser des erreurs de classification. Des variables
ressorts (ou variables d’écart) sont introduites comme le montre la figure 2.3.

Figure 2.3: Marge souple
On obtient la formulation primale suivante du problème sous la forme de la relation (2.9)
 1 n

min  w  C  i  , C  0
2
 w ,b  2 i 1  (2.9)
i 
avec y wT x  b  1   ;   0; i  i, n 
 i i i
Sous la forme duale, le problème s’exprime par la relation (2.10).
  n 1 n 
 max  i     i j yi y j  xi .x j  
  i 1 2 i , j 1  (2.10)

avec C   i  0; i  1, n 
Le paramètre C règle le compromis entre la marge possible et le nombre d’erreurs

admissibles. Plus C est grand, plus faibles seront les valeurs de 𝜉𝑖 autorisées. Ce paramètre
C est fixé par l’utilisateur, généralement par validation croisée.
2.4.3. Le cas non linéaire : les noyaux

Dans le cas général, la frontière optimale est non linéaire. Dans le cadre des SVM, la prise
en compte des non linéarités dans le modèle s’effectue par l’introduction de noyaux non

linéaires. De manière inattendue, l’utilisation de noyaux ne modifie pas fondamentalement

la nature des SVM (pourvu que l’on travaille dans le dual).
L’idée des SVM est de reconsidérer le problème dans un espace de dimension supérieure,
éventuellement de dimension infinie. Dans ce nouvel espace, il est alors probable qu'il
existe un séparateur linéaire comme le montre la figure 2.4.
Figure 2.4: Séparation linéaire des exemples après redescription dans un espace de dimension
plus grande
Plus formellement, on applique aux vecteurs d'entrée x une transformation non-linéaire 𝜙.

L'espace d'arrivée 𝜙(𝑥) est appelé espace de redescription (Figure 2.5). Dans cet espace,
on cherche alors l'hyperplan.
Figure 2.5 : Redescription des données pour permettre une séparation linéaire

La forme duale du problème non linéaire est exprimée par la relation (2.11).
  n 


max  i  
1 n

2 i , j 1

 i j yi y j   xi  .  x j    (2.11)
 i 1 

avec C   i  0; i  1, n 
Le problème de cette formulation est qu'elle implique un produit scalaire entre vecteurs
dans l'espace de redescription, de dimension élevée, ce qui est couteux en termes de calculs.
Pour résoudre ce problème, on utilise une fonction noyau k donnée la relation (2.12).
k  xi , x j     xi  .  x j  avec xi , x j  p
(2.12)
Ainsi il n’est pas nécessaire de faire la projection 𝜙, l’espace de redescription reste virtuel.
La fonction noyau (plus facile à calculer) donne le même résultat dans l’espace d’entrée.
Ceci est appelé ’the kernel trick’. Cette fonction peut être vue comme une mesure de
similarité non linéaire.
L’expression du problème est finalement donnée par la relation (2.13).
  n 1 n 
 max  i     i j yi y j k  xi .x j  
  i 1 2 i , j 1 
 (2.13)
 n
avec C   i  0;   i yi  0;i  1, n 

 i 1
La fonction de décision, relation (2.14), est alors:
 n 
 i 1

f( x)  sign   yi i k  xi .x j   b 

 (2.14)
La difficulté qui reste à l’utilisateur est celle de choisir une fonction noyau. Il existe
quelques familles paramétrables connues (voir tableau 2.2). L’utilisateur va pouvoir choisir
une fonction par essai-erreur ou essayer de s’appuyer sur des fonctions déjà définies dans
le domaine considéré [43]. Plus la fonction prendra en compte les informations disponibles
sur le problème considéré, meilleurs devraient être les résultats.

Tableau 2.2: Les fonctions noyaux
Fonction noyau Forme fonctionnelle

𝑛
Polynomiale (𝑥𝑖 . 𝑥𝑗 + 𝑐)
2
A base radiale ‖𝑥𝑖 − 𝑥𝑗 ‖
exp (− )
𝜎2
Sigmoïde tanh(𝑎(𝑥𝑖 . 𝑥𝑗 ) − 𝑏)
2.4.4. Les SVM multiclasses

L’adaptation des SVM bi classes au cas multi classe peut se faire de trois façons différentes.
Le choix va dépendre de la taille du problème.
1- L’approche un contre tous consiste à entrainer un SVM bi classe en utilisant les

éléments d’une classe contre tous les autres. Il s’agit de résoudre de l’ordre de c
problèmes SVM chacun de taille n.
𝑐(𝑐−1)
2- L’approche un contre un : consiste à entrainer SVM sur chacun des couples
2
de classes, puis à décider la classe gagnante soit par un vote majoritaire soit en post
traitant les résultats grâce à l’estimation de probabilités a posteriori. Le nombre de
classifieurs SVM à entrainer peut être réduit en utilisant un codage astucieux pour
les classes à travers un code correcteur d’erreur ou un graphe direct acyclique.
3- L’approche globale consiste à traiter le problème en une seule fois. Le dual de ce
problème est un programme quadratique de même nature que celui des SVM et de
taille n*c. L’estimateur associé est non consistant mais donne de bons résultats en
pratique.
2.4.5. Support Vector Régression

Le principe des SVM est repris et adapté par les SVR pour modéliser un problème de
régression. Le but est d’approximer un ensemble de données (xi, yi) par une fonction f
[relation (2.15)].
f  x   wT x  b
(2.15)

Telle que |f(xi ) − yi | ≤ ε , avec i ∈ [1, n].
L’idée consiste à minimiser le terme w tout en étant sous la contrainte de ne pas dépasser
un taux d’erreur 𝜀. Du point de vue graphique, ceci revient à trouver une zone du plan qui
contient tous les exemples xi de largeur 2ε appelé tube, (voir figure 2.6). Si on considère la
minimisation de ‖𝑤‖2 on obtient le problème quadratique de la relation (2.16).
 1 2
min  2 w 
  

avec  yi  w xi  b  
T
  T
  w xi  b  yi  
(2.16)
Cette description du problème considère donc qu’une fonction linéaire f qui approxime tous
les exemples avec une précision " existe. Dans la pratique, ce n’est pas toujours le cas. En
présence de bruit trop important ou de valeurs aberrantes, il est aussi plus important
d’autoriser certaines erreurs. Dans ce cas, le concept de marge souple est utilisé. Il consiste
à introduire des variables de relâchement 𝜉𝑖 , 𝜉𝑖∗ pour rendre faisables les contraintes du
problème d’optimisation qui devient la relation (2.17).
 1 * 
min  w  C  i  i  
n
2
 2 i 1 
 (2.17)
avec  yi  w xi  b    i
T
  T
 w xi  b  yi    i
*

où 𝜉𝑖 et 𝜉𝑖∗ représentent respectivement les erreurs positives et négatives. La constante C >

0 est un hyper paramètre permettant de régler le compromis entre la quantité d’erreur
autorisé et la platitude de la fonction f. Cette formulation du problème revient à utiliser une
fonction d’erreur |𝜉 |𝜀 appelée "ε-insensible (relation (2.18)) et représentée à la figure 2.6.
0, pour y  f  x   
y  f  x    (2.18)
 y  f  x    , pour y  f  x   

On peut interpréter cette fonction comme créant un tube d’insensibilité de rayon ε autour
de la fonction f(x). Les variables 𝜉𝑖 ou 𝜉𝑖∗ représentent alors la distance selon l’axe y entre
le point (xi; yi) et le bord du tube.
Figure 2.6 : ɛ-insensible
En passant par la formulation duale et l’équation de Lagrange, la fonction obtenue peut être
écrite sous la forme de la relation (2.19).
f  x     i   i*  xiT x  b
n
(2.19)
i 1
où 𝛼𝑖 et 𝛼𝑖∗ sont les multiplicateurs de Lagrange issus de la formulation duale.
La résolution d’un problème de régression non linéaire se fait de la même façon que dans
le cas de classification. C’est-à-dire en faisant une projection des donnes d’entrées dans un
espace de dimension supérieure dans lequel le problème devient linéaire. Une projection
implicite par fonction noyaux est utilisée pour les mêmes raisons de cout en temps de calcul.
Le modèle dans le cas général est donné par la relation (2.20).
f  x     i   i*  k  xi , x   b
n
(2.20)
i 1
2.4.6. Les SVM par la pratique

Il s’agit dans cette partie d’exposer la pratique des SVM.

2.4.6.1. Réglage des hyper paramètres

Dans la méthode SVM, différents hyper paramètres apparaissent : C, qui représente le
compromis entre la complexité du modèle et l’erreur sur les données d’apprentissage ; ε,
qui correspond à la largeur du tube d’insensibilité ; les Eventuels paramètres de la fonction
noyau k (σ, γ, . . .). Ces hyper paramètres sont en général réglés en fonction d’une estimation
de l’erreur de généralisation qui peut être évaluée sur un jeu indépendant de données de
validation ou par validation croisée [21]. Cela implique de réaliser l’apprentissage pour
différentes valeurs et d’estimer leurs performances. Dans le cas d’une estimation de l’erreur
de généralisation par validation croisée, cette procédure peut se révéler très couteuse en
temps de calcul.
D’autres approches permettent d’optimiser le réglage des hyper paramètres. Certaines sont
basées sur des méthodes évolutionnistes, d’autres sur une recherche par descente de
gradient.
2.4.6.2. Réglage automatique du tube : υ-SVM

La largeur du tube d’insensibilité " peut être réglé en considérant le niveau de bruit contenu
dans les données. En effet, celui-ci détermine le niveau d’erreur qui ne sera pas prise en
compte par l’algorithme. Si le modèle du bruit était disponible, le problème d’identification
se résumerait à appliquer la méthode du maximum de vraisemblance pour obtenir le
meilleur estimateur. Mais en pratique, les connaissances sur le bruit sont généralement très
limitées.
Il existe néanmoins une technique, appelée υ-SVR, permettant de construire un SVM qui
ajuste automatiquement la largeur du tube d’insensibilité. Elle consiste à ajouter un terme
dans la formulation du problème d’optimisation pour tenter de minimiser l’erreur. Le
problème est donc reformulé ainsi par la relation (2.21).

 1  n 
 min  w
2
 C    i  i*   N  
 2  i 1 
  yi  wT xi  b    i

avec  wT x  b  y     *
  i i i
 
i , i  0
*
 (2.21)
Avec υ > 0.
2.4.6.3. Algorithmes et optimisation

L’implémentation des SVM tant pour la classification que pour la régression consiste à
déterminer les αi multiplicateurs de Lagrange optimaux. Si le nombre d’exemples est
modeste (de l’ordre de 1000), les méthodes classiques de programmation quadratique tel
que les méthodes quasi-Newton [5] ou les méthodes du point intérieur [39], peuvent être
utilisées. Si par contre le nombre d’exemples est important (le cas habituel), des méthodes
d’optimisation sont indispensables pour résoudre le problème en un temps acceptable.
En pratique, quand n est élevé, deux problèmes se posent : premièrement la taille de la

matrice du noyau qui devient insupportable par la mémoire principale, deuxièmement le
temps de recherche des αi optimaux est exhaustif. Pour résoudre ces problèmes, plusieurs
méthodes ont été développées :
La méthode de shnuking [18], effectue l’entrainement sur un nombre limité d’exemples,

choisis par une heuristique, puis ajoute itérativement les autres jusqu’à atteindre
l’hyperplan optimal. Parmi les implémentations classiques de cette méthode on trouve le
SVMlight [48].
La méthode SMO (Sequential Minimal Optimisation), est la méthode la plus utilisée

actuellement, elle consiste à optimiser à chaque itération, deux αi conjointement. Le point
fort de l’algorithme est que l’optimisation des deux multiplicateurs choisis se fait
analytiquement, ce qui réduit considérablement le temps d’entrainement.

En plus, l’algorithme ne fait aucune opération matricielle et n’a pas besoin de maintenir la
matrice du noyau en mémoire. Divers packages d’implémentation du SMO peuvent être
trouvés dans la littérature, particulièrement LIBSVM [13].
2.5. Conclusion
Nous avons, dans ce chapitre, vu quelques méthodes utilisées pour prédire la vitesse du
vent. De la méthode de la persistance aux méthodes de Machine Learning, plusieurs études
ont été consacrées à la prédiction de la vitesse du vent prouvant ainsi la nécessité de
prédiction pour les centrales éoliennes. Nous avons vu les bases théoriques et pratiques des
techniques de SVR.

3. Chapitre 3 : analyse et
discussions des résultats et
étude économique
ECONOMIQUE
3.1. Introduction
Dans ce chapitre, il sera question dans un premier temps de faire une application des
algorithmes des SVM vus chapitre précédant pour prédire la vitesse du vent. Ensuite, les
performances des différents modèles seront présentées en vue de dégager le meilleur
modèle à partir de la base des critères de performance qui sont présentés plus loin. Enfin,
nous ferons une analyse suivie d’une discussion des résultats.
3.2. Environnement
Cette étude a été fait en utilisant les outils suivants : les programmes ont été écrits en python,
en utilisant des librairies tels que, NumPy pour la gestion de grands tableaux, matplotlib
pour générer les graphiques, scikit-learn pour les fonctions d’apprentissage automatique…
3.2.1. Pythons
Depuis sa première apparition en 1991, créé par Guido van Rossum, Python est devenu l'un
des langages de programmation interprétés les plus populaires, avec Perl, Ruby, et d'autres.
Python et Ruby sont devenus particulièrement populaire depuis 2005 ou plus pour la
création de sites Web utilisant leur nombreux frameworks web, comme Rails (Ruby) et
Django (Python). Ces langues sont souvent appelés langages de script, car ils peuvent être
utilisés pour écrire rapidement de petits programmes, ou des scripts pour automatiser
d'autres tâches. À la fin de ses 10 ans d’existence, Python est passé d'un point de vue
scientifique à la pointe de la technologie faisant du langage l'une des langages les plus
importantes pour la science des données, le Machine Learning, et le développement de
logiciels généraux dans les universités et l'industrie.
Pour l'analyse de données, l'informatique interactive et la visualisation de données, Python

fera inévitablement concurrence avec d'autres langages de programmation open source et
commerciale et des outils largement utilisés, tels que R, MATLAB, SAS, Stata et autres.
Au cours ces dernières années, le développement des bibliothèques (telles que pandas et
scikit-learn) a fait de python un choix populaire pour les tâches d'analyse de données.

ECONOMIQUE
Pour notre travail nous avons utilisé l’environnement de développement Anaconda dans sa
version 4.4.0 disponible à l’adresse http//continuum.io/downloads. Anaconda 4.4.0 offre la
possibilité de programmer dans deux versions de python soit Python 2.7 et Python 3.6.
3.2.2. Pandas
La librairie pandas fournit des structures de données de haut niveau et des fonctions conçues
pour rendre le travail avec des données structurées ou tabulaires rapide, facile et expressif.
Cela a permis à Python d'être un environnement d'analyse de données puissant et productif.
Les objets primaires de pandas sont le DataFrame, une structure de données tabulaire,
orientée colonne, avec des étiquettes de ligne et de colonne.
Pandas allie les idées performantes de NumPy en matière de calcul matriciel et les capacités
de manipulation de données de tableurs et de bases de données relationnelles (telles que
SQL). Il fournit une fonctionnalité d'indexation sophistiquée pour le rendre facile à
remodeler, découper, effectuer des agrégations et sélectionner des sous-ensembles de
données. Depuis la manipulation des données, la préparation et le nettoyage est une étape
importante dans l'analyse des données, pandas est l'un des les principaux outils que nous
avons utilisés.
3.2.3. NumPy
NumPy, abréviation de Numerical Python, a longtemps été la pierre angulaire des calculs
numériques en Python. Il fournit les structures de données, les algorithmes et la colle de
bibliothèque nécessaires pour la plupart des applications scientifiques impliquant des
données numériques en Python. NumPy contient, entre autres :
- Un objet tableau multidimensionnel rapide et efficace ndarray.
- Fonctions pour effectuer des calculs par éléments avec des tableaux ou des
opérations mathématiques entre les tableaux.
- Outils pour lire et écrire des ensembles de données sur disque.
- Opérations d'algèbre linéaire, transformée de Fourier et génération de nombres
aléatoires.

ECONOMIQUE
- Une API C pour permettre aux extensions Python et code natif C ou C ++

d'accéder aux structures de données de NumPy.
Au-delà des capacités de traitement de tableaux rapides que NumPy ajoute à Python, l'un
de ses utilisations principales dans l'analyse des données sont comme un conteneur pour les
données à transmettre entre algorithmes et bibliothèques. Pour les données numériques, les
tableaux NumPy sont plus efficaces pour le stockage et la manipulation des données que
les autres structures de données Python intégrées. Aussi, les bibliothèques écrites dans un
langage de niveau inférieur, comme C ou Fortran, peuvent fonctionner sur les données
stockées dans un tableau NumPy sans copier les données dans une autre représentation de
la mémoire.
3.2.4. Matplotlib
Matplotlib est la bibliothèque Python la plus populaire pour la production de graphiques et
d'autres visualisations de données bidimensionnelles. Il est conçu pour créer des courbes
adaptées pour la publication. Bien qu'il existe d'autres bibliothèques de visualisation
disponibles sous Python, matplotlib est le plus largement utilisé et en tant que tel a
généralement une bonne intégration avec le reste de l'écosystème.
3.2.5. SciPy
SciPy est une collection de paquets abordant un certain nombre de problèmes standard de
différents domaines scientifiques. Voici un échantillon des paquets inclus :
- scipy.integrate : Routines d'intégration numérique et solveurs d'équations
différentielles.
- scipy.linalg : Les routines d'algèbre linéaire et les décompositions matricielles
qui s'étendent au-delà de celles incluses dans numpy.linalg.
- scipy.optimize : Optimiseurs de fonction (minimiseurs) et algorithmes de
recherche de racine.
- scipy.signal : Outils de traitement du signal

ECONOMIQUE
- scipy.stats : Les distributions de probabilité continues et discrètes standard

(fonctions de densité, échantillonneurs, fonctions de distribution continue),
divers tests statistiques, et d’autres statistiques descriptives.
3.2.6. Statsmodels
Statsmodels est un paquet d'analyse statistique. Comparé à scikit-learn, statsmodels
contient des algorithmes de statistiques et économétrie classiques. Cela inclut des sous-
modules tels que :
- Modèles de régression : régression linéaire, modèles linéaires généralisés,
linéaires robustes modèles, modèles d'effets mixtes linéaires, etc.
- Analyse de variance (ANOVA).
- Analyse de séries chronologiques : AR, ARMA, ARIMA, VAR et autres
modèles.
- Méthodes non paramétriques : estimation de la densité du noyau, régression du
noyau.
- Visualisation des résultats du modèle statistique.
Statsmodels est plus axé sur l'inférence statistique, fournissant des estimations d'incertitude
et p-valeurs pour les paramètres. En revanche, scikit-learn est davantage axé sur la
prédiction.
3.2.7. scikit-learn
scikit-learn est le premier outil d'apprentissage automatique polyvalent pour les
programmeurs Python. Il comprend des sous-modules pour des modèles comme :
- Classification : SVM, voisins les plus proches, forêt aléatoire, régression
logistique, etc.
- Régression : Lasso, régression de crête, etc.
- Clustering: k-means, clustering spectral, etc.
- Réduction de dimensionnalité : sélection de caractéristiques, factorisation
matricielle, etc.

ECONOMIQUE
- Sélection du modèle : recherche de grille, validation croisée, métriques

- Prétraitement : extraction de caractéristiques, normalisation
Avec pandas, statsmodels et IPython, scikit-learn a été essentiel pour Python pour être un
langage de programmation de science de données productif.
3.3. Description du problème

Le problème est de prédire la vitesse du vent pour un horizon 1 heure à Lomé par la
technique de « Machine Learning ». Pour atteindre nos objectifs nous nous sommes doté
d’une base de données des vitesses du vent recueillies chaque jour par intervalle d’une
heure, de septembre 1998 à Avril 2018.
3.4. Méthodologie
Pour atteindre nos objectifs nous devons donc avoir une méthodologie de travail qui nous
permettra de pouvoir effectuer une évaluation du modèle à la fin.
3.4.1. Mesure de performance

Nous évaluerons la performance des prédictions en utilisant la racine carre de l'erreur
quadratique moyenne (RMSE), l’erreur absolue moyenne (MAE), l’erreur quadratique
moyenne (MSE) et le coefficient de détermination (R2).
Erreur absolue moyenne (MAE) : l’erreur moyenne absolue est la moyenne des résidus
(c’est-à-dire la différence entre la valeur cible et la valeur prédite). Elle est exprimée par
la relation (3.1).
1 n 1
MAE  y, yˆ    yi  yˆi
n i 0
(3.1)
Où :
- 𝑦𝑖 est la valeur cible ;
- 𝑦̂𝑖 est la valeur prédite ;
- n le nombre de valeur.

ECONOMIQUE
Erreur quadratique moyenne (MSE) : similaire à l’erreur absolue moyenne, à

l’exception que la moyenne quadratique utilise le carré des résidus. L’erreur quadratique
est valeur toujours positive, et est meilleur si proche de 0. La formulation mathématique
de l’erreur quadratique est donnée la relation (3.2).
1 n 1
MSE  y , yˆ     yi  yˆi 
2
(3.2)
n i 0
La racine carre du MSE donne La racine carre de l'erreur quadratique moyenne (RMSE).
Le coefficient de détermination R2 : fournit une mesure de la façon dont les échantillons

futurs sont susceptibles d’être prédites par le modèle. Le meilleur score possible est 1.0 et
peut être négatif. Le coefficient R2 est obtenu par la relation (3.3).
n 1
  y  yˆ 
2
i i
R2  1  i 0
n 1
(3.3)
 y  y 
2
i i
i 0
où yi est la moyenne des valeurs cibles.
Toute transformation des données sera inversée avant que le calcul des erreurs ne soit
effectué, ceci afin de rendre la performance entre différentes méthodes directement
comparable.
3.4.2. Stratégie d’apprentissage

Les données de vitesse du vent sont une série chronologique tandis que les SVM sont un
algorithme d’apprentissage supervise. Rappelons pour une bonne compréhension, ce qu’est
les séries temporelles et l’apprentissage supervisé.
Les séries chronologiques sont une suite de nombre ordonnée d’après une fréquence de
temps donnée. Les données d’une série temporelle se présentent en une liste d’une colonne.
L’apprentissage supervisé comme présenté au chapitre 2 est l’apprentissage où on a une
ou plusieurs variables d’entrée (X) et une variable de sortie (Y) et où on utilise un
algorithme pour apprendre la fonction de mappage de ou des entrées à la sortie Y = f(X).

ECONOMIQUE
Dans un premier temps nous avons exprimé les données de séries chronologiques dont nous
disposons sous forme d’apprentissage supervisé en utilisant la technique de « sliding
Window » ou méthode de décalage ou de retard qui consiste à utiliser la valeur de vitesse
du vent au temps t comme variable d’entrée et la valeur de vitesse du vent au temps t +δt
comme variable de sortie de l’entrée t.
La matrice de décalage ainsi obtenue a ensuite été découpée en ensemble de test (testing
set) et d’apprentissage (training set) de façon non aléatoire sur lequel nous avons appliqué
l’algorithme des SVR.
Nous avons reparti la base de données comme suit :
- le premier ensemble, constitué de 70 % des données est dédié à l’apprentissage ;

- et le second ensemble, constitue de 30 % des données est utilisé pour la validation
des modèles
Notre objectif est de prédire la moyenne horaire de la vitesse du vent en prenant, en plus de
la vitesse du vent à l’instant t-1, des variables physiques exogènes et endogènes du
processus comme les paramètres d’entrée de notre modèle. L’utilisation de toutes les
variables d’entrée sera coûteuse en temps de calcul. Toutefois certains paramètres sont
dépendants et fortement corrélés entre eux, ainsi il n’est pas nécessaire d’utiliser toutes les
variables comme paramètres d’entrée. Nous allons utiliser le test de corrélation linéaire
entre variables définie par la relation (3.4) dans laquelle x et y sont des variables.
xy  x . y
r (3.4)
 x2  x 2  y2  y 2 
3.5. Modélisation de la vitesse du vent par les SVM
Dans cette section nous exposons le travail effectué.

ECONOMIQUE
3.5.1. Analyse exploratoire des données de vitesse

La phase d’exploration de données permet de comprendre ses dernières. Grace à l’analyse
univariée, on peut déduire certaines hypothèses qui pourront servir lors de la phase de
modélisation.
L’analyse univariée permet d’explorer une seule feature à la fois. Cette analyse se base sur
les statistiques descriptives. Ces dernières permettent de tirer des indicateurs concis sur une
feature donnée. Parmi ces indicateurs on retrouve la moyenne, la médiane ainsi que les
mesures de dispersion de données.
3.5.1.1. Origine des données de vitesses du vent

Les données météorologiques utilisées dans cette étude sont des données recueillies sur le
site de la Société Aéroportuaire Lomé-Tokoin au TOGO. Ces données sont enregistrées
chaque jour par intervalle d’une heure à une hauteur de 10 m au-dessus du sol et sont
obtenues à travers la base de données météorologique du site Web
‘http://weather.uwyo.edu/surface/meteogram’, de l’Université de Wyoming. La fiche de
données fournie (Tableau 3.1), comporte pour chaque enregistrement : le nom de site
(STN), la date et l’heure d’enregistrement (TIME), la température ambiante (TMPC) en °C,
la pression atmosphérique (ALTM) en hPa, la température de la rosée (DWPC) en °C etc.
Tableau 3.1: fiche des données

ECONOMIQUE
La figure 3.1 montre la représentation temporelle des données de vitesse du vent du 01

janvier 2015 au 10 Avril 2018.
Figure 3.1 : La courbe des vitesses du vent de 2015 à 2018
3.5.1.2. Les statistiques des données de vitesses du vent

Il s’agit dans cette section de présenter les caractéristiques statistiques des vitesses de vent
sur le site de Lomé
La moyenne : la moyenne est la somme des valeurs de vitesses divisée par le nombre de
valeurs de vitesses. Elle est donnée par la relation (3.5).
1 n
moy   xi
n 1
(3.5)
La moyenne est sensible aux valeurs extrêmes.

La médiane : la médiane est la valeur centrale qui partage l'échantillon en 2 groupes de
même effectif. La médiane est donnée par la relation (3.6).

ECONOMIQUE
 x n 1  si n est impair
  2 

med   x n  x n (3.6)
   
  2   2 1
 si n est pair
2
Le mode : le mode correspond à la réalisation la plus fréquente.
La variance : la variance indique de quelle manière la série de données de vitesse se

disperse autour de la moyenne. Une variance élevée indique que les valeurs sont très écartés
les uns des autres et vice-versa. Elle est donnée par la relation (3.7).
1 n
  xi  moy 
2
2  (3.7)
n 1
L’écart-type (standard Deviation) : Il est la racine carre de la variance. On utilise souvent

l’écart-type que la variance pour mieux appréhender le degré de dispersion des données.la
relation (3.8) donne la variance.
1 n
  xi  moy 
2
 (3.8)
n 1
Le minimum et le maximum : Étendue ; c'est l'intervalle entre la plus petite et la plus

grande valeur. On dit d'un phénomène qu'il présente une « forte dynamique » lorsque
l'étendue (ou la dispersion) est grande.
Les quantiles : Un quantile d’ordre α (0< α <1) est la plus petite valeur de la série tel qu’au
moins α% des autres valeurs lui sont inférieures.
Le tableau 3.2 donne un résumé des indices statistiques des données de vitesses du vent du
01 janvier 2015 au 10 Avril 2018. La vitesse du vent de Lomé a une moyenne de 4.249
m/s dans ces dernières années. Les valeurs de l’écart-type et de la variance suggèrent que
la plupart du temps la vitesse du vent à Lomé est autour cette moyenne.

ECONOMIQUE
Tableau 3.2 : Les statistiques du vent
Variables statistiques valeur

Population 32963.000000
Moyenne 4.249067
Ecart-type 1.906311
Variance 1.380662
Min 0.000000
25% 3.000000
Médiane 4.000000
75% 6.000000
Max 16.000000
L’histogramme : l’histogramme est un hybride d'une représentation graphique exhaustive

des données et d'une description par recours à des lois statistiques. La figure 3.2 présente
l’histogramme des données de vitesse. L’histogramme ci-dessous nous confirme que les
valeurs mesurées de vitesse sont autour de la moyenne. En effet les battons de
l’histogramme sont plus longues.
Figure 3.2 : Histogramme des données de vitesses

ECONOMIQUE
3.5.1.3. Corrélation
Le rôle de l’analyse de corrélation est de déterminer les coefficients de corrélation linéaire
entre variables afin de faire un bon choix des variables d'entrée du modèle.
Tableau 3.3: Matrice de corrélation des variables d'entrées
ALTM TMPC DWPC RELH SPED

ALTM 1
TMPC -0.437 1
DWPC -0.199 0.247 1
RELH 0.232 -0.709 0.478 1
SPED -0.066 0.426 0.06 -0.367 1
L’analyse de la matrice de corrélation ci-dessus (tableau 3.3) nous a permis d’éliminer

l’humidité relative du vent RELH car étant bien corrélée à la température TMPC. D’autre
part, nous avons réalisé diverses séances d’apprentissage sur différentes modèles en faisant
plusieurs combinaisons des variables d’entrée. Grâce à La comparaison des diverses MSE
(Mean Squared Error c’est à dire Erreur Quadratique Moyenne), nous avons écarté des
variables d’entrée moins influençant que d’autres. Le tableau 3.4 présente les différentes
variables d’entrée.
Tableau 3.4: Variables d'entrée
NUMERO DESIGNATION CODE

1 La pression atmosphérique ALTM
2 La Température ambiante TMPC
3 L’humidité relative du vent RELH
4 La température de la rosée DWPC
5 La vitesse du vent SPED
Il s’agit donc de prédire les vitesses du vent à partir des combinaisons des variables
explicatives mentionnées dans le tableau 3.4 afin de déceler le cas de configuration le plus
performant sur la base d’un critère bien défini. Nous avons testé les différents cas de
configurations qui sont mentionnés dans le tableau 3.5.

ECONOMIQUE
Tableau 3.5: les différentes configurations d'entrée
Modèle Vecteurs d’entrée

1 [SPED(t-2), SPED(t-1), TMPC(t-1), ALTM(t-1), DWPC(t-1)]
2 [SPED(t-1), TMPC(t-1), ALTM(t-1), DWPC(t-1)]
3 [SPED(t-1), TMPC(t-1), ALTM(t-1)]
4 [SPED(t-1), TMPC(t-1), DWPC(t-1)]
5 [SPED(t-1), ALTM(t-1), DWPC(t-1)]
6 [SPED(t-2), SPED(t-1), TMPC(t-1), DWPC(t-1)]
7 [SPED(t-2), SPED(t-1), ALTM(t-1), DWPC(t-1)]
8 [SPED(t-2), SPED(t-1), TMPC(t-1), ALTM(t-1)]
3.5.2. Prétraitement des données du vent

Les données collectées ont été "préparées". Avant tout, elles ont subi un nettoyage
puisqu’elles contiennent plusieurs types d’anomalies : des données omises, des données
incohérentes.
3.5.2.1. Les données manquantes

On dit qu’une observation comporte une donnée manquante s’il existe une feature pour
laquelle sa valeur n’est pas renseignée. Evidemment, on peut avoir plusieurs données
manquantes pour une même observation.
Traiter les données manquantes revient à « réparer » le jeu de données pour qu’il puisse
être utilisable parle les algorithmes. Cette réparation peut prendre plusieurs formes : comme
supprimer les données manquantes ou les remplacer par des valeurs artificielles (on parle
d’imputation).
Pour notre étude nous avons opté pour la suppression complète des observations contenants
des données manquantes.

ECONOMIQUE
3.5.2.2. Le feature scaling

Les données recueillies ont des ordres de grandeurs différents. Cette différence peut
conduire à des performances moindres. Pour remédier à cela, nous avons exécuté une
Normalisation.
La Normalisation : Cette transformation nous a permis de translater les valeurs dans

l’intervalle fixe [0,1]. Le but d’avoir un tel intervalle restreint et de réduire l’espace de
variation des valeurs d’une feature.
La normalisation est effectuée par la technique du Min-Max scaling. La transformation se
fait grâce la relation (3.9).
x  xmin
xnormalise  (3.9)
xmax  xmin
Où :
- 𝑥𝑚𝑖𝑛 est la plus petite valeur observée pour le feature x ;
- 𝑥𝑚𝑎𝑥 la plus grande valeur observée ;
- x la valeur de la feature que l’on recherche à normaliser.
3.5.3. Les performances des configurations

Nous avons reporté les performances des différents cas de configurations du modèle SVR
pour différents kernel (noyau) et pour différents modèles dans les tableaux 3.6, 3.7, 3.8,
3.9, 3.10, 3.11, 3.12 et 3.13.
Tableau 3.6: Performances SVR; configuration 1
Noyau MSE RMSE MAE R2

Linéaire 0.933 0.966 0.734 0.720
Rbf 1.009 1.004 0.771 0.697
Poly; degree 2 0.994 0.997 0.764 0.701
Poly; degree 3 1.046 1.023 0.789 0.686

ECONOMIQUE

Linéaire 0.165 0.406 0.323 0.950
Rbf 0.214 0.462 0.364 0.936
Poly; degree 2 0.230 0.480 0.374 0.931
Poly; degree 3 0.299 0.547 0.412 0.910
Tableau 3.8 : Performances SVR; configuration 3

Linéaire 0.165 0.407 0.324 0.950
Rbf 0.216 0.464 0.357 0.935
Poly; degree 2 0.246 0.496 0.382 0.926
Poly; degree 3 0.461 0.679 0.518 0.861

Linéaire 0.142 0.377 0.303 0.957
Rbf 0.169 0.411 0.318 0.949
Poly; degree 2 0.171 0.414 0.315 0.949
Poly; degree 3 0.217 0.466 0.327 0.935

Linéaire 0.128 0.357 0.295 0.962
Rbf 0.168 0.410 0.350 0.950
Poly; degree 2 0.161 0.401 0.327 0.952
Poly; degree 3 0.201 0.448 0.350 0.940

Linéaire 0.902 0.950 0.721 0.729
Rbf 0.959 0.979 0.743 0.712
Poly; degree 2 0.976 0.988 0.750 0.707
Poly; degree 3 1.003 1.002 0.758 0.699

ECONOMIQUE

Linéaire 0.838 0.915 0.694 0.748
Rbf 0.894 0.946 0.722 0.731
Poly; degree 2 0.884 0.940 0.713 0.734
Poly; degree 3 0.922 0.960 0.736 0.723

Linéaire 0.912 0.955 0.726 0.726
Rbf 0.991 0.995 0.763 0.702
Poly; degree 2 0.990 0.955 0.768 0.702
Poly; degree 3 1.104 1.051 0.824 0.668
3.5.4. Bilan des meilleurs performances pour chaque configuration et choix des
entrées
L’analyse des performances des différentes configurations nous a permis de détecter pour
chaque approche le meilleur modèle. Le tableau 3.14 donnent le récapitulatif des
performances des différents configurations. Les meilleurs performances sont obtenues pour
la configuration 5 et ce pour le noyau linéaire. Ceci nous permet de choisir les variables
d’entrées du modèle SVR.
En définitif, les variables d’entrées du modèle sont constituée par la vitesse du vent
(SPED(t-1)), la pression atmosphérique (ALTM(t-1)) et la température de rosée (DWPC(t-
1)), le tout à l’instant t-1; soit au total trois variables d’entrées. La sortie du modèle étant la
vitesse du vent (SPED(t)) à l’instant t. sur la figure 3.3 et 3.4 nous présentons
respectivement la représentation temporelle de la variable de sortie et celles des variables
d’entrées.

ECONOMIQUE
Tableau 3.14 : Récapitulatif des performances de différentes configurations
modèle noyau Config. MSE RMSE MAE R2

1 0.933 0.966 0.734 0.720
2 0.165 0.406 0.323 0.950
3 0.165 0.407 0.324 0.950
4 0.142 0.377 0.303 0.957
Linéaire* 5* 0.128* 0.357* 0.295* 0.962*
6 0.902 0.950 0.721 0.728
7 0.838 0.915 0.694 0.748
8 0.912 0.955 0.726 0.726
1 0.994 0.997 0.764 0.701
2 0.230 0.480 0.374 0.931
3 0.246 0.496 0.382 0.926
Poly 2 4 0.171 0.414 0.315 0.949
5* 0.161* 0.401* 0.327* 0.952*
6 0.976 0.988 0.750 0.707
7 0.884 0.940 0.713 0.734
8 0.990 0.995 0.768 0.702
SVR 1 1.046 1.023 0.789 0.686
2 0.299 0.547 0.412 0.910
3 0.461 0.678 0.518 0.861
Poly 3 4 0.217 0.466 0.327 0.935
5* 0.201* 0.448* 0.350* 0.940*
6 1.003 1.002 0.758 0.699
7 0.922 0.960 0.736 0.723
8 1.104 1.051 0.824 0.668
1 1.009 1.004 0.771 0.697
2 0.214 0.462 0.364 0.936
3 0.216 0.464 0.357 0.935
RBF 4 0.169 0.411 0.315 0.949
5* 0.168* 0.410* 0.350* 0.950*
6 0.959 0.979 0.743 0.712
7 0.894 0.946 0.722 0.731
8 0.991 0.995 0.768 0.702

ECONOMIQUE
Figure 3.3: Courbe de la variable de sortie du modèle
a) b)

ECONOMIQUE
c)
Figure 3.4 : Courbes des variables d’entrée du modèle
Les principales caractéristiques du model choisi sont présentées au tableau 3.15.
Tableau 3.15:Les principales caractéristiques du model choisi
Modèle SVR
Noyau linaire
Cas 5
configuration SPED(t-1)- ALTM(t-1)-DWPC(t-1)
C 1000
ɛ 0.1
MSE 0.128
RMSE 0.357
MAE 0.295
R2 0.962
3.6. Prédiction avec le modèle choisi

Nous présentons à la figure 3.5, une capture d’écran de quelques-uns des résultats de
modélisation de la vitesse du vent sur le site de Lomé. On peut distinguer sur cette figure
la valeur de vitesse prédite, la valeur attendue et l’erreur quadratique correspondante.

ECONOMIQUE
Figure 3.5: Résultats de prédiction
La représentation temporelle est la meilleure manière de présenter les résultats. A cet effet
la figure 3.6 nous présentons le résultat en superposant la représentation temporelle des
données de vitesse mesurées et celle des données de vitesses prédites. On note bien une
corrélation presque linéaire entre les vitesses de vent prédites et celles mesurées.
Cette corrélation entre les données de vitesses mesurées et prédites est bien plu visible avec
la figure 3.7 où nous visualisons un nuage de point ayant pour abscisse les données de
vitesses mesurées et pour ordonnée celles prédites qui suit presque linéairement la première
bissectrice.

ECONOMIQUE
Figure 3.6: Vitesses mesurées et vitesses prédites
Figure 3.7: Corrélation vitesses mesurées-vitesses prédites

ECONOMIQUE
Pour valider les résultats nous choisissons d’observer les résultats de prédiction obtenus
pour les différentes méthodes. La figure 3.8 permet d’observer la force de modélisation des
SVR avec différents noyaux (linéaire, fonction a base radial, polynomial) sur 24 heures. On
remarque donc que le modèle avec le noyau linéaire modélise mieux la vitesse du vent à
Lomé (R2=0,962 ; MSE= 0.128).
Figure 3.8: Vitesse de vent réelle et prédite pour différents noyaux sur 24 heures
L’histogramme des erreurs au cours de la validation du modèle (figure 3.9) montre que plus
de 70% des données sont prédites avec une erreur nulle.

ECONOMIQUE
Figure 3.9: Histogramme des erreurs au cours de la validation
Il s’avère aussi important d’observer les puissances prédites correspondantes aux vitesses
prédites. Pour cela nous prenons une éolienne du fabricant Indien AUROVILLE ENERGY
PRODUCT (puissance nominale = 5 kW, vitesse nominale = 14 m/s, vitesse
d’enclenchement = 3.3 m/s). Cette dernière s’est avéré le choix optimal pour le site de Lomé
dans [41]. Sa courbe de puissance a été modélisée par la relation 3.10.
0 si V  3.3m / s
 3 3 1 2 1
4.8.10 V  1.495.10 V  9.162.10 V  1.8 si 3.3m / s  V  14m / s
P(V )   (3.10)
5 si 14m / s  V  25m / s
0 si V  25m / s
La figure 3.10 montre la représentation temporelle des puissances mesurées et prédites

correspondantes. Sur cette figure on observe une concentration aux basses puissances due
aux faibles vitesses sur le site de Lomé.

ECONOMIQUE
Figure 3.10 : Puissances prédites correspondantes
3.7. Coût du projet

Le projet ainsi réalisé, une évaluation financière s’avère nécessaire. Le coût du projet
englobe le coût du matériel informatique et celui de la recherche. Ainsi nous avons utilisé
le logiciel Anaconda dans sa version 4.4.2 et un ordinateur portable de marque HP pour le
traitement des données et des différentes simulations (capacité 500 Go, 4Go de RAM et un
processeur de fréquence 1.0 GHz). Les coûts d’acquisition du matériel utilisé sont indiqués
dans le tableau 3.16.
L’étude du projet est facturée suivant le nombre d’heures de travail par jour. La
réalisation du projet a nécessité en moyenne 6 heures de temps par jour. Le projet a duré
au total 3 mois et nous avons travaillé en moyenne 22 jours par mois (voir tableau 3.17),
ce qui fait au total 396 heures de travail. Le coût de facturation par unité de temps utilisé
pendant l’étude du projet est cinq mille francs (5000) FCFA [58].

ECONOMIQUE
Tableau 3.16: Coûts du matériel et du logiciel utilisés
Matériel et logiciels utilisés Prix (FCFA)

Ordinateur portable 250 000
Connexion internet UL-WIFI, libre pour étudiant
Anaconda +librairies Open source
Tableau 3.17: Estimation financière du temps de travail
Temps de travail en heure 396

Coût horaire (FCFA) 5000
Total partiel (FCFA) 1 980 000
Le coût total du projet est composé du coût du matériel utilisé, du coût du temps de travail
et de la taxe sur la valeur ajoutée. Le coût total du projet est présenté dans le tableau 3.18.
Tableau 3.18 : Estimation du coût total du projet
DENOMINATION DESIGNATION PRIX TOTAL (FCFA)

Prix du matériel 1 Ordinateur portatif 250 000
Frais d’étude 6h/jour pendant 66 jours 1 980 000

Total partiel - 2 230 000
TVA 18% du total partiel 401 400
Montant total TTC - 2 631 400
Le coût total du projet est alors de quatre millions six cent dix-neuf mille cinquante francs
CFA (2 631 400 CFA).
3.8. Conclusion
Ce chapitre a été consacré à la modélisation de la vitesse du vent de Lomé par les SVR.
Dans un premier temps nous avons réalisé une analyse exploratoire des données de vitesse

ECONOMIQUE
du vent, étape importante de toute modélisation. Ensuite nous avons présenté l’outil qui a
servi à la modélisation (Anaconda). Puis enfin les différents cas de prédictions ont étés
développés et testés. L’indicateur statique MSE a été utilisé pour évaluer les performances
des différentes configurations. Les résultats obtenus sont satisfaisants comparés aux
résultats de A.A. Salami et al. [3] où il est obtenu un MSE de 1.0293.

Conclusion générale
CONCLUSION GENERALE
Ce travail traite le problème de prédiction de la vitesse du vent lie à la production d’énergie
éolienne. Nous y avons tout d’abord commencé par exposer les techniques d’implantation
et d’exploitation d’une éolienne dans le premier chapitre. Cela nous a permis de mettre en
évidence la liaison étroite entre la vitesse du vent sur un site éolienne et la production de ce
dernier.
Dans le deuxième chapitre, nous avons commencé par introduire une revue de littérature
complète sur la prédiction de la vitesse du vent à l’issue de laquelle nous avons jugé
intéressant la méthode de modélisation de la vitesse du vent par les SVM. Puis nous avons
expose les bases théoriques des SVM et de sa variantes pour la régression (SVR).
Les résultats issus de la modélisation ont été présentés au troisième chapitre. Plusieurs
configurations ont été développées et testées en faisant varier les différentes variables
explicatives, l’objectif étant de trouver la configuration qui modélise le mieux les données
de vitesses de notre base de données. Toutes les configurations ont été implémentées dans
le logiciel Anaconda 4.4.2.
L’indicateur MSE (Mean Squarred Error) a été utilisé pour évaluer les différents cas de
configuration. Le cas le plus performant de tous est le cas 5 (configuration SPED(t-1)-
ALTM(t-1)-DWPC(t-1)) avec le noyau linéaire, avec un MSE de 0.128. Les variables
explicatives SPED(t-1), ALTM(t-1), et DWPC(t-1) désignent respectivement la vitesse du
vent, la pression atmosphérique et la température de rosée, le tout à l’instant t-1. Ce modèle
pourra donc être utilisé pour les prédictions futures de la vitesse du vent sur le site de Lomé.
Cependant, du travail, il en reste encore dans ce contexte afin d'améliorer les résultats
obtenus. Cette amélioration peut être obtenue en développant différents aspects. Ainsi
comme perspectives il faut tenir compte des recommandations suivantes :
- les données utilisées dans ce projet comportent plusieurs anomalies, il serait plus
intéressant de trouver d’autres sources de données plus fiables, ou même de
développer des moyens d’enregistrement de la vitesse ;

CONCLUSION GENERALE
- rendre ce travail en application ou outil facilement utilisable et même
transportable ;
- utiliser d’autres techniques de prédiction comme le Deep Learning.

Références bibliographiques
ANNEXES
[1] AHMET D. SAHIN, Progress and recent trends in wind energy, Progress in Energy
and Combustion Science 30, pp.501–543, 2004.
[2] AKIM A. SALAMI, modélisation du vent à partir des méthodes d’analyse de

données imparfaites : étude et réalisation d’un outil d’aide à la décision pour la
caractérisation du potentiel éolien, la prédiction de vitesses du vent et l’optimisation
du dimensionnement des aérogénérateurs au Togo, thèse de doctorat unique en
sciences de l’ingénieur.
[3] AKIM A. SALAMI, AYITE. S. A. AJAVON, MAWUGNO. K. KODJO, KOFFI-

SA BEDJA, Prédiction de la moyenne horaire de la vitesse du vent sur le site de
Lomé par réseau de neurones. Revue Cames – Sci. Appl. & de l’Ing., Vol. 2(1), pp.
01-12. ISSN 2312-8712.
[4] BABUSKA R., Fuzzy Modeling and Identification Toolbox for the user’s guide,
Delft University of technology, Delft, the Netherlands, August 1998.
[5] B.A. MURTAGH AND M.A. SAUNDERS, Large-scale linearly constrained

optimization. Mathematical Programming, 14(1):41–72, 1978.
[6] BETZ, A., Das maximum der theoretisch möglichen ausnützung des windes
durch windmotoren. Zeitschrift für das gesamte Turbinewesen, pp. 307–309,
September 20, 1920.
[7] BILGILI M, SAHIN B, YASAR A., Application of artificial neural networks for
the wind speed prediction of target station using reference stations data, Renewable
Energy 2007; 32(14):235060.
[8] BISHOP, C. M., Pattern Recognition and Machine Learning, volume 4 de

Information science and statistics, Springer, 2006.
[9] BOX, G. E. P., JENKINS, G. M. ET REINSEL, G. C., Time Series Analysis:

Forecasting and Control (Wiley Series in Probability and Statistics), Wiley, 1994.

ANNEXES
[10] BUBNOVA R, HELLO G, BENARD P, GELEYN J-F., Integration of the fully-

elastic equations cast in the hydrostatic pressure terrain-following coordinate in the
framework of the ARPEGE/ALADIN NWP system, Mon Weather Rev 1995;
123:51535.
[11] CASSOLA F, BURLANDO M., Wind speed and wind energy forecast through
Kalman filtering of Numerical Weather Prediction model output, Appl Energy 2012;
99: 15466.
[12] CARLIN P.W., A.S. LAXSON, E.B. MULJADI, the History and State of Art of
Variable-Speed Wind Turbine Technology, NREL/TP-500-28607, Février 2001.
[13] C.C. CHANG AND C.J LIN, LIBSVM: A library for support vector machines. ACM
Transactions on Intelligent Systems and Technology, 2:27:1–27:27, 2011.
[14] DORAN, A., Classification of wind turbines,

http://www.articlesbase.com/electronics-articles/classification-of-wind-turbines-
429469.html.
[15] EL-ALI, A., MOUBAYED, N. & OUTBIB, R., Comparison between solar and wind
energy in Lebanon, Proc. of 9th Int. Conf. on Electrical Power Quality and
Utilisation, Barcelona, 2007.
[16] ERDEM E, SHI J., ARMA based approaches for forecasting the tuple of wind speed
and direction. Appl Energy 2011; 88(4):140514.
[17] EUROPEAN WIND ENERGY ASSOCIATION, Wind energy – the facts, part I:
Technology, 2009, http://www.wind-energy-the-facts.org/en.
[18] E. OSUNA, R. FREUND, AND F. GIROSI, An improved training algorithm for

support vector machines, In Proceedings of the VIIth IEEE Workshop on Neural
Networks for Signal Processing, pages 276–285. IEEE, 1997.

ANNEXES
[19] FOLEY, A.M., LEAHY, P.G., MARVUGLIA, A. AND MCKEOGH, E.J., Current
Methods and Advances in Forecasting of Wind Power Generation, Renewable
Energy, 37, 1-8, 2012.
[20] FADARE DA, The application of artificial neural networks to mapping of wind
speed profile for energy application in Nigeria, Appl Energy 2010; 87(3):93442.
[21] GAN H. H., PASQUALI S., SCHLICK T, Exploring the repertoire of RNA
secondary motifs using graph theory; implications for RNA design NAR, 31(11):
2926-43, 2003.
[22] GIEBEL G, BADGER J, LANDBERG L, NIELSEN HAA, NIELSEN T, MADSEN

H, SATTLER K, FEDDERSEN H, VEDEL H, TØFTING J, KRUSE L, VOULUND
L., Wind Power Prediction Ensembles, Report 1527, Risoe National Laboratory,
Denmark; 2005.
[23] HAMILTON, J. D. (1994). Time Series Analysis, volume 3, Princeton Univ Pr.
[24] HERWIG WENDT, PATRICK FLANDRIN, PATRICE ABRY, Régressions par

machines à vecteurs supports pour la prédiction de séries chaotiques... GRETSI
2005, Sep 2005, Louvain-la Neuve, Belgique, GRETSI, pp.153-156, 2005. <ensl-
00144560>.
[25] HUANG Z, CHALABI ZS, Use of time-series analysis to model and forecast wind
speed, J Wind Eng Ind Aerodyn 1995; 56(2):31122.
[26] KAVASSERI RG, SEETHARAMAN K., Day-ahead wind speed forecasting using
f-ARIMA models, Renewable Energy 2009; 34(5):138893.
[27] KANI SP, ARDEHALI MM., Very short-term wind speed prediction: a new
artificial neural network Markov chain model, Energy Convers Manage 2011;
52(1):73845.
[28] KODJO M. K., BÉDJA K., AJAVON A. S. A., FAYE R. M., LISHOU C., Neural
network for predictive control of the mechanism of orientation of wind turbine,
ANNEXES
Journal des Sciences Pour l’Ingénieur(JSPI), Presses Universitaires de Dakar, N° 9,

pp. 75-85, 2008.
[29] K. MULLER, A. SMOLA, G. RATSCH, B. SCHOLKOPF, O. KOHL-MORGEN,

AND V. VAPNIK, Predicting time series with support vector machines, Artificial
Neural Networks, ICANN 97 (M. Hasler W. Gerstner, A. Germond and J.-D.
Nicoud, eds.), Springer, 1997.
[30] KALLEN E. HIRLAM documentation manual, System 2.5, Technical report,

Sweden; 1996.
[31] LI G, SHI J., on comparing three artificial neural networks for wind speed
forecasting, Appl Energy 2010; 87(7):231320.
[32] LIU H, TIAN HQ, LI YF., Comparison of two new ARIMA-ANN and ARIMA-
Kalman hybrid methods for wind speed prediction, Appl Energy 2012; 98:41524.
[33] LIU H, SHI J, ERDEM E., Prediction of wind speed time series using modified
Taylor Kriging method, Energy 2010; 35(12):48709.
[34] MA, L., LUAN, S.Y., JIANG, C.W., LIU, H L. AND ZHANG, Y., A Review on the
Forecasting of Wind Speed and Generated Power, Renewable and Sustainable
Energy Reviews, 13, 915-920, 2009.
[35] MITCHELL, T. M., Machine Learning, volume 4 de McGraw-Hill Series in

Computer Science, McGraw-Hill, 1997.
[36] NELSON, V., Wind Energy Renewable Energy and the Environment, CRC Press,
2009.
[37] RAGHEB, M., Optimal rotor tip speed ratio, 2009.
[38] RENEWABLE ENERGY RESEARCH LABORATORY/UNIVERSITY OF

MASSACHUSETTS AT AMHERST, Wind power: capacity factor, intermittency,
and what happens when the wind doesn’t blow?

ANNEXES
[39] R.J. VANDERBEI, An interior point code for quadratic programming. Optimization
methods and software, 11(1):451–484, 1999.
[40] SALAMI A. A., TIEM S., LISHOU C., BEDJA K., La logique floue pour la
prédiction de la moyenne horaire de la vitesse du vent sur le site de Lomé, Journal
des Sciences Pour l’Ingénieur (JSPI), Presses Universitaires de Dakar, N° 8, pp. 88-
96, 2007.
[41] SALAMI, A.A, AJAVON, A.S.A, KODJO, M.K. AND BEDJA, K. evaluation of
wind potential for an optimum choice of wind turbine generator on the sites of Lomé,
Accra, and Cotonou located in the gulf of guinea, int. Journal of Renawable Energy
Development, 2016.
[42] SALCEDO-SANZ S, PEREZ-BELLIDO AM, ORTIZ-GARCIA EG, PORTILLA-

FIGUERAS A, PRIETO L, PAREDES D., Hybridizing the fifth generation
mesoscale model with artificial neural networks for short-term wind speed
prediction, Renewable Energy 2009; 34(6):14517.
[43] SCHOLKOPF B., TSUDA K., VERT J.-P., Kernel Methods in Computational
Biology, MIT Press, 2004.
[44] SHI J, ZENG S., Evaluation of hybrid forecasting approaches for wind speed and
power generation time series, Renewable Sustainable Energy Rev 2012;
16(5):347180.
[45] S. MUKHERJEE, E. OSUNA, AND F. GIROSI, Nonlinear prediction of chaotic

time series using support vector machines, IEEE Workshop on Neural Networks for
Signal Processing VII (N. Morgan J. Principe, L. Giles and E. Wilson, eds.), IEEE
Press, 1997, p. 511
[46] TASCIKARAOGLU A, UZUNOGLU M., A review of combined approaches for

prediction of short term wind speed and power, Renewable Sustainable Energy Rev
2014; 34:24354

ANNEXES
[47] THE EUROPEAN WIND ENERGY ASSOCIATION, Wind in power 2015

European statistics.
[48] T. JOACHIMS, Svm light. Software disponible à http://svmlight.joachims.org/
[49] ULGEN, K. & HEPBASLI, A., Determination of Weibull parameters for wind
energy analysis of Izmir, Turkey, International Journal of Energy Research, 26(6),
pp. 495–506, 2002.
[50] VAPNIK V. N., The nature of statistical learning theory, Springer, 2000.
[51] WEIBULL, W., A statistical distribution function of wide applicability, ASME

Journal of Applied Mechanics, 18(3), pp. 239–297, 1951.
[52] WEI TONG, Wind Power Generation and Wind Turbine Design, Koll morgen Corp.,
USA, 2010.
[53] WEN-YEAU CHANG, A Literature Review of Wind Forecasting Methods, Journal

of Power and Energy Engineering, 2014, 2, 161-168
[54] Wikistat.fr
[55] WU, Y.K. AND HON, J.S., A Literature Review of Wind Forecasting Technology
in the World, Proceedings of the IEEE Conference on Power Tech, Lausanne, 1-5
July 2007, 504-509, 2007.
[56] ZHAO, X., WANG, S.X. AND LI, T, Review of Evaluation Criteria and Main
Methods of Wind Power Forecasting. Energy Procedia, 12, 761-769, 2011.
[57] ZHOU J, SHI J, LI G, Fine tuning support vector machines for short-term wind
speed forecasting, Energy Convers Manage 2011; 52(4):1990.
[58] “www.votresalaire.org/Togo” consulté le 10 avril 2012.

Memoire Ouro Agbake

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Memoire Ouro Agbake

Transféré par

Droits d'auteur :

Formats disponibles

MINISTERE DE L’ENSEIGNEMENT REPUBLIQUE TOGOLAISE

DEPARTEMENT DE GENIE ELECTRIQUE

"SUPPORT VECTOR MACHINE" POUR

MEMOIRE DE FIN D’ETUDES POUR L’OBTENTION DU DIPLOME MASTER

Rédigé et soutenu par : Hadnane OURO-AGBAKE

A Allah, le très haut.

A mes chers parents:

études, qu’Allah les protège et les bénisse.

nous aimons et qui nous sont très chers.

Mémoire d’ingénieur/Master Professionnel i Hadnane OURO-AGBAKE

Je tiens à adresser mes vifs et sincères remerciements :

au Professeur BEDJA Koffi-Sa, Professeur Titulaire, Ingénieur des Télécommunications,

au Dr. AJAVON Ayité Sénah, Maître de Conférences, Ingénieur Electro-énergéticien,

au Dr. KODJO Koffi Mawugno, Maître de Conférences, Ingénieur Automaticien,

au Dr. SALAMI Adekunle Akim, Maître de Conférences, Ingénieur Génie Electrique,

au Dr. BAYOR Sibiri Wourè-Nadiri, Maître-Assistant, Ingénieur Génie Electrique,

au Dr. DEFLY Koffi, Maître-Assistant, Enseignant-Chercheur à l’ENSI ;

au Dr. BOKOVI Yao, Maître-Assistant, Ingénieur Génie Electrique, Enseignant chercheur

à M EGBEKU Edem, Ingénieur Génie Electrique, Enseignant-chercheur à l’ENSI ;

à M. KPOGLI Komlan, Ingénieur, Enseignant chercheur à l’ENSI ;

Mémoire d’ingénieur/Master Professionnel ii Hadnane OURO-AGBAKE

à tout le personnel enseignant, administratif et technique de l’ENSI pour leur

Mémoire d’ingénieur/Master Professionnel iii Hadnane OURO-AGBAKE

La production de l’énergie éolienne dépend fortement de la variation de la vitesse du vent

Mots clés : apprentissage automatique, Support Vector Machine, Support Vector

Mémoire d’ingénieur/Master Professionnel iv Hadnane OURO-AGBAKE

Table des matières

TABLE DES MATIERES .................................................................................................... v

LISTE DES FIGURES ..................................................................................................... viii

LISTE DES TABLEAUX ................................................................................................... ix

LISTE DES ABREVIATIONS ET ACRONYMES ............................................................ x

INTRODUCTION GENERALE ....................................................................................... 1

CHAPITRE 1 : LE PROCESSUS ENERGETIQUE EOLIEN ..................................... 4

1.1. Introduction ............................................................................................................. 5

1.3.2. La force de Coriolis .......................................................................................... 7

1.3.3. La géographie locale ........................................................................................ 7

1.4. Les caractéristiques de l’énergie éolienne .............................................................. 8

1.4.2. Les caractéristiques du vent ........................................................................... 11

1.4.3. Les classes de vent ......................................................................................... 13

1.5. Aérogénérateurs .................................................................................................... 15

Mémoire d’ingénieur/Master Professionnel v Hadnane OURO-AGBAKE

1.5.1. Configuration d’une éolienne ......................................................................... 15

1.5.2. Classification des aérogénérateurs ................................................................. 16

1.5.3. Les paramètres de l’énergie éolienne ............................................................. 19

1.5.4. Commandes de l’éolienne .............................................................................. 24

1.6. Problématique de la prédiction de la vitesse du vent ............................................ 27

2.1. Introduction ........................................................................................................... 30

2.3.2. Modèles de prévision numérique ................................................................... 32

2.3.3. Prévision d'ensemble ...................................................................................... 33

2.3.4. Méthodes physiques ....................................................................................... 33

2.3.5. Méthodes d'approche statistique et d'apprentissage ....................................... 34

2.4. Machines à Vecteurs Support (SVM) ................................................................... 36

2.4.2. Les SVM linéaires .......................................................................................... 37

2.4.3. Le cas non linéaire : les noyaux ..................................................................... 42

2.4.4. Les SVM multiclasses .................................................................................... 45

2.4.5. Support Vector Régression ............................................................................ 45

2.4.6. Les SVM par la pratique ................................................................................ 47

2.5. Conclusion ............................................................................................................ 50

Mémoire d’ingénieur/Master Professionnel vi Hadnane OURO-AGBAKE

3.1. Introduction ........................................................................................................... 52

3.2.4. Matplotlib ....................................................................................................... 54

3.2.6. Statsmodels .................................................................................................... 55

3.2.7. scikit-learn ...................................................................................................... 55

3.3. Description du problème ....................................................................................... 56