Vous êtes sur la page 1sur 70

République Algérienne Démocratique et Populaire

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique


Université Djilali BOUNAAMA KHEMIS MILIANA

Faculté des Sciences et de la Technologie


Département de la Technologie
Mémoire du Projet de Fin d’Etudes
Pour l’obtention de diplôme

Master En« Génie Electrique Option : « Electrotechnique »


Titre :
ANALYSE ET CREATION DE MODELES DE
RÉGRESSION
DES DONNÉES ÉNERGÉTIQUES
Réalisé par : Encadré par :

MAZARI ABDESSAMED Imene BENCHRIF Mohamed


KERRACI Abdelkader

Année Universitaire 2013/2014


Aujourd'hui, les scientifiques s'accordent sur
un réchauffement climatique ( plus ou moins
important) de notre planète. L'émission de
Gaz à effet de serre (GES) notamment de CO2
est une des principales causes du
réchauffement climatique. Ce sont les
activités humaines et notamment la
production et la consommation d'énergie
combustibles qui sont responsables de ces
émissions croissantes de manière forte depuis
la révolution industrielle.
Problématique??
l’électricité ne se stocke pas à l’échelle industrielle, il faut à chaque
instant produire l’électricité que nous consommons.
Une bonne gestion et la prise de décision adéquates nécessitent la
connaissance des demandes à satisfaire.
La demande n’est pas toujours connue à l’avance.

Aussitôt produite, aussitôt livrée ! Le réseau haute tension


transporte l’électricité bien sûr… Mais au-delà, il veille également à
l’équilibre instantané entre l’offre et la demande en électricité, dans
notre pays.
PRODUCTION, TRANPORT, DISTRIBUTION
D’ÉNERGIE ÉLECTRIQUE

L'électricité circule depuis le lieu où elle est fabriquée


(les centrales) jusqu'à l'endroit où elle est consommée,
par l'intermédiaire d'un réseau de lignes électriques
aériennes ou souterraines et transformateur de
puissance. Il permet de transporter et de distribuer
l'énergie électrique sur l'ensemble du territoire du pays.
Structure
du Système électrique
Énergie
primaire: Centrale production
GN d’électricité

Réseau Transport THT:


220 KV & 400 KV
SH

Rx Distribution MT : Système électrique


30 KV, 10 KV ou 5,5 KV

Rx Transport HT :
150 KV, 90 KV ou 60 KV

Rx Distribution BT :
220 V ou 380 V
Les centrales

Turbine vapeur
Turbine gaz

Centrale hydraulique
Centrale diesel

Centrale nucléaire Ferme éolienne


Centrale solaire
Établir les objectifs de réduction (ou de production) d’énergie

Réduire la variabilité
production d’énergie
Consommation ou

Améliorer le rendement

Réduire l’énergie non-productive (gaspillage)

Facteur(s) d’influence
Plan

2
Analyse des données énergétiques

L’analyse des données a pour objet de mieux


comprendre la consommation et le coût de l'énergie, de
calculer les niveaux de rendement et d'établir les
objectifs et la consommation modèle. Un éventail de
techniques est disponible, allant des plus simples aux
plus complexes. Ces techniques devraient être choisies
en fonction des problèmes à résoudre.
Exemple 1: Estimation quantitative de la performance énergétique des
bâtiments résidentiels qui utilisent des outils d'apprentissage de la machine
statistiques
• Simulation généré par le logiciel Ecotect
• Utilisation huit attributs
Compacité relative
Surface
Espace mur
Zone de toit
Hauteur hors tout
orientation
Surface Vitrée
Répartition de la zone vitrage
• Deux variables de sorties
Charge de chauffage
Charge de refroidissement
• Volume constant
• Mêmes Materiaux
• 768 echantillons
Représentation graphique

les deux variables de sorties. huit variables d'entrées


Relation entre chaque variable d'entrée normalisées et les signaux de sortie normalisés

Charge de chauffage Charge de refroidissement

Les travaux et stratégies d'amélioration de la performance énergétique peuvent prendre place au


moment de la construction, ou lors d'opération de réhabilitation/transformation/réaffectation, ou
encore de reconstruction. Ils concernent l'échelle d'un bâtiment, de quartier voire de l'urbanisme.
Exemple 2 Analyse des déterminants de l’efficacité énergétique
dans l’espace UEMOA

L’analyse a été faite sur les déterminants de l’efficacité

énergétique dans l’espace de l’union économique et monétaire

ouest-africaine (UEMOA) à partir d’un modèle à l’issue des

différents tests effectués, le modèle à effets fixes dont les

estimations des paramètres par le logiciel STATA version 10


Exemple 3 Développement d’un modèle de prédiction et d’optimisation
de la conception des maisons individuelles vis-à-vis de leur consommation de
chauffage au nord du Maroc

• Le bâtiment sélectionné est une maison


individuelle, d’une superficie de 100 m²
• Pour l’identification des coefficients du modèle, des simulations à l’aide du
logiciel TRNSYS ont été réalisées. Le polynôme d’estimation de la
consommation de chauffage est donné par :

• comparaison aux résultats de 250 simulations dynamiques de combinaisons


aléatoires pour les niveaux des paramètres étudiés. (précision)
Exemple 4 Réseau de neurones artificiels intégré avec les méthodes
de régression de la charge prévisionnelle

cet exemple a combiné le réseau de neurones artificiel et


des méthodes de modélisation de régression pour prédire la
charge électrique à l’aide du logiciel MATLAB, tenant compte
de données historiques pour prévoir la demande de la charge
électrique prévisionnelle jusqu'à l'année 2020.
Exemple 5 Séries de modèle chronologique de régression pour la
prévision demande de la charge électrique de la Malaisie

Cette analyse a été structurée en suivant un régime par étapes


en commençant par le modèle de régression le plus simple et en
ajoutant à chaque fois de nouveaux termes afin d'évaluer
séparément l'effet des différents facteurs qui influent sur la
demande quotidienne d'électricité. Tenant compte de tous les

résultats, le modèle estimé est finalement donnée par :


Régression linéaire simple et
régression symbolique
Intérêts de réaliser une régression

 A partir d’un volume important de valeurs résumer


l’information

 Dégager une tendance de l’évolution des données

 Prédiction : interpolation et avec précaution extrapolation


Les différentes étapes d’une étude de régression
La régression linéaire simple

Définition : La régression linéaire l’ajustement d’une


droite au nuage statistique d’une série de couples de
données.
Ainsi, une régression linéaire simple va permettre de
résumer, d’interpréter et de prévoir les variations d’un
caractère dit dépendant (Y) en fonction d’un autre dit
indépendant (X) et ce en utilisant une droite.
Modèle d’une régression linéaire simple

• Le modèle de la régression:

Yi  a  bX i   i i
Yi
• alors, toutes les régressions DY
linéaires simples sont décrites par
deux paramètres, l’ordonnée à
l’origine (a) et la pente (b)
a
(intercept) X DX Xi

Observées b = DY/DX
Attendues (pente)

20
La méthode des moindres carrés

Cette méthode essaie de construire une droite de


régression empirique qui minimise la somme des
carrés des distances verticales entre cette droite et
chacun des points observés.
Critère des moindres carrés

où:
min  (yi  yˆ i ) 2
yi = valeur observée de la variable dépendante
pour
pour la ième observation
yˆi = valeur estimée de la variable
dépendante pour la ième observation
La droite des moindres carrés

1600
On cherche
1400
yˆ  aˆx  bˆ
â et b̂
1200

valeur
observée yi1000
minimisant
erreur ei
800 n
i
valeur
prédite ŷi
600
* e 2

i 1
400

200
Prix

0
0 100 200 300
xi
Surface
23
Principes de la méthode des moindres carrés …

Comment calculer les coefficients b0 et b1?

Les estimations ponctuelles des paramètres de la


droite de régression obtenues par la méthode des
moindres carrés sont :
b0  y  b1 x Autre formule pour b1
n
 xi yi  n x y  ( x  x )( y  y )
b1  i 1 b i i

( x  x )
1 2
n
i
x 2
 nx 2 i
i 1 Taille de l’échantillon
Prévision

Action d’envisager à l’avance un évènement


Choix de la meilleure technique de prévision
Principales mesures d’erreurs
La meilleure méthode de prévision doit donner
les prévisions les plus précises possibles.
Pour évaluer une méthode, on se base sur les
erreurs de prévision passées.
L’écart entre une donnée passée et la prévision faite
par le modèle pour la période correspondante est
mesuré pour s’assurer de la justesse du modèle.
Différentes mesures d’écart

• Écart quadratique moyen


• Écart absolu moyen
• Écart absolu moyen en %
• Biais
Écart quadratique moyen

L’écart quadratique moyen se calcule ainsi


n

 P  X 
2
i i
EQM n  i 1
n
où Pi = valeur prévue et Xi = valeur réelle.
Écart absolu moyen

Ce type de mesure d’erreur tient compte des


écarts sans égard au signe des valeurs.

L ’écart absolu moyen se calcule ainsi

PX i i
EAM t  i 1
n
Erreur absolue moyenne

Par ailleurs, l’erreur absolue moyenne en % se


calcule un peu différemment que l’écart absolu
moyen.
Pi  X i
n
100
i 1 Xi
EAM 
n
Biais ou erreur moyenne

Pour le calcul du biais, les écarts tiennent compte


du signe des valeurs i.e. négatifs ou positifs.

Le biais devrait être près de 0.


La régression symbolique

La régression symbolique est un type de l'analyse par régression,

les expressions initiales sont formées en combinant aléatoirement des

blocs de construction mathématiques, de nouvelles équations sont

alors formées par une recombinaison des équations précédentes, en

utilisant la programmation génétique qui est une technique permettant

à un programme informatique d'apprendre, par un algorithme

évolutionniste.
Eureqa Formulize
Eureqa Formulize est un logiciel mathématique à l'origine créé

par Creative Machines Lab de Cornell et plus tard commercialisé par

Nutonian, Inc.

Le logiciel utilise la régression symbolique pour déterminer les

modèles mathématiques
Présentation du logiciel Eureqa

Eureqa est un système qui utilise l'informatique évolutive pour


reproduire les équations définissant les lois de la nature que les
scientifiques n'ont pas été en mesure de découvrir. Il fonctionne
en enchaînant des expressions mathématiques simples pour
créer de grandes banques d'équations.
L'interface utilisateur d’Eureqa

1. Saisie de données
1 2 3 4 5 6 7
1. Saisie de données :Copier les données à
partir de Microsoft Excel
2. Préparation des données
3. Définition du modèle
4. Commencer une recherche
5. Affichage des résultats du modèle
6. Rapports et analyses
7. En utilisant le Cloud
Préparation des données
Définir le modèle
Lancement de recherche du modèle
Affichage des résultats de recherche
Rapports et analyses
En utilisant le Cloud
Méthodes et outils pour la
démarche expérimentale
Analyse des principales caractéristiques de la consommation d’électricité de la ville
d’Alger et les différents paramètres pouvant l’influencer,
les prévisions de consommation de la ville d’Alger à court terme avec l’utilisation
du logiciel Eureqa Fomalize
Méthodologie

Température
Historique météo
Les données météorologiques ont été obtenues simplement auprès de
infoclimat et importées depuis une station météo Alger port.

Prévisions météo
Les prévisions météo et leur incertitude sont obtenues auprès de
infoclimat de la température (°C).

Historique des courbes de charge


La consommation électrique des quatre premiers mois de l’année 2014
fournies par l’Opérateur système.

Modèles de prévision
Chaque modèle de prévision correspond aux valeurs des paramètres de
la méthode. Eureqa inclut des mécanismes permettant de calibrer un
modèle sur un historique donné. Dans la pratique, un modèle est issu des
résultats de calculs.
Courbes de charge prévisionnelles
Les courbes de charge prévisionnelles brutes résultent de l'application de la
méthode avec un modèle donné et sur un historique donné. Le processus de
prévision est interactif et permet à l'utilisateur d'intervenir pour y introduire
son expertise, par correction de certains paramètres, voire de la courbe
résultante elle-même. On obtient ainsi plusieurs courbes de charge
prévisionnelles corrigées par secteur et région qu'il est possible de combiner
pour obtenir la courbe globale.

Mesures de qualité des prévisions


Eurequa permet d'observer simplement l'efficacité d'un modèle par
simulation des prévisions pour chaque jour d'un historique. On obtient ainsi
des indicateurs et des graphiques de dispersion de l'erreur, précieux pour
quantifier la qualité des prévisions futures.
Mesurer
Résultats
Collecte
des
Agir données

Analyser
Informations
Le processus de prévision …

Choix du
Données
Données modèle de
historiques
historiques prévision

révision
du
choix du
modèle
Prévisions

Calcul des erreurs


de prévision

révision des Évaluation subjective


prévisions des prévisions
Horizon des prévisions
La charge
période Importance
prévisionnelle

-Pour calculer et d'allouer la capacité future nécessaire.


-Pour planifier de nouvelles centrales
Long terme De 1 à 10 ans
-Pour faire face aux exigences des clients.
-Joue un rôle essentiel pour déterminer le futur budget.

-Allocation de carburant et d'entretien


horaires.
D’une semaine à
Moyen terme -Précis pour le système d'alimentation
quelque mois
opération.
-Pour une évaluation économique

- hydro-thermique coordination, unité


D’une heure à une engagement, transaction.
Court terme
semaine - Pour la sécurité du système d'analyse entre autre
fonction obligatoire.
D’une minute à une
Très court terme - Systèmes de gestion de l'énergie (EMS)
heure
Le profil de la consommation sur une journée est caractérisé par 3 points:

 le creux de nuit, qui correspond au minimum de la consommation sur les


24 heures de la journée,
 la pointe du matin, Le maximum de consommation est atteint vers 13h00
 la pointe du soir est La période de pointe qui correspond à une
demande d’énergie électrique maximale. Elle dépend de la localisation
et de la période étudiée et pose des problèmes particuliers
aux gestionnaires de réseaux et aux producteurs d’électricité. c’est pour
cela notre choix a été porté sur la pointe du soir.
Représentation graphique de la consommation d’électricité de la ville d’Alger(Pointe soir)
representation 3D de la consommation d'Alger durant les premiers quatre mois de l'année 2014

0
300
0
290
Fig.2 janvier (du 1 au 22 janvier 2014) 280
0

7 0 0
2
6 0 0
2

Pointe Soir
0
250
0
2 40
0
23 0
0
22 0
0
210

Av
ril 3
2 0
2 8
Ma 2 6 > 2800
rs 22 4
2
1 0 < 2800
Fig.3 février(du 1 au 22fevrier 2014) Mo
is Fe 1 8
14 6
v 1
1 2 r < 2700
8 0 Jou
Ja 6 < 2600
nv 4
2 < 2500
0
< 2400
< 2300
< 2200

Fig. 1 Représentation 3D des données de la charge de la consommation


électrique pointe soir les quatre premiers mois année 2014.
Fig.4 mars (du 1 au 22 mars 2014)

Fig.. d’avril (du 1 au 22 avril 2014)


Fig.6 (janvier, février, mars) (du 1 Janvier au 31 Mars 2014)
Dans notre étude, plusieurs modèles de prévisions de
consommation ont été réalisés :
 Les prévisions hebdomadaires à l’aide des opérations basiques.

 Les prévisions mensuelles à l’aide des opérations basiques.

 Les prévisions mensuelles à l’aide des opérations basiques et trigonométrique.

 Les prévisions hebdomadaires à l’aide des opérations basiques


et trigonométrique.
Interprétation des résultats
Les Modèles à l’aide des opérations basiques pour le mois
de janvier
Outils d’aide à la décision
1- Corrélation entre consommation observée et estimée

Modèle 21 Modèle 3

Modèle 2 Modèle 1
•Interprétation et sélection de modèles

Parmi un ensemble de modèles candidats, comment


éliminer d’office ceux qui ne seront pas intéressants ?
•Enveloppe convexe

•Elle est formée par les courbes qui, à un moment


ou à un autre, n’ont aucune courbe « au-dessus »
d’elles.

•Les courbes situées sur cette enveloppe


correspondent aux modèles qui sont
potentiellement les plus performantes pour une
matrice de coût donnée.

•Les modèles qui ne participent jamais à cette


enveloppe peuvent être éliminés.

•Dans notre exemple, l’enveloppe convexe est


formée par les courbes de modèle 21 et modèle 3.

>> Modèle 1 est dominé par tous les modèles, il peut être éliminé.
>> Modèle 21 peut être meilleur que le modèle 3 dans
certains cas
3- Courbe de précision en fonction du seuil estimé
Résultats de la prévision
Comparaison entre deux modèles choisis
Le modèle 3 est le plus simple des modèles.

Le modèle 21 est le plus complexe des modèles


Qualité de prévision

Métriques de l’erreur du modèle 3

Erreur moyenne absolue 58.389493

Erreur quadratique moyenne 4454.64

Coefficient de corrélation 0.86448176

Erreur maximale 103.31199

Métriques de l’erreur du modèle

Erreur moyenne absolue 60.620379

Erreur quadratique moyenne 5432.169

Coefficient de corrélation 0.97039569

Erreur maximale 120.73006


Modèles à l’aide des opérations basiques et trigonométrique
pour le mois de janvier
Outils d’aide à la décision
1- corrélation entre consommation observée et estimée

Modèle 70 Modèle 38

Modèle 20 Modèle 10
2- Courbe de ROC

3- Courbe de précision en fonction du seuil estimé


résultats de la prévision
Comparaison entre deux modèles choisis
Le modèle 38 est le plus simple des
modèles.

Le modèle 70 est le plus complexe des modèles


Qualité de prévision

Métriques de l’erreur du modèle 3

Erreur moyenne absolue 30.200353


Erreur quadratique moyenne 1506.9153
Coefficient de corrélation 0.95621894
Erreur maximale 54.193387

Métriques de l’erreur du modèle 70

Erreur moyenne absolue 16.638307

Erreur quadratique moyenne 500.67791

Coefficient de corrélation 0.98650544

Erreur maximale 33.513936


Résultats de la prévision du mois d’avril à l’aide des opérations basiques

Le modèle 5 est le plus simple des modèles.

Le modèle 14 est le plus complexe des modèles


Qualité de prévision

Métriques de l’erreur du modèle 5


Erreur moyenne absolue 101.42709
Erreur quadratique moyenne 13261.517
Coefficient de corrélation 0.6420994
Erreur maximale 218.70238

Métriques de l’erreur du modèle 14


Erreur moyenne absolue 99.02882
Erreur quadratique moyenne 500.67791
Coefficient de corrélation 0.65028579
Erreur maximale 221.71605
Résultats de la prévision du mois d’avril à l’aide des opérations basiques et
trigonométrique
Le modèle 8 est le plus simple des modèles.

Le modèle 47 est le plus complexe des modèles


Qualité de prévision

Métriques de l’erreur du modèle 8


Erreur moyenne absolue 101.8511
Erreur quadratique moyenne 13385.893
Coefficient de corrélation 0.95621894
Erreur maximale 220.60243

Métriques de l’erreur du modèle 47


Erreur moyenne absolue 106.94837
Erreur quadratique moyenne 18244.982
Coefficient de corrélation 0.39205948
Erreur maximale 634.36129
Conclusion et perspectives
Malgré les difficultés liées à la période observé (fin de l’hiver et début du printemps), les résultats
obtenus sont fortement encourageant même si tout apprentissage a ses limites, et d’autres
facteurs imprévisibles peuvent fausser les calculs.
Les études énergétiques nécessitent :
• Une fiabilité des données de consommation et de la chaîne de mesure associée.
• L'analyse efficace des données est essentielle, mais souvent, on ne lui accorde pas
l'importance qui lui revient.
Comme perspectives,
• L’amélioration des modèles existants afin notamment de pouvoir quantifier l’aléa de
consommation et la recherche de nouveaux modèles intégrant notamment une meilleure
représentation des paramètres influents (comme par exemple la nébulosité ou le vent).
• Une meilleure connaissance des usagers en s’appuyant notamment sur des campagnes
de mesure.

Vous aimerez peut-être aussi