Vous êtes sur la page 1sur 19

Traduit de Afrikaans vers Français - www.onlinedoctranslator.

com

Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Listes de contenus disponibles surScienceDirect

Examens énergétiques renouvelables et durables

page d'accueil Journal:www.elsevier.com/locate/rser

Un examen et une analyse des modèles de régression et d'apprentissage automatique sur la


prévision de la charge électrique des bâtiments commerciaux

B. Yildiz, JI Bilbao⁎, AB Sproul


École de génie photovoltaïque et des énergies renouvelables, Université de Nouvelle-Galles du Sud, Sydney, NSW 2052, Australie

ARTICLEINFO ABSTRAIT

Mots clés: La prévision de la charge électrique est un outil important qui peut être utilisé pour permettre un contrôle efficace des
Prévision de charge à court terme pour les bâtiments charges électriques des bâtiments commerciaux. Des prévisions précises des charges électriques des bâtiments commerciaux
commerciaux peuvent apporter des avantages environnementaux et économiques importants en réduisant la consommation d'électricité et
Examen des modèles de régression
la demande de pointe et les émissions de GES correspondantes. Cet article présente un examen des différents modèles de
Apprentissage automatique
prévision de la charge électrique avec un accent particulier sur les modèles de régression, en discutant des différentes
Les réseaux de neurones
applications, des variables de régression les plus couramment utilisées et des méthodes pour améliorer les performances et
Prise en charge des arbres de régression

de régression vectorielle
la précision des modèles. Une comparaison entre les modèles est ensuite présentée pour prévoir les charges d'électricité
horaires du jour à l'avance à l'aide des données réelles du bâtiment et du campus obtenues du campus de Kensington et du
Tyree Energy Technologies Building (TETB) de l'Université de Nouvelle-Galles du Sud (UNSW). Les résultats révèlent que les
réseaux de neurones artificiels avec rétropropagation de régulation bayésienne ont les meilleures performances d'erreur
moyenne quadratique et de pourcentage absolu moyen et que presque tous les modèles ont mieux prédit la charge globale
du campus que la charge d'un seul bâtiment. Les modèles ont également été testés sur la prévision de la demande de pointe
quotidienne en électricité. Pour chaque modèle, l'erreur obtenue pour les prévisions de demande de pointe quotidienne était
supérieure à la moyenne des prévisions horaires journalières.

1. Introduction efforts pour comprendre et réduire la consommation et la demande d'énergie des


bâtiments commerciaux. En outre, il est bien connu que la réduction de la demande
Selon les rapports de l'Agence internationale de l'énergie (AIE) d'électricité de pointe est une voie claire pour obtenir des avantages économiques et
[1], le secteur des bâtiments tertiaires représente 32 % de la consommation environnementaux. Par exemple, la demande de pointe est identifiée comme le principal
finale d'électricité dans les pays de l'OCDE. En particulier, ce nombre était de moteur des investissements croissants dans les infrastructures de réseau, qui exercent
29 % pour les pays européens et aux États-Unis, des rapports plus récents une pression à la hausse sur les prix de l'électricité[5]. L'Energy Supply Association of
ont montré que les bâtiments commerciaux représentaient plus de 35 % de Australia estime que 80 % des investissements dans les mises à niveau du réseau ont été
la consommation finale d'électricité.[2]. En Australie, les bâtiments nécessaires pour répondre à la demande de pointe croissante à Sydney[6]. Par
commerciaux représentaient environ 30 % de la consommation finale conséquent, la mise en œuvre de méthodes de prévision de la charge électrique précises
d'électricité[1]et 10 % des émissions totales de gaz à effet de serre en 2013 et robustes, tant au niveau du réseau de distribution qu'au niveau de l'utilisateur final,
[3]. La plupart de ces bâtiments présentent des inefficacités énergétiques en peut aider les activités de gestion de la demande et d'efficacité énergétique qui peuvent
raison de leur nature physique. Le Rocky Mountain Institute a déclaré qu'il est être considérées comme des solutions alternatives à l'augmentation du réseau
possible de réduire la consommation d'énergie des bâtiments commerciaux de électrique.[7].
20 % aux États-Unis et d'autres rapports indiquent qu'il existe un potentiel de Les bâtiments commerciaux équipés de systèmes de surveillance et de
réduction d'environ 29 %.[4]. Ces chiffres suggèrent l'importance de se concentrer comptage modernes ainsi que de systèmes de gestion des bâtiments sont bien

Abréviations :AR, Auto Régressif ; MA, moyenne mobile ; ARMA, moyenne mobile auto-régressive ; ARIMA, moyenne mobile intégrée auto-régressive ; ANN, Réseau de neurones
artificiels ; NARX, réseau autorégressif non linéaire avec entrées exogènes ; SVM, Support Vector Machine ; SVR, Support Vector Regression; SLR, régression linéaire simple ; MLR,
régression linéaire multivariée ; PRISM, la méthode de notation de Princeton ; R2, Coefficient de détermination; R2 un dj, coefficient de détermination ajusté ; CV, coefficient de variance ;
RMSE, erreur quadratique moyenne ; CV-RMSE, Pourcentage RMSE par la moyenne ; MAPE, erreur absolue moyenne en pourcentage ; MPE, erreur moyenne en pourcentage ; TMY, année météorologique type ; DDCAV,
double conduit sous volume d'air constant ; DDVAV, double conduit sous volume d'air variable ; TRCAV, Réchauffage terminal sous volume d'air constant ; TRVAV, réchauffage terminal sous volume d'air variable ; DBT,
température de bulbe sec ; Jdp, température du point de rosée ; HR, humidité relative ; qsol, gains de chaleur solaire ; qje, gains de chaleur sensibles ; I, indicateur variable ; WWR, rapport fenêtre/mur ; UNSW, Université de
Nouvelle-Galles du Sud
⁎Auteur correspondant.
Adresse e-mail:j.bilbao@unsw.edu.au (JI Bilbao).

http://dx.doi.org/10.1016/j.rser.2017.02.023
Reçu le 29 mars 2016 ; Reçu sous forme révisée le 2 décembre 2016 ; Accepté le 4 février 2017 1364-0321 / ©
2017 Elsevier Ltd. Tous les droits sont réservés.
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

adapté à la mise en œuvre d'activités de réduction de la charge électrique. De plus, les un bref examen des modèles en dehors des modèles de régression est introduit.
avantages économiques potentiels induits par la réduction de la demande peuvent Dans Section 3, un examen détaillé de l'utilisation des modèles de régression est
devenir plus importants pour les prosommateurs - les clients qui produisent et présenté. Après les sections d'examen, dansSection 4la mise en œuvre de modèles
consomment de l'énergie. Cependant, les systèmes énergétiques des bâtiments de régression pour prévoir les charges électriques de pointe, horaires et
commerciaux peuvent être des systèmes complexes, en particulier dans les bâtiments journalières, pour un seul bâtiment universitaire (Tyree Energy Technologies
dotés de grands systèmes de chauffage, de ventilation et de climatisation (CVC). Cette Building - TETB) et un campus universitaire avec environ 50 bâtiments sur un site
complexité rend l'évaluation et la prévision de la demande d'électricité assez difficiles. La de 38 ha (Campus de Kensington - UNSW) est discutée . Suite à l'analyse de
principale cause de la difficulté peut être attribuée à la variation des profils de régression, quatre autres modèles d'apprentissage automatique sont utilisés pour
consommation d'énergie au sein des bâtiments[8]. Le problème augmente dans les l'analyse des prévisions : les réseaux de neurones artificiels (ANN) avec Levenberg
bâtiments qui ont un mélange de zones qui ont des exigences différentes en matière de Marquitd (LM) et la rétropropagation de la régulation bayésienne (BR), le réseau
CVC et d'éclairage, telles que les bureaux, les laboratoires, les amphithéâtres, les salles autorégressif non linéaire avec des entrées exogènes (NARX) avec LM et BR
d'opération, les salles d'événements, les centres de données et les installations de Rétropropagation, arbres de régression (RT) et régression des vecteurs de support
fabrication. De plus, les charges électriques des bâtiments varient en fonction de facteurs (SVR). ANN et SVR sont les modèles d'apprentissage automatique les plus
internes tels que l'occupation et les horaires. Enfin et surtout, les charges des bâtiments couramment utilisés dans le domaine [9,14]. La mise en œuvre d'arbres de
sont également sensibles aux changements des paramètres météorologiques externes régression n'est pas non plus rare [26,27,29]alors que NARX est une méthode
tels que la température, le rayonnement solaire et l'humidité. relativement nouvelle et à notre connaissance, sa mise en œuvre a été limitée,
Pour les raisons décrites ci-dessus, de nombreuses tentatives ont été faites nous avons donc voulu comparer cette méthode avec d'autres modèles
pour prévoir avec précision les charges électriques des bâtiments commerciaux. d'apprentissage automatique populaires. Les performances, la facilité d'utilisation
Différentes techniques telles que les modèles thermiques, les modèles de et l'interprétabilité des modèles sont comparées dansArticle 5.
régression statistique, les modèles de séries chronologiques et les modèles
d'apprentissage automatique ont été utilisées pour prévoir les charges électriques
des bâtiments commerciaux pour divers climats et horizons temporels (court 2. Modèles utilisés dans la prévision de la charge électrique des bâtiments
terme, moyen terme et long terme). Les prévisions à court terme (de quelques commerciaux
minutes à une semaine à l'avance) peuvent avoir un impact immédiat sur le
fonctionnement et la programmation d'un bâtiment et constituent un élément 2.1. Modèles thermiques
crucial pour les systèmes de gestion de l'énergie des bâtiments. Les prévisions à
moyen terme (une semaine à un an à l'avance) et à long terme (plus d'un an à Les modèles thermiques calculent les transferts de chaleur et le comportement
l'avance) ont une plus grande importance pour la planification à plus long terme. énergétique à un sous-niveau ou à l'ensemble du bâtiment[9]. Les calculs de transfert de
Les articles de synthèse existants ont fourni une bonne base pour classer le travail chaleur sont basés sur l'interaction de l'enveloppe du bâtiment avec les environnements
effectué en termes de types de modèles,[9–13], tandis que certains articles internes et externes. Les modèles thermiques complets peuvent nécessiter un nombre
mettent un accent particulier sur certaines méthodes[11,14,15]. élevé d'entrées par rapport aux modèles plus simples. Les données historiques ne sont
Parmi les différentes méthodes de prévision, les modèles de régression sont simples généralement pas requises pour ces modèles[30].
à développer, à utiliser et à interpréter, par rapport à d'autres techniques plus Des logiciels de modélisation thermique analytique tels que DOE-2, Energy Plus, BLAST et
complexes, ils ont donc été couramment utilisés pour la prévision de la charge des ESP-r ont été développés pour évaluer la consommation d'énergie et l'efficacité énergétique des
bâtiments.[9,16]. Les modèles de régression corrèlent la consommation d'énergie avec bâtiments. Ce type de logiciel a été largement utilisé pour développer les normes énergétiques
les paramètres météorologiques externes et internes du bâtiment. Ces modèles peuvent des bâtiments et analyser la consommation d'énergie et les mesures de conservation dans les
être développés en utilisant des données de charge historiques réelles[16 - 20]ou bâtiments. Bien que ces modèles soient assez puissants, ils nécessitent des données détaillées
données de charge simulées[21–25]. À la connaissance des auteurs, il n'y a pas eu concernant l'enveloppe du bâtiment, les conditions météorologiques extérieures, le
d'examen détaillé particulièrement axé sur les modèles de régression dans la prévision comportement des occupants et les performances des équipements intérieurs, qui peuvent ne
de la charge des bâtiments commerciaux, bien qu'il y ait eu des études approfondies où pas être accessibles à certains utilisateurs.
des modèles de régression ont été utilisés dans la prévision de la charge électrique des [30].Article 3.1donne des exemples de modèles de régression développés en utilisant des
bâtiments commerciaux et leurs performances ont été comparées à d'autres méthodes. données de simulation de modèles thermiques.
[26–28]. Notre étude présente donc un examen approfondi des modèles de régression et
vise à informer le lecteur sur l'éventail des différentes applications où ces modèles 2.2. Modèles autorégressifs
peuvent être utilisés avec succès. Pour plus de clarté, les modèles de régression sont
classés en différentes catégories telles que leur domaine d'application, les paramètres Les modèles auto-régressifs analysent des ensembles de points de données dans une série
d'entrée couramment utilisés, les méthodes pour améliorer les performances du modèle chronologique et corrèlent la valeur future d'une certaine variable avec ses valeurs passées
et la comparaison avec d'autres modèles. [30]. Il est possible de corréler différentes variables d'entrée à la sortie de sorte que dans
la prévision de la charge des bâtiments commerciaux, la charge peut être corrélée avec
Afin d'étendre notre étude au-delà de la théorie, des modèles de régression sont mis d'autres paramètres météorologiques et de construction importants. Par exemple,
en œuvre dans une analyse de prévision de la charge électrique horaire du jour à l'avance Espinoza et al.[31]a utilisé un modèle de régression automatique périodique pour 245
en appliquant les méthodologies décrites dans la section de revue. Les études où des sous-stations où chaque sous-station avait quatre années de points de données horaires.
modèles de régression ont été utilisés pour la prévision de la charge électrique des La méthode a donné des résultats satisfaisants pour la prévision à court terme (225
bâtiments commerciaux et leurs performances ont été comparées à d'autres méthodes, postes sur 245 ont montré un R2supérieur à 90 %).
ont été principalement limitées à un seul niveau de bâtiment et les résultats n'ont été L'une des techniques de prévision les plus couramment utilisées parmi les
analysés que pour l'ensemble de données global. Cette étude prolonge l'analyse en modèles de séries chronologiques est basée sur la méthodologie Box-Jenkins, qui
mettant en œuvre des modèles de prévision à différentes échelles : bâtiment unique et combine l'ordre autorégressif (AR)pet ordre de moyenne mobile (MA)qde la série
niveau campus universitaire ce qui permet d'observer l'impact de l'échelle de charge sur chronologique. Le modèle est appelé ARIMA lorsqu'un ordre différentiateur
les performances prévisionnelles. De plus, notre étude permet également de comparer supplémentaireréest intégré au modèle afin de supprimer les éventuelles non-
les performances des modèles pour différentes saisons. Les modèles analysés sont stationnarités au sein des données[30]. Une étude réalisée par Amjady[32]utilise
entraînés et testés non seulement pour l'ensemble de données global, mais également une nouvelle méthode Box Jenkins pour les prévisions de charge à court terme et
avec des sous-ensembles saisonniers. En plus des prévisions de charge horaire du jour à de pointe. Cette méthode ARIMA modifiée utilise une entrée de prévision initiale et
l'avance, l'analyse est élargie pour prévoir les charges de pointe quotidiennes en la combine avec des données de température et de charge pour l'analyse de
modifiant les modèles, ce qui a donné une autre occasion de comparer les performances régression. La méthode permet de prévoir avec précision les charges horaires et
des modèles sur différentes charges cibles. de pointe et donne de meilleurs résultats que le modèle ARIMA standard (pour
Le reste de l'article est organisé comme suit. DansSection 2, une trois opérateurs situés dans différentes zones climatiques de l'Iran, le

1105
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

la prévision horaire MAPE était comprise entre 2,2 % et 4,3 % pour le modèle Revue de la littérature sur les modèles de régression
ARIMA et entre 1,5 % et 2,0 % pour l'ARIMA modifié).
Les modèles de régression sont des méthodes statistiques pour estimer
2.3. Modèles d'apprentissage automatique la relation entre la sortie et les variables qui ont une influence sur la sortie,
également appelées paramètres d'influence. Un exemple d'équation de
2.3.1. Réseaux de neurones artificiels (ANN) régression est donné ci-dessous :
Les réseaux de neurones artificiels sont souvent désignés comme les modèles d'apprentissage
ŷ=une1×X1+une2×X2+… +uneune×Xune (1)
automatique les plus largement utilisés pour la prévision de la charge des bâtiments.[11]. Les modèles

ANN sont efficaces pour traiter des problèmes complexes et non linéaires. Les ANN sont utilisés pour y=ŷ+e (2)
estimer les charges de chauffage/refroidissement, la consommation totale d'électricité et le
où,yest la sortie réelle,ŷreprésente la sortie du modèle de régression, X1pour
fonctionnement et l'optimisation des composants de sous-niveau.
Xunereprésenter les paramètres d'influence,une1pouruneunereprésentent les
Une étude de Neto et Fiorelli[8]ont comparé un modèle ANN simple avec un
coefficients des paramètres d'influence correspondants, eteest le terme
modèle thermique développé dans Energy Plus, pour prévoir les charges horaires
d'erreur associé.
dans un bâtiment administratif universitaire. Le MAPE quotidien du modèle
Données pouryetXpeut être obtenu à partir de valeurs historiques ou peut être
thermique était inférieur à 13 % alors que le modèle ANN fonctionnait avec un
simulé par un logiciel de modélisation thermique. Habituellement, l'objectif du modèle de
MAPE quotidien de 10 %. L'étude a en outre comparé le modèle ANN simple (la
régression est de minimiser la somme des carrés des erreurs en faisant varier les
température a été prise comme seul paramètre d'influence) avec un modèle ANN
coefficientsune1pouruneune. Pour la prévision de la charge électrique dans les bâtiments,
plus complexe (la température, l'humidité relative et le rayonnement solaire ont
les modèles de régression corrèlent une relation entre les valeurs historiques de la
été pris comme paramètres d'influence). Le complexe ANN avait un MAPE moyen
charge avec les paramètres d'influence pour prédire la valeur future de la charge. Les
de 9,5 %, ce qui était légèrement meilleur que l'ANN plus simple. Il a également
modèles peuvent varier selon le nombre et la sélection de paramètres d'influence
été conclu que les effets de l'humidité et du rayonnement sur la consommation
(modèles de régression à une ou plusieurs variables), l'inclusion de paramètres de point
d'énergie étaient moins importants que ceux de la température extérieure pour
de changement (modèles de régression à un, multivariés ou à point de changement),
les bâtiments climatisés. Une étude plus récente de Huang et al.[33]a utilisé un
l'horizon de prévision (prévisions annuelles, mensuelles, quotidiennes et horaires) et
modèle ANN pour modéliser l'énergie CVC d'un terminal d'aéroport avec quatre
sélection des données (données historiques ou données simulées).
zones thermiques. Contrairement aux approches à zone unique, l'étude a pu
prendre en compte les interactions dynamiques de transfert de chaleur entre
Les modèles de régression sont largement utilisés non seulement pour la prévision
plusieurs zones en utilisant le modèle NARX. La méthode proposée et l'approche
de la charge [16,20,23,38,39]mais aussi pour le suivi de la consommation énergétique
de zone unique ont montré une RMSE moyenne de 0,32 ° C et 0,38 ° C
des bâtiments, la mesure et la vérification des méthodes d'efficacité énergétique[40–42],
respectivement pour une heure jusqu'à une semaine à l'avance, les prévisions de
identifier les problèmes d'exploitation et de maintenance (O&M) et analyser le système
température de zone. La plus grande précision des prévisions de température a
CVC[16.18].
conduit à des économies d'énergie quotidiennes sur l'ensemble du bâtiment de
28 %.
3.1. Modèles de régression basés sur des données historiques

2.3.2. Machines à vecteurs de support (SVM)


Les modèles de régression sont construits sur la base de données réelles chaque fois que
Les SVM sont des modèles très efficaces d'apprentissage automatique et ont la
des données historiques sont disponibles pour la charge électrique et d'autres paramètres
capacité de résoudre des problèmes non linéaires, même avec de petites quantités de
d'influence tels que les variables météorologiques (température, humidité, rayonnement solaire
données d'apprentissage.[9]. Ils peuvent être utilisés à la fois pour des problèmes de
et vent). Une hypothèse fréquente stipule que les modèles de prévision de charge doivent utiliser
classification et de régression, ce dernier cas étant appelé Support Vector Regression
des données réelles lorsqu'elles sont disponibles, sinon l'évaluation de la consommation
(SVR).
d'énergie pourrait être fortement sous ou surestimée[8].
Les SVM ont un avantage sur les autres méthodes d'apprentissage automatique
Un modèle de régression multivariée (MLR) basé sur des données historiques a été
telles que les ANN, en raison de leur capacité à localiser les minima globaux plutôt que
développé par Ramanathan et al.[20]pour la charge électrique à court terme et la
les minima locaux dans l'espace de solution[34]. Dans une étude récente, Borges et al.
prévision des pointes. Avec la charge historique donnée et les données météorologiques,
[35]ont comparé différentes méthodes d'apprentissage automatique pour
un certain nombre de modèles MLR ont été développés pour chaque heure de la journée.
trois bâtiments commerciaux différents dans la région de la Slovaquie
Les prévisions ont été faites de 16 à 40 h dans le futur. Le modèle MLR a la forme
orientale. Bien que les auteurs aient conclu qu'il n'y a pas de meilleur
suivante :
modèle pour chaque scénario, le modèle SVR a donné des résultats de
prévisions horaires plus précis que le modèle ANN pour chacun des trois Chargeheure1= (une×Déterministe) + (b×Température) + (c×Charge)
bâtiments après correction du biais. De plus, Chen et al. a participé au
+ (ré×Erreurs passées) +e (3)
concours EUNITE (European Network on Intelligence Technologies for Smart
Adaptive Systems) pour la prévision de la charge électrique à moyen terme Le 'un, b, c,etré 'les termes représentent les constantes des paramètres
et a remporté le concours en utilisant un modèle SVR[36]. d'influence, 'e 'représente l'erreur résiduelle et le 'Déterministe ' Le
paramètre fait référence à des variables telles que l'année, le mois, la
2.3.3. Arbres de régression semaine du mois et le jour de la semaine. La MAPE des 24 modèles de
Les arbres de régression sont un autre modèle d'apprentissage automatique qui régression horaire individuels variait entre 4,04 % et 5,66 % pour la période
peut être préféré aux modèles de régression linéaire lorsque les données comportent de de cinq mois donnée.
nombreuses fonctionnalités qui interagissent de manière compliquée et non linéaire. Les Une autre étude a été réalisée pour améliorer le modèle de régression utilisé pour la
modèles de régression linéaire utilisent une formule prédictive globale contenant charge à court terme du système et la prévision des pics par la Pacific Gas and Electric
l'ensemble de l'espace de données, tandis que les arbres de régression subdivisent Company, San Francisco, Californie[38]. Le modèle initial consistait en un modèle de
l'espace en régions plus petites et partitionnent davantage les sous-divisions et pointe ARIMA et un modèle de pointe MLR qui utilisaient des données historiques pour
attribuent à ses nœuds (feuilles) où les interactions sont plus gérables. Les arbres de les 15 derniers jours. Le modèle amélioré a supprimé le modèle de prévision de pointe
régression régressent les décisions sous forme d'arbre, en partant du nœud racine ARIMA et s'est uniquement appuyé sur un modèle MLR qui produit une prévision de
jusqu'à un nœud feuille où le nœud feuille contient la réponse[37]. pointe quotidienne et l'utilise comme entrée pour la prévision horaire. L'erreur en
Fan et al. a utilisé divers modèles pour prédire les charges électriques horaires et de pourcentage moyenne quotidienne (MPE) du modèle variait entre 0,25 % et 0,32 % pour
pointe journalières d'un immeuble commercial à Hong Kong. Les arbres de régression les charges de pointe en semaine, tandis que le nouveau modèle a amélioré la plage de
étaient le modèle le plus performant par rapport aux autres modèles de régression, MPE à -0,04 % et 0,09 %.
d'apprentissage automatique et de séries chronologiques[27]. Une étude récente de Fan et al.[27]utilisé un modèle MLR avec huit

1106
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

d'autres modèles pour prédire la charge électrique du plus haut bâtiment commercial de Tableau 1

Hong Kong. Une année de charge électrique horaire historique et 12 autres variables Paramètres d'influence utilisés dans chaque étude (Un astérisque indique que le paramètre
d'influence est analysé pour chaque orientation N, S, E, W).
climatiques ont été utilisées pour développer les modèles. Le modèle MLR a montré
respectivement 4,23 % et 6,08 % MAPE pour les prévisions de charge de pointe Paramètres d'influence Turiel et al. Yang et al. Hyg et al.
quotidiennes et le jour suivant et a obtenu de meilleurs résultats que les modèles ARIMA [23] [22] [24]
et ANN, mais moins bons que cinq autres modèles d'apprentissage automatique et de
Coeff. Coeff. Coeff. X X
séries chronologiques. Les résultats ont également montré que le modèle MLR
SHGC fenêtre X X X*
nécessitait de loin le moins de temps de calcul par rapport aux autres méthodes.
X X X*
X X*
Une autre étude récente réalisée par Braun et al.[17]développé des modèles de régression Rapport fenêtre/mur X X X*
pour la consommation d'électricité et de gaz d'un supermarché situé au Royaume-Uni, afin de Coeff. X X*
Charge d'éclairage X X
prédire sa consommation d'énergie à long terme. Les modèles de régression ont été développés
Charge d'équipement X X
en utilisant les données météorologiques et de consommation d'énergie de l'année de référence Prise d'air CVC X X
2012 et testés avec les données météorologiques et de consommation moyennes à long terme Efficacité du ventilateur X
de 1961 à 1990. Les modèles ont ensuite été utilisés pour prédire la consommation en 2040 et COP du refroidisseur X
Efficacité de la chaudière X
ont estimé une augmentation de 5,5 %. baisse de 28 % pour l'électricité et de 28 % pour le gaz.
Consigne de chauffage X X
Consigne de refroidissement X X
Thermostat de nuit X
3.2. Modèles de régression basés sur des données simulées Superficie totale du bâtiment X
Nombre de magasins X
Profondeur X
Pour certains bâtiments commerciaux, les données de charge historiques peuvent ne pas
Orientation du bâtiment X
être facilement disponibles. Dans ce cas, un logiciel de modélisation thermique analytique, Couleur et émissivité du toit X
comme mentionné dansArticle 2.1, peut devenir un outil efficace en simulant des données pour
des modèles de régression.
Turiel et al.[23]a utilisé une base de données de simulations DOE 2.1-A précédentes
pour développer une méthode simplifiée d'analyse de la charge des bâtiments études. Hyg et al.[24]utilisé le plus grand nombre d'influence
commerciaux. Un immeuble de bureaux à Denver, Colorado a été utilisé pour les 2 valeurs (voirAnnexe A),
paramètres qui ont donné le R le plus élevéadj.
simulations et 11 paramètres d'influence ont été identifiés à l'aide d'une analyse de cependant, il n'est pas aussi simple de conclure qu'un nombre plus élevé
sensibilité des paramètres de contrôle du bâtiment et du système (voirArticle 3.7.2). Les des paramètres d'influence se traduira par un R plus élevé
adj.2comme chaque étude a

charges annuelles de chauffage, de refroidissement et d'énergie totale ont ensuite été différences dans les paramètres d'influence, les types de bâtiments et les climats.
comparées aux résultats des simulations du DOE. Pour la plupart des essais, la prédiction Avoir un nombre plus élevé de paramètres d'influence peut ne pas améliorer la
du modèle et les simulations réelles du DOE 2.1-A différaient de moins de 15 %. L'étude précision ; en fait, dans certains cas, cela peut compliquer les modèles et réduire
s'est avérée très utile pour les types de bâtiments génériques qui nécessitent une analyse les performances des prévisions (voirSection 4).
similaire, mais des modèles distincts seraient nécessaires pour les bâtiments qui ont des
aspects, des CVC et des climats différents de ceux des types étudiés. 3.3. Modèles de régression pour prédire les charges CVC dans les bâtiments
commerciaux
Lam et al.[21]a généré une base de données de charge grâce à une série de
simulations énergétiques de bâtiments dans DOE-2 pour cinq bâtiments différents dans L'étude de Katipamula et al.[18]visant à dériver des relations fonctionnelles à l'état
cinq climats différents en Chine. Une analyse de sensibilité a identifié 12 variables clés de d'équilibre entre les paramètres météorologiques et l'utilisation horaire de l'énergie
conception de bâtiment. Données typiques de l'année météorologique (TMY) qui ont été thermique CVC dans l'ensemble du bâtiment (refroidissement et chauffage) dans les
calculées pour une étude antérieure[22], a été utilisé dans la simulation énergétique avec bâtiments commerciaux de taille moyenne et grande. Des équations analytiques pour
les paramètres d'influence du bâtiment identifiés. Les modèles de régression ont été chacun des quatre systèmes CVC les plus répandus ont été développées : Double gaine
développés pour prédire la consommation énergétique annuelle des bâtiments et ont été sous volume d'air constant et variable (DDCAV et DDVAV) et réchauffage terminal sous
comparés aux résultats du programme de simulation DOE-2. Le modèle R2variait entre volume d'air variable constant (TRCAV et TRVAV). Les équations comprenaient les
89% et 97% pour différents climats. Les climats plus chauds se sont avérés avoir une caractéristiques de l'enveloppe du bâtiment (coefficient de perte de chaleur, charges
corrélation plus forte entre la consommation annuelle d'électricité des bâtiments et les internes), les paramètres du système (débit d'air, températures des conduits chauds et
paramètres d'influence. La différence entre la régression prévue et l'électricité annuelle froids) et les paramètres météorologiques. L'étude a révélé quels paramètres sont
du bâtiment simulée par le DOE était principalement inférieure à 10 %. L'étude s'est principalement affectés par les types de systèmes CVC et a donné des résultats sur la
avérée utile pour estimer les économies d'énergie au cours des étapes de conception plage réaliste de variation des paramètres du système ainsi qu'un ensemble de valeurs
initiales lorsque différents schémas de construction et concepts de conception sont typiques (voirTableau 1).
envisagés, cependant, elle pourrait ne pas être adéquate pour les applications où des Une autre étude réalisée par Katipamula et al.[16]analysé les charges d'énergie de
prévisions de résolution temporelle plus précises et plus élevées sont souhaitées. refroidissement pour cinq bâtiments commerciaux différents au Texas, aux États-Unis,
pour deux systèmes CVC différents, DDCAV et DDVAV, à l'aide de données historiques de
Hyg et al.[24]utilisé Energy Plus pour développer des modèles MLR. Un immeuble de charge et météorologiques. Des modèles de régression ont été développés pour la
bureaux de taille moyenne conforme aux normes du DOE a été choisi pour l'étude et 27 consommation d'énergie de refroidissement des cinq bâtiments à des échelles de temps
paramètres de construction ont été identifiés. Les données climatiques TMY ont été mensuelles, quotidiennes et horaires. L'étude a révélé que les modèles MLR produisaient
utilisées dans le modèle pour trouver la consommation annuelle de refroidissement, de une diminution de 33 % du coefficient de variance (CV) par rapport aux modèles de
chauffage et d'énergie totale pour le même immeuble de bureaux dans quatre régression unique. L'étude a en outre étudié le R partiel2de chaque paramètre d'influence
emplacements climatiques différents. Le modèle a été développé à l'aide de cet ensemble des modèles MLR.Tableau 2ci-dessous montre les résultats des modèles MLR mis en
de données et ses prédictions ont été comparées aux résultats de la simulation. La œuvre sur cinq charges de refroidissement de bâtiment pour les systèmes CVC discutés.
précision du modèle de régression a été encore améliorée par une régression
progressive vers l'avant qui a abouti à un R ajusté2, (voirArticle 4.2.1) valeurs supérieures
à 96%.Tableau 1montre les paramètres d'influence utilisés dans chaque modèle de 3.4. Modèles de régression pour la mesure et la vérification des économies de
régression sur la base de données simulées. rénovation
Le rapport fenêtre / mur (WWR), le coefficient de perte de chaleur de la fenêtre et le
coefficient de perte de chaleur du mur sont les trois paramètres d'influence utilisés dans les trois La Princeton Scorekeeping Method (PRISM) a été introduite en

1107
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 2 moins de 10% ne sont pas rares dans la littérature[30].


Partielle R2des paramètres d'influence sur les deux systèmes CVC pour cinq bâtiments différents (Voir Le DBT peut également être utilisé sous d'autres formes, telles que les degrés-
nomenclature pour les paramètres d'influence[16]).
jours de refroidissement et de chauffage (CDD et HDD) ou les degrés-heures de

DDVAV MLR PARTIEL R2 DDCAV MLR PARTIEL R2 refroidissement et de chauffage (CDH et HDH). Hyg et al.[24]utilisé les fonctions
(%) (%) HDD et CDD annuelles pour les simulations Energy Plus et atteint R2valeurs de
96%. Lam et al.[44] ont comparé deux modèles de régression simple, l'un avec la
Bâtiment Non 1 2 3 1 4 5 DBT comme seule entrée et l'autre avec la CDH comme seule entrée (une

Modèle total 96,4 96,2 91.3 91,9 96,9 95,0 température de base de 19 °C a été utilisée). L'étude a révélé que la
DBT 83.2 79.1 84.1 87.1 6.6 4.5 consommation mensuelle d'électricité présentait une forte corrélation avec la
Jdp 7.2 8.1 5.5 4.0 90,3 88,6 température ambiante mensuelle moyenne et la CDH. Le modèle de régression
qje 4.1 2.3 0,6 0,8 0.0 0,9 simple avec DBT avait un R moyen2de 0,87 alors que le modèle avec CDH avait un
je 1.1 2.3 0,2 0.0 0.0 0,1
R moyen2de 0,88 pour 20 bâtiments commerciaux différents.
Je * DBT 0,8 0,8 0,9 0.0 0.0 0,9
qsol 0.0 0.0 0.0 0.0 0.0 0.0
3.5.2. Humidité
L'humidité est un paramètre climatique couramment utilisé dans les modèles de
régression[16–19,21,22,39]. Dans l'étude réalisée par Nassif[19], l'humidité spécifique a
1986 pour déterminer la consommation annuelle normalisée (NAC) des unités résidentielles dans montré le R partiel le plus bas2pour les bâtiments situés dans des climats ensoleillés et
le New Jersey, aux États-Unis. PRISM utilise les lectures des compteurs de services publics avant intérieurs. Alors que dans les climats chauds et humides, où la charge de refroidissement
et après une rénovation avec des températures extérieures moyennes afin de dériver les était dominante toute l'année, l'humidité avait un impact significatif sur la consommation
économies totales de rénovation (également appelées économies de rénovation ajustées aux d'électricité pour les bâtiments climatisés.
conditions météorologiques)[43]. Certaines extensions du modèle PRISM ont été introduites en Katipamula et al.[16]utilisé l'humidité spécifique comme l'un des paramètres
ajoutant les gains solaires, les données d'occupation, la vitesse du vent et les gains internes en d'influence dans la modélisation MLR pour l'énergie de refroidissement de
plus du paramètre d'influence principal, la température de bulbe sec DBT[25]. Les modèles différents bâtiments (ce qui a déjà été discuté dansArticle 3.3). Reddy et Claridge
peuvent incorporer un terme de température de point de changement, qui sont alors appelés [39]utilisé l'humidité ainsi que le DBT et le rayonnement solaire comme
modèles de point de changement ou modèles de signature. Éq.(4)est un exemple pour un paramètres d'influence climatique. L'étude a dérivé les relations fonctionnelles qui
changement de trois paramètres existent entre l'utilisation horaire d'énergie thermique CVC côté air du bâtiment,
modèle de régression ponctuelle avecβ 3comme point de changement et ()+indique l'enveloppe du bâtiment et les paramètres climatiques.
que la valeur entre parenthèses est mise à zéro lorsque sa valeur est Kissock et al.[41], ont utilisé l'humidité comme l'un des paramètres de régression ainsi que le
positive. DBT et la charge interne, pour générer une séquence de données synthétiques, représentative de
la consommation d'énergie quotidienne dans les grandes institutions.
E=β+β1(J-β)+2 0 3 (4) constructions dans quatre climats différents. Dans la première partie de l'étude,

Kissock et al.[41]utilisé des modèles de régression linéaire et de point de rupture pour


les effets de l'humidité sur les systèmes CVC à volume d'air constant et
estimer les économies de rénovation ajustées aux conditions météorologiques dans les
variable ont été étudiés, où les charges CVC ont montré une augmentation
bâtiments commerciaux. Sever et al.[40]a utilisé un modèle de régression de point de
avec l'augmentation de la charge latente. Braun et al.[17]humidité utilisée
changement modifié (modèle de signature énergétique inverse) pour estimer les économies de
sous la forme du taux d'humidité, le rapport de DBT à l'humidité relative. Il a
rénovation dans les bâtiments industriels. La méthode utilise à la fois les données réelles et TMY.
été noté qu'en raison de la multicolinéarité entre le taux d'humidité et le
Les résultats du modèle de régression du point de changement pour les économies prévues ont
DBT, seule l'analyse de régression du DBT était préférée. Le R2était de 0,95
été comparés aux économies prévues par des simulations horaires détaillées et le MAPE était à
pour la régression avec le DBT et l'humidité relative et il n'a été réduit à 0,92
moins de 14 %. Plus récemment, Walter et al.[42]ont utilisé des modèles de régression
que lorsque le taux d'humidité a été supprimé de l'équation de régression.
multivariés pour construire un modèle global sur la prévision des économies de rénovation. Les
auteurs ont utilisé des données provenant d'un grand parc de bâtiments qui comprenaient des
3.5.3. Apport solaire
informations sur la consommation d'énergie du bâtiment, le type d'utilisation du bâtiment,
Le gain solaire est un autre paramètre météorologique utilisé dans les modèles de
l'emplacement, les caractéristiques opérationnelles et les systèmes énergétiques. L'étude a
régression. L'effet du gain solaire peut être important, en particulier pour les bâtiments
quantifié l'impact de certains composants et équipements de l'enveloppe du bâtiment sur la
situés dans des climats ensoleillés et avec un rapport fenêtre / mur (WWR) élevé. Reddy
consommation d'énergie en trouvant leurs coefficients de régression. Cela a permis de prédire
et Claridge[39]ont constaté que le gain solaire avait une plus grande influence que
les économies potentielles de la mise à niveau d'un certain composant. En particulier, les
l'humidité pour trois des quatre bâtiments étudiés, chacun situé dans un climat différent.
économies réalisées grâce à la rénovation des murs et des fenêtres ont été quantifiées pour le
Pour le bâtiment situé dans un endroit sec à fort rayonnement solaire (Albuquerque),
parc immobilier étudié.
gain solaire, R partiel2était trois fois supérieure à l'humidité pour la charge quotidienne
du bâtiment, alors que dans un endroit à forte humidité (Miami), l'humidité a montré un
3.5. Paramètres d'influence R partiel plus grand2que le gain solaire. Dans une autre étude, le gain solaire à travers les
fenêtres a été identifié comme la plus grande composante des charges de
3.5.1. Température ambiante de bulbe sec (DBT) refroidissement dans les bâtiments commerciaux pendant le mois d'été de juillet pour
Selon Kissock et al.[41], la DBT est reconnue comme la principale variable cinq villes différentes en Chine.[22].
météorologique contribuant à la prévision des charges électriques des bâtiments.
L'utilisation de la température ambiante comme seul paramètre d'influence pour 3.5.4. Planning (semaine / week-end / jours fériés)
l'analyse de régression présente certains avantages, car elle élimine les problèmes L'effet de l'ordonnancement est important pour les bâtiments commerciaux. Les
statistiques dus à la multicolinéarité (voir la section 3.8) et réduit les exigences de collecte profils de charge peuvent varier considérablement entre les jours de semaine, les week-
de données à un paramètre unique, mesuré avec précision et largement disponible. En ends et les jours fériés. Par conséquent, les jours de semaine doivent généralement être
raison de ces avantages, les modèles de régression basés sur la température sont distingués des week-ends et des jours fériés[25]. Dans la littérature, la planification est
largement utilisés dans la prévision de la charge électrique[17,24,27,38,44]et estimation principalement prise en compte soit en utilisant des modèles séparés pour les jours de
des économies de rénovation normalisées en fonction des conditions météorologiques semaine, les week-ends et les jours fériés, soit en utilisant une variable indicatrice
[40,43,45]. Cependant, les modèles de régression utilisant la température ambiante (variable binaire) au sein du même modèle. Par exemple, Ramanathan et al.
comme seule entrée ont produit des charges de chauffage et de refroidissement [20]développé 24 équations de prévision distinctes pour chaque heure de la
quotidiennes prévues pour les bâtiments commerciaux avec un CV-RMSE de 15 %.[41]. Il journée. Ces équations ont ensuite été divisées pour les week-ends et les jours de
s'agit d'une erreur de prévision raisonnablement bonne, mais les CV-RMSE horaires semaine afin qu'il y ait en fait 48 modèles distincts.

1108
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Les modèles de régression linéaire multivariés développés par approcher; cependant, il peut produire des modèles plus fiables et
Papalexopoulos & Hesterberg[38]a pris en compte les jours de la semaine, les physiquement plausibles. Il a été conclu que l'ACP peut être recommandée
week-ends et les jours fériés en utilisant des variables binaires. Il a été conclu que lorsque l'un des paramètres d'influence a une force de coefficient de
la prise en compte de ces effets peut améliorer considérablement la précision de corrélation de 0,5 ou plus, et lorsque le MLR R2la valeur est faible (autour de
l'algorithme de prévision. Kissock et al.[41]ont également utilisé une variable 0,5).
indicatrice dans le modèle de régression qui a été attribuée à 1 pour les jours de
semaine et à 0 pour les week-ends. 3.7.2. Analyse de sensibilité
Lorsque l'analyse de régression est mise en œuvre à l'aide d'un modèle
3.5.5. Résolution temporelle thermique, un nombre élevé de variables est généralement requis. De plus, cela
La résolution temporelle des modèles de régression examinés dans cet article allait peut être une approche fastidieuse et difficile pour exécuter suffisamment de
d'une heure à une année. Les paramètres d'influence météo tels que DBT, Tdp, et les simulations pour un nombre élevé de paramètres d'influence. Dans ce cas, une
gains solaires peuvent varier considérablement d'une heure à l'autre. Cette variation analyse de sensibilité peut être réalisée afin de mesurer l'importance relative des
devient beaucoup plus faible sur une période quotidienne ou mensuelle, car les paramètres d'influence, permettant d'éliminer les paramètres ayant un effet
changements positifs et négatifs par rapport aux valeurs moyennes se font la moyenne. négligeable sur la variable de sortie. De nombreuses études ont utilisé l'analyse de
Par conséquent, les charges électriques des bâtiments qui ont une forte corrélation avec sensibilité afin d'identifier les variables les plus importantes parmi les variables
les paramètres météorologiques montrent beaucoup moins de dispersion à des initialement désignées[20–24].
intervalles mensuels et quotidiens par rapport à toutes les heures. La même logique peut Une autre approche est le modèle de régressions apparemment non liées
être appliquée lors de la comparaison des variations mensuelles et annuelles. Comme les (SUR) qui peut également être utilisé dans les modèles de régression. Cependant,
variations mensuelles s'étalent sur l'année, les résultats annuels montrent moins d'écart Ramanathan et al.[20]ont étudié cette approche pour les paramètres d'influence
que les résultats mensuels[16]. Par conséquent, l'obtention d'une grande précision communs utilisés dans le MLR, mais ont constaté que les améliorations de
devient une tâche plus difficile avec une résolution temporelle accrue. précision obtenues par cette approche étaient négligeables.

3.7.3. Régression pas à pas


3.6. Modèles de régression à une ou plusieurs variables
La régression pas à pas est un autre moyen d'améliorer la précision d'un modèle de
régression. La régression pas à pas vers l'arrière élimine les paramètres du modèle,
Les modèles MLR offrent une plus grande précision que les modèles de régression à variable
tandis que la régression pas à pas vers l'avant considère l'ajout
unique pour la modélisation de la consommation d'énergie CVC dans les bâtiments
nouveaux paramètres d'influence dans le modèle un à la fois. L'ensemble
commerciaux, car la consommation dans les grands bâtiments commerciaux est une fonction
R2adj.(voir section 4.3.2) est observé à chaque fois qu'une nouvelle variable est
complexe des conditions climatiques, des caractéristiques du bâtiment, du fonctionnement du
introduit ou retiré du modèle ; la variable qui ne
système CVC et du comportement des occupants.[16].
augmenter le Radj.
2 est exclu du modèle. La régression pas à pas
Nassif[19]ont comparé des modèles SLR avec différents modèles MLR (trois
quantifie par ordre décroissant d'importance, les paramètres qui
paramètres et quatre paramètres) avec et sans paramètres de point de
expliquent une partie de l'erreur restante[46].
changement pour les données recueillies auprès de 225 écoles du centre de la
Hyg et al.[24]effectué une régression pas à pas vers l'avant pour sélectionner
Floride. Les modèles SLR utilisaient DBT comme seul paramètre alors que les
la combinaison de variables qui a généré le meilleur modèle parmi les variables
modèles MLR avaient des paramètres supplémentaires tels que Tdpet une variable
d'origine et leurs termes de produits croisés. Pour les quatre analysés
binaire (jours de semaine / week-end).Tableau 3montre le CV moyen de MLR et
bâtiments, le modèle de régression initial a donné un R2adj.entre 0,498
SLR pour les 225 écoles pour les données analysées sur une période de trois ans.
et 0,816 pour la charge de chauffage et 0,917–0,977 pour la charge de refroidissement,
alors que le modèle obtenu par la régression pas à pas vers l'avant a donné
3.7. Méthodes d'amélioration des modèles de régression
un R2adj.supérieur à 0,96 pour les deux charges.

Les paramètres d'influence MLR peuvent être fortement corrélés les uns aux
4. Analyse des prévisions de charge électrique avec des modèles de régression et
autres, ce qui provoque un problème de multicolinéarité. Lorsque la
d'apprentissage automatique
multicolinéarité existe dans un modèle, les paramètres d'influence n'indiquent pas
leur véritable importance relative. De plus, les incertitudes des coefficients de
Le campus UNSW Kensington est situé sur un site de 38 ha et accueille environ
régression (généralement l'erreur type du paramètre) peuvent être si importantes
50 000 étudiants. Le campus comprend divers amphithéâtres, des salles de
que l'utilité du modèle peut être compromise.[41].
tutorat, des bureaux universitaires et administratifs, des laboratoires, des
restaurants, des boutiques et un centre de remise en forme et aquatique. Le Tyree
3.7.1. Analyse des composants principaux Energy Technologies Building (TETB) se compose de cinq niveaux et a une surface
L'analyse en composantes principales (ACP) est l'une des méthodes développées au sol d'environ 18 000 m2. Le bâtiment comprend des espaces d'enseignement,
pour traiter le problème de la multicolinéarité et elle analyse la covariance et la de recherche et de bureau, des laboratoires énergivores et un café. Un 150kWpLe
structuration des corrélations. L'ACP peut non seulement résumer les données (réduisant réseau photovoltaïque est situé sur le toit et la conception du bâtiment a obtenu
le nombre de paramètres d'influence), mais peut également supprimer efficacement les une note de conception 6 étoiles, Green Star[47].
effets de multicolinéarité des paramètres d'influence. Reddy et Claridge[39]a effectué
une évaluation PCA large sur un modèle MLR à trois paramètres (DBT, humidité, 4.1. Analyse préliminaire des charges électriques horaires du campus et du
rayonnement solaire) et a comparé ce modèle avec un modèle MLR à un seul paramètre. TETB
Il a été démontré que l'ACP est plus exigeante en temps et en efforts que la MLR à
paramètre unique Les données de charge électrique horaire et les données météorologiques à
intervalles de minutes, y compris le DBT et l'humidité relative (RH), ont été
Tableau 3 obtenues respectivement à partir des compteurs d'électricité du campus et du
Coefficient de variance moyen en pourcentage pour SLR et MLR[19].
TETB et d'une station météo locale. Des données météorologiques

CV (%) complémentaires ont été obtenues de la station météorologique de Sydney


Observatory Hill, située à 7 km de l'UNSW. L'analyse des données a été effectuée à
2006 2007 2008 l'aide de Matlab_R2015b et des boîtes à outils statistiques et de réseau de
neurones associées et de LibSVM[48].
SLR 11.6 15.4 14.9
Figues. 1et2montrent les boîtes à moustaches pour les charges électriques horaires
MLR 8.3 12.1 13.5
du campus et du TETB pour chaque jour de la semaine et heure de la journée et

1109
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

FIGUE. 1.Boîtes à moustaches pour les charges électriques horaires du campus et du TETB par rapport au jour de la semaine.

Tableau 4montre les résultats de l'analyse statistique préliminaire. L'ensemble de 4.2.1. Régression simple avec paramètres climatiques
données horaires analysé s'étend du 01-Jan-2013 au 09-Sep-2014. Les modèles de régression unique ont déjà été discutés dansSection 3et leur
Comme prévu, les jours ouvrables affichent une consommation commodité et leur facilité d'utilisation ont été soulignées. Par conséquent,
d'électricité plus élevée que les week-ends, tant pour le Campus que pour le l'analyse commence par la formation de modèles de régression simples utilisant
TETB. La répartition de la charge électrique horaire montre que le Campus des paramètres climatiques tels que DBT, RH, le paramètre d'inconfort humain
connaît des pics de charge entre 13h et 16h et le TETB entre 12h et 16h. La (humidex) et l'enthalpie. Ces deux derniers paramètres peuvent être calculés en
période analysée montre que les charges électriques horaires de TETB et du utilisant DBT et RH. L'humidex est utilisé comme mesure de l'inconfort causé par
Campus ont suivi un profil similaire.FIGUE. 3montre les profils de charge la température et l'humidité relative et c'est l'un des indices d'inconfort les plus
horaires pour une période d'exemple allant du 03 mars au 20 avril 2014. Afin couramment utilisés.[49]. Humidex (SALUT)se calcule comme suit :
de comparer les profils sur la même parcelle, les charges Campus et TETB
sont mises à l'échelle en fonction de leurs plages. Il a été observé que le 5
SALUT=DBT+ (e−10)
TETB connaît des pics quotidiens avec un léger retard par rapport au pic de 9 (5)
demande du Campus.
oùeest la pression de vapeur d'eau de l'air en hPa[49]. Pour le calcul des valeurs
d'enthalpie les équations rapportées par Padfield[50] ont été utilisées. Les résultats pour
4.2. Analyse de régression chaque modèle (formé avec les données de 2013 et testé avec les données de 2014)
peuvent être trouvés dansTableau 4, où R2représente le bien-être de l'ajustement du
Suite à l'analyse préliminaire, les modèles SLR et MLR ont été entraînés et testés sur modèle sur l'ensemble d'apprentissage, et les autres métriques représentent les
les charges électriques horaires du Campus et du TETB. L'analyse saisonnière a consisté à performances du modèle sur l'ensemble de test.
former les modèles avec des données de l'été, de l'automne, de l'hiver et du printemps Les modèles de régression simple basés sur DBT ont montré le R le plus élevé2pour presque
2013 et à les tester avec les saisons correspondantes de 2014. En plus des sous- tous les ensembles d'entraînement. Cependant, ce R plus élevé2les performances n'ont pas
ensembles saisonniers, un cinquième modèle a été créé en utilisant les données abouti à des résultats significativement meilleurs que d'autres modèles basés sur des paramètres
complètes, qui ont été partitionnées de manière aléatoire. puis validation croisée 10 fois. climatiques sur des ensembles de tests. En fait, les termes d'erreur étaient assez similaires pour
Les mesures de performance utilisées pour l'analyse des prévisions sont : l'erreur les saisons d'automne et d'hiver pour tous les modèles. De plus, les modèles basés sur RH ont
quadratique moyenne en pourcentage de la charge moyenne de l'ensemble de tests obtenu de meilleurs résultats que les modèles basés sur DBT pour les saisons d'été et de
(RMSE %), l'erreur de biais moyenne en pourcentage de la charge moyenne de l'ensemble printemps. Il a été observé que les erreurs étaient significativement plus élevées pour les
de tests (MBE %), le pourcentage absolu moyen erreur (MAPE), coefficient de modèles TETB, ce qui est principalement causé par le MBE plus élevé. En examinant les valeurs de
détermination (R2), et ajusté charge saisonnières moyennes de 2013 et 2014, il a été constaté que les charges électriques du
coefficient de détermination (R2adj.). Les formules et la justification de TETB et du Campus ont augmenté d'environ 40 % et 8 % respectivement. La principale cause de la
utilisant ces métriques sont présentées dansAnnexe A.

1110
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

FIGUE. 2.Boîtes à moustaches pour les charges électriques horaires du campus et du TETB par rapport à l'heure de la journée.

L'augmentation des charges électriques TETB peut être attribuée à l'augmentation Afin d'étudier les performances des modèles sans ces changements progressifs, une
significative du nombre d'étudiants et d'activités de laboratoire. De plus, le TETB correction de biais a été mise en œuvre dans laquelle chaque sortie du modèle était
disposait d'une usine de tri-génération active qui produisait de l'électricité pour simplement augmentée d'une quantité égale à la différence entre les charges électriques
l'ensemble du campus. Cette unité a été arrêtée fin 2013, ce qui est un autre saisonnières moyennes. Les résultats du modèle de régression unique corrigé du biais
facteur important de cette augmentation annuelle entre les deux années. Les sont présentés dansTableau 5.
modèles de régression unique basés sur le climat n'étaient pas capables de On peut voir que les modèles SLR corrigés du biais présentent des performances
détecter ces changements et ont donc donné lieu à de mauvaises performances. nettement meilleures que les modèles précédents en raison du plus petit MBE.

FIGUE. 3.Profils de charge électrique des campus et TETB du 03 mars au 20 avril 2014.

1111
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 4
Résultats des modèles de régression unique saisonniers.

L'été Automne Hiver Saut

R2 RMSE % MBE % CARTE R2 RMSE % MBE % CARTE R2 RMSE % MBE % CARTE R2 RMSE % MBE % CARTE

Charge du campus
DBT 0,32 21h55 - 10,81 14,57 0,33 19.67 - 6,79 12.59 0,29 20,89 - 6,62 13h55 0,47 26.28 - 15.67 18.07
HR 0,15 22.08 - 8.11 14.51 0,17 22,76 - 7,83 14.27 0,16 20h20 - 17h30 13.81 0,19 21.87 - 6,94 14,76
Humidex 0,23 23.22 - 11,78 15,38 0,24 20.80 - 6,61 13.26 0,21 20.87 - 6,90 13.53 0,34 29.38 - 17.04 19.59
Enthalpie 0,12 24h41 - 11,66 15,51 0,16 22h00 - 6,61 13,95 0,09 20.52 - 6,81 13h38 0,12 21.87 - 8,73 14,61

Charge TETB
DBT 0,21 38,51 - 31.30 31.43 0,21 36,67 - 31,55 31,55 0,34 41,87 - 34,60 34,61 0,35 42,83 - 37,25 37,25
HR 0,26 35,82 - 28.08 28.69 0,19 37,95 - 33.08 33.09 0,18 39,97 - 32,84 32,84 0,14 34,53 - 27,80 27,81
Humidex 0,09 40.09 - 31,67 31,68 0,13 37.45 - 31.45 31.45 0,25 42.04 - 35.02 35.05 0,28 46,60 - 39.35 39.35
Enthalpie 0,02 40.36 - 31.02 31.02 0,06 38.15 - 31,60 31,60 0,11 41,53 - 34,95 34,96 0,12 36,53 - 30,52 30,52

Tableau 5
Résultats du modèle de régression unique saisonnier après correction du biais.

L'été Automne Hiver Saut

R2 RMSE % MBE % CARTE R2 RMSE % MBE % CARTE R2 RMSE % MBE % CARTE R2 RMSE % MBE % CARTE

Charge du campus
DBT 0,32 17.11 2,81 13h31 0,33 17h34 4.73 14,99 0,29 18.75 2.53 15.50 0,47 22.01 - 8.34 15.08
HR 0,15 19.27 5.52 15.62 0,17 19.91 3,70 15.86 0,16 18h55 3,84 15.72 0,19 19.68 0,39 15,79
Humidex 0,23 18h31 1,85 14.10 0,24 18h55 4,92 16.08 0,21 18.59 2.25 15h32 0,34 25.22 - 9,72 17.04
Enthalpie 0,12 19.63 1,96 15.14 0,16 19.72 4,91 16.90 0,09 18.21 2.34 15.14 0,12 19.08 - 1.40 14.77

Charge TETB
DBT 0,21 19h30 3.45 15h43 0,21 16.10 4.07 13.77 0,34 20.46 2,59 16,98 0,35 21,99 - 9,85 15h43
HR 0,26 19.81 6,66 16h47 0,19 15,94 2.53 13.26 0,18 19.52 4.36 16.85 0,14 17,96 - 0,40 14h42
Humidex 0,09 20,95 3.08 16.82 0,13 17h33 4.16 14.92 0,25 20.08 2.17 16.63 0,28 26.44 - 12h00 17.78
Enthalpie 0,02 21.90 3,73 17,89 0,06 18.11 4.01 15.65 0,11 19.06 2.25 16.10 0,12 18.04 - 3.11 13.91

Fait important pour les modèles TETB, les erreurs ont été réduites. De plus, la • Enthalpie (X8)
différence de performances entre les modèles TETB et Campus a été • Heure du jour (X9)
considérablement réduite. En revanche, le RMSE et le MAPE étaient toujours en • Jour de la semaine (X10)
moyenne de 19 % et 16 % respectivement, ce qui est supérieur aux erreurs
rapportées pour les modèles SLR dans la littérature.[16.19]. Nos modèles SLR Les prédicteurs temporels sont introduits afin de saisir la relation
n'étaient pas capables de capturer les changements et les variations des charges entre la valeur actuelle de la charge et son passé. Le paramètre jour
électriques du TETB et du Campus. Par conséquent, des modèles plus avancés ouvré / jour férié est un indicateur binaire tel que pour les jours ouvrés
sont nécessaires pour des résultats plus précis. Bien que la méthode de correction c'est un et pour les week-ends et jours fériés c'est zéro.
du biais ait été utile pour réduire l'erreur des modèles SLR, elle nécessite une Cinq modèles MLR ont été construits en utilisant les données de 2013 pour la
étape supplémentaire et peut ne pas être une mise en œuvre réalisable pour les formation, quatre en utilisant des sous-ensembles pour chaque saison et un en utilisant
applications de prévision en temps réel. Par conséquent, la correction du biais l'ensemble des données en utilisant une validation croisée de 10 fois.FIGUE. 4montre le
sera omise pour les méthodes suivantes et nous étudierons si les modèles sont processus de régression par étapes mis en œuvre pour le modèle MLR d'été de la charge
capables de décrire de manière adéquate le changement progressif. Campus. La figure montre également les coefficients, les statistiques t, les valeurs p et les
intervalles de confiance de chaque paramètre. Les paramètres indiqués en bleu sont
ceux qui sont inclus dans le modèle final.
4.2.2. Modèle de régression linéaire multiple (MLR) avec paramètres L'historique du modèle montre la progression de la RMSE avec l'ajout de
climatiques et temporels chaque paramètre au modèle d'été. Le paramètre X1 était le premier
Pour les modèles MLR, la méthode de régression pas à pas vers l'avant a été inclus car il a entraîné un R2 adj.valeur de 0,73. Paramètres suivants X2, X5,
mise en œuvre. Dans une régression pas à pas vers l'avant, le modèle initial ne X4, X10 et X3 ont été ajoutés car tous ont amélioré le modèle global R2 adj..
n'incluent aucun des prédicteurs de régression. Outre le R2 adj.Critères Les paramètres X6, X7, X8 et X9 n'ont pas été inclus dans le modèle car chacun
qui ont déjà été discutés dansArticle 3.7.3, chaque prédicteur doit avoir une avait des valeurs de p supérieures à 0,05. En particulier, les paramètres X7 et X8
valeur de p inférieure à 0,05 pour être inclus dans le modèle. En plus des (Humidex et Enthalpie) avaient des valeurs de p proches de 1, ce qui indique que
paramètres climatiques qui ont été utilisés dans les modèles de régression les deux ont très peu de signification en tant que prédicteurs de la charge
unique, de nouveaux prédicteurs temporels sont introduits et les électrique du Campus lorsqu'ils sont utilisés avec d'autres paramètres choisis. Le
paramètres candidats initiaux consistent en : paramètre X1 était le prédicteur le plus significatif pour tous les modèles
(R2adj.~ 0,8), suivi de X2. Le paramètre DBT a été inclus dans tous
• Charge de la même heure le jour précédent (X1) d'autres modèles saisonniers alors que l'humidité relative n'était incluse que dans le modèle de printemps.

• Même charge horaire la semaine précédente (X2)

• Charge moyenne des 24 h précédentes (X3) Dans le cas des modèles saisonniers pour le TETB, RH a été inclus dans les
• Indicateur binaire jour ouvré / jour férié (X4) modèles d'été, d'hiver et de printemps, tandis que DBT n'a été inclus que dans les
• DBT (X5) modèles d'automne et d'hiver. Il est important de noter que dans tous les
• Droite (X6) modèles, les quatre premiers paramètres du modèle à choisir par la régression
• Humidex (X7) pas à pas consistaient en des paramètres temporels et des paramètres de travail.

1112
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

FIGUE. 4.Résumé de la régression pas à pas pour le modèle MLR d'été pour la charge du campus.

indicateur binaire jour / jour férié (X1 - X4) et chaque fois qu'un paramètre les modèles ont montré une performance légèrement meilleure pour les charges Campus que le TETB. De

climatique était inclus dans le modèle, il n'avait que la 5e priorité ou moins. Le fait plus, les meilleures performances ont été affichées sur l'ensemble de données d'hiver.

que l'humidité relative et l'enthalpie n'aient pas été incluses dans trois des
modèles saisonniers Campus et deux des modèles saisonniers TETB est inhabituel
4.2.3. Analyse en composantes principales
étant donné qu'environ 60 % de la charge du bâtiment TETB est due au CVC. De
En plus de l'analyse par étapes, une matrice de corrélation a été tracée
plus, le campus compte de nombreux bâtiments comme le TETB et tous ont des
afin de mesurer la corrélation linéaire entre chacun des paramètres MLR,
charges CVC élevées. Cela pourrait être une indication que l'inclusion des
comme indiqué dansTableau 7. Cela a été fait pour diagnostiquer des
paramètres de charge temporelle tels que X1, X2 et X3 pour les prévisions horaires
paramètres hautement corrélés et donc prévenir tout problème de
journalières apporte des informations qui sont initialement contenues dans les
colinéarité possible.
paramètres climatiques. Cela peut entraver l'inclusion de certains paramètres
Les paramètres climatiques DBT, humidex et enthalpie se sont avérés avoir une
climatiques dans les modèles MLR lors de l'utilisation de la méthode de régression
corrélation linéaire élevée entre eux (la plus élevée entre l'humidex et l'enthalpie à 0,97),
progressive vers l'avant, même s'ils se sont avérés être un paramètre significatif
ce qui était attendu car les deux derniers sont des fonctions de DBT. Cette corrélation
en eux-mêmes dans une analyse de régression unique.
élevée n'a pas été observée pour l'humidité relative, puisqu'elle n'a été incluse
Une fois la formation MLR par étapes terminée et les paramètres finaux du modèle
qu'indirectement dans le calcul de l'humidex et de l'enthalpie[50]. Pour les paramètres
déterminés, les modèles ont été testés sur les ensembles de tests saisonniers 2014
temporels, la charge de la même heure du jour précédent et la charge de la même heure
correspondants. En plus de l'analyse SLR, les modèles MLR ont également été testés sur
de la semaine précédente ont montré une corrélation élevée à 0,84.
des sous-ensembles de formation et de test aléatoires avec une méthode de validation
Si un paramètre est une combinaison linéaire d'autres paramètres, alors le
croisée de 10 fois. Les résultats sont présentés dansTableau 6.
modèle a une multicolinéarité (comme introduit dansSection 3), et la méthode du
Il est clair que les modèles MLR ont surpassé tous les modèles SLR. Les prédicteurs
facteur d'inflation de la variance (VIF) peut être utilisée pour évaluer le niveau de
temporels supplémentaires ont grandement amélioré le bien-être de l'ajustement, ce qui
multicolinéarité. Pour chaque paramètre, le VIF est calculé en divisant la variance
a entraîné des erreurs plus petites. De plus, les paramètres temporels ont pu capturer le
de son coefficient de régression dans le modèle complet par la variance de son
changement de pas dans une certaine mesure sans avoir besoin d'une correction de
coefficient de régression pour son ajustement de régression unique. En règle
biais, comme cela était requis pour l'analyse SLR. On peut voir que le
générale, les valeurs VIF supérieures à 10 sont une indication de

Tableau 6
Résultats du modèle MLR de validation saisonnière et croisée pour les prévisions de charge d'électricité horaire du jour à l'avance.

Campus TETB

2 2
Modèle R adj. RMSE (%) MBE (%) CARTE Radj. RMSE (%) MBE (%) CARTE

L'été 0,87 7,95 - 1,68 5,50 0,88 10.08 5.17 7.71


Automne 0,83 9.43 - 6.13 6,99 0,91 6,82 - 4,54 5.16
Hiver 0,93 4.32 1,97 3.49 0,96 5.03 2,69 4.06
Saut 0,89 6,98 - 2,50 4,55 0,90 5.44 3,64 4.29
CrossVal 0,89 6,98 0,43 4,75 0,94 7,75 0,61 5,50

1113
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 7
Matrice de corrélation des paramètres MLR.

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

X1 1,00 0,84 0,49 0,11 0,15 - 0,36 0,04 - 0,05 0,40 0,24
X2 0,84 1,00 0,42 0,30 0,13 - 0,34 0,03 - 0,06 0,40 0,03
X3 0,49 0,42 1,00 0,40 - 0,22 - 0,09 - 0,26 - 0,29 0,00 0,27
X4 0,11 0,30 0,40 1,00 0,00 - 0,02 - 0,01 - 0,02 0,00 0,00
X5 0,15 0,13 - 0,22 0,00 1,00 - 0,29 0,95 0,85 0,24 0,03
X6 - 0,36 - 0,34 - 0,09 - 0,02 - 0,29 1,00 - 0,01 0,22 - 0,25 - 0,03
X7 0,04 0,03 - 0,26 - 0,01 0,95 - 0,01 1,00 0,97 0,18 0,02
X8 - 0,05 - 0,06 - 0,29 - 0,02 0,85 0,22 0,97 1,00 0,12 0,02
X9 0,40 0,40 0,00 0,00 0,24 - 0,25 0,18 0,12 1,00 0,01
X10 0,24 0,03 0,27 0,00 0,03 - 0,03 0,02 0,02 0,01 1,00

multicolinéarité[51]. Dans ce cas, tous les paramètres climatiques (X5 – X8) ont 4.3. Analyse de régression sur les charges de pointe quotidiennes à l'aide de modèles MLR
montré des valeurs VIF de l'ordre de 100.
La matrice de corrélation et la méthode VIF ont montré qu'il existe une Comme mentionné précédemment, la prévision des charges de pointe
multicolinéarité dans les paramètres prédictifs choisis. Comme discuté dansArticle est d'une importance primordiale pour les activités de gestion de la
3.7.1, une façon de résoudre le problème de la multicolinéarité consiste à utiliser demande maximale, et son analyse nécessite donc une attention
l'analyse en composantes principales (ACP). L'ACP crée de nouveaux prédicteurs particulière.Tableau 8présente les statistiques récapitulatives des charges
en utilisant des combinaisons linéaires des paramètres existants là où la électriques de pointe quotidiennes du Campus et du TETB pour les années
multicolinéarité n'existe pas dans les nouveaux paramètres. Étant donné que les 2013 et 2014. Les données sont analysées pour les jours ouvrables /
paramètres prédicteurs ont des unités différentes et ont des variances différentes, ouvrables et séparées entre quatre saisons (les vacances / week-ends sont
ils sont mis à l'échelle en les divisant par leurs variances respectives présentés séparément à la fin du tableau ). Le TETB a connu la charge de
[52]. En utilisant la matrice de corrélation montrée précédemment, dix pointe la plus élevée pendant l'hiver; cependant le printemps a la valeur
composants principaux (vecteurs propres) ont été trouvés. Ces composants moyenne la plus élevée. Le Campus, d'autre part, a connu le pic le plus élevé
principaux ont été triés en fonction de leurs valeurs propres, où l'importance à l'automne, qui a également la moyenne la plus élevée. Cela a du sens
relative des composants principaux est indiquée dansFIGUE. 5. Les sept premières puisqu'en Australie, la saison d'automne commence le 1er mars, ce qui
composantes principales étaient suffisantes pour expliquer presque 100 % de coïncide avec le début du semestre universitaire.
variance dans les paramètres prédicteurs. Ces sept composantes principales ont Il y a une augmentation significative des charges de pointe quotidiennes
été utilisées pour construire la nouvelle matrice de prédiction, composée de sept moyennes entre 2013 et 2014 (11 % et 27 % des moyennes 2013 pour le Campus
nouveaux paramètres au lieu de dix. et le TETB respectivement). Comme mentionné précédemment, une unité de
En utilisant les sept nouveaux paramètres, la formation et les tests ont été mis en trigénération fonctionnait pendant les jours de semaine à une puissance nominale
œuvre pour chacun des modèles saisonniers. Cependant, les nouveaux composants de 746 kW qui utilisait du gaz naturel comme combustible. Cette unité a été
principaux n'ont pas entraîné d'amélioration significative des modèles fermée au début de 2014, d'où environ 7 % de l'augmentation de pointe
Radj. 2et précision. En fait, les erreurs obtenues étaient très similaires aux résultats de quotidienne de l'électricité du réseau du campus, peut être attribuée à la
régression pas à pas présentés précédemment. Cela indique que la méthode par étapes fermeture de cette unité. De plus, l'augmentation des activités de laboratoire et de
était une méthode de sélection de paramètres adéquate pour l'ensemble de données et classe au sein du TETB en 2014 explique une partie de l'augmentation des charges
ne nécessitait pas d'étapes supplémentaires pour résoudre le problème de de pointe subies par le bâtiment.
multicolinéarité. Les paramètres utilisés dans la section précédente ont été modifiés afin d'intégrer la
demande de pointe et la demande minimale. Le nouveau modèle de crête MLR consistait
en :

FIGUE. 5.Nouveaux composants principaux vs variance expliqués dans les paramètres.

1114
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 8 performances dans la prévision des charges horaires journalières par rapport aux charges de
Statistiques récapitulatives pour les charges de pointe quotidiennes.
pointe quotidiennes pour TETB et le Campus (voirTableau 6).

Max Quelque Signifier Std


4.3.1. Charges de pointe quotidiennes vs DBT & RH
Campus (kW) Il a été noté précédemment que la consommation d'électricité entraînée par le
L'été 14 256 5435 10 710 1736 refroidissement CVC a été identifiée comme le principal contributeur aux charges de pointe
Automne 14 874 7743 11 931 1453
[54]à NSW, Australie. Par conséquent, cela conduit à s'attendre à ce que les charges de
Hiver 12 523 6889 10 831 829
pointe les plus élevées se produisent pendant les mois d'été (décembre,
Saut 13 762 9249 11 148 906
Année 2013 14 030 5435 10 636 1266 janvier et février). Cependant, ce n'était pas le cas pour le bâtiment
Année 2014 14 874 7113 11 818 1302 Campus et TETB pour les périodes analysées.FIGUE. 6a et c montrent le
Week-ends / Vacances 10 250 5316 8389 834 relation entre les pointes de charge quotidiennes et la DBT quotidienne maximale
correspondante pour les jours ouvrables. On peut observer qu'il n'y a pas de
TETB (kW)
L'été 518 117 362 73 relation significative entre les charges de pointe quotidiennes et la DBT
Automne 493 218 394 61 quotidienne maximale (le R2des ajustements linéaires ont été observés autour de
Hiver 522 162 399 71 0,09 et 0,03 pour le Campus et le TETB respectivement). Tant pour le campus que
Saut 517 313 414 41
pour le TETB, les pics les plus élevés se sont produits à une DBT quotidienne
Année 2013 462 117 348 50
Année 2014 522 267 443 45 maximale (27 ° C et 19 ° C respectivement) plutôt qu'à une DBT estivale plus
Week-ends / Vacances 434 123 285 68 élevée. Cette relation faible indique que d'autres facteurs influencent les charges
de pointe autres que le DBT pour ces cas particuliers.

• Charge de pointe du jour précédent (X1)


FIGUE. 6b et d étudient plus en détail la relation entre les charges de pointe quotidiennes et

• Charge minimale du jour précédent (X2)


les valeurs d'humidité relative maximales quotidiennes correspondantes. Encore une fois, la

• Pic de charge de la semaine précédente (X3)


relation entre l'humidité relative maximale quotidienne et la charge de pointe quotidienne pour

• Chargement minimum de la semaine précédente (X4)


le campus et le TETB s'est avérée faible. Normalement, une augmentation de l'humidité relative

• Indicateur binaire de vacances / jours ouvrables (X5)


entraînerait une augmentation de la charge latente de CVC, ce qui pourrait conduire à s'attendre

• DBT (X6)
à une demande d'électricité de pointe plus élevée.

• Droite (X7)
Puisqu'il existe de nombreux laboratoires, salles de classe et autres installations dans un

• Humidex (X8)
environnement universitaire, l'occupation devient un facteur très important qui peut affecter

• Enthalpie (X9)
considérablement les pics. Ce facteur est très probablement la raison pour laquelle le campus et
le TETB ne connaissent pas les pics quotidiens les plus élevés pendant l'été (généralement

• Heure du jour (X10)


lorsque les taux de DBT et d'HR les plus élevés se produisent), car la plupart des étudiants et du

• Jour de la semaine (X11)


personnel sont en vacances.

4.4. Analyse du modèle d'apprentissage automatique


À l'aide de ces paramètres, quatre modèles MLR saisonniers ont été construits
pour prédire les charges de pointe quotidiennes. L'analyse par étapes a montré
Les modèles d'apprentissage automatique peuvent avoir différents objectifs en termes de
que le premier paramètre du modèle à inclure était X5, ce qui indique l'importance
minimisation des erreurs (également appelée fonction de coût). Tous les modèles
de l'indicateur binaire Vacances / Jour ouvrable pour expliquer la variation des
d'apprentissage automatique implémentés utilisés dans cette étude ont utilisé la méthode des
charges de pointe quotidiennes (la différence entre la pointe quotidienne
moindres carrés pour la fonction de coût.
moyenne pour les jours ouvrables et les jours fériés était d'environ 1500 kW et 60
Semblable à l'analyse MLR, tous les modèles d'apprentissage automatique ont été
kW pour le Campus et le TETB respectivement). Les paramètres X5 ; X3, X1, X4 et
initialement formés avec des sous-ensembles saisonniers des données de 2013 et testés
X10 étaient les autres prédicteurs les plus significatifs des charges de pointe
sur les sous-ensembles saisonniers correspondants de 2014. De plus, un autre modèle a
quotidiennes. La seule variable climatique incluse dans les modèles MLR était DBT
été formé en utilisant l'ensemble de données complet, de sorte que le les données
(X6) car aucune autre variable climatique n'avait de valeurs p inférieures à 0,05.
complètes ont été réparties au hasard et validées 10 fois. Tous les ensembles de données
Les modèles MLR saisonniers ont montré une assez bonne performance pour le
de formation ont ensuite été partitionnés et 70 % des données ont été affectées à la
Campus, cependant le MBE a été observé comme étant significatif pour les charges de
formation et 30 % à la validation croisée. Les résultats obtenus à partir des sous-
pointe TETB (supérieures à 20%). Cette erreur de biais élevée était un indicateur d'un
ensembles de données saisonnières ont été représentés par les saisons été, automne,
modèle sous-ajusté, qui n'a pas réussi à capturer l'augmentation des charges de pointe
hiver et printemps ; tandis que les résultats obtenus en utilisant l'ensemble de données
quotidiennes TETB entre les années 2013 et 2014. Afin de résoudre le problème, deux
complet étaient représentés par « 2013-2014 ».
méthodes supplémentaires ont été essayées.[53]:

• Introduction de nouveaux paramètres au modèle


4.4.1. Réseaux de neurones artificiels (ANN)

• Utilisation d'un ensemble d'entraînement plus large


Suite à l'analyse MLR, des modèles ANN ont été mis en œuvre pour les
prévisions de charge de pointe journalières et horaires. Les modèles ANN
intègrent différentes couches d'entrée, cachées et de sortie pour expliquer les
Par conséquent, des paramètres polynomiaux supplémentaires de second et
relations complexes et non linéaires entre les entrées et les sorties. Pour cette
troisième ordre ont été introduits dans le modèle pour X1, X2, X3 et X4. Les erreurs
étude, la couche d'entrée se composait des mêmes variables prédictives utilisées
minimales ont été obtenues en utilisant X1 comme paramètre polynomial ; cependant, le
dans l'analyse MLR qui sont activées par une fonction tangente hyperbolique
problème de biais n'a pas été résolu par cette méthode. Afin de tester l'effet de
(sigmoïde), et sont ensuite introduites dans la couche cachée unique. Cette étude
l'utilisation d'un ensemble d'entraînement plus large, les modèles ont été entraînés avec
a suivi la pratique courante consistant à utiliser un seul réseau de couches cachées
une année entière de données (2013) et testés sur les saisons 2014. Le plus grand
au lieu de plusieurs couches pour les applications de prévision[55]. D'autre part,
ensemble de données a été mis en œuvre sur les modèles initiaux sans utiliser de termes
afin de choisir le nombre optimal de neurones (paramètres d'entrée appris) dans
polynomiaux. L'utilisation d'un plus grand ensemble d'apprentissage a entraîné une
la couche cachée, l'entraînement a été effectué avec un nombre différent de
réduction des erreurs.Tableau 9résume les résultats obtenus pour le modèle Campus
neurones (de 5 à 30). Le nombre optimal de neurones s'est avéré être de 10, sur la
saisonnier (formé avec les saisons 2013 correspondantes) et le modèle TETB (formé avec
base d'erreurs de validation croisée. La couche de sortie était constituée d'un
l'ensemble des données 2013).
neurone activé par une fonction de régression linéaire.
On peut observer que quatre modèles sur cinq ont mieux réussi à prédire les
charges de pointe du campus. De plus, les modèles ont montré une meilleure
Les modèles ANN utilisés dans notre analyse étaient les modèles Levenberg-

1115
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 9
Résultats pour les charges de pointe quotidiennes par les modèles MLR.

Campus (formé avec des données saisonnières) TETB (formé avec des données sur toute l'année)

2 2
Modèle Radj. RMSE (%) MBE (%) CARTE Radj. RMSE (%) MBE (%) CARTE

L'été 0,85 7.34 2.12 6.18 0,86 11.94 5.45 9h35


Automne 0,84 8.12 - 1,90 6.45 0,87 9.02 6.10 7.23
Hiver 0,81 6.29 - 2,55 5.27 0,85 6.45 2.29 5.63
Saut 0,90 12.03 - 11h28 11.28 0,86 9.13 5,69 7,56
CrossVal 0,85 6,74 0,47 5.15 0,90 7.28 0,85 6,50

FIGUE. 6.Charges de pointe quotidiennes vs DBT quotidiennes maximales (° C) et HR (%) pour le campus et TETB, a) DBT de pointe pour la charge du campus, b) HR de pointe pour la charge du campus, c) DBT de pointe pour la charge TETB, et d) Pic
RH pour la charge Campus.

Modèles de rétropropagation de Marquardt (LM) et de rétropropagation de défini par le théorème de Bayes. Prière de se référer à[56]pour des informations
régularisation bayésienne (BR).FIGUE. 7démontre l'architecture ANN la plus plus détaillées et une comparaison de ces méthodes.
performante oùwetbcorrespond respectivement à l'unité de poids et de biais (le Une caractéristique importante d'ANN est la possibilité d'utiliser un paramètre de
biais représente ici le vecteur unitaire de représentation des termes constants régularisation, en particulier pour faire face à des problèmes de surajustement. Une
dans la couche cachée). LM utilise une technique de rétropropagation standard gamme de différentes valeurs de paramètres de régularisation pour le réseau a été
pour calculer la matrice jacobienne sans calculer la matrice hessienne, ce qui est essayée. Cependant, cela n'a pas permis d'obtenir des améliorations significatives par
une tâche beaucoup plus complexe. Dans la méthode BR, les poids du réseau sont rapport au réseau par défaut sans paramètre de régularisation. Les résultats sont
traités comme des variables aléatoires (distribution gaussienne) et les paramètres présentés dansTableaux 10 à 13.
de la fonction d'optimisation sont
4.4.2. Réseaux de neurones artificiels dynamiques avec entrées exogènes Le
réseau autorégressif non linéaire avec entrées exogènes (NARX) est un
mélange de méthodes de réseau de neurones et de séries chronologiques et est
basé sur le modèle linéaire autorégressif avec entrées exogènes (ARX). Avec
l'inclusion de la série chronologique, l'ANN devient un réseau dynamique où la
sortie est régressée sur ses valeurs précédentes et les valeurs précédentes
d'autres variables exogènes (par exemple les variables climatiques dans notre
exemple). L'architecture de la méthode NARX est présentée dans FIGUE. 8. Le
paramètre supplémentaire pour un tel réseau est le pas de temps de retard pour
FIGUE. 7.Architecture ANN la plus performante avec une seule couche cachée et 10 neurones l'ensemble d'apprentissage. L'apprentissage du réseau se fait en boucle ouverte et
[57]. le test se fait en boucle fermée où la charge est

1116
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 10
Résultats RMSE (%) de tous les modèles sur la charge électrique de pointe journalière et horaire du jour suivant.

Modèle MLR NN ML NN BR NARX LM NARX BR RT RVS MLR NN ML NN BR NARX LM NARX BR RT RVS

Prévision horaire du campus RMSE (%) Prévision horaire TETB RMSE (%)
L'été 7,95 4,72 4.36 2.34 1,82 7.09 7,43 10,08 7,09 6,66 2,83 2,74 8,94 8.63
Automne 9,43 3,97 3.29 1,85 1,88 7.02 5,97 6,82 3,70 3.28 2.11 1,98 9h15 5.17
Hiver 4,32 2,34 2.05 1,56 1h30 5,96 4,58 5,03 2,94 2,81 1,99 1,89 7,95 4.41
Saut 6,98 4,09 3.10 2.15 1,76 7.49 5,02 5,44 4,69 3,56 2.41 2.33 9.54 6,50
2013-2014 6,98 4,25 3,89 1,92 1,87 6.18 5,99 7,75 4.81 4.53 2.41 2.22 7,99 6.01

Campus RMSE maximal quotidien (%) TETB pic quotidien RMSE (%)
L'été 7,66 7,83 5.53 9,73 7.58 12,39 8,24 11,94 10,80 9.21 11.74 9.29 17.15 13.49
Automne 9,28 4,50 4.00 8,87 6.38 8,25 7,03 9,02 6,82 5.63 7.09 6.38 8,67 7,38
Hiver 6,44 2,62 2,60 9.34 2.71 5,02 6,95 6,45 6,03 5.64 10h42 5,60 8,11 6,89
Saut 12,64 5,00 6,93 8.21 6.20 7,53 8,01 9,13 4,77 2.61 10.80 7.08 9,63 8,78
2013-2014 6,83 6,34 4.35 8,85 4,92 7,83 6,41 8,01 7,08 5,96 8,98 6.35 9,47 10,94

alimenté de manière récurrente en lui-même en tant qu'entrée. Pour une telle dansTableaux 10 à 13.
configuration, le NARX peut effectuer autant de prédictions que la série d'entrée a
de pas de temps[58]. Semblable à l'analyse précédente, les algorithmes BR et LM
ont été utilisés pour les prévisions journalières horaires et de charge de pointe. Il a
été observé que le modèle BR surpassait le modèle LM dans ce cas. Cependant,
4.5. Prise en charge de la régression vectorielle
cette fois, la mise en œuvre du modèle BR a nécessité beaucoup plus de temps de
calcul que ce dernier. Les résultats sont affichés dansTableaux 10 à 13.
Support Vector Regression (SVR) est une méthode de machines à vecteurs de
support utilisée pour résoudre des problèmes de régression numérique.
Semblables aux modèles ANN, les vecteurs d'entrée sont transformés en espaces
4.4.3. Arbres de régression de dimension supérieure. La transformation peut être effectuée à l'aide de
L'analyse par arbre de régression est effectuée en utilisant les mêmes paramètres fonctions de similarité (noyaux). Parmi les différentes méthodes de noyau, le
d'influence pour les prévisions de charge de pointe journalières et horaires journalières. noyau gaussien (RBF) a été utilisé pour l'étude en raison de sa large utilisation
Deux paramètres importants affectant les performances des arbres de régression ont été dans la littérature.[60]. Par rapport à la régression linéaire, SVR définit de
optimisés au cours de la formation. Le premier était la taille minimale des feuilles de nouvelles marges notées ε qui régressent le long de la ligne avec les marges (tube
l'arbre où chaque feuille a au moins le nombre d'observations de taille minimale des SVR). Les points qui tombent dans les limites du tube ne sont pas considérés
feuilles par feuille d'arbre[59]. Un arbre profond avec de nombreuses feuilles sur-ajuste comme des erreurs, mais ceux qui tombent à l'extérieur le sont (notés par ξ)[34](
généralement les données, et bien qu'il montre une grande précision sur l'ensemble FIGUE. dix).
d'apprentissage, il peut ne pas montrer une performance similaire sur l'ensemble de test. L'analyse SVR a été réalisée à l'aide de LibSVM[48]dans l'environnement MATLB. LibSVM a
Un arbre peu profond peut ne pas atteindre une précision d'entraînement aussi élevée requis la mise à l'échelle (également connue sous le nom de mise à l'échelle des fonctionnalités)
qu'un arbre profond ; cependant, sa précision de test est plus similaire à sa précision des paramètres d'influence ; par conséquent, avant de commencer l'analyse, toutes les variables
d'entraînement[59]. Par conséquent, une taille de feuille optimale doit être trouvée. prédictives ont été mises à l'échelle en utilisant la méthodologie décrite dans
FIGUE. 9 montre l'erreur de validation croisée de l'arbre de régression pour la charge [61]. Suite à la mise à l'échelle des caractéristiques, les matrices d'entrée ont été
horaire Campus day ahead avec une taille de feuille variable. La taille optimale des formées et validées 10 fois pour chaque modèle saisonnier. Semblable à l'analyse
feuilles pour les charges électriques horaires du Campus et du TETB était respectivement ANN, des paramètres SVR importants ont été ajustés pour obtenir la RMSE
de 5 et 43. minimale sur l'ensemble de validation croisée. En plus des marges ε, deux autres
L'autre paramètre important est le niveau d'élagage de l'arbre, qui ajuste la paramètres importants ont également été optimisés sur des ensembles de
profondeur (feuillage) de l'arbre de régression en fusionnant les feuilles sur la même validation croisée ; C, le paramètre de régularisation de la fonction de coût, et γ, le
branche[59]. Le niveau d'élagage optimal peut également être trouvé en observant paramètre Kernel. Cela a été fait en introduisant une plage de valeurs différentes
l'erreur de validation croisée, similaire à la taille de la feuille. Après le processus pour chaque paramètre dans les boucles for tout en observant l'erreur RMSE. Les
d'élagage, les niveaux d'élagage optimaux se situaient entre 40 et 60, alors que les paramètres optimaux se sont avérés être : C = 500 et 1000, ε = 5 et 1, γ = 16 et 0,5
niveaux d'élagage d'origine étaient de l'ordre de 100. Une fois ces deux paramètres pour les charges de pointe journalières et horaires journalières respectivement.
optimisés pour chaque modèle saisonnier, des arbres de régression sont construits. Les Les résultats de l'analyse SVR sont présentés dans Tableaux 10 à 13.
résultats des modèles d'arbre de régression sont donnés

Tableau 11
Résultats MAPE de tous les modèles sur la charge électrique de pointe horaire et journalière du jour suivant.

Modèle MLR NN ML NN BR NARX LM NARX BR RT RVS MLR NN ML NN BR NARX LM NARX BR RT RVS

Prévisions horaires du campus MAPE Prévision horaire TETB MAPE


L'été 5,50 4,64 4,60 1,59 1.36 3,90 5,42 7,71 4,64 4,60 2.54 2.19 5,23 5,42
Automne 6,99 2,61 2,64 1.52 1.40 3,25 3,82 5,16 2,61 2,64 1.49 1.51 3,25 3,82
Hiver 3,49 3,42 2.31 1.25 1.04 2,31 3,69 4,06 3,42 2.31 1.43 1,45 5,63 3,69
Saut 4,55 3,21 3.11 1,57 1.33 5,41 5,55 4,29 3,21 3.11 2.14 1,79 8,60 5,55
2013-2014 4,75 3,49 3.29 1.36 1.33 4,61 4,32 5,50 3,49 3.29 1,75 1,73 7,55 4,32

Campus MAPE Daily Peak TETB pic quotidien MAPE


L'été 6,18 5,24 3.51 9h30 4,97 6.02 7.38 9,35 7,93 8.19 9,74 4.14 9.30 9.53
Automne 6,45 3,66 1,98 6.06 2.03 6,53 6,11 7.23 4.06 3,77 7,90 5.23 6,01 6,36
Hiver 5,27 2,12 1.18 3.07 1.01 3,23 4,19 5.63 4.62 1,76 7,56 1.23 4,59 4,39
Saut 11,28 3,25 1.18 7.11 6.01 5,23 6,02 7,56 3,55 0,95 8.29 1,74 7,28 7,23
2013-2014 5,15 4,36 3.31 4,99 3,77 4,71 5,82 6,50 4.49 3.62 6.29 4.44 5,94 7,53

1117
B.Yildiz et al. Examens des énergies renouvelables et durables 73 (2017) 1104–1122

Tableau 12
Formation R2résultats de tous les modèles.

Modèle MLR NN ML NN BR NARX LM NARX BR RT RVS MLR NN ML NN BR NARX LM NARX BR RT RVS

Formation sur le campus R2 Formation TETB R2


L'été 0,87 0,95 0,97 0,99 0,99 0,88 0,96 0,88 0,97 0,96 0,99 0,99 0,86 0,96
Automne 0,83 0,97 0,98 0,99 0,99 0,87 0,96 0,91 0,99 0,99 0,99 0,99 0,85 0,95
Hiver 0,93 0,98 0,99 0,99 0,99 0,91 0,96 0,96 0,97 0,99 0,99 0,99 0,86 0,94
Saut 0,89 0,92 0,97 0,98 0,99 0,86 0,94 0,90 0,98 0,98 0,98 0,99 0,84 0,94
2013-2014 0,89 0,97 0,97 0,99 0,99 0,90 0,93 0,94 0,98 0,97 0,99 0,99 0,87 0,95

Formation sur le campus R2 Formation TETB R2


L'été 0,85 0,92 0,86 0,74 0,83 0,86 0,78 0,86 0,86 0,86 0,74 0,85 0,82 0,79
Automne 0,84 0,90 0,94 0,81 0,91 0,84 0,80 0,87 0,93 0,93 0,81 0,89 0,84 0,82
Hiver 0,81 0,95 0,97 0,85 0,92 0,92 0,83 0,85 0,98 0,98 0,85 0,94 0,83 0,85
Saut 0,90 0,90 0,94 0,68 0,69 0,87 0,76 0,86 0,98 0,98 0,68 0,88 0,85 0,82
2013-2014 0,85 0,89 0,93 0,85 0,94 0,88 0,79 0,90 0,95 0,95 0,85 0,93 0,87 0,93

5. Résultats & discussions

Les tableaux suivants montrent le RMSE (%), MAPE, R2et MBE (%) résultats pour tous
les modèles mis en œuvre sur les prévisions de pointe horaires et quotidiennes. On peut
voir que NARX avec rétropropagation de régulation bayésienne a montré la meilleure
performance globale sur les prévisions de charge horaire du jour à l'avance et ANN avec
rétropropagation de régulation bayésienne a montré la meilleure performance globale
sur les prévisions de charge de pointe quotidiennes. Les modèles ANN ont montré un R
d'entraînement très élevé2performance and their MBE (%) were much smaller compared
to other machine learning models.
Fig. 11a, b, c and d show scatter plots of actual loads vs model Fig. 8. NARX Architecture for closed loops [57].
predictions for SVR, MLR, RT and NARX BR models respectively on day
ahead hourly predictions for the Campus load data for the test period
from June 16 to June 23, 2014. Day ahead hourly forecast plots for all
the models on the Campus load for the same period is shown in Fig. 12.
Furthermore, Figs. 13 and 14 show the best and worst performing
models, NARX BR and RT, for the TETB day ahead hourly forecasts,
again using the same example week period.
The ANN models showed very small bias errors over all the seasonal
models ( < 1%). The MLR models showed initially high bias on daily peak
forecasts (20% avg.). However, the error was reduced to an average
value of 5% after training the models with a whole year's worth of data
rather than a single seasonal data set. Both the SVR and RT models
initially suffered from bias errors on both hourly and daily peak loads
for the Campus loads ( > 15% for 2014 Autumn and 10% on average). As
previously discussed, there was a step change in the Campus electricity
demand from the grid due to the closure of the trigeneration unit in
2014; hence, the high bias error could be attributed to the models not
being able to capture this step change. When the training data set was
increased to involve some portion of the 2014 data (test sets were still
left independent of the training set), the bias errors reduced
significantly to levels below < 5% on average. In addition to using larger
Fig. 9. Leaf Size vs Cross-Validation Error on Campus Hourly Load.
data sets, SVR models were tested with smaller numbers of the
influence parameters. The models showed a better

Table 13
MBE (%) results of all the models on day ahead hourly and daily peak electricity load.

Model MLR NN LM NN BR NARX LM NARX BR RT SVR MLR NN LM NN BR NARX LM NARX BR RT SVR

Campus Hourly Forecast MBE (%) TETB Hourly Forecast MBE (%)
Summer − 1.68 0.05 − 0.04 0.00 0.00 1.12 1.39 3.94 0.01 0.01 0.03 0.00 0.51 1.39
Autumn − 6.80 0.01 − 0.19 − 0.08 − 0.01 − 0.83 2.33 − 4.57 0.04 0.01 0.00 − 0.02 − 0.92 2.33
Winter 1.97 0.03 0.00 − 0.01 0.00 − 0.53 2.21 2.49 −0.08 0.00 0.04 − 0.01 − 1.43 2.21
Spring − 3.88 − 0.10 − 0.01 0.11 − 0.01 − 1.17 1.21 1.41 0.04 0.01 − 0.05 − 0.01 − 6.16 5.24
2013–2014 1.21 − 0.11 − 0.01 0.03 − 0.01 − 1.84 5.24 0.95 −0.03 0.01 0.00 0.01 − 5.10 2.15

Campus Daily Peak MBE (%) TETB Daily Peak MBE (%)
Summer 3.09 1.28 − 0.30 0.16 0.34 3.76 2.65 5.45 −1.65 − 1.14 1.73 − 0.14 4.63 2.64
Autumn − 6.35 − 0.04 − 0.06 − 2.93 0.01 − 3.05 3.32 6.10 0.30 − 0.05 1.24 0.08 − 2.85 1.63
Winter − 3.84 0.22 0.06 0.19 − 0.16 − 0.78 2.47 2.29 − 0.40 − 0.05 − 0.19 − 0.28 − 2.31 1.09
Spring − 12.02 0.17 − 0.75 − 1.78 0.06 − 2.54 0.45 5.69 0.14 0.21 2.65 1.13 − 3.09 0.57
2013–2014 0.47 1.18 − 0.06 0.60 − 0.23 0.08 1.58 0.85 1.89 − 0.01 0.56 0.13 2.22 2.64

1118
B. Yildiz et al. Renewable and Sustainable Energy Reviews 73 (2017) 1104–1122

produce meaningful results on the test sets. Some authors have


pointed out the difficulties involved in forecasting data sets which have
complex seasonalities [63,64]. This study's unsuccessful attempts at
using ARIMA models for forecasting can be attributed to not being able
to remove the seasonal non-stationarities within the data set.

6. Conclusion

From a review of the literature it was found that regression models


are commonly used not only for forecasting total building electricity
loads but also for HVAC loads and retrofit savings. The DBT was the
most pronounced climate variable used in previous regression studies
and our analysis also confirmed this finding. Through the single
Fig. 10. SVR Tube with new margins and errors [34]. regression analysis, DBT was found to be the most significant predictor
for both the Campus and the TETB electricity loads amongst the other
weather parameters. When the temporal parameters were included in
performance when the climate variables were removed and the models
the MLR stepwise selection, most of the weather parameters failed to
were trained with only the temporal parameters and holiday & business
give p-values smaller than 0.05 and were not included in the final
day indicator.
models. However DBT was the only exception as it was included in
It was also noted that when models were trained with seasonal sets
almost all of the models. Another result from our study that supported
for forecasting daily peak loads, due to the relatively smaller size of the
the literature findings was the significance of holiday and business day
data set (90 points per season) increasing the number of influence
binary indicator as a predictor for building electricity loads. The
parameters helped to improve the performance of the models
significance of this parameter was even greater for the daily peak load
(especially SVR and RT).
MLR models.
A limitation of this study is not being able to incorporate ARIMA
In contrast to the literature findings where DBT based single
models in to the analysis. Various combinations of p, d and q (see
regression models showed fair forecasting capabilities [16,44], our
Section 2.2) and different transformations such as log and square root
single regression models which consisted of different climate
were investigated in order to find an improved model for this study.
parameters failed to show adequate forecast performance. This raised
This process was done after observing autocorrelation plots ACF and
the importance of other parameters which have impact on the load.
PACF and Dickey-Fuller tests [62]. However, the models did not
Especially for university Campuses and buildings, occupancy can have

Fig. 11. Predicted vs actual Campus load scatter plots for four of the models between June 16 to June 23, 2014.

1119
B. Yildiz et al. Renewable and Sustainable Energy Reviews 73 (2017) 1104–1122

Fig. 12. Campus hourly electricity load forecasts vs model predictions from June 16 to June 23, 2014.

a significant effect on electricity loads therefore it should be taken into parameters were found to improve the model performance.
account whenever possible. In stepwise regression analysis, temporal Another advantage of regression analysis over machine learning
parameters were observed to be the most significant predictors and models was found to be their straightforward implementation and
the previous day same hour was the first included variable during the relative ease of use. However for applications where forecast accuracy
selection. It is possible that some proportion of the variation brought is highly crucial, machine learning models can have a significant
about by variations in occupancy can be captured by using the past advantage over MLR models. Since forecasting peak electricity loads
values of the load in MLR models. However this needs to be further has significant importance for many commercial buildings, machine
tested with the actual occupancy data. learning models should be considered.
Most of the machine learning models used in this study showed a better This study showed that forecasting daily peak electricity loads is a
forecast performance than the MLR models however the MLR analysis more difficult task than forecasting the day ahead hourly electricity
enabled greater user engagement and control over the forecast analysis loads since all the models showed higher RMSE and bias for the former.
which is a comparative advantage of regression models over machine In addition, almost all the models showed a better forecast
learning models. Machine learning models used for the study were pre- performance for the Campus demand in comparison to the single TETB
made, highly complex optimization packages, which are often referred as demand for both day ahead hourly and peak loads. The forecast
‘black box models’. Although the mathematical background of these models analysis for smaller scale applications such as residential load
does not need to be known in detail, the user is expected to be able to know forecasting has been acknowledged as a more difficult task than
the operational principles and model diagnosis. Our analysis proved that commercial load building forecasts [65] . The same analogy can be seen
model diagnosis can be a cumbersome and time consuming process, yet the in our example where, as the scale gets bigger, smaller and
effort spent can bring significant improvements in model accuracy and instantaneous changes in consumption have a smaller impact on the
performance. In particular, utilizing a larger training set, both increasing and overall load of the Campus, therefore models can analyse and forecast
reducing the number of influence parameters and optimizing the relevant this steadier load data more accurately.
model

Fig. 13. TETB hourly electricity load vs best performing model prediction with NARX BR from June 16 to June 23, 2014.

1120
B. Yildiz et al. Renewable and Sustainable Energy Reviews 73 (2017) 1104–1122

Fig. 14. TETB hourly electricity load vs worst performing model prediction with Regression Trees from June 16 to June 23, 2014.

Acknowledgements the provided data-set and access to the equipment used to conduct this
research.
Baran Yildiz would like to thank UNSW Facilities Management for

Appendix A

Error terms

To measure and compare the performance of the models the following error terms are used:

SSE SSE n−1


R2 = 1 − (Coefficient of Determination)R 2 adj = 1 − × (Adjusted Coefficient of Determination)RMSE (%)
SST SST n−k−1
∑ni=1(yi − yi) 2
n (yi − y i)
(Root Mean Squared Error)MBE (%) = 1/n ∑
n
= × 100 (Mean Bias Error)MAPE
y i=1 yi
yi − y i
= 1/n ∑ni=1 × 100 (Mean Absolute Percentage Error)
yi

In the above equations n represents the number of observations, k is the number of influence parameters (predictors), SSE and SST are the
unexplained and total variability of the measured output (load) respectively [66].
R2 and R 2adj are used to measure the wellness of the fit by the trained models. R 2 adj is a more useful parameter for MLR than R2 since it is a
better indicator of whether introducing a new parameter adds any value to the model (regardless of the relationship with the parameter and output, adding a
new parameter to the model results in an increase in R2 however Radj 2 only increases if the parameter is actually a good predictor for the

output). For large datasets, both have similar values since the penalty term ( n−1)
n−k−1
approaches unity when n is large [66].
MAE is a commonly used average error metric which is the mean value of the sum of absolute errors. RMSE is one of the most commonly used metric for
describing uncertainty and it is a function of both MAE and the distribution of error magnitudes. RMSE penalizes the larger error terms and tends to become
increasingly larger than MAE as the distribution of the errors magnitude becomes more variable. Previous papers have discussed the advantages of using MAE
over RMSE [67] and others have favoured the use of RMSE over MAE [68]. We therefore decided to present both metrics as well as the mean bias error (MBE)
which indicates by how much the model predictions are on average above or below the average measured output value.

For our forecasting study, p-value is used to measure the statistical significance of an influence parameter on the load during stepwise
regression. Note that p-values smaller than 0.05 represent the rejection of the null hypothesis where the null hypothesis can be defined as: There is
no statistically significant relationship between a particular influence parameter and load. Therefore influence parameters which had p-values
smaller than 0.05 rejected the null hypothesis and were included in the model.

References energy efficiency; 2013.


[4] Granade HC, Creyts J, Derkach A, Farese P, Nyguist S, Ostrowski K. Unlocking energy
efficiency in the U.S. economy. McKinsey Glob Energy Mater 2009:1–165.
[1] International Energy Agency. Electricity Information. Paris; 2012. [5] Lister M Scaling the peaks : demand management in network infrastructure
[2] EIA . Electric power monthly: with data for January 2015. US Energy Inf Adm; 2015. planning key questions for the stage 3 review; 2011.
[6] Smith M, Hargroves K, Stasinopoulos P, Stephens R, Desha CH. Energy
[3] Pitt Sherry. Final report : quantitative assessment of energy savings from building transformed: sustainable energy solutions for climate change mitigation; 2007.

1121
B. Yildiz et al. Renewable and Sustainable Energy Reviews 73 (2017) 1104–1122

[7] Steinfeld J, Bruce A, Watt M. Peak load characteristics of Sydney office buildings and forecasting. 2011 IEEE PES Innov Smart Grid Technol ISGT Asia 2011 Conference
policy recommendations for peak load reduction. Energy Build Smarter Grid Sustain Afford Energy Futur; 2011 〈doi:10.1109/ISGT-Asia.2011.
2011;43:2179–87. http://dx.doi.org/10.1016/j.enbuild.2011.04.022. 6167091〉.
[8] Neto AH, Fiorelli FAS. Comparison between detailed model simulation and artificial [36] Chen B-J, Chang M-W, Lin C-J. Load forecasting using support vector machines: a
neural network for forecasting building energy consumption. Energy Build study on EUNITE competition 2001. IEEE Trans Power Syst 2004(19):1821–30. http://
2008;40:2169–76. http://dx.doi.org/10.1016/j.enbuild.2008.06.013. dx.doi.org/10.1109/TPWRS.2004.835679.
[9] Zhao H, Magoulès F. A review on the prediction of building energy consumption. [37] Tibshirani R, Wasserman L. Statistical machine learning. Carnegie Mellon Univ;
Renew Sustain Energy Rev 2012;16:3586–92. http://dx.doi.org/10.1016/ 2006. p. 1–7.
j.rser.2012.02.049. [38] Papalexopoulos AD, Hesterberg TC. A regression-based approach to short-term
[10] Alfares HK, Nazeeruddin M. Electric load forecasting: literature survey and system load forecasting – power systems. IEEE Trans Power Syst 1990;5:1535–50.
classification of methods. Int J Syst Sci 2002;33:23–34. http://dx.doi.org/10.1080/ [39] Reddy T, Claridge D. Using synthetic data to evaluate multiple regression and
00207720110067421. principal component analyses for statistical modeling of daily building energy
[11] Foucquier A, Robert S, Suard F, Stephan L, Jay A. State of the art in building consumption. Energy Build 1994;21:35–44. http://dx.doi.org/10.1016/0378-
modelling and energy performances prediction: a review. Renew Sustain Energy 7788(94)90014-0.
Rev 2013;23:272–88. http://dx.doi.org/10.1016/j.rser.2013.03.004. [40] Sever F, Kissock K, Brown D, Mulqueen S. Estimating industrial building energy
[12] Suganthi L, Samuel AA. Energy models for demand forecasting – a review. Renew savings using inverse simulation. ASHRAE Trans 2011;117:348–55.
Sustain Energy Rev 2012;16:1223–40. http://dx.doi.org/10.1016/ j.rser.2011.08.014. [41] Kissock JK, Reddy TA, Claridge DE. Ambient-temperature regression analysis for
estimating retrofit savings in commercial buildings. J Sol Energy Eng
[13] Harish VSKV, Kumar A. A review on modeling and simulation of building energy 1998;120:168. http://dx.doi.org/10.1115/1.2888066.
systems. Renew Sustain Energy Rev 2016;56:1272–92. http://dx.doi.org/10.1016/ [42] Walter T, Sohn MD. A regression-based approach to estimating retrofit savings
j.rser.2015.12.040. using the building performance database. Appl Energy 2016;179:996–1005.
[14] Ahmad AS, Hassan MY, Abdullah MP, Rahman HA, Hussin F, Abdullah H, et al. A http://dx.doi.org/10.1016/j.apenergy.2016.07.087.
review on applications of ANN and SVM for building electrical energy consumption [43] Fels M. PRISM: an introduction. Cent Energy Environ Stud Princt Univ, vol. 9; 1986.
forecasting. Renew Sustain Energy Rev 2014;33:102–9. http://dx.doi.org/ 10.1016/ p. 5–18.
j.rser.2014.01.069. [44] Lam JC, Chan RYC, Li DHW. Simple regression models for fully air-conditioned public
[15] Wang Z, Srinivasan RS A review of artificial intelligence based building energy use sector office buildings in subtropical climates. Arch Sci Rev 2002;45:361–9. http://
prediction : contrasting the capabilities of single and ensemble prediction models. dx.doi.org/10.1080/00038628.2002.9696951.
Renew Sustain Energy Rev; n.d. 0–1. http://dx.doi.org/10.1016/j.rser.2016.10. 079. [45] Kissock K, Joseph HB, McBride JR. Effects of varying indoor air temperature and heat
gain on the measurement of retrofit savings. ASHRAE Trans
[16] Katipamula S, Reddy T, Claridge DE. Multivariate regression modeling. J Sol 1998;104:895–900.
Energy Eng 1998;120:177. http://dx.doi.org/10.1115/1.2888067. [46] Morgan MG. Uncertainty: a guide to dealing with uncertainty in quantitative risk and
[17] Braun MR, Altan H, Beck SBM. Using regression analysis to predict the future energy policy analysis. New York; 1990.
consumption of a supermarket in the UK. Appl Energy 2014;130:305–13. http:// [47] Green Building Council of Australia. Introducing Green Star; 2013.
dx.doi.org/10.1016/j.apenergy.2014.05.062. [48] Chih-Wei Hsu, Chih-Chung Chang, C-JL . Library for support vector machines. ACM
[18] Katipamula S, Kissock JK, Claridge DE. The functional basis of steady- state Trans Intell Syst Technol 2011;2:27. http://dx.doi.org/10.1177/
tliermal energy use in air- side HVAC Equipment; 1995. p. 117. 02632760022050997.
[19] Nassif N. Regression models for estimating monthly energy consumptions in [49] Beccali M, Cellura M, Lo Brano V, Marvuglia A. Short-term prediction of household
schools in hot and humid climates. ASHRAE Trans 2012;118:225–32. http:// electricity consumption: assessing weather sensitivity in a Mediterranean area.
dx.doi.org/10.1080/01998595.2013.10750242. Renew Sustain Energy Rev 2008;12:2040–65. http://dx.doi.org/10.1016/
[20] Ramanathan R, Engle R, Granger CWJ, Vahid-Araghi F, Brace C. Short-run forecasts j.rser.2007.04.010.
of electricity loads and peaks. Int J Forecast 1997;13:161–74. http:// dx.doi.org/ [50] Padfield T. Equations describing the physical properties of moist air. Creat
10.1016/S0169-2070(97)00015-0. Commons 2015:1–4.
[21] Lam JC, Wan KKW, Liu D, Tsang CL. Multiple regression models for energy use in air- [51] James G, Witten D, Hastie T, Tibshirani R. An introduction to statistical learning. vol.
conditioned office buildings in different climates. Energy Convers Manag 102; 2006. http://dx.doi.org/10.1016/j.peva.2007.06.006.
2010;51:2692–7. http://dx.doi.org/10.1016/j.enconman.2010.06.004. [52] Smith LI. A tutorial on principal components analysis introduction. Department of
[22] Yang L, Lam JC, Liu J, Tsang CL. Building energy simulation using multi-years and Computer Science Univ Otago, vol. 51; 2002. p. 52. http://dx.doi.org/10.1080/
typical meteorological years in different climates. Energy Convers Manag 03610928808829796.
2008;49:113–24. http://dx.doi.org/10.1016/j.enconman.2007.05.004. [53] NG A. Advice for applying machine learning. Stanford Univ; 2015 〈https://www.
[23] Turiel I, Boschen R, Seedall M, Levine M. Simplified energy analysis methodology for coursera.org/learn/machine-learning/lecture/zJTzp/deciding-what-to-do-
commercial buildings. Energy Build 1984;6:67–83. http://dx.doi.org/10.1016/ nextrevisited〉.
0378-7788(84)90008-2. [54] Sinclair . Identification and investigation of peak demand reduction opportunities –
[24] Hygh JS, DeCarolis JF, Hill DB, Ranji Ranjithan S. Multivariate regression as an energy Sydney CBD area. Sinclair Kn Merz Consult; 2006.
assessment tool in early building design. Build Environ 2012;57:165–75. http:// [55] NG A. Neural networks learning in machine learning. Stanford Univ; 2015 〈https://
dx.doi.org/10.1016/j.buildenv.2012.04.021. www.coursera.org/learn/machine-learning/lecture/Wh6s3/putting-it-together〉.
[25] Bauer M, Scartezzini J-L. A simplified correlation method accounting for heating and [56] Jesus DE, Hagan MT. Backpropagation through time for a general class of recurrent
cooling loads in energy-efficient buildings. Energy Build 1998;27:147–54. http:// network. Proc Int Jt Conf Neural Networks, Washingtonm DC; 2001. p. 2638–42.
dx.doi.org/10.1016/S0378-7788(97)00035-2.
[26] Tso GKF, Yau KKW. Predicting electricity energy consumption: a comparison of [57] MATLAB. Nerual network toolbox; 2015.
regression analysis, decision tree and neural networks. Energy 2007;32:1761–8. [58] Beale MH, Hagan MT, Demuth HB. Neural network toolboxTM user’s guide 2015.
http://dx.doi.org/10.1016/j.energy.2006.11.010. http://dx.doi.org/10.1016/j.neunet.2005.10.002.
[27] Fan C, Xiao F, Wang S. Development of prediction models for next-day building [59] MathWorks . Decision trees. MATLAB Doc; 2015 〈http://au.mathworks.com/help/
energy consumption and peak power demand using data mining techniques. Appl stats/classification-trees-and-regression-trees.html#bsw6a96〉.
Energy 2014;127:1–10. http://dx.doi.org/10.1016/j.apenergy.2014.04.016. [60] Ng A. Support vector machines, 1. Stanford Univ; 2000. p. 1–25. http://dx.doi.org/
[28] Gómez JR, Gregio K, Santo D, Antonio M. Linear and non-linear methods for 10.1016/j.aca.2011.07.027.
prediction of peak load at University of São Paulo, vol. 78; 2016. p. 187–201. [61] Sauptik Dhar, Han Tai S. Support Vector Machine Regression. Univ Minnesota, CSci,
http://dx.doi.org/10.1016/j.measurement.2015.09.053. Mach Learn; 2011. 〈http://www.ece.umn.edu/users/cherkass/ee4389/sw/
[29] Basu K, Hawarah L, Arghira N, Joumaa H, Ploix S. A prediction system for home scaleSVM.m〉.
appliance usage. Energy Build 2013;67:668–79. http://dx.doi.org/10.1016/ [62] Shumway RH, Stoffer DS. Time series analysis and its applications with R
j.enbuild.2013.02.008. examples; 2011. http://dx.doi.org/10.1007/978-1-4419-7865-3.
[30] Lazos D, Sproul AB, Kay M. Optimisation of energy management in commercial [63] Taylor JW. Short-term electricity demand forecasting using double seasonal
buildings with weather forecasting inputs: a review. Renew Sustain Energy Rev exponential smoothing. J Oper Res Soc 2003;54:799–805. http://dx.doi.org/
2014;39:587–603. http://dx.doi.org/10.1016/j.rser.2014.07.053. 10.1057/palgrave.jors.2601589.
[31] Espinoza M, Joye C, Belmans R, De Moor B. Short-term load forecasting, profile [64] Livera AMDe, Hyndman RJ, Snyder RD. Forecasting time series with complex
identification, and customer segmentation: a methodology based on periodic time seasonal patterns using exponential smoothing Forecasting time series with
series. IEEE Trans Power Syst 2005;20:1622–30. http://dx.doi.org/10.1109/ complex seasonal patterns using exponential smoothing.October 2010:to appear.
TPWRS.2005.852123. [65] Sevlian R, Rajagopal R. Short term electricity load forecasting on varying levels of
[32] Amjady N. Short-term hourly load forecasting using time-series modeling with peak aggregation; 2014.
load estimation capability. IEEE Trans Power Syst 2001;16:798–805. http:// [66] Diez DM, Barr CD, Çetinkaya-Rundel M. Open intro statistics, Third ed. Creat
dx.doi.org/10.1109/59.962429. Commons; 2015.
[33] Huang H, Chen L, Hu E. A neural network-based multi-zone modelling approach for [67] Willmott CJ, Matsuura K. Advantages of the mean absolute error (MAE) over the root
predictive control system design in commercial buildings. Energy Build 2015;97:86– mean square error (RMSE) in assessing average model performance. Clim Res
97. http://dx.doi.org/10.1016/j.enbuild.2015.03.045. 2005;30:79–82. http://dx.doi.org/10.3354/cr030079.
[34] Clarke SM, Griebsch JH, Simpson TW. Analysis of support vector regression for [68] Chai T, Draxler RR. Root mean square error (RMSE) or mean absolute error (MAE)
approximation of complex engineering analyses. J Mech Des 2005;127:1077. - Arguments against avoiding RMSE in the literature. Geosci Model Dev
http://dx.doi.org/10.1115/1.1897403. 2014;7:1247–50. http://dx.doi.org/10.5194/gmd-7-1247-2014.
[35] Borges CE, Penya YK, Fernández I. Optimal combined short-term building load

1122

Vous aimerez peut-être aussi