Vous êtes sur la page 1sur 216

N dordre : 2011-04-TH

THSE DE DOCTORAT

SPECIALITE : PHYSIQUE


Ecole Doctorale Mathmatiques, Tlcommunications, Informatique, Signal,
Systmes Electroniques



Prsente par :

Petru-Daniel MOROAN




Sujet :

Commande prdictive distribue. Approches appliques
la rgulation thermique des btiments



Soutenue le 30 Septembre 2011 devant les membres du jury :



M. Bart DE SCHUTTER Delft University of Technology Examinateur
M. Mohammed MSAAD Universit de Caen Rapporteur
M. Mazen ALAMIR Universit de Grenoble Rapporteur
M. Jean BUISSON SUPELEC Directeur de thse
M. Romain BOURDAIS SUPELEC Co-directeur de thse
M. Didier DUMUR SUPELEC Co-directeur de thse
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
ii
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
`
A ma famille
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
iv
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Remerciements
Les travaux presentes dans ce memoire ont ete menes `a Supelec, sur le Campus de
Rennes, au sein de lequipe Automatique des Syst`emes Hybrides (ASH). Ces recherches
ont benecie du soutien nancier de la Fondation Supelec.
Je souhaite exprimer ma plus sinc`ere reconnaissance `a Monsieur Herve Gueguen pour
la conance quil a eu en morant la possibilite dintegrer leur equipe de recherche d`es
le debut de mon stage Erasmus, quil ait encadre minutieusement. Je remercie egalement
Monsieur Romain Bourdais, Monsieur Jean Buisson et Monsieur Didier Dumur, mes co-
directeurs de th`ese, pour leur aide precieuse, leur disponibilite et leur patience au cours
de ces trois annees de th`ese. Je tiens `a faire part de toute ma gratitude `a ce trio qui ma
accorde tant de conance et de liberte.
Je tiens egalement `a adresser mes plus vifs remerciements aux membres du jury pour
lhonneur quils mont fait dexaminer lensemble de ces recherches. Je remercie tout par-
ticuli`erement Monsieur Mazen Alamir et Monsieur Mohammed MSaad pour le temps
consacre `a la lecture minutieuse de ce document. Jai pu, ` a la lueur des observations et
des commentaires pertinents gurant dans leurs rapports, envisager mon travail sous des
angles nouveaux et entrevoir dinteressantes perspectives de recherche. Je remercie aussi
Monsieur Bart De Schutter davoir accepte le role dexaminateur.
Jai ete tr`es honore de presenter mes travaux de th`ese devant un tel jury. Je vous
remercie inniment.
Je souhaite remercier tous les membres de lequipe ASH de Supelec Rennes : Marie-
Anne Lefebvre, Herve Cormerais, Pierre-Yves Richard, Nabil Sadou. Un grand merci `a
Catherine Pilet, Ophelie Morvan, Clairette Place et Myriam Andrieux pour leur aide de
tous les jours et surtout pour leur sympathie. Merci au service logistique pour setre occupe
de tous les les probl`emes informatiques.
Merci `a tous mes coll`egues th`esards : Adrian, Mihai, Ilham, Maxime, Antoine pour
lambiance sympathique dans lequipe pendant les trois annees de th`ese.
Je noublie ni mes amis roumains de Rennes : Alina, Remus, Roxana, Alexandra, Eliza,
Diana, Ilona, Lidia, ... pour leur amitie.
Une mention toute speciale `a mes parents et `a mon fr`ere pour mavoir encourage
pendant les moments diciles de la vie de thesard et pour mavoir donne les meilleurs
conseils. Quils trouvent ici toute ma gratitude et mon amour.
v
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
vi
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Avant-propos
Le travail presente dans ce memoire a donne lieu `a la publication dun certain nombre
darticles de revue et de congres nationaux et internationaux avec actes et dune commu-
nication nationale sans actes.
Articles de revue internationale avec comite de lecture
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Building temperature regula-
tion using a distributed model predictive control, Energy and Buildings, n.9, vol.42,
p.1445-1452, 2010.
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, A distributed MPC strategy
based on Benders decomposition applied to multi-source multi-zone temperature
regulation, Journal of Process Control, n.5, vol.21, p.729-737, 2011.
Articles de revue nationale avec comite de lecture
P.-D. Morosan, R. Bourdais, H. Gueguen, Apports de la commande predictive pour
la regulation thermique des batiments, Journal Europeen des Syst`emes Automa-
tises, n.4-5, vol.44, p.479-492, 2010.
Rapport technique du projet europeen Hierarchical and Distributed Model
Predictive Control of Large-Scale Systems (HD-MPC)
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Distributed MPC based on
Benders decomposition, Report on new methods for complex control problems (non-
linear, dynamic, constrained), HD-MPC ICT-223854, p.40-49 2010.
Conferences internationales avec actes
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, A dynamic horizon distributed
predictive control approach fortemperature regulation in multi-zone buildings, Me-
diterranean Conference on Control and Automation (MED), p.622-627, 23-25 Juin
2010.
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Distributed model predictive
control for building temperature regulation, American Control Conference (ACC),
p.3174-3179, 30 Juin-2 Juillet 2010.
vii
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
viii
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, A distributed MPC applied
to multisource temperature regulation in buildings, IFAC Workshop on Distributed
Estimation and Control in Networked Systems (NECSYS), p.91-96, 13-14 Septembre
2010.
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Distributed model predictive
control based on Benders decomposition applied to multisource multizone building
temperature regulation, Conference on Decision and Control (CDC), p.3914-3919,
15-17 Decembre 2010.
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Distributed MPC for multi-
zone temperature regulation with coupled constraints, IFAC World Congress, 28
Ao ut-2 Septembre 2011.
Conferences nationales avec actes
P.-D. Morosan, R. Bourdais, H. Gueguen, Apports de la commande predictive pour
la regulation thermique des batiments, Sixi`eme

Edition de la Conference STIC &
Environnement, 16-18 Juin 2009.
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Commande predictive dis-
tribuee pour la regulation thermique des batiments, Sixi`eme Conference Interna-
tionale Francophone dAutomatique (CIFA), 2-4 Juin 2010.
Communications nationales sans actes
P.-D. Morosan, R. Bourdais, D. Dumur, J. Buisson, Distributed model predictive
control for building temperature regulation, GDR - MACS, Groupe de travail de
commande predictive non lineaire, 8 Octobre 2009.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Table des mati`eres
Liste des notations 13
Acronymes 15
1 Introduction 17
1.1 Contexte energetique actuel et futur . . . . . . . . . . . . . . . . . . . . . . 17
1.1.1 Importance des batiments dans la consommation energetique totale 19
1.1.2 Le chauage dans la consommation energetique des b atiments . . . . 20
1.2 Solutions pour reduire la consommation du chauage . . . . . . . . . . . . . 22
1.2.1 Standards eleves pour les nouveaux batiments . . . . . . . . . . . . . 22
1.2.2 Travaux de renovation . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.3 Optimisation du controle du chauage . . . . . . . . . . . . . . . . . 24
1.3 Notions de controle thermique des batiments . . . . . . . . . . . . . . . . . 25
1.3.1 Confort thermique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.3.2 Prol doccupation . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.3 Prix variables de lenergie nale . . . . . . . . . . . . . . . . . . . . . 27
1.4 Plan du document . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2

Etat de lart 31
2.1 Techniques pour la regulation thermique des batiments . . . . . . . . . . . . 31
2.1.1 Controle classique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.1.2 Procedures de reglage et dautoreglage . . . . . . . . . . . . . . . . . 33
2.1.3 Controle avance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1.3.1 Reseaux de neurones . . . . . . . . . . . . . . . . . . . . . . 34
2.1.3.2 Logique oue . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.1.3.3 Algorithmes genetiques . . . . . . . . . . . . . . . . . . . . 36
2.1.4 Commande predictive . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.1.4.1 Principe de la commande predictive . . . . . . . . . . . . . 37
2.1.4.2 Commande predictive pour le controle thermique . . . . . . 40
2.1.4.3 Motivation du choix de la commande predictive . . . . . . 43
2.2 Controle predictif pour les syst`emes de grande taille . . . . . . . . . . . . . 46
2.2.1 Commande centralisee . . . . . . . . . . . . . . . . . . . . . . . . . . 46
9
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
10 TABLE DES MATI
`
ERES
2.2.2 Commande decentralisee . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.2.3 Commande distribuee . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2.3.1 Modelisation des couplages . . . . . . . . . . . . . . . . . . 49
2.2.3.2 Caracteristiques du crit`ere . . . . . . . . . . . . . . . . . . 51
2.2.3.3 Techniques de distribution . . . . . . . . . . . . . . . . . . 52
2.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3 Commande predictive quadratique 59
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.2 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.3 Commande predictive `a crit`ere dynamique . . . . . . . . . . . . . . . . . . . 62
3.3.1 Vecteur doccupation . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.3.2 Denition du crit`ere . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3.3

Elaboration de la loi de commande . . . . . . . . . . . . . . . . . . . 64
3.3.3.1 Mod`ele de prediction . . . . . . . . . . . . . . . . . . . . . 64
3.3.3.2 Predicteur optimal . . . . . . . . . . . . . . . . . . . . . . . 65
3.3.3.3 Minimisation du crit`ere . . . . . . . . . . . . . . . . . . . . 65
3.3.3.4 Mise en oeuvre sous forme RST dynamique . . . . . . . . . 68
3.3.4 Reglage des param`etres . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.3.4.1 Indices de performance . . . . . . . . . . . . . . . . . . . . 70
3.3.4.2 Mod`ele de simulation et mod`ele de commande . . . . . . . 71
3.3.4.3

Etude sur linuence des param`etres de reglage . . . . . . . 73
3.3.5 Fenetre de prediction variable . . . . . . . . . . . . . . . . . . . . . . 75
3.3.5.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.3.5.2 Une strategie de variation de lhorizon de prediction . . . . 77
3.3.6 Resultats numeriques . . . . . . . . . . . . . . . . . . . . . . . . . . 78
3.3.7 Du monozone au multizone . . . . . . . . . . . . . . . . . . . . . . . 81
3.4 MPC distribue `a horizon de prediction dynamique . . . . . . . . . . . . . . 82
3.4.1 Mod`ele couple par les sorties . . . . . . . . . . . . . . . . . . . . . . 82
3.4.2

Elaboration de la commande distribuee . . . . . . . . . . . . . . . . 83
3.4.3 Sequence dechange . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
3.4.3.1 Horizon de prediction constant dans le temps et identique
pour tous les agents . . . . . . . . . . . . . . . . . . . . . . 86
3.4.3.2 Horizon de prediction variable dans le temps . . . . . . . . 86
3.4.4 Algorithme predictif distribue . . . . . . . . . . . . . . . . . . . . . . 90
3.4.5 Analyse de la convergence . . . . . . . . . . . . . . . . . . . . . . . . 91
3.4.6 Resultats numeriques . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.4.6.1 Mod`ele decouple . . . . . . . . . . . . . . . . . . . . . . . . 97
3.4.6.2 Comparaison MPC decentralise - MPC distribue . . . . . . 97
3.4.6.3

Etude experimentale sur la vitesse de convergence . . . . . 102
3.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
TABLE DES MATI
`
ERES 11
4 MPC lineaire multivariable pour la regulation thermique multizone 107
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.3 Contraintes locales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.3.1 Denition du crit`ere . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.3.1.1 MPC lineaire decentralise . . . . . . . . . . . . . . . . . . . 110
4.3.1.2 MPC lineaire centralise . . . . . . . . . . . . . . . . . . . . 112
4.3.1.3 MPC lineaire distribue . . . . . . . . . . . . . . . . . . . . 113
4.3.2 Resultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . 115
4.4 Contraintes couplees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.4.1 Denition du crit`ere . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
4.4.2 Mod`ele de prediction decouple . . . . . . . . . . . . . . . . . . . . . 122
4.4.2.1 Formalisation du probl`eme global . . . . . . . . . . . . . . 122
4.4.2.2 Methode de decomposition de Dantzig-Wolfe . . . . . . . . 124
4.4.3 Mod`ele de prediction couple . . . . . . . . . . . . . . . . . . . . . . . 129
4.4.3.1 Couplage par les sorties . . . . . . . . . . . . . . . . . . . . 130
4.4.3.2 Couplage par les entrees . . . . . . . . . . . . . . . . . . . . 135
4.4.4 Resultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
5 MPC lineaire multivariable pour la regulation thermique multizone et
multisource 145
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.2 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
5.3 MPC avec commande centrale . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.3.1 Denition du crit`ere . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
5.3.2 Mod`ele de prediction decouple . . . . . . . . . . . . . . . . . . . . . 148
5.3.2.1 Methode de decomposition de Benders . . . . . . . . . . . 149
5.3.3 Mod`ele de prediction couple . . . . . . . . . . . . . . . . . . . . . . . 155
5.3.3.1 Couplage par les sorties . . . . . . . . . . . . . . . . . . . . 155
5.3.3.2 Couplage par les entrees . . . . . . . . . . . . . . . . . . . . 160
5.3.4 Resultats de simulation . . . . . . . . . . . . . . . . . . . . . . . . . 164
5.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
6 Conclusion generale et perspectives 173
6.1 Synth`ese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
6.2 Originalite, contributions et faiblesses des approches proposees . . . . . . . 176
6.3 Perspectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
A Mod`eles de simulation 179
B Dualite en programmation lineaire 189
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
12 TABLE DES MATI
`
ERES
Liste des gures 193
Liste des tableaux 197
Index 199
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Liste des notations
a Notation generale pour un scalaire
aaa Notation generale pour un vecteur
AAA
Notation generale pour une matrice
AAA
T
Notation generale pour la transposee dune matrice
diag{a
1
, ..., a
n
} Matrice diagonale de dimension n
diag{aaa}
Matrice diagonale dont les composantes diagonales sont egales aux elements
du vecteur aaa
bloc-diag{AAA
1
, ..., AAA
n
} Matrice diagonale par blocs
T
s
Periode dechantillonnage
k
Increment en temps discret (pour un signal x, x(k) = x(kT
s
))
q
1
Operateur retard (pour un signal x, q
1
x(k) = x(k 1))
H
i
Ensemble des voisins de lagent i
N Ensemble des nombres entiers naturels
N

Ensemble des nombres entiers naturels non nuls


N
j
i
Ensemble des nombres entiers naturels {i, i + 1, ..., j}
R Ensemble des nombres reels
R
mn
Ensemble des matrices `a coecients reels de dimensions mn
13
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
14 LISTE DES NOTATIONS
s Variable de Laplace
tr(AAA)
Trace de la matrice AAA
xxx Prediction de la variable xxx
xxx
Variable dechange
xxx(k + l|k)
Prediction de la variable xxx `a linstant k + l `a partir des valeurs connues `a
linstant k
xxx
(l(k))
Variable xxx est utilisee `a literation l de linstant k
III
n
Matrice identite de dimension n n
000
mn Matrice nulle de dimension mn
111
mn
Matrice de dimension mn dont toutes les composantes sont egales `a 1
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Acronymes
ANN Articial Neural Networks (reseaux de neurones articiels)
ARX Auto Regressive model with eXternal inputs (mod`ele auto regressif qui inclut des
entrees externes)
ARMAX Auto Regressive Moving Average with eXternal inputs
ASHRAE American Society of Heating, Refrigerating and Air-Conditionning Engineers
BBC B atiment Basse Consommation
CARIMA Controlled AutoRegressive Integrated Moving Average
CSTB Centre Scientique et Thermique du B atiment
CVC Chauage, Ventilation et Climatisation
DJ Degres Jour
DJu Degres Jour unie
DMC Dynamic Matrix Control
E/S Entree / Sortie
EPDB Energy Performance of Buildings Directive
EU27 Les 27 pays membres de lUnion Europeenne
GA Genetic Algorithms (algorithmes genetiques)
GPC Generalized Predictive Control (commande predictive generalisee)
HVAC Heating, Vetilation and Air-Conditionning
IECC International Energy Conservation Code
ISO International Standards Organization
ISS Input-to-State Stability (stabilite entree-etat)
MBPC Model-Based Predictive Control
MPC Model Predictive Control (commande predictive par mod`ele)
ONU LOrganisation des Nations Unies
P/PI/PID Proportionnel / Integral / Derive
PL Programme Lineaire
PM Probl`eme Matre
15
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
16 ACRONYMES
PMR Probl`eme Matre Restreint
PMV Predicted Mean Vote (vote moyen predit)
PPD Percentage of Persons Dissatised (pourcentage previsible dinsatisfaits)
PWA Piece-Wise Ane (ane par morceaux)
RST Regulateur lineaire polynomial (lacronyme vient de la nomenclature utilisee pour
les trois polyn omes)
RT Reglementation Thermique
SP
i
Sous-Probl`eme i
TOR Tout-Ou-Rien
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Chapitre 1
Introduction
Tout le monde est aecte dune mani`ere ou dune autre par
les batiments - nous sommes nes en eux, y vivons, y
travaillons, et le plus souvent nous mourons en eux, pourtant
le profane a probablement moins de connaissances sur eux
que sur presque tout autre chose qui aecte sa vie.
The Book of Buildings
Richard Reid
1.1 Contexte energetique actuel et futur
Un des des du XXIe si`ecle est le developpement durable, cest `a dire maintenir la
qualite de vie pour une population croissante, avec des attentes de confort de plus en
plus elevees, tout en respectant lenvironnement. La production et la gestion denergie
necessaires pour repondre `a ces attentes seront essentielles dans les prochaines annees.
La crise economique a plonge le marche energetique mondial dans une incertitude sans
precedent. Le rythme de la reprise economique conditionnera les perspectives energetiques
pendant les annees `a venir. La crainte de recession et la multiplication des decits publics
nationaux rendent particuli`erement diciles les previsions pour leconomie mondiale `a
moyen terme. Suite `a la crise, la consommation energetique mondiale a diminue en 2009
pour la premi`ere fois dans des proportions signicatives depuis 1981 [6]. Malgre cette chute,
elle devrait repartir rapidement `a la hausse, une fois la reprise economique amorcee.

Etant
la principale source demissions de gaz `a eet de serre, lenergie (fossile) est au coeur du
probl`eme de changement climatique et donc sa gestion fait partie integrante de la solution.
La conference historique de lONU sur le changement climatique, tenue `a Copenhague
en decembre 2009, xe lobjectif de limitation de la hausse de la temperature moyenne
mondiale `a deux degres Celsius par rapport aux niveaux de l`ere preindustrielle. Cepen-
dant, meme si les engagements pris par les principaux pays emetteurs de gaz `a eet de
serre etaient integralement tenus, ils ne nous m`eneraient que partiellement sur la trajec-
toire des emissions nous permettant datteindre lobjectif de 2

C, trajectoire decrite par


17
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
18 1. Introduction
le scenario 450, visant `a limiter la concentration `a long terme de gaz `a eet de serre `a 450
ppm (parties par million) dequivalent CO
2
, presente pour la premi`ere fois dans [5].
Ledition [8] propose encore deux scenarios de prediction relatifs `a une evolution
possible dici 2050. Ainsi, le scenario politiques actuelles (appele aussi scenario de
reference) decrit levolution des marches mondiaux de lenergie si les politiques en vi-
gueur en 2010 restent inchangees. Ce scenario prevoit, ` a long terme, la croissance de la
concentration de gaz `a eet de serre dans latmosph`ere superieure `a 1000 ppm dequivalents
CO
2
, provoquant une hausse de la temperature moyenne mondiale pouvant atteindre 6
o
C.
Le deuxi`eme scenario, appele scenario nouvelles politiques, prend en compte les enga-
gements politiques generaux et les plans daction annonces par les pays du monde entier.
La hausse rapide des emissions de CO
2
prevue dans le scenario politiques actuelles
est due `a laccroissement de la demande mondiale denergie fossile, qui restera la source
primaire predominante dans le monde. Le charbon connat de loin la croissance la plus
importante, suivi du gaz et du petrole. Le principal moteur de la demande de charbon et
de gaz est laugmentation inexorable des besoins en energie pour produire de lelectricite.
Lapport de la production nucleaire par rapport `a la production mondiale delectricite dimi-
nuerait. Lutilisation des technologies renouvelables modernes (hors hydraulique) telles que
leolien, le solaire, la geothermie, lenergie des marees et des vagues ainsi que la bioenergie
ache lessor le plus rapide `a lhorizon 2035. La demande de petrole dans le scenario de
reference devrait augmenter de 1 % par an en moyenne durant la periode consideree, le
secteur des transports etant `a lorigine de la plupart de cette augmentation.
Dans le scenario nouvelles politiques, le taux de croissance de la demande mondiale
denergie primaire est de 1,2 % par an en moyenne, contre 2 % par an au cours des
vingt-sept annees precedentes. Les facteurs qui contribueront `a freiner la croissance de la
demande en combustibles fossiles sont :
laugmentation des prix des combustibles fossiles pour les utilisateurs naux, sous
leet de la pression des prix `a la hausse sur les marches internationaux et
les penalites de carbone de plus en plus onereuses, conjuguees aux politiques en-
courageant les economies denergie et ladoption de sources denergie peu emettrices
de carbone.
Des nouveaux carburants emergent dej` a pour se substituer aux produits petroliers dans
le domaine des transports. La demande de charbon devrait saccrotre jusquen 2025, puis
decrotre. La demande en gaz naturel depasserait leg`erement celle des autres combustibles
fossiles en raison de ses caracteristiques ecologiques et pratiques plus favorables. La part de
lenergie nucleaire et des energies renouvelables modernes augmenterait considerablement.
Les reductions des emissions de CO
2
liees `a la consommation energetique quexige le
scenario 450 par rapport au scenario de reference sont colossales. De plus, la faiblesse des
engagements de reduction des emissions de gaz `a eet de serre pris en vertu de lAccord de
Copenhague reduit indubitablement la probabilite de concretisation de lobjectif de 2

C.
Pour latteindre il faudrait une transformation technologique `a un rythme sans precedent.
Lamelioration de lecacite energetique dans tous les secteurs semble etre le principal
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1.1. Contexte energetique actuel et futur 19
moteur pour reduire la demande denergie. Ainsi, plus de la moitie des emissions seront
evitees gr ace `a lecacite energetique dans le scenario 450 par rapport au scenario de
reference [6].
1.1.1 Importance des batiments dans la consommation energetique to-
tale
Le paragraphe precedent a montre la necessite dameliorer lecacite energetique du
consommateur an datteindre les objectifs de reduction de la demande energetique dans
les prochaines decennies. An dagir rapidement et ecacement il est important de cibler
les secteurs dactivites qui consomment le plus denergie et qui emettent donc le plus de
gaz `a eet de serre.
Les batiments representes par les secteurs residentiel et tertiaire sont les plus impor-
tants consommateurs denergie dans lEU27
1
ainsi quen France [7], suivis par le secteur
du transport et par lindustrie (voir la gure 1.1). Le parc residentiel compte environ 70
% du parc immobilier europeen [83]. Pourtant, les batiments non-residentiels sont loin
detre negligeables, ainsi le secteur residentiel est responsable de 30 % de la consommation
denergie nale totale, tandis que le secteur tertiaire contribue `a hauteur de 11 % [83].
Par consequent, les eorts de reduction de la depense energetique doivent viser toutes les
categories de batiments.
27%
32%
41%


Industrie Transport Rsidentieltertiaire
23%
32%
44%
EU27
France
Figure 1.1 Consommation denergie nale par secteur en 2008 dans la zone EU27 (`a
gauche) et en France (`a droite)
Le potentiel de reduction de la consommation energetique dans les batiments est un
point cle dans les nombreuses demarches pour combattre laugmentation de la concentra-
1. Les 27 pays membres de lUnion europeenne (lAllemagne, lAutriche, la Belgique, la Bulgarie,
Chypre, le Danemark, lEspagne, lEstonie, la Finlande, la France, la Gr`ece, la Hongrie, lIrlande, lItalie, la
Lituanie, la Lettonie, le Luxembourg, Malte, Les Pays-Bas, la Pologne, le Portugal, la Republique tch`eque,
la Roumanie, le Royaume-Uni, la Slovaquie, la Slovenie et la Su`ede.)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
20 1. Introduction
tion de gaz `a eet de serre dans latmosph`ere, notamment celle du Groupement Intergou-
vernemental pour l

Evolution du Climat dans son evaluation [3].


Pour les batiments residentiels, cest la taille et la localisation qui ont limpact le
plus fort sur la consommation denergie. La quantite et le type denergie utilisee dans
les habitations sont non seulement lies aux conditions meteorologiques, `a la conception
architecturale, aux syst`emes energetiques mis en uvre mais aussi au comportement des
occupants. En general, les logements dans les pays developpes utilisent plus denergie que
ceux dans les pays aux economies emergentes.
Le secteur tertiaire couvre tous les batiments publics et commerciaux (bureaux, maga-
sins, ecoles, restaurants, hotels, hopitaux, musees, etc) avec une grande variete dactivites
et dusages ayant un impact enorme sur la qualite et la quantite denergie necessaire. Les
batiments de bureaux et de commerce sont les plus energivores, representant en general
plus de 50 % de lenergie totale consommee par le secteur non-residentiel [149]. La crois-
sance de la population implique une demande de services plus importante et requiert
evidement plus denergie.
1.1.2 Le chauage dans la consommation energetique des batiments
Si lon consid`ere la part des batiments dans la consommation energetique europeenne et
francaise (plus de 40 %), il convient daner toujours plus lanalyse de ce secteur. Ainsi,
la gure 1.2 montre la distribution de la consommation dans les batiments residentiels
et tertiaires europeens. Le poste de chauage est de loin le syst`eme le plus gourmand
en energie, etant responsable de plus de la moitie de la consommation. En France, la
hierarchie ne se modie pas, mais les proportions sont encore un peu plus desequilibrees
[4], le chauage depassant meme 65 %.
57%
25%
7%
11%


Chauffage Eau Chaude Cuisson Electricit spcifique
52%
9%
5%
34%
Btiments tertiaires Btiments rsidentiels
Figure 1.2 Repartition de la consommation energetique dans les batiments residentiels
et tertiaires en Europe [2]
Les facteurs qui inuencent la quantite denergie depensee par le poste de chauage
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1.1. Contexte energetique actuel et futur 21
dun batiment sont decrits ci dessous.
1. Le climat est le facteur le plus important agissant sur la demande de chauage dans
un batiment.

Evidement, plus il fait froid, plus le besoin en energie pour le chauage
augmente. Cette inuence de la temperature exterieure sur la demande de chauage
est mesuree en meteorologie en degres jour (DJ), qui representent lecart entre la
temperature moyenne exterieure pendant une journee et un seuil de temperature
preetabli. Le nombre de degres jours unies (DJu) est determine en utilisant comme
temperature de reference la valeur de 18

C. Avec cette methode tr`es simple on peut


estimer la consommation denergie thermique. La demande energetique peut etre
reduite selon lintensite des apports solaires.
2. La geometrie du b atiment joue un role non negligeable. Un rapport eleve volume
/ surface (une forme simple, de preference un cube) induit une consommation plus
faible du poste de chauage, reduisant les pertes de chaleur `a travers lenveloppe.
3. Un autre facteur tr`es important est la performance thermique de lenveloppe du
batiment, autrement dit, les valeurs de coecients U (coecient de transmission
thermique, exprime en W/m
2
K) des parois et des fenetres. Plus les valeurs U des
elements de construction exterieurs sont faibles, moins il y aura de chaleur perdue
par echange avec lexterieur.
4. La ventilation peut jouer un role cle, surtout en ce qui concerne les batiments `a faibles
besoins energetiques ou les maisons passives. Pour reduire les pertes de chaleur, les
syst`emes de ventilation mecanique integrant une recuperation de la chaleur sont de
plus en plus utilises.
5. La consommation energetique totale dun batiment depend egalement de lecacite
du syst`eme de chauage, cest-`a-dire du rendement de transformation de lenergie
nale en chaleur.
6. La methode de controle du syst`eme de chauage joue `a la fois sur le confort et
la consommation energetique. Ainsi, des ecarts signicatifs apparaissent entre les
performances dun syst`eme de chauage controle manuellement, un syst`eme pilote
par une loi de commande simple (de type tout-ou-rien ou P/PI/PID) et un syst`eme
pilote par une loi commande avancee (de type predictif par exemple).
7. Le mode de vie des occupants a un eet decisif sur la facture energetique. La negligence
et les mauvaises habitudes peuvent reduire sensiblement les avantages lies aux me-
sures de rendement energetique presentes dans le batiment.
8. Les apports de chaleur provenant des occupants ou des dierents appareils electriques
(autres que les equipements de chauage) peuvent avoir un eet appreciable dans
certaines situations (salles de theatre, cinema, ecoles, salles serveurs, etc).
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
22 1. Introduction
1.2 Des solutions pour reduire la consommation du poste
de chauage
1.2.1 Standards eleves pour les nouveaux batiments
Les batiments sont generalement concus pour etre utilises pendant de nombreuses
decennies et, dans certains cas, plus dune centaine dannees. Ainsi, la construction des
nouveaux batiments presente une bonne occasion deconomiser lenergie sur le long terme,
car ils inuencent la consommation energetique du secteur pour beaucoup plus longtemps
que dautres elements consommateurs denergie dont la duree de vie est limitee `a quelques
dizaines dannees.
Lamelioration de lecacite des batiments au stade de la conception est relativement
simple, alors quapr`es leur construction elle est beaucoup plus dicile et tr`es co uteuse. Les
decisions prises pendant la phase de projet du batiment determineront la consommation
pendant la plus grande partie, sinon la totalite, de la duree de vie dun batiment. Des
param`etres importants pour lecacite energetique du batiment sont xes une fois pour
toute `a la construction du batiment (lorientation de limmeuble, lorientation des fenetres,
les materiaux de construction, etc).
Les reglementations concernant les batiments abordent, en general, les problematiques
liees `a lenveloppe et aux syst`emes de chauage, de climatisation, de ventilation et deau
chaude, elements qui sont responsables denviron trois quarts de la demande energetique
des logements [5]. Occasionnellement, ces standards portent sur dautres equipements
comme leclairage, ou lutilisation des energies renouvelables. Visant plut ot la thermique
des batiments, les reglementations di`erent dune region (pays) `a lautre en fonction des
particularites climatiques locales.
Les premiers standards, mentionnant des valeurs pour les coecients de transfert ther-
mique et des materiaux speciques ou multi-vitrage, remontent `a la n des annees 1950
et le debut des annees 1960 dans les pays scandinaves. Ces exigences etaient destinees `a
ameliorer lecacite energetique et le confort dans les batiments. La crise petroli`ere du
debut des annees 1970 a favorise lemergence des reglementations concernant lecacite
energetique des batiments dans de nombreux pays et dans les annees qui suivirent ces
exigences ont continue daugmenter. Des exemples de ces normes sont les standards crees
par IECC et ASHRAE utilises aux

Etats-Unis et au Canada, alors que dans lUnion eu-
ropeenne la directive EPDB requiert aux etats membres detablir des standards decacite
energetique dans les nouveaux batiments.
En France, le Grenelle Environnement a bouleverse la politique des reglementations
thermiques qui devrait avoir une periodicite de 5 ans (RT 2005, RT 2010, RT 2015, etc)
avec des ameliorations de 15 % par rapport `a la version precedente. Suite au Grenelle En-
vironnement, la reglementation thermique 2012 (RT 2012), publiee en octobre 2010, sera
appliquee `a partir doctobre 2011 aux batiments tertiaires et `a partir du debut 2013 aux
batiments residentiels. Ainsi, les performances requises par la RT 2012 sont identiques au
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1.2. Solutions pour reduire la consommation du chauage 23
label B atiment Basse Consommation (BBC 2005), cest-`a-dire une consommation maxi-
male denergie primaire de 50 kW/m
2
/an.
Malgre tout, la grande majorite des nouveaux batiments est construite exactement
aux exigences minimales decacite energetique. Cependant, certains batiments ciblent
des normes de rendement beaucoup plus elevees et parmi ceux-ci : les batiments `a basse
consommation (BBC), les batiments passifs, les batiments `a energie zero, ou meme `a
energie positive (RT 2020).
1.2.2 Travaux de renovation
Limportance des normes decacite energetique setend au-del` a de leur role lors de la
construction de nouveaux batiments. Ces reglementations servent souvent comme objectifs
decacite pour les travaux de renovation des batiments existants. Linteret accru pour
lecacite energetique stimule la demande de renovation des batiments existants.
Des travaux de renovation majeurs ont lieu tous les 30 - 40 ans pour les batiments
residentiels, principalement `a cause des degradations des parties principales ou des instal-
lations des immeubles. Une autre raison pour les travaux de renovation est levolution du
mode de vie et des exigences de confort dans la societe moderne. Des remplacements et
des reparations de moindre envergure peuvent meme se produire plus souvent. Ces travaux
de renovation ou de changement dequipements orent une formidable opportunite pour
ameliorer lecacite dun batiment.
Parmi les etats membres de lUnion europeenne, on peut observer que la renovation
(durable) des centres urbains et la rehabilitation des logements sont devenues des priorites.
Des politiques nationales sont en cours de developpement an dencourager cette nouvelle
priorite. Selon [83], en France, des travaux de renovation visant `a realiser des economies
denergie ont ete entrepris : 70 % sont concentres sur lisolation thermique, en particulier
le double vitrage, linstallation de volets et lisolation des planchers ou des toits. Les autres
activites sont destinees `a renouveler principalement les syst`emes de chauage (25 %), de
ventilation et de climatisation.
Bien que, dans la plupart des pays, les investissements pour travaux de renovation
soient generalement beaucoup plus faibles que les montants investis dans des immeubles
nouvellement construits, le nombre de batiments qui sont renoves chaque annee est bien
plus important que le nombre annuel de constructions nouvelles. Par consequent, limpact
de la renovation du parc existant est plus grand que celui des constructions nouvelles.
Meme si les actions gouvernementales essayent dencourager les travaux de renovation
(le credit dimp ot developpement durable , leco-pret `a taux zero), en general, le prin-
cipal obstacle dune telle demarche est le manque de connaissances de la relation entre les
co uts et les beneces esperes.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
24 1. Introduction
1.2.3 Optimisation du controle du chauage
Le parc existant rec`ele dimmenses gisements economiques et des travaux de renovation
ecaces sont necessaires pour proter de ces ressources. Lamelioration de la qualite de
lenveloppe et du rendement des syst`emes de chauage ne sut pas. Il faut egalement
optimiser le fonctionnement de ces derniers. Le developpement technologique permet au-
jourdhui dequiper les immeubles avec des syst`emes de controle de haut niveau an de
contribuer `a la transformation du batiment en un syst`eme intelligent.
Le principal objectif du syst`eme de controle automatique du chauage dans un batiment
est dassurer un certain niveau de confort thermique tout en minimisant la consommation
denergie necessaire pour le realiser. La nalite du controle est de moduler la puissance du
syst`eme de chauage an datteindre cet objectif. Si ces syst`emes etaient toujours `a leur
capacite maximale, le besoin dune loi de commande ne serait pas motive. Cependant, la
plupart des syst`emes de chauage sont concus pour repondre aux demandes dans les pires
conditions (temperature tr`es basse). Ces conditions se manifestent uniquement pendant
de courtes periodes au cours de lutilisation. La plupart du temps, le syst`eme doit fonc-
tionner lorsque les besoins de chauage sont bien inferieurs `a la capacite des equipements
de chauage.
Malheureusement, de nombreux syst`emes de chauage ont de mauvaises performances
parce que limportance de la commande a ete sous-estimee par les producteurs. Ainsi,
la majorite des installations sont controlees par une loi de commande simple, de type
tout ou rien, proportionnel (P) ou proportionnel `a action integrale voire derivee (PI ou
PID). Ces structures de controle ont des performances acceptables pour la regulation de
la temperature dans les immeubles d`es que le niveau de confort souhaite est atteint, ce
qui les a amenees `a etre utilisees `a grande echelle. Mais levolution du mode de vie et du
marche energetique montre les points faibles de ces strategies de commande.
La plupart des batiments ont une occupation intermittente. Maintenir la temperature
de confort pendant les periodes o` u certaines pi`eces sont vides conduit `a un gaspillage
denergie. An deviter cela, lutilisation dune temperature de consigne plus basse ou meme
larret du poste de chauage pendant les periodes dinoccupation devient une necessite et
simultanement un probl`eme pour le syst`eme de commande. Pour remonter la temperature
an datteindre le confort thermique souhaite, le chauage doit demarrer plus tot que
le debut de la prochaine periode doccupation. Ce delai peut varier, en fonction des ca-
racteristiques du syst`eme (equipement de chauage + batiment), des facteurs internes
(temperature interieure, apports internes, ...) et externes (temperature exterieure, rayon-
nement solaire, ...) de quelques minutes `a plusieurs heures. Labsence dune gestion op-
timale de ces transitions entre les periodes doccupation et celles dinoccupation force le
chauagiste `a reduire lecart entre la temperature de confort et la temperature de reference
pendant linoccupation, augmentant la consigne dinoccupation, ce qui am`ene `a laccrois-
sement non justie de la consommation.
En France, malgre son co ut dutilisation eleve, le chauage electrique poursuit sa
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1.3. Notions de controle thermique des batiments 25
progression notamment dans les logements recents. En 2004, 7,1 millions de menages se
chauent `a lelectricite dont la consommation se stabilise `a 40,6 TWh [4]. Pour diminuer
les pics energetiques, les producteurs choisissent dutiliser des prix variables de lelectricite,
an dinciter la population `a consommer moins aux moments de forte demande. Pour lins-
tant, les tarifs electriques, ont une dynamique journali`ere simple de type heures pleines
/ heures creuses (ou jour /nuit). Mais avec lintroduction des reseaux electriques intelli-
gents (smart grids) et les compteurs intelligents, levolution de la dynamique des tarifs
electriques peut conduire `a des plages de prix tr`es variees en fonction de letat courant
et predit du rapport demande / ore du reseau. Ainsi, la connaissance de levolution du
prix, au bout dun horizon relativement court (quelques heures), exploitee de mani`ere op-
timale par le syst`eme de controle du chauage electrique, peut diminuer signicativement
la facture delectricite.
Reduire la puissance souscrite peut saverer tr`es important dans la demarche decono-
miser les co uts de fonctionnement. Pourtant, une telle decision etablit une contrainte glo-
bale sur lensemble des equipements electriques du batiment. Meme si le poste de chauage
electrique est generalement le syst`eme le plus energivore dans un batiment, il est loin detre
le plus critique. Ainsi, aux moments de forte demande de chaleur, si la puissance disponible
est inferieure `a la puissance requise par le chauage, certains equipements electriques dej` a
en fonctionnement peuvent etre eteints brutalement. Une commande optimale du chauf-
fage, pouvant prendre en compte la contrainte globale denergie disponible elimine ce
probl`eme.
Parmi les logements francais qui utilisent le chauage electrique, plus de 30 % declarent
lutiliser comme chauage dappoint. Dans les maisons individuelles, il est frequemment
associe `a un chauage au bois ou au gaz. Lutilisation de plusieurs types de syst`emes
de chauage ne conduit `a une amelioration des performances que par lutilisation dune
commande avancee an de prendre en compte les avantages de chaque source de chaleur
(le co ut moins eleve du chauage au combustible et la dynamique rapide du chauage
electrique).
Les paragraphes precedents mettent en evidence limportance de lutilisation dune loi
de commande optimale capable de reduire la facture energetique liee au chauage tout en
orant le niveau de confort desire aux occupants.
1.3 Notions de contr ole thermique des batiments
1.3.1 Confort thermique
La consommation energetique du poste de chauage est fortement dependante du degre
de confort thermique `a linterieur de limmeuble. Il nexiste pas de standard absolu du
confort thermique, ce qui nest pas surprenant car les humains vivent dans une gamme de
climats tr`es large. Pourtant, une denition internationalement acceptee du confort ther-
mique, utilisee par ASHRAE, est letat desprit qui exprime la satisfaction par rapport
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
26 1. Introduction
`a lenvironnement thermique (ISO 7730). Lambigute de cette denition souligne encore
une fois que lestimation du confort est un processus cognitif inuence par des facteurs
physiques, physiologiques et psychologiques.
Le standard international actuel concernant le confort thermique (ISO 7730) est base
sur des travaux de recherche menes dans les annees 1960. Cette norme utilise le mod`ele de
Fanger [56], appele PMV (vote moyen predit). P.O. Fanger a determine experimentalement
les conditions physiologiques necessaires pour le confort thermique sous des conditions
thermiques homog`enes et stationnaires. La formulation de lindice PMV a ete obtenue de
mani`ere empirique, en fonction du metabolisme, de lisolement vestimentaire et des quatre
param`etres climatiques (temperature de lair, rayonnement, humidite et vitesse de lair).
Ainsi, lindice donne lavis moyen dun groupe important de personnes qui exprimeraient
un vote de sensation de confort thermique en se referant `a une echelle de -3 (froid) `a +3
(chaud). Une valeur de PMV nulle exprime une sensation de confort thermique optimale.
Dans le controle des syst`emes de chauage, linteret dutiliser lindice PMV est relati-
vement reduit, d u au fait que le poste de chauage nagit que sur la temperature de lair
et sur la temperature de rayonnement (temperature moyenne des surfaces de parois). La
diculte destimer les param`etres concernant le metabolisme et lhabillement et la formu-
lation relativement compliquee du PMV sont dautres aspects qui rendent dicile lusage
de cet indice dans les structures de controle. Ainsi, dans les travaux presentes dans ce
memoire, le confort thermique est deni soit par une temperature de consigne, soit par
une bande de temperature de confort.
1.3.2 Prol doccupation
Il est evident que les exigences de confort ne doivent etre satisfaites que lors de periodes
o` u le batiment est occupe, periodes que lon appelle periodes doccupation. D`es lors, il
sav`ere inutile, sauf pour des raisons de securite, de preciser des specications thermiques
au cours des periodes o` u le batiment est vide (periodes dinoccupation). Dans ce cas, le seul
objectif actif de controle est la minimisation energetique et larret du poste de chauage
est sa solution optimale.
Le role de lusager devient tr`es important dans le bon fonctionnement du syst`eme
de controle. Personne ne souhaite avoir `a eteindre ou `a allumer son chauage `a chaque
depart ou rentree, par contre tout le monde aime benecier des avantages economiques
lies `a lexploitation optimale du chauage. Utilisant un syst`eme de controle performant,
le rapport confort / co ut dependra de la qualite du planning, comme cest le cas dans de
nombreux autres domaines.
Linteret energetique du chauage intermittent dans les batiments `a occupation discon-
tinue est connu depuis longtemps [185]. Pour que la consommation denergie soit minimale,
sans baisser le niveau de confort, il est necessaire doptimiser la commande pendant les
periodes de prechauage (voir gure 1.3). An de pouvoir calculer la commande pendant
la periode de prechauage (relance), le syst`eme de controle a besoin de connatre le mo-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1.3. Notions de controle thermique des batiments 27
ment du debut de la periode doccupation. De fa con similaire, pour un batiment `a grande
inertie thermique, lequipement de chauage peut etre arrete avant que les occupants ne
laient quitte, sans induire une degradation du confort thermique pendant loccupation.
O
c
c
u
p
a
t
i
o
n
T
e
m
p
e
r
a
t
u
r
e
Temps
1
0
T
conf
Prechauage
Figure 1.3 Illustration du prechauage
Une exploitation optimale du poste de chauage dans le cadre dun batiment `a occu-
pation intermittente ne peut pas se realiser sans la connaissance a priori du prol doc-
cupation de ses pi`eces. Ce prol doccupation doit contenir letat, occupe (1) ou inoccupe
(0), du batiment ou de chaque pi`ece sur un certain horizon futur de temps. Cette in-
formation peut etre transmise par les agendas des occupants ou estimee, en utilisant les
connaissances sur la dynamique des occupations precedentes mesurees par un capteur de
presence. Neanmoins, si loccupation dune pi`ece nest pas prevue dans son prol doccu-
pation, le confort thermique sera aecte.
1.3.3 Prix variables de lenergie nale
Les valeurs statistiques de lenergie consommee par le poste de chauage presentees
dans les sections precedentes sont exprimees par rapport `a lenergie nale totale. Lenergie
nale represente lenergie livree `a lutilisateur. Certains types denergies passent par dautres
stades, avant detre livres. Ainsi, lenergie primaire (brute) est celle qui na subi aucune
conversion (petrole non rane par exemple). Ensuite, elle est transformee en energie secon-
daire (produits petroliers ranes) et transportee vers lutilisateur. Lenergie nale, recue
par lutilisateur, est convertie par le syst`eme de chauage en chaleur qui constitue lenergie
utile. Chaque passage de lenergie dun stade `a lautre engendre des pertes liees au rende-
ment de transformation ou de transport. La faiblesse de lecacite energetique fran caise,
energie primaire / energie nale, par rapport `a la moyenne de lEU27 (9 % decart, selon
[7]) est due au grand apport des centrales nucleaires qui ont des rendements tr`es faibles
par rapport aux centrales `a carburants fossiles.
Le chauage electrique represente 10% de la consommation fran caise delectricite et il
equipe 30% de logements. Ceci est une valeur exceptionnelle en Europe, car le parc fran cais
de chauage electrique represente la moitie du parc europeen. Ainsi, un des probl`emes les
plus importants du reseau electrique, les pics de la demande, est lie aussi aux syst`emes de
chauage. A cause de laugmentation de la demande electrique, ces pics de consommation
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
28 1. Introduction
sont de plus en plus eleves, et font peser le risque de defaillance sur le reseau fran cais de dis-
tribution de lelectricite. Un moyen ecace de combattre ce probl`eme est la dierenciation
des tarifs (heures pleines / heures creuses) qui incite les consommateurs `a reduire leur
demande durant les periodes les plus chargees de lannee. Les reseaux intelligents (smart
grids) et les compteurs intelligents pourraient permettre daner la politique des prix de
lelectricite qui deviendraient dynamiques, en fonction du rapport ore / demande courant
sur le reseau.
Les strategies de controle pour la regulation thermique des batiments presentees dans
ce memoire visent `a utiliser de fa con optimale ces tarifs denergie variables, lutilisation de
plusieurs sources denergie ou des contraintes dynamiques sur lenergie disponible. Le but
de ces lois de commande est de reduire le co ut du chauage tout en gardant le niveau de
confort requis par les occupants.
1.4 Plan du document
La suite de ce memoire est structuree en quatre chapitres, resumes dans les paragraphes
suivants.
Chapitre 2
Le deuxi`eme chapitre peut etre vu comme un etat de lart. Il se focalise sur la synth`ese
des principales lois de commande en boucle fermee utilisees pour la regulation thermique
des batiments. Nous presentons les avantages et inconvenients de certains regulateurs de
type TOR et PID, des methodes dautoreglage, des techniques basees sur lintelligence
articielle et des correcteurs predictifs. Pour cette derni`ere classe de correcteurs, nous nous
concentrons sur des techniques de distribution de la loi de commande, pour le controle de
batiments de grande taille. Par consequent, une br`eve synth`ese des dierentes techniques
MPC distribue conclut le chapitre.
Chapitre 3
Dans le troisi`eme chapitre, nous proposons dierentes modications du crit`ere classique
de MPC an de mieux repondre aux objectifs de controle. La minimisation de la commande
(et non plus de son increment), linclusion du prol doccupation dans la fonction de co ut
et une strategie de variation de la taille de lhorizon de prediction sont nos principales
propositions. Lapproche est initialement exposee pour le cas dune seule pi`ece, et ensuite
etendue `a un ensemble de zones. Dans ce dernier cas, nous presentons une loi de commande
predictive distribuee, pour laquelle les horizons de prediction locaux sont variables, en
fonction des prols doccupation.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1.4. Plan du document 29
Chapitre 4
Pour favoriser des exigences dordre economique, dans le chapitre 4 nous nous orientons
vers des formulations lineaires du crit`ere. Ainsi, lapparition des contraintes est imperative,
pour que la solution optimale soit nie. Nous considerons, tout dabord, des contraintes
locales, propres `a chaque pi`ece et nous formulons un algorithme distribue similaire au
cas quadratique. La deuxi`eme partie du chapitre propose une solution pour le cas o` u
plusieurs variables locales sont liees par une contrainte globale. Pour la resolution du PL
ainsi formule, nous proposons des solutions basees sur la methode de decomposition de
Dantzig-Wolfe, que nous etendons pour repondre au mieux au probl`eme pose.
Chapitre 5
Le cinqui`eme chapitre vient enrichir la methodologie dej` a proposee par lajout dune
commande centrale, qui agit simultanement sur lensemble des pi`eces. En formulant le
probl`eme doptimisation de MPC sous la forme standard dun PL, il nest plus possible
de resoudre le probl`eme de mani`ere decentralisee. Pourtant, la structure particuli`ere du
PL est exploitee par la methode de decomposition de Benders.
`
A partir de cela, nous
proposons un algorithme distribue. Dune mani`ere similaire au chapitre 4, nous presentons
des modications sur les algorithmes issus de ces methodes de decomposition an de
prendre en compte les couplages entre les pi`eces adjacentes.
Conclusions et perspectives
Cette derni`ere partie dresse le bilan des travaux presentes dans ce manuscrit et pro-
posent des perspectives dans la continuite des travaux eectues. Les pistes futures evoquees
sont tant au niveau theorique quau niveau applicatif.
Annexes
Ce memoire inclut deux annexes. La premi`ere regroupe une presentation synthetique
du logiciel SIMBAD et de ses mod`eles utilises dans les experiences presentees tout au long
du memoire. La deuxi`eme partie dannexe propose au lecteur les principaux aspects de la
dualite des programmes lineaires qui sont utilises dans le developpement des algorithmes
distribues bases sur les methodes de decomposition.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
30 1. Introduction
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Chapitre 2

Etat de lart
Tout lecteur est soit un voyageur qui fait une pause ou
quelquun qui rentre chez lui.
La Biblioth`eque
Alberto Manguel
Dans ce chapitre, nous allons presenter dans un premier temps dierentes techniques
de commande utilisees pour la regulation thermique des b atiments, des lois de commande
depuis les plus simples jusqu`a celles elaborees par des methodes de controle avance. Quand
le syst`eme est de grande taille, il peut etre interessant de distribuer la loi de commande. La
seconde partie de ce chapitre est consacree `a ces techniques de commande distribuee. Pour
chacune des deux parties, nous insisterons davantage sur toutes les approches predictives.
2.1 Techniques pour la regulation thermique des batiments
Du point de vue de lautomaticien, les syst`emes de chauage, ventilation et climatisa-
tion (CVC, ou langlais HVAC de heating, ventilation and air conditioning) ne sont pas en
soi des cas diciles de controle-commande. Cest pourquoi, dans la plupart des batiments,
les lois de commande utilisees pour ce type dequipement sont relativement simples. Pour-
tant, pour satisfaire des niveaux de performance de plus en plus eleves, des structures
de commande plus sophistiquees ont ete proposees, pour lesquelles on cherche souvent `a
optimiser un compromis entre la consommation et le confort.
2.1.1 Controle classique
Le controle des syst`emes de chauage du batiment a ete revolutionne, au debut du
XXe si`ecle, avec la mise en place du thermostat. Ainsi, le regulateur de temperature
se composait de trois elements : un thermostat, un amplicateur et un moteur ou un
mecanisme pour actionner les vannes ou les commutateurs [138]. Dans les paragraphes
suivants, nous allons presenter bri`evement les principales lois de commande utilisees pour
le controle des dierents syst`emes CVC.
31
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
32 2.

Etat de lart
Parmi les controleurs les plus simples, on trouve :
La loi de commande de type tout-ou-rien (TOR) controle letat du syst`eme, u,
(marche ou arret) en fonction dun niveau derreur ((k) = T
ref
(k) T
mes
(k)) entre
la consigne et la valeur mesuree. Limplantation usuelle aboutit `a un fonctionnement
`a hysteresis an de reduire la frequence de commutation :
u(k) = f
hyst
((k)) . (2.1)
Ce controleur est un bon choix pour les processus, qui permet un nombre reduit de
valeurs pour la variable de commande (usuellement deux), comme par exemple le
br uleur dune chaudi`ere. Le comportement du syst`eme controle par un regulateur
TOR est caracterise par des oscillations de la variable controlee (gure 2.1).
Pour les eecteurs `a commande continue, les controleurs de type proportionnel (P),
implementes generalement sous forme de vannes thermostatiques, ou proportionnel `a
action integrale voire derivee (PI ou PID) sont egalement utilises. En temps discret,
la loi de commande PID est decrite par :
u(k) = K
P
(k) + K
I
T
s
k

i=0
(i) + K
D
(k) (k 1)
T
s
, (2.2)
avec T
s
la periode dechantillonnage. Les comportements obtenus par ces dierents
controleurs sont presentes sur la gure 2.1. Bien que ces regulateurs ameliorent les
performances de controle, le reglage de ces param`etres (K
P
, K
I
et K
D
) est loin
detre trivial et necessite une procedure ecace. Dierentes procedures de reglage
ou dautoreglage ont ete proposees, quelques unes sont explicitees dans le paragraphe
suivant.
0 6 12 18 24
15
16
17
18
19
20
21


0 6 12 18 24
0
0.2
0.4
0.6
0.8
1
Temps [h]
Temps [h]
T
e
m
p
e
r
a
t
u
r
e
[

C
]
P
u
i
s
s
a
n
c
e
[

1
.
2
k
W
]
Consigne
TOR
P
PI
Figure 2.1 Comportement des regulateurs classiques
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 33
2.1.2 Procedures de reglage et dautoreglage
Le reglage des param`etres dun controleur PID necessite un mod`ele mathematique du
processus et un algorithme ecace an dobtenir les performances exigees en boucle fermee.
Trois types de methodes existent pour determiner les bonnes valeurs des param`etres : le
reglage manuel, le reglage automatique et le reglage adaptatif.
La procedure de reglage manuel est une tache chronophage, co uteuse et dicile [92].
Lautoreglage facilite enormement la mise en uvre des controleurs PID, ameliorant aussi
leur performance [14]. Pour realiser un bon reglage des param`etres du PID, dans [176]
les auteurs utilisent la methode Ziegler-Nichols [197], an de controler la temperature
de leau et lhumidicateur dans un syst`eme de climatisation. D`es que les syst`emes ont
des param`etres qui varient dans le temps, la procedure adaptative est la solution la plus
performante [95].
Des methodes didentication ont ete proposees pour determiner les param`etres du
mod`ele du processus. En fonction des valeurs identiees, les trois param`etres du PID sont
mis `a jour. Dans [24] le syst`eme dautoreglage se met en marche de temps en temps,
decouplant le PID et envoyant des impulsions au processus an didentier les param`etres
dun mod`ele de second ordre avec retard. La procedure est presentee pour le cas monova-
riable ainsi que pour le cas dun syst`eme multivariable. Une identication en ligne dun
processus variant dans le temps est proposee dans [17] an de commander lequipement
de chauage dun syst`eme de climatisation, ce qui correspond `a une procedure adaptative.
La structure du mod`ele identie est un premier ordre avec retard. Une loi de commande
lineaire basee sur une procedure didentication en ligne pour la regulation dun ventilo-
convecteur est presentee dans [169].
w(k) (k)
+
-
PID Processus
u(k) y(k)
Autoreglage
K
P
K
I
K
D
Figure 2.2 Schema generique pour les procedures dautoreglage du PID
Le but principal des strategies dautoreglage (gure 2.2) hors-ligne et en ligne men-
tionnees ci-dessous, comme dautres evoquees dans la litterature, est daugmenter la por-
tabilite du controleur. Ainsi, les param`etres du regulateur sadaptent en fonction du com-
portement du syst`eme, ce qui peut etre precieux lors de linstallation du materiel. La
non-linearite, plus ou moins importante, des dierents types dequipements CVC consti-
tue un autre inconvenient qui est surmonte par la technique dautoreglage, ce qui ameliore
les performances de la commande lineaire. Ainsi, la prise en compte des connaissances
particuli`eres des equipements thermiques utilises dans les batiments requiert lemploi dun
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
34 2.

Etat de lart
niveau superieur de controle [133], qui ne peut plus etre synthetise sous la forme dun
simple PID. Les principales connaissances supplementaires qui peuvent etre utilisees sont
les suivantes : la denition dune zone de confort thermique, le prol doccupation, les
previsions meteorologiques, les prix des energies, les couplages thermiques entre les pi`eces,
ainsi que dierents types de contraintes (puissance maximale disponible). Pour les exploi-
ter au mieux, les travaux de recherche se sont orientes vers des structures de commande
plus evoluees, basees sur de lintelligence articielle ou des approches de type commande
optimale, ce que nous developpons dans les paragraphes suivants.
2.1.3 Controle avance
Les structures de controle dit intelligent forment une classe de techniques de com-
mande construites sur diverses approches dintelligence articielle. Parmi les plus connues,
on trouve la logique oue, les reseaux de neurones, les mecanismes dapprentissage et les
algorithmes genetiques. Cette nouvelle generation de controle, basee sur lintuition et le ju-
gement a pour objectif de parvenir `a un controle simple, adaptatif et performant, sans avoir
recours `a un mod`ele structurel du processus. Leurs performances sont en general comparees
`a celles des regulateurs classique de type PID, et leur superiorite reside principalement dans
le fait que des connaissances supplementaires sur le comportement du syst`eme (exprimees
dans le langage naturel - logique oue ou assimilees par des methodes dapprentissage -
reseaux de neurones) ou un certain degre doptimalite (algorithmes genetiques) sont pris
en compte. Ces methodes sont appliquees `a la regulation thermique dans les batiments
depuis les annees 1990, dont la plupart des travaux sont references dans larticle [50]. Nous
proposons ici de survoler rapidement ces techniques et quelques unes de leurs applications.
2.1.3.1 Reseaux de neurones
Comme leur nom lindique, les reseaux de neurones articiels (souvent abrege par
ANN, de langlais articial neural networks) essayent de copier la structure du neurone
biologique. Le neurone est un syst`eme de traitement dinformation, caracterise par un
nombre tr`es important dentrees et une seule sortie. Ces reseaux sont souvent employes
pour resoudre des probl`emes de reconnaissance et de classication. Leur fonctionnement
est base sur des algorithmes dapprentissage, qui leur fait memoriser et classer les donnees.
Ils ont ete utilises dans le domaine de la thermique des b atiments pour resoudre dierents
probl`emes.
Ils ont ete introduits pour denir la notion de confort thermique [15], dans les cas o` u
le calcul de lindice PMV nest pas envisageable. Une experience dans une pi`ece climatisee
a ete eectuee an de prouver lecacite de la methode. Par extension, levaluation du
confort thermique individuel est etudiee dans [106, 100]. De plus, dans [100], il est propose
une structure de controle mixte, o` u lon trouve egalement une strategie dapprentissage
pour etablir la zone de confort thermique en fonction de commandes des utilisateurs,
avec en plus une strategie de controle `a puissance minimale pour realiser des economies
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 35
denergie.
On trouve des ANN egalement dans la modelisation du comportement thermique et
energetique dune enceinte, modelisation qui peut etre utilisee par exemple pour obtenir
une prediction de la temperature dans une serre, ou la prediction de la consommation
energetique dun batiment solaire passif mono-zone dont les methodes sont detaillees res-
pectivement dans [60] et [87].
Enn, pour ameliorer les performances de controle, les reseaux de neurones ont ete
utilises pour modier en ligne les trois param`etres du PID dun regulateur de climatisation
[194]. Pour un syst`eme similaire, letude de deux categories de methodes dapprentissage
de type feedforward est presentee dans [81]. Un autre usage des reseaux de neurones a ete
propose dans [191], an de calculer le moment optimal pour declencher le chauage, apr`es
une periode dinoccupation. Dans cet algorithme, les variables dentrees du reseau sont
la temperature interieure, la temperature exterieure et ses gradients. Linconvenient de la
technique reside dans le fait quelle a besoin dun nombre signicatif de donnees pour la
procedure dapprentissage an quelle ore des solutions precises.
2.1.3.2 Logique oue
Un autre type de controle intelligent est base sur de la logique oue. Cet outil exploite
davantage la performance qualitative du cerveau humain. Le syst`eme ou repose alors sur
une connaissance prealable sur le processus. Cette connaissance sexprime sous la forme
dun ensemble de r`egles, qui peuvent senoncer de mani`ere generale comme : `a telle
situation convient tel comportement .
La modelisation des syst`emes ou des composantes du CVC par la logique oue per-
met de surmonter labsence dun mod`ele mathematique du processus. Un tel exemple est
presente dans le cas dun echangeur de chaleur avec une caracteristique non-lineaire [177].
Dans cet article, le mod`ele ou sert `a predire le comportement du syst`eme pour appliquer
ensuite une commande de type predictif. Les auteurs utilisent un superviseur de type ou
pour ajuster les param`etres du controleur. Dans [171], la logique oue permet de modeliser
et identier un syst`eme de climatisation, mod`ele qui sera ensuite utilise comme mod`ele de
commande.
La commande oue a ete adoptee dans dierents travaux de recherche, comme par
exemple, pour la regulation dune chaudi`ere [77], dun ventilo-convecteur [66] ou dune
climatisation [179]. Dans [49, 91], la logique oue permet de developper un schema de
commande pour le controle de leclairage et de la temperature dans les batiments. Un
exemple interessant est celui de la commande dun syst`eme de chauage pour un batiment
`a energie renouvelable [192], o` u les auteurs proposent une structure de controle hierarchisee
sur trois niveaux. Dans un premier niveau, on retrouve un arbre de decision qui denit un
ensemble approprie de r`egles en fonction des informations disponibles sur les conditions
exterieures et sur loccupation. Le deuxi`eme niveau de r`egles oues gen`ere un prol de puis-
sance optimale. Le troisi`eme niveau determine le mode de fonctionnement des equipements
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
36 2.

Etat de lart
et les valeurs des variables de commande. Les nombreux travaux sur la modelisation et la
commande de syst`emes CVC, utilisant la logique oue, sont repertories dans un etat de
lart tr`es complet [168].
Ces probl`emes de regulation de la temperature et de leclairage sont egalement traites
dans [93]. Dans cet article, une structure de controle en cascade est adoptee, avec un
controleur de type ou dans la boucle externe et un PID pour la boucle interne, qui
permet le reglage du store.
On trouve egalement des algorithmes dautoreglage ou [173] ou encore des combinai-
sons PID-ou [29]. Le point interessant de ce dernier exemple est lemploi de la logique
oue pour compenser la non-linearite de lindice PMV.
2.1.3.3 Algorithmes genetiques
Loptimisation du controle des equipements CVC dans les batiments peut etre realisee
`a laide des algorithmes genetiques (GA). Cette classe de methode appartient `a la fa-
mille des algorithmes evolutionnistes. Les algorithmes genetiques sont une abstraction de
la theorie de levolution, sappuyant sur les principes de selection de Darwin et sur les
methodes de combinaison de g`enes. Ces algorithmes fournissent des bonnes performances
`a de faibles co uts surtout quand le probl`eme doptimisation poss`ede de nombreuses solu-
tions admissibles [156].
En ce qui concerne lapplication des algorithmes genetiques, [190] decrit comment cette
technique peut resoudre le probl`eme de controle optimal de la source de refroidissement
dun syst`eme de climatisation, qui poss`ede des variables de commande continues mais aussi
discr`etes. Dans [40], cest loptimisation du controle de la concentration de CO
2
qui est
decrite. Lecacite de lapproche proposee est mesuree en terme deconomie denergie, en
utilisant le logiciel EnergyPlus.
Un crit`ere doptimisation pour un syst`eme complet de climatisation est developpe dans
[108], construit `a partir des mod`eles mathematiques de chacun de ses composants. Selon les
caracteristiques des operations et des interconnections entre ces sous-syst`emes, le probl`eme
doptimisation est simplie, an detre resolu par lalgorithme genetique developpe dans
[130].
Toujours pour les probl`emes de climatisation, une structure hierarchisee sur deux ni-
veaux est presentee dans [133]. Loptimisation des consignes est realisee au niveau superieur
par un algorithme genetique, quant au niveau inferieur, des controleurs simples soccupent
des regulations locales.
Nous venons daborder bri`evement quelques applications de commandes avancees,
developpees sur des techniques dites intelligentes . Ce nest evidemment quun sur-
vol et ce paragraphe ne se veut en aucun cas exhaustif. La partie suivante presente la
technique qui sera utilisee tout au long de ce memoire, la commande predictive.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 37
2.1.4 Commande predictive
La commande predictive fait partie de la classe des commandes optimales. La theorie
moderne du controle optimal a commence dans la deuxi`eme moitie du XXe si`ecle. Les
travaux de Pontryagin et de ses collaborateurs sur le principe du maximum, ainsi que
lequation dHamilton-Jacobi-Bellman, constituent des resultats fondamentaux dans le
domaine. Resoudre des probl`emes doptimisation est une tache quotidienne pour cha-
cun dentre nous : comment arriver `a destination le plus rapidement possible, comment
organiser lagenda an de satisfaire les contraintes personnelles et professionnelles, etc.
Lobjectif principal de la commande des syst`emes thermiques dans le batiment, comme
par ailleurs la majorite des objectifs de controle, sexprime sous forme dun probl`eme
doptimisation : minimiser la consommation (ou le co ut) tout en garantissant le niveau de
confort (thermique) desire. Cet objectif semble largument susant pour lutilisation de
la commande predictive dans ce cas. Pourtant, le co ut eleve de la technologie necessaire
`a limplantation et la diculte dobtention dun mod`ele mathematique ont longtemps
penalise lutilisation des commandes optimales (predictives) dans les batiments.
Mais limportance de ces deux inconvenients a diminue progressivement. Ainsi, les
avancees technologiques ont permis notamment `a la commande predictive detre employee
dans de nombreuses applications [152]. Dautre part, de nombreux outils de simulation de
thermique et / ou energetique des batiments ont ete developpes, parmi lesquels SIMBAD
[42], EnergyPlus [55], SIBIL [54], DOE-2 [25], HAP [38], BLAST [96], TAS [71], HVACSIM
[148], TRNSYS [19], SPARK [172], ESP-r [35], COMFIE [16] et bien dautres. Due aux
avantages enormes du logiciel (co ut et vitesse), la majorite des resultats experimentaux
concernant le controle thermique des batiments sappuient sur des simulations.
`
A partir des
details de construction du batiment reel (orientation, structure, dimensions et composition
des murs, fenetres, equipements CVC), lutilisateur du logiciel peut egalement obtenir un
mod`ele mathematique par une procedure didentication ou par acc`es direct au mod`ele
du logiciel, quand cela est possible.
2.1.4.1 Principe de la commande predictive
Le principe de la commande predictive [30] consiste `a optimiser une fonction de
co ut, qui decrit lobjectif de controle sur un horizon de temps ni. An de calculer la
sequence de commandes qui optimise le crit`ere deni, le controleur dispose dun mod`ele
(mathematique) du processus pour predire son comportement.
`
A chaque instant, une
sequence de commandes optimales en boucle ouverte, minimisant la fonction de co ut, sur
lhorizon de prediction est calculee, mais seul le premier element est applique au syst`eme.
Cette procedure est reprise `a la periode dechantillonnage suivante (gure 2.3), mettant
`a jour les param`etres courants du syst`eme (mesures ou estimations), selon le principe
dhorizon fuyant.
En fait, la technique predictive est similaire au comportement anticipatif de letre
humain. Pour une analogie simple, prenons le cas de la conduite dune voiture. Le conduc-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
38 2.

Etat de lart
k k k + 1 k + 1 k 1 k 1 k + N (k + 1) + N Temps Temps
Passe Horizon Futur Passe Horizon Futur
Consigne
Sortie
Prediction de la sortie
de prediction non prevu de prediction non prevu
Figure 2.3 Principe de fonctionnement de la commande predictive : Prediction de la
commande et de la sortie `a linstant k sur un horizon ni (gauche) ; Reiteration `a linstant
suivant (droite)
teur connat la trajectoire `a suivre sur un horizon ni et, prenant en compte les ca-
racteristiques de la voiture (mod`ele mental), decide dactionner ses commandes. En utili-
sant un regulateur classique, comme le PID, les actions sont prises en fonction des erreurs
passees entre la sortie et la consigne, ce qui est equivalent, dans cet exemple, `a conduire
la voiture en regardant le retroviseur [30]. Cette comparaison est pourtant leg`erement
inequitable pour le PID, sachant quil nutilise pas les connaissances sur la consigne future
`a suivre.
Les etapes speciques de la mise en uvre dune loi de commande predictive peuvent
etre divisees en deux categories, en fonction de leur apparition par rapport au moment de
mise en service du regulateur (voir la gure 2.4) :
1.

Etapes hors ligne
Le mod`ele de commande est un element essentiel `a la commande predictive. Le
concept fondamental de ce type de controle, celui de prediction, sappuie sur le
mod`ele de commande. Ainsi, sa precision devient determinante pour les perfor-
mances de la commande. Il faut mentionner que la commande predictive est sou-
vent precedee dune procedure didentication [165], et evidemment, plus le mod`ele
de prediction est precis, plus la commande appliquee sera ecace.
Le crit`ere doptimisation est ensuite deni en fonction des objectifs de controle :
(a) Stabilite. La structure de la fonction de co ut est usuellement choisie telle
que loptimum forme une fonction de Lyapunov pour le syst`eme en boucle
fermee, qui garantit la stabilite. Dans la pratique, cette exigence est souvent
relaxee pour le cas des syst`emes stables et lents, tels que les processus ther-
miques presents dans les batiments [76]. Ainsi, dans la suite de ce memoire on
sinteressera plut ot aux aspects technico-economiques qu`a la problematique
de stabilite.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 39

Elaboration du mod`ele de prediction


Denition de la fonction de co ut
Mise `a jour des variables (etat, sortie, consigne, perturbations, etc.)
Calcul de la sequence de commandes (via loptimisation)
Application du premier element de la sequence au syst`eme
I
n
s
t
a
n
t
s
u
i
v
a
n
t
(
k
=
k
+
1
)
Pre-calcul
E
t
a
p
e
s
h
o
r
s
l
i
g
n
e
E
t
a
p
e
s
e
n
l
i
g
n
e
Mise en service
Figure 2.4 Procedure de synth`ese de la loi de commande predictive
(b) Performances de la commande. Le crit`ere est generalement, mais pas tou-
jours, utilise pour specier les performances souhaitees en boucle fermee. Une
liste non exhaustive des travaux concernant lapplication de la commande
predictive (MPC) aux processus thermiques sera donnee dans le paragraphe
suivant, dont dierentes fonctions de co ut sont proposees pour minimiser
lenergie, maximiser le confort ou optimiser un crit`ere qui decrit un compromis
entre ces deux objectifs.
Traditionnellement, la commande predictive est formulee via une fonction de co ut
quadratique. Dun point de vue theorique, loptimisation quadratique presente des
bonnes proprietes, comme la derivabilite et la convexite du crit`ere. La formulation
analytique de loptimum, pour le cas sans contraintes, constitue un autre avantage,
en diminuant leort de calcul en ligne. Pourtant, les objectifs economiques ont
souvent une importance majeure dans les performances des regulateurs. Ces ob-
jectifs, exprimes sous une forme lineaire, transforme la formulation initiale en un
probl`eme doptimisation dans le cadre de la programmation lineaire (sous condi-
tions de linearite du mod`ele et des contraintes). Bien que le calcul de la solution
dun programme lineaire exige un eort reduit par rapport `a une optimisation qua-
dratique de meme complexite, le principal inconvenient reste la non-derivabilite
de la fonction de co ut [159]. Ainsi, les solutions analytiques ne sont generalement
pas disponibles.
Une etape de pre-calcul est souvent necessaire pour reduire la charge en ligne.
Ainsi, la loi de commande MPC `a crit`ere quadratique sans contraintes peut etre
implantee sous la forme dun regulateur lineaire de type RST, par exemple, comme
on le verra au chapitre suivant.
2.

Etapes en ligne
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
40 2.

Etat de lart
La mise `a jour des variables est une etape propre `a tout controleur en boucle
fermee. Cette etape peut viser egalement `a actualiser les param`etres speciques `a
la loi predictive, comme par exemple les dimensions des horizons de prediction et
les valeurs des termes de ponderation ou bien les contraintes du probl`eme dopti-
misation.
Un acteur decisif pour lapplicabilite de cette strategie de commande est le solveur
utilise. Ainsi, il doit fournir une solution du probl`eme doptimisation dans un delai
deni, inferieur `a la periode dechantillonnage du processus.

`
A la n de la procedure doptimisation, seul le premier element de la sequence de
commande est applique au syst`eme.
`
A linstant suivant, de nouvelles informations
seront utilisees pour le calcul de la sequence optimale. Cette technique se base sur
le principe de lhorizon glissant.
2.1.4.2 Commande predictive pour le contr ole thermique
Parmi les nombreuses methodes de commande predictive, la commande predictive
generalisee (GPC de langlais Generalized Predictive Control) [37] est lune des plus
connues. Sa popularite est principalement liee `a lusage dun mod`ele entree-sortie, usuel-
lement de type CARIMA (Controlled AutoRegressive Integrated Moving Average), qui
aboutit `a limplantation de la loi de commande sous une forme RST, quand le probl`eme
pose est lineaire et sans contrainte. De nombreuses applications sont traitees par la methode
GPC, essentiellement pour des syst`emes monovariables [26].
Rien nimpose une formulation specique de la fonction de co ut, pourtant dans les
travaux mentionnes ci-dessous, le crit`ere prefere est celui decrit par lequation suivante :
J(k) =
N
2

j=N
1
(j)[ y(k + j|k) w(k + j)]
2
+
N
u

j=1
(j)u
2
(k + j 1|k), (2.3)
o` u y et w sont, respectivement, la sortie predite (utilisant le mod`ele CARIMA) et la
consigne, quand u represente lincrement de la commande (u(k) = u(k) u(k 1)).
La notation x(k + j|k) traduit la prediction de la variable x, correspondant `a linstant
k + j, calculee au pas de temps k. Le probl`eme doptimisation sexprime alors comme la
minimisation du crit`ere (2.3) :
min
u(k|k),u(k+1|k),...,u(k+N
u
1|k)
J(k). (2.4)
Dans la formulation (2.3) on peut egalement identier les param`etres de reglage speciques
`a la commande predictive GPC :
les horizons inferieur, N
1
, et superieur, N
2
, de prediction sur la sortie,
lhorizon de prediction sur la commande, N
u
, au-del` a duquel les valeurs futures de
la commande sont considerees constantes,
les facteurs de ponderation sur lerreur, , et sur leort de commande, .
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 41
Pour la regulation de la temperature dans une pi`ece chauee par un convecteur elec-
trique, les auteurs proposent dans [52] un regulateur RST construit `a partir de la solution
analytique du probl`eme doptimisation de GPC. An de simplier limplantation, une
technique danticipation empirique est mise au point qui reduit la dimension de lhorizon
de prediction. Lidee utilisee est le decalage dans le temps de la consigne future. Dans [33],
la commande GPC est appliquee `a un syst`eme de chauage par le plancher. Lidentication
des param`etres du mod`ele CARIMA est basee sur une methode destimation des moindres
carres. Suite `a cette procedure, les auteurs ont propose deux mod`eles du syst`eme (pour
le jour et pour la nuit). Les mod`eles polynomiaux, speciques `a la commande predictive
generalisee, sont relativement diciles `a manipuler dans le cas des processus multivariables.
Cest pourquoi, par exemple, on retrouve des structures de commande GPC decentralisees
(monovariables) [189, 162], pour des syst`emes de climatisation multivariables.
Pour les processus de grande taille, composes de plusieurs sous-syst`emes, la formulation
de la commande predictive dans lespace detat est preferable [175]. Ce formalisme, com-
munement appele MPC (Model Predictive Control) ou MBPC (Model-based Predictive
Control) [36], facilite egalement lanalyse de stabilite et de robustesse du correcteur.
Dans [64], le passage de la formulation polynomiale vers celle de lespace detat est
detaille. Le mod`ele du syst`eme de climatisation considere est suppose lineaire. Lajout
de lindice PMV au mod`ele conduit les auteurs `a adopter une structure Hammerstein-
Wiener (basee sur une fonction de transfert `a laquelle vient sajouter une non-linearite
statique). Dierentes fonctions de co ut quadratiques sont proposees pour le controle de
la temperature, de lhumidite et de lindice de confort. Ainsi, on peut distinguer des for-
mulations quadratiques minimisant soit lerreur de suivi, soit la commande, ou bien un
compromis entre les deux.
Dans le meme esprit, le travail de [150] presente un schema de commande MPC pour
un syst`eme de chauage par le plafond. Une procedure didentication par sous-espaces a
ete utilisee pour obtenir un mod`ele lineaire du processus. La temperature exterieure est
incluse dans le mod`ele sous forme de deux valeurs, T
min
et T
max
, qui denissent lintervalle
de conance de la prevision meteorologique. La fonction de co ut est une modication de
(2.3) o` u le second terme ne minimise pas leort de controle u
2
(k), mais directement la
commande u
2
(k). Les contraintes inegalite sont imposees sur lamplitude et la vitesse
du signal de commande, ainsi quune limite inferieure de la temperature. Les resultats
obtenus sur un batiment reel montrent des economies importantes, entre 17 et 24 %, par
rapport `a une commande en boucle ouverte (en fonction de la temperature exterieure).
Une formulation similaire de la fonction de co ut est adoptee dans [146], o` u les auteurs
comparent trois structures de controle. Le syst`eme de chauage considere poss`ede deux
sources denergie : une source fossile et une source renouvelable. Les schemas de commande
inclus dans letude sont un PID, un PID-ou et un PID-MPC. Les resultats obtenus
montrent la superiorite du controleur PID-MPC par rapport `a un indice de performance
qui int`egre lerreur de suivi et le pourcentage relatif denergie fossile consommee.
Dans [144], la commande predictive est employee pour le controle hygrothermique
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
42 2.

Etat de lart
dun incubateur pour les nouveaux nes. Un mod`ele ane par morceaux (PWA) est ob-
tenu par un algorithme didentication. Les commandes sont denies par un ensemble de
valeurs discr`etes.
`
A chaque valeur du signal de controle correspond un mod`ele lineaire.
Deux controleurs, un pour la regulation de la temperature et lautre pour lhumidite, sont
proposes. Le crit`ere quadratique utilise inclut seulement le carre de lerreur de suivi.
Les travaux mentionnes, dedies `a loptimisation du controle des syst`emes CVC utilisent
des fonctions de co ut quadratiques. Pourtant, le co ut de fonctionnement est souvent pro-
portionnel `a lenergie delivree, et non ` a son carre comme cela est propose dans le crit`ere.
Cest pourquoi, pour satisfaire des objectifs economiques, les probl`emes de minimisation
ont ete orientes vers une formalisation lineaire du probl`eme.
La commande predictive a ete etudiee dans le projet de recherche OptiControl an de
controler le climat dans les batiments en utilisant les previsions des conditions meteoro-
logiques. Lobjectif principal du projet est de maintenir la temperature ambiante, la
concentration de CO
2
et leclairage dans une gamme de confort predenie tout en minimi-
sant la consommation [142]. Les resultats publies sont obtenus en simulation, en utilisant
dierentes congurations dequipements [140]. Trois structures de controle sont comparees :
La premi`ere, prise comme reference, est une strategie basee sur des r`egles de type
si condition alors action , denie dans [74].
La deuxi`eme loi de commande est de type MPC. Les auteurs proposent une approche
stochastique [141]. Le crit`ere `a minimiser est constitue par le co ut de fonctionnement,
J(k) =

N
u
j=1
c
T
(k +j 1)u(k +j 1|k). Le confort est exprime par une contrainte
lineaire stochastique, P[GGG(AAAxxx(k) +BBBuuu(k) +CCCwww(k)) ggg] , o` u [0, 1] designe
le niveau (ou degre) de conance, xxx(k) est letat du syst`eme, uuu(k) et www(k) sont les
sequences futures des entrees et des perturbations. La fonction GGG rend la sequence fu-
ture de sorties predites, en utilisant le mod`ele detat deni par les matrices AAA, BBB et CCC,
quand le vecteur designe les limites de la zone de confort. Cette formulation permet
deviter linfaisabilite du probl`eme doptimisation. Le mod`ele de commande utilise
est obtenu par la linearisation dun mod`ele bilineaire, `a chaque pas dechantillonnage
(1h).
La troisi`eme strategie est plut ot un concept. Il sagit dun controle optimal qui uti-
lise une prevision meteorologique parfaite, fournissant ainsi les performances limites
quun controleur peut atteindre.
Une methode pour reduire le pic de la demande delectricite dans les batiments a ete
egalement proposee dans [143]. Ainsi, le prix de lelectricite qui intervient dans le crit`ere,
c
T
(k), est calcule en fonction du prix au compteur, de la charge du reseau et dune variable
particuli`ere `a la localisation.
Dans le cadre du programme Homes [1] on retrouve egalement des approches predictives
pour la regulation globale de plusieurs syst`emes, comme le CVC, leclairage et la qualite
de lair avec une consommation energetique minimale. Les auteurs de [12] presentent le
probl`eme doptimisation sous forme dun PL. Le crit`ere `a optimiser est la consommation
ou le co ut energetique, sous des contraintes denies par le mod`ele de prediction, le ni-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 43
veau de confort et les limitations des actionneurs. Dans un premier temps, une procedure
iterative est proposee pour surmonter linconvenient lie `a la bilinearite du mod`ele. Ainsi, le
probl`eme initial est resolu par la resolution repetitive dun programme lineaire parametre.
Les resultats montrent la convergence rapide de lalgorithme, pourtant la preuve theorique
de la convergence est dicile `a obtenir. Une deuxi`eme contribution est representee par le
sous-echantillonnage de la sequence future des sorties conjugue `a une parametrisation de
la sequence des entrees [13], ce qui permet de reduire la charge de calcul.
Une autre initiative recemment developpee au Laboratoire de controle predictif et dis-
tribue de lUC-Berkeley, se concentre sur lelaboration de strategies MPC pour les syst`emes
de stockage de lenergie [112, 111]. Le cas du syst`eme de climatisation dans le campus uni-
versitaire est considere. Ces travaux ont mis au point des mod`eles simplies pour les
refroidisseurs, les tours de refroidissement, les reservoirs et les batiments. Lobjectif de la
commande predictive est de minimiser la consommation delectricite, satisfaisant la charge
de refroidissement requise. Pour traiter la complexite du syst`eme, un mod`ele de commande
simplie sous forme hybride est utilise et le probl`eme doptimisation est resolu par une
strategie de type branch and bound.
2.1.4.3 Motivation du choix de la commande predictive
Les strategies de commande mentionnees dans le paragraphe precedent sadressent aux
dierents syst`emes thermiques. Malgre les caracteristiques particuli`eres des equipements,
les objectifs de controle sont toujours les memes : assurer un certain niveau de confort
avec un co ut minimal, et cest dans ce sens que la plupart des travaux ont ete menes. Pour
satisfaire les exigences energetiques imposees aux batiments, dans le cadre reglementaire
(RT 2012), ou par les usagers eux-memes qui veulent diminuer leur facture, lutilisation
dinformations exog`enes semble de plus en plus importante voire necessaire. Voici une liste
non exhaustive des informations qui peuvent contribuer `a ameliorer les performances du
controle du poste de chauage dans un batiment :
lintermittence, cest-`a-dire le prol doccupation,
la consigne / zone de confort,
le prix de lenergie,
les conditions meteorologiques,
les apports des occupants et des equipements electriques.
Ceci etant, connatre ces valeurs `a un instant donne ne sut pas `a ameliorer signi-
cativement la qualite du controle. La raison est simple. Les syst`emes thermiques par
leur grande inertie ont des dynamiques relativement lentes. Pour exploiter au mieux ces
donnees complementaires, il est necessaire de les anticiper.
Lutilisation du prol doccupation futur permet par exemple de declencher le chauage
en avance pour satisfaire le confort d`es le debut des plages doccupation. La connaissance
des horaires tarifaires (heures creuses - heures pleines) peut engendrer des economies si-
gnicatives en utilisant la capacite de stockage thermique de limmeuble. Une prevision
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
44 2.

Etat de lart
plus ou moins correcte des perturbations (internes ou externes) peut eviter les surchaues.
Cest pour permettre de tels eets anticipatifs que nous avons utilise dans nos travaux
une commande predictive, approche qui sera exploree dans la suite du memoire. La gure
2.5 propose ainsi un schema illustrant la structure du controleur predictif pour la regulation
thermique. Le prix `a payer pour lexploitation optimale des informations exog`enes nest
pas negligeable. Il faut un mod`ele de prediction susamment able. Il faut de plus que le
probl`eme doptimisation resultant ne devienne pas trop complexe pour pouvoir etre resolu
en ligne avec une charge de calcul reduite.
Predicteur
Procedure
Mod`ele de
Perturbations
Commande Sortie
Prix de lenergie Prol doccupation
Confort thermique
Contr oleur predictif
doptimisation
perturbations
Mod`ele
Contraintes
perturbations
Prediction des
Objectif
Sortie / etat estime
Figure 2.5 Structure de controle predictif pour la regulation thermique dans les
batiments
Concernant la modelisation du syst`eme thermique (batiment et equipement de chauf-
fage), des mod`eles de prediction lineaires seront utilises dans la suite du memoire. Ils
representeront le comportement du batiment chaue par des convecteurs electriques ou par
un syst`eme de chauage par le sol, moyennant des hypoth`eses simplicatrices supplemen-
taires qui seront precisees le cas echeant.
La complexite de limplantation de la commande predictive constitue lautre point
faible de cette approche. La diculte liee au temps de calcul en ligne a longtemps ete
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.1. Techniques pour la regulation thermique des batiments 45
un verrou pour lutilisation de cette technique dans certains domaines. Pour reduire cet
eort de calcul, de nombreuses solutions ont ete proposees. Un des moyens les plus simples
est ladoption du MPC sans contraintes. La solution du probl`eme de minimisation qua-
dratique, avec un mod`ele de prediction lineaire, sobtient de mani`ere analytique, ce qui
conduit `a une implantation sous la forme dun controleur lineaire (RST) [26].
Neanmoins, un interet majeur de la methode predictive reside dans sa capacite `a
prendre en compte les contraintes lors de la synth`ese de la commande. Ces contraintes
peuvent etre liees aux aspects physiques, au confort, `a la s urete, etc. Dun point de vue
technique, elles sont exprimees en fonction des variables comme letat, lincrement ou lam-
plitude de la commande, tout comme la sortie. Le probl`eme ne peut plus etre resolu de
mani`ere analytique, mais en ligne. Pour une fonction de co ut donnee, la charge de calcul
necessaire `a cette resolution depend non seulement de la dimension du vecteur des variables
doptimisation (dimension notamment liee `a lhorizon de prediction) mais aussi du nombre
de contraintes. Sachant que les contraintes dures qui apparaissent dans les probl`emes de
controle sont normalement justiees par des limitations physiques du syst`eme, la reduction
de lhorizon de prediction est devenue une pratique usuelle en commande predictive an de
diminuer le temps de calcul [30]. On trouve dautres strategies de reduction du nombre de
degres de liberte, par exemple le blocage de certains elements de la sequence de commande.
Elles sont analysees dans [28].
Pourtant, la solution analytique sans contrainte, comme la diminution du nombre de
degre de liberte, impliquent une perte au niveau de loptimalite par rapport `a la solution
du probl`eme initialement pose. Une approche plus interessante dans cette optique est la
construction dune loi MPC explicite [21, 72, 139] basee sur les principes de la program-
mation multiparametrique. Elle permet dalleger leort de calcul en ligne requis par la
procedure de resolution du probl`eme doptimisation sous contraintes. Ainsi, la commande
predictive lineaire (avec mod`ele de prediction lineaire) sexprime comme une loi ane par
morceaux. Ceci permet le calcul hors ligne des lois anes et de leurs regions dapplicabi-
lite, de sorte que la procedure en ligne est reduite `a lidentication de la region courante.
Malgre tout, lapplication de cette technique aux lois de commande predictives presentees
dans les chapitres suivants sav`ere moins adaptee, car les param`etres du crit`ere et / ou les
contraintes changent au cours du temps en fonction des informations exog`enes.
Dans ce memoire, nous verrons que nous devrons faire face `a deux dicultes. La
premi`ere est liee au crit`ere : lhorizon de prediction doit etre important pour anticiper
ecacement les modications sur les variables intervenant dans la fonction de co ut, mais
egalement pour exploiter la capacite de stockage thermique du batiment. La seconde est
liee `a la taille du syst`eme. Ainsi, pour les syst`emes de grande taille, une parallelisation de
la procedure doptimisation du crit`ere predictif engendre generalement des avantages en
termes de temps de calcul mais aussi en ce qui concerne limplantation et la maintenance
de la structure de controle. La distribution de la commande et par consequent la distri-
bution de leort de calcul font lobjet de nombreux travaux depuis quelques annees. La
partie suivante a pour objectif de sensibiliser le lecteur ` a ces dierents travaux et dierents
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
46 2.

Etat de lart
outils mathematiques qui leur servent de support.
2.2 Contr ole predictif pour les syst`emes de grande taille
La plupart des travaux mettant en uvre la commande predictive pour la regulation
thermique dans les batiments se focalisent au cas monozone.
Les perturbations externes considerees sont de nature meteorologique, et dans les
mod`eles proposes, les couplages thermiques entre deux zones adjacentes sont negliges.
Cette simplication est usuellement faite d`es que lon fait lhypoth`ese que la temperature
est la meme dans toutes les pi`eces [142].
Dans la partie precedente, nous avons souligne limportance de la prise en compte de
lintermittence doccupation des pi`eces pour realiser des economies denergie, que ce soit
pour des bureaux ou des habitations. Notons dailleurs que cette economie denergie est
dautant plus grande que lecart de consigne entre la temperature en periode dabsence
et celle en periode de presence est important [62]. Si lon consid`ere que chaque zone a
son propre prol doccupation, le transfert thermique entre deux pi`eces voisines nest
plus negligeable. Il est alors proportionnel `a lecart de temperature (voire Annexe A).
Par consequent, le mod`ele thermique dun batiment multi-zone doit prendre en compte
ces interactions. Il pourra alors etre modelise par plusieurs sous-syst`emes interconnectes
(gure 2.6).
Zone 1 Zone 2
Zone 3 Zone 4
Sous-syst`eme 1 Sous-syst`eme 2
Sous-syst`eme 3 Sous-syst`eme 4
(a) (b)
Figure 2.6 B atiment multi-zone (a) et structure des interconnexions (b)
Ce type de decomposition et dinteractions nest evidemment pas limite au probl`eme
de la regulation thermique. De nombreux processus issus de lindustrie moderne sont com-
poses de plusieurs sous-syst`emes inuences seulement par les sous-syst`emes voisins. Pour
satisfaire les exigences accrues de performance, les syst`emes de controle doivent prendre en
compte ces interactions speciques. Pour ces syst`emes de grande taille, dierentes solutions
sont developpees.
2.2.1 Commande centralisee
Generalement, la commande predictive est etudiee via une approche centralisee. La
prediction utilise un mod`ele complet du processus, qui inclut toutes ses interconnexions.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.2. Controle predictif pour les syst`emes de grande taille 47
`
A lexception de loptimalite de la commande ainsi calculee, la structure monolithique du
regulateur (voir gure 2.7.a) resultant soure de nombreux inconvenients potentiels :
La croissance du temps de calcul avec le nombre des sous-syst`emes constitue un
desavantage majeur de cette structure de commande. Pourtant, laugmentation de
la puissance de calcul, les logiciels doptimisation performants et les algorithmes
concus speciquement pour le controle des syst`emes interconnectes [145] ont ameliore
laspect pratique du correcteur centralise.
Pour certains syst`emes, la diculte ou limpossibilite dobtenir un mod`ele du syst`eme
global (trac aerien, reseaux, etc) rend la structure centralisee inacceptable [85].
Quand ce mod`ele est disponible, ses dimensions peuvent etre prohibitives. De plus,
il doit etre reconstruit `a chaque changement de la conguration du syst`eme, par
exemple dans le cas darret temporel dun sous-syst`eme en raison des actions de
maintenance ou de dysfonctionnement.
Les operateurs des syst`emes de grande taille consid`erent les structures de commande
centralisees comme monolithiques et tr`es peu exibles [184]. En outre, lorsque le
controleur central tombe en panne, la fonctionnalite du syst`eme entier est compro-
mise.
Dans nombreux cas, les dierentes parties du syst`eme global sont la propriete dor-
ganisations dierentes. Le partage des informations requis par lusage du controleur
centralise est loin detre evident.
Ces points faibles ont encourage le developpement des strategies decentralisees.
2.2.2 Commande decentralisee
Dans le controle decentralise, voir la gure 2.7.b, les entres (u
i
) et les variables controlees
(y
i
) sont regroupees dans des ensembles disjoints u
i
, y
i
. Ensuite, `a chaque ensemble est
associe un regulateur qui fonctionne independamment des autres. La solution du probl`eme
est relativement simple lorsque les interactions entre dierentes paires (sous-syst`emes) sont
faibles.
u
1
u
2
u
3
MPC
y
1
y
2
y
3
u
1
u
2
u
3
MPC
2
y
1
y
2
y
3
MPC
3
MPC
1
(a) (b)
Figure 2.7 Schema de controle centralise (a) et decentralise (b) pour le cas de trois
sous-syst`emes
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
48 2.

Etat de lart
Linteret pour le controle decentralise remonte aux annees soixante-dix [188]. Depuis
lors, le nombre des travaux sur ce sujet a augmente plus quexponentiellement [90]. Les
techniques de controle decentralisees sont dediees aujourdhui `a un large eventail dap-
plications, allant de la robotique `a laeronautique en passant par lingenierie civile. Ce
grand interet rend tr`es dicile linspection des approches proposees dans la litterature et
va au-del` a du cadre de ce document.
La structure decentralisee est une solution tr`es ecace aux probl`emes engendres par
une commande centralisee. Ainsi, le calcul de la loi de commande est parallelise de mani`ere
naturelle et les mod`eles de commande sont decomposes par sous-syst`eme. La modularite
de la structure augmente la abilite et la exibilite du syst`eme. Larret ou lajout dun
sous-syst`eme peut etre eectue sans perturber le fonctionnement du syst`eme global. Pour-
tant, le fait de negliger les interactions provoque certaines repercussions sur le mecanisme
de controle. Par consequent, les interactions fortes peuvent meme empecher de parvenir
`a la stabilite, tandis que pour les sous-syst`emes `a interactions relativement faibles, les
performances denies par le crit`ere diminuent (par rapport `a la solution centralisee).
Concernant le MPC decentralise, dans [115] les auteurs presentent une loi de com-
mande stabilisante pour une classe de mod`eles non-lineaires. La preuve de stabilite repose
sur lutilisation dune contrainte, appelee contractive, proposee dans [45]. Une autre ap-
proche qui sappuie sur le concept de stabilite entree-etat (ISS, de langlais Input-to-State
Stability) est adoptee dans [155]. Les interactions entre les sous-syst`emes sont considerees
comme des perturbations bornees et lobjectif revient donc `a concevoir une loi de com-
mande robuste.
Pour les probl`emes de regulation de la temperature dans les batiments, les inconvenients
lies aux probl`emes de stabilite dus `a lomission des couplages dans les mod`eles de com-
mande sont loin detre critiques. Ainsi, la structure decentralisee est utilisee `a grande
echelle pour la regulation de la temperature dans les batiments multi-zone. Cependant,
lutilisation de la commande predictive decentralisee implique une diminution des perfor-
mances [122].
Cet ecart par rapport `a la solution centralisee peut augmenter encore, suite `a lappa-
rition des contraintes couplees (entre les sous-syst`emes). Ces contraintes sont gerees de
mani`ere sous-optimale par les controleurs locaux.
Quand le batiment dispose de plusieurs sources de chauage (une source centrale et
des sources locales) la gestion ecace privilegie normalement la source la moins ch`ere.
Pourtant, les prix variables de lenergie peuvent engendrer une hierarchie dynamique.
En outre, supposant que la source centrale chaue toutes les zones de limmeuble, son
rendement depend alors du degre doccupation du batiment.
Intuitivement, on esp`ere que des echanges dinformations entre les controleurs locaux
amelioreraient les performances du syst`eme. Ceci conduit `a des architectures de commande
distribuee basees sur la cooperation des regulateurs locaux dans lesquels la communication
joue un role decisif.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.2. Controle predictif pour les syst`emes de grande taille 49
2.2.3 Commande distribuee
Les structures de controle distribuees, comme lexemple illustre dans la gure 2.8, sup-
posent des echanges dinformations entre les regulateurs locaux, an que chacun dentre
eux ait des connaissances sur le comportement des autres. Le developpement des reseaux
de communication et la technologie eld-bus fournit les moyens necessaires pour lim-
plantation de cette methode de controle. La commande distribuee apporte de nouvelles
specications dans le domaine du controle et permet denvisager de nouvelles applications.
u
1
u
2
u
3
MPC
2
y
1
y
2
y
3
Reseau de
communication
MPC
3
MPC
1
Figure 2.8 Schema de controle distribue
Cette strategie de controle est vue comme une alternative aux deux structures men-
tionnees precedemment. Par consequent, elle est une option attractive pour les situations
o` u lobjectif global, tel que la stabilite en boucle fermee et / ou les exigences de per-
formance, ne peuvent pas etre satisfaites par les controleurs decentralises, tandis que les
inconvenients de la regulation centralisee sont indesirables.
Lorsque les controleurs sont de type predictif, linformation transmise est composee
generalement des sequences futures des variables (etats, commandes, sorties, etc). Ainsi,
tous les regulateurs peuvent predire les eets des interactions sur lhorizon de prediction
considere. Pour prendre en compte ces informations, les mod`eles de prediction doivent
inclure les couplages entre les sous-syst`emes.
2.2.3.1 Modelisation des couplages
Le developpement dune strategie de commande predictive distribuee repose sur la
facon de considerer les couplages. Un nombre important de strategies de commande predic-
tive distribuees proposees dans les derni`eres annees, ainsi que celles proposees dans ce
memoire, sappuient sur des mod`eles de prediction lineaires et invariants dans le temps.
La majorite des etudes consid`erent que les ensembles des variables dentrees, detats et de
sorties locales sont disjoints.
`
A partir de cette hypoth`ese, les vecteurs dentrees, detats et
de sorties du mod`ele global :
_
xxx
g
(k + 1) = AAA
g
xxx
g
(k) +BBB
g
uuu
g
(k)
yyy
g
(k) = CCC
g
xxx
g
(k),
(2.5)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
50 2.

Etat de lart
sont obtenus par la concatenation des vecteurs locaux :
uuu
g
(k) =
_
uuu
T
1
(k) uuu
T
s
(k)
_
T
,
xxx
g
(k) =
_
xxx
T
1
(k) xxx
T
s
(k)
_
T
,
yyy
g
(k) =
_
yyy
T
1
(k) yyy
T
s
(k)
_
T
,
(2.6)
o` u s represente le nombre des sous-syst`emes.
On retrouve dans la litterature cinq types de mod`eles locaux, en fonction de la prise
en compte des couplages entre les sous-syst`emes :
1. Couplage complet [180, 119] : la representation la plus generale des sous-syst`emes
lineaires couples est decrite par :
_

_
xxx
i
(k + 1) =
s

j=1
AAA
i,j
xxx
j
(k) +
s

j=1
BBB
i,j
uuu
j
(k)
yyy
i
(k) =
s

j=1
CCC
i,j
xxx
j
(k).
(2.7)
Alors, les matrices du mod`ele global sont :
AAA
g
= [AAA
iN
s
1
,jN
s
1
], BBB
g
= [BBB
iN
s
1
,jN
s
1
], CCC
g
= [CCC
iN
s
1
,jN
s
1
], (2.8)
avec la notation suivante :
[RRR
iN
s
1
,jN
t
1
] =
_

_
RRR
1,1
RRR
1,2
RRR
1,t
RRR
2,1
RRR
2,2
RRR
2,t
.
.
.
.
.
.
.
.
.
.
.
.
RRR
s,1
RRR
s,2
RRR
s,t
_

_
. (2.9)
2. Couplage par les entrees et par les etats [134, 183, 47] : les sorties locales
dependent uniquement des etats locaux :
_

_
xxx
i
(k + 1) =
s

j=1
AAA
i,j
xxx
j
(k) +
s

j=1
BBB
i,j
uuu
j
(k)
yyy
i
(k) = CCC
i,i
xxx
i
(k).
(2.10)
ainsi les matrices du mod`ele global sont :
AAA
g
= [AAA
iN
s
1
,jN
s
1
], BBB
g
= [BBB
iN
s
1
,jN
s
1
], CCC
g
= bloc-diag{CCC
1,1
, ..., CCC
s,s
}. (2.11)
3. Couplage par les etats [86, 31, 196] : les etats locaux sont inuences par les etats
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.2. Controle predictif pour les syst`emes de grande taille 51
des autres sous-syst`emes :
_

_
xxx
i
(k + 1) =
s

j=1
AAA
i,j
xxx
j
(k) +BBB
i,i
uuu
i
(k)
yyy
i
(k) = CCC
i,i
xxx
i
(k).
(2.12)
et les matrices du mod`ele global sont :
AAA
g
= [AAA
iN
s
1
,jN
s
1
], BBB
g
= bloc-diag{BBB
1,1
, ..., BBB
s,s
}, CCC
g
= bloc-diag{CCC
1,1
, ..., CCC
s,s
}.
(2.13)
4. Couplage par les entrees [98, 195, 184, 114, 131, 68, 11, 174] : il sagit dun des
mod`eles les plus frequemment utilises dans les approches predictives distribuees :
_

_
xxx
i
(k + 1) = AAA
i,i
xxx
i
(k) +
s

j=1
BBB
i,j
uuu
j
(k)
yyy
i
(k) = CCC
i,i
xxx
i
(k),
(2.14)
et les matrices du mod`ele global sont :
AAA
g
= bloc-diag{AAA
1,1
, ..., AAA
s,s
}, BBB
g
= [BBB
iN
s
1
,jN
s
1
], CCC
g
= bloc-diag{CCC
1,1
, ..., CCC
s,s
}.
(2.15)
5. Mod`ele decouple [163, 23, 153, 88, 99, 46, 32] : il represente des sous-syst`emes
compl`etement independants :
_
xxx
i
(k + 1) = AAA
i,i
xxx
i
(k) +BBB
i,i
uuu
i
(k)
yyy
i
(k) = CCC
i,i
xxx
i
(k).
(2.16)
Ce type de mod`eles intervient dans les structures de commande distribuees dont les
param`etres des sous-syst`emes sont reunis par une contrainte globale ou une fonction
de co ut non-separable. Les trois matrices du mod`ele global ont une structure bloc-
diagonale.
En enlevant lhypoth`ese selon laquelle les ensembles de variables locales sont disjoints,
les mod`eles de couplage precedemment decrits deviennent composites [182]. Ainsi, quelques
entrees, etats ou sorties locales peuvent etre partagees par plusieurs sous-syst`emes.
2.2.3.2 Caracteristiques du crit`ere
Selon la gure 2.4, apr`es la denition du mod`ele, letape suivante dans la conception de
la loi predictive consiste `a formuler lobjectif de commande. Mathematiquement, cet ob-
jectif est exprime par un probl`eme doptimisation global, qui a la forme generale suivante :
min
uuu
1
(k),...,uuu
s
(k)
J(uuu
1
(k), ..., uuu
s
(k), xxx
1
(k), ..., xxx
s
(k)) (2.17a)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
52 2.

Etat de lart
sous les contraintes
dynamiques du syst`eme (couple) (2.17b)
f
i
(uuu
i
(k), xxx
i
(k)) F, i N
s
1
, (2.17c)
g(uuu
1
(k), ..., uuu
s
(k), xxx
1
(k), ..., xxx
s
(k)) G, (2.17d)
o` u uuu
i
(k), i N
s
1
denotent les sequences de commande sur lhorizon de prediction. En
fonction des objectifs de commandes locales, il existe de nombreuses variantes du probl`eme
(2.17), pour lesquelles dierentes hypoth`eses sont faites. Pourtant, la conception de lar-
chitecture distribuee est fortement liee `a certaines proprietes particuli`eres du probl`eme.
Une premi`ere caracteristique importante est la separabilite (ou ladditivite) de la fonc-
tion de co ut : J =

s
i=1
J
i
. On dit alors que J
i
est un crit`ere local. Generalement les
fonctions de co ut utilisees dans les applications de controle poss`edent cette propriete. Ce-
pendant, en fonction de la structure du type de mod`ele de couplage, le crit`ere local, i,
dependra non seulement des variables locales, uuu
i
(k) et xxx
i
(k), mais egalement des variables
dautres sous-syst`emes.
Les contraintes appelees decouplees ou locales (2.17c) reunissent uniquement les va-
riables appartenant au sous-syst`eme. Du point de vue de la distribution de loptimisa-
tion, elles ne posent pas de probl`emes supplementaires. Toutefois, les contraintes couplees
(2.17d) ont tendance `a compliquer lalgorithme ou `a degrader ses performances [160].
Lobjectif des paragraphes suivants sera dexposer, sans etre exhaustif, dierentes
methodes de distribution de la loi de commande predictive.
2.2.3.3 Techniques de distribution
Concernant les aspects algorithmiques, letat de lart de R. Scattolini, [166], sugg`ere
trois crit`eres pour classer les structures MPC distribuees.
1. Premi`erement, en fonction de la topologie du reseau de communication, les deux cas
suivants peuvent etre consideres :
algorithmes compl`etement connectes, dans lesquels linformation est envoyee (et
recue) de tous les controleurs locaux vers tous les autres
algorithmes partiellement connectes, dans lesquels linformation est envoyee (et
recue) de tous les controleurs locaux seulement vers un sous-ensemble des autres
agents.
Sans doute les structures topologiques partiellement connectees sont plus seduisantes
du point de vue de limplantation, tout specialement dans le cas des syst`emes de
grande taille. Neanmoins, la topologique de communication entre les agents suit,
naturellement, celle des interconnexions entre les sous-syst`emes.
2. Un aspect essentiel des algorithmes distribues reside dans lechange dinformations
entre les controleurs. Cest dailleurs le detail qui fait la distinction entre les approches
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.2. Controle predictif pour les syst`emes de grande taille 53
distribuees et celles compl`etement decentralisees. Le nombre dechanges dinforma-
tion par periode dechantillonnage constitue alors un autre crit`ere de classication.
Ainsi, on peut dierencier :
algorithmes non iteratifs, dans lesquels linformation est envoyee (et recue) une
seule fois par instant dechantillonnage
algorithmes iteratifs, dans lesquels linformation est envoyee (et recue) plusieurs
fois par instant dechantillonnage.
3. Typiquement, les algorithmes iteratifs sont construits pour converger vers un consen-
sus global ou un point dequilibre (de Nash).
`
A cet egard, une troisi`eme classication
peut etre consideree :
algorithmes communiquants, dans lesquels chaque controleur minimise un crit`ere
local, en prenant en compte linuence des autres sous-syst`emes sur ses propres
variables
algorithmes cooperatifs, dans lesquels chaque controleur local minimise un crit`ere
qui prend egalement en compte leet des actions locales sur lobjectif global.
Cette derni`ere classication a, probablement, les consequences les plus importantes sur
la complexite des correcteurs locaux. En reduisant les connaissances du controleur local `a
son propre mod`ele de prediction et `a la fonction de co ut locale, le comportement des agents
sera caracterise par des actions egostes. Cest le cas des algorithmes de communication
iteratifs, qui convergent generalement vers un point dequilibre, ou un point de Nash [132],
specique `a la theorie des jeux [18].
Dans cette categorie, rappelons les travaux de [86, 31] qui presentent des algorithmes
communiquants. Une contrainte sur la matrice globale detat est utilisee pour garantir la
stabilite nominale en boucle fermee. Une structure distribuee, dans laquelle les interactions
entre les sous-syst`emes sont traitees comme des incertitudes bornees, est decrite dans [85].
Chaque controleur impose des contraintes locales sur ses propres etats, contraintes qui
seront utilisees par les autres agents an de formuler un probl`eme de type min-max.
La preuve de stabilite est obtenue en bornant lensemble des contraintes sur letat. Dans
[131], un autre algorithme independant est presente dans le cadre sans contrainte. Larticle
propose egalement une methode an de partitionner un syst`eme global en sous-syst`emes,
par lutilisation de la norme de Hankel, qui exprime lenergie des paires entree/sortie. Dans
le meme cadre de travail, des conditions necessaires et susantes pour la convergence et
la stabilite nominale sont determinees dans [51, 98], utilisant la solution analytique du
probl`eme doptimisation quadratique. La stabilite de la boucle fermee est egalement etudiee
pour lalgorithme equivalent, non iteratif. Des conditions similaires sont montrees dans [68].
De plus, un retard dun pas dechantillonnage, correspondant `a lechange dinformation,
est ajoute dans [180].
Les travaux de [11] presentent une methode de selection de la structure de controle
(parmi le MPC centralise, lalgorithme distribue independant et la structure decentralisee).
`
A partir de la solution explicite, les auteurs denissent un indice de performance du syst`eme
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
54 2.

Etat de lart
de commande, en fonction de la marge de robustesse et de la connectivite entre les sous-
syst`emes.
Lobjectif des algorithmes cooperatifs est dassurer la convergence vers la solution op-
timale globale. Generalement, pour atteindre ce but, les controleurs locaux doivent agir
de fa con altruiste, ce qui suppose linclusion dans les fonctions de co ut locales des termes
lies aux objectifs des autres agents.
Ainsi, lalgorithme cooperatifs propose dans [184] implique la connaissance locale du
mod`ele complet du syst`eme, an que la fonction de co ut globale soit minimisee locale-
ment. Dans lapproche presentee, de nombreuses proprietes interessantes sont prouvees
comme la convergence de lalgorithme vers la solution optimale globale, mais egalement
la faisabilite et la stabilite nominale en boucle fermee si lalgorithme est interrompu `a
une iteration intermediaire. Un autre algorithme convergeant vers loptimum global est
decrit dans [195], mais par rapport au precedent, cette etude est developpee pour une
optimisation sans contraintes. Lavantage de lapproche reside dans la minimisation locale
dune fonction qui reunit seulement le crit`ere local et les crit`eres des sous-syst`emes voisins
(directement interconnectes), ce qui augmente la exibilite du syst`eme de controle. Deux
algorithmes cooperatifs sont analyses dans [103], dont le premier est non iteratif et suppose
des echanges unidirectionnels entre agents, tandis que le deuxi`eme est iteratif et utilise des
communications bidirectionnelles. Pour prouver la stabilite des deux architectures, les au-
teurs font appel `a la theorie des ensembles invariants via lutilisation dune contrainte de
stabilite. Les algorithmes sont ensuite appliques au processus dalkylation catalytique du
benz`ene [104], compose par quatre reacteurs et un separateur. Des extensions de ces tra-
vaux, prenant en compte des mesures asynchrones ou retardees ainsi que la possibilite de
perte dinformations se retrouvent dans [105] et [80].
Un algorithme interessant qui implique seulement deux echanges dinformation par
periode dechantillonnage est propose dans [113, 114] pour le cas de deux sous-syst`emes.
Chaque agent resout son propre probl`eme doptimisation et ensuite partage la solution
optimale locale obtenue. Apr`es le premier echange, la procedure doptimisation locale est
repetee et la nouvelle solution partagee, puis les agents choisissent la solution qui donne
la meilleure performance globale, parmi un ensemble de possibilites. Linconvenient de
lapproche vient du fait que le nombre des communications peut saverer enorme pour des
syst`emes de grande taille.
Dans les approches mentionnees precedemment, la connaissance locale des objectifs
dautres agents reduit laspect decentralise de la structure de controle. Une alternative
interessante est lutilisation dun mecanisme dagent de prix, qui permet la convergence
vers loptimum global, alors que chaque controleur na quune vue locale du crit`ere. Ce
type dalgorithmes repose sur dierentes techniques de decomposition.
Ainsi, la loi MPC distribuee presentee dans [69] est basee sur la decomposition duale
et la mise `a jour des multiplicateurs de Lagrange par une methode de sous-gradient qui
repose sur les travaux de [157, 158]. La vitesse de convergence faible est le principal in-
convenient de lalgorithme. Par consequent, les auteurs proposent un crit`ere darret de
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.2. Controle predictif pour les syst`emes de grande taille 55
la procedure iterative de telle sorte quun certain degre de sous-optimalite est garanti si
la stabilite asymptotique du syst`eme en boucle fermee est assuree. Limplantation de la
strategie suppose normalement lapparition dun ou plusieurs agents de prix qui diusent
les valeurs des multiplicateurs vers les controleurs locaux en fonction des solutions locales.
Une telle structure de controle est presentee dans [27], pour la commande dun syst`eme
de refrigeration controle par des variables booleennes ou dans [97], pour la gestion dun
reseau deau potable. Pour une application similaire, dans [84], un agent negociateur est
employe pour chaque paire de regulateurs MPC qui partage une ou plusieurs variables. Il
resout un probl`eme doptimisation au moyen dun algorithme dapprentissage par renforce-
ment. Dautres structures de coordination, dont lidee est de remplacer chaque contrainte
couplee par un terme lineaire base sur les multiplicateurs de Lagrange, sont proposees dans
[137, 135, 136], avec des applications appropriees.
An de gerer de mani`ere optimale les contraintes couplees dans une approche MPC
distribuee, larticle [134] sappuie aussi sur la decomposition duale. Une solution alternative
pour le meme type de probl`eme est proposee dans [47], representee par une version de
lalgorithme de Han [78] adaptee `a la formulation quadratique de la fonction de co ut
du MPC. Lidee principale de lalgorithme de Han est de resoudre le dual du probl`eme
doptimisation centralisee dans un environnement parall`ele. Ses ameliorations sur la vitesse
de convergence de lalgorithme sont realisees en utilisant des ponderations individuelles
pour chaque variable duale, ainsi quune solution initiale non nulle [48]. Lalgorithme est
applique pour la regulation des niveaux deau dans un canal dirrigation.
La manque de convergence de la decomposition duale pour le cas dun syst`eme non
lineaire compose de quatre reservoirs a motive les auteurs de [167] pour proposer une
methode de gradient dynamique distribue, dont lidee est dutiliser localement une infor-
mation sur le gradient du crit`ere global.
`
A ce stade, les conditions necessaires ou susantes
pour la convergence de lalgorithme representent les pistes futures de travail.
Concernant la programmation lineaire, une strategie predictive de coordination basee
sur la decomposition de Dantzig-Wolfe est analysee dans [34]. An que la methode soit em-
ployee, les couplages entre les sous-syst`emes sont negliges. La necessite de la coordination
reside dans lexistence dune contrainte de couplage.
Plusieurs structures MPC distribuees ont ete proposees pour des sous-syst`emes decou-
ples, dont linterconnexion est realisee par lobjectif de controle ou par les contraintes
couplees. Une solution `a ce type de probl`emes est proposee dans [163], o` u les sorties des
sous-syst`emes sont couplees par une contrainte globale. Les agents resolvent les probl`emes
doptimisation locaux de mani`ere sequentielle, en echangeant les valeurs predites des va-
riables de couplage. Une preuve de faisabilite robuste est presentee bri`evement, en sup-
posant que les perturbations sur les sous-syst`emes sont independantes et bornees. Une
approche distribuee qui traite un probl`eme similaire fait lobjet de letude dans [89], dont
chaque agent calcule les sequences optimales locales ainsi que celles des voisins. Un autre
algorithme developpe pour la commande dun ensemble de sous-syst`emes couples unique-
ment par une fonction de co ut non-separable est propose dans [53]. La stabilite est assuree
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
56 2.

Etat de lart
par une contrainte, dite de compatibilite. Pourtant, cette contrainte peut conduire vers
des performances dierentes par rapport au cas centralise. Les architectures distribuees
utilisant des mod`eles decouples ont des applications interessantes pour les probl`emes de
vol en formation [88, 153], levitement de collisions [32, 46], etc.
MPC Solution Optimisation du crit`ere
distribue, non iteratif
dequilibre (Nash)
locale + prix
locale
dierentes formulations
distribue, iteratif
globale
locale decentralise
centralise globale
intermediaire
decentralisee
centralisee
C
o
m
p
l
e
x
i
t
e
O
p
t
i
m
a
l
i
t
e
Figure 2.9 Caracteristiques des dierentes categories dalgorithmes MPC
La gure 2.9 represente un schema synthetique des structures de commande predictive
pour les syst`emes de grande taille. Le choix de lalgorithme de commande est generalement
la consequence dun compromis entre le degre doptimalite de la solution fournie et la
complexite des regulateurs.
2.3 Conclusion
Dans ce chapitre, nous avons cite des travaux sur les methodes de commande utilisees
pour la regulation thermique dans les batiments. Plus speciquement, nous nous sommes
concentres sur les approches basees sur le controle classique de type TOR et PID, les
methodes dautoreglage, les techniques de commande basees sur lintelligence articielle et
egalement sur des methodes de commande predictives. Cest sur cette derni`ere classe de
lois de commande que nous avons insiste, principalement en vertu de son eet anticipatif,
mais egalement de loptimalite de la solution par rapport `a un crit`ere doptimisation donne.
Traditionnellement, larchitecture de commande des syst`emes CVC presente une struc-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
2.3. Conclusion 57
ture decentralisee. Lutilisation des regulateurs predictifs locaux (pi`ece par pi`ece) implique
le calcul, `a chaque instant, dune sequence de controle qui decrit le comportement futur du
sous-syst`eme. Seule la premi`ere valeur est appliquee, les autres netant pas exploitees. Ce-
pendant, ces informations peuvent saverer tr`es utiles pour les pi`eces voisines pour prendre
en compte de mani`ere optimale les couplages thermiques entre les pi`eces adjacentes. Cest
une des motivations pour se diriger vers les architectures distribuees, qui connaissent un
interet croissant dans la derni`ere decennie. Cest pourquoi, les principales approches de la
commande predictive distribuee ont ete presentees.
Lobjectif du chapitre suivant est de presenter une solution de commande de type
predictif, `a crit`ere quadratique, pour la regulation du poste de chauage dans un batiment
`a occupation intermittente. Lapproche sera tout dabord exposee pour le cas monozone.
Les idees presentees pour le cas dune seule pi`ece seront generalisees pour un batiment
multizone, pour lequel une architecture predictive distribuee sera developpee.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
58 2.

Etat de lart
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Chapitre 3
Commande predictive quadratique
pour la regulation thermique des
batiments
1
Ce que lon con coit bien senonce clairement,
Et les mots pour le dire arrivent aisement.
Lart poetique
Nicolas Boileau
Nous abordons dans ce chapitre le probl`eme du controle thermique des batiments par
des techniques de commande predictive pour lesquelles lintermittence de loccupation des
pi`eces est prise en compte au sein dun crit`ere quadratique. Notre approche repose sur une
modication de la formulation du probl`eme doptimisation, qui devient ainsi dynamique,
en fonction du prol doccupation. La demarche est tout dabord presentee dans le cas
dune seule pi`ece, puis est etendue dans un second temps `a un ensemble de pi`eces pour
lequel la commande est elaboree de mani`ere distribuee.
3.1 Introduction
Une grande partie des locaux du secteur tertiaire nest utilisee quune dizaine dheures
par jour [61]. En comptant en plus les jours feries, les week-ends et les vacances, le taux
doccupation ne depasse pas 30 %. Il en est de meme pour le secteur residentiel, meme
si le taux doccupation est leg`erement plus important. Que ce soit pour le tertiaire ou le
residentiel, assurer le confort thermique na dinteret que si les pi`eces sont occupees. Pour
ces deux grandes classes dimmeubles, il devient donc important dassurer les conditions
de confort thermique lorsque cela sav`ere necessaire.
La pratique de lintermittence du controle thermique dans les batiments `a occupation
discontinue est ainsi un des moyens les plus ecaces pour realiser des economies denergie
1. Des parties de ce chapitre peuvent etre retrouvees dans [128, 129, 121, 125].
59
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
60 3. Commande predictive quadratique
importantes. Il faut, pour ce faire, gerer au mieux les transitions absence / presence. Ainsi,
les lois de commande predictives presentees dans ce chapitre ont ete concues dans cette
optique.
Lorganisation de ce chapitre est la suivante. Une premi`ere partie sattache `a presenter
le contexte du controle intermittent de la temperature dans les batiments, avec une premi`ere
hypoth`ese de travail : la connaissance a priori du prol doccupation des pi`eces. Dans une
deuxi`eme partie, nous modions la loi de commande GPC classique an de mieux repondre
aux objectifs de commande : une premi`ere modication est lintegration du prol doccu-
pation dans le crit`ere predictif. La loi de commande resultante est alors implantee sous la
forme dun regulateur de type RST dont les coecients des trois polyn omes sont variables
dans le temps. Une seconde modication est lutilisation dune fenetre de prediction, dont
la taille varie en fonction du prol doccupation.
Les idees presentees pour le cas dune seule pi`ece seront dans une troisi`eme partie
adaptees `a un ensemble de pi`eces. Lutilisation de controleurs predictifs locaux indepen-
dants implique le calcul dune sequence de commande, dont seul le premier element est uti-
lise. Nous proposons alors une commande distribuee, dans laquelle les sequences predites
de temperatures locales sont echangees entre les agents locaux pour ameliorer les per-
formances globales du batiment. Lapproche repose sur lutilisation des mod`eles locaux
couples par les sorties, ce qui permet de gerer egalement des horizons de prediction locaux
de taille dierente.
En revenant `a lepigraphe de ce chapitre, nous voulons nous excuser aupr`es de nos
lecteurs pour les notations diciles `a suivre de la troisi`eme partie. La gestion des horizons
de prediction dynamiques, des multiples sous-syst`emes, des interactions entre eux et des
iterations de lalgorithme distribue nous a menes `a lutilisation de plusieurs indices qui
alourdissent les equations.
Lecacite des approches proposees sera analysee par simulation tant pour une seule
pi`ece que pour un ensemble de trois pi`eces. Dans ce chapitre, les equipements de chauage
consideres sont des convecteurs electriques.
3.2 Contexte
Une premi`ere condition necessaire pour la gestion de lintermittence est la connaissance
du prol futur doccupation. De mani`ere pratique, cette hypoth`ese de travail nest pas en
soi une condition aberrante : les horaires de travail sont connus, de meme, il devient courant
de regler soi-meme un programmateur journalier voire hebdomadaire pour une utilisation
domestique du chauage. Certaines etudes ont ete proposees pour denir un mod`ele de
prediction de loccupation des zones, construit `a partir de donnees fournies par dierents
capteurs de presence [186].
Hypoth`ese 3.2.1 Tout au long de ce memoire, nous supposons que le prol doccupation
future des zones est connu, au moins sur lintervalle de temps deni par la fenetre de
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.2. Contexte 61
prediction du controleur. Il sera decrit par un vecteur booleen (voir le paragraphe 3.3.1).
Lobjectif de controle peut etre ainsi scinde en deux. Durant les periodes doccupa-
tion, la commande doit maintenir la sortie (temperature mesuree) autour dune valeur de
consigne. Une des caracteristiques dun batiment est son inertie thermique. Il est alors
interessant dutiliser cette inertie pour couper le chauage avant la n de la periode doc-
cupation, sans perturber le confort.
`
A linverse, pendant les periodes dinoccupation, le
temps de relance necessaire pour obtenir une temperature desiree va dependre de letat
du syst`eme (temperature de lair, des parois, etc.), de ses caracteristiques (structure,
materiaux, equipements de chauage) et des perturbations (internes et externes). Ce temps
peut avoir des variations importantes, de quelques minutes `a plusieurs heures. Leet
predictif a pour objectif doptimiser ce temps, en gerant le compromis entre la consomma-
tion energetique et le confort de loccupant. Generalement, une consigne de temperature
basse est imposee pendant les periodes dinoccupation pour reduire la consommation
energetique. Les economies liees `a une bonne gestion de lintermittence sont generalement
dautant plus grandes que la consigne de temperature durant linoccupation est basse
[185]. Cependant, pour certains batiments `a tr`es grande inertie thermique, lintermittence
du chauage peut apporter des economies peu signicatives.
Cette strategie de controle repose ainsi sur un probl`eme doptimisation de la periode de
prechauage, necessaire pour la remontee en temperature pour atteindre les exigences de
confort. Une remontee sousestimee am`ene alors `a un inconfort en debut de periode doccu-
pation.
`
A linverse, une anticipation surestimee implique alors un gaspillage energetique.
La plupart des regulateurs couramment utilises poss`edent des solutions simples pour
surmonter ce probl`eme doptimisation. Mentionnons ici la strategie de relance `a heure
xe ou le calcul du debut de la relance en fonction de la temperature exterieure et / ou
interieure. Ces techniques sont generalement elaborees empiriquement par les fabricants
et conduisent `a une surestimation des periodes de prechauage, pour preserver le confort
en debut doccupation [61].
Des approches de type IA, comme la logique oue [62] ou les reseaux de neurones
[191] sont associees habituellement `a des mecanismes dapprentissage pour determiner le
moment optimal pour declencher le prechauage. Leur principal avantage, evoque par les
auteurs, repose sur le fait que le controleur na pas besoin dun mod`ele mathematique du
processus. Les informations qualitatives concernant le comportement du syst`eme, issues de
lexpertise humaine ou de lexperience, sont utilisees dans la phase de conception de la loi
de commande. En revanche, en general, les informations quantitatives, issues des entrees-
sorties du syst`emes `a controler, sont assimilees par le correcteur dans un processus iteratif
dapprentissage. Par exemple, la procedure dapprentissage proposee dans [61] est basee
sur lecart entre la duree de relance calculee par le controleur et la duree reelle constatee `a
posteriori. Malgre tout, un grand nombre de donnees est necessaire an que le regulateur
ore des solutions precises.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
62 3. Commande predictive quadratique
Disposant dun mod`ele mathematique du syst`eme, la commande predictive peut ex-
ploiter de mani`ere optimale la connaissance du prol doccupation. Traditionnellement, le
crit`ere de la commande predictive a une forme quadratique, qui simplie lanalyse, mais
egalement limplantation du controleur. Par consequent, en formulant le probl`eme dopti-
misation sans contraintes, la solution optimale peut etre determinee de mani`ere analytique.
Tant que le mod`ele de prediction est lineaire, le regulateur equivalent poss`ede la meme
propriete, ce qui rend possible une mise en oeuvre sous forme polynomiale de type RST.
3.3 Commande predictive `a crit`ere dynamique
Pour bien comprendre tout linteret de cette approche, il est important dans un premier
temps de souligner les inconvenients de lutilisation classique de la commande predictive
(2.3), pour le probl`eme de regulation intermittente du chauage. La gure 3.1 illustre le
comportement de la temperature, en appliquant la commande predictive classique.
Temps
Temperature
b
c
a
w
o
w
i
Sortie
Consigne
Figure 3.1 Utilisation dune commande predictive classique
Comme on peut le constater, en supposant que la trajectoire future `a suivre est connue,
laspect anticipatif (a) est bien present. En fonction des reglages, le suivi de consigne peut
etre ameliore pour reduire le temps necessaire pour remonter la temperature, qui sera
toutefois limite par la puissance maximale du poste de chauage. Un second probl`eme
vient sajouter : le fait dimposer une consigne en periode dinoccupation, w
i
, produit un
retard de la relance (b), mais egalement une anticipation ` a la n de la periode doccupation
(c). Par consequent, pour lutilisateur, ces phenom`enes viennent perturber son confort.
On peut penser `a decaler la consigne pour atteindre la consigne haute w
o
d`es le debut
de loccupation. En se basant sur cette idee, les auteurs de [52] ont reduit lhorizon de
prediction du controleur GPC, necessaire pour assurer le temps de prechauage. Plus
recemment, une strategie de ponderation de lerreur de suivi a ete presentee dans [67],
cette fois pour levaluation de la charge thermique optimale. Selon la methode presentee,
la ponderation sur lerreur est choisie egale `a zero, avant le debut de loccupation, pour
un certain intervalle appele temps de relaxation. Par consequent, la duree de cet intervalle
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 63
denit la duree de la relance. Une periode de relaxation elevee produit une commande
lisse et un pic de consommation reduit, par contre lenergie necessaire `a la remontee de
la temperature augmente. Ainsi, la gestion optimale de la periode de prechauage est
reformulee dans un probl`eme doptimisation de lintervalle de relaxation.
La demarche proposee dans les paragraphes suivants est basee sur la prise en compte
du prol doccupation dans la formulation de la fonction de co ut.
3.3.1 Vecteur doccupation
En considerant que le confort thermique est deni uniquement pendant les periodes
doccupation, on peut imaginer penaliser le terme exprimant lecart entre la temperature
de confort et la temperature predite uniquement pendant les instants doccupation. Cette
idee est egalement utilisee dans un article contemporain `a nos travaux [154].
Le crit`ere `a minimiser doit donc prendre en compte les periodes doccupation. Par
consequent, nous proposons lintroduction du vecteur dynamique suivant :
(k) =
_
(k + N
1
) (k + N
1
+ 1) (k + N
2
)
_
T
, (3.1)
qui decrit le prol doccupation de la pi`ece pendant lhorizon de prediction considere.
Chaque composante du vecteur doccupation est denie comme suit :
(k + j) =
_
1, pour k + j Occupation
0, pour k + j Inoccupation
, j {N
1
, ..., N
2
}. (3.2)
1
0
O
c
c
u
p
a
t
i
o
n
Instant de temps (k) 2 4 6
(1) = [0000]
T
(2) = [0001]
T
(3) = [0011]
T
(4) = [0111]
T
(5) = [1111]
T
(6) = [1111]
T
Figure 3.2 Construction du vecteur doccupation, (k), pour N
1
= 1 et N
2
= 4
Notation 3.3.1 Dans la suite de ce document on utilisera la notation N
j
i
pour designer
lensemble des entiers consecutifs naturels {i, i + 1, ..., j}.
La gure 3.2 illustre la construction du vecteur (3.1), pour un exemple de prol doc-
cupation. Plusieurs methodes peuvent etre envisagees pour connatre la dynamique des
periodes doccupation :
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
64 3. Commande predictive quadratique
les prols doccupation sont introduits directement par les utilisateurs,
les regulateurs ont acc`es aux agendas electroniques des occupants,
des previsions doccupation sont realisees en fonction des donnees passees, mesurees
par les capteurs de presence [186].
3.3.2 Denition du crit`ere
Dans lapproche predictive classique, cest la variation de leort, u, que lon cherche
`a minimiser. En ce qui nous concerne, cest la consommation que lon desire diminuer,
cest-`a-dire u directement. En ponderant les erreurs predites par les elements du vecteur
(k), la fonction de co ut `a optimiser a la formulation suivante :
J(k) =
N
2

j=N
1
(k + j)[ y(k + j|k) w(k + j)]
2
+
N
2

j=1
u
2
(k + j 1|k), (3.3)
dans laquelle N
1
et N
2
denissent respectivement la limite inferieure et la limite superieure
de lhorizon de prediction, y(k + j|k) est la sortie (temperature de la pi`ece) predite `a
linstant courant, k, pour linstant k + j et w(k + j) est la consigne future `a suivre (la
temperature de confort) sur lhorizon glissant. est le coecient de ponderation sur la
commande, u(k), qui exprime la puissance de chauage et N
u
represente lhorizon de
prediction sur la commande.
En utilisant la fonction de co ut (3.3), on donne de limportance au suivi de consigne en
temperature d`es que la pi`ece est occupee. La minimisation de la consommation energetique
reste un objectif permanent.
Remarque 3.3.1 Usuellement, lhorizon de prediction sur la sortie est superieur ` a lho-
rizon de commande et on suppose que :
u(k + j|k) = u(k + N
u
1|k), j N
N
2
1
N
u
, (3.4)
ce qui permet de reduire la complexite du regulateur. Malgre tout, ce blocage des com-
mandes futures diminue loptimalite de la solution par rapport au cas N
u
= N
2
.
3.3.3

Elaboration de la loi de commande
Maintenant que notre crit`ere a ete clairement deni, nous presentons dans cette section
les etapes qui permettent daboutir au controle predictif optimal : la denition du mod`ele,
la construction du predicteur puis le calcul de la commande.
3.3.3.1 Mod`ele de prediction
Dans un premier temps, representons le processus par un mod`ele lineaire entree-
sortie monovariable. Celui-ci peut alors se mettre sous une forme ARX, representee par
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 65
lequation :
A(q
1
)y(k) = B(q
1
)u(k 1) + (k), (3.5)
dans laquelle u(k) et y(k) sont respectivement lentree et la sortie du mod`ele, (k) est
un bruit blanc centre et q
1
loperateur de retard. A(q
1
) et B(q
1
) sont des polyn omes
denis par :
_
A(q
1
) = 1 + a
1
q
1
+ + a
n
a
q
q
n
a
B(q
1
) = b
0
+ b
1
q
1
+ + b
n
b
q
n
b
. (3.6)
3.3.3.2 Predicteur optimal
`
A partir du mod`ele decrit par lequation (3.5), en se basant sur les idees presentees
dans [37], on decompose la sortie predite pour linstant k + j en reponse libre et reponse
forcee. Elle peut se mettre alors sous la forme suivante :
y(k + j|k) = F
j
(q
1
)y(k) + H
j
(q
1
)u(k 1)
. .
reponse libre
+G
j
(q
1
)u(k + j 1|k) + J
j
(q
1
)(k + j)
. .
reponse forcee
,
(3.7)
dans laquelle les polyn omes F
j
, G
j
, H
j
et J
j
sont obtenus de mani`ere unique, par la
resolution des deux equations diophantiennes suivantes :
A(q
1
)J
j
(q
1
) + q
j
F
j
(q
1
) = 1,
G
j
(q
1
) + q
j
H
j
(q
1
) = B(q
1
)J
j
(q
1
),
(3.8)
dont les degres des quatre polyn omes sont : degre
_
J
j
(q
1
)

= j 1, degre
_
F
j
(q
1
)

=
n
a
1, degre
_
G
j
(q
1
)

= j 1 et degre
_
H
j
(q
1
)

= n
b
1.
Pour obtenir le predicteur optimal, il sut alors de considerer que la meilleure prediction
du bruit, (k), est sa moyenne (nulle ici), et lon obtient son equation :
y(k + j|k) = F
j
(q
1
)y(k) + H
j
(q
1
)u(k 1) + G
j
(q
1
)u(k + j 1|k). (3.9)
3.3.3.3 Minimisation du crit`ere
Reecrivons lequation (3.3) sous forme matricielle :
J(k) = [ yyy(k) www(k)]
T
(k)[ yyy(k) www(k)] +uuu
T
(k)uuu(k), (3.10)
avec les notations :
yyy(k) =
_
y(k + N
1
|k) y(k + N
1
+ 1|k) y(k + N
2
|k)
_
T
, (3.11)
www(k) =
_
w(k + N
1
) w(k + N
1
+ 1) w(k + N
2
)
_
T
, (3.12)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
66 3. Commande predictive quadratique
uuu(k) =
_
u(k|k) u(k + 1|k) u(k + N
u
1|k)
_
T
, (3.13)
(k) = diag {(k)} , (3.14)
= diag
_
_
(N
2
N
u
+ 1)
_
T
_
. (3.15)
Lexpression du dernier element diagonal de la matrice est la consequence de la contrainte
(3.4), qui inclut la penalisation pour les commandes bloquees.
Notation 3.3.2 On rappelle que tout au long de ce memoire nous considerons les nota-
tions suivantes : une lettre minuscule ou majuscule en caract`ere normal designe un scalaire
(a, , A), une lettre minuscule en caract`ere gras designe un vecteur (bbb, ) et une lettre
majuscule en caract`ere gras pour matrice (CCC, ).
`
A partir de lequation de prediction (3.9), on peut ecrire la sequence de sorties futures
sous la forme suivante :
yyy(k) = GGGuuu(k) +fff(q
1
)y(k) +hhh(q
1
)u(k 1), (3.16)
avec les vecteurs polynomiaux :
fff(q
1
) =
_

_
F
N
1
(q
1
)
F
N
1
+1
(q
1
)
.
.
.
F
N
2
(q
1
)
_

_
, hhh(q
1
) =
_

_
H
N
1
(q
1
)
H
N
1
+1
(q
1
)
.
.
.
H
N
2
(q
1
)
_

_
, (3.17)
et la matrice :
GGG =
_

_
g
N
1
1
g
N
1
2
g
0
0 0
g
N
1
g
N
1
1
g
N
1
2
g
0
0
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
g
N
2
1
g
N
2
2

N
2
N
u
i=0
g
i
_

_
. (3.18)
Remarque 3.3.2 Les coecients g
i
, i N
N
2
1
0
de la matrice GGG R
(N
2
N
1
+1)N
u
issus
des polynomes G
j
(q
1
) = g
0
+g
1
q
1
+ +g
j1
q
j+1
, correspondent `a ceux de la reponse
impulsionnelle du mod`ele. En revanche, pour la formulation du crit`ere en minimisant
u
2
`a la place u
2
, les coecients resultants decrivent la reponse indicielle. Pour N
u
=
N
2
N
1
+1, la matrice GGG poss`ede une structure de type Toeplitz. En reduisant lhorizon de
commande, selon (3.4), la derni`ere colonne de la matrice devient la somme des derni`eres
N
2
N
u
+ 1 colonnes de la matrice de Toeplitz.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 67
Dans les developpements `a venir, on introduit la notation R
(N
2
N
1
+1)1
pour
designer la sequence de reponse libre du syst`eme sur lhorizon de prediction considere :
(k) = fff(q
1
)y(k) +hhh(q
1
)u(k 1). (3.19)
Reportons lequation (3.16) et (3.19) dans (3.10), il vient alors :
J(k) = [GGGuuu(k) +(k) www(k)]
T
(k)[GGGuuu(k) +(k) www(k)] +uuu
T
(k)uuu(k). (3.20)
La solution optimale de la minimisation du crit`ere (3.20) est obtenue de mani`ere ana-
lytique par la resolution de lequation :
J(k)
uuu(k)
= 0, (3.21)
et peut sexprimer ainsi :
uuu

(k) = (GGG
T
(k)GGG +)
1
GGG
T
(k)(www(k) (k)). (3.22)
Le vecteur de controle optimal est maintenant calcule, mais seule la premi`ere com-
posante est appliquee au syst`eme. La loi de commande predictive prend alors la forme
suivante :
u

(k) = (k)(www(k) (k)), (3.23)


avec
(k) =
_
1 0 0
_
(k), (3.24)
(k) = (GGG
T
(k)GGG +)
1
GGG
T
(k). (3.25)
Remarque 3.3.3 Lexistence de la solution optimale uuu

(k) est conditionnee par le fait


que la matrice GGG
T
(k)GGG + est non singuli`ere. Ce qui signie que cette matrice doit
etre strictement denie positive, autrement dit, les matrices (k) et ne peuvent pas etre
nulles simultanement. Sachant que le vecteur (k), qui denit la matrice (k), peut etre
nul, alors la condition necessaire pour lexistence du minimum est donnee par :
> 0. (3.26)
La formulation classique minimise lincrement de la commande et introduit ainsi une
action integrale, ce qui assure une erreur statique nulle pour des consignes et perturbations
constantes.
D`es lors que u est considere ici, aucune action integrale nest introduite dans le regula-
teur, engendrant une erreur statique `a prendre en compte quand = 111
(N
2
N
1
+1)1
. On
peut alors determiner le coecient de ponderation qui assure une valeur donnee de
lerreur statique desiree.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
68 3. Commande predictive quadratique
Proposition 3.3.1 Soit le syst`eme monovariable deni par lequation
A(q
1
)y(k) = B(q
1
)u(k 1), (3.27)
controle par la loi de commande (3.23). Si le vecteur doccupation (k) = 111
(N
2
N
1
+1)1
,
alors lerreur stationnaire relative de suivi en boucle fermee est :

r
=

K
2
+
, (3.28)
o` u K est le gain statique du syst`eme : K =

n
b
i=0
b
i
/ (1 +

n
a
i=1
a
i
).
Preuve
`
A lequilibre, toutes les variables sont constantes. De plus, le crit`ere peut etre
exprime comme la fonction de co ut sur un seul pas de prediction, multipliee par la taille
de la fenetre de prediction, alors :
J = (N
2
N
1
+ 1)
_
( y w)
2
+ u
2
_
, (3.29)
En remplacant la sortie predite stationnaire par y = Ku dans (3.29), on obtient la com-
mande optimale `a lequilibre, par la resolution de lequation
J
u
= 0, sous la forme :
u

=
wK
K
2
+
. (3.30)
Lerreur stationnaire relative de suivi peut secrire en fonction de la commande optimale
u

par la relation :

r
=
w Ku

w
. (3.31)
Le resultat de la proposition est obtenu en reportant lequation (3.30) dans (3.31).
3.3.3.4 Mise en oeuvre sous forme RST dynamique
Comme nous lavions dej` a evoque dans lintroduction du chapitre, un autre avan-
tage apporte par la commande predictive generalisee est que, pour la formulation sans
contraintes, la loi de commande est lineaire. Elle peut se mettre sous la forme plus clas-
sique dun regulateur RST, dont la structure est rappelee gure 3.3. En eet, lequation
(3.23) peut sexprimer de mani`ere suivante :
S(q
1
)u

(k) = R(q
1
)y(k) + T(q)w(k), (3.32)
dans laquelle les trois polyn omes S, R et T sont dynamiques et denis par :
S(q
1
) = 1 +(k)hhh(q
1
)q
1
,
R(q
1
) = (k)fff(q
1
),
T(q) = (k)
_
q
N
1
q
N
1
+1
q
N
2
_
T
,
(3.33)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 69
avec les dimensions
degre
_
S(q
1
)

= n
b
, degre
_
R(q
1
)

= n
a
1, degre [T(q)] = N
2
. (3.34)
Remarque 3.3.4 La non causalite du polynome T produit leet anticipatif du correcteur
`a condition que la sequence future de consigne www(k) soit disponible. En utilisant le resultat
de la proposition 3.3.1 on peut obtenir un gain statique egal `a 1, pour le syst`eme nominal,
pendant loccupation, (k) = 111
(N
2
N
1
+1)1
. Ceci peut se faire par la modication des co-
ecients du polynome non causal, qui devient ainsi : T

(q) =
K
2
+
K
2
T(q). On sinteresse ` a
avoir un gain statique egal `a 1 que pendant les periodes doccupation, parce que autrement
on est soit dans la periode dinoccupation quand la commande est nulle, soit dans une
periode de transition (inoccpation-occupation ou vice-versa), quand le regulateur nest pas
stationnaire.
+

u(k) y(k) w(k + N


2
)
Processus
1
S(q
1
)
R(q
1
)
T(q)
Mod`ele de
prediction
Optimisation
des coecients
r
0
, ..., r
n
b
s
0
, ..., s
n
a
1 t
N
1
, ..., t
N
2
(k)
Figure 3.3 Structure du schema de controle
Si la demarche proposee dans cette section permet dobtenir une solution analytique
au probl`eme doptimisation, limplantation de cette loi de commande est egalement un
point crucial et ne doit pas necessiter un eort de calcul trop important. Rappelons que
notre approche aboutit `a denir un regulateur RST dynamique, ce qui signie qu`a chaque
periode dechantillonnage les coecients des polyn omes doivent etre mis `a jour. Mais, en
regardant de plus pr`es, on peut remarquer quun grand nombre de calculs peuvent etre
eectues hors ligne, cest-`a-dire une fois pour toutes. Cest le cas notamment des vecteurs
polynomiaux fff, hhh et des matrices GGG et . Finalement, seules les periodes proches des
changements de mode necessitent un calcul en ligne et une mise `a jour des coecients,
et ce calcul correspond plus precisement `a linversion de la matrice strictement denie
positive GGG
T
(k)GGG+, qui peut etre determinee rapidement par lalgorithme de Choleski
par exemple, peu co uteux en temps de calcul.
Si linversion de cette matrice sav`ere un inconvenient pour limplantation de la com-
mande predictive presentee, elle peut etre remplacee par un bloc de memoire qui stocke
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
70 3. Commande predictive quadratique
les coecients des trois polyn omes calcules pour toutes les sequences possibles du vecteur
doccupation, . Ainsi, la capacite de memoire necessaire est donnee par :
c
t
= 2
N
2
N
1
+1
(N
2
N
1
+ n
a
+ n
b
+ 2) c
c
, (3.35)
o` u c
c
represente le nombre de bits necessaire pour stocker une seule valeur dun coecient.
Ce volume de memoire augmente exponentiellement avec la dimension de lhorizon de
prediction. Pourtant, la plupart des sequences possibles du vecteur doccupation decrivent
des prols doccupation peu probables. Ainsi, en imposant des contraintes sur la duree mi-
nimale des periodes doccupation et / ou dinoccupation on peut reduire signicativement
la capacite requise. Par exemple, cette capacite est reduite `a
c

t
= 2 (N
2
N
1
+ 2) (N
2
N
1
+ n
a
+ n
b
+ 2) c
c
, (3.36)
en supposant quaucune periode doccupation et dinoccupation naient une duree inferieure
`a la dimension de lhorizon de prediction.
Cest l` a un autre point fort de la commande predictive telle que nous lavons presentee,
`a savoir un grand nombre de calculs `a eectuer hors ligne, pour un eort en temps reel
minime. Des points qui restent encore en suspens sont dans un premier temps le reglage
des param`etres du controleur (choix des horizons de prediction et de la ponderation sur la
commande) puis dans un second temps lecacite de la demarche developpee. Ces aspects
sont analyses dans la section suivante.
3.3.4 Reglage des param`etres
Si la demarche que nous avons presentee precedemment est generique et peut sadap-
ter `a dierents syst`emes de chauage, le reglage des param`etres reste, comme tout dis-
positif de controle, propre au syst`eme etudie. Pour analyser les eets de ces param`etres,
nous avons pris lexemple dun batiment virtuel monozone. Sa conguration est decrite
dans lAnnexe A. Pour nos manipulations, nous nous sommes servis de la bote `a outils
SIMBAD, developpee par le Centre Scientique et Thermique du B atiment (CSTB). La
biblioth`eque de mod`eles SIMBAD est bri`evement presentee dans lAnnexe A. Les mod`eles
MATLAB/Simulink fournis par cette biblioth`eque seront utilises comme des mod`eles de
simulation.
3.3.4.1 Indices de performance
Pour verier lecacite des lois de commande presentees dans ce chapitre et les com-
parer `a dautres methodes, nous introduisons deux indicateurs de performance. Ces deux
indices traduisent lenergie consommee et le confort des occupants.
Le premier indicateur, E
c
, decrit la consommation energetique du poste de chauage,
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 71
en [kWh], pendant la periode de simulation consideree :
E
c
=
k
f

k=k
0
T
s
P
n
u(k)
3600
, (3.37)
dont k
0
et k
f
denissent linstant initial et nal de lintervalle de simulation. La commande
u represente la puissance electrique normalisee, T
s
est la periode dechantillonnage du
syst`eme, tandis que P
n
est la puissance nominale du convecteur, exprimee en [kW].
Le deuxi`eme indice mesure la qualite de la regulation du point de vue du suivi de
consigne et represente lindicateur du confort thermique dans le batiment. Mentionnons
cependant que le confort thermique est generalement base sur le ressenti des occupants.
Pourtant les crit`eres connus sous lappellation de Vote Moyen Previsible (PMV - Predicted
Mean Vote) et Pourcentage Previsible dInsatisfaits (PPD - Percentage of Persons Dissa-
tised) [56] necessitent la mesure dautres variables qui ne sont pas controlees par le poste
de chauage considere. Par consequent, lindice de confort que nous avons choisi mesure
la qualite de la regulation du point de vue du suivi de consigne, mais uniquement lors des
periodes doccupation de la zone, ce qui donne, en [
o
Ch] :
I
c
=
k
f

k=k
0
T
s
(k)|y(k) w(k)|
3600
. (3.38)
Maintenant que ces indicateurs ont ete clairement denis, letape suivante consiste `a
presenter le mod`ele de commande, puis le reglage des param`etres du controleur, pour que
ces indicateurs soient les meilleurs (les plus faibles) possibles.
3.3.4.2 Mod`ele de simulation et mod`ele de commande
Pour les mod`eles de simulation, la precision est peut-etre le principal indice de perfor-
mance. Cependant, la simplicite des mod`eles utilises au sein des regulateurs (mod`eles de
commande) pour predire le comportement du processus est un facteur important. Ceci per-
met `a la fois une implantation peu co uteuse du controleur, mais egalement une procedure
didentication moins complexe (moins de param`etres `a identier). Le mod`ele fourni par
la biblioth`eque SIMBAD sera notre mod`ele de simulation. La description du batiment
virtuel simule est presentee dans lAnnexe A.
Comme mod`ele de commande, nous proposons lutilisation dun mod`ele lineaire du
second ordre. Ce type de mod`ele met en evidence les deux constantes de temps principales
presentes dans la dynamique thermique des batiments : une constante de temps faible qui
decrit la dynamique de la temperature de lair de la zone, T
a
et lautre, plus elevee, qui
est associee `a la dynamique de la temperature moyenne des parois T
w
. Lutilisation de ce
mod`ele pour la commande des syst`emes de chauage date de la n des annees 80 [41]. Des
travaux plus recents se sont orientes vers des procedures speciques didentication qui
prennent en compte lexistence de ces deux constantes de temps. Dans [116], par exemple,
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
72 3. Commande predictive quadratique
les auteurs comparent trois methodes didentication pour obtenir les param`etres dun
mod`ele de type ARX. Leurs resultats mettent en evidence lecacite dune procedure
didentication `a deux echelles de temps, par rapport `a une methode des moindres carres.
Les mod`eles de regression sont frequemment adoptes pour lidentication de la dynamique
du syst`eme thermique. Dans [63], deux mod`eles du premier ordre sont identies pour
predire la temperature et lhumidite. Des mod`eles identies de type ARX et ARMAX
de dierents ordres sont compares dans [164], en concluant que les meilleurs mod`eles
didentication pour le batiment sont ceux dordre 2 et 3. Un mod`ele ARX qui int`egre
la commande du poste de chauage, mais egalement celles de la ventilation et du store
est propose dans [110]. T. Y. Chen [33] utilise deux mod`eles ARX pour la commande
predictive dun plancher chauant `a grande inertie (un pour le jour et lautre pour la
nuit). Bien que le fait que les mod`eles de regression adoptes dans les travaux mentionnes
comportent plusieurs entrees (puissance de chaue, temperature exterieure, rayonnement
solaire, humidite, vitesse du vent, etc.), nous utiliserons dans la suite uniquement deux
entrees : la puissance du convecteur electrique et la temperature exterieure. Ce choix est
motive par le fait que lobjectif est detudier les performances de la strategie de commande
predictive `a crit`ere dynamique, presentee dans la partie 3.3 et non lapport des previsions
meteo sur les performances du syst`eme. Une telle analyse peut etre retrouvee dans le
rapport du projet OptiControl [76].
Apr`es simulations et phases didentication, le mod`ele de commande obtenu est :
y(k) =1, 7360y(k 1) 0, 7378y(k 2)+
1, 8443u(k 1) 1, 7825u(k 2)+
0, 0155T
ext
(k 1) 0, 0139T
ext
(k 2),
(3.39)
o` u T
ext
est la temperature de lair exterieur, en
o
C. Les valeurs futures de la temperature
exterieure necessaires dans lequation de prediction sont considerees constantes et egales `a
la temperature mesuree `a linstant courant, T
ext
(k). La prise en compte de linuence de la
temperature exterieure dans le mod`ele de commande implique une leg`ere modication de
la structure du regulateur polynomial, par lapparition dun element de type feedforward
(voir gure 3.4), decrit par le polyn ome :
V (q
1
) = (k)(q
1
hhh

(q
1
) +ggg

), (3.40)
avec
ggg

=
_

N
1
1
i=0
g

N
2
1
i=0
g

i
_
T
, (3.41)
o` u le vecteur polynomial hhh

et les coecients g

i
sont calcules de mani`ere similaire `a (3.17)
et (3.18), pour le transfert T
ext
y. Les performances du correcteur augmenteraient si
une prevision des temperatures exterieures sur lhorizon de prediction etait disponible, et
par consequent le polyn ome V etait non causal.
Les periodes dechantillonnage des regulateurs discrets de type predictif pour le controle
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 73
+

u(k) y(k) w(k + N


2
)
Processus
1
S(q
1
)
R(q
1
)
T(q
1
)

T
e
(k)
V (q
1
)
Figure 3.4 Structure du regulateur polynomial avec la partie feedforward
du poste de chauage des batiments, utilisees dans la litterature, varient dans une plage
relativement importante. On retrouve ainsi des regulateurs discrets, avec T
s
= 5min [107],
T
s
= 10min [52], T
s
= 20min [73] ou T
s
= 30min [75], tandis que les regulateurs proposes
plus recemment ont un pas de temps egal `a une heure [70, 112, 147, 140]. Pour le mod`ele
(3.39) la periode dechantillonnage choisie est egale ` a 30min, ce qui represente pour notre
cas detude un bon compromis entre les performances de controle et leort de calcul.
3.3.4.3

Etude sur linuence des param`etres de reglage
Les syst`emes de chauage sont caracterises par une forte inertie et des dynamiques
tr`es lentes. Ainsi, pour atteindre la temperature de confort en debut doccupation, il
est necessaire danticiper susamment `a lavance. Pour prechauer la zone, le regulateur
predictif dispose dune periode daction egale `a la duree de lhorizon de prediction. Par
consequent, le choix de la limite superieure de lhorizon de prediction, N
2
, est lie `a la
periode de prechauage necessaire, dans un cas peu favorable (temperature interieure et /
ou exterieure basse). La valeur choisie dans nos manipulations est N
2
= 16, ce qui corres-
pond `a une periode de prediction de 8h. Cet intervalle de temps est susant pour remonter
la temperature de 10
o
C jusqu`a 20
o
C, `a une temperature exterieure constante T
e
= 10
o
C,
avec une puissance de chaue de 1,2kW.
Nous nous proposons ensuite detudier a posteriori linuence des param`etres N
u
et
sur les performances du syst`eme de commande. La gure 3.5 illustre limpact de ces
param`etres sur les deux indices de performance, (3.37) et (3.38), sur une journee de simu-
lation, avec une periode doccupation de 9h `a 19h.
On observe une tendance generale : la diminution de la ponderation engendre un
niveau de confort plus eleve, mais avec une consommation plus importante. Des valeurs
superieures `a (N
2
N
1
+ 1)/2, pour le param`etre N
u
, ont un eet mineur sur les deux
indices. Cependant, pour une taille plus faible de lhorizon de commande, les performances
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
74 3. Commande predictive quadratique
0
5
10
15
20
0
2
4
6
8
0
5
10
15
20
a
0
5
10
15
20
0
2
4
6
8
10
12
14
16
b
I
C
[
o
C
h
]
E
c
[
k
W
h
]

N
u
N
u
N
u
= 3, = 1
N
u
= 3, = 1
Figure 3.5 Inuence de la dimension de lhorizon de commande, N
u
, et de la
ponderation, , sur lindice de confort (a) et sur la consommation energetique (b), sur
une journee de simulation, avec une temperature initiale y(0) = 12
o
C. La periode doccu-
pation considere est de 9h `a 19h et la dimension de lhorizon de prediction est denie par
N
1
= 1 et N
2
= 16. La temperature de consigne est xe `a 20
o
C.
mesurees ont des variations plus importantes. Le choix N
u
= 1 ne semble pas approprie,
sachant que le principal objectif de controle est dassurer un niveau de confort eleve. Notons
que pour N
u
> 1 les performances en termes de confort sont meilleures pour les horizons
de prediction plus faibles, ce qui nest pas a priori intuitif.
Pour une meilleure comprehension de ce phenom`ene, deux scenarios sont consideres,
en fonction de la temperature initiale dans la pi`ece : pour le premier, y(0) = 16
o
C, ce qui
correspond `a une occupation journali`ere, tandis que le deuxi`eme correspond `a une periode
dinoccupation relativement longue (un week-end), y(0) = 12
o
C. La gure 3.6 illustre les
signaux de sortie et de commande pour trois valeurs signicatives de N
u
, dans les deux
scenarios.
Dans les sous-gures 3.6a et 3.6b, on observe que le param`etre N
u
inuence les al-
lures des courbes pendant la relance et avant la n de la periode doccupation, i.e. quand
la fenetre de prediction comporte des instants doccupation et dinoccupation. Une va-
leur faible de N
u
avance dans le temps et diminue le pic de la demande pendant le
prechauage. Malgre le fait que ce comportement soit sous-optimal (par rapport au cas
N
u
= N
2
), il ameliore le confort au debut de la periode doccupation, notamment dans
le deuxi`eme scenario (sous-gures 3.6c et 3.6d). Rappelons que lon se trouve dans le cas
sans contraintes et que la puissance maximale du convecteur, ici 1kW, nest pas prise en
compte dans le probl`eme doptimisation, par consequent, la commande est saturee. Ainsi,
en utilisant un horizon de commande reduit, le phenom`ene de saturation apparat plus tot
et diminue lecart entre la consigne et la sortie en debut de loccupation.
Un cas particulier est N
u
= 1, pour lequel la commande appliquee pendant la phase
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 75
0 1 9 12 19 24
12
20
c
0 1 9 12 19 24
0
1
d
0 1 9 12 19 24
16
20
a


0 1 9 12 19 24
0
1
b
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
k
W
]
Temps [h] Temps [h]
w
Nu = 1
Nu = 3
Nu = 16
Figure 3.6 Reponses temporelles du syst`eme en boucle fermee pour N
u
{1, 3, 16},
= 1, N
1
= 1, N
2
= 16 et une periode doccupation de 9h `a 19h, avec une temperature
initiale y(0) = 16
o
C (a et b) et y(0) = 12
o
C (c et d)
de prechauage est uniformement distribuee tout au long de la periode de relance, due
au fait qu`a chaque pas le controleur calcule une sequence de commande dont toutes les
composantes sont egales. Ce regulateur est tr`es interessant du point de vue numerique
car il engendre un eort de calcul reduit. Malgre cela, cette conguration nassure pas un
degre de confort acceptable.
En considerant le confort etant prioritaire `a la consommation, des valeurs inferieures
`a 2 pour sont retenues. Pourtant, le choix dune ponderation tr`es faible de la commande
diminue limportance de la minimisation energetique dans le probl`eme de controle. Pour
le choix de lhorizon de commande, plusieurs param`etres doivent etre pris en compte :
la complexite de calcul, qui crot avec N
u
et loptimalite par rapport au crit`ere de mi-
nimisation. De plus la saturation de la commande calculee par la resolution analytique
du probl`eme doptimisation a egalement un impact important sur les indices de perfor-
mance. Suite `a plusieurs essais, pour le cas etudie nous proposons lutilisation des valeurs
suivantes : N
u
= 3 et = 1.
3.3.5 Fenetre de prediction variable
Dans cette partie nous proposons une solution originale pour ameliorer les performances
du regulateur predictif presente dans les paragraphes precedents. Lidee consiste `a faire
varier lhorizon superieur de prediction sur la sortie, N
2
, en fonction du prol doccupation.
Ensuite nous motiverons notre approche par quelques aspects dordre qualitatif, et dans
la partie 3.3.6 nous presenterons les avantages quantitatifs sur un exemple numerique.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
76 3. Commande predictive quadratique
3.3.5.1 Motivation
Comme nous lavons dej` a mentionne au debut de ce chapitre, pour lobjectif de controle
du poste de chauage dans un cadre doccupation intermittente, on peut distinguer deux
cas, en fonction de la phase courante : occupation ou inoccupation.
Durant les periodes dinoccupation, le fait davoir une fenetre de prediction de grande
taille est particuli`erement interessant pour couvrir une longue periode de prechauage.
Pendant loccupation, cet argument disparat, sachant que les seules connaissances futures
disponibles au controleur sont le prol doccupation decrit par le vecteur et la sequence
de consigne future, www. Le probl`eme de controle est alors reduit au probl`eme de regulation
de la temperature interieure autour de la temperature de confort. On peut alors penser `a
diminuer lhorizon de prediction pendant les phases doccupation.
Si avoir une grande periode de prediction permet de donner de meilleures marges de
stabilite au syst`eme [26], la commande devient moins agressive [9]. Durant les periodes
doccupation, les uctuations de temperature sont frequentes et peuvent avoir des dy-
namiques relativement rapides, comme par exemple celles generees par le rayonnement
solaire, par louverture dune porte, etc. Cest le cas des perturbations positives (apports
gratuits) qui nous interessent en particulier, car elles nous permettent de realiser des
economies denergie. Ainsi, en utilisant une taille reduite de lhorizon de prediction pen-
dant loccupation, le controleur devient plus reactif et donc on peut esperer ameliorer les
performances de controle par un rejet plus rapide des perturbations.
Les eventuelles ameliorations en termes de performances realisees avec une strategie
de variation de N
2
nimpliquent pas un augmentation de la complexite de calcul en temps
reel du regulateur (sous forme RST dynamique).
La taille de lhorizon de commande N
u
inuence egalement le comportement du syst`eme
de commande. Ainsi, laccroissement du terme r
N
=
N
2
N
u
implique une reponse plus lisse
de la part du correcteur predictif [170] et en meme temps augmente la sous-optimalite de
la solution par rapport au cas o` u r
N
= 1, `a N
2
donne. Laugmentation de la valeur du
param`etre N
u
accroissent la complexite du probl`eme doptimisation (il agit sur le nombre
des variables de decision).
Les mod`eles de prediction, generalement simplies, negligent souvent certaines dyna-
miques du syst`eme, ce qui engendre des predictions moins precises vers la n de la periode
de prediction. Ceci est notamment le cas dans notre mod`ele de prediction, dans lequel la
temperature exterieure est supposee constante sur tout lhorizon. Cette approximation est
dautant meilleure que cet horizon est court.
Un autre interet de diminuer la valeur du param`etre N
2
sera mis en evidence dans
la partie 3.4, dans laquelle une architecture de commande distribuee sera presentee. Une
valeur reduite de la taille de lhorizon de prediction permettra une baisse de la quantite
des informations echangees entre les controleurs locaux, ainsi quune augmentation de la
vitesse de convergence de lalgorithme iteratif.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 77
3.3.5.2 Une strategie de variation de lhorizon de prediction
Dans le paragraphe precedent, on a bri`evement rappele comment la taille de la fenetre
de prediction inue sur les caracteristiques du syst`eme asservi. Nous presentons une
demarche pour faire varier le param`etre N
2
.
Notation 3.3.3 Dans la demarche suivante, on note :
N
2
, la taille minimale que peut prendre lhorizon de prediction, N
2
N
+
, N
2
N
1
N
2
, la taille maximale que peut prendre lhorizon de prediction, N
2
> N
2
.
Nous proposons alors lutilisation de la taille minimal de la fenetre de prediction pen-
dant les phases doccupation, tandis que lhorizon de prediction maximale sera plus ap-
proprie aux periodes dinoccupation, an danticiper la relance. Pour eviter les variations
brusques de la dimension de lhorizon de prediction dun pas dechantillonnage `a lautre
pendant les phases doccupation, lidee est la suivante :
Reduire progressivement la taille de la fenetre de prediction, jusqu`a N
2
, d`es que
lon entre en phase de prechauage (voir gure 3.7). Le debut de la periode de
prechauage est calcule par rapport `a lhorizon de prediction maximal. Il correspond
`a linstant k telle que (k + N
2
1) = 0 et (k + N
2
) = 1,
Revenir `a une taille de prediction elevee, d`es que lon passe en periode dinoccupation.
1
0
O
c
c
u
p
a
t
i
o
n
Instant de temps (k) 2 4 6
(1) = [ 0000

N
2
(1)=4
]
T
(2) = [ 0001

N
2
(2)=4
]
T
(3) = [ 001

N
2
(3)=3
1]
T
(4) = [ 01

N
2
(4)=2
11]
T
(5) = [ 11

N
2
(5)=2
11]
T
(6) = [ 11

N
2
(6)=2
11]
T
Figure 3.7

Evolution de lhorizon de prediction (N
1
= 1, N
2
= 2, N
2
= 4)
De mani`ere formelle, on denit la valeur courante de lhorizon superieur de prediction,
N
2
(k), par lequation suivante :
N
2
(k) =
_

_
N
2
, si (k) = 000
(N
2
N
1
+1)1
,
N
2
, si (k + N
1
) = 1,
max (j, N
2
) , autrement,
(3.42)
o` u j = max {N
N
2
N
1
+1
|(k + j) > (k + j 1)}. Ainsi, linstant k + j indique le debut dune
periode doccupation. Pour calculer la taille courante de la fenetre de prediction, il est
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
78 3. Commande predictive quadratique
necessaire de disposer du prol doccupation correspondant `a la fenetre de prediction
maximale, i.e. du vecteur : (k) =
_
(k + N
1
) (k + N
2
)
_
T
.
Remarque 3.3.5 Du point de vue formel, les modications apportees par lutilisation de
la fenetre de prediction variable (3.42), par rapport `a la demarche presentee dans la section
3.3.3, sont mineures. Les dimensions des vecteurs polynomiaux fff, hhh et des matrices GGG et
HHH deviennent ainsi variables dans le temps. Notons que pour N
2
N
u
, les vecteurs et les
matrices mentionnes peuvent etre obtenus en eliminant les derni`eres N
2
N
2
(k) lignes par
rapport au cas o` u la dimension de lhorizon de prediction est maximale. La structure du
controleur RST dynamique reste identique `a celle representee gure 3.3, seule la dimension
du polynome T devient variable dans le temps.
3.3.6 Resultats numeriques
Reprenons le batiment virtuel monozone decrit dans lAnnexe A et le mod`ele de com-
mande (3.39), pour tester lecacite du regulateur GPC `a horizon de prediction variable.
Dans la gure 3.8 sont representees les valeurs des deux indices de performance sur une
annee de simulation, dont la saison de chaue est comprise entre le 1
er
octobre et le 30
avril. Trois congurations dierentes du controleur GPC sont comparees :
1. GPCHC : la loi de commande decrite par lequation (3.23) (horizon de prediction
constant)
2. GPCHV1 : la loi de commande decrite par lequation (3.23), dont la dimension de
la fenetre de prediction varie selon (3.42) (horizon de prediction variable)
3. GPCHV2 : la loi de commande decrite par lequation (3.23), dont la dimension de
la fenetre de prediction prend uniquement deux valeurs, en fonction de la valeur du
premier element du prol futur doccupation, ainsi :
N
2
(k) =
_
_
_
N
2
, si (k + N
1
) = 0,
N
2
, autrement.
(3.43)
Les param`etres du regulateur predictif ont ete choisis comme suit :
N
1
= 1, ce qui est le choix le plus pertinent pour les mod`ele sans retard pur et `a
dephasage minimal,
la valeur maximale de lhorizon superieur de prediction consideree est egale `a la
valeur du param`etre N
2
du GPCHC, i.e. N
2
= N
2
= 16,
la valeur minimale de lhorizon superieur de prediction est N
2
= N
u
, ce qui nous
permet de maintenir constantes les dimensions de la matrice GGG
T
(k)GGG+ `a inverser
et de ne pas modier la charge de calcul (surtout dans le cas avec contraintes)
la valeur de la ponderation sur la commande, = 1.
Les deux congurations qui utilisent une taille reduite de lhorizon de prediction pen-
dant les periodes doccupation favorisent les economies denergie par rapport `a la con-
guration equivalente du GPCHC. Ces gains energetiques sont dautant plus importants
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 79
2 4 6 8 10 12 14 16
310
320
330
340
350
360
370
380
390


GPCHC
GPCHV1
GPCHV2
2 4 6 8 10 12 14 16
89
90
91
92
93
94
95
96
I
c
[
o
C
h
]
E
c
[
k
W
h

a
n

2
]
N
u
N
u
Figure 3.8 Comparaison en termes dindices de performances entre le controleur
predictif `a horizon de prediction constant (GPCHC) et deux congurations `a horizon
de prediction variable (GPCHV1 et GPCHV2)
que lhorizon de prediction minimal est faible. Cette economie energetique est pourtant
associee `a une diminution de la qualite de confort, due principalement aux transitions
inoccupation-occupation o` u la commande du GPCHV1 est souvent saturee `a la n de la
relance.
Il apparat clairement que pour N
2
= 2 on obtient lamelioration la plus importante sur
les deux indices de performance en employant une strategie de diminution de la taille de
lhorizon. Ainsi, les economies denergie par rapport au cas GPCHC sel`eve `a 6,25 % pour
GPCHV1 et 0,98 % pour GPCHV2. Leconomie relative de lenergie moins importante du
cote de GPCHV2 est associee `a une amelioration de 9,5 % de lindice de confort.
Pendant la periode de prechauage, les lois de commande GPCHC et GPCHV2 sont
identiques. De mani`ere similaire, les regulateurs GPCHV1 et GPCHV2 sont equivalents
durant les phases doccupation. Pour N
u
8, les performances globales du GPCHV2 sont
leg`erement superieures `a celles du GPCHC, ce qui est d u uniquement `a la diminution de
lhorizon de prediction pendant loccupation. Lecart entre les resultats du GPCHV1 et
ceux du GPCHV2 reside dans une gestion dierente de la periode de relance.
On peut egalement remarquer que les allures des courbes qui representent la dependance
des deux indices par rapport au param`etre N
u
, pour le GPCHC sont similaires `a ceux de
la gure 3.5. Autrement dit, une analyse des resultats sur une seule journee permet dex-
trapoler qualitativement les performances `a une periode de simulation plus longue.
Le tableau 3.1 regroupe les meilleurs resultats (en termes de confort et denergie)
obtenus en utilisant les controleurs GPCHC et GPCHV. Pour comparer ces resultats avec
une loi de commande couramment utilisee, on a choisi le regulateur PI comme cas de
reference. Pour avoir un comportement similaire au GPC, la consigne du regulateur PI est
anticipee. Sachant que les periodes doccupation journali`eres considerees sont du lundi au
vendredi entre 9h et 19h, on a choisi de decaler la consigne de mani`ere dierente les lundi,
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
80 3. Commande predictive quadratique
par rapport aux autres jours. Ainsi, les lundi, la relance du PI commence t
l
heures avant le
debut de la periode doccupation, tandis que les autres jours la consigne est anticipee avec
t
mv
heures. Les valeurs de ces deux param`etres ont ete etablies apr`es plusieurs tests, an
dobtenir des valeurs de lindice de confort proches de celles obtenues par les controleurs
predictifs. Ces intervalles de temps qui denissent les durees des relances sont souvent
surestimees par les fabricants an de preserver le confort en debut doccupation.
Loi de commande
I
c
[
o
Ch] E
c
[kWh an
1
m
2
]
Type Specicite
PI avec anticipation
t
l
= 6h, t
mv
= 3h 399,33 91,97
t
l
= 8h, t
mv
= 3h 388,89 93,89
t
l
= 8h, t
mv
= 4h 369,05 96,64
t
l
= 8h, t
mv
= 5h 367,48 99,19
t
l
= 8h, t
mv
= 8h 362,52 105,53
GPC-
-HC, N
u
= 3 311,37 94,48
-HC, N
u
= 16 355,48 90,47
-HV1, N
u
= 8 347,39 89,21
Table 3.1 Resultats comparatifs (confort et energie) entre les controleurs de type GPC
`a crit`ere dynamique et PI avec anticipation de la consigne
Le fait davoir les memes horaires doccupation journali`ere avantage le controleur PI
avec une relance `a heure xe. Ainsi, en fonction de reglages pour les deux types de
regulateurs, les economies denergie apportees par la structure GPC montent jusqu`a
15 %, sans degrader lindice de confort. De plus, la majorite des congurations GPC
presentees ci-dessous orent de meilleures performances en termes de confort par rapport
aux controleurs de type PI.
Malgre les ecarts relativement faibles entre les performances de GPCHC et de GPCHV1
il faut souligner que les ameliorations apportees par la commande `a horizon variable nen-
gendrent pas une augmentation de la complexite du correcteur (la capacite de memoire
necessaire pour le stockage des coecients polynomiaux est egale `a celle necessaire pour
GPCHC).
La gure 3.9 presente levolution comparative de la temperature `a linterieur du bati-
ment monozone considere, et la puissance electrique du convecteur pour une conguration
GPCHC et GPCHV1. Pour avoir une meilleure vision sur le contexte de simulation, les
principales perturbations meteorologiques sont egalement representees. On peut observer
que, pendant la relance, la temperature interieure pour la conguration GPCHV1 reste
toujours inferieure `a celle pour la conguration GPCHC.
Pendant les premiers N
2
N
2
instants de la periode de prechauage, un seul moment
doccupation est pris en compte dans le probl`eme doptimisation. Dautre part le nombre
de degres de liberte du regulateur GPCHV1 relatif `a N
2
(k) augmente progressivement.
Ces deux phenom`enes contribuent `a retarder le pic de la commande. Ce comportement
sapproche de loptimalite par rapport `a un crit`ere lineaire (voir chapitre suivant), o` u la
meilleure strategie de controle pendant la relance est de chauer au dernier moment `a
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.3. Commande predictive `a crit`ere dynamique 81
puissance maximale. Pourtant, une amplitude elevee du pic de consommation avant le
debut de loccupation peut causer une diminution du confort, `a cause de la puissance
limitee du convecteur.
0 24 48 72 96 120 144 168 192
12
16
20
0 24 48 72 96 120 144 168 192
0
0.5
1


GPCHC
GPCHV1
0 24 48 72 96 120 144 168 192
0
10


0 24 48 72 96 120 144 168 192
0
500
1000
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
k
W
]
Temps [h]
T
e
m
p
.
e
x
t
.
[
o
C
]
R
a
y
o
n
n
e
m
e
n
t
s
o
l
a
i
r
e
[
W
/
m
2
]
T. ext.
direct
dius
Figure 3.9

Evolution des principaux signaux, en conguration GPCHC et GPCHV1
En pratique, les periodes doccupation dune pi`ece nont pas une periodicite et une
duree constantes comme dans le prol doccupation propose. Par consequent, lutilisation
dune relance `a heure xe engendre souvent un gaspillage de lenergie.
3.3.7 Du monozone au multizone
La loi de commande predictive proposee dans la section 3.3 a ete developpee pour une
seule zone, comme dailleurs la plupart des etudes sur la regulation de la temperature
dans les batiments. Les mod`eles utilises, generalement appeles monozones, consid`erent
que linterieur complet du batiment poss`ede des caracteristiques thermiques homog`enes,
autrement dit, toutes les pi`eces de limmeuble ont la meme temperature. La simplicite
de cette famille de mod`eles constitue leur principal avantage. Ils necessitent uniquement
des informations generales concernant lenveloppe, le syst`eme de chauage (et / ou de
climatisation) et les apports de chaleur pour la construction du mod`ele [181]. Toutefois,
ils sav`erent insusants si des ecarts de temperature existent entre les dierentes pi`eces
du batiment. Dans le cas dune regulation intermittente de la temperature, les mod`eles
monozones restent appropries en supposant que toute les pi`eces du batiment ont le meme
prol doccupation. Or evidemment, cette hypoth`ese est trop restrictive pour la grande
majorite des cas.
Les mod`eles multizones sont plus adequats pour les prols doccupation propres `a
chaque zone. Ils comportent la modelisation dune zone thermique pour chaque pi`ece ou
pour un groupe restreint de pi`eces. Cependant les mod`eles multizones ne sont pas seule-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
82 3. Commande predictive quadratique
ment des ensembles de mod`eles monozones, les couplages entre les pi`eces etant egalement
consideres. Ces mod`eles permettent ainsi de prendre en compte la repartition non uniforme
des temperatures dans les dierentes pi`eces dun batiment.
3.4 MPC distribue `a horizon de prediction dynamique
Cette partie propose une extension de la loi de commande predictive `a horizon dy-
namique au cas multizone. Pour les batiments de grande taille, lapproche predictive
centralisee engendre des probl`emes de complexite de calcul, mais egalement dautres in-
convenients lies `a la structure monolithique du regulateur, mentionnes dans le chapitre
prec`edent. Lalternative adoptee pour surmonter ces desavantages est lutilisation dun
controleur par pi`ece. Si ces correcteurs locaux sont independants, alors on parle dune loi
de commande decentralisee. Les performances de cette loi de commande se degradent d`es
que les interactions entre les zones deviennent importantes et que les periodes doccupation
et / ou les valeurs de consigne sont dierentes.
En utilisant des correcteurs predictifs locaux, on dispose alors, `a chaque instant, dune
information qui decrit le comportement futur local. Lechange de ces donnees entre les
regulateurs voisins (dont les mod`eles locaux presentent des couplages) pourrait ameliorer
les performances globales, ce qui represente lidee de base de la commande distribuee
presentee dans cette partie.
Nous developpons dans les paragraphes suivants une approche predictive distribuee
capable de gerer facilement les fenetres de prediction variables. La diculte du probl`eme
reside dans le fait que deux agents voisins, i et j, peuvent avoir, `a un certain instant k, des
horizons de prediction de taille dierente, par exemple N
2,i
(k) < N
2,j
(k). En echangeant
les informations sur leur comportement futur, lagent j aura besoin de plus dinformation
sur le comportement futur de son voisin que ce dont lagent i ne dispose. Nous proposons
une approche pour traiter ce probl`eme.
Dans les approches predictives distribuees examinees dans la suite de ce memoire, les
hypoth`eses suivantes seront utilisees :
Hypoth`ese 3.4.1 Les etats des sous-syst`emes sont mesurables.
Hypoth`ese 3.4.2 Les controleurs (agents) locaux fonctionnent en mode synchrone.
Hypoth`ese 3.4.3 Le reseau de communication ninduit pas de retard sur les informations
echangees.
3.4.1 Mod`ele couple par les sorties
En passant au cas multizone, les mod`eles de prediction utilises dans ce memoire sont
orientes vers le formalisme detat, qui permet une manipulation des syst`emes multiva-
riables beaucoup plus aisee que la representation sous forme de fonction de transfert [175].
Considerons alors un batiment compose de s zones, dont le comportement dynamique de la
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 83
zone i N
s
1
est represente par un mod`ele discret, lineaire et invariant dans le temps. An de
simplier les notations et de garder une certaine coherence par rapport au cas monozone,
on consid`ere que les variables locales de commande et de sortie sont unidimensionnelles
u
i
, y
i
R. Alors, le sous-syst`eme (zone) i est decrit par :
_

_
xxx
i
(k + 1) = AAA
i
xxx
i
(k) +bbb
i
u
i
(k) +

jH
i
eee
j,i
y
j
(k)
y
i
(k) = ccc
T
i
xxx
i
(k),
(3.44)
o` u la matrice AAA
i
R
n
i
n
i
represente la matrice detat locale, tandis que les vecteurs
bbb
i
, ccc
i
R
n
i
1
sont les vecteurs locaux de commande et dobservation, respectivement.
eee
j,i
R
n
i
1
designe le vecteur de couplage, qui traduit linuence de la zone j sur la zone
i. On dit que deux zones i et j sont couplees (adjacentes) si elles sont delimitees par une
paroi commune. H
i
represente lensemble des zones adjacentes `a la zones i.
Notation 3.4.1 Nous adoptons la notation suivante :
x
i
pour une variable propre `a lagent local i,
x
j,i
pour une variable mettant en avant linuence de lagent j sur lagent i. Le
dernier indice, i dans cet exemple, souligne lappartenance de la variable ` a lagent.
Remarque 3.4.1 Le mod`ele (3.44) est en fait un cas particulier du mod`ele couple par les
etats (2.12), qui peut etre obtenu en remplacant eee
j,i
par le produit eee
j,i
ccc
T
j
.
Du point de vue physique, le mod`ele couple par les sorties suppose que le transfert
thermique entre deux zones adjacentes soit realise par conduction `a travers la paroi et par
convection entre lair et la paroi (voir lAnnexe A).
En utilisant le mod`ele zonal (3.44), le paragraphe suivant decrit la mise au point de la
commande calculee par chaque agent local.
3.4.2

Elaboration de la commande distribuee
De mani`ere similaire `a lapproche monovariable, denissons le crit`ere local `a horizon
variable, propre `a chaque agent i, par :
J
i
(k) =
N
2,i
(k)

j=1

i
(k + j)[y
i
(k + j) w
i
(k + j)]
2
+
i
N
2,i
(k)

j=1
u
2
i
(k + j 1|k), (3.45)
avec des notations similaires `a celles du paragraphe 3.3.2.
On consid`ere dans la suite du chapitre que la valeur courante de lhorizon superieur de
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
84 3. Commande predictive quadratique
prediction de lagent i est denie par :
N
2,i
(k) =
_

_
N
2,i
, si
i
(k) = 000
N
2,i
,1
,
N
2,i
, si
i
(k + 1) = 1,
max (max{j N
N
2,i
2
|
i
(k + j) >
i
(k + j 1)}, N
2,i
) , sinon.
(3.46)
On a choisi N
1,i
= 1, i N
s
1
uniquement pour des raisons de simplicite du developpement
suivant.
Le regulateur local i calcule la sequence optimale de commande par la resolution du
probl`eme de minimisation :
min
u
i
(k|k),...,u
i
(k+N
2,i
(k)1|k)
J
i
(k),
sous les contraintes denies par (3.44) et
u
i
(k + j|k) = u
i
(k + N
u,i
1|k), j N
N
2,i
(k)1
N
u
.
(3.47)
En incluant les contraintes du probl`eme (3.47) dans le crit`ere (3.45) on peut exprimer
la fonction de co ut sous forme matricielle :
J
i
(k) = ( yyy
i
(k) www
i
(k))
T

i
(k) ( yyy
i
(k) www
i
(k)) +uuu
T
i
(k)
i
uuu
i
(k) (3.48)
o` u les vecteurs yyy
i
(k), www
i
(k) et uuu
i
(k), comme les matrices
i
(k) et
i
sont similaires `a ceux
de (3.14) et (3.15).
`
A partir du mod`ele (3.44), lequation de prediction du sous-syst`eme i
secrit comme suit :
yyy
i
(k) =
i
(k)xxx
i
(k) +
i
(k)uuu
i
(k) +

jH
i

j,i
(k) yyy

j
(k), (3.49)
avec les notations suivantes :
yyy
i
(k) =
_

_
y
i
(k + 1|k)
.
.
.
y
i
(k + N
2,i
(k)|k)
_

_
,
i
(k) =
_

_
ccc
T
i
AAA
i
.
.
.
ccc
T
i
AAA
N
2,i
(k)
i
_

_
, uuu
i
(k) =
_

_
u
i
(k|k)
.
.
.
u
i
(k + N
u,i
1|k)
_

_
,
(3.50)
yyy

j
(k) =
_
y

j
(k) y

j
(k + 1) y

j
(k +

N
2,j
(k) 1)
_
T
, (3.51)

i
(k) =
_

i
(0) 0 0

i
(1)
i
(0) 0 0
.
.
.
.
.
.
.
.
.

.
.
.

i
(N
2,i
(k) 1)
i
(N
2,i
(k) N
u,i
+ 1)

N
2,i
(k)N
u,i
j=0

i
(j)
_

_
,
(3.52)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 85

j,i
(k) =
_

j,i
(0) 0 0 000
1,

N
2,j
(k)N
2,i
(k)

j,i
(1)
j,i
(0) 0 0 000
1,

N
2,j
(k)N
2,i
(k)
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

j,i
(N
2,i
(k) 1)
j,i
(0) 000
1,

N
2,j
(k)N
2,i
(k)
_

_
, (3.53)

i
(k) = ccc
T
i
AAA
k
i
bbb
i
,
j,i
(k) = ccc
T
i
AAA
k
i
eee
j,i
,

N
2,j
(k) = max
iH
j
N
2,i
(k). (3.54)
Le vecteur yyy

j
represente la sequence de sortie optimale du sous-syst`eme j sur une
fenetre de prediction de dimension egale `a la taille maximale des horizons courants parmi
tous ses voisins i H
j
. Pourtant, les derni`eres

N
2,j
(k) N
2,i
(k) composantes du vecteur
yyy

j
ne sont pas utilisees par le predicteur de lagent i (voir la derni`ere colonne bloc de
la matrice
j,i
(k)). Cette notation a pour but de simplier le developpement qui suit.
Le vecteur yyy

j
represente ainsi la sequence dinformations echangees entre les controleurs
locaux.
Par la substitution de lequation de prediction (3.49) dans (3.45) et la resolution de
lequation
J
i
(k)
uuu
i
(k)
= 0, on obtient la sequence de commande optimale locale, dans le cas
sans contraintes, `a linstant k, decrite par :
uuu

i
(k) =
i
(k)
_
_
www
i
(k)
i
(k)xxx
i
(k)

jH
i

j,i
(k) yyy

j
(k)
_
_
, (3.55)
avec

i
(k) =
_

T
i
(k)
i
(k)
i
(k) +
i
_
1

T
i
(k)
i
(k). (3.56)
La formulation (3.55) suppose la connaissance des vecteurs de sorties futures des voi-
sins, calcules en fonction de la commande locale optimale uuu

j
(k), j H
i
. La tache du
regulateur local j devient ainsi similaire `a celle de ses voisins i H
j
, ce qui gen`ere une
boucle algebrique. Une solution proposee par les methodes de controle distribue implique
la resolution iterative du probl`eme local, min
uuu
i
(k)
J
i
(k), en utilisant dans lequation de
prediction locale la sequence de sortie des voisins calculee `a literation precedente. Par
consequent, `a chaque iteration l de linstant k, lagent i calcule sa propre sequence de
commande selon :
uuu
(l(k))
i
(k) =
i
(k)
_
_
www
i
(k)
i
(k)xxx
i
(k)

jH
i

j,i
(k) yyy
(l(k))
j
(k)
_
_
, (3.57)
o` u yyy
(l(k))
j
(k) est la sequence de sortie predite, calculee par lagent j `a literation l(k) 1
et diusee vers tous les agents voisins.
Notation 3.4.2 Dans la suite du present memoire, on utilisera un exposant entre pa-
renth`eses, x
(l(k))
, pour designer le fait que la variable x est utilisee ` a literation l de lins-
tant k pour le calcul de la sequence courante de commande.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
86 3. Commande predictive quadratique
3.4.3 Sequence dechange
Le point cle de notre approche distribuee reside dans la construction du vecteur
dechange, yyy
j
(k). Sa structure depend de literation de lalgorithme distribue.
`
A lins-
tant k, on distingue ainsi literation initiale, l
0
(k) et les autres iterations intermediaires,
l(k). Cette dierenciation est liee au fait qu`a literation initiale, chaque controleur utilise la
sequence de sortie envoyee par ses voisins `a la derni`ere iteration du pas precedent, l
f
(k1).
Considerons dans la suite, la sequence future de sortie calculee de mani`ere distribuee, par
lagent i `a literation l(k) :
yyy
(l(k))
i
(k) =
i
(k)xxx
i
(k) +
i
(k)uuu
(l(k))
i
(k) +

jH
i

j,i
(k) yyy
(l(k))
j
(k). (3.58)
Dans les paragraphes suivants nous presentons une methode de construction du vecteur
yyy
j
en fonction des tailles locales des fenetres de prediction.
3.4.3.1 Horizon de prediction constant dans le temps et identique pour tous
les agents
On commence par le cas le plus simple et le plus classique, celui dont la taille de
lhorizon de prediction est xee une fois pour toute et ne varie pas dun agent `a lautre, i.e.
N
2,i
(k) = N
2
, i N
s
1
, k N. On consid`ere qu`a literation initiale de linstant k, lagent i
utilise, an dobtenir la solution initiale uuu
(l
0
(k))
i
(k), la derni`ere sequence de sortie calculee
au pas precedent par tous ses voisins :
yyy
(l
0
(k))
j
(k) = yyy
(l
f
(k1))
j
(k 1), j H
i
. (3.59)
`
A partir du premier echange dinformation `a linstant k, on peut remplacer la composante
qui correspond `a y
(l(k))
j
(k) par la valeur mesuree, ainsi le vecteur yyy
(l(k))
j
(k) `a une iteration
intermediaire, l(k), est decrit par :
yyy
(l(k))
j
(k) =
_
y
j
(k) y
(l(k)1)
j
(k + 1|k) y
(l(k)1)
j
(k + N
2
1|k)
_
T
. (3.60)
Remarque 3.4.2 La valeur courante de la sortie y
j
(k) nest envoyee vers tous les voisins
de lagent j quapr`es literation initiale, car tout au long des iterations du pas k elle restera
constante.
`
A chaque iteration, les N
2
1 premi`eres composantes du vecteur yyy
(l(k))
j
(k) sont
diusees vers tous les controleurs i H
j
, sauf `a la derni`ere iteration, o` u son dernier
element, y
(l
f
(k))
j
(k + N
2
|k), sera egalement transmis. Il entrera dans la composition du
vecteur yyy
(l
0
(k+1))
j
(k + 1).
3.4.3.2 Horizon de prediction variable dans le temps
Lobjectif de ce paragraphe est detendre la methode de construction du vecteur yyy
j
pour le cas o` u les dimensions des horizons de prediction de chaque agent sont variables
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 87
dans le temps. Les tailles des fenetres locales sont calculees en fonction du prol futur
doccupation, selon lequation (3.46).
Le principe initial est le meme que dans le cas precedent, i.e. `a chaque iteration initiale
les agents utilisent les sequences de sortie des voisins calculees `a linstant anterieur. Il
devient alors interessant danticiper, au moment k 1, la taille de lhorizon de prediction
correspondant au pas suivant. Ceci permet `a lagent local j de construire le vecteur
yyy
(l
0
(k))
j
(k) R

N
2,j
(k)1
. Ainsi, `a la derni`ere iteration du pas k 1, l
f
(k 1), lagent j
doit connatre les dimensions des horizons de prediction locaux de tous ses voisins qui
seront employees au pas suivant, k. Chaque agent j calcule (et envoie), au pas k 1, la
valeur du param`etre local N
2,j
(k|k 1). Pour ce faire, la valeur de lelement
i
(k + N
2,j
)
est necessaire `a linstant k 1. Le prol futur doccupation est generalement connu sur
un horizon de temps plus grand que la fenetre de prediction maximale, ce qui signie que
la valeur exacte de N
2,j
(k) peut etre obtenue. La diusion de ce param`etre vers tous les
agents locaux permet le calcul de

N
2,j
(k) `a linstant k 1.
Alors, en fonction de la relation entre N
2,j
(k 1) et

N
2,j
(k), on distingue deux possi-
bilites pour la construction du vecteur yyy
(l
0
(k))
j
(k).
Si N
2,j
(k 1)

N
2,j
(k), alors la sequence future de sortie, calculee de mani`ere
distribuee par lagent j `a literation l
f
(k1), comporte touts les elements necessaires
`a la construction du vecteur dechange :
yyy
(l
0
(k))
j
(k) =
_
y
(l
f
(k1))
j
(k|k 1) y
(l
f
(k1))
j
(k +

N
2,j
(k|k 1))
_
T
. (3.61)
Si N
2,j
(k 1) <

N
2,j
(k), alors le vecteur yyy
(l
f
(k1))
j
(k) na pas la dimension requise
par ses voisins pour la construction du vecteur dechange yyy
(l
0
(k))
j
(k), dans le sens
o` u il manque des donnees. On peut envisager alors de completer les elements futurs
indisponibles y
(l
f
(k1))
j
(k +N
2,j
(k 1)|k 1), ..., y
(l
f
(k1))
j
(k +

N
2,j
(k)|k 1) par des
valeurs calculees de mani`ere decentralisee.
La methode que nous proposons pour calculer ces composantes indisponibles ne
suppose pas la resolution dun probl`eme doptimisation. Toutefois, pour avoir une
certaine precision sur cette sequence future des valeurs de sortie locale, on consid`ere :
N
2,i
= N
2
, i N
s
1
, (3.62)
ce qui nous permettra, suite `a la denition de lhorizon de prediction variable (3.46),
darmer que les instants k + N
2,j
(k 1), ..., k +

N
2,j
(k) correspondent soit `a une
periode occupation ou dinoccupation continue, soit `a une periode doccupation suivie
dune periode dinoccupation. En exploitant ce detail, on peut approcher les elements
futurs en dehors de lhorizon local de la mani`ere suivante :
1. Les sorties futures correspondant aux instants doccupation seront egales `a la
consigne, i.e. on suppose que le controle local est parfait pendant la periode
doccupation qui suit juste apr`es le dernier instant de la fenetre courante de
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
88 3. Commande predictive quadratique
prediction.
2. Concernant les periodes dinoccupation, on sait que lexistence dun instant
dinoccupation
j
(k 1 + o
j
(k 1)) = 0 en dehors de lhorizon de prediction
o
j
(k 1) N

N
2,j
(k|k1)1
N
2,j
(k1)
, implique le fait que tous les instant suivants, de
k 1 + o
j
(k 1) `a k 1 + N
2
sont des instants dinoccupation. Dans ce cas,
en utilisant lhorizon de prediction

N
2,j
(k|k 1), la sequence de commande
optimale locale qui correspond `a la periode mentionnee est nulle :
u
j
(k + i) = 0, i N

N
2,j
(k|k1)2
o
j
(k1)1
, (3.63)
et par consequent les sorties futures seront completees par la reponse libre du
sous-syst`eme j, `a partir de letat xxx
i
(k 1 + N
2,i
(k 1)|k 1), i.e. le dernier
calcule en appliquant la sequence de commande calculee de mani`ere distribuee.
La structure generale du vecteur de sortie du sous-syst`eme j, utilise `a literation initiale
de lagent i H
j
, contient alors trois composantes :
1. un vecteur de sorties futures calcule de mani`ere distribuee yyy
j
,
2. un vecteur de consignes futures www
j
,
3. un vecteur qui correspond `a la reponse libre yyy
0,j
.
En fonction du prol doccupation, les deux derni`eres composantes du vecteur peuvent etre
vides. Cependant lordre des trois vecteurs dans la composition de la sequence dechange
ne varie pas.
Pour ameliorer lecacite de lalgorithme, `a partir de literation l
0
(k) +1, il est impor-
tant pour les agents de prendre en compte les nouvelles informations disponibles `a linstant
courant, k. Par consequent, on inclut egalement la valeur mesuree de la sortie locale `a la
place du premier element du vecteur yyy
(l(k))
j
(k). Il peut alors secrire, de mani`ere generale,
comme suit :
yyy
(l(k))
j
(k) =
1,j
(k)y
j
(k) +
2,j
(k) yyy
(l(k)1)
j
(k) +
3,j
(k)www
j
(k) +
4,j
(k) yyy
(l(k)1)
0,j
(k + o
j
(k))
(3.64)
o` u yyy
(l(k)1)
0,j
(k +o
j
(k)) =
_
y
(l(k)1)
0,j
(k + o
j
(k)) y
(l(k)1)
0,j
(k +

N
2,j
(k) 1)
_
T
designe la
sequence de reponse libre du sous-syst`eme j. Les quatre matrices de selection,
i,j
(k),
i N
4
1
, sont denies ainsi :

1,j
(k) =
_
1
000
(

N
2,j
(k)1)1
_
,
2,j
(k) =
_

_
000
1
1,j
(k)
000
1
2,j
(k)
III

1,j
(k)
1,j
(k)
000

1,j
(k)
2,j
(k)
000

3,j
(k)
1,j
(k)
000

3,j
(k)
2,j
(k)
_

_
, (3.65)

3,j
(k) =
_

_
000
1+
1,j
(k)
1,j
(k)
000
1+
1,j
(k)
4,j
(k)
000
1+
1,j
(k)
5,j
(k)
000

4,j
(k)
1,j
(k)
III

4,j
(k)
4,j
(k)
000

4,j
(k)
5,j
(k)
000

6,j
(k)
1,j
(k)
000

6,j
(k)
4,j
(k)
000

6,j
(k)
5,j
(k)
_

_
, (3.66)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 89

4,j
(k) =
_
000
1+
1,j
(k)+
4,j
(k)
6,j
(k)
III

6,j
(k)
6,j
(k)
_
. (3.67)
avec les notations suivantes :

1,j
(k) = min(N
2,j
(k),

N
2,j
(k) 1) : nombre delements du vecteur yyy
(l(k)1)
j
(k) qui
entrent dans la composition du vecteur dechange yyy
(l(k))
j
(k),

2,j
(k) = N
2,j
(k)
1,j
(k) : nombre des derniers elements du vecteur yyy
(l(k)1)
j
(k) qui
ne sont pas necessaires `a la construction du vecteur dechange yyy
(l(k))
j
(k),

3,j
(k) = max(0,

N
2,j
(k) 1
1,j
(k)) : nombre delements du vecteur dechange qui
doivent etre calcules de mani`ere decentralisee,

4,j
(k) = max(0, o
j
(k) k 1
1,j
(k)) : nombre delements du vecteur dechange
qui sont egaux aux valeurs de la consigne, o
j
(k) = min O
j
, o` u lensemble O
j
= {i
N
k+

N
2,j
(k)1
k+N
2,j
(k)+1
|
j
(i) = 0} inclut tous les instants futurs en dehors de lhorizon courant
de prediction qui correspond `a linoccupation,

5,j
(k) = N
2

1,j
(k)
4,j
(k) : nombre des derniers elements de la sequence de
consigne qui nentrent pas dans la composition du vecteur dechange,

6,j
(k) =
3,j
(k)
4,j
(k) : nombre delements correspondant `a la reponse libre locale
qui sont inclus dans le vecteur dechange.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
1


0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
2
4
6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
2
4
6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
2
4
6


Instant de temps (k)

1
(k)
2
(k)
3
(k)
P
r
o

l
d

o
c
c
u
p
a
t
i
o
n
y yy
(
l
(
k
)
)
1
(
k
)
y yy
(
l
(
k
)
)
2
(
k
)
y yy
(
l
(
k
)
)
3
(
k
)
Reponse libre Consigne prevue Optimisation distribuee Sortie mesuree
Figure 3.10

Evolution temporelle de la structure du vecteur yyy
(l(k))
j
(k) pour le cas de
trois zones avec : N
2
= 6, N
2,j
= 2, H
j
= N
3
1
\{j}, j N
3
1
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
90 3. Commande predictive quadratique
Pour illustrer la structure variable dans le temps du vecteur dechange `a une iteration
intermediaire, yyy
(l(k))
j
(k), prenons lexemple dun batiment de trois zones, dont chaque zone
est adjacente avec les autres, H
j
= N
3
1
\{j}, j N
3
1
. La gure 3.10 montre la composition
du vecteur dechange par rapport aux quatre composantes (voir (3.64)). Ainsi, pendant
linoccupation, ce vecteur inclut la valeur mesuree de la sortie suivie par une sequence
calculee de mani`ere distribuee.
D`es que la fenetre de prediction entre progressivement dans la periode doccupation,
la valeur de N
2,i
(k) diminue, ce qui necessite lajout de valeurs de consigne future an
dobtenir tous les elements du vecteur dechange. Vers la n de la periode doccupation,
il est possible que des valeurs de sortie correspondant `a linoccupation soient necessaires.
Elles seront calculees comme la reponse libre du mod`ele decentralise.
Remarque 3.4.3 Dans la gure 3.10 on observe egalement la quantite dinformation
echangee entre les regulateurs `a chaque iteration.
`
A une iteration intermediaire, lagent
i transmet `a ses voisins les elements qui correspondent `a optimisation distribuee et ` a la
reponse libre.
`
A la derni`ere iteration on ajoute, eventuellement, des valeurs de consigne,
qui sont utilisees `a linstant suivant.
3.4.4 Algorithme predictif distribue
Lalgorithme 1 synthetise la demarche presentee dans les paragraphes 3.4.2 et 3.4.3. Le
programme est execute localement par chaque regulateur i, `a chaque pas dechantillonnage.
Les etapes principales de la procedure iterative consistent `a resoudre le probl`eme local
doptimisation et `a communiquer la sequence de sortie future aux agents voisins. Ensuite,
chaque agent compare le vecteur dechange nouvellement calcule `a celui obtenu `a literation
precedente. Si la condition darret :
yyy
(l(k))
i
(k) yyy
(l(k)1)
i
(k)
i
(3.68)
est satisfaite pour tous les agents, alors on applique la commande calculee `a la derni`ere
iteration. Comme dans lalgorithme 1, la plupart des travaux references dans ce memoire
ne precise pas explicitement la norme utilisee dans le crit`ere darret de lalgorithme iteratif
[51, 98, 195, 184, 131, 10, 103]. Pourtant, les choix usuelles sont la norme l
2
[32] et la norme
innie l

[68, 97].
Remarque 3.4.4 Dans les travaux mentionnes ci-dessus, la condition darret de lalgo-
rithme iteratif distribue est exprimee en fonction de la sequence de commande : uuu
(l(k))
i
(k)
uuu
(l(k)1)
i
(k)
i
. Pour le cas de la regulation de la temperature en utilisant des mod`eles
couples par la sortie, la formulation (3.68) est plus appropriee. Elle permet egalement
detablir un lien entre la precision des capteurs de temperature et la complexite de lalgo-
rithme (le nombre diterations), car il na aucun sens de choisir
i
inferieur ` a la precision
des capteurs.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 91
Algorithme 1 Procedure iterative de la commande predictive distribuee `a horizon
dynamique (pour chaque agent i, i N
s
1
)
1 : Initialiser l(k) = l
0
(k)
2 : Mettre `a jour les variables locales xxx
i
(k), y
i
(k),
i
(k), www
i
(k)
3 : Calculer la taille de la fenetre de prediction locale pour linstant suivant
N
2,i
(k + 1|k)
4 : Calculer la sequence de commande optimale locale uuu
(l
0
(k))
i
(k) (3.57) `a literation
initiale
5 : Tant que (l(k) < l
max
ET yyy
(l(k))
i
(k) yyy
(l(k)1)
i
(k) >
i
, i N
s
1
) faire
5.1 : Iteration suivante l(k) = l(k) + 1
5.2 : Si (l(k) = l
0
(k) + 1) Alors
5.2.1 : Construire yyy
(l(k))
i
(k) (3.64)
5.2.2 : Envoyer yyy
(l(k))
i
(k) et N
2,i
(k + 1|k) `a tous les agents j H
i
5.2.3 : Recevoir yyy
(l(k))
j
(k) et N
2,j
(k + 1|k) de tous les agents j H
i
Sinon
5.2.4 : Construire yyy
(l(k))
i
(k) (3.64)
5.2.5 : Envoyer yyy
(l(k))
i
(k) `a tous les agents j H
i
5.2.6 : Recevoir yyy
(l(k))
j
(k) de tous les agents j H
i
Fin Si
5.3 : Calculer la sequence de commande optimale locale uuu
(l(k))
i
(k) (3.57)
Fait
6 : Appliquer la premi`ere composante de uuu
(l(k))
i
(k) au sous-syst`eme local i
7 : Calculer

N
2,i
(k + 1|k) et construit yyy
(l
0
(k+1))
i
(k)
8 : Envoyer yyy
(l
0
(k+1))
i
(k) `a tous les agents j H
i
9 : Recevoir yyy
(l
0
(k+1))
j
(k) de tous les agents j H
i
10 : Mettre `a jour k = k + 1 et retour au pas 1
Suite `a la formulation de la fonction locale de co ut (3.45), la convergence de lalgorithme
1, qui sera etudiee dans la partie suivante, conduit les agents vers un consensus appele
equilibre non cooperatif ou equilibre de Nash [18]. Lalgorithme presente est execute par
tous les agents i, `a chaque pas de temps.
Generalement, les contraintes temporelles, liees `a la periode dechantillonnage, ne per-
mettent pas de satisfaire la condition terminale et lalgorithme iteratif est arrete apr`es
un certain nombre diterations l
max
. En choisissant l
max
= l
0
on obtient la version non
iterative de lalgorithme, avec une seule communication par pas de temps.
3.4.5 Analyse de la convergence
Nous nous proposons detudier la convergence de lalgorithme 1, `a un pas de temps
donne. Pour des raisons de simplicite des notations, dans la demarche suivante, on omet
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
92 3. Commande predictive quadratique
la dependance des variables en linstant courant k. Reprenons lequation (3.64), alors le
vecteur qui decrit la sequence future de sortie utilisee par tous les voisins de lagent i, `a
literation l + 1, secrit comme suit :
yyy
(l+1)
i
=
1,i
y
i
+
2,i
yyy
(l)
i
+
3,i
www
i
+
4,i
yyy
(l)
0,i
, (3.69)
avec les notations utilisees au paragraphe 3.4.3.
Lobjectif principal des lignes suivantes consiste `a trouver une equation de recurrence,
qui exprime yyy
i
`a literation l+1 en fonction des predictions obtenues `a literation precedente.
Ainsi, lequation de prediction (3.49) pour lagent i `a literation l est la suivante :
yyy
(l)
i
=
i
xxx
i
+
i
uuu
(l)
i
+

jH
i

j,i
yyy
(l)
j
. (3.70)
Explicitons maintenant la partie reponse libre. Comme nous lavons dej` a mentionne,
on consid`ere comme etat initial la valeur predite qui correspond au dernier instant de la
fenetre de prediction locale, xxx
i
(k + N
2,i
(k)), alors :
yyy
(l)
0,i
=
0,i
_
_
_
_
_
_
_
AAA
N
2,i
i
xxx
i
+
0,i
uuu
(l)
i
+

jH
i

0,j,i
yyy
(l)
j
. .
xxx
i
(k+N
2,i
(k))
_
_
_
_
_
_
_
, (3.71)
avec les matrices

0,i
=
_

0,i
(N
2,i
1)
0,i
(N
2,i
N
u,i
+ 1)

N
2,i
N
u,i
j=0

0i
(j)
_
,
0,i
(k) = AAA
k
i
bbb
i
,
(3.72)

0,j,i
=
_

0,j,i
(N
2,i
1) (1)
0,j,i
(0)
0,j,i
000
n
i
,

N
2,j
N
2,i
_
,
0,j,i
(k) = AAA
k
i
eee
j,i
,
(3.73)

0,i
=
_

_
ccc
T
i
AAA
0,i
.
.
.
ccc
T
i
AAA

6,i
0,i
_

_
, AAA
0,i
= AAA
i
+

jH
i
eee
j,i
ccc
T
j
, i N
s
1
, k N. (3.74)
La matrice AAA
0,i
represente la matrice detat de la zone i, en supposant que les valeurs des
sorties de toutes les zones adjacentes sont egales `a la sortie de la zone i.
An dobtenir la condition de convergence de lalgorithme, on utilise la solution ana-
lytique du probl`eme de minimisation du crit`ere local (3.45) `a literation l qui peut secrire
comme suit :
uuu
(l)
i
=
i

jH
i

j,i
yyy
(l)
j
+
i
, (3.75)
avec la matrice
i
denie par lequation (3.56) et le vecteur
i
=
i
(www
i

i
xxx
i
) qui est
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 93
constant par rapport aux iterations intermediaires de lalgorithme distribue.
En remplacant (3.75) dans (3.70) et (3.71), ensuite (3.70) et (3.71) dans (3.69), on
obtient :
yyy
(l+1)
i
=

jH
i

j,i
yyy
(l)
j
+
i
, (3.76)
avec les notations suivantes :

j,i
=
2,i

j,i
+
4,i

0,i

0,j,i
(
2,i

i
+
4,i

0,i

0,i
)
i

j,i
, (3.77)

i
=
i
+ (
2,i

i
+
4,i

0,i

0,i
)
i
, (3.78)

i
=
1,i
y
i
+
3,i
www
i
+
_

2,i

i
+
2,i

0,i
AAA
N
2,i
i
_
xxx
i
. (3.79)
Alors, le vecteur global des sequences de sorties echangees sexprime par lequation :
yyy
(l+1)
=
_

_
yyy
(l+1)
1
.
.
.
yyy
(l+1)
s
_

_
= yyy
(l)
+, (3.80)
o` u
=
_

_
000

N
2,1


N
2,1

2,1

s,1

1,2
000

N
2,2


N
2,2

s,2
.
.
.
.
.
.
.
.
.

1,s

s1,s
000

N
2,s


N
2,s
_

_
. (3.81)
Les matrices
j,i
sont denies par (3.77) si les sous-syst`emes i et j sont couples, sinon

j,i
= 000

N
2,i


N
2,j
. La matrice est bloc diagonale : = bloc-diag{
1
, ...,
s
}.
Maintenant on peut formuler une condition necessaire et susante pour la convergence
de lalgorithme iteratif.
Proposition 3.4.1 (Convergence de lalgorithme iteratif ).

Etant donne linstant k, lal-
gorithme 1 converge vers un consensus, si et seulement si la condition (3.82) est satisfaite :
() < 1, (3.82)
o` u () = max
i
(|
i
|) designe le rayon spectral de la matrice et
1
,
2
, ...,

s
i=1

N
2,i
sont
les valeurs propres de .
Remarque 3.4.5 Pendant les instants k pour lesquels
i
= 000
N
2
1
, la matrice est nil-
potente dindice N
2
. Ceci est d u au fait que pour ces instants, lexpression de la matrice
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
94 3. Commande predictive quadratique
devient :
=
_

_
000
N
2
N
2

2,1

2,1

2,1

s,1

2,2

1,2
000
N
2
N
2

2,2

s,2
.
.
.
.
.
.
.
.
.

2,s

1,s

2,s

s1,s
000
N
2
N
2
_

_
, (3.83)
o` u les matrices
s,1
R
N
2
N
2
ont une structure triangulaire inferieure (voir (3.53)),
tandis que dans ce cas les matrices de selection
2,i
R
N
2
N
2
sont denies par :

2,i
=
_

_
0 0 0
1 0 0
.
.
.
.
.
.
.
.
.
.
.
.
0 1 0
_

_
, (3.84)
ce qui fait que tous les blocs de matrices qui entrent dans la composition de sont soit
nuls, soit triangulaires inferieurs avec toutes les composantes diagonales egales ` a zero.
Ainsi, tous les blocs de matrices non nuls sont nilpotents dindice N
2
, propriete qui est
egalement transmise `a la matrice . Par consequent,
N
2
= 000
sN
2
sN
2
et lalgorithme 1
converge apr`es N
2
iterations.
La nilpotence de la matrice de convergence pour le cas particulier presente dans la
remarque precedente, ainsi que la convergence rapide de lalgorithme (qui sera illustree par
un exemple numerique au paragraphe (3.4.6.3)) peuvent sexpliquer par les interactions
stables et relativement lentes entre les sous-syst`emes. Le couplage par les sorties, ainsi
que le blocage des composantes calculees de mani`ere decentralisee contribuent egalement
`a augmenter la vitesse de convergence de lalgorithme. Suite `a cette propriete, un nombre
tr`es faible diterations est necessaire pour obtenir de bonnes performances de controle.
De mani`ere similaire, `a partir de lequation (3.75), lexpression de la sequence globale
de commandes calculee `a literation l + 1 est donnee par :
uuu
(l+1)
=
_

_
uuu
(l+1)
1
.
.
.
uuu
(l+1)
s
_

_
= yyy
(l)
+, (3.85)
avec les notations
=
_

_
000
N
u,1


N
2,1

2,1

1

s,1

1,2
000
N
u,2


N
2,2

2

s,2
.
.
.
.
.
.
.
.
.

1,s

s

s1,s
000
N
u,s


N
2,s
_

_
, (3.86)
et = bloc-diag{
1
, ...,
s
}.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 95
3.4.6 Resultats numeriques
Cette partie presente les performances de la structure de controle distribuee appliquee
`a la commande des convecteurs electriques dans un batiment virtuel qui est compose
par trois zones thermiques. Le dimensionnent et les caracteristiques des materiaux du
mod`ele simule sont regroupes dans lAnnexe A. La gure 3.11 illustre la conguration des
trois zones du batiment. Chaque zone est equipee dun convecteur electrique de puissance
maximale P
n,i
= 1, 2kW, surdimensionne par rapport aux normes en vigueur, ce qui est
souvent le cas des batiments anciens.
u
3
u
1
u
2
Zone1 Zone2
Zone3
y
1
y
2
y
3
Transfert thermique
6m
2m
4m
Figure 3.11 Conguration du batiment simule
De mani`ere similaire au cas monozone, la temperature exterieure a ete ajoutee comme
perturbation mesurable du mod`ele de commande. Sachant que chaque zone est adjacente
avec les deux autres, alors les mod`eles locaux contiennent quatre entrees et une sortie. On
a choisi dutiliser une structure tr`es simple pour le mod`ele de commande, ce qui facilite
en meme temps la procedure didentication ainsi que limplantation du controleur. Par
consequent, chaque transfert E/S est modelise par un premier ordre, ce qui donne pour
chaque zone :
y
i
(s) =
K
i

i
s + 1
u
i
(s) +
K
ext,i

ext,i
s + 1
T
ext
(s) +

jH
i
K
j,i

j,i
s + 1
y
j
(s), (3.87)
avec la prise en compte de linuence de la temperature exterieure, T
ext
. Les mod`eles
locaux sont discretises avec une periode dechantillonnage T
s
= 30min. Ensuite, ils sont
exprimes sous la forme de representation detat (3.44), avec les matrices :
AAA
1
=
_
0,9501 0 0 0
0 0,8215 0 0
0 0 0,8833 0
0 0 0 0,8916
_
, AAA
2
=
_
0,9491 0 0 0
0 0,8193 0 0
0 0 0,8848 0
0 0 0 0,8885
_
, (3.88)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
96 3. Commande predictive quadratique
AAA
3
=
_
0,9585 0 0 0
0 0,8409 0 0
0 0 0,8938 0
0 0 0 0,8902
_
, bbb
1
=
_
0
2,8606
0
0
_
, eee
2,1
=
_
0
0
0,0480
0
_
, eee
3,1
=
_
0
0
0
0,0361
_
, (3.89)
eee
ext,1
=
_
0,0113
0
0
0
_
, bbb
2
=
_
0
2,8657
0
0
_
, eee
1,2
=
_
0
0
0,0481
0
_
, eee
3,2
=
_
0
0
0
0,0367
_
, (3.90)
eee
ext,2
=
_
0,0113
0
0
0
_
, bbb
3
=
_
0
2,7269
0
0
_
, eee
1,3
=
_
0
0
0,0363
0
_
, eee
2,3
=
_
0
0
0
0,0362
_
, (3.91)
eee
ext,3
=
_
0,0125
0
0
0
_
, ccc
i
= 111
41
, i N
3
1
, (3.92)
Les caracteristiques des trois zones du batiment considere sont assez similaires, ce qui
fait que les valeurs numeriques des param`etres des trois mod`eles locaux sont assez proches.
Ils sont stables, commandables et observables. Lelaboration de la loi de commande aux
paragraphes precedents a ete menee en supposant que les etats du syst`eme sont connus, ce
qui nest generalement pas le cas dans la pratique. Ici, sachant que les etats des mod`eles ne
correspondent pas aux grandeurs physiques, il apparat necessaire de mettre en place des
observateurs detat. Lobservateur utilise le mod`ele de commande avec une contre-reaction
qui pond`ere lerreur de sortie. Lestimation de letat peut ainsi etre eectuee `a laide dun
observateur de type Luenberger [109]. Ainsi, letat predit estime a la forme suivante :
xxx
i
(k + 1) = AAA
i
xxx
i
(k) +bbb
i
u
i
(k) +

jH
i
eee
j,i
y
j
(k) +eee
ext,i
T
e
(k) +kkk
i
_
y
i
(k) ccc
T
i
xxx
i
(k)

. (3.93)
La propriete dobservabilite nous permet de choisir les gains des observateurs, kkk
i

R
n
i
1
, pour placer leurs valeurs propres `a linterieur du cercle unite. Comme on peut
lobserver, an destimer letat xxx
i
, lobservateur local a egalement besoin des valeurs des
sorties mesurees par les capteurs des pi`eces voisines et aussi de T
ext
. En supposant que les
observateurs locaux ont acc`es aux mesures des sorties des zones adjacentes et en choisissant
ses poles cinq fois plus rapides que les poles du mod`ele, les gains des observateurs obtenus
sont :
kkk
1
=
_
32, 0847 2, 7697 178, 9277 206, 8616
_
T
,
kkk
2
=
_
32, 9429 2, 7582 432, 8484 461, 6421
_
T
,
kkk
3
=
_
24, 0146 3, 3348 354, 5509 335, 1681
_
T
.
(3.94)
En placant les poles de lobservateur beaucoup plus rapides que ceux du syst`eme, les
valeurs des composantes du gain kkk
i
devient importantes. Sachant que les observateurs
`a gain eleve (high-gain observers) peuvent amplier les erreurs destimation (dues aux
perturbations et aux simplications de modelisation), les poles de lobservateur ont ete
calcules an dobtenir de bonnes performances de controle [187], ainsi quune vitesse de
convergence satisfaisante des etats estimes. Pour plus dinformations sur les observateurs
`a gain eleve ou les observateurs pour certaines classes de syst`emes MIMO, le lecteur est
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 97
invite `a consulter les travaux de [58, 59].
3.4.6.1 Mod`ele decouple
Pour mesurer les ameliorations sur les performances apportees par la prise en compte
du couplage entre les zones adjacentes, on va comparer les resultats obtenus en utilisant la
structure de commande distribuee par rapport `a une strategie compl`etement decentralisee,
pour laquelle chaque agent calcule la commande locale de mani`ere independante. An
dutiliser la meme structure du mod`ele de commande pour le cas decentralise, on formule
lhypoth`ese que les temperatures sont egales dans toutes les zones du batiment. Dans ce
cas, le mod`ele local decentralise devient :
_

_
xxx
0,i
(k + 1) =
_
_
_
_
_
_
_
AAA
i
+

jH
i
eee
j,i
ccc
T
j
. .
AAA
0,i
_
_
_
_
_
_
_
xxx
0,i
(k) +bbb
i
u
i
(k) +eee
ext,i
T
e
(k)
y
i
(k) = ccc
T
i
xxx
0,i
(k).
(3.95)
`
A partir du mod`ele (3.95), lequation de lobservateur local decentralise est la suivante :
xxx
0,i
(k + 1) = AAA
0,i
xxx
0,i
(k) +bbb
i
u
i
(k) +kkk
0,i
_
y
i
(k) ccc
T
i
xxx
0,i
(k)

, (3.96)
o` u le gain de lobservateur, kkk
0,i
est calcule par une procedure de placement de poles,
an dobtenir une dynamique de lobservateur cinq fois plus rapide que la dynamique du
mod`ele.
3.4.6.2 Comparaison MPC decentralise - MPC distribue
Dans ce paragraphe nous allons comparer les performances en termes de confort et de
consommation de la structure de commande predictive distribue (DiMPC) par rapport
`a la strategie compl`etement decentralisee (DeMPC). Pour ce faire, nous reprenons les
indices denis dans le paragraphe 3.3.4.1 pour une seule zone et nous les etendons `a un
batiment multizone. Ainsi, la consommation du batiment tout entier est la somme des
consommations locales :
E
c
=
s

i=1
k
f

k=k
0
T
s
P
n,i
u
i
(k)
3600
. (3.97)
De mani`ere similaire, lindice global qui mesure la qualite de la regulation est represente
par la somme des indices locaux :
I
c
=
s

i=1

k
f
k=k
0
T
s

i
(k) |y
i
(k) w
i
(k)|
3600
. (3.98)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
98 3. Commande predictive quadratique
Dans cette etude, on se propose de comparer les performances de six strategies de
commande predictive appliquees `a la regulation thermique du batiment. On utilisera ainsi
des abreviations similaires `a celles introduites au paragraphe 3.3.6 : le suxe HC designe
le fait que la commande predictive utilise une taille de fenetre de prediction constante,
tandis que les suxes HV1 et HV2 indiquent le fait que la valeur du param`etre local
N
2,i
est variable dans le temps. Pour avoir une meilleure vision sur les performances de
controle de chaque structure developpee, les resultats sont compares sur quatre scenarios
doccupation. Les param`etres de reglage pour les controleurs predictifs locaux sont les
suivants : N
u,i
= N
2,i
N
10
2
, N
2,i
= 10,
i
= 1,
i
= 10
2
, i N
3
1
.
Scenario 1. La zone 1 est occupee du lundi au vendredi de 8h `a 24h, tandis que les autres
pi`eces ne sont jamais occupees. Ceci est une cas tr`es particulier, qui est rarement rencontre
dans la realite. Pourtant, il est interessant dobserver comment une zone chauee inuence
les zones inoccupees et ayant une temperature interieure faible (voir la gure 3.12a). On
peut observer une bonne qualite de la regulation pendant les phases doccupation.
0 24 48 72 96 120 144 168 192
8
12
16
20
0 24 48 72 96 120 144 168 192
0
0.2
0.4
0.6
0.8
1


zone 1
zone 2
zone 3
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
,
2
k
W
]
Temps [h]
a
b
2 3 4 5 6 7 8 9 10
150
155
160
165
170
175
180
185
190
195


2 3 4 5 6 7 8 9 10
174
176
178
180
182
184
186
I
c
[
o
C
h
]
E
c
[
k
W
h
]
N
u
N
u
DeMPCHC
DeMPCHV1
DeMPCHV2
DiMPCHC
DiMPCHV1
DiMPCHV2
c d
Figure 3.12 Scenario 1 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d)
Des apports solaires plus importants les deuxi`eme et quatri`eme jours provoquent de
legers depassements. Les valeurs temporelles des principales perturbations liees aux condi-
tions meteorologiques simulees peuvent etre retrouvees gure A.4 de lAnnexe A. En termes
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 99
de performances, les strategies de commande distribuees ameliorent le confort en moyenne
de 8,3 % et reduisent la consommation energetique de 1,64 % par rapport `a une commande
equivalente compl`etement decentralisee.
Remarque 3.4.6 Dans cette partie on a omit de comparer les resultats des strategies
distribuees avec ceux obtenus par lapplication dun regulateur MPC centralise. Ceci pour
plusieurs raisons :
la formulation du probl`eme centralise `a horizon de prediction variable est loin detre
evidente, d u `a des valeurs dierentes de N
2,i
, pour chaque zone
en favorisant le confort par rapport `a la consommation, dans le cas centralise on
peut avoir des situations o` u les equipements de chauage des pi`eces non-occupees
sont mis en marche, pour aider le (pre-)chauage dune pi`ece adjacente (ce qui ne
peut pas se passer en employant la strategie distribuee, d u au fait que les regulateurs
minimisent uniquement des objectifs locaux).
0 24 48 72 96 120 144 168 192
8
12
16
20
0 24 48 72 96 120 144 168 192
0
0.2
0.4
0.6
0.8
1


zone 1
zone 2
zone 3
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
,
2
k
W
]
Temps [h]
a
b
2 3 4 5 6 7 8 9 10
60
65
70
75
80
85
90
95
100
105


2 3 4 5 6 7 8 9 10
232
234
236
238
240
242
244
246
248
250
I
c
[
o
C
h
]
E
c
[
k
W
h
]
N
u
N
u
DeMPCHC
DeMPCHV1
DeMPCHV2
DiMPCHC
DiMPCHV1
DiMPCHV2
c d
Figure 3.13 Scenario 2 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) pour N
u,i
= N
2,i
N
10
2
, N
2,i
= 10,

i
= 1, i N
3
1
Scenario 2. On consid`ere un prol doccupation desynchronise avec des periodes doc-
cupation courtes. Ainsi, la zone 1 est occupee de 8h `a 12h, la zone 2 de 13h `a 17h, alors que
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
100 3. Commande predictive quadratique
la zone 3 est occupee de 18h `a 22h. Sur ce scenario, les amelioration relatives moyennes
des structures distribuees sont de 21,8 % par rapport `a lindice de confort, et dans le meme
temps la consommation est reduite en moyenne de 2 %.
Par rapport au Scenario 1, on observe que lecart en termes de performances entre
les DeMPC et les DiMPC augmente. Ceci sexplique par le fait que pendant les periodes
de relance et doccupation, les variations des temperatures dans les trois pi`eces sont im-
portantes. Ces evolutions temporelles sont prises en compte par les structures distribuees,
gr ace aux echanges dinformations.
0 24 48 72 96 120 144 168 192
8
12
16
20
0 24 48 72 96 120 144 168 192
0
0.2
0.4
0.6
0.8
1


zone 1
zone 2
zone 3
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
,
2
k
W
]
Temps [h]
a
b
2 3 4 5 6 7 8 9 10
600
620
640
660
680
700
720
740


2 3 4 5 6 7 8 9 10
245
250
255
260
265
270
275
I
c
[
o
C
h
]
E
c
[
k
W
h
]
N
u
N
u
DeMPCHC
DeMPCHV1
DeMPCHV2
DiMPCHC
DiMPCHV1
DiMPCHV2
c d
Figure 3.14 Scenario 3 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) pour N
u,i
= N
2,i
N
10
2
, N
2,i
= 10,

i
= 1, i N
3
1
Scenario 3. Dans ce troisi`eme cas, on admet que les trois zones poss`edent le meme prol
doccupation, de 8h `a 17h. Par rapport aux scenarios precedents, le rayonnement solaire
engendre des depassements de consigne plus importants, jusqu`a 2
o
C pour la periode de
simulation representee gure 3.14a. Pour ce prol doccupation synchronisee, lecart moyen
entre lindice de confort des structure decentralisees par rapport `a celles distribuees est
reduit `a 3,4 %, avec une economie moyenne de 3,3 %.
Scenario 4. Dans ce quatri`eme scenario, un prol doccupation semi-synchronise a ete
deni. Ainsi, la zone 1 est occupee de 8h `a 17h, la zone 2 de 10h `a 19h et la zone 3 de 14h `a
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 101
18h. Admettons que les deux prols doccupation precedents representent deux extremes,
celui-ci se situe quelque part entre les deux.
`
A partir de cette remarque, les resultats
obtenus sont relativement intuitifs. Les strategies predictives distribuees ameliorent les
degre de confort avec une moyenne de 10,3 % tout en realisant des economies energetiques
de 2,4 %.
0 24 48 72 96 120 144 168 192
8
12
16
20
0 24 48 72 96 120 144 168 192
0
0.2
0.4
0.6
0.8
1


zone 1
zone 2
zone 3
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
,
2
k
W
]
Temps [h]
a
b
2 3 4 5 6 7 8 9 10
280
300
320
340
360
380
400
420


2 3 4 5 6 7 8 9 10
220
222
224
226
228
230
232
234
236
238
240
I
c
[
o
C
h
]
E
c
[
k
W
h
]
N
u
N
u
DeMPCHC
DeMPCHV1
DeMPCHV2
DiMPCHC
DiMPCHV1
DiMPCHV2
c d
Figure 3.15 Scenario 4 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) pour N
u,i
= N
2,i
N
10
2
, N
2,i
= 10,

i
= 1, i N
3
1
Cette etude comparative sur les quatre scenarios doccupation presentes ci-dessous
nous a permis de mesurer les performances de six structures de controle developpees pour
la regulation de la temperature dans le cadre multizone. Pour chaque scenario, on a mis
en evidence les ameliorations sur les performances de controle issues de la prise en compte
des couplages thermiques entre les zones par lintermediaire des architectures distribuees.
Pour les deux architectures de commande, DeMPC et DiMPC, on a egalement com-
pare de mani`ere quantitative les performances obtenues en utilisant deux strategies de
variation de la taille de lhorizon de prediction local par rapport au cas o` u la dimension
de lhorizon de prediction est constante. Les resultats sur les quatre scenarios consideres
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
102 3. Commande predictive quadratique
montrent, comme pour le monozone, quil devient interessant de diminuer la taille de lho-
rizon de prediction dans le cas o` u des valeurs relativement faibles de la taille de lhorizon
de commande sont utilisees.
3.4.6.3

Etude experimentale sur la vitesse de convergence
Lobjectif de ce paragraphe est detudier, de mani`ere experimentale, la vitesse de
convergence de lalgorithme distribue. Pour ce faire, on reprend les scenarios doccupa-
tion 2 et 4, presentes ci-dessus. Les gures 3.16 et 3.17 illustrent levolution de lecart
maximal parmi les agents entre deux vecteurs dechange consecutifs, exprimee en norme
innie, et egalement la valeurs du rayon spectral de la matrice .
5 10 15 20 25 30 35 40 45
0
0.5
1


5 10 15 20 25 30 35 40 45
10
20
10
0
10
20
5 10 15 20 25 30 35 40 45
0
0.1
0.2
Pas

1
(k)
2
(k)
3
(k)

i
m
a
x
i
(

y yy
(
l
)
i

y yy
(
l

1
)
i

(

)
Figure 3.16 Scenario 2 :

Evolution de la vitesse de convergence et du rayon spectral de
la matrice en fonction du prol doccupation, pour la conguration DiMPCHV1, avec :
N
2
= 6, N
2,j
= 3, j N
3
1
5 10 15 20 25 30 35 40 45
0
0.5
1


5 10 15 20 25 30 35 40 45
10
20
10
0
10
20
5 10 15 20 25 30 35 40 45
0
0.1
0.2
Pas

1
(k)
2
(k)
3
(k)

i
m
a
x
i
(

y yy
(
l
)
i

y yy
(
l

1
)
i

(

)
Figure 3.17 Scenario 4 :

Evolution de la vitesse de convergence et du rayon spectral de
la matrice en fonction du prol doccupation, pour la conguration DiMPCHV1, avec :
N
2
= 6, N
2,j
= 3, j N
3
1
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.4. MPC distribue `a horizon de prediction dynamique 103
La vitesse de convergence de lalgorithme distribue est relativement rapide. Pour les
quatre scenarios etudies, un maximum de 4 iterations par pas dechantillonnage est neces-
saire pour satisfaire la condition de convergence avec
i
= 10
2
. Un nombre eleve ditera-
tions est atteint quand le rayon spectral () est relativement important. Ces instants
correspondent `a la periode de prechauage pendant laquelle la vitesse de convergence
augmente progressivement.
Scenario
Loi de commande
I
c
[
o
Ch] E
c
[kWh]
Type Specicite
1
DiMPCHV1
l
max
= 1 158,64 175,67
l
max
= 2 154,62 175,48
l
max
= 10 154,61 175,46
DeMPCHV1 - 167,29 177,43
2
DiMPCHV1
l
max
= 1 71,14 235,85
l
max
= 2 66,44 235,39
l
max
= 10 66,44 235,26
DeMPCHV1 - 84,48 237,23
3
DiMPCHV1
l
max
= 1 620,99 249,57
l
max
= 2 607,07 248,74
l
max
= 10 606,86 248,83
DeMPCHV1 - 618,27 256,61
4
DiMPCHV1
l
max
= 1 301,96 221,44
l
max
= 2 294,93 221,24
l
max
= 10 294,91 221,22
DeMPCHV1 - 323,24 225,50
Table 3.2 Resultats comparatifs DeMPCHV1 - DiMPCHV1 pour les quatre scenarios
doccupation, avec les param`etres : N
u,i
= N
2,i
= 2, N
2,i
= N
2,i
= 10,
i
= 1,
i
= 0,
i N
3
1
Dans le tableau 3.2, on compare les performances de la structure de commande dis-
tribuee en utilisant plusieurs valeurs du nombre maximal diterations. On observe que la
version non iterative de lalgorithme 1 ore des resultats proches de ceux obtenus par la
procedure iterative, ce qui est principalement d u `a une bonne initialisation (voir le para-
graphe 3.4.3.2) La deuxi`eme iteration permet une amelioration au niveau du confort de
2,25 `a 6,6 % avec des taux de consommation quasiment identiques. Pourtant, il semble
que laugmentation du nombre diterations `a une valeur superieure `a 2 ne modie pas
de mani`ere signicative les performances de controle. Ceci peut sexpliquer par le fait
qu`a partir de la deuxi`eme iteration certaines composantes des vecteurs dechange restent
constantes. De plus, la sequence de sortie calculee de fa con distribuee na pas une evolution
importante au l des iterations (les termes de ponderation
i
etant choisis an de favoriser
le suivi de consigne).
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
104 3. Commande predictive quadratique
3.5 Conclusion
Le travail developpe dans ce chapitre avait comme objectif de presenter une strategie
de commande predictive `a crit`ere quadratique pour la regulation du poste de chauage des
batiments, dans le cas dune occupation intermittente. Lutilisation dun mod`ele lineaire
du syst`eme (batiment et organe de chaue) permet, dans le cadre dune optimisation sans
contraintes, dexprimer la commande sous la forme dune loi lineaire. Ainsi, le regulateur
predictif peut etre facilement implante sur une carte electronique embarquee.
Dans un premier temps, nous avons modie la fonction de co ut classique de la loi de
commande predictive, pour mieux repondre aux objectifs de controle thermique dans le
cadre dune occupation discontinue. Ainsi, le prol futur doccupation a ete inclus dans la
formulation de la fonction de co ut. Ceci modie lobjectif de controle en fonction de la phase
(occupation / inoccupation) de la zone. La loi de commande lineaire devient ainsi variable
dans le temps. Malgre le fait que la strategie de commande ait ete presentee dans le contexte
de la regulation thermique, elle peut egalement etre une solution pour la commande des
syst`emes qui poss`edent un fonctionnement discontinu, comme par exemple les machines-
outils qui doivent usiner des pi`eces [79]. Il apparat des periodes de temps pendant lesquelles
la machine nusine pas, et dans ce cas seule la reduction de sa consommation energetique
est interessante.
Pour faciliter la mise en oeuvre de la loi de commande presentee, une structure polyno-
miale dynamique de type RST, dont les coecients des trois polyn omes sont variables dans
le temps, a ete developpee. Pour reduire la charge de calcul en ligne, les coecients des po-
lynomes peuvent etre stockes dans un bloc de memoire. An dameliorer les performances
de controle sans augmenter la complexite du correcteur, une strategie de diminution de
lhorizon de prediction sur la sortie, en fonction du prol doccupation, a ete presentee.
La demarche developpee pour une seule pi`ece a ete adaptee `a un batiment multizone
o` u la commande est calculee de mani`ere distribuee. Les interactions thermiques entre les
zones adjacentes sont prises en compte dans le mod`ele de commande par lutilisation dun
couplage par les sorties. Cette particularite du mod`ele permet de reduire la quantite din-
formations echangees entre les agents voisins, en employant une strategie de variation de
lhorizon de prediction. En fonction du prol doccupation local et de literation courante,
la sequence dinformation echangee parmi les agents est composee dune partie calculee de
fa con distribuee, mais peut egalement inclure une partie evaluee de mani`ere decentralisee
sans avoir recours `a une procedure doptimisation. Une condition necessaire et susante
pour la convergence de lalgorithme propose a ete formulee.
Les resultats de simulation ont montre des augmentations sur le degre de confort ainsi
que des economies denergie avec larchitecture distribuee `a horizon dynamique. Le prix
`a payer pour ces ameliorations de performance est lutilisation dun reseau de commu-
nication, qui permet lechange dinformation entre les regulateurs locaux. Pour le cas o` u
lalgorithme non iteratif nore pas les performances requis, une complexite supplementaire
sajoute, suite au calcul de la commande optimale `a chaque iteration de lalgorithme dis-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
3.5. Conclusion 105
tribue.
Malgre les avantages de la commande predictive `a crit`ere quadratique, elle nore
pas une relance optimale du poste de chauage. Celle-ci suppose le declenchement du
chauage `a puissance maximale, au dernier moment, pour que la temperature de la zone
atteigne la valeur de confort d`es le debut de la periode doccupation. Comme on a pu le
constater, la duree de la periode de prechauage des regulateurs etudies dans ce chapitre
est denie par la taille de lhorizon maximal de prediction. Pourtant, levolution de la
puissance de chaue pendant la relance depend des param`etres de reglage du regulateur.
Sachant quil nexiste pas de r`egles permettant de calculer les param`etres speciques `a
la commande predictive, nous avons egalement analyse les performances obtenues pour
dierentes valeurs des param`etres de reglage.
Les performances economiques etant generalement exprimees via des crit`eres lineaire
de performance , il sav`ere alors interessant detudier le comportement des regulateurs
predictifs `a crit`ere lineaire, cet aspect sera developpe dans les chapitres suivants.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
106 3. Commande predictive quadratique
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Chapitre 4
MPC lineaire multivariable pour la
regulation thermique multizone
1
Cest un menage `a quatre : lui, elle, lidee quelle se fait de lui
et lidee quil a delle.
La vie de couple
Claude Roy
4.1 Introduction
La mise en uvre de la commande predictive est parfois limitee par le temps de calcul
necessaire `a la resolution du probl`eme doptimisation. Ceci est une des raisons pour la-
quelle la formulation classique du MPC repose sur un crit`ere quadratique. Pour le cas sans
contraintes, la solution optimale peut etre, en eet, obtenue par la resolution analytique
du probl`eme doptimisation, ce qui permet une implantation peu co uteuse du correcteur.
Cet avantage a ete mis en evidence dans le chapitre precedent dans lequel la loi predictive
a ete implantee sous la forme dun regulateur classique de type RST. Ainsi les premiers
regulateurs MPC industriels, comme IDCOM ou DMC [152], ont ete developpes pour les
formulations sans contraintes des crit`eres quadratiques. Ils ont ete suivis par des correc-
teurs MPC bases sur des algorithmes de programmation quadratique, qui optimisent un
probl`eme sous contraintes. Plus tard, les eorts de la communaute scientique se sont
concentres sur les aspects lies `a la faisabilite et `a la stabilite en boucle fermee [118].
Dans le chapitre 3 nous avons propose une methode de reduction de la taille de lho-
rizon de prediction, ce qui nous a permis de mieux gerer les periodes de relance, mais
egalement daugmenter leg`erement la robustesse du regulateur par rapport au cas de lho-
rizon constant. En diminuant la taille de lhorizon de prediction, on augmente lagressivite
de la loi de commande. Cependant, par ses proprietes intrins`eques, le MPC `a crit`ere lineaire
1. Des elements de ce chapitre peuvent etre retrouves dans [123, 120, 126].
107
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
108 4. MPC lineaire multivariable pour la regulation thermique multizone
est beaucoup plus agressif que le MPC `a formulation quadratique [159], ce qui peut en-
gendrer un comportement de type dead-beat. Meme si les actions brusques du correcteur
sont generalement indesirables, dans le cas des syst`emes electriques de chauage, elles ne
representent pas un inconvenient majeur. Frequemment, en eet, ces equipements sont
commandes par des correcteurs de type TOR.
Malgre ces points, en faveur dun MPC quadratique, les principaux aspects qui mo-
tivent ladoption dans la suite de ce document du MPC `a crit`ere lineaire sont resumes ci
dessous.
Les crit`eres de performance sont generalement formules sous forme lineaire. Cela est
plus intuitif et represente mieux les objectifs economiques. De mani`ere generale, la
consommation energetique est proportionnelle `a la commande appliquee au syst`eme.
Ainsi, une fonction de co ut lineaire permet de prendre en compte facilement les
variations (journali`eres) du prix de lelectricite.
La meilleure strategie de controle pendant la phase de relance consiste `a declencher
lequi-pement `a la puissance maximale au dernier moment, deni de sorte que la
temperature atteigne le niveau de confort voulu d`es le debut de la periode doccu-
pation. Dans le chapitre precedent on a vu que ce comportement ne caracterise pas
la commande quadratique, pour laquelle la puissance de chaue croit generalement
de mani`ere progressive pendant la relance.
Ce chapitre sera alors focalise sur des strategies de commande predictives distribuees,
`a fonctions de co ut lineaires. Lapparition explicite des contraintes dans la denition du
probl`eme doptimisation devient obligatoire, car la solution sans contraintes est innie. La
section 4.3 traitera le cas des contraintes locales, propres `a chaque agent. Les contraintes
locales les plus importantes concernent les limites inferieures et superieures sur les signaux
de commande, traduisant de limitations physiques de lactionneur. Dans la partie 4.4,
nous introduirons une contrainte globale qui int`egre des param`etres appartenant soit `a un
ensemble de zones, soit au batiment entier. La methode de decomposition de Dantzig-Wolfe
sera loutil qui permettra la distribution de leort de calcul sur les dierents regulateurs
locaux.
4.2 Contexte
La programmation lineaire est sans doute le mecanisme le plus naturel pour une for-
mulation aisee dune vaste gamme de probl`emes pratiques. Un probl`eme de programma-
tion lineaire est caracterise, comme son nom lindique, par un objectif lineaire et par des
contraintes egalites et / ou inegalites lineaires. On peut penser, au premier abord, que les
formulations lineaires des probl`emes doptimisation sont populaires parce que la formula-
tion mathematique est agreable, la theorie est riche et la charge de calcul est plus faible que
pour dautres types de probl`emes doptimisation. En fait, ce ne sont pas l` a les principales
raisons. En termes de proprietes mathematiques et calculatoires, il existe des classes de
probl`emes doptimisation (quadratiques, par exemple) qui poss`edent des theories elegantes
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.3. Contraintes locales 109
et puissantes, et pour lesquelles des algorithmes ecaces sont disponibles. Cependant, il
semble que la popularite de la programmation lineaire soit plut ot due `a la phase de formu-
lation du probl`eme qu`a la phase de calcul de la solution optimale. Ainsi, la plupart des
contraintes et des objectifs qui se posent dans la pratique sont incontestablement lineaires.
La majorite des objectifs de controle dans le domaine de lenergie poss`edent au moins
une composante economique (minimisation de lenergie consommee). Cette composante est
generalement une fonction lineaire des variables de decision. Pour un syst`eme de chauf-
fage electrique, les depenses sont proportionnelles `a lenergie electrique consommee par le
poste de chauage. Dans le cadre de la commande predictive, ces objectifs economiques
sont usuellement remplaces par des crit`eres quadratiques, comme on la vu au chapitre
precedent, en vertu des bonnes proprietes mathematiques de la programmation quadra-
tique [159].
Malgre cela, des performances meilleures en termes economiques peuvent etre obtenues
par des structures de controle predictif `a crit`ere lineaire. Lutilisation de la programma-
tion lineaire pour la resolution des probl`emes de commande optimale date du debut des
annees soixante [193, 151]. Ulterieurement, seuls peu dauteurs ont etudie des formula-
tions lineaires de crit`eres MPC, exprimes comme de sommes de normes l
1
ou de normes
l

. Mentionnons ici les travaux relativement recents de [159, 20, 82]. Les deux derniers
articles se sont concentres sur laspect reduction du temps de calcul en ligne, `a laide de
techniques de programmation lineaire multiparametriques. Dans notre cas, la formulation
dynamique du crit`ere (suite `a linclusion du prol doccupation) reduit linteret de lutili-
sation dune solution explicite. D`es lors, des solveurs ecaces doivent etre implantes sur
les controleurs an de calculer, `a chaque pas, la commande `a appliquer au syst`eme.
4.3 Contraintes locales
Dans cette partie, nous nous proposons detudier le comportement de trois structures
de commande predictive `a crit`ere de type norme l
1
pour la regulation de la temperature
dans un batiment multizone :
la structure decentralisee,
la structure distribuee,
la structure centralisee.
Les contraintes considerees dans cette partie portent uniquement sur les grandeurs de
commande locales. On reprend, dans les paragraphes suivantes, les notations utilisees au
chapitre precedent.
4.3.1 Denition du crit`ere
Considerons la fonction de co ut locale :
J
i
(k) =
i
(k) ( yyy
i
(k) www
i
(k))
1
+
i
(k)uuu
i
(k)
1
, (4.1)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
110 4. MPC lineaire multivariable pour la regulation thermique multizone
o` u la norme l
1
dun vecteur xxx R
n1
est denie comme la somme des valeurs absolues
de ses composantes : xxx
1
= |x
1
| +... +|x
n
|. Alors, chaque agent local minimise le crit`ere
(4.1) sous la contrainte :
000
N
u
1
uuu
i
(k) uuu
i
(k), (4.2)
qui specie les limitations sur la grandeur de commande locale. Dautres contraintes, sur les
variables dentree, de sortie ou sur les increments de la commande, peuvent etre egalement
ajoutees.
Dans la suite du manuscrit, nous faisons lhypoth`ese suivante :
Hypoth`ese 4.3.1 Les horizons de prediction sur la commande et sur la sortie sont les
memes pour tous les agents locaux, i.e. N
1,i
= N
1
, N
u,i
= N
u
, N
2,i
= N
2
, i N
s
1
.
Cette hypoth`ese est motivee par le fait que la puissance de chaue installee dans chaque
pi`ece est adaptee `a ses caracteristiques (dimensions, deperditions, localisation, etc.). Par
consequent, les durees de relance dans le pire des cas ne varient pas beaucoup dune pi`ece
`a lautre. Toutefois, le choix du param`etre N
2
est dicte par le temps de reponse le plus long
parmi tous les sous-syst`emes (zones). D u au comportement plus agressif de type dead-beat
de la commande predictive `a crit`ere lineaire, la reduction de la dimension de lhorizon de
prediction nengendre pas damelioration signicative au niveau des performances.
4.3.1.1 MPC lineaire decentralise
Lapproche decentralisee constitue la structure de commande la plus utilisee dans la
regulation thermique multizone. Chaque zone dispose dun controleur qui regule la tempe-
rature locale, en jouant sur la puissance locale de chaue. Les couplages thermiques entre
les zones adjacentes sont negliges. Ainsi, dans le mod`ele de commande, les temperatures
des zones voisines sont considerees egales `a la temperature locale.
`
A partir du mod`ele local (3.44) deni au paragraphe 3.4.1, le mod`ele local decouple
secrit comme suit :
_
xxx
i
(k + 1) = AAA
0,i
xxx
i
(k) +bbb
i
u
i
(k)
y
i
(k) = ccc
T
i
xxx
i
(k),
(4.3)
o` u la matrice AAA
0,i
est denie par (3.74).
Par lajout de N
u
+ 2N
2
variables auxiliaires, le probl`eme doptimisation local :
min
uuu
i
(k)
J
i
(k) (4.4)
sous la contrainte (4.2) peut etre pose sous la forme standard
2
dun programme lineaire
2. Un probl`eme de programmation lineaire est dit sous la forme standard lorsque toutes ses contraintes
sont des egalites et toutes ses variables de decision sont non-negatives.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.3. Contraintes locales 111
(PL) :
min
uuu

i
(k)

T
i
(k)uuu

i
(k)
s.c. GGG
0,i
uuu

i
(k) = ggg
0,i
(k)
uuu

i
(k) 000
(2N
u
+2N
2
)1
.
(4.5)
La nouvelle variable doptimisation uuu

i
(k) est obtenue en concatenant `a la sequence de
commandes futures, les variables auxiliaires, decrites ci dessous.
N
u
variables auxiliaires,
i
(k) R
N
u
1
, transforment les contraintes inegalite en
contraintes egalite. Seule la contrainte qui indique la limite superieure de la com-
mande est transformee en contrainte egalite, tandis que la limite inferieure, qui
designe la positivite de la variable de decision est implicite dans la formulation PL
standard.
2N
2
variables auxiliaires,
i
(k),
i
(k) R
N
2
1
, sont necessaires pour mettre sous
une forme lineaire le premier terme du crit`ere (4.1). Ces variables decrivent lecart
entre les sorties predites et les valeurs de consigne futures. Suite `a la positivite des
grandeurs de commande, le deuxi`eme terme du crit`ere (4.1) devient :
i
(k)uuu
i
(k)
1
=

T
i
(k)uuu
i
(k).
Suite aux remarques precedentes, le vecteur doptimisation augmente et son co ut as-
socie deviennent :
uuu

i
(k) =
_

_
uuu
i
(k)

i
(k)

i
(k)

i
(k)
_

_
,

i
(k) =
_

i
(k)
000
N
u
1

i
(k)111
N
2
1

i
(k)111
N
2
1
_

_
. (4.6)
La matrice et le vecteur qui denissent la contrainte egalite du probl`eme (4.5) ont les
formulations suivantes :
GGG
0,i
=
_
III
N
u
III
N
u
000
N
u
N
2
000
N
u
N
2

0,i
000
N
2
N
u
III
N
2
III
N
2
_
, ggg
0,i
(k) =
_
uuu
i
(k)
www
i
(k)
0,i
xxx
0,i
(k)
_
, (4.7)
avec :

0,i
=
_

0,i
(0) 0 0

0,i
(1)
0,i
(0) 0 0
.
.
.
.
.
.
.
.
.

.
.
.

0,i
(N
2
1)
0,i
(N
2
N
u
+ 1)

N
2
N
u
j=0

0,i
(j)
_

_
, (4.8)

0,i
=
_

_
ccc
T
i
AAA
0,i
ccc
T
i
AAA
2
0,i
.
.
.
ccc
T
i
AAA
N
2
0,i
_

_
,
i
(k) = diag{
i
(k)},
0,i
(j) = ccc
T
i
AAA
j
0,i
bbb
i
, j N
N
2
1
0
. (4.9)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
112 4. MPC lineaire multivariable pour la regulation thermique multizone
4.3.1.2 MPC lineaire centralise
Par opposition `a la structure decentralisee, la loi de commande centralisee calcule la
solution optimale du probl`eme doptimisation globale du syst`eme complet. Le regulateur
centralise dispose alors du mod`ele global, ainsi que de toute linformation collectee sur le
syst`eme entier. Il recoit egalement les prols doccupation et les valeurs de consigne de
toutes les pi`eces du batiment. Ce controleur central connat egalement les objectifs locaux
ainsi que les contraintes locales de toutes le zones.
Le mod`ele global de prediction employe par le MPC centralise :
_
xxx
g
(k + 1) = AAA
g
xxx
g
(k) +BBB
g
uuu
g
(k)
yyy
g
(k) = CCC
g
xxx
g
(k),
(4.10)
peut etre construit `a partir des mod`eles de zones couples (3.44). Les vecteurs detat,
de commande et de sortie, ainsi que les matrices qui decrivent le mod`ele global ont les
formulations suivantes :
xxx
g
(k) =
_

_
xxx
1
(k)
.
.
.
xxx
s
(k)
_

_
, uuu
g
(k) =
_

_
u
1
(k)
.
.
.
u
s
(k)
_

_
, yyy
g
(k) =
_

_
y
1
(k)
.
.
.
y
s
(k)
_

_
, (4.11)
AAA
g
=
_

_
AAA
1,1
AAA
1,s
.
.
.
.
.
.
.
.
.
AAA
s,1
AAA
s,s
_

_
, AAA
i,j
=
_

_
AAA
i
, si i = j,
eee
j,i
ccc
T
j
, si j H
i
,
000
n
i
n
j
, autrement,
(4.12)
BBB
g
= bloc-diag{bbb
1
, ..., bbb
s
}, CCC
g
= bloc-diag{ccc
T
1
, ..., ccc
T
s
}. (4.13)
Le probl`eme global doptimisation minimise la somme des crit`eres locaux sous les
contraintes locales de tous les sous-syst`emes. Il peut secrire alors comme suit :
min
uuu
1
(k),...,uuu
s
(k)

s
i=1
J
i
(k)
s.c. 000
N
u
1
uuu
i
(k) uuu
i
(k), i N
s
1
.
(4.14)
De mani`ere similaire au cas decentralise, on peut exprimer le probl`eme (4.14) sous la forme
PL standard :
min
uuu

(k)

T
(k)uuu

(k)
s.c. GGGuuu

(k) = ggg(k)
uuu

(k) 000
(2sN
u
+2sN
2
)1
,
(4.15)
avec les notations suivantes :
uuu

(k) =
_
uuu
T
(k)
T
(k)
T
(k)
T
(k)
_
T
, (4.16)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.3. Contraintes locales 113

(k) =
_

T
(k) 000
1sN
u
111
1sN
2
(k) 111
1sN
2
(k)
_
T
, (4.17)
uuu(k) =
_
uuu
T
g
(k) uuu
T
g
(k + 1) uuu
T
g
(k + N
u
1)
_
T
, (4.18)
(k) =
_

1
(k)
s
(k)
1
(k + N
u
1)
s
(k + N
u
1)
_
T
, (4.19)
uuu(k) =
_
u
1
(k) u
s
(k) u
1
(k + N
u
1) u
s
(k + N
u
1)
_
T
, (4.20)
www(k) =
_
w
1
(k) w
s
(k) w
1
(k + N
2
) w
s
(k + N
2
)
_
T
, (4.21)
(k) = diag{
1
(k + 1), ...,
s
(k + 1), ...,
1
(k + N
2
), ...,
s
(k + N
2
)}, (4.22)
GGG =
_
III
sN
u
III
sN
u
000
sN
u
sN
2
000
sN
u
sN
2
000
sN
2
sN
u
III
sN
2
III
sN
2
_
, ggg(k) =
_
uuu(k)
www(k) xxx
g
(k)
_
, (4.23)
=
_

_
CCC
g
AAA
g
CCC
g
AAA
2
g
.
.
.
CCC
g
AAA
N
2
g
_

_
, =
_

_
(0) 0 0
(1) (0) 0 0
.
.
.
.
.
.
.
.
.

.
.
.
(N
2
1) (N
2
N
u
+ 1)

N
2
N
u
j=0
(j)
_

_
, (4.24)
(j) = CCC
g
AAA
j
g
BBB
g
, j N
N
2
1
0
. (4.25)
4.3.1.3 MPC lineaire distribue
La structure centralisee et la strategie compl`etement decentralisee representent deux
extremes du compromis entre les performances de controle, dune part, et la abilite, la
exibilite et leort de calcul, dautre part. Une structure qui permet une meilleure gestion
de ce compromis est representee par lapproche distribuee. Ainsi, les agents locaux mini-
misent des crit`eres locaux et echangent des informations concernant leur comportement
futur, permettant aussi dameliorer les performances globales du syst`eme par rapport `a la
strategie decentralisee.
Comme on la vu au chapitre precedent, lutilisation des mod`eles couples par les sorties
necessite de communiquer les sequences locales de sorties predites. Lapproche distribuee
presente de ce fait une structure decentralisee. De plus, un reseau de communication doit
etre ajoute, pour permettre lechange des informations entre les agents.
La formulation standard du probl`eme doptimisation local (4.4) pour le cas distribue
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
114 4. MPC lineaire multivariable pour la regulation thermique multizone
secrit alors :
min
uuu

i
(k)

T
i
(k)uuu

i
(k)
s.c. GGG
i
uuu

i
(k) = ggg
(l(k))
i
(k)
uuu

i
(k) 000
(2N
u
+2N
2
)1
,
(4.26)
avec
GGG
i
=
_
III
N
u
III
N
u
000
N
u
N
2
000
N
u
N
2

i
000
N
2
N
u
III
N
2
III
N
2
_
, (4.27)
ggg
(l(k))
i
(k) =
_
uuu
i
(k)
www
i
(k)
i
xxx
i
(k)

jH
i

j,i
yyy
(l(k))
j
(k)
_
, (4.28)
avec les notations introduites au paragraphe 3.4.2. Cest dans le vecteur deni par (4.28)
que se trouvent les sequences futures de sortie des zones voisines.
En se basant sur lalgorithme de cooperation 1 presente au paragraphe 3.4.4, on peut
formuler la procedure iterative `a executer par chaque agent i, `a tous les instants de temps,
qui est decrite dans lalgorithme 2. Suite `a lhypoth`ese 4.3.1, la structure de lalgorithme 2
est en fait un cas particulier de lalgorithme 1 (paragraphe 3.4.4), pour lequel les dimensions
des fenetres de prediction de tous les agents sont egales et constantes dans le temps. Ainsi,
lestimation et la transmission des valeurs predites du param`etre N
2,i
nest plus necessaire.
Algorithme 2 Procedure iterative de commande predictive distribuee `a crit`ere
lineaire
1 : Initialiser l(k) = l
0
(k)
2 : Mettre `a jour les variables locales xxx
i
(k), y
i
(k),
i
(k), www
i
(k)
3 : Calculer la sequence de commande optimale locale uuu
(l
0
(k))
i
(k) `a literation initiale
4 : Tant que (l(k) < l
max
ET yyy
(l(k))
i
(k) yyy
(l(k)1)
i
(k)

>
i
, i N
s
1
) faire
4.1 : Iteration suivante l(k) = l(k) + 1
4.2 : Construire yyy
(l(k))
i
(k)
4.3 : Envoyer yyy
(l(k))
i
(k) `a tous les agents j H
i
4.4 : Recevoir yyy
(l(k))
j
(k) de tous les agents j H
i
et met `a jour ggg
(l(k))
i
(k)
4.5 : Calculer la sequence de commande optimale locale uuu
(l(k))
i
(k), par la reso-
lution du probl`eme local (4.26)
Fait
5 : Appliquer la premi`ere composante de uuu
(l(k))
i
(k) au sous-syst`eme local i
6 : Construire yyy
(l
0
(k+1))
i
(k)
7 : Envoyer yyy
(l
0
(k+1))
i
(k) `a tous les agents j H
i
8 : Recevoir yyy
(l
0
(k+1))
j
(k) de tous les agents j H
i
et met `a jour ggg
(l
0
(k+1))
i
(k)
9 : Mettre `a jour k = k + 1 et retour au pas 1
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.3. Contraintes locales 115
4.3.2 Resultats de simulation
Pour illustrer les ameliorations sur les performances apportees par lutilisation dun
crit`ere lineaire de type norme l
1
, nous reprenons le mod`ele du batiment presente au para-
graphe 3.4.6.
An de pouvoir calculer la commande par le biais de la programmation lineaire, letat
du syst`eme est estime `a laide dun observateur predicteur de type Luenberger. Il
utilise les vecteurs dentrees et de sorties de linstant k 1 pour predire letat `a linstant k.
Dans le cadre de la commande predictive `a crit`ere lineaire, le choix du gain de lobservateur
peut avoir un impact plus important sur le comportement du regulateur (par rapport au
MPC quadratique). Les erreurs de modelisation, ainsi que lapport des perturbations, sont
amplies par un observateur rapide. Lagressivite des controleurs predictifs presentes aux
paragraphes precedents peut degenerer en une commande tr`es oscillante. Les gains des
observateurs pour les trois structures de commande ont ete choisis an de placer les poles
des observateurs trois fois plus rapides que les poles des mod`eles de prediction.
0 10 20 30 40
0
20
40
60
80
100
120
140
160
180


0 10 20 30 40
0
2
4
6
8
10
12


I
c
[
o
C
h
]
E
c
[
k
W
h
]

i
DeMPCL
DeMPCL
CMPCL
CMPCL
DiMPCL
DiMPCL
Figure 4.1 Inuence du param`etre de ponderation
i
sur les indices de performance
Certains auteurs [159] ont rapporte le fait que la commande predictive `a crit`ere lineaire
presente, en fonction du choix des termes de ponderations pour lerreur et pour la com-
mande, soit un comportement de type idle (commande nulle), soit un comportement
de type dead-beat . La gure 4.1 met en evidence ce phenom`ene, en illustrant les
performances des trois structures de commande predictives (MPC lineaire decentralise -
DeMPCL, MPC lineaire centralise - CMPCL et MPC lineaire distribue - DiMPCL) en fonc-
tion de la ponderation sur la commande,
i
. Les valeurs des indices de performance sont
obtenues sur une journee de simulation, avec le prol doccupation decrit par le Scenario 4
(paragraphe 3.4.6.2). Dans la gure 4.1 droite on observe qu`a partir dune certaine valeur
de
i
, la consommation devient nulle, ce qui correspond au contr ole idle. Pour les valeurs de

i
dont on obtient E
c
= 0kWh, lindice de confort atteint son maximum denviron 180
o
Ch.
Cette valeur de lindice de confort correspond (pour le prol doccupation considere) `a un
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
116 4. MPC lineaire multivariable pour la regulation thermique multizone
ecart moyen de 8,18
o
C entre la valeur de consigne et la temperature mesuree pendant une
journee.
Une caracteristique importante de la commande de type dead-beat est le temps de
reponse minimal [82]. Ceci constitue le principal avantage de la loi MPC `a crit`ere l
1
par
rapport `a une commande `a crit`ere quadratique. La gure 4.2 illustre le comportement des
lois de commande predictives distribuees `a crit`ere lineaire (DiMPCL) et respectivement `a
crit`ere quadratique (DiMPCHC). Dans les deux cas, les param`etres de reglage speciques `a
la commande predictive sont identiques, N
u
= N
2
= 10, `a lexception de
i
qui a ete choisi
pour que les performances en termes de confort des deux commandes soient similaires.
0 24 48 72 96 120 144 168 192
5
10
15
20
25
0 24 48 72 96 120 144 168 192
0
0.5
1


0 24 48 72 96 120 144 168 192
0
20
40
60
80


0 24 48 72 96 120 144 168 192
0
10
20
30
e


a
b
d
I
c
[
o
C
h
]
E
c
[
k
W
h
]
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
P
u
i
s
s
a
n
c
e
e
l
e
c
t
r
i
q
u
e
[

1
,
2
k
W
]
Temps [h]
u1 : DiMPCL
u2 : DiMPCL
u3 : DiMPCL
u1 : DiMPCHC
u2 : DiMPCHC
u3 : DiMPCHC
DiMPCL
DiMPCL
DiMPCHC
DiMPCHC
Figure 4.2

Evolution temporelle des signaux de sortie (a) et de commande (b) et des
indicateurs de performance (c et d) pour les huit premiers jours de lannee
On peut observer que par lemploi dun crit`ere de type norme l
1
, la periode de relance
varie en fonction de letat du syst`eme, tandis que pour une loi de commande quadratique,
comme celle denie au chapitre precedent, la duree de la relance est toujours egale `a la
dimension de lhorizon de prediction. Naturellement, lutilisation des regulateurs lineaires
engendrent des pics de consommation avant les debuts des periodes doccupation. Si ce
phenom`ene sav`ere etre un inconvenient, il peut etre reduit par la diminution de la borne
superieure de la commande uuu(k). Du point de vue quantitatif, les sous-gures 4.2c et
4.2d montrent levolution des indicateurs globaux de performance pour les deux strategies
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.3. Contraintes locales 117
distribuees. On observe une leg`ere amelioration, au niveau des deux indices, apportee par
lemploi du crit`ere avec norme l
1
.
Scenario
Loi de commande
I
c
[
o
Ch] E
c
[kWh]
Type Specicite
1
DiMPCHC

i
= 5, l
max
= 1 207,30 174,07

i
= 5, l
max
= 2 199,84 173,68

i
= 5, l
max
= 3 199,67 173,66
DiMPCL

i
= 1, l
max
= 1 197,28 171,58

i
= 1, l
max
= 2 190,44 171,26

i
= 1, l
max
= 3 190,42 171,26
DeMPCL
i
= 1 221,89 166,11
CMPCL
i
= 1 191,42 175,36
2
DiMPCHC

i
= 5, l
max
= 1 125,60 227,47

i
= 5, l
max
= 2 120,66 227,22

i
= 5, l
max
= 3 120,61 227,19
DiMPCL

i
= 1, l
max
= 1 119,70 219,04

i
= 1, l
max
= 2 114,04 218,91

i
= 1, l
max
= 3 113,99 218,91
DeMPCL
i
= 1 229,55 207,34
CMPCL
i
= 1 104,96 222,09
3
DiMPCHC

i
= 5, l
max
= 1 747,64 248,40

i
= 5, l
max
= 2 724,36 247,32

i
= 5, l
max
= 3 724,17 247,32
DiMPCL

i
= 1, l
max
= 1 745,29 240,47

i
= 1, l
max
= 2 720,45 239,64

i
= 1, l
max
= 3 720,45 239,63
DeMPCL
i
= 1 856,65 248,37
CMPCL
i
= 1 741,16 242,62
4
DiMPCHC

i
= 5, l
max
= 1 396,38 217,63

i
= 5, l
max
= 2 379,94 217,20

i
= 5, l
max
= 3 379,79 217,18
DiMPCL

i
= 1, l
max
= 1 365,92 210,37

i
= 1, l
max
= 2 350,95 210,20

i
= 1, l
max
= 3 350,95 210,19
DeMPCL
i
= 1 472,75 212,25
CMPCL
i
= 1 335,59 213,46
Table 4.1 Resultats comparatifs entre les structures predictives `a crit`ere lineaire par
rapport `a la structure distribuee `a crit`ere quadratique pour les quatre scenarios doccupa-
tion, avec les param`etres : N
u,i
= N
2,i
= 10,
i
= 0, i N
3
1
Ensuite nous nous proposons de comparer les performances des trois structures predic-
tives `a crit`ere lineaire, dont les schemas-bloc de ces strategies de commande sont illustres
gures 4.3, 4.4 et respectivement 4.5. De plus, nous avons egalement ajoute les resultats
obtenus par la commande distribuee `a crit`ere quadratique, avec un horizon de prediction
constant (DiMPCHC), pour pouvoir les comparer `a ce qui a ete fait auparavant. Les
resultats sont synthetises dans le tableau 4.1.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
118 4. MPC lineaire multivariable pour la regulation thermique multizone
Il apparat clairement que le meilleur compromis, pour le cas distribue, entre leort de
calcul et les performances de controle est donne par lutilisation de deux iterations. Ceci
est valable pour les deux types de crit`ere. Les gains relatifs du DiMPCL par rapport au
DiMPCHC sel`event `a 7,6 % pour le confort et 3,8 % concernant leconomie de lenergie.
Sachant que par le choix de la variable
i
, le confort est prioritaire `a la consommation, la
structure decentralisee ore des performances nettement inferieures, i.e. des degradations
au niveau du confort de 14 % `a 50 %, par rapport au DiMPCL. Les resultats obtenus
par lutilisation du controleur centralise peuvent paratre surprenants, surtout pour les
scenarios 1 et 3. Meme si, du point de vue du crit`ere global doptimisation, CMPCL ore
la solution optimale, elle nest pas forcement la meilleure par rapport aux indicateurs de
performance, mesures a posteriori. En revanche, pour les scenarios 2 et 4, on observe des
ameliorations au niveau de confort engendrees par le CMPC.
u
1
u
2
u
3
MPC
y
1
y
2
y
3
Observateur
T
ext

www
xxx

uuu
Figure 4.3 Schema-bloc de controle centralise pour le batiment trois-zones

1
,
1
, www
1
, uuu
1

2
,
2
, www
2
, uuu
2

3
,
3
, www
3
, uuu
3
u
1
u
2
u
3
y
1
y
2
y
3
Observateur
1
xxx
1
MPC
2
MPC
3
MPC
1
Observateur
2
Observateur
3
xxx
2
xxx
3
T
ext
Figure 4.4 Schema-bloc de controle decentralise pour le batiment trois-zones
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 119
yyy
1
yyy
3

2
,
2
, www
2
, uuu
2

3
,
3
, www
3
, uuu
3
u
1
u
2
u
3
y
1
y
2
y
3
Observateur
1
xxx
1
MPC
2
MPC
3
MPC
1
Observateur
2
Observateur
3
xxx
2
xxx
3
yyy
2

1
,
1
, www
1
, uuu
1
T
ext
Figure 4.5 Schema-bloc de controle distribue pour le batiment trois-zones
Compte tenu de ces remarques et des resultats presentes tableau 4.1 on peut conclure
que DiMPCL ore de meilleurs resultats en termes de confort et de consommation que
son equivalent quadratique.
4.4 Contraintes couplees
Une solution pour reduire la facture energetique, pour les batiments chaues par des
syst`emes electriques, peut etre la diminution de la puissance maximale souscrite. Elle
correspond `a la puissance mise `a disposition par le distributeur. La puissance souscrite est
etablie en accord avec le client an de repondre aux besoins reels de lutilisateur (chauage,
eclairage, autres equipements electriques) mais egalement `a la fa con dont lelectricite est
utilisee (pendant les heures de la journee, jours de la semaine, saisons, etc.), autrement
dit, au prol doccupation et aux habitudes des usagers. Lutilisateur a donc tout interet `a
diminuer les pics de sa demande delectricite, car ce sont eux qui determinent la puissance
maximale necessaire. En r`egle generale, cette puissance est calee sur la prevision de la
valeur maximale de la puissance atteinte pendant lannee.
Sachant que le syst`eme de chauage represente, en France et en Europe, le plus impor-
tant poste de consommation dans un immeuble, en periode de forte demande de chauage
la puissance absorbee par letablissement peut etre superieure `a la puissance souscrite.
Usuellement, le depassement de cette puissance est tolere, dans la mesure o` u elle nexc`ede
pas un certain pourcentage de la puissance maximale souscrite. Cependant, une facturation
dune penalite est appliquee sur le nombre de kWh en depassement.
Neanmoins, il est possible de souscrire `a des puissances maximales dierentes selon
les periodes tarifaires horo-saisonni`eres (Pointe, Heures Pleines dHiver - HPH, Heures
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
120 4. MPC lineaire multivariable pour la regulation thermique multizone
Creuses dHiver - HCH, Heures Pleines Demi-Saison - HPD, Heures Creuses Demi-Saison
- HCD, Heures Pleines dEte - HPE, Heures Creuses dEte - HCE, Juillet-Ao ut - JA). De
plus, avec le developpement des reseaux electriques intelligents (smart grid), la variation
du prix du kWh pourrait etre encore plus ne. Elle pourrait ainsi dependre egalement de
la puissance absorbee par le batiment.
Dans un environnement de controle optimal, cette puissance souscrite agit comme une
contrainte de couplage sur les grandeurs de commande locales. Les controleurs classiques
de type PI et tout-ou-rien ne peuvent pas gerer cette contrainte de couplage autrement
quen la divisant en contraintes locales. Cette solution simple est pourtant loin detre
optimale.
Dans les paragraphes suivants, nous proposons lutilisation dun algorithme distribue
base sur la technique de decomposition de Dantzig-Wolfe [44]. Elle permet la prise en
compte dune contrainte de couplage, tout en gardant la structure distribuee de la loi de
commande. Le prix `a payer pour la prise en compte de cette contrainte dune mani`ere
optimale est lapparition dun agent coordonnateur qui doit communiquer avec tous les
controleurs locaux dont les variables sont couplees par une contrainte.
4.4.1 Denition du crit`ere
Lors du paragraphe 4.3.2, on a observe les ameliorations au niveau de la consommation,
engendrees par lutilisation dune fonction de co ut lineaire par rapport `a une fonction de
co ut quadratique. Pour les deux crit`eres, le confort est deni par une temperature de
consigne. Lecart entre la temperature predite et la consigne future est dieremment prise
en compte (penalite lineaire et respectivement quadratique). La subjectivite de la notion de
confort thermique nimplique pas une temperature de confort stricte. Une denition dune
bande de temperature de confort ore plus de degres de liberte au syst`eme de pilotage,
et en meme temps se rapproche des denitions du confort thermique proposees dans les
standards internationaux (ISO 7730 et 55-2004 de ASHRAE).
Dans la suite du manuscrit le confort thermique de chaque zone i sera deni par une
bande de temperature, delimitee par une borne inferieure w
i
et une borne superieure w
i
.
Ces deux limites peuvent etre xes, calculees en fonction des autres facteurs (humidite,
PMV, PPD, etc.) ou reglees par les utilisateurs. En favorisant le confort ainsi deni, on
peut lintegrer dans les contraintes du probl`eme doptimisation de la loi predictive, qui
devient alors :
min
uuu
i
(k),...,uuu
s
(k)
J(k) =
s

i=1

T
i
(k)uuu
i
(k) (4.29a)
s.c.
000
N
u
1
uuu
i
(k) uuu
i
(k), i N
s
1
, (4.29b)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 121
s

i=1
uuu
i
(k) uuu
t
(k), (4.29c)

i
(k)(www
i
(k) yyy
i
(k)) 000
N
2
1
, i N
s
1
,

i
(k)( yyy
i
(k) www
i
(k)) 000
N
2
1
, i N
s
1
,
(4.29d)
o` u uuu
t
(k) represente la sequence future des puissances globales maximales.
Linegalite (4.29c) represente la contrainte de couplage, tandis que les inegalites (4.29d)
determinent le confort thermique. En prenant en compte le prol doccupation de chaque
zone, les contraintes de confort deviennent dynamiques, dans le sens o` u elles disparaissent
pendant les periodes dinoccupation (voire gure 4.6).
Temps
k
N
2
y
i
y
i

i
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
w
i
w
i
1
0
Figure 4.6 Prol doccupation et limites de confort dans le cadre de la commande
predictive
Suite `a la formulation (4.29), le confort thermique est integre dans le PL comme des
contraintes dures. Si, `a un instant donne, une de ces contraintes ne peut pas etre sa-
tisfaite, le probl`eme doptimisation devient infaisable. Dans la pratique, pour eviter cet
inconvenient, les contraintes sont relaxees, par lajout dune penalite dans la fonction de
co ut, quand elles ne sont pas satisfaites. Ainsi, on peut reformuler le probl`eme relaxe sous
la forme :
min
uuu
i
(k),...,uuu
s
(k)
J(k) =
s

i=1
_
_

T
i
(k)uuu
i
(k) +
N
2

j=1
f
i
(k + j)
_
_
, (4.30)
sous les contraintes (4.29b) et (4.29c). La fonction locale de penalite f
i
est :
f
i
(k + j) =
_

_
0, si
i
(k + j) 0 et
i
(k + j) 0

i
(k + j), si
i
(k + j) > 0

i
(k + j), si
i
(k + j) > 0,
(4.31)
avec les notations

i
(k + j) =
i
(k + j)(w
i
(k + j) y
i
(k + j|k)),

i
(k + j) =
i
(k + j)( y
i
(k + j|k) w
i
(k + j)).
(4.32)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
122 4. MPC lineaire multivariable pour la regulation thermique multizone
Le choix de cette fonction de penalite (illustree gure 4.7) preserve la structure lineaire du
probl`eme doptimisation, meme si elle peut etre consideree comme ane par morceaux.
Lors du paragraphe suivant, on verra que par un choix judicieux des variables auxiliaires,
le PL (4.30) peut etre reformule sous la forme standard lineaire. Le param`etre
i
traduit
limportance relative du confort par rapport au co ut energetique.
f
i
0
w
i
w
i
y
i

i
= 1

i
w
i
Figure 4.7 Allure de la fonction de penalite
4.4.2 Mod`ele de prediction decouple
Prenons tout dabord le cas du mod`ele decouple (4.3), en considerant que les temperatures
des zones adjacentes sont egales `a la temperature de la zone locale.
4.4.2.1 Formalisation du probl`eme global
Apr`es quelques manipulations, le probl`eme doptimisation global (4.30) peut etre ex-
prime sous la forme PL standard :
min
zzz(k),uuu

1
(k),...,uuu

s
(k)

T
1
(k)uuu

1
(k) + +
T
s
(k)uuu

s
(k)
s.c. HHH
0
zzz(k) + HHH
1
uuu

1
(k) + + HHH
s
uuu

s
(k) = uuu
t
(k)
GGG

0,1
uuu

1
(k) = ggg

0,1
(k)
.
.
.
.
.
.
GGG

0,s
uuu

s
(k) = ggg

0,s
(k)
zzz(k) 000
N
u
1
, uuu

1
(k) , , uuu

s
(k) 000
(2N
u
+4N
2
)1
,
(4.33)
avec les notations suivantes :
uuu

i
(k) =
_
uuu
T
i
(k)
T
i
(k)
T
1,i
(k)
T
2,i
(k)
T
1,i
(k)
T
2,i
(k)
_
T
, (4.34)

i
(k) =
_

T
i
(k) 000
1N
u
000
1N
2

i

T
i
(k) 000
1N
2

i

T
i
(k)
_
T
, (4.35)
HHH
0
= III
N
u
, HHH
i
=
_
III
N
u
000
N
u
N
u
+4N
2
_
, i N
s
1
, (4.36)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 123
GGG

0,i
=
_

_
III
N
u
III
N
u
000
N
u
N
2
000
N
u
N
2
000
N
u
N
2
000
N
u
N
2

0,i
000
N
2
N
u
III
N
2
III
N
2
000
N
2
N
2
000
N
2
N
2

0,i
000
N
2
N
u
000
N
2
N
2
000
N
2
N
2
III
N
2
III
N
2
_

_
, (4.37)
ggg

0,i
(k) =
_

_
uuu
i
(k)
www
i
(k) +
0,i
xxx
i
(k)
www
i
(k)
0,i
xxx
i
(k)
_

_
. (4.38)
La mise sous la forme PL standard du probl`eme (4.30) est realisee par lajout de :
N
u
variables auxiliaires, zzz(k) R
N
u
1
, necessaires pour reecrire la contrainte (4.29c)
sous la forme de contrainte egalite,
sN
u
variables auxiliaires,
i
(k) R
N
u
1
, i N
s
1
, an de transformer la deuxi`eme
inegalite de la contrainte (4.29b) en contrainte egalite et
4sN
2
variables auxiliaires comprises dans
T
1,i
(k),
T
2,i
(k),
T
1,i
(k),
T
2,i
(k) R
N
2
1
,
i N
s
1
, necessaires pour mesurer lecart entre les valeurs predites de la temperature
locale et les sequences futures qui denissent les limites de confort.
Le nombre de variables doptimisation du PL (4.33) est proportionnel au nombre de
sous-syst`emes, s, tandis que le nombre de contraintes depend des param`etres de reglage
N
u
et N
2
.
Remarque 4.4.1 En fonction des prols doccupation locaux, certaines composantes des
vecteurs
T
1,i
(k),
T
2,i
(k),
T
1,i
(k),
T
2,i
(k) ne sont pas necessaires, quand la fenetre de prediction
locale inclut des instants dinoccupation. Ainsi, dans une implantation ecace de lalgo-
rithme, les dimensions de la matrice de contraintes sont variables, en fonction des prols
doccupation.
Dans la pratique de la regulation thermique des batiments, on rencontre des probl`emes
qui peuvent atteindre plusieurs milliers dequations et / ou dinconnues. Malgre le fait
que cette complexite de calcul ne represente pas un inconvenient majeur pour les solveurs
tr`es performants existants sur le marche, les regulateurs employes pour le controle de la
temperature sont generalement implantes sur des microcontroleurs `a faible puissance de
calcul. Ainsi, pour resoudre ces probl`emes de grande taille, lutilisation de certaines tech-
niques de decomposition sav`ere opportune ou meme necessaire, pour des raisons tech-
niques ou pratiques. Les methodes de decomposition permettent, pour certains types de
probl`emes, la construction dun algorithme distribue qui converge vers la solution optimale
souhaitee.
Lecacite des techniques de decomposition depend de la structure du probl`eme dop-
timisation [39]. Pour la programmation lineaire, deux cas surviennent frequemment dans
la pratique : les contraintes couplantes et les variables couplantes. Le premier est traite lors
des paragraphes suivants, tandis que le deuxi`eme sera analyse au chapitre 5 du memoire.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
124 4. MPC lineaire multivariable pour la regulation thermique multizone
4.4.2.2 Methode de decomposition de Dantzig-Wolfe
La methode de decomposition de Dantzig-Wolfe (D-W) permet dexprimer un PL
comme un ensemble de sous-probl`emes de dimensions reduites. Ces sous-probl`emes sont
relies entre eux par une contrainte lineaire dite compliquante ou couplante . Re-
soudre le probl`eme de depart qui contient un tr`es grand nombre de variables, revient alors
`a resoudre plusieurs probl`emes de tailles reduites. Le prix `a payer pour cette simplica-
tion est la repetition. Ainsi, au lieu de resoudre le probl`eme original, deux probl`emes sont
resolus de mani`ere iterative :
un probl`eme matre, qui comporte toutes les variables du probl`eme original et uni-
quement la contrainte compliquante, et
un probl`eme similaire au probl`eme original, mais sans la contrainte compliquante,
appele le probl`eme relaxe.
Cette procedure iterative permet la prise en compte de mani`ere progressive des contraintes
compliquantes. De plus, elle atteint loptimum en un nombre ni diterations [43].
Malgre le fait que la methode de decomposition D-W peut etre appliquee `a tous les
probl`emes doptimisation lineaires, elle est particuli`erement ecace pour les PL dont la
matrice de contraintes a une structure particuli`ere, appelee bloc-angulaire primale. Ainsi,
le probl`eme relaxe peut etre resolu par blocs, etant structurellement decomposable.
Denition 4.4.1 Une matrice AAA est appelee bloc-angulaire primale si sa structure a
la forme suivante :
AAA =
_

_
AAA
0,1
AAA
0,2
AAA
0,n
AAA
1,1
000 000
000 AAA
2,2
000
.
.
.
000 000 AAA
n,n
_

_
. (4.39)
La technique de decomposition de Dantzig-Wolfe est basee sur le theor`eme de com-
binaison convexe et sur des techniques de generation de colonnes. Ainsi, nous presentons
ci-dessous quelques denitions necessaires `a la formulation du theor`eme de combinaison
convexe.
Denition 4.4.2 Soient n points {xxx
1
, ..., xxx
n
}. On appelle combinaison conique (ou
combinaison lineaire non negative) de ces points, les points xxx tels que :
xxx =
n

j=1

j
xxx
j
,
j
0, j N
n
1
. (4.40)
Denition 4.4.3 Soient n points {xxx
1
, ..., xxx
n
}. On appelle combinaison convexe de ces
points, les points xxx tels que :
xxx =
n

i=1

i
xxx
i
,
n

i=1

i
= 1,
i
0, i N
n
1
. (4.41)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 125
Denition 4.4.4 Un point ppp
i
inclus dans un ensemble convexe X qui ne peut pas etre
decrit par une combinaison convexe des autres points de X est appele sommet (ou un
point extreme).
Denition 4.4.5 Soit un point rrr X. Le rayon genere par rrr est lensemble de points
{xxx|xxx = rrr, (0, +)}.
Dans la suite du manuscrit nous utiliserons, par abus de notation, le point rrr pour
denoter le rayon genere selon la denition 4.4.5. Ainsi, un rayon rrr peut etre vu comme une
direction innie sur laquelle toutes les solutions du poly`edre non borne X sont realisables.
Denition 4.4.6 Un rayon extremal dun ensemble convexe X est le rayon qui ne peut
pas sexprimer par une combinaison convexe de rayons de X.
Theor`eme 4.4.1 (de Minkowski) Tous les points appartenant au poly`edre convexe X =
{xxx|Ax Ax Ax = bbb, xxx 000} peuvent etre representes comme une combinaison convexe de lensemble
ni de ses sommets et une combinaison conique de lensemble ni de ses rayons extremaux.
Selon le theor`eme 4.4.1, chaque point xxx appartenant au poly`edre X peut etre represente
sous la forme suivante :
xxx =
d

i=1

i
ppp
i
+
e

j=1

j
rrr
j
,
d

i=1

i
= 1,

i
0, i N
d
1
,

j
0, j N
e
1
,
(4.42)
o` u {ppp
i
}
iN
d
1
est lensemble ni de tous les points extremes et {rrr
i
}
iN
e
1
represente lensemble
ni de tous les rayons extremaux du poly`edre X.
Apr`es ce rappel des notions, nous revenons au probl`eme de programmation lineaire issu
de la formulation du crit`ere MPC. Pour la presentation de la methode de decomposition
de Dantzig-Wolfe, reprenons le PL (4.33) dont, pour la simplicite des notations, nous
omettrons la dependance des variables vis-` a-vis de linstant de temps k. Alors, le probl`eme
considere par (4.33) est decrit par :
min
zzz,uuu

1
,...,uuu

T
1
uuu

1
+ +
T
s
uuu

s
s.c. HHH
0
zzz + HHH
1
uuu

1
+ + HHH
s
uuu

s
= uuu
t
GGG

0,1
uuu

1
= ggg

0,1
.
.
.
.
.
.
.
.
.
GGG

0,s
uuu

s
= ggg

0,s
zzz 000
N
u
1
, uuu

1
, , uuu

s
000
(2N
u
+4N
2
)1
.
(4.43)
Puisque la premi`ere contrainte du probl`eme (4.43) comporte toutes les variables de
decision, empechant ainsi une solution par blocs, elle constitue la contrainte compliquante
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
126 4. MPC lineaire multivariable pour la regulation thermique multizone
du PL. Le probl`eme relaxe est alors deni par (4.43) dont on elimine la premi`ere contrainte
egalite : HHH
0
zzz +HHH
1
uuu

1
+ +HHH
s
uuu

s
= uuu
t
.
Suite `a la structure bloc-angulaire de la matrice de contraintes, le domaine admissible
de chaque variable doptimisation locale uuu

i
est deni par le poly`edre U
0,i
= {uuu

i
|GGG

0,i
uuu

i
=
ggg

0,i
, uuu

i
000
(2N
u
+4N
2
)1
}. Selon le theor`eme de Minkowski, uuu

i
peut sexprimer comme
suit :
uuu

i
=
d
i

j=1

i,j
ppp
i,j
+
e
i

j=1

i,j
rrr
i,j
,
d
i

i=1

i,j
= 1,
i,j
,
i,j
0, j N
d
i
1
, i N
s
1
, (4.44)
o` u d
i
represente le nombre de sommets et e
i
le nombre de rayons extremaux du poly`edre
U
0,i
.
En reportant (4.44) dans (4.43), on peut formuler le probl`eme matre (PM) :
min
zzz,
i,j
,
i,j
s

i=1

T
i
_
_
d
i

j=1
ppp
i,j

i,j
+
e
i

j=1
rrr
i,j

i,j
_
_
(4.45a)
sous les contraintes
HHH
0
zzz +
s

i=1
HHH
i
_
_
d
i

j=1
ppp
i,j

i,j
+
e
i

j=1
rrr
i,j

i,j
_
_
= uuu
t
: , (4.45b)
d
i

j=1

i,j
= 1 :
i
, i N
s
1
, (4.45c)
zzz 000
N
u
1
,
i,j
,
i,j
0. (4.45d)
o` u R
N
u
et
i
R sont les solutions duales
3
(multiplicateurs du Simplexe) correspon-
dantes au contraintes (4.45b) et (4.45c), respectivement. Le probl`eme matre resultant a
moins de contraintes que le probl`eme original (4.43), mais un nombre de colonnes beau-
coup plus important en raison dune augmentation du nombre de variables. Ces variables
sont associees `a tous les points extremes et `a tous les rayons extremaux de U
0,i
. La solution
du probl`eme relaxe peut etre obtenu par la resolution par blocs de chaque sous-probl`emes
(SP
i
) :
min
uuu

T
i
uuu

i
, (4.46a)
sous les contraintes
GGG

i
uuu

0,i
= ggg

0,i
, (4.46b)
uuu

i
000
(2N
u
+4N
2
)1
. (4.46c)
3. Des generalites sur la dualite en programmation lineaire sont donnees en Annexe B.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 127
Pour la resolution du PM, en utilisant la methode du Simplexe par exemple, il est
necessaire de proceder par generation de colonnes an de nexpliciter reellement quun
sous-ensemble de sommets et de rayons extremaux, ceux susceptibles dintervenir dans
la solution optimale. Ainsi, la solution optimale du probl`eme (4.43) est obtenue par la
resolution iterative dun probl`eme matre restreint (PMR) construit de mani`ere dyna-
mique. Un sous-ensemble initial de sommets et de rayons extremaux peut etre calcule par
la resolution (en parall`ele) de tous les sous-probl`emes (4.46) mais en utilisant des co uts

T
i
dierents (choisis arbitrairement), an dobtenir des sommets et / ou des rayons extremaux
distincts.
Remarque 4.4.2 Le choix de mani`ere arbitraire de co uts

T
i
, pendant la phase de gene-
ration dun ensemble initial de solutions locales (sommets et / ou rayons extremaux) ne
garantit pas la faisabilite du PMR, autrement dit lexistence de
i,j
,
i,j
positifs, tels que
(4.45b) et (4.45c) soient satisfaites. Il nexiste pas de r`egle generale pour choisir les co uts
locaux tels que le PMR construit avec la base ainsi obtenue soit faisable. Pourtant, an
deviter linfaisabilite du PMR, des strategies de relaxation sont proposees [39]. Cependant,
la particularite du probl`eme doptimisation (4.43) rend possible un choix qui garantit la
faisabilite du PMR.
Proposition 4.4.1 Les solutions des sous-probl`emes (4.46), dont le vecteur de co ut est
deni par

i
=
_

T
i
000
1N
u
000
1N
2
000
1N
2
000
1N
2
000
1N
2
_
T
, (4.47)
conjuguees `a des solutions obtenues en utilisant des co uts choisis arbitrairement constituent
une base de colonnes initiales qui rend le PMR faisable.
Preuve

Etant donnees les specicites du PM et des SP
i
, lutilisation des vecteurs de co ut
locaux denis par (4.47) implique uuu
i
= 000
N
u
1
. Sachant que la contrainte couplante lie
uniquement les premi`eres N
u
composantes des solution locales et quelle est la relaxation
dune contrainte inegalite, speciant une limite superieure positive de la somme de ces
composantes, alors
i,1
= 1,
i,j
=
i,j
= 0, j 2, tel que (4.45c) et (4.45d) representent
une solution faisable du PM.
Supposant que lon dispose dun ensemble initial de sommets et de rayons extremaux,
et que la solution du PMR soit unique, alors par la resolution du probl`eme (4.45) on
dispose egalement des multiplicateurs du Simplexe (solutions duales), notes dans (4.45)
par et
i
. La solution optimale du PMR est egalement optimale pour PM si et seulement
si tous les points extremes et tous les rayons extremaux du domaine U =
iN
s
1
U
0,i
, qui
ninterviennent pas dans PMR, ne participent pas `a la solution optimale de PM. Pour
le savoir, il sut de calculer les co uts reduits des variables nintervenant pas dans PMR.
Ainsi, le co ut reduit associe `a la variable
i,j
ou
i,j
est :
f
i,j
=
_

T
i
HHH
i
_
ppp
i,j

i
. (4.48)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
128 4. MPC lineaire multivariable pour la regulation thermique multizone
Pour le calcul des co uts reduits, les sous-probl`emes SP
i
sont modies comme suit :
min
uuu

i
_

T
i
HHH
i
_
uuu

i
, (4.49)
sous les contraintes (4.46b) et (4.46c). Notons que la modication apportee aux sous-
probl`emes est mineure et vise uniquement leur crit`ere. Une fois les solutions de tous les
sous-probl`emes (4.49) obtenues, on peut decider si le nouveau sommet ou rayon extremal
de U permet dameliorer la solution courante du PMR. Ceci se fait comme suit :
si toutes les variables restantes ont un co ut reduit positif, i.e.
min
i,j
f
i,j
= min
i
_

T
i
HHH
i
_
uuu

i

i
0, (4.50)
alors la solution optimale de PMR est egale `a la solution optimale de PM
sil existe une ou plusieurs variables avec un co ut reduit strictement negatif, alors la
solution optimale du PMR nest pas optimale pour PM, ainsi une ou plusieurs de
ces variables doivent etre ajoutees au sous-ensemble de points du PMR.
Les deux tests permettent de verier si la solution courante du probl`eme matre res-
treint concide `a la solution du PM et donc `a la solution du probl`eme initial. Souvent, dans
la pratique, il nest pas forcement necessaire de faire le calcul exact de la solution optimale.
La methode de decomposition DW nous permet dobtenir facilement les bornes courantes
(superieure et inferieure) de loptimum. Ainsi, `a chaque iteration l
DW
de lalgorithme, les
deux limites courantes de loptimum global du probl`eme PM sont :
J
(l
DW
)
=
s

i=1

T
i
_
_
d
i

j=1
ppp
i,j

(l
DW
)
i,j
+
e
i

j=1
rrr
i,j

(l
DW
)
i,j
_
_
, (4.51)
J
(l
DW
)
=
s

i=1
_

T
i

(l
DW
)
HHH
i
_
uuu
(l
DW
)
i
+
(l
DW
)
uuu
t
, (4.52)
o` u lindice superieur (l
DW
) denote le nombre de literation de D-W. Ces bornes permettent
darreter lalgorithme lorsque la solution courante est susamment proche de loptimum.
Le developpement presente ci-dessus peut etre synthetise dans un algorithme iteratif.
La procedure resumee par lalgorithme 3 decrit ainsi les etapes `a suivre pour tous les
agents an que la solution proposee, calculee par la resolution du PMR, converge vers la
solution globale.
Le syst`eme de controle distribue resultant a une structure decentralisee dont tous les
regulateurs locaux MPC
i
sont coordonnes par le controleur MPC
c
, qui resout le PMR. Ce
controleur coordonnateur teste egalement la condition darret de lalgorithme, J
(l
DW
)

J
(l
DW
)
. Bien que les sous-probl`emes soient independants, ils peuvent etre calcules en
parall`ele, an de reduire la charge de calcul. Notons qu`a la n de chaque iteration, l
DW
,
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 129
une solution globale faisable est disponible :
uuu
(l
DW
)
i
=
d
i
(l
DW
)

j=1
ppp
i,j

(l
DW
)
i,j
+
e
i
(l
DW
)

j=1
rrr
i,j

(l
DW
)
i,j
, i N
s
1
, (4.53)
ce qui permet dappliquer au syst`eme la solution fournie par lalgorithme dans un intervalle
de temps borne (limite par la periode dechantillonnage) ou meme dutiliser un nombre
xe diterations.
Algorithme 3 Procedure iterative de la commande predictive distribuee basee sur la
decomposition de Dantzig-Wolfe
1 : Initialiser l
DW
= 1 et calcule un ensemble initial de solutions de base ppp
i,j
, j
N
d
i
(l
DW
)
1
, rrr
i,j
, j N
e
i
(l
DW
)
1
, i N
s
1
2 : Resoudre le PMR par MPC
c
, en obtenant
(l
DW
)
i,j
et
(l
DW
)
i,j
ainsi que les solution
duales
(l
DW
)
,
(l
DW
)
i
3 : Envoyer
(l
DW
)
, par MPC
c
, vers tous les controleurs locaux MPC
i
4 : Resoudre (en parall`ele) tous les sous-probl`emes modies (4.49), par les MPC
i
5 : Envoyer les solutions locales, uuu
(l
DW
)
i
, de tous les MPC
i
vers MPC
c
6 : Calculer les bornes courantes, superieure (4.51) et inferieure (4.52), par MPC
c
7 : Si (l
DW
l
DWmax
ET J
(l
DW
)
J
(l
DW
)
) Alors
7.1 : uuu

i
=

d
i
(l
DW
)
j=1
ppp
i,j

(l
DW
)
i,j
+

e
i
(l
DW
)
j=1
rrr
i,j

(l
DW
)
i,j
, i N
s
1
, Stop
Sinon
7.2 : Mettre `a jour l
DW
= l
DW
+ 1 et ajouter la nouvelle solution faisable du
probl`eme relaxe ppp
i,d
i
(l
DW
)+1
= uuu
(l
DW
)
i
, d
i
(l
DW
) = d
i
(l
DW
) + 1 si SP
i
(4.49)
a une solution bornee, et rrr
i,e
i
(l
DW
)+1
= uuu
(l
DW
)
i
, e
i
(l
DW
) = e
i
(l
DW
) + 1 si le
sous-probl`eme i modie presente une solution innie, alors uuu
(l
DW
)
i
est un rayon
extremal i N
s
1
(par MPC
c
) et Goto pas 2
Fin Si
4.4.3 Mod`ele de prediction couple
Lors du paragraphe precedent, nous avons expose les idees de base de la methode de
decomposition de Dantzig-Wolfe, `a partir desquelles on a formule un algorithme predictif
distribue. Suite `a lutilisation des mod`eles locaux decouples, les sous-probl`emes pris en
charge par les controleurs locaux sont independants. Dans le cadre du controle thermique
multi-zone, utiliser ces mod`eles revient `a negliger les couplages thermiques entre les zones.
Pourtant, les resultats presentes dans les parties 3.4 et 4.3 ont montres limportance de la
prise en compte de ces interactions, ce que nous developpons dans les paragraphes suivants.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
130 4. MPC lineaire multivariable pour la regulation thermique multizone
4.4.3.1 Couplage par les sorties
Si les mod`eles locaux couples par les sorties (3.44) sont employes pour la prediction de
la temperature des zones, alors les domaines admissibles des sous-probl`emes i sont denis
par :
U
i
= {uuu

i
(k)|GGG

i
uuu

i
(k) = ggg

i
(k), uuu

i
(k) 000
(2N
u
+4N
2
)1
}, i N
s
1
, (4.54)
avec les notations
GGG

i
=
_

_
III
N
u
III
N
u
000
N
u
N
2
000
N
u
N
2
000
N
u
N
2
000
N
u
N
2

i
000
N
2
N
u
III
N
2
III
N
2
000
N
2
N
2
000
N
2
N
2

i
000
N
2
N
u
000
N
2
N
2
000
N
2
N
2
III
N
2
III
N
2
_

_
, (4.55)
ggg

i
(k) =
_

_
uuu
i
(k)
www
i
(k) +
i
xxx
i
(k) +

jH
i

j,i
yyy

j
(k)
www
i
(k)
i
xxx
i
(k)

jH
i

j,i
yyy

j
(k)
_

_
. (4.56)
Dans la formulation du vecteur ggg

i
(k) on retrouve les sequences futures des sorties des
zones j H
i
. On peut alors penser utiliser les sequences de sorties locales predites `a
linstant precedent, k 1. Dans ce cas, les vecteurs ggg

i
(k) deviennent :
ggg

i
(k) =
_

_
uuu
i
(k)
www
i
(k) +
i
xxx
i
(k) +

jH
i

j,i
yyy
j
(k|k 1)
www
i
(k)
i
xxx
i
(k)

jH
i

j,i
yyy
j
(k|k 1)
_

_
. (4.57)
Lalgorithme MPC distribue avec la prise en compte des couplages par les sorties a la
meme structure que lalgorithme 3 dont pour le calcul de la solution globale du probl`eme
(pas 7.1), les regulateurs locaux envoient les sequences de sorties `a tous les agents voisins.
Lalgorithme ainsi concu converge vers la solution optimale, pourtant, la formulation
du probl`eme doptimisation nest pas optimale, ce qui est d u au fait que les sequences
de sorties calculees `a deux instants de temps consecutifs sont generalement dierentes.
Pourtant, dans la pratique, lecart entre les valeurs de sortie predites correspondant au
meme pas k + j, mais calculees `a des instants dierents est faible.
Suite `a lapparition des echanges entre les regulateurs locaux, larchitecture de controle
devient un peu plus complexe. Ainsi, chaque regulateur local, MPC
i
, echange les sequences
de sortie locales avec ses voisins et communique les sequences de commande locales au
regulateur coordonnateur, MPC
c
. La gure 4.8 illustre les schemas des architectures MPC
distribuees pour le cas du mod`ele decouple et respectivement pour le cas du mod`ele couple.
En developpant le schema de commande distribuee, supposant de plus que le mod`ele local
inclut egalement linuence de la temperature exterieure, la structure bloc qui resulte est
representee gure 4.9, pour lexemple du batiment `a trois zones considere precedemment.

Etude numerique de la vitesse de convergence Pour etudier la vitesse de conver-


gence de lalgorithme distribue 3 par rapport `a une procedure centralisee, nous avons
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 131
u
2
xxx
1
MPC
c
MPC
1
MPC
2
MPC
s
u
s
u
1
xxx
2
xxx
s
u
2
xxx
1
MPC
c
MPC
1
MPC
2
MPC
s
u
s
u
1
xxx
2
xxx
s
Figure 4.8 Schema de commande distribuee base sur la methode de decomposition de
Dantzig-Wolfe, utilisant le mod`ele decouple (`a gauche) et le mod`ele couple (`a droite)
yyy
1
yyy
3

2
,
2
, www
2
, uuu
2

3
,
3
, www
3
, uuu
3
u
1
u
2
u
3
y
1
y
2
y
3
Observateur
1
xxx
1
MPC
2
MPC
3
MPC
1
Observateur
2
Observateur
3
xxx
2
xxx
3
yyy
2

1
,
1
, www
1
, uuu
1
T
ext
MPC
c
uuu

uuu

3

uuu

1
uuu
t
,
Figure 4.9 Schema-bloc de controle distribue base sur la methode de decomposition de
Dantzig-Wolfe
decide dutiliser un mod`ele thermique simple dune pi`ece, sachant que les dimensions des
probl`emes doptimisation sont independants de la complexite (nombre des etats) du mod`ele
de prediction. Pour les resultats presentes dans ce paragraphe, on consid`ere que toutes les
pi`eces du batiment ont les memes caracteristiques et quelles sont disposees en serie (voir
gure 4.10). Le mod`ele discret dune zone secrit alors sous la forme :
_

_
xxx
i
(k + 1) = AAA
i
xxx
i
(k) +bbb
i
u
i
(k) +eee
ext,i
T
ext
(k) +

jH
i
eee
j,i
y
j
(k)
y
i
(k) = ccc
T
i
xxx
i
(k),
(4.58)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
132 4. MPC lineaire multivariable pour la regulation thermique multizone
Les zones situees aux extremites sont decrites par les matrices :
AAA
1
= AAA
s
=
_

_
0, 9501 0 0
0 0, 8215 0
0 0 0, 8833
_

_
, bbb
1
= bbb
s
=
_

_
0
2, 8606
0
_

_
, (4.59)
eee
2,1
= eee
s1,s
=
_
0 0 0, 0480
_
T
, eee
ext,1
= eee
ext,s
=
_
0, 0113 0 0
_
T
, ccc
1
= ccc
s
= 111
31
,
(4.60)
tandis que toutes les autres zones ont deux voisins (se qui explique la dimension du vecteur
detat), elles sont alors decrites par :
AAA
i
=
_

_
0, 9501 0 0 0
0 0, 8215 0 0
0 0 0, 8833 0
0 0 0 0, 8833
_

_
, bbb
i
=
_

_
0
2, 8606
0
0
_

_
, eee
i1,i
=
_

_
0
0
0, 0480
0
_

_
, (4.61)
eee
i+1,i
=
_
0 0 0 0, 0480
_
T
, eee
ext,i
=
_
0, 0113 0 0 0
_
T
, ccc
1
= ccc
s
= 111
41
, (4.62)
avec une periode dechantillonnage de 30min. Mentionnons que les valeurs numeriques des
matrices proposees ci-dessus correspondent au mod`ele de prediction de la zone 1, utilise
au paragraphe 3.4.6.
Zone 1 Zone 2
Transfert thermique
3m
4m
Transfert thermique
Zone s
Transfert thermique
u
1
y
1 u
2
y
2 u
s
y
s
Figure 4.10 B atiment compose de s zones disposees en serie
Les deux premiers scenarios presentes ci-dessous consid`erent le mod`ele de prediction
decouple, tandis que le troisi`eme prend en compte les couplages.
Nous nous proposons de mesurer le facteur de sous-optimalite relatif S
f
[%] :
S
f
=
J
d
J
c
J
c
100 (4.63)
au l des iterations de lalgorithme, ainsi que linuence du nombre de sous-syst`emes s
et de la taille de lhorizon de prediction sur la commande N
u
. Dans lequation (4.63),
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 133
J
d
represente la valeur de loptimum calculee de mani`ere distribuee, quand J
c
represente
la valeur de loptimum calculee de mani`ere centralisee. Les autres param`etres de reglage
sont choisis comme suit : N
1
= 1, N
2
= 10. Les etats initiaux des sous-syst`emes ainsi
que le nombre dinstants doccupation inclus dans lhorizon de prediction sont choisis de
mani`ere aleatoire pour avoir plus de coherence du point de vue statistique. Les courbes
representees gures 4.11, 4.12 et 4.13 representent les moyennes obtenues en considerant
50 essais dierents.
Scenario 1 : On xe N
u
= N
2
= 10 tandis que le nombre des sous-syst`emes change. Les
valeurs qui denissent la bande de confort sont choisies telles que le confort ne peut etre
satisfait que par la saturation de la contrainte de couplage. Dans toutes les autres situa-
tions, lalgorithme converge en une seule iteration. En regardant la gure 4.11, on observe
que generalement le nombre diterations necessaires pour atteindre loptimum ou pour en
etre tr`es proche est autour de 10. On constate egalement la convergence exponentielle de
lalgorithme d`es que le nombre de sous-syst`emes est superieur `a 4. La courbe obtenue pour
s = 2, qui peut paratre un peu surprenante sexplique par le fait que les deux pi`eces
sont concurrentes sur un ensemble de ressources. D u au fait que les mod`eles des zones
sont identiques, un nombre important de points sont situes sur lhyperplan deni par la
contrainte couplante, ce qui explique la stagnation du crit`ere sur les premi`eres iterations
(pour un nombre faible de sous-syst`emes).
0 5 10 15
10
5
10
4
10
3
10
2
10
1
10
0
10
1
10
2
10
3


s=2
s=4
s=8
s=16
s=32
s=64
s=128
Nombre diterations DW
S
f
[
%
]
Figure 4.11 Inuence du nombre de sous-syst`emes, s, sur la vitesse de convergence
Scenario 2 : On xe le nombre de sous-syst`emes `a s = 40 et on joue sur la taille de
lhorizon de commande. La gure 4.12 montre la vitesse de convergence (en termes de
sous-optimalite) de lalgorithme 3 au l des iterations, en fonction de N
u
. La reduction
du param`etre N
u
determine une augmentation de la vitesse de convergence, ainsi quune
decroissance du nombre des iterations. Ce phenom`ene sexplique par le fait que N
u
inuence
le nombre de variables du probl`eme doptimisation ainsi que le nombre de leurs contraintes.
Scenario 3 : Le troisi`eme scenario de ce paragraphe se concentre sur letude de lin-
uence des erreurs de predictions entre deux pas consecutifs sur le facteur de sous-optima-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
134 4. MPC lineaire multivariable pour la regulation thermique multizone
0 2 4 6 8 10 12 14
10
15
10
10
10
5
10
0
10
5


N
u
=2
N
u
=4
N
u
=6
N
u
=8
Nombre diterations DW
S
f
[
%
]
Figure 4.12 Inuence de la taille de lhorizon de commande, N
u
, sur la vitesse de
convergence
lite de la solution fournie par lalgorithme distribue. Pour ce faire, nous calculons tout
dabord de mani`ere centralisee les sequences futures optimales de sortie et les multiplions
par une valeur aleatoire, (0, 1, 5). Ainsi, les sequences locales de sortie utilisees par
lalgorithme distribue sont :
yyy
j
(k) = yyy

j
(k). (4.64)
La gure 4.13 montre des facteurs de sous-optimalite tr`es faibles meme pour des ecarts
relativement importants entre la sequence de sorties optimale, yyy

j
(k), et la sequence uti-
lisee pour la prediction, yyy
j
(k). Nous avons choisi de mani`ere arbitraire 100 valeurs pour le
param`etre . De meme, les etats initiaux et les prols doccupation ont ete choisis arbi-
trairement, ce quexplique les valeurs sensiblement dierentes de S
f
pour des valeurs tr`es
approchees de . Les valeurs negatives des facteurs de sous-optimalite sexplique par le
fait que des sequences de sortie superieures `a celles optimales engendrent une baisse de
consommation et donc du crit`ere. On observe egalement que pour les valeurs de autour
de 1, le facteur de sous-optimalite tr`es proche de 0, ce que illustre loptimalite de la solution
distribuee ainsi calculee.
0 0.5 1 1.5
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
0.05
0.1
0.15

S
f
[
%
]
Figure 4.13 Inuence du param`etre sur loptimalite de la solution distribuee
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 135
Suite `a lanalyse des trois scenarios precedents, on peut conseiller lutilisation de lal-
gorithme distribue pour un nombre de sous-syst`emes superieur `a 8. Des valeurs faibles de
la taille de lhorizon de commande augmente la vitesse de convergence de lalgorithme. La
perte relativement faible doptimalite dans le troisi`eme scenario est due au couplage pas
fort entre les sous-syst`emes, ainsi que `a la formulation du probl`eme doptimisation.
4.4.3.2 Couplage par les entrees
Comme on la vu au chapitre 2, la majorite des mod`eles locaux de prediction uti-
lises dans la litterature sont couples par les entrees (voir paragraphe 2.2.3.1). Dans ce
paragraphe nous proposons ainsi une modication de lalgorithme de Dantzig-Wolfe pour
prendre en compte ce type de couplage. Notons egalement que dans lAnnexe A on presente
un methode de construction du mod`ele couple par les entrees, `a partir du mod`ele global
simple dun batiment deux zones. Considerons alors s mod`eles locaux couples par les
entrees :
_

_
xxx
i
(k + 1) = AAA
i
xxx
i
(k) +bbb
i
u
i
(k) +

jH
i
eee
j,i
u
j
(k)
y
i
(k) = ccc
T
i
xxx
i
(k).
(4.65)
Utilisant les memes notations que celles employees dans les paragraphes precedents, on
peut alors ecrire le probl`eme global doptimisation sous la forme lineaire standard comme
suit :
min
zzz(k),uuu

1
(k),...,uuu

s
(k)

T
1
(k)uuu

1
(k) + +
T
s
(k)uuu

s
(k)
s.c. HHH
0
zzz(k) + HHH
1
uuu

1
(k) + + HHH
s
uuu

s
(k) = uuu
t
(k)
GGG

1
uuu

1
(k) + + GGG

s,1
uuu

s
(k) = ggg

1
(k)
.
.
.
.
.
.
GGG

1,s
uuu

1
(k) + + GGG

s
uuu

s
(k) = ggg

s
(k)
zzz(k) 000
N
u
1
, uuu

1
(k) , , uuu

s
(k) 000
(2N
u
+4N
2
)1
,
(4.66)
avec
GGG

j,i
=
_

_
_

_
000
N
u
N
u
000
N
u
N
u
000
N
u
N
2
000
N
u
N
2
000
N
u
N
2
000
N
u
N
2

j,i
000
N
2
N
u
000
N
2
N
2
000
N
2
N
2
000
N
2
N
2
000
N
2
N
2

j,i
000
N
2
N
u
000
N
2
N
2
000
N
2
N
2
000
N
2
N
2
000
N
2
N
2
_

_
, si j H
i
000
(N
u
+2N
2
)(2N
u
+4N
2
)
, autrement
(4.67)
ggg

i
(k) =
_

_
uuu
i
(k)
www
i
(k) +
i
xxx
i
(k)
www
i
(k)
i
xxx
i
(k)
_

_
, i N
s
1
. (4.68)
Par rapport aux cas traites precedemment, le probl`eme (4.66) ne presente pas une ma-
trice de contraintes de type bloc-angulaire. Par exemple, si les zones sont disposees en serie,
la matrice de contraintes du probl`eme relaxe a une structure tridiagonale. Lapparition des
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
136 4. MPC lineaire multivariable pour la regulation thermique multizone
matrices non nulles GGG

j,i
empeche la resolution par blocs du probl`eme relaxe.
Algorithme 4 Procedure iterative de la commande predictive distribuee basee sur la
decomposition de Dantzig-Wolfe, avec la prise en compte des couplages par les entrees
1 : Initialiser l
DW
= 1, l
i
= 1 et calcule un ensemble initial de solutions de base ppp
i,j
,
j N
d
i
(l
DW
)
1
, rrr
i,j
, j N
e
i
(l
DW
)
1
, i N
s
1
2 : Resoudre le PMR par MPC
c
, en obtenant
(l
DW
)
i,j
et
(l
DW
)
i,j
ainsi que les solution
duales
(l
DW
)
,
(l
DW
)
i
3 : Envoyer
(l
DW
)
, par MPC
c
, vers tous les controleurs locaux MPC
i
4 : Resoudre (en parall`ele) tous les sous-probl`emes i en obtenant uuu
(l
DW
,l
i
)
i
, par les
MPC
i
5 : Si (l
i
l
max
ET
_
_
_uuu
(l
DW
,l
i
)
i
uuu
(l
DW
,l
i
1)
i
_
_
_

<
i
, i N
s
1
) Alors
5.1 : Envoyer les solutions locales, uuu
(l
DW
)
i
, de tous les MPC
i
vers MPC
c
Sinon
5.2 : Envoyer uuu
(l
DW
,l
i
)
i
de tous les MPC
i
vers tous leurs voisins j H
i
5.3 : Mettre `a jour l
i
= l
i
+ 1 et Goto pas 4
Fin Si
6 : Calculer les bornes courantes, superieure (4.51) et inferieure (4.52), par MPC
c
6 : Si (l
DW
l
DWmax
ET J
(l
DW
)
J
(l
DW
)
) Alors
6.1 : uuu

i
=

d
i
(l
DW
)
j=1
ppp
i,j

(l
DW
)
i,j
+

e
i
(l
DW
)
j=1
rrr
i,j

(l
DW
)
i,j
, i N
s
1
, Stop
Sinon
6.2 : Mettre `a jour l
DW
= l
DW
+ 1 et ajouter la nouvelle solution faisable du
probl`eme relaxe ppp
i,d
i
(l
DW
)+1
= uuu
(l
DW
)
i
, d
i
(l
DW
) = d
i
(l
DW
) + 1 si SP
i
(4.49)
a une solution bornee, et rrr
i,e
i
(l
DW
)+1
= uuu
(l
DW
)
i
, e
i
(l
DW
) = e
i
(l
DW
) + 1 si le
sous-probl`eme i modie presente une solution innie, alors uuu
(l
DW
)
i
et un rayon
extremal i N
s
1
(par MPC
c
) et Goto pas 2
Fin Si
On peut alors penser utiliser (comme dans le paragraphe precedent) les sequences
de commande calculees `a linstant k 1. Alors il faut ajouter les derni`eres composantes
de ces vecteurs car elles nentrent pas dans lhorizon de prediction au pas k 1. Une
autre solution est de mettre en place un algorithme de communication, similaire `a celui
presente au paragraphe 4.3.1.3. Sachant quen recourant `a la premi`ere idee on obtient un
algorithme tr`es similaire `a celui presente au paragraphe 4.4.3.1, alors dans la suite du
paragraphe on se concentre uniquement sur la seconde option. Par consequent, `a chaque
iteration de Dantzig-Wolfe, la solution du probl`eme relaxe sera calculee par la mise en
place dun algorithme iteratif similaire `a lalgorithme 2. Ceci implique lapparition des
iterations imbriquees, notees par l
i
. Elles correspondent aux iterations de lalgorithme 2,
dont le couplage par les sorties a ete remplace par un couplage par les entrees.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 137
Notation 4.4.1 On utilisera un indice superieur entre parenth`eses sous la forme x
(l
DW
,l
i
)
pour designer le fait que la variable x est utilisee `a literation imbriquee l
i
de literation
exterieure (de Dantzig-Wolfe), l
DW
.
Comme on va le voir au paragraphe 4.4.4, la prise en compte des couplages entre les
sous-syst`emes ameliore les performances globales du syst`eme de commande. Malgre cela,
la convergence vers la solution optimale des algorithmes distribues, prenant en compte les
couplages entre les zones, nest pas garantie.
La faiblesse de lalgorithme 4 `a couplage par les entrees reside dans les iterations im-
briquees. La presence de ces iterations nimplique pas la convergence vers la solution opti-
male. Ainsi, les solutions des probl`emes relaxes, obtenues `a laide des iterations imbriquees,
ne sont pas forcement des sommets ou des rayons extremaux des poly`edres U
i
.

Etude numerique de lecacite de lalgorithme distribue Pour letude de la


complexite de la procedure distribuee `a iterations imbriquees, decrite par lalgorithme
4, considerons le mod`ele (4.65) avec les valeurs numeriques suivantes :
AAA
i
=
_
0, 9921 0
0 0, 998
_
, bbb
i
=
_
0, 2595
0
_
, eee
j,i
=
_
0
0, 02
_
, ccc
T
i
=
_
1
1
_
, (4.69)
dont le pas dechantillonnage est T
s
= 10min. Les valeurs numeriques ont ete obtenues
apr`es une identication experimentale sur la pi`ece 1 du batiment trois zones. Les zones
sont disposees en serie. La variables a ete introduite an detudier linuence du gain
statique de couplage sur les performances de lalgorithme distribue.
Les performances de lalgorithme distribue sont comparees `a celles du solveur centralise
par rapport `a deux indicateurs :
le facteur de sous-optimalite, S
f
[%] et
le temps de calcul necessaire `a la resolution du meme probl`eme par les deux strategies
Lalgorithme iteratif a ete implemente sur une machine sequentielle. Ainsi le temps de
calcul equivalent, en utilisant un environnement distribue (en negligeant le temps lie `a la
communication des informations entre les agents) est :
t
distr
=
l
DW

l=1
_
_
t
MPC
c
(l) +
l
i
(l)

i=1
max
jN
s
1
t
MPC
j
(i)
_
_
, (4.70)
o` u l
DW
represente le nombre diterations de Dantzig-Wolfe necessaires pour satisfaire la
condition darret, t
MPC
c
(l) est le temps de calcul requis par le controleur coordonnateur
MPC
c
pour resoudre le PMR `a literation l et t
MPC
j
(i) est le temps de calcul requis par
le controleur local MPC
j
pour resoudre son sous-probl`eme `a literation imbriquee i de
literation de Dantzig-Wolfe l.
Pour la strategie distribuee, le temps de communication, qui peut etre important dans
les applications en temps reel, est proportionnel au nombre diterations. Par consequent,
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
138 4. MPC lineaire multivariable pour la regulation thermique multizone
les resultats presentes ci-dessous vont mettre egalement en evidence le nombre diterations
atteint par la procedure distribuee.
Trois scenarios sont proposes, chacun illustrant linuence sur les indicateurs de per-
formance dun des param`etres suivants :
le nombre de sous-syst`emes, s,
la taille de lhorizon de commande, N
u
et
le terme , proportionnellement lie au gain statique de couplage entre les sous-
syst`emes.
Dans les resultats de simulation presentes ci-dessous, nous avons utilise les valeurs
suivantes pour les param`etres de reglage : N
1
= 1, N
2
= 30 et =
i
= 10
3
. Le nombre
dinstants doccupation inclus dans la fenetre de prediction de chaque pi`ece est egal `a 15.
Pour resoudre les PL, nous avons utilise le solveur Simplexe de Matlab (fonction linprog
avec loption simplex) sur une machine Intel Pentium 4 `a 3GHz. An davoir des resultats
statistiques plus coherents, cinq valeurs dierentes pour les etats initiaux des sous-syst`emes
ont ete considerees. Ceci explique les multiples valeurs des param`etres qui apparaissent
dans les gures de chaque scenario.
10
0
10
2
0
0.005
0.01
0.015
0.02
10
0
10
2
10
2
10
0
10
2
10
4


t
centr
t
distr
10
0
10
2
5
6
7
8
9
10
0
10
2
5
5.2
5.4
5.6
5.8
6
T
e
m
p
s
d
e
c
a
l
c
u
l
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
D
W
N
o
m
b
r
e
m
o
y
e
n
d

i
t
e
r
a
t
i
o
n
s
i
m
b
r
i
q
u
e
e
s
S
f
[
%
]
s s
s s
Figure 4.14 Inuence du nombre de sous-syst`emes, s, sur les performances de lalgo-
rithme 4
Scenario 1 : Les param`etres N
u
= 15 et = 1 sont xes tandis que le nombre de
sous-syst`emes evolue. La gure 4.14 montre une tr`es bonne capacite dextensibilite de lal-
gorithme distribue par rapport au solveur centralise. Cependant, labaissement du temps
de calcul par lutilisation de lalgorithme distribue est possible `a partir dun certain nombre
de sous-syst`emes (10 pour le cas Simplexe, 100 pour CPLEX). En ce qui concerne le fac-
teur de sous-optimalite, on observe que la solution distribuee est tr`es proche de loptimum
trouve par la methode centralisee. On observe egalement que pour plus de 100 pi`eces,
le solveur Simplexe centralise nore pas la solution optimale dans le delai dune periode
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 139
dechantillonnage. Ceci nest pas un probl`eme pour les solveur plus performants, comme
CPLEX.
Scenario 2 : Nous allons faire varier maintenant la dimension de lhorizon de commande
et nous xons les param`etres s = 40 et = 1. N
u
inuence les dimensions de la matrice
de contrainte `a la fois du probl`eme matre et des sous-probl`emes. On peut remarquer
gure 4.15 que lecart entre le temps de calcul centralise et le temps de calcul distribue
augmente avec N
u
. Dans le meme temps, les indices de performance sont peu inuences
par la variation de ce param`etre.
5 10 15 20 25
0
0.02
0.04
0.06
5 10 15 20 25
0
20
40
60
80


t
centr
t
distr
5 10 15 20 25
4
6
8
10
5 10 15 20 25
5
5.2
5.4
5.6
5.8
6
T
e
m
p
s
d
e
c
a
l
c
u
l
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
D
W
N
o
m
b
r
e
m
o
y
e
n
d

i
t
e
r
a
t
i
o
n
s
i
m
b
r
i
q
u
e
e
s
S
f
[
%
]
N
u
N
u
N
u
N
u
Figure 4.15 Inuence de la taille de lhorizon de commande, N
u
, sur les performances
de lalgorithme 4
Scenario 3 : Dans ce scenario nous montrons linuence du gain de couplage sta-
tique sur les performances de lalgorithme distribue, pour s = 40 et N
u
= 15. Intuitive-
ment, un gain de couplage superieur implique une augmentation du nombre diteration
imbriquees, necessaires pour se rapprocher du point dequilibre. Dans le meme temps, ce
point dequilibre de Nash seloigne de loptimum global avec laugmentation du facteur
de couplage . Ainsi, le degre de sous-optimalite de la solution distribuee grandit avec la
croissance de .
4.4.4 Resultats de simulation
Dans les paragraphes precedents, nous avons presente deux algorithmes predictifs dis-
tribues bases sur la methode de decomposition de Dantzig-Wolfe ainsi que leur performance
en termes de vitesse de convergence, de degre doptimalite de la solution et de temps de
calcul.
Le but du present paragraphe est de comparer ces algorithmes avec dautres structures
de commande. Cette fois, les crit`eres de comparaison sont le confort et le co ut energetique.
Pour ce faire, les algorithmes de controle sont appliques au batiment virtuel 3-pi`eces, decrit
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
140 4. MPC lineaire multivariable pour la regulation thermique multizone
1 2 3 4 5
0
0.02
0.04
0.06
0.08
0.1
1 2 3 4 5
0
20
40
60


t
centr
t
distr
1 2 3 4 5
2
4
6
8
1 2 3 4 5
0
10
20
30
40
T
e
m
p
s
d
e
c
a
l
c
u
l
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
D
W
N
o
m
b
r
e
m
o
y
e
n
d

i
t
e
r
a
t
i
o
n
s
i
m
b
r
i
q
u
e
e
s
S
f
[
%
]


Figure 4.16 Inuence du gain statique de couplage sur les performances de lalgorithme
4
dans lAnnexe A.
Les resultats de simulation presentes jusqu`a present dans ce memoire sinteressaient
essentiellement `a la consommation energetique liee aux equipements de chauage et au
degre de confort des occupants. Comme indique dans lintroduction du chapitre, la formu-
lation lineaire du crit`ere de MPC nous permet dinclure facilement le prix de lenergie et
de minimiser par consequent la facture et non pas le nombre de kWh.
Supposons donc que les co uts locaux
i
(k +j) (en e/W) associes aux commandes des
convecteurs locaux sexpriment sous la forme :

i
(k + j) = c
e
(k + j)T
s
/(36 10
5
), i N
s
1
, j N
Nu1
0
(4.71)
o` u c
e
(k+j) represente le prix de lelectricite (en e/kWh). Le tarif de lelectricite considere
est constant et egal `a c
e
= 0, 0742e/kWh. La puissance maximale est denie par u
t
=

iS
u
i
avec (0, 1). Les conditions meteorologique simulees sont celles mesurees `a
Rennes, le 1 Janvier 1998.
Le mod`ele de prediction a ete obtenu en ecrivant les equations thermiques, dune
mani`ere similaire `a [101], methode qui nous a amene `a construire un mod`ele global `a 119
etats. Ce mod`ele de commande est tr`es precis par rapport au mod`ele de simulation oert
par SIMBAD. Notons que par rapport au mod`ele couple par les entrees (4.65), le mod`ele
de simulation utilise presente deux entrees de plus, i.e. la temperature du sol (xe `a 10
o
C)
et la temperature exterieure. En supposant que le regulateur ne dispose pas des previsions
meteorologiques, alors les composantes de la sequence future de temperatures exterieures
seront egales `a la temperature courante mesuree. Pour les valeurs des param`etres MPC,
les valeurs suivantes ont ete utilisees : N
u
= N
2
= 30, =

= 10
3
,
i
= 10
3
, i S,
T
s
= 600s.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 141
Zone 1 Zone 2 Zone 3
w
i
[
o
C] 19,5 20,5 21,5
w
i
[
o
C] 20,5 21,5 22,5
PO 1 08h00 - 12h00 13h00 - 17h00 17h00 - 20h00
PO 2 08h00 - 17h00 10h00 - 19h00 14h00 - 18h00
PO 3 08h00 - 17h00 - -
Table 4.2 Prols doccupation
Pour avoir une meilleure vue sur les performances du syst`eme de controle distribue,
nous proposons de comparer les co uts de chauage de trois scenarios doccupation dierents,
synthetises dans le tableau 4.2. Nous avons considere deux valeurs pour les conditions ini-
tiales (temperature de lair interieur et temperature des murs), ce qui correspond `a une
occupation quotidienne (16
o
C) et `a une periode dinoccupation dun week-end (10
o
C).
T
0
[
o
C] Loi de commande
Co ut/jour [e]
PO 1 PO 2 PO 3
0,5
10
CMPC 1,15 1,21 0,80
DiMPCDW 1,17 1,23 0,80
PI 1,28 1,33 0,84
16
CMPC 0,81 0,86 0,49
DiMPCDW 0,82 0,86 0,49
PI 0,92 0,95 0,54
0,7
10
CMPC 1,15 1,21 0,80
DiMPCDW 1,17 1,21 0,81
PI 1,29 1,35 0,84
16
CMPC 0,81 0,86 0,49
DiMPCDW 0,81 0,86 0,49
PI 0,94 0,97 0,54
Table 4.3 Comparaison en termes de co uts de chauage
Dans le tableau 4.3, nous comparons, en terme de co uts de chauage, la structure
distribue DiMPCDW, le controleur centralise equivalent CMPC et une structure de com-
mande decentralisee de type PI. Pour chaque prol doccupation, nous avons considere que
la puissance souscrite est 50 %, respectivement 70 % de la puissance maximale installee.
Les consignes des PI locaux, w
PI
i
(k) =
i
(k)(w
i
(k) + w
i
(k))/2 ont ete anticipees en fonc-
tion des conditions initiales. Ainsi, les controleurs PI (K = 0, 35, T
i
= 3600s) declenchent
le chauage 5 heures avant le debut de la periode doccupation si T
0
= 10
o
C et 3 heures
quand T
0
= 16
o
C. La duree de ces periodes de prechauage a ete determinee de mani`ere
experimentale. Dun point de vue qualitatif, cette anticipation peut etre observee sur la
gure 4.17 dans laquelle on illustre levolution des principaux signaux sur une journee de
simulation pour la structure DiMPCDW et PI.
Pour que les comparaisons avec le PI soient realistes, vis-` a-vis de lapproche predictive,
on choisit, dans le cas du PI, de diviser u
t
(k) entre les seules zones occupees, en saturant
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
142 4. MPC lineaire multivariable pour la regulation thermique multizone
0 3 5 8 9 10 14 17 18 19 24
14
16
18
20
22


0 3 5 8 9 10 14 17 18 19 24
0
1
1.5


0 3 5 8 9 10 14 17 18 19 24
14
16
18
20
22


0 3 5 8 9 10 14 17 18 19 24
0
1
1.5


0 3 5 8 9 10 14 17 18 19 24
6
7
8
9
10


0 3 5 8 9 10 14 17 18 19 24
0
50
100
150
200
Temps [h]
Temps [h]
Temps [h]
Temps [h]
Temps [h]
DiMPC
PI
P
u
i
s
s
a
n
c
e
e
l
e
c
.
[

1
.
2
k
W
]
P
u
i
s
s
a
n
c
e
e
l
e
c
.
[

1
.
2
k
W
]
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
T
e
m
p
.
e
x
t
e
r
i
e
u
r
e
[
o
C
]
R
a
y
.
s
o
l
a
i
r
e
[
W
/
m
2
]
y
1
y
1
y
2
y
2
y
3
y
3
u
1
u
1
u
2
u
2
u
3
u
3
u
t
u
t

u
i

u
i
T
ext
Ray. direct
Ray. dius
Figure 4.17 Resultats de simulation sur une journee utilisant la commande DiMPCDW
et respectivement PI, dans la conguration PO 2, = 0, 5, T
0
= 16
o
C
la commande locale avec :
u
PI
i
(k) = min (u
i
, u
t
/o(k)) (4.72)
o` u o(k) represente le nombre de pi`eces occupees `a linstant k, incluant egalement lantici-
pation de la consigne dans la periode doccupation.
Les resultats synthetises dans le tableau 4.3 montrent que lutilisation de la structure
distribuee permet de realiser des economies moyennes de 9 % par rapport `a la commande
de type PI.
Notons que lapproche proposee peut egalement etre utilisee si la puissance totale
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
4.4. Contraintes couplees 143
maximale est variable dans le temps. Un tel cas est illustre gure 4.18. Bien evidement,
ceci necessite la connaissance `a linstant k de la sequence
uuu
t
(k) =
_
u
t
(k + 1) u
t
(k + N
2
)
_
T
. (4.73)
De plus, dans ce cas, le choix N
u
= N
2
devient preferable (an davoir un nombre de
degres de liberte susant pour satisfaire la contrainte couplante), ce qui peut augmenter
considerablement leort de calcul. Ceci peut etre un interet de plus pour lemploi dune
strategie distribuee meme pour les batiments de taille moyenne.
0 3 8 12 13 17 20 24
14
16
18
20
22


y
1
y
2
y
3
0 3 8 12 13 17 20 24
0
1


u
1
u
2
u
3
0 3 8 12 13 17 20 24
0
1
2.1


0 3 8 12 13 17 20 24
6
7
8
9
10


0 3 8 12 13 17 20 24
0
50
100
150
200
T
ext
Temps [h]
Temps [h]
Temps [h]
Temps [h]
P
u
i
s
s
a
n
c
e
e
l
e
c
.
[

1
.
2
k
W
]
P
u
i
s
s
a
n
c
e
e
l
e
c
.
[

1
.
2
k
W
]
T
e
m
p
e
r
a
t
u
r
e
[
o
C
]
T
e
m
p
.
e
x
t
e
r
i
e
u
r
e
[
o
C
]
R
a
y
.
s
o
l
a
i
r
e
[
W
/
m
2
]
Ray. direct
Ray. dius
u
t

u
i
Figure 4.18 Simulation DiMPCDW avec puissance maximale, u
t
, variable dans le temps
4.4.5 Conclusion
Lobjectif de ce chapitre etait de poursuivre avec lapproche predictive distribuee pro-
posee au chapitre 3 et de sorienter vers des formulations lineaires des crit`eres. Sachant
que la plupart des contraintes qui peuvent apparatre dans des probl`emes de regulation
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
144 4. MPC lineaire multivariable pour la regulation thermique multizone
thermique sont lineaires, on a etudie levolution de la fonction de co ut vers une formulation
lineaire. La principale motivation de ce choix est de nature economique. Le regulateur mini-
mise alors le co ut eectif de chauage, sachant que celui-ci est generalement proportionnel
`a lenergie consommee.
Les probl`emes doptimisation engendres par la commande predictive se posent alors
sous forme de programmes lineaires. Lapparition de contraintes, necessaires pour denir
les bornes superieures et inferieures des grandeurs de commande, devient inevitable.
Dans un premier temps nous avons considere le cas des contraintes locales, speciques
`a chaque zone. Les structures decentralisee, centralisee et distribuee ont ete mises sous la
forme standard lineaire. Ensuite nous avons compare les resultats obtenus en simulation
pour les trois strategies, utilisant dierents scenarios doccupation. Le comportement de
type dead-beat du MPC `a crit`ere lineaire favorise le declenchement du poste de chauage
au dernier moment, ce qui est la meilleure strategie du point de vue energetique pour un
batiment `a occupation discontinue. Ceci est la raison principale dune economie denergie
de plus de 7 % par rapport `a la formulation quadratique du crit`ere.
Dans la deuxi`eme partie du chapitre, une contrainte couplante a ete ajoutee, qui lie les
variables de decision dune partie ou de la totalite des sous-syst`emes. Cette contrainte est
generalement determinee par la valeur de la puissance souscrite dans le cas dun batiment
`a chauage electrique. Pour resoudre le PL resultant dans le cadre dune structure de
controle distribuee, il a ete fait appel ` a la methode de decomposition de Dantzig-Wolfe.
Lalgorithme distribue a ete initialement concu en ignorant les couplages thermiques entre
les zones. Ensuite, nous avons presente deux mani`eres de distribution de leort de calcul
en considerant des mod`eles locaux couples par les sorties et par les entrees, respectivement.
Des etudes numeriques sur lecacite des algorithmes ont montre un bon comportement en
termes de vitesse de convergence et de degre doptimalite de la solution fournie. Dans les
deux cax, la structure MPC distribuee a ete testee en simulation sur un batiment virtuel
avec de bonnes performances economiques.
Toujours dans le cadre lineaire de la fonction de co ut, le chapitre suivant traitera la
gestion distribuee de plusieurs types dequipements de chauage, problematique de plus
en plus importante d`es lors que lon vise `a une diversication des sources denergie.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Chapitre 5
MPC lineaire multivariable pour
la regulation thermique multizone
et multisource
1
Deliberer est le fait de plusieurs. Agir est le fait dun seul.
Memoires de guerre
Charles de Gaulle
5.1 Introduction
Dans le chapitre precedent, nous avons propose une methodologie de distribution de
la loi de commande predictive multivariable pour la regulation de la temperature pour un
batiment multizone, dans lequel les sources de chauage sont locales. Ce type de syst`eme
correspond en particulier au chauage electrique. Deux architectures de commande ont ete
developpees, en fonction du type de contraintes : locales et globales. Dans le premier cas,
la prise en compte des couplages thermiques entre les zones est realisee par des echanges
dinformations entre les agents voisins. Lapparition dune contrainte globale necessite un
agent coordonnateur pour converger vers la solution optimale.
Ce chapitre vient enrichir la methodologie dej` a developpee par lajout dune source
de chauage centrale, qui agit sur toutes ou sur une partie des pi`eces du batiment. Ainsi,
chaque pi`ece peut etre chauee par deux types de sources : locale et centrale. La gestion de
plusieurs sources de chauage peut devenir un enjeu majeur, notamment avec lemergence
des energie renouvelables.
1. Des parties de ce chapitre peuvent etre retrouvees dans [122, 124, 127].
145
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
146 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
5.2 Contexte
Une solution de plus en plus frequente pour reduire la facture energetique est lutili-
sation de plusieurs sources de chauage. Un exemple usuel est la combinaison entre un
syst`eme de chauage central `a biocarburant (biocarburant liquide, bois, etc.) ou `a com-
bustible fossile (petrole, charbon, gaz, etc.) et des convecteurs electriques utilises comme
chauage dappoint. Les deux syst`emes ont des dynamiques et des co uts de fonctionnement
dierents. An de proter du prix relativement reduit du chauage `a base de combustibles,
et en meme temps de la dynamique plus rapide du syst`eme de chauage electrique, une
loi de commande optimale doit etre mise en place. Tel est le contexte de ce chapitre.
Peu de travaux ont ete menes sur des algorithmes de commande pour la regulation
de plusieurs sources de chauage. Mentionnons ici le brevet [161] dans lequel les auteurs
proposent une strategie basee sur des r`egles pour la commande dune pompe `a chaleur,
dune chaudi`ere et dun syst`eme electrique, utilises pour chauer lair dans un syst`eme de
climatisation. La source principale est la pompe `a chaleur, avec des co uts de fonctionne-
ment reduits, tandis que les autres sources sont considerees comme auxiliaires. Pourtant,
le rendement de la pompe diminue considerablement quand la temperature exterieure est
basse, cest pourquoi plusieurs sources de chauage sont utilisees. Ainsi, les sources auxi-
liaires sont mises en marche d`es que la pompe `a chaleur ne fonctionne pas ecacement ou
quand elle na plus la capacite de chauer lespace interieur.
Une vue un peu dierente est proposee dans [146]. Les auteurs consid`erent deux
syst`emes de chauage. Le premier est suppose alimente par une energie renouvelable.
Le second, considere comme syst`eme dappoint, est alimente par une energie fossile. Les
strategies de commande developpees (PID, PID-MPC et PID-ou) favorisent toujours la
source renouvelable, tandis que la source fossile doit rester marginale et nintervenir que
lorsque la premi`ere nest pas susante pour chauer le batiment.
Les deux approches multisource mentionnees ci-dessus ont le meme principe : faire
appel en priorite `a la source denergie la moins co uteuse (du point de vue economique ou
environnemental).
Lidee de notre demarche est un peu dierente. Elle sappuie sur le fait que les deux
types de sources considerees agissent dieremment sur lensemble des zones du batiment.
On consid`ere tout dabord les sources locales qui, comme leurs nom lindique, chauent
leur propres zones. Cest le cas multizone traite dans les chapitres precedents. La deuxi`eme
source, appelee centrale, chaue simultanement une partie ou toutes les pi`eces du batiment.
Un exemple dun tel type de syst`eme est donne par la combinaison entre un chauage
electrique et un chauage central `a bois ou `a gaz, ce que lon trouve dans environ 9 %
des logements francais [4]. Generalement, la source centrale est alimentee par une energie
moins ch`ere. En contre-partie, sa dynamique est moins rapide que celle de la source locale.
De plus, le fait quelle chaue simultanement plusieurs pi`eces rend particuli`erement dicile
son controle, sachant que les zones peuvent avoir des prols doccupation, ainsi que des
bandes de confort, dierents.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 147
Lobjectif de ce chapitre est de proposer une loi de commande predictive distribuee
pour la gestion optimale dun syst`eme de chauage `a sources multiples. Dans ce cadre,
lalgorithme devra integrer, en plus des commandes propres `a chaque source locale, une
commande de la source centrale, appelee par la suite commande centrale.
5.3 MPC avec commande centrale
Nous allons tout dabord denir le crit`ere global doptimisation et puis presenter la
methode de decomposition de Benders. Elle sera loutil de base pour la construction de lal-
gorithme distribue. Les idees principales de la methode de decomposition seront presentees
en ignorant les couplages thermiques entre les zones. Ensuite, nous etendrons la procedure
distribuee pour prendre en compte ces couplages. Les performances technico-economiques
des algorithmes seront etudiees en simulation.
5.3.1 Denition du crit`ere
En gardant la denition du confort avec une bande de temperature, on peut exprimer
la fonction de co ut du MPC sous la forme :
min
uuu
c
(k),uuu
1
(k),...,uuu
s
(k)
J(k) =
T
c
(k)uuu
c
(k) +
s

i=1

T
i
(k)uuu
i
(k) (5.1a)
sous les contraintes
000
N
u
1
uuu
c
(k) uuu
c
(k), (5.1b)
000
N
u
1
uuu
i
(k) uuu
i
(k), i N
s
1
, (5.1c)

i
(k)(www
i
(k) yyy
i
(k)) 000
N
2
1
, i N
s
1
,

i
(k)( yyy
i
(k) www
i
(k)) 000
N
2
1
, i N
s
1
,
(5.1d)
o` u uuu
c
(k) represente la sequence de commandes centrales, tandis que les autres notations
sont identiques `a celles utilisees au chapitre precedent. En utilisant la meme technique de
relaxation des contraintes que celle employee `a la section 4.3, le probl`eme doptimisation
(5.1) est transforme en :
min
uuu
c
(k),uuu
1
(k),...,uuu
s
(k)

T
c
(k)uuu
c
(k) +
s

i=1
_
_

T
i
(k)uuu
i
(k) +
N
2

j=1
f
i
(k + j)
_
_
, (5.2a)
sous les contraintes
000
N
u
1
uuu
c
(k) uuu
c
(k), (5.2b)
000
N
u
1
uuu
i
(k) uuu
i
(k), i N
s
1
, (5.2c)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
148 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
o` u la fonction de penalite f
i
est denie par (4.31).
5.3.2 Mod`ele de prediction decouple
Considerons dans un premier temps le cas de mod`eles locaux independants. Chaque
zone i presente deux entrees, celle de la source locale et celle de la source centrale. Le
mod`ele discret de la zone i peut sexprimer alors sous la forme :
_
xxx
i
(k + 1) = AAA
0,i
xxx
i
(k) +bbb
c,i
u
c
(k) +bbb
i
u
i
(k)
y
i
(k) = ccc
T
i
xxx
i
(k).
(5.3)
`
A partir du mod`ele (5.3), on peut ecrire lequation de prediction locale :
yyy
i
(k) =
0,i
xxx
i
(k) +
0,c,i
uuu
c
(k) +
0,i
uuu
i
(k), (5.4)
avec
0,i
et
0,i
denies par (4.8) et (4.9), tandis que la matrice
0,c,i
est construite comme
suit :

0,c,i
=
_

0,c,i
(0) 0 0

0,c,i
(1)
0,c,i
(0) 0 0
.
.
.
.
.
.
.
.
.

.
.
.

0,c,i
(N
2
1)
0,c,i
(N
2
N
u
+ 1)

N
2
N
u
j=0

0,c,i
(j)
_

_
, (5.5)

0,c,i
(j) = ccc
T
i
AAA
j
0,i
bbb
c,i
, j N
N
2
1
0
. (5.6)
Reportons lequation (5.4) dans la formulation de la fonction de penalite locale, apr`es
quelques manipulations on peut reecrire le probl`eme (5.2) sous la forme standard PL :
min
uuu

c
(k),uuu

1
(k),...,uuu

s
(k)

T
c
(k)uuu

c
(k) +
T
1
(k)uuu

1
(k) + +
T
s
(k)uuu

s
(k)
s.c. KKK
0
uuu

c
(k) = uuu
c
(k)
KKK
0,1
uuu

c
(k) + GGG

0,1
uuu

1
(k) = ggg

0,1
(k)
.
.
.
.
.
.
.
.
.
KKK
0,s
uuu

c
(k) + GGG

0,s
uuu

s
(k) = ggg

0,s
(k)
uuu

c
(k) 000
2N
u
1
, uuu

1
(k) , , uuu

s
(k) 000
(2N
u
+4N
2
)1
,
(5.7)
o` u les matrices GGG

0,i
et les vecteurs ggg

0,i
(k) sont denis par (4.7). Les blocs de matrices qui
composent la premi`ere colonne-bloc de la matrice de contraintes sont denis par :
KKK
0
=
_
III
N
u
III
N
u
_
, KKK
0,i
=
_

_
000
N
u
N
u
000
N
u
N
u

0,c,i
000
N
2
N
u

0,c,i
000
N
2
N
u
_

_
. (5.8)
De mani`ere similaire `a la construction de uuu

i
(k), le vecteur qui inclut la sequence future
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 149
des commandes centrales int`egre N
u
variables auxiliaires, regroupees dans le vecteur
c
(k).
Elles sont necessaires `a la transformation de la deuxi`eme inegalite de la contrainte (5.2b)
en contrainte egalite. On a alors :
uuu

c
(k) =
_
uuu
T
c
(k)
T
c
(k)
_
T
,

c
(k) =
_

T
c
(k) 000
1N
u
_
T
. (5.9)
5.3.2.1 Methode de decomposition de Benders
La decomposition de Benders [22], connue comme la methode duale de la decomposition
de Dantzig-Wolfe, exploite la structure bloc-angulaire duale de la matrice de contraintes,
an de paralleliser leort de calcul necessaire `a la resolution du PL. De mani`ere similaire
`a la methode de decomposition de Dantzig-Wolfe, la decomposition de Benders divise un
probl`eme de programmation lineaire (de grande taille) en un ou plusieurs sous-probl`emes
coordonnes par un probl`eme matre (PM). La solution optimale du probl`eme original est
identique `a la solution obtenue apr`es un nombre ni diterations de Benders [22]. Meme si
cette methode peut etre aussi utilisee dans la resolution de probl`emes doptimisation non
lineaires convexes [65, 39], dans le developpement qui suit, nous presentons et utilisons la
decomposition uniquement dans le contexte de la programmation lineaire.
Denition 5.3.1 Une matrice AAA est appelee bloc-angulaire duale si sa structure a la
forme suivante :
AAA =
_

_
AAA
1,0
000 000
AAA
2,0
AAA
2,2
000
.
.
.
AAA
n,0
000 AAA
n,n
_

_
. (5.10)
Le PL associe presente des variables couplantes qui empechent la resolution par blocs.
Ce sont les n
0
premi`eres variables de decision, o` u n
0
est le nombre de colonnes des matrices
AAA
i,0
.
En se rappelant la denition 4.4.1 dune matrice bloc-angulaire primale, on observe
que la structure bloc-angulaire duale nest rien dautre que la transposee de la structure
primale. Par consequent on peut formuler la proposition suivante.
Proposition 5.3.1 (Decomposabilite primale et duale [39]) Si un probl`eme de program-
mation lineaire presente une structure decomposable avec des contraintes couplantes, alors
son dual a une structure decomposable avec des variables couplantes. Et reciproquement,
si un PL presente une structure decomposable avec des variables couplantes, alors son dual
a une structure decomposable avec des contraintes couplantes.
Revenons `a la formulation (5.7) du probl`eme doptimisation. Pour simplier les equa-
tions utilisees dans la demarche suivante, nous omettrons la dependance des variables
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
150 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
vis-` a-vis de linstant de temps k. Alors, le PL `a resoudre secrit :
min
uuu

c
,uuu

1
,...,uuu

T
c
uuu

c
+
T
1
uuu

1
+ +
T
s
uuu

s
s.c. KKK
0
uuu

c
= uuu
c
KKK
0,1
uuu

c
+ GGG

0,1
uuu

1
= ggg

0,1
.
.
.
.
.
.
.
.
.
KKK
0,s
uuu

c
+ GGG

0,s
uuu

s
= ggg

0,s
uuu

c
000
2N
u
1
, uuu

1
, , uuu

s
000
(2N
u
+4N
2
)1
.
(5.11)
On peut identier uuu

c
comme la variable couplante du PL (5.11). Si lon dispose de la
valeur optimale de cette variable, alors loptimum global pourra etre calcule facilement
par la resolution (en parall`ele) des sous-probl`emes (SP
i
) :
z
i
(uuu

c
) = min
uuu

T
i
uuu

i
(5.12a)
sous les contraintes
GGG

0,i
uuu

i
= ggg

0,i
KKK
0,i
uuu

c
, (5.12b)
uuu

i
000
(2N
u
+4N
2
)1
. (5.12c)
Lidee principale de la methode de decomposition est de faire converger la valeur cou-
rante de la variable couplante vers la valeur optimale uuu

c
. En reportant (5.12a) dans (5.11),
le PL initial devient :
J = min
uuu

T
c
uuu

c
+
s

i=1
z
i
(uuu

c
), (5.13a)
sous les contraintes
KKK
0
uuu

c
= uuu
c
, (5.13b)
uuu

c
000
2N
u
1
. (5.13c)
Suite `a la dualite lineaire, z
i
(uuu

c
) est aussi loptimum de la formulation duale du (5.12),
i.e. :
z
i
(uuu

c
) = max
ppp
i
ppp
T
i
(ggg

0,i
KKK
0,i
uuu

c
), (5.14a)
sous les contraintes
GGG
T
0,i
ppp
i

i
. (5.14b)
La raison de lutilisation de la formulation duale des sous-probl`emes est que le poly`edre
U
0,i
=
_
ppp
i
| GGG
T
0,i
ppp
i

i
_
, qui denit le domaine faisable du probl`eme (5.14) est indepen-
dant de uuu

c
. La solution du PL (5.14) est un sommet ou un rayon extremal de U
0,i
. En
resolvant (5.14), lun des deux cas suivants peut se presenter.
1. Si loptimum du PL (5.14) est ni, alors sa solution est un sommet ppp

i
{ppp
i,j
|j N
d
i
1
}
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 151
du poly`edre U
0,i
. Loptimum peut sexprimer alors par :
z
i
(uuu

c
) = ppp
T
i
(ggg

0,i
KKK
0,i
uuu

c
)
= max
jN
d
i
1
ppp
T
i,j
(ggg

0,i
KKK
0,i
uuu

c
).
(5.15)
2. Si U
0,i
na pas de borne superieure, alors la solution du sous-probl`eme dual (5.14)
est un des rayons extremaux rrr

i
{rrr
i,j
|j N
e
i
1
} avec la propriete suivante :
rrr
T
i
(ggg

0,i
KKK
0,i
uuu

c
) > 0. (5.16)
Dans ce cas z
i
(uuu

c
) = +.
En regroupant (5.15) et (5.16), on peut ecrire loptimum du sous-probl`eme sous la
forme :
z
i
(uuu

c
) = min
z
i
z
i
, (5.17a)
sous les contraintes
ppp
T
i,j
(ggg

0,i
KKK
0,i
uuu

c
) z
i
, j N
d
i
1
, (5.17b)
rrr
T
i,j
(ggg

0,i
KKK
0,i
uuu

c
) 0, j N
e
i
1
. (5.17c)
Remarque 5.3.1 Le probl`eme (5.17) est simplement une reecriture du sous-probl`eme
dual (5.14), dont lobjectif est evalue au meilleur sommet du domaine de faisabilite.
Linteret de la contrainte (5.17c) apparat uniquement dans (5.18), car dans la formulation
(5.17) elle nagit pas sur la variable de decision.
Reportons (5.17) dans (5.13) pour obtenir :
J = min
uuu

c
,z
1
,...,z
s

T
c
uuu

c
+
s

i=1
z
i
, (5.18a)
sous les contraintes
KKK
0
uuu

c
= uuu
c
, uuu

c
000
2N
u
1
, z
i
0, i N
s
1
, (5.18b)
ppp
T
i,j
KKK
0,i
uuu

c
+ z
i
ppp
T
i,j
ggg

0,i
, i N
s
1
, j N
d
i
1
, (5.18c)
rrr
T
i,j
KKK
0,i
uuu

c
ppp
T
i,j
ggg

0,i
, i N
s
1
, j N
e
i
1
. (5.18d)
On appelle (5.18) le probl`eme matre complet, qui est equivalent au probl`eme initial. Par
rapport au PL (5.11), on a elimine toutes les variables uuu

i
, cest `a dire s(2N
u
+4N
2
) variables
scalaires, en ajoutant uniquement s variables scalaires. Cependant, cette transformation a
implique lapparition dun nombre considerable de contraintes.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
152 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
La formulation et la resolution du probl`eme (5.18) sont generalement plus diciles
que la minimisation du probl`eme initial. Sachant que pour la solution optimale peu
de contraintes sont actives, la methode de decomposition sappuie sur une strategie de
generation de contraintes. Lidee derri`ere cela est de resoudre le PM en utilisant unique-
ment un petit sous-ensemble de contraintes et de verier ensuite si lune des contraintes
non-incluses est violee.
Considerons le probl`eme matre restreint (PMR), qui comporte seulement s(l
B
1)
contraintes (de type sommet / rayon extremal) du probl`eme (5.18). Alors, `a literation l
B
,
le PMR peut secrire comme suit :
J
(l
B
)
= min
uuu

c
,z
1
,...,z
s

T
c
uuu

c
+
s

i=1
z
i
, (5.19a)
sous les contraintes
KKK
0
uuu

c
= uuu
c
, uuu

c
000
2N
u
1
, z
i
0, i N
s
1
, (5.19b)
ppp
T
i,j
KKK
0,i
uuu

c
+ z
i
ppp
T
i,j
ggg

0,i
, i N
s
1
, j N
k
1
, (5.19c)
rrr
T
i,j
KKK
0,i
uuu

c
ppp
T
i,j
ggg

0,i
, i N
s
1
, j N
l
B
1k
1
, (5.19d)
o` u k represente le nombre courant des sommets locaux identies par la resolution des
sous-probl`emes SP
i
.
`
A cause de labsence de certaines contraintes dans la formulation restreinte, loptimum
du PL (5.19) represente une borne inferieure de loptimum du probl`eme initial, i.e. :
J
(l
B
)
J. (5.20)
An de verier si les solutions du probl`eme (5.19), uuu
(l
B
)
c
, z
(l
B
)
i
, sont egalement optimales
pour le PM, il faut regarder si elles respectent toutes les contraintes non incluses, ce qui
peut etre verie par la resolution des sous-probl`emes SP
(l
B
)
i
:
max
ppp
i
ppp
T
i
(ggg

0,i
KKK
0,i
uuu
(l
B
)
c
), (5.21a)
sous les contraintes
GGG
T
0,i
ppp
i

i
, (5.21b)
comme suit.
1. Si la solution de (5.21) est innie, alors lalgorithme de resolution donne un rayon
extremal rrr
i,l
B
qui satisfait la condition :
rrr
T
i,l
B
(ggg

0,i
KKK
0,i
uuu
(l
B
)
c
) > 0. (5.22)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 153
Alors, la contrainte rrr
T
i,l
B
(ggg

0,i
KKK
0,i
uuu

c
) 0 nest pas satisfaite et elle doit etre ajoutee
au PMR.
2. Si la solution de (5.21) est nie, elle represente un sommet ppp
i,l
B
du poly`edre U
0,i
. De
plus, si :
ppp
T
i,l
B
(ggg

0,i
KKK
0,i
uuu
(l
B
)
c
) > z
(l
B
)
i
, (5.23)
alors la solution du PMR ne satisfait pas la contrainte ppp
T
i,l
B
(ggg

0,i
KKK
0,i
uuu

c
) z
i
. Alors
elle doit ainsi etre ajoutee `a la formulation (5.19).
3. Si
ppp
T
i,l
B
(ggg

0,i
KKK
0,i
uuu
(l
B
)
c
) z
(l
B
)
i
, i N
s
1
, (5.24)
alors la solution
_
uuu
(l
B
)
c
, z
(l
B
)
1
, ..., z
(l
B
)
s
_
est faisable et optimale pour le PM. La condi-
tion (5.24) permet la verication de loptimalite de la solution courante du PMR par
rapport au PM.
Dans la pratique, il nest pas forcement interessant de faire le calcul exact de la so-
lution optimale. La majorite des algorithmes de programmation mathematique ore la
possibilite darreter leurs iterations d`es que lecart entre loptimum et la solution courante
est inferieure `a une certaine erreur predenie . Cest aussi le cas de lalgorithme issu de
la methode de decomposition de Benders.
Loptimum du probl`eme (5.19) represente la borne inferieure courante de loptimum
du probl`eme initial, tandis que la borne superieure est denie par :
J
(l
B
)
=
T
c
uuu
(l
B
)
c
+
s

i=1

T
i
uuu
(l
B
)
i
, (5.25)
o` u
T
i
uuu
(l
B
)
i
est loptimum du probl`eme (5.21). Alors, la condition darret sexprime par
la relation : J
(l
B
)
J
(l
B
)
.
La gure 5.1 illustre levolution du domaine admissible du probl`eme matre restreint
pour le cas o` u le probl`eme initial se decompose en un PMR et un sous-probl`eme.
Remarque 5.3.2 La faisabilite du probl`eme initial implique la faisabilite du PMR tout au
long des iterations, i.e. les contraintes ajoutees (appelees coupes de Benders) ne reduisent
pas le domaine admissible du PMR `a lespace vide. Au contraire, si le probl`eme initial est
infaisable, alors apr`es un nombre ni diterations le PMR devient egalement infaisable.
La faisabilite du probl`eme initial ne garantit pas cette propriete pour les sous-probl`emes.
Malgre cet aspect, la formulation du probl`eme proposee dans le memoire (en relaxant les
contraintes de confort) assure la faisabilite des sous-probl`emes. Le point pour lequel toutes
les composantes de la sequence de commande sont nulles reste toujours faisable et il peut
etre egalement utilise comme point de depart de lalgorithme utilise pour la resolution des
SP
i
.
Le developpement expose ci-dessus aboutit sous la forme dun algorithme iteratif. La
procedure 5 presente les etapes `a suivre pour tous les controleurs an quils puissent
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
154 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
J
z
u
c
Iteration
J
J
J
z
u
c
Iteration
1 2 3 4
J
J
1 2 3 4
J
z
u
c
Iteration
1 2 3 4
J
J
J
z
u
c
Iteration
1 2 3 4
J
J
Figure 5.1 Exemple de levolution du domaine admissible du PMR
converger vers la solution optimale de commande.
Algorithme 5 Procedure iterative de la commande predictive distribuee basee sur la
decomposition de Benders
1 : Initialiser l
B
= 1
2 : Resoudre le PMR (5.19) par MPC
c
, en obtenant uuu
(l
B
)
c
et z
(l
B
)
i
, i N
s
1
3 : Envoyer uuu
(l
B
)
c
de MPC
c
vers tous les controleurs locaux MPC
i
4 : Resoudre (en parall`ele) tous les sous-probl`emes par les MPC
i
, en obtenant les
solutions primales uuu
(l
B
)
i
ainsi que les solutions duales (ppp
(l
B
)
i
ou rrr
(l
B
)
i
)
5 : Envoyer les solutions duales de tous les MPC
i
vers MPC
c
6 : Calculer les bornes courantes, superieure (5.25) et inferieure (5.19a), par MPC
c
7 : Si (l
B
l
Bmax
ET J
(l
B
)
J
(l
B
)
) Alors
7.1 : uuu

c
= uuu
(l
B
)
c
, uuu

i
= uuu
(l
B
)
i
, i N
s
1
, Stop
Sinon
7.2 : Mettre `a jour le PMR en ajoutant les nouvelles contraintes (par MPC
c
),
l
B
= l
B
+ 1 et Goto pas 2
Fin Si
La methode de decomposition de Benders, synthetisee dans ce paragraphe, requiert une
structure de commande distribuee avec s agents locaux, MPC
i
, qui g`erent les commandes
locales u
i
et un agent coordonnateur, MPC
c
, qui calcule la commande de la source centrale
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 155
u
c
. Le schema bloc de la structure de commande resultante est illustre gure 5.2 (gauche).
5.3.3 Mod`ele de prediction couple
Les paragraphes precedents ont montre comment la methode de decomposition de
Benders peut repartir leort de calcul dans une architecture de commande predictive
distribuee. Nous avons expose les idees de base de lapproche, `a partir desquelles on a
formule un algorithme iteratif.
Lecacite de la methode presentee sappuie principalement sur la structure parti-
culi`ere du probl`eme doptimisation. Plus precisement, cest la structure bloc-angulaire
duale de la matrice de contrainte qui permet de paralleliser une importante partie de lef-
fort de calcul, du fait de lindependance des sous-probl`emes. Cela nest plus valable si le
mod`ele de prediction prend en compte les couplages thermiques entre les zones adjacentes.
Cette partie traite de la prise en compte des couplages (par les sorties et par les
entrees) et leurs consequences sur les performances de la structure distribuee. Du point de
vue materiel, en considerant ces interactions entre les zones, il apparat necessaire de faire
communiquer les correcteurs locaux (voir la gure 5.2 droite).
u
c
u
2
xxx
1
MPC
c
MPC
1
MPC
2
MPC
s
u
3
u
1
xxx
2
xxx
3
u
c
u
2
xxx
1
MPC
c
MPC
1
MPC
2
MPC
s
u
3
u
1
xxx
2
xxx
3
Figure 5.2 Schema de commande distribuee base sur la methode de decomposition de
Benders, utilisant le mod`ele decouple (`a gauche) et le mod`ele couple (`a droite)
5.3.3.1 Couplage par les sorties
Nous considerons dans ce paragraphe les mod`eles zonaux lineaires couples par les
sorties :
_

_
xxx
i
(k + 1) = AAA
i
xxx
i
(k) +bbb
c
u
c
(k) +bbb
i
u
i
(k) +

jH
i
eee
j,i
y
j
(k)
y
i
(k) = ccc
T
i
xxx
i
(k),
(5.26)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
156 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
Les dierences, dans la formulation du PL, par rapport au cas decouple sont au niveau
des matrices bloc qui entre dans la composition des contraintes :
min
uuu

c
(k),uuu

1
(k),...,uuu

s
(k)

T
c
(k)uuu

c
(k) +
T
1
(k)uuu

1
(k) + +
T
s
(k)uuu

s
(k)
s.c. KKK
0
uuu

c
(k) = uuu
c
(k)
KKK
1
uuu

c
(k) + GGG

1
uuu

1
(k) = ggg

1
(k)
.
.
.
.
.
.
.
.
.
KKK
s
uuu

c
(k) + GGG

s
uuu

s
(k) = ggg

s
(k)
uuu

c
(k) 000
2N
u
1
, uuu

1
(k) , , uuu

s
(k) 000
(2N
u
+4N
2
)1
,
(5.27)
o` u
KKK
0
=
_
III
N
u
III
N
u
_
, KKK
i
=
_

_
000
N
u
N
u
000
N
u
N
u

c,i
000
N
2
N
u

c,i
000
N
2
N
u
_

_
, (5.28)

c,i
=
_

c,i
(0) 0 0

c,i
(1)
c,i
(0) 0 0
.
.
.
.
.
.
.
.
.

.
.
.

c,i
(N
2
1)
c,i
(N
2
N
u
+ 1)

N
2
N
u
j=0

c,i
(j)
_

_
, (5.29)

c,i
(j) = ccc
T
i
AAA
j
i
bbb
c,i
, j N
N
2
1
0
, (5.30)
tandis que les autres notations sont identiques `a celles utilisees au paragraphe 4.4.3.1. Les
vecteurs ggg

1
(k), i N
s
1
incluent dans leur formulations les sequences optimales futures de
sorties qui correspondent aux zones j H
i
:
yyy

j
(k) =
_
y
j
(k) y
j
(k + 1) y
j
(k + N
2
)
_
T
. (5.31)
Ces valeurs requises par le regulateur local MPC
i
sont diciles `a obtenir dans un environ-
nement distribue, car leur obtention peut alourdir signicativement la charge de calcul.
Une strategie simple et ecace est de remplacer les sequences (5.31) par les sorties predites
en utilisant la sequence optimale de commande calculee `a linstant k 1 :
yyy
j
(k 1) =
_
y
j
(k|k 1) y
j
(k + 1|k 1) y
j
(k + N
2
|k 1)
_
T
. (5.32)
La mise en place de cette strategie a peu de repercussions sur lalgorithme 5. Ainsi, une
fois les iterations de Benders arretees `a linstant k, les agents locaux calculent les sequences
locales de sorties et les envoient vers tous les controleurs voisins. Elles seront utilisees dans
les predictions de linstant k + 1.

Etude numerique de la vitesse de convergence Sachant que la mani`ere de prendre


en compte des couplages par les sorties ne modie pas fondamentalement lalgorithme 5,
nous allons maintenant etudier les performances de la procedure de distribution decrite
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 157
par lalgorithme decouple. Pour ce faire, nous prenons la structure du mod`ele de prediction
local (5.3) avec les valeurs numeriques suivantes :
AAA
0,i
=
_
0, 9921 0
0 0, 9931
_
, bbb
c,i
=
_
0
0, 1376
_
, bbb
i
=
_
0, 2595
0
_
, ccc
i
=
_
1
1
_
, (5.33)
et la periode dechantillonnage T
s
= 10min. Les valeurs numeriques (5.33) correspondent `a
une pi`ece de 12m
2
. Notons que du point de vue de loptimalite par rapport `a la formulation
du probl`eme `a un instant donne k, lutilisation de mod`eles decouples et de mod`eles couples
par les sorties est similaire. Cest pour cela que nous considerons un mod`ele de prediction
decouple.
Lecacite de lalgorithme distribue sera mesuree en fonction du temps de calcul dans
un environnement distribue (t
distr
) et du nombre diterations requises. Cette etude est
divisee en trois scenarios, dans lesquels on fait varier le nombre de sous-syst`emes, les
dimensions des sous-probl`emes et la valeur de lerreur qui denit la condition darret. Les
param`etres de reglage speciques `a la commande predictive utilises dans les experiences
sont N
1
= 1 et N
2
= 30, ce qui nous am`ene `a un horizon de prediction de 5h. Pour chaque
valeur du param`etre etudie, nous avons realise cinq essais dierents, avec des etats initiaux
aleatoires.
10
0
10
1
10
2
10
3
10
2
10
0
10
2
10
4


t
centr
t
distr
10
0
10
1
10
2
10
3
6
8
10
12
14
16
10
0
10
1
10
2
10
3
0
0.05
0.1
0.15
0.2
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
S
f
[
%
]
s
s
s
10
0
10
1
10
2
10
3
10
1
10
0
10
1
10
2
10
3


t
centr
t
distr
10
0
10
1
10
2
10
3
6
8
10
12
14
16
10
0
10
1
10
2
10
3
0
0.05
0.1
0.15
0.2
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
S
f
[
%
]
s
s
s
10
0
10
1
10
2
10
3
10
2
10
1
10
0
10
1
10
2


t
centr
t
distr
10
0
10
1
10
2
10
3
6
8
10
12
14
16
10
0
10
1
10
2
10
3
0
0.05
0.1
0.15
0.2
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
S
f
[
%
]
s
s
s
Figure 5.3 Inuence du nombre de zones, s, sur les performances de lalgorithme 5, en
utilisant le solveur Simplexe de MATLAB (`a gauche), la methode du point interieur (au
milieu) et le solveur CPLEX de IBM (`a droite)
Scenario 1 : Dans ce premier scenario, on xe N
u
= N
i
o
= 15 et = 10
3
et on fait
varier le nombre de zones s {2
1
, 2
2
, ..., 2
9
}. La gure 5.3 montre les performances de
lalgorithme distribue, en utilisant trois solveurs dierents : deux solveurs fournis par la
boite doutils Optimization de MATLAB (Simplexe et une methode du point interieur)
et CPLEX, developpe par IBM. Intuitivement, le nombre diterations ainsi que le degre
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
158 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
de sous-optimalite ne sont pas inuences par le type de solveur. Cependant, des ecart si-
gnicatifs en termes de temps de calcul peuvent etre observes, illustrant les performances
superieures du CPLEX. On constate laugmentation exponentielle du temps de calcul
centralise pour les deux solveurs de MATLAB. Pour CPLEX, cette croissance est signi-
cativement diminuee si le nombre de sous-syst`emes est faible (inferieur `a 16), pourtant
elle reprend lallure exponentielle d`es que les dimensions des probl`emes deviennent signi-
catives. De meme, le temps de calcul distribue presente une croissance tr`es faible avec
s.
Malgre la tr`es bonne extensibilite de lalgorithme, t
distr
devient inferieur `a t
centr
`a par-
tir dun certain nombre de sous-syst`emes (4 pour les solveurs de MATLAB et 128 pour
CPLEX, respectivement). Malgre la superiorite du CPLEX, pour les resultats presentes
dans les scenarios suivants nous utiliserons lalgorithme de Simplexe comme solveur prin-
cipal, car les correcteurs destines `a la regulation de la temperature sont generalement
implantes sur des puces `a faible puissance de calcul, sur lesquels il serait dicile de mettre
en place un algorithme tr`es elabore comme CPLEX. Concernant le nombre diterations,
on observe une dependance logarithmique en s, tandis que le degre de sous-optimalite est
lie `a la valeur de .
1 5 10 15 20 25 30
0
20
40
60
80


t
centr
t
distr
1 5 10 15 20 25 30
0
50
100
150


t
centr
t
distr
1 5 10 15 20 25 30
0
50
100
150
1 5 10 15 20 25 30
0
50
100
150
T
e
m
p
s
[
s
]
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
N
u
N
u
N
i
o
N
i
o
Figure 5.4 Inuence de la taille de lhorizon de commande, N
u
, (`a gauche) et du nombre
dinstants doccupation par zone, N
i
o
, (`a droite)
Scenario 2 : Nous nous sommes interesses ici `a etudier linuence de la dimension
(nombre de lignes et de colonnes de la matrice de contraintes) des sous-probl`emes :
d
i
= (N
u
+ 2N
i
o
) (2N
u
+ 4N
i
o
), (5.34)
sur le temps de calcul et sur le nombre diterations. Dans (5.34), N
i
o
represente le nombre
dinstants doccupation inclus dans lhorizon de prediction de la zone i. Notons que par
rapport `a la formulation (5.7), nous navons pas pris en compte ici les variables auxiliaires
associees aux instants dinoccupation. La gure 5.4 montre linuence de N
u
et N
i
o
sur
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 159
la vitesse de convergence. Les valeurs des autres param`etres sont s = 50 et = 10
3
.
Les resultats montrent un impact plus important de N
i
o
sur les indices de performance
consideres, ce qui sexplique par un poids plus grand sur la dimension du probl`eme. On
peut egalement observer le caract`ere exponentiel de la dependance de t
centr
vis-` a-vis des
deux param`etres (N
u
et N
i
o
).
Scenario 3 : Dans ce troisi`eme scenario nous illustrons les performances de lalgorithme
5 en fonction de la valeur de . Les resultats presentes gure 5.5 ont ete obtenus avec s = 50,
N
u
= 10 et N
i
o
= 15. On a omis de representer les facteurs de sous-optimalites, car ils
sont strictement lies `a la valeur de . On observe linuence leg`ere de ce param`etre sur le
temps de calcul dans le cas distribue. De plus, une dependance logarithmique du nombre
diterations sur peut etre constatee, ce qui montre la vitesse de convergence exponentielle
de la methode.
10
6
10
5
10
4
10
3
10
2
10
1
0
10
20
30
40


t
centr
t
distr
10
6
10
5
10
4
10
3
10
2
10
1
10
15
20
25
N
u
m
b
e
r

o
f

i
t
e
r
a
t
i
o
n
s
T
e
m
p
s
[
s
]

Figure 5.5 Inuence de lerreur, , qui denit la condition darret


Les trois scenarios precedents ont montre les performances en termes de vitesse de
convergence et de loptimalite de lalgorithme distribue. Le temps de calcul necessaire `a
la structure distribuee an de resoudre le PL (5.11) reste inferieur au temps de calcul
centralise d`es que lon depasse un certain nombre de sous-syst`emes. La dimension des
sous-probl`emes inuence egalement la vitesse de convergence (le nombre diterations). En
considerant N
2
xe, les param`etres qui jouent sur le nombre de contraintes et dinconnues
sont N
i
o
eu N
u
. Sachant que N
i
o
nest pas une param`etre de reglage, la diminution de N
u
peut reduire sensiblement le nombre diterations et nous conseillons un choix N
u
< N
2
/2.
Pourtant, il ne faut pas oublier la perte doptimalite par rapport au cas N
u
= N
2
, qui
devient encore plus importante quand la tarication de lenergie est variable dans le temps.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
160 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
5.3.3.2 Couplage par les entrees
Si lon consid`ere maintenant les s mod`eles couples par les entrees, alors la dynamique
de chaque sous-syst`eme est decrite par :
_

_
xxx
i
(k + 1) = AAA
i
xxx
i
(k) +bbb
c
u
c
(k) +bbb
i
u
i
(k) +

jH
i
eee
j,i
u
j
(k)
y
i
(k) = ccc
T
i
xxx
i
(k).
(5.35)
En recourant `a une technique similaire `a celle presentee aux paragraphes precedents, le
probl`eme doptimisation global peut sexprimer comme suit :
min
uuu

c
(k),uuu

1
(k),...,uuu

s
(k)

T
c
(k)uuu

c
(k) +
T
1
(k)uuu

1
(k) + +
T
s
(k)uuu

s
(k)
s.c. KKK
0
uuu

c
(k) = uuu
c
(k)
KKK
1
uuu

c
(k) + GGG

1
uuu

1
(k) + + GGG

s,1
uuu

s
(k) = ggg

1
(k)
.
.
.
.
.
.
.
.
.
KKK
s
uuu

c
(k) + GGG

1,s
uuu

1
(k) + + GGG

s
uuu

s
(k) = ggg

s
(k)
uuu

c
(k) 000
2N
u
1
, uuu

1
(k) , , uuu

s
(k) 000
(2N
u
+4N
2
)1
,
(5.36)
et la structure bloc-angulaire duale de la matrice de contraintes se perd (voir la gure 5.6
pour un exemple de couplage de 6 zones). Les sous-probl`emes deviennent ainsi dependants
les uns des autres, ce qui ne permet plus la resolution du probl`eme relaxe par blocs.
Or, lecacite en termes de temps de calcul de la methode de decomposition sappuie
exactement sur cette parallelisation (pas 4 de lalgorithme 5).
u
c
u
1
u
2
u
3
u
4
u
5
u
6
1
2
3
4
5
6
KKK
0
KKK
1
KKK
2
KKK
3
KKK
4
KKK
5
KKK
6
GGG

1
GGG

2
GGG

3
GGG

4
GGG

5
GGG

6
GGG

2,1
GGG

4,1
GGG

1,2
GGG

3,2
GGG

5,2
GGG

2,3
GGG

6,3
GGG

1,4
GGG

5,4
GGG

2,5
GGG

4,5
GGG

6,5
GGG

3,6
GGG

5,6
Figure 5.6 Exemple de batiment multizone multisource (`a gauche) et structure de la
matrice de contraintes du PL associe (`a droite)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 161
Algorithme 6 Procedure iterative de la commande predictive distribuee basee sur la
decomposition de Benders, avec la prise en compte des couplages par les entrees
1 : Initialiser l
B
= 1, l
i
= 1
2 : Resoudre le PMR (5.19) par MPC
c
, en obtenant uuu
(l
B
)
c
et z
(l
B
)
i
, i N
s
1
3 : Envoyer uuu
(l
B
)
c
de MPC
c
vers tous les controleurs locaux MPC
i
4 : Resoudre (en parall`ele) tous les sous-probl`emes par les MPC
i
, en obtenant les
solutions primales uuu
(l
B
,l
i
)
i
ainsi que les solutions duales (ppp
(l
B
)
i
ou rrr
(l
B
)
i
)
5 : Si (l
i
l
max
ET
_
_
_uuu
(l
B
,l
i
)
i
uuu
(l
B
,l
i
1)
i
_
_
_

<
i
, i N
s
1
) Alors
5.1 : Envoyer les solutions duales (ppp
(l
B
,l
i
)
i
ou rrr
(l
B
,l
i
)
i
) de tous les MPC
i
vers MPC
c
Sinon
5.2 : Envoyer uuu
(l
B
,l
i
)
i
de MPC
i
vers tous leurs voisins j H
i
5.3 : Mettre `a jour l
i
= l
i
+ 1 et Goto pas 4
Fin Si
6 : Calculer les bornes courantes, superieure (5.25) et inferieure (5.19a), par MPC
c
7 : Si (l
B
l
Bmax
ET J
(l
B
)
J
(l
B
)
) Alors
7.1 : uuu

c
= uuu
(l
B
)
c
, uuu

i
= uuu
(l
B
)
i
, i N
s
1
, Stop
Sinon
7.2 : Mettre `a jour le PMR en ajoutant les nouvelles contraintes (par MPC
c
),
l
B
= l
B
+ 1 et Goto pas 2
Fin Si
Pour prendre en compte les couplages par les entrees, nous proposons un compromis
entre le temps de calcul distribue et loptimalite de la solution resultante. Sachant que
par leur denition, les matrices bloc-diagonales GGG

i
sont dominantes, on peut envisager
dutiliser les sequences futures dentrees calculees ` a une iteration precedente (comme au
paragraphe 4.4.3.2). Cependant, il faut etre conscient de la perte doptimalite engendree
par le fait que les solutions duales des sous-probl`emes ainsi calculees ne sont pas force-
ment des sommets ou des rayons extremaux du domaine admissible local. La procedure,
construite initialement pour des mod`eles decouples, se modie, en ajoutant un mecanisme
diterations imbriquees, ce que presente lalgorithme 6.
La structure de controle resultante est schematisee gure 5.7, dans laquelle on illustre
les principales composantes ainsi que les interactions et les informations echangees entre
les agents, pour le cas du batiment trois pi`eces.

Etude numerique de lecacite de lalgorithme distribue Pour tester leca-


cite du nouvel algorithme sur un exemple, considerons le mod`ele (5.35) avec les valeurs
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
162 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
uuu

1
uuu

2
,
2
, www
2
, uuu
2

3
,
3
, www
3
, uuu
3
u
1
u
2
u
3
y
1
y
2
y
3
Observateur
1
xxx
1
MPC
2
MPC
3
MPC
1
Observateur
2
Observateur
3
xxx
2
xxx
3
uuu

1
,
1
, www
1
, uuu
1
T
ext
MPC
c
ppp
2
/ rrr
2
uuu

c
uuu

c
ppp
3
/ rrr
3
uuu

c
ppp
1
/ rrr
1
uuu
c
,
u
c
Figure 5.7 Schema de controle distribue base sur la methode de decomposition de
Benders
numeriques suivantes :
AAA
i
=
_
0,992 0 0
0 0,993 0
0 0 0,998
_
, bbb
c,i
=
_
0
0,137
0
_
, bbb
i
=
_
0,259
0
0
_
, ccc
i
=
_
1
1
1
_
, eee
j,i
=
_
0
0
0,02
_
, j H
i
.
(5.37)
La conguration du batiment est representee par un ensemble de s zones disposees en
serie, i.e. H
1
= {2}, H
s
= {s 1} et H
i
= {i 1, i +1}, i N
s1
2
. Les valeurs numeriques
(5.37) correspondent `a celles de (5.33) dont nous avons ajoute inuence du couplage.
Nous utiliserons la variable pour etudier linuence du gain statique de couplage sur les
performances de lalgorithme.
Letude de lecacite de lalgorithme 6 se deroule dune mani`ere similaire `a celle
exposee au paragraphe 5.3.3.1. De plus, nous presentons egalement les degres de sous-
optimalites des solutions distribuees ainsi que le nombre moyen diterations imbriquees
requises. Pour obtenir les resultats de simulation exposes ci-dessous, nous avons utilise les
valeurs suivantes pour les param`etres de reglage : N
2
= 30, N
i
o
= 15 et =

= 10
3
,
T
s
= 10min.
Scenario 1 : On consid`ere N
u
= 15 et = 1 xes et on fait varier le nombre de
sous-syst`emes s {2
1
, 2
2
, ..., 2
8
}. Comme nous lavons dej` a mentionne, la procedure de
resolution du probl`eme relaxe par lalgorithme de communication ne converge pas force-
ment vers la solution optimale globale. Les solutions duales ainsi calculees peuvent etre
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 163
dierentes des sommets et / ou des rayons extremaux des sous-probl`emes. Par consequent,
lalgorithme 6 ne garantit plus la convergence vers la solution optimale. Ce phenom`ene est
observe gure 5.8, o` u certains degres de sous-optimalite obtenus sont superieurs `a lerreur
qui decrit la condition darret des iterations. Pourtant, S
f
reste `a des valeurs faibles.
10
0
10
2
0
0.5
1
1.5
10
0
10
2
10
2
10
0
10
2
10
4


10
0
10
2
5
10
15
20
10
0
10
2
0
10
20
30
t
centr
t
distr
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
N
o
m
b
r
e
m
o
y
e
n
d

i
t
e
r
a
t
i
o
n
s
i
m
b
r
i
q
u
e
e
s
S
f
[
%
]
s s
s s
Figure 5.8 Inuence du nombre de sous-syst`emes sur les performances de lalgorithme
6
Concernant la charge de calcul, en utilisant le solveur centralise le temps de calcul
depasse 1200s (soit le double de la periode dechantillonnage consideree) pour un ensemble
de 256 zones. Notons egalement que lutilisation de solveurs plus performants comme
CPLEX diminue considerablement le temps de calcul. Lextensibilite de lalgorithme 5
se conserve egalement pour sa version `a iterations imbriquees, ainsi que la croissance
logarithmique du nombre diterations de Benders. Pour un grand nombre de sous-syst`emes,
le nombre diterations imbriquees augmente. Ceci engendre une hausse leg`ere du temps de
calcul distribue.
Scenario 2 : Ce scenario etudie leet du param`etre N
u
sur les performances de lal-
gorithme. Pour ce faire nous xons s = 40 et = 1. La gure 5.9 montre que lecart
entre le temps de calcul centralise et le temps de calcul de lalgorithme distribue augmente
avec N
u
. Autrement dit, lecacite de la procedure distribuee sameliore avec laugmenta-
tion de la dimension des sous-probl`emes. Ce phenom`ene est intuitif car les sous-probl`emes
sont resolus en parall`ele. On observe egalement une croissance leg`ere du degre de sous-
optimalite.
Scenario 3 : Ce troisi`eme scenario nous montre les limitations, du point de vue temps de
calcul, de lalgorithme 6. Un couplage fort entre les sous-syst`emes provoque laugmentation
du nombre des deux types diterations de lalgorithme. Cela a des repercussions sur la
charge de calcul. On peut voir gure 5.10 laugmentation du temps de calcul distribue
avec . Cependant, les performances du solveur centralise ne sont pas inuencees par
ce param`etre, car les dimensions du probl`eme global restent inchangees. Malgre cette
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
164 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
5 10 15
0
0.005
0.01
0.015
0.02
5 10 15
0
5
10
15
20


t
centr
t
distr
5 10 15
5
10
15
20
5 10 15
0
2
4
6
8
10
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
N
o
m
b
r
e
m
o
y
e
n
d

i
t
e
r
a
t
i
o
n
s
i
m
b
r
i
q
u
e
e
s
S
f
[
%
]
N
u
N
u
N
u
N
u
Figure 5.9 Inuence de lhorizon de commande sur les performances de lalgorithme 6
deterioration du temps de calcul distribue, la solution proposee par lalgorithme 6 reste
toujours tr`es proche de la solution centralisee et faible en temps de calcul.
1 2 3 4 5
0
0.01
0.02
0.03
1 2 3 4 5
0
10
20
30


t
centr
t
distr
1 2 3 4 5
14
16
18
20
22
1 2 3 4 5
0
10
20
30
T
e
m
p
s
[
s
]
N
o
m
b
r
e
d

i
t
e
r
a
t
i
o
n
s
d
e
B
N
o
m
b
r
e
m
o
y
e
n
d

i
t
e
r
a
t
i
o
n
s
i
m
b
r
i
q
u
e
e
s
S
f
[
%
]


Figure 5.10 Inuence du gain statique de couplage () sur les performances de lalgo-
rithme 6
5.3.4 Resultats de simulation
Par rapport aux paragraphes precedents o` u nous avons montre le calcul des algorithmes
distribues bases sur la methode de decomposition de Benders, cette partie sera dediee `a
letude des performances economiques de lalgorithme distribue. La structure de controle
developpee dans ce chapitre sera utilisee pour la regulation de la temperature dans un
batiment virtuel divise en trois zones. La conguration du batiment est illustree gure 5.11.
Toutes les zones (chacune dune surface egale `a 12m
2
) sont chauees par des convecteurs
electriques identiques, de puissances maximales u
i
= 1200W. Ils constituent les sources
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 165
locales de chauage. La source centrale est representee par un syst`eme de chauage par le
plancher. Ce dernier est compose dune chaudi`ere `a gaz, dune pompe `a vitesse constante
et dun reseau de tuyaux. Une importante partie des syst`emes de chauage par le sol ne
presente pas de vannes locales, pour chaque zone, ainsi lenergie calorique est repartie
simultanement dans lensemble des zones. Cest ce type de syst`eme que nous considerons
dans la suite du paragraphe.
u
3
u
1
u
2
Zone1 Zone2
Zone3
y
1
y
2
y
3
6m
2m
4m
u
c
Figure 5.11 B atiment multizone et multisource
Les grandeurs locales de commande, u
i
, sont representees par les puissances electriques
et la commande centrale, u
c
, exprime lecart entre la temperature de leau qui sort T
wout
et la temperature de leau qui entre T
win
dans la chaudi`ere. On suppose que la chaudi`ere
est controlee par un regulateur ideal qui recoit u
c
(k) = T(k) = T
wout
T
win
comme
consigne. Les simulations ont ete menees sous lhypoth`ese que cette boucle interne de
commande est stationnaire et transparente. De plus, nous negligeons egalement le retard
induit par le transport de leau dans la tuyauterie (etant nettement inferieur `a la periode
dechantillonnage T
s
= 10min), ainsi que les pertes de chaleur du syst`eme hydraulique. La
limite superieure de la commande centrale est u
c
= 4
o
C. Notons quil est tout `a fait possible
dinclure dautres contraintes (sur la temperature de leau dans le circuit, sur lincrement
de la commande, etc.), qui ne perturbent pas le fonctionnement de lalgorithme distribue.
Les co uts locaux
i
(k + j) associes aux commandes locales sont calcules selon (4.71),
tandis que le co ut associe `a la commande centrale sexprime par :

c
(k + j) = c
g
(k + j)T
s
C
pw

w
q
w
/(36 10
5
), (5.38)
o` u c
g
represente le tarif (en e/kWh) du gaz, C
pw
,
w
et q
w
sont respectivement la capacite
thermique massique, la densite et le debit de leau dans le circuit hydraulique. Le param`etre
correspond au rendement de la chaudi`ere. Les simulations ont ete realisees en supposant
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
166 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
que le tarif de lelectricite est c
e
= 0, 0742 e/kWh et celui du gaz c
g
= 0, 063 e/kWh.
Le mod`ele considere dans les resultats presentes dans ce paragraphe a ete obtenu de
mani`ere analytique, par le biais des equations thermo-dynamiques (integrant les pheno-
m`enes de transfert convectif et radiatif), dune mani`ere similaire `a [102]. Nous ne detaillons
pas le mod`ele, `a cause de ses dimensions. Mentionnons que pour le batiment considere,
le mod`ele global atteint 151 etats. Cette dimension relativement importante est princi-
palement d u `a la discretisation spatiale des parois, en plusieurs couches longitudinales,
pour simuler avec plus de precision le transfert thermique `a travers les materiaux qui les
composent. Le nombre de couches depend des proprietes thermiques des materiaux ainsi
que de leur epaisseur. Par exemple, une paroi externe est divisee en neuf couches. Apr`es
la discretisation temporelle du mod`ele, nous avons reduit sa dimension par le biais de la
technique de realisation equilibree, en arrivant `a 50 etats.
Le mod`ele de prediction comporte deux entrees de plus que celui decrit par les equations
(5.35). Elles representent la temperature exterieure et la temperature du sol (dessus le
plancher bas). Dans lequation de prediction, la temperature exterieure est consideree
constante pendant toute la periode de prediction et sa valeur est egale `a la temperature
courante mesuree. La temperature du sol est consideree constante et egale `a 10
o
C.
Zone 1 Zone 2 Zone 3
w
i
[
o
C] 19,5 20,5 21,5
w
i
[
o
C] 20,5 21,5 22,5
PO 1 08h00 - 17h00 10h00 - 19h00 14h00 - 18h00
PO 2 08h00 - 12h00 13h00 - 17h00 18h00 - 22h00
PO 3 08h00 - 17h00 08h00 - 17h00 08h00 - 17h00
Table 5.1 Prols doccupation pour le cas multizone et multisource
Pour etudier les performances economiques de lapproche proposee dans ce chapitre on
consid`ere trois prols doccupation, qui sont synthetises dans le tableau 5.1. Ces prols
correspondent `a une occupation semi-synchronisee (PO 1), non synchronisee (PO 2) et
synchronisee (PO 3). Les bandes de confort de chacune des pi`eces sont dierentes.
Le tableau 5.2 resume les co uts journaliers lies au poste de chauage du batiment trois
pi`eces, pour les scenarios doccupation proposes. De plus on ajoute un autre param`etre `a
cette etude, la temperature initiale (au debut de la journee) du batiment, T
0
. Elle represente
la temperature de lair dans les pi`eces, mais egalement la temperature initiale des parois.
Les deux valeurs choisies correspondent `a une periode dinoccupation longue (10
o
C) et `a
une occupation journali`ere intermittente (16
o
C), respectivement.
Nous comparons les co uts journaliers obtenus par lutilisation de la commande predic-
tive (centralisee et distribuee) `a ceux obtenus par une regulation de type PI avec antici-
pation. Pour que la commande PI ait des performances similaires, en termes de confort,
aux controleurs predictifs, les consignes locales des PIs, employes pour la commande des
convecteurs, sont anticipees. Pour que cette comparaison soit encore plus realiste, cette
anticipation est consideree dieremment, selon la temperature initiale : 2h et respective-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 167
T
0
[
o
C] Loi de commande Specicite
Co ut/jour [e]
PO 1 PO 2 PO 3
10
PI K = 0, 5, T
i
= 5400s 1,5855 1,6186 1,6066
DiMPCB
l
Bmax
= 1 1,6559 1,6061 1,7157
l
Bmax
= 2 1,3038 1,3190 1,4417
l
Bmax
= 3 1,1929 1,2362 1,3366
l
Bmax
= 100, = 10
3
1,1250 1,1992 1,2340
CMPC - 1,1188 1,2095 1,2590
16
PI K = 0, 5, T
i
= 5400s 1,0121 1,0558 0,9973
DiMPCB
l
Bmax
= 1 1,0756 1,0804 1,0972
l
Bmax
= 2 0,7586 0,8582 0,7343
l
Bmax
= 3 0,7460 0,8558 0,7363
l
Bmax
= 100, = 10
3
0,7450 0,8569 0,7325
CMPC - 0,7457 0,8640 0,7281
Table 5.2 Comparaison en termes de co uts de chauage pour le cas multizone et mul-
tisource
ment 4h. Pour le cas de la regulation PI, la chaudi`ere est controlee par une commande
en boucle ouverte, an de monter la temperature des pi`eces jusqu`a 18
o
C au debut de
loccupation de la premi`ere zone (cest ce type de commande qui est couramment utilisee
pour la regulation du poste de chauage `a SUPELEC, sur le Campus de Rennes), sans
compter lapport des convecteurs locaux.
Le tableau 5.2 montre egalement les co uts journaliers obtenus en utilisant peu ditera-
tions de Benders. La moyenne des dierences relatives obtenues entre le solution distribuee
issue de 3 iterations et la solution obtenue en iterant jusqu`a lobtention dune erreur de
= 10
3
ne depasse pas 3 %. Ceci montre que lutilisation dun nombre reduit diterations
de Benders ne degrade pas signicativement les performances economiques de la commande
distribuee.
Dapr`es les resultats obtenus, les structures predictives permettent des economies de 18
`a 29 % par rapport `a la regulation PI. Sachant que les gains en termes de consommation
presentes lors des chapitres precedents ont ete sensiblement inferieurs, on deduit alors
que lutilisation dune commande optimale, comme MPC, est beaucoup plus adaptee `a la
gestion des sources multiples de chauage.
De mani`ere generale, les economies apportees par la commande predictive sont dau-
tant plus importantes que la source centrale soit active. Ceci se passe quand lhorizon de
prediction inclut des periodes doccupation de plusieurs pi`eces. Les resultats leg`erement
meilleurs, dans certains scenarios, de la solution distribuee par rapport `a celle centralisee
peuvent paratre surprenants. Ils sexpliquent par le fait que la solution optimale calculee
par CMPC nest pas forcement la meilleure en presence des perturbations et des erreurs
de modelisation.
La gure 5.12 illustre le comportement de la commande predictive distribuee (DiMPCB)
sur une journee, en utilisant le prol doccupation PO 1, T
0
= 16
o
C et une tarica-
tion constante dans le temps. La premi`ere sous-gure montre levolution temporelle des
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
168 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
temperatures mesurees dans les trois zones, ainsi que les bandes de confort associees. La
deuxi`eme sous-gure represente les commandes locales, tandis que la troisi`eme illustre la
commande centrale. On peut facilement observer leet ancipatif du MPC au debut et `a
la n des periodes doccupation.
3 5 8 9 10 14 17 18 19 24
16
18
20
22
Temps [h]
T
e
m
p

r
a
t
u
r
e

[
o
C
]


y
1
y
2
y
3
3 5 8 9 10 14 17 18 19 24
0
0.5
1
Temps [h]
P
u
i
s
.

l
e
c
.

[
x
1
,
2
k
W
]


u
1
u
2
u
3
3 5 8 9 10 14 17 18 19 24
0
2
4
Temps [h]


T

[
o
C
]
3 5 8 9 10 14 17 18 19 24
20
30
40
Temps [h]
T
w

[
o
C
]


T
wout
T
win
3 5 8 9 10 14 17 18 19 24
6
7
8
9
10
T
e
x
t

[
o
C
]
Temps [h]


3 5 8 9 10 14 17 18 19 24
0
50
100
150
200

R
a
y
o
n
.

s
o
l
a
i
r
e

[
W
/
m
2
]
T
ext
Ray. direct
Ray. diffus
Figure 5.12 DiMPCB - signaux principaux sur une journee (PO 1, T
0
= 16
o
C)
Par rapport aux resultats des chapitres precedents, ici larret du chauage avant la n
doccupation est beaucoup plus visible, etant donne linertie du chauage par le plancher.
Dans ce scenario, la source centrale est preferee pendant letape de prechauage pour
mieux exploiter linertie thermique de ce type de chauage, mais egalement lorsque toutes
les pi`eces sont occupees. Les sources locales sont utilisees comme sources complementaires
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.3. MPC avec commande centrale 169
`a cause du prix eleve de lelectricite. Elles sont employees pour le rejet des perturbations
negatives et pour satisfaire les niveaux de confort dierents de chaque zone. On observe
egalement que la source locale de la zone 1 (pour laquelle on a deni le plus bas niveau de
confort) est utilisee uniquement pendant la relance. Ensuite, son niveau de confort nest
plus assure que par la source centrale. La quatri`eme sous-gure montre levolution de la
temperature de leau `a lentree et `a la sortie de la chaudi`ere. Notons quune contrainte
qui denit une borne superieure de la temperature de leau peut egalement etre incluse
dans la formulation du PL, pour prevenir lusure excessive des equipements. La derni`ere
sous-gure illustre les conditions meteorologiques simulees.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
14
16
18
20
22
Temps [h]
T
e
m
p

r
a
t
u
r
e

[ o
C
]


y
1
y
2
y
3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
0.5
1
Temps [h]
P
u
i
s
.

l
e
c
.

[
x
1
,
2
k
W
]


u
1
u
2
u
3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
2
4
Temps [h]


T

[
o
C
]
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
20
30
40
Temps [h]
T
w

[
o
C
]


T
wout
T
win
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0.06
0.065
0.07
0.075
Temps [h]
T
a
r
i
f

[
e
u
r
o
s
/
k
W
h
]


c
e
c
g
Figure 5.13 DiMPCB - signaux principaux sur une journee (PO 2, T
0
= 16
o
C), tari-
cation xe
Encore plus interessant est de voir comment la commande sadapte aux tarications
variables des energies de chaue. Dans ce sens, nous avons utilise deux scenarios de tari-
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
170 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
cation : une tarication xe (gure 5.13) et une tarication variable (gure 5.14). Les deux
simulations ont ete menees pour le prol doccupation PO 2, T
0
= 16
o
C, tandis que les
conditions meteorologiques sont identiques `a celles illustrees par la derni`ere sous-gures
de la gure 5.12.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
14
16
18
20
22
Temps [h]
T
e
m
p

r
a
t
u
r
e

[ o
C
]


y
1
y
2
y
3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
0.5
1
Temps [h]
P
u
i
s
.

l
e
c
.

[
x
1
,
2
k
W
]


u
1
u
2
u
3
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0
2
4
Temps [h]


T

[
o
C
]
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
20
30
40
Temps [h]
T
w

[
o
C
]


T
wout
T
win
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0.02
0.04
0.06
0.08
Temps [h]
T
a
r
i
f

[
e
u
r
o
s
/
k
W
h
]


c
e
c
g
Figure 5.14 DiMPCB - signaux principaux sur une journee (PO 2, T
0
= 16
o
C), tari-
cation variable
Pour le cas dune tarication xe, on observe que la source centrale est utilisee unique-
ment pendant des periodes pour lesquelles au moins deux zones presentent des instants
doccupation inclus dans lhorizon courant de prediction. Par exemple, `a partir de 8h00,
la zone 1 est occupee, mais on voit egalement le premier instant doccupation de la zone
2 (lhorizon de prediction est de cinq heures). Un phenom`ene similaire se passe `a partir de
13h00. Une exception est lutilisation de la source centrale avant la periode de prechauage
de la zone 1. En chauant leau qui circule par le sol, on diminue les deperditions par le
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
5.4. Conclusion 171
sol.
La gure 5.14 illustre les principaux signaux qui decrivent le comportement de la
commande DiMPCB avec une tarication variable. Ainsi, de 00h00 `a 07h00 lelectricite
est moins ch`ere que le gaz et par consequent on ne voit plus lutilisation de la source
centrale avant le prechauage de la zone 1. Dans le meme temps, la periode de relance est
leg`erement avancee, pour benecier encore plus du tarif inferieur de lelectricite. De 07h00
`a 11h00, on utilise les memes tarifs que dans la gure 5.13 et on observe un comportement
similaire `a celui obtenu pour la tarication xe. De 11h00 ` a 15h00, on consid`ere le gaz
environ 2,35 fois moins cher que lelectricite. Cette periode inclut le prechauage de la zone
2, ainsi au lieu dutiliser la source locale (voir gure 5.13), on pref`ere la source centrale.
5.4 Conclusion
Dans ce dernier chapitre, nous avons propose une methodologie de distribution de la
commande predictive pour la regulation dun syst`eme de chauage un peu particulier,
dans le cadre multizone. Le poste de chauage considere est compose de sources locales,
independantes, et dune source centrale.
Le probl`eme doptimisation du MPC est formule pour minimiser les co uts lies au chauf-
fage du batiment sous des contraintes qui modelisent les limites physiques du processus
et le confort thermique des occupants. En employant la meme technique de relaxation de
contraintes que celle presentee au paragraphe 4.4.1, le probl`eme de minimisation peut etre
mis sous la forme standard dun PL.
En negligeant tout dabord les couplages entre les sous-syst`emes voisins, on obtient
une structure particuli`ere du PL. Cette specicite du probl`eme peut etre exploitee par
la methode de decomposition de Benders an dobtenir une structure de commande dis-
tribuee, dont tous les correcteurs locaux sont coordonnes par lagent qui commande egale-
ment la source centrale.
`
A partir du probl`eme MPC initial, nous avons presente la methode
de decomposition, pour formuler un algorithme iteratif qui decrit les etapes `a suivre par
chaque agent. La prise en compte des interactions entre les sous-syst`emes necessite des
echanges dinformations entre les regulateurs voisins. Deux types de couplage ont ete
consideres : le couplage par les sorties et le couplage par les entrees.
Les performances des algorithmes distribues ont ete testees pour des exemples rela-
tivement simples de mod`eles de prediction. Ainsi, nous avons analyse du point de vue
numerique les impacts des principaux param`etres susceptibles davoir une inuence sur
la vitesse de convergence et le degre doptimalite de la solution distribuee. Les aspects
economiques ont ete mis en evidence par lapplication sur un batiment virtuel.
Ce chapitre compl`ete lensemble des algorithmes de commande distribuee proposes tout
au long du memoire. Dans le chapitre suivant, nous soulignons les conclusions globales
sur les travaux presentes et nous proposerons des perspectives, `a la fois theoriques et
applicatives.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
172 5. MPC lineaire multivariable pour la regulation thermique multizone et multisource
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Chapitre 6
Conclusion generale et
perspectives
La vie est supportable uniquement parce que lon ne va pas
jusquau bout.
Magazine litteraire
Emil M. Cioran
Lensemble de ce memoire est dedie au developpement de strategies MPC distribuees,
appliquees `a la regulation thermique des batiments. Trois classes de probl`emes ont ete
etudiees dans les chapitres precedents, `a savoir, la formulation quadratique sans contraintes,
la formulation lineaire avec contraintes locales et / ou contraintes globales et enn la for-
mulation lineaire avec contraintes locales pour la gestion de sources multiples denergie.
Dans chaque chapitre, nous avons formalise et analyse les probl`emes poses, avant dex-
pliciter les solutions proposees, tout en soulignant les dierentes contributions apportees.
Chacune de nos strategies a ete testee en simulation.
6.1 Synth`ese
La simplicite des solutions de controle a ete toujours privilegiee, cest pourquoi les
controleurs adoptes par la communaute industrielle sont generalement bases sur des com-
mandes de type si condition alors action , combinees `a des regulateurs simples, de type
PID. Ces r`egles, etablies par les constructeurs, sont usuellement heuristiques et obtenues
dune mani`ere empirique. Les controleurs resultants donnent des solutions sous-optimales.
La commande optimale des equipements de CVC est une etape cle vers lamelioration
de lecacite energetique des batiments. Dorenavant, le regulateur du poste de chauage
ne doit plus maintenir la temperature de la pi`ece autour de la valeur de consigne, mais il
doit egalement exploiter de fa con optimale, des informations concernant :
loccupation intermittente,
la tarication variable de lenergie,
173
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
174 6. Conclusion generale et perspectives
la prevision meteo,
la puissance disponible (variable).
De plus, le developpement des reseaux sans l ainsi que la disponibilite de plusieurs sources
de chauage dans un seul batiment nous a conduit vers des strategies de controle dis-
tribuees.
La commande predictive est une technique puissante, eprouvee industriellement, pour
la regulation optimale des syst`emes complexes. Les resultats presentes dans ce manuscrit,
comme ceux fournis dans de nombreuses publications, ont souligne les avantages, en termes
de consommation et / ou de confort, de la commande predictive. Malgre ces ameliorations
en performance, lindustrie du batiment reste encore reticente quant `a ladoption du MPC
[117]. Les principaux inconvenients de lapproche predictive sont la necessite dun mod`ele
du processus `a controler et les co uts relativement eleves de mise en uvre.
Des travaux de recherche importants ont ete menes durant ces derni`eres annees sur la
modelisation des phenom`enes thermiques presents dans le batiment. Les plus importants
dentre eux ont abouti `a la mise en place de dierents logiciels de simulation. Pourtant,
les travaux presentes dans ce manuscrit ne sont pas focalises sur la problematique de
modelisation. Nous nous sommes eorces de proposer des solutions aboutissant `a un com-
promis entre loptimalite de la commande, dune part, et la simplicite et la exibilite de
limplantation, dautre part. Ainsi, la commande predictive distribuee a ete choisie comme
principal outil de notre approche.
Le developpement de la demarche exposee dans cette th`ese est progressif. La gure 6.1
resume les principales problematiques abordees dans ce manuscrit et les solutions adoptees,
ainsi que leur repartition par chapitre.
Batiment Solution Formulation du probl`eme MPC
multizone DiMPCL
lineaire, contraintes globales
lineaire, contraintes locales
quadratique, sans contraintes
multizone et
lineaire, contraintes locales
quadratique, sans contraintes monozone
DiMPCHC, DiMPCHV
RST dynamique
DiMPCB
Chapitre
multisource
5
DiMPCDW
4
3
Figure 6.1 Recapitulatif des probl`emes et des solutions proposees dans le manuscrit
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
6.1. Synth`ese 175
Nous avons considere, tout dabord, la formulation quadratique du crit`ere MPC, pour
laquelle nous synthetisons un regulateur de type RST. La prise en compte du prol doccu-
pation dans la fonction de co ut `a minimiser rend dynamiques les coecients du controleur
polynomial (pour le cas sans contraintes). Des ameliorations de performance ont ete ob-
tenues par la mise en place dune strategie de variation de lhorizon de prediction, en
fonction du prol doccupation. Malgre son impact relativement reduit pour le cas mono-
zone, son importance devient signicative en passant au cas multizone. La prise en compte
du couplage entre les zones nous a conduit vers une structure MPC distribuee, qui preserve
les avantages de la decentralisation de la commande tout en ameliorant les performances
par rapport `a une structure compl`etement decentralisee. Les regulateurs locaux echangent
des informations, concernant leur comportement futur, avec leurs voisins. En considerant
les mod`eles locaux couples par les sorties, ces informations representent les sequences des
sorties locales. Pour integrer facilement la strategie de variation de N
2
dans la structure dis-
tribuee, nous avons propose une methode simple pour completer de mani`ere decentralisee
les composantes qui ne peuvent pas etre calculees de fa con distribuee.
An de mieux satisfaire les objectifs economiques de controle, nous sommes passes de la
formulation quadratique `a la formulation lineaire du crit`ere MPC. Pour ce nouveau forma-
lisme, lapparition des contraintes est imperative. On distingue ainsi des contraintes locales,
propres `a chaque zone, et des contraintes globales qui lient des variables appartenant `a
plusieurs zones. Considerant, en premier lieu, le cas des contraintes locales, nous avons
propose un algorithme distribue communiquant similaire au cas quadratique an de
comparer les performances des deux approches. Les resultats de simulation ont montre les
ameliorations sur les performances par rapport `a la formulation quadratique. Lapparition
des contraintes globales ou couplantes rend particuli`erement dicile la resolution locale
des sous-probl`emes, qui risque de mener le probl`eme vers une solution infaisable. An de
contourner cet inconvenient, nous nous sommes orientes vers la methode de decomposition
de Dantzig-Wolfe. Cet outil mathematique fournit un algorithme iteratif, pour lequel la so-
lution calculee `a chaque iteration est globalement faisable. Cette procedure de distribution
de la charge de calcul est particuli`erement ecace pour les PL `a structure bloc-angulaire,
structure qui correspond `a des mod`eles locaux independants. Pour prendre en compte les
couplages entre les sous-syst`emes, nous avons propose deux strategies, en fonction du type
de couplage : par les sorties ou par les entrees.
La derni`ere partie du document est consacree `a la distribution de la commande MPC
pour la regulation `a partir de plusieurs sources de chauage. Plus precisement, nous pre-
nons le cas de sources locales par pi`ece, associees `a une source de chauage centrale, qui
agit simultanement sur lensemble des pi`eces. En reformulant le probl`eme doptimisation
globale sous la forme standard PL, la commande de la source centrale devient la variable
couplante (empechant la resolution locale des sous-probl`emes). Pour surmonter la diculte
liee `a la distribution de la charge de calcul du probl`eme global, nous proposons lutilisation
de la methode de decomposition de Benders. Ensuite, nous avons etendu lalgorithme issu
de la methode de decomposition pour la prise en compte des couplages.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
176 6. Conclusion generale et perspectives
Bien que les approches proposees dans ce memoire aient ete destinees `a la regulation
thermique des batiments, les algorithmes developpes peuvent etre appliques pour dautres
processus de grande taille pour lesquels on connat la trajectoire future de consigne. Des
exemples de ce type de syst`emes sont : les canaux dirrigation, les processus industriels
composes de plusieurs reacteurs, syst`emes de stockage (memoires, entrep ots), syst`emes
compartimentaux (utilises frequemment pour la modelisation des phenom`enes de transport
et daccumulation). De plus, certains de ces syst`emes peuvent avoir des periodes de temps
pendant lesquelles ils nont pas `a etre fonctionnels. On rejoint ainsi lidee de lutilisation
intermittente du syst`eme.
6.2 Originalite, contributions et faiblesses des approches pro-
posees
Le developpement des travaux de th`ese a permis de mettre en evidence plusieurs
elements originaux, `a la fois theoriques et applicatifs.
Une premi`ere contribution originale est liee `a la formulation du crit`ere dynamique sous
forme quadratique du MPC. Il int`egre le prol futur doccupation. De plus, nous avons
propose une strategie `a horizon de prediction variable. Lapproche a ete developpee pour
aboutir `a un regulateur de type RST dynamique, pour lequel les coecients polynomiaux
sont variables dans le temps. Des restrictions sur la taille minimale des periodes doccu-
pation / inoccupation ont ete proposees. Elles permettent de reduire considerablement la
capacite de memoire necessaire pour le stockage des coecients.
La formulation du MPC presentee initialement pour une zone a ete etendue `a un
batiment multizone. Cette extension a permis de mettre en evidence dautres aspects nova-
teurs. Mentionnons, tout dabord, la modelisation du couplage entre les sous-syst`emes par
les sorties. Ensuite, nous avons propose une strategie ecace pour completer les vecteurs
dechange entre les controleurs voisins. En utilisant cette strategie, nous avons egalement
formule une condition necessaire et susante pour la convergence de lalgorithme distribue,
meme si lalgorithme propose ne converge pas vers la solution optimale globale. Ceci est
d u au fait que les fonctions de co ut locales representent uniquement les objectifs locaux.
Cette classe dalgorithmes distribues converge generalement vers un point dequilibre de
Nash [132], qui ne concide pas forcement avec loptimum global. Cependant, les resultats
de simulations ont montre, que pour les syst`emes consideres, ces points dequilibre de Nash
ne sont pas tr`es loin de loptimum. De plus, la vitesse de convergence est elevee, ce qui per-
met darreter lalgorithme apr`es un nombre faible diterations. Ceci est principalement d u
aux bonnes proprietes des mod`eles thermiques (couplages relativement faibles et stables),
mais egalement `a la facon de prendre en compte les couplages.
Le passage vers la formulation lineaire du crit`ere MPC augmente les performances
de la commande, mais rend plus dicile les preuves theoriques de convergence. Lappa-
rition des contraintes elimine la methode analytique de calcul de la solution. Les autres
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
6.3. Perspectives 177
outils mathematiques, usuellement employes pour etablir des conditions de convergence,
reposent sur les methodes de gradients. Pourtant, ces derniers sont inutiles dans lanalyse
des programmes lineaires.
Nous nous sommes orientes vers des methodes de decomposition lineaire. Les formu-
lations des probl`emes doptimisation, conjuguees `a la structure et / ou aux contraintes
du syst`eme `a controler a permis dexploiter les avantages calculatoires des methodes de
decomposition de Dantzig-Wolfe et de Benders. Lecacite des algorithmes issus de ces
methodes est moindre d`es que lon consid`ere les couplages entre les sous-syst`emes. Pour
surmonter cet inconvenient, nous avons propose deux strategies dierentes pour le cas du
couplage par les sorties et pour le cas du couplage par les entrees. Dans le premier cas,
lalgorithme distribue converge vers la solution optimale, en utilisant les sequences des
sorties calculees `a linstant precedent. Malgre cette optimalite par rapport `a la formula-
tion du probl`eme, le comportement des sous-syst`emes locaux peut se modier `a linstant
k +1 par rapport `a celui predit `a linstant k. En ce sens, on se retrouve en presence dune
sous-optimalite par rapport `a la formulation du probl`eme. Pour le cas des mod`eles locaux
couples par les entrees, nous proposons la resolution du probl`eme relaxe par un algorithme
distribue communiquant. Labsence de garantie de loptimalite de la solution ainsi ob-
tenue se repercute sur lalgorithme issu de la methode de decomposition. Cependant, de
mani`ere similaire `a lapproche quadratique, les algorithmes distribues, presentes pour les
crit`eres lineaires de MPC, convergent rapidement et orent de tr`es bonnes performances
economiques avec un nombre faible diterations.
6.3 Perspectives
Plusieurs directions sont envisagees pour les developpements futurs, en prolongement
de ces travaux de th`ese.
Les principales pistes theoriques sont listees ci-dessous :
etude theorique de la stabilite de la formulation quadratique dynamique de MPC
pour le cas monozone, ainsi que lextension au cas multizone
etude de limpact des observateurs detat locaux sur le developpement theorique de
la demarche, ainsi que sur les performances de la commande
etude de la abilite de la structure distribuee
1
(o` u lon peut envisager des defauts
sur les controleurs, sur les capteurs, sur les actionneurs ou sur le reseau de commu-
nication).
les idees presentees dans lapproche distribuee `a horizon de prediction variable peuvent
etre etendues au cas des syst`emes multi-echantillonnes
1. Pour le cas multizone, avec des formulations sans contraintes ou avec contraintes locales, le defaut
de fonctionnement dun controleur local naecte pas le batiment entier. Ainsi, plusieurs strategies peuvent
etre envisagees : les sequences des sorties ou des entrees futures que lagent en defaut doit transmettre `a
ses voisins peuvent etre remplacees par la sequence des sorties futures ou respectivement, une sequence de
commandes nulles.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
178 6. Conclusion generale et perspectives
generalisation des methodes de decomposition lineaires pour les mod`eles `a com-
mandes discr`etes ou pour les mod`eles non lineaires
2
une methode qui permet la gestion simultanee des contraintes couplantes et des
variables couplantes
3
des strategies didentication en ligne pour la commande distribuee ou des strategies
adaptatives [94].
Toutes les pistes theoriques mentionnees ci-dessus pour le cas de la commande des
syst`emes CVC peuvent etre conjuguees aux proprietes particuli`eres des syst`emes positifs
4
[57].
Dun point de vue applicatif, les perspectives visent generalement lapplication des
approches sur un batiment reel, mais egalement :
lapplication des algorithmes distribues sur dautres congurations de batiments
ladaptation des structures de commande pour inclure la regulation dautres syst`emes
presents dans les batiments (climatisation, ventilation, eclairage, syst`emes de cogene-
ration, etc.)
la prise en compte des couplages thermiques entres les zones par des echanges dair
(ventilation mecanique ou naturelle).
2. Certaines pistes peuvent etre retrouvees dans [39, 178, 65]
3. Ce type de probl`emes peuvent etre resolus par limbrication des deux methodes de decomposition
[39]. Pourtant, il est interessant detudier une possible resolution en parall`ele de ces procedures, en utilisant
la structure un peu particuli`ere du probl`eme doptimisation issu de MPC.
4. Un syst`eme lineaire est appele positif (externally positive system) si et seulement si sa reponse forcee
(reponse correspondante `a letat initial nul) est positive pour toutes les commandes positives. [57]
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Annexe A
Mod`eles de simulation
Pourquoi la simulation des batiments ?
Pour ameliorer les performances des syst`emes de chauage et de climatisation, il est im-
portant detudier comparativement dierentes strategies de commande. Ces etudes peuvent
etre realisees sur des batiments reels par le biais de lexperimentation, ou de mani`ere vir-
tuelle, voire une combinaison des deux approches. Cependant, aujourdhui, lanalyse des
performances de nouveaux controleurs est plus generalement menee dans des laboratoires
virtuels que par lintermediaire dexperimentations reelles. Ceci est d u `a plusieurs raisons,
les plus importantes etant mentionnees ci-dessous.
Lecart entre les investissements en temps et en co ut est enorme entre les deux
options (simulation et experimentation).
La non-reproductibilite des conditions meteorologiques rend dicile la comparaison
des dierents regulateurs sur le meme batiment. Dautre part chaque immeuble a
ses propres caracteristiques qui le rendent unique.
Levaluation des performances energetiques annuelles de certaines installations est
tr`es dicile, voire impossible, pour un immeuble reel.
De nombreux outils de simulation ont ete crees an de contourner les probl`emes men-
tionnes precedemment, tout en orant des resultats satisfaisants par rapport au cas reel.
Une liste non exhaustive des logiciels de simulation est donnee section 2.1.4.
La biblioth`eque de mod`eles SIMBAD
Les resultats de simulation presentes tout au long de ce manuscrit ont ete obtenus `a
laide de la biblioth`eque de composants de genie climatique SIMBAD Building and HVAC
Toolbox. Elle fournit des mod`eles MATLAB/Simulink des batiments et des composants de
syst`emes thermiques (chauage et climatisation), pour realiser des simulations dynamiques
des installations de genie climatique.
Les principaux mod`eles de la biblioth`eque SIMBAD peuvent etre groupes en :
1. Mod`eles de zones :
179
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
180 A. Mod`eles de simulation
Mod`eles monozone avec des param`etres predenis ou mod`eles avec une description
detaillee des parois et des fenetres
Mod`eles multizone avec description de la conguration des zones et des parois
gr ace `a un chier XML qui peut etre cree en utilisant une interface graphique
appelee SimBDI.
2. Elements de production : pompes `a chaleur et dierents mod`eles de chaudi`eres
3. Elements de distribution hydraulique (pompe, vannes, tuyauteries, ...) et aeraulique
(ventilateurs, tuyauteries, ...)
4. Elements terminaux : ventilo-convecteurs, planchers et plafonds chauants, radia-
teurs, convecteurs electriques, ...
5. Syst`emes de regulation typiquement utilises dans la regulation thermique, de type
tout-ou-rien, PID ou PID en cascade, capteurs, ...
6. Syst`emes predenis preassembles et fonctionnels.
En plus de ces groupes de mod`eles, loutil de simulation ore egalement des chiers
meteo-rologiques, des prols doccupation predenis, un mod`ele declairage articiel et des
blocs de conversion entre dierentes grandeurs physiques.
Mod`ele-bloc batiment multizone
Les batiments virtuels utilises dans les dierentes simulations presentees dans le present
memoire sont bases sur le mod`ele SIMBAD appele b atiment multizone. Ce bloc permet la
simulation des :
parois opaques multicouches, pour lesquelles les hypoth`eses fondamentales suivantes
sont faites :
1. mod`ele monodimensionnel : le transfert de chaleur `a travers la paroi se fait
uniquement sur lepaisseur
2. la resistance de contact entre dierentes couches de la paroi est nulle (contact
parfait)
3. les proprietes thermiques des couches sont constantes
4. lechange radiatif est linearise
fenetres, caracterisees par :
1. le coecient de transmission thermique entre les deux faces
2. les coecients dechange convectif aux deux surfaces
3. la transmissivite pour le rayonnement solaire
4. labsorptivite pour le rayonnement solaire
zones dair : basees sur lhypoth`ese dune temperature dair homog`ene dans chaque
zone (lair de la zone est bien melange).
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
181
Notons egalement que le mod`ele suppose le batiment simule place dans un site degage,
et par consequent on ne tient pas compte de la presence dautres immeubles dans son voi-
sinage. La gure A.1 illustre les congurations en 3D du batiment monozone et multizone,
utilisees dans les simulations presentees dans ce manuscrit.
1m 1m
1m
1,5m
4m
2m 2m
1m
1,5m
6m 1,5m
1m
1m
1m
3,5m
6m
N
2m
N
3m
Figure A.1 Conguration du batiment monozone (`a gauche) et trois zones (`a droite)
Ceci etant dit, on passe maintenant `a la description des entrees et des sorties du bloc
MATLAB/Simulink qui modelise le batiment multizone. Elles sont representees gure
A.2. Les cinq premi`eres entrees du mod`ele constituent des donnees fournies par les chiers
meteorologiques. La sixi`eme entree, la temperature limite, represente la temperature de
contact du plancher bas avec le sol. La valeur de cette temperature est xee `a 10
o
C. Les
mod`eles de fenetre consideres dans nos simulations ne prennent pas en compte des protec-
tions solaires, et donc la septi`eme entree du mod`ele nest pas utilisee. Dans nos simulations,
nous avons considere les apports de chaleur de la part des occupants et des equipements
electriques (autres que les equipements de chauage). Pendant les periodes doccupation,
lapport des equipements est considere egal `a 10W/m
2
, il est de meme considere egal `a
80W pour chaque occupant. Les debits dair entre les zones du batiment sont consideres
nuls. Le renouvellement de lair de chaque pi`ece du batiment est pris en compte. Ainsi,
le debit dair frais entrant dans les zones occupees est egal `a 20m
3
/h/pers. Les dierentes
valeurs mentionnees precedemment sont des valeurs proposees par defaut par SIMBAD
et elles representent des bonnes approximations pour les valeurs rencontrees dans la pra-
tique. La derni`ere entree du mod`ele constitue la puissance de chaue fournie par le poste de
chauage, dans notre cas, les convecteurs electriques. Les mod`eles de planchers chauants
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
182 A. Mod`eles de simulation
consideres au chapitre 5 sont integres `a linterieur du bloc multizone.
Temperature de lair exterieur [
o
C]
Rayonnement solaire direct [W/m
2
]
Rayonnement solaire diuse [W/m
2
]
Jour de lannee
Heure de la journee
Temperature limite (sol) [
o
C]
Position du store
Sources internes
Debits dair entre les zones [kg/s]
Ventilations
Puissance convective et
radiative des equipements [W]
(convectives et radiatives) [W]
(protection des fenetres)
Multizone
Temperature de lair
des zones [
o
C]
Temperature radiative moyenne
des zones [
o
C]
Besoins de chauage
des zones [W]
Besoins de climatisation
des zones [W]
Figure A.2 Entrees et sorties du mod`ele SIMBAD multizone
Seules les deux premi`eres sorties du mod`ele multizone sont utilisees pour tester nos
structures de commande. Elles representent les temperatures de lair de chacune des zones
et les temperatures radiatives moyennes (calculees en fonction des temperatures des sur-
faces interieures des parois).
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
1
8
3
Type Composition
Epaisseur Densite Cap. therm. Cond. therm. Coef. dechange
[m] [kgm
3
] [Jkg
1
K
1
] [Wm
1
K
1
] [Wm
2
K
1
](i / e)
B
a
t
i
m
e
n
t
m
o
n
o
z
o
n
e
Mur exterieur
Plaque de pl atre 0,010 1000 1000 0,430
5 / 20 Polystyr`ene expanse 0,080 20 1450 0,047
Parpaings 0,200 950 920 0,46
Plancher bas
Plastique 0,020 270 1400 0,100
5 /
Hourdis creux 0,200 1400 920 1,330
Polystyr`ene expanse 0,100 20 1450 0,047
Polyurethane 0,075 1200 1800 0,250
Sable 0,150 1800 910 2,000
Toiture
Plaque de pl atre 0,010 1000 1000 0,430
5 / 20
Polystyr`ene expanse 0,080 20 1450 0,047
Hourdis creux 0,200 1400 920 1,330
Polyurethane 0,075 1200 1800 0,250
Neopr`ene 0,010 1240 2140 0,230
B
a
t
i
m
e
n
t
t
r
o
i
s
-
z
o
n
e
s
Mur exterieur
Plaque de pl atre 0,010 850 800 0,35
5 / 20 Polystyr`ene extrude 0,080 35 1200 0,033
Beton plein 0,200 2300 920 1,75
Mur interieur Plaques de pl atre 0,072 850 800 0,35 5 / 5
Plafond
Tablier de toit 0,019 530 900 0,140
5 / 20 Fibre de verre 0,112 12 840 0,040
Plaques de pl atre 0,010 950 840 0,160
Plancher Beton 0,035 2200 879 1,3
3,2 /
chauant Tube de polyethyl`ene 0,016 920 0,582 1,000
(sapplique uniquement Polyurethane 0,0040 30 837 0,028
au mod`ele multisource) Beton 0,070 2200 879 1,3
Table A.1 Composition des parois du batiment monozone
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
184 A. Mod`eles de simulation
Actionneur et capteur
Les mod`eles des convecteurs electriques fournis par la biblioth`eque SIMBAD sont repre-
sentes par des syst`emes lineaires du premier ordre de constante de temps T
conv
= 180s.
La commande des convecteurs, u, prend des valeurs dans lintervalle [0, 1]. Alors le gain
exprime la puissance maximale du convecteur P
max
. Les sorties des convecteurs electriques
de chaque pi`ece sont connectees `a la derni`ere entree du mod`ele multizone (voir gure A.2).
Les capteurs de temperature sont egalement modelises de mani`ere simple par un premier
ordre, avec une constante de temps de T
capt
= 300s.
Convecteurs Multizone Capteurs
Perturbations
uuu yyy
PPP
conv
PPP
rad
TTT
a
TTT
rm
Figure A.3 Schema bloc du mod`ele de simulation
En incluant ces deux elements, le schema du mod`ele de simulation est represente gure
A.3. Comme on peut lobserver, la puissance de chaue du convecteur presente une partie
convective (95 %) et une partie radiative (5 %). De meme, le capteur de temperature
mesure une moyenne entre la temperature de lair de la zone et la temperature radiative
moyenne (ce que lon appelle egalement la temperature operationnelle).
Par rapport aux dynamiques des temperatures de lair et des parois, les dynamiques
relativement rapides des actionneurs et des capteurs consideres sont negligees dans les
mod`eles de commande utilises dans ce manuscrit.
Conditions meteorologiques
Les batiments virtuels consideres dans les simulations presentees tout au long de ce
memoire sont situes `a Rennes, en France. Les donnees meteo utilisees pour simuler len-
vironnement dans lequel sont places les immeubles retracent les conditions climatiques
mesurees `a Rennes, en 1998. La gure A.4 illustre levolution des trois perturbations
exterieures prises en compte par le mod`ele : la temperature de lair exterieur, le rayonne-
ment solaire direct et dius, pour le mois de janvier de lannee considere. Les trois signaux
sont echantillonnes avec un pas de temps de 1 heure.
Modelisation des couplages par les entrees et par les sorties
Dans cette partie nous nous proposons dillustrer les deux types de couplages utilises
dans ce manuscrit. Pour ce faire, nous considerons un batiment multizone simple, compose
de deux pi`eces. Pour simplier encore plus le developpement, nous prenons en compte
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
185
5 10 15 20 25 30
5
0
5
10
15
5 10 15 20 25 30
0
500
1000
5 10 15 20 25 30
0
100
200
Temps [jours]
T
e
m
p
.
d
e
l

a
i
r
e
x
t
.
[
o
C
]
R
a
y
.
d
i
r
e
c
t
[
W
/
m
2
]
R
a
y
.
d
i

u
s
[
W
/
m
2
]
Figure A.4 Conditions climatiques mesurees pour la ville de Rennes, en janvier 1998 :
temperature de lair exterieur, rayonnement solaire direct et rayonnement solaire dius
uniquement les echanges convectifs. Le mod`ele global pour les deux zones peut alors secrire
comme suit :
_

_
C
a1
dT
a1
(t)
dt
=Q
1
(t) + Q
c
(t) K
w1
(T
a1
(t) T
w1
(t)) K
e1
(T
a1
(t) T
e
(t))
K
wi1
(T
a1
(t) T
wi
(t))
C
a2
dT
a2
(t)
dt
=Q
2
(t) + Q
c
(t) K
w2
(T
a2
(t) T
w2
(t)) K
e2
(T
a2
(t) T
e
(t))
K
wi2
(T
a2
(t) T
wi
(t))
C
w1
dT
w1
(t)
dt
=K
w1
(T
w1
(t) T
a1
(t)) K
w1e
(T
w1
(t) T
e
(t))
C
w2
dT
w2
(t)
dt
=K
w2
(T
w2
(t) T
a2
(t)) K
w2e
(T
w2
(t) T
e
(t))
C
wi
dT
wi
(t)
dt
=K
wi1
(T
wi
(t) T
a1
(t)) K
wi2
(T
wi
(t) T
a2
(t)),
(A.1)
o` u les variables C representent des capacites thermiques [J/
o
C], T des temperatures [
o
C],
Q des puissances de chaue [W] et les param`etres K sont les coecients de transfert
thermique [W/
o
C]. La gure A.5 illustre la distribution des indices sur les composantes
du syst`eme thermique considere. Comme on peut lobserver, nous avons considere une
seule couche pour chaque paroi ce qui est loin detre le meilleur choix. Pourtant, le but de
lutilisation de ce mod`ele est dexprimer dune mani`ere simple les deux types de couplages.
`
A partir du syst`eme dequations (A.1) et en choisissant les temperatures de lair des
deux zones et les temperatures des parois comme les etats du syst`eme, on peut identier
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
186 A. Mod`eles de simulation
T
a1
T
a2
T
w1
T
w2
T
wi
T
e
Q
1
Q
c
Q
2
K
wi1
K
wi2
K
w2
K
w2e
K
w1e
K
w1
Figure A.5 Schema du batiment deux zones
les matrices du mod`ele detat :
_

_
_

T
a1
(t)

T
a2
(t)

T
w1
(t)

T
w2
(t)

T
wi
(t)
_

_
. .
xxx(t)
=
_

_
a
11
0 a
13
0 a
15
0 a
22
0 a
24
a
25
a
31
0 a
33
0 0
0 a
42
0 a
44
0
a
51
a
52
0 0 a
55
_

_
. .
AAA
_

_
T
a1
(t)
T
a2
(t)
T
w1
(t)
T
w2
(t)
T
wi
(t)
_

_
. .
xxx(t)
+
_

_
b
11
b
12
b
13
0
b
21
b
22
0 b
24
b
31
0 0 0
b
41
0 0 0
0 0 0 0
_

_
. .
BBB
_

_
T
e
(t)
Q
c
(t)
Q
1
(t)
Q
2
(t)
_

_
. .
uuu(t)
_
T
a1
(t)
T
a2
(t)
_
. .
yyy(t)
=
_
1 0 0 0 0
0 1 0 0 0
_
. .
CCC
_

_
T
a1
(t)
T
a2
(t)
T
w1
(t)
T
w2
(t)
T
wi
(t)
_

_
,
(A.2)
avec
a
11
= (K
w1
+ K
e1
+ K
wi1
)/C
a1
, a
13
K
w1
/C
a1
, a
15
K
wi1
/C
a1
, a
22
= (K
w2
+ K
e2
+ K
wi2
)/C
a2
,
a
24
= K
w2
/C
a2
, a
25
K
wi2
/C
a2
, a
31
= K
w1
/C
w1
, a
33
= (K
w1
+ K
w1e
)/C
w1
, a
42
= K
w2
/C
w2
,
a
44
= (K
w2
+ K
w2e
)/C
w1
, a
51
= K
wi1
/C
wi
, a
52
= K
wi2
/C
wi
, a
55
= (K
wi1
+ K
wi2
)/C
wi
,
b
11
= K
e1
/C
a1
, b
12
= 1/C
a1
, b
13
= 1/C
a1
, b
21
= K
e2
/C
a2
, b
22
= 1/C
a2
, b
24
= 1/C
a2
,
b
31
= K
w1
/C
w1
, b
41
= K
w2
/C
w2
.
(A.3)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
187
Couplage par les entrees
Mod`ele de la zone 1 :
_

_
xxx(t) = AAA
..
AAA
1
xxx(t)
..
xxx
1
(t)
+
_

_
b
12
b
22
0
0
0
_

_
. .
bbb
c,1
Q
c
(t)
. .
u
c
(t)
+
_

_
b
13
0
0
0
0
_

_
. .
bbb
1
Q
1
(t)
. .
u
1
(t)
+
_

_
0
b
24
0
0
0
_

_
. .
eee
2,1
Q
2
(t)
. .
u
2
(t)
+
_

_
b
11
b
21
b
31
b
41
0
_

_
. .
eee
ext,1
T
e
(t)
T
a1
(t)
. .
y
1
(t)
=
_
1 0 0 0 0
_
. .
ccc
T
1
xxx(t).
(A.4)
Mod`ele de la zone 2 :
_

_
xxx(t) = AAA
..
AAA
2
xxx(t)
..
xxx
2
(t)
+
_

_
b
12
b
22
0
0
0
_

_
. .
bbb
c,2
Q
c
(t)
. .
u
c
(t)
+
_

_
0
b
24
0
0
0
_

_
. .
bbb
2
Q
2
(t)
. .
u
2
(t)
+
_

_
b
13
0
0
0
0
_

_
. .
eee
1,2
Q
1
(t)
. .
u
1
(t)
+
_

_
b
11
b
21
b
31
b
41
0
_

_
. .
eee
ext,2
T
e
(t)
T
a2
(t)
. .
y
2
(t)
=
_
0 1 0 0 0
_
. .
ccc
T
2
xxx(t).
(A.5)
Couplage par les sorties
Mod`ele de la zone 1 :
_

_
_

T
a1
(t)

T
w1
(t)

T
wi
(t)
_

_
. .
xxx
1
(t)
=
_

_
a
11
a
13
a
15
a
32
a
33
0
a
51
0 a
55
_

_
. .
AAA
1
_

_
T
a1
(t)
T
w1
(t)
T
wi
(t)
_

_
. .
xxx
1
(t)
+
_

_
b
12
0
0
_

_
. .
bbb
c,1
Q
c
(t)
. .
u
c
(t)
+
_

_
b
13
0
0
_

_
. .
bbb
1
Q
1
(t)
. .
u
1
(t)
+
_

_
0
0
a
52
_

_
. .
eee
2,1
T
a2
(t)
. .
y
2
(t)
+
_

_
b
11
b
13
0
_

_
. .
eee
ext,1
T
e
(t)
T
a1
(t)
. .
y
1
(t)
=
_
1 0 0
_
. .
ccc
T
1
_

_
T
a1
(t)
T
w1
(t)
T
wi
(t)
_

_
.
(A.6)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
188 A. Mod`eles de simulation
Mod`ele de la zone 2 :
_

_
_

T
a2
(t)

T
w2
(t)

T
wi
(t)
_

_
. .
xxx
2
(t)
=
_

_
a
22
a
24
a
25
a
42
a
44
0
a
52
0 a
55
_

_
. .
AAA
2
_

_
T
a2
(t)
T
w2
(t)
T
wi
(t)
_

_
. .
xxx
2
(t)
+
_

_
b
22
0
0
_

_
. .
bbb
c,2
Q
c
(t)
. .
u
c
(t)
+
_

_
b
24
0
0
_

_
. .
bbb
2
Q
2
(t)
. .
u
2
(t)
+
_

_
0
0
a
51
_

_
. .
eee
1,2
T
a1
(t)
. .
y
1
(t)
+
_

_
b
21
b
41
0
_

_
. .
eee
ext,2
T
e
(t)
T
a2
(t)
. .
y
2
(t)
=
_
1 0 0
_
. .
ccc
T
2
_

_
T
a2
(t)
T
w2
(t)
T
wi
(t)
_

_
.
(A.7)
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Annexe B
Dualite en programmation lineaire
Lidee de base de la dualite en programmation lineaire est dassocier au PL initial,
appele primal, un deuxi`eme PL appele programme dual tel que :
le PL dual a autant de variables que le nombre de contraintes du primal,
il a autant de contraintes que le nombre de variables du PL primal
le dual est un probl`eme de minimisation si le primal est formalise comme un probl`eme
de maximisation et vice-versa.
Denition 1 Soit le probl`eme de programmation lineaire :
min
xxx
ccc
T
xxx, (B.1a)
sous les contraintes
Ax Ax Ax bbb, (B.1b)
xxx 000, (B.1c)
alors sa forme duale est :
max
yyy
bbb
T
yyy, (B.2a)
sous les contraintes
AAA
T
yyy ccc, (B.2b)
yyy 000, (B.2c)
o` u yyy est appelee la variable duale.
On peut identier alors le PL (B.1) comme le probl`eme primal, le PL (B.2) etant le
probl`eme dual. La matrice de contrainte AAA et les vecteurs bbb et ccc denissent de mani`ere
unique les deux probl`emes. Notons que chaque contrainte du probl`eme primal comporte
une variable duale associee. Le theor`eme suivant enonce la propriete de symetrie de la
dualite.
189
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
190 B. Dualite en programmation lineaire
Theor`eme 1 Si le probl`eme (D) est le dual du probl`eme (P), alors (P) est le dual du
probl`eme (D).
Meme si le primal dans la denition du probl`eme dual nest pas sous la forme standard,
cette formulation est preferee parce quelle permet didentier plus facilement la symetrie
entre les deux formulations. En utilisant cette denition, on peut exprimer le dual du
probl`eme sous forme standard par le theor`eme suivant.
Theor`eme 2 Le probl`eme dual du probl`eme sous forme standard :
min
xxx
ccc
T
xxx, (B.3a)
sous les contraintes
Ax Ax Ax = bbb, (B.3b)
xxx 000, (B.3c)
est :
max
yyy
bbb
T
yyy, (B.4a)
sous les contraintes
AAA
T
yyy ccc. (B.4b)
Contrainte
Variable
= =
Primal (min) Dual (max)
Dual (min) Primal (max)

sans
contr.
sans
contr.
Figure B.1 Representation schematique des r`egles de transformation de primal en dual
et vice-versa [39]
Un probl`eme de programmation lineaire dont la formulation nest pas sous la forme
(B.1) ou sous la forme standard (B.3) a egalement un equivalent dual. Pour faciliter lob-
tention du PL dual, `a partir dun probl`eme lineaire deni dune mani`ere quelconque, on
peut utiliser les ensembles de r`egles exposes gure B.1.
Limportance de la relation entre les formulations primal-dual est donnee par le theor`eme
suivant et son corollaire.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
191
Theor`eme 3 (de dualite faible) Soit xxx une solution admissible du PL primal (B.1) et yyy
une solution admissible de son dual (B.2), alors ccc
T
xxx bbb
T
yyy.
Corollaire 1 Si ccc
T
xxx = bbb
T
yyy alors les solutions xxx et yyy sont optimales pour leur probl`eme
respectif.
Les preuves des theor`emes presentes dans cette annexe peuvent etre trouvees dans
[39].
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
192 B. Dualite en programmation lineaire
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Liste des gures
1.1 Consommation denergie nale par secteur en 2008 dans la zone EU27 (`a
gauche) et en France (`a droite) . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2 Repartition de la consommation energetique dans les batiments residentiels
et tertiaires en Europe [2] . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 Illustration du prechauage . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1 Comportement des regulateurs classiques . . . . . . . . . . . . . . . . . . . 32
2.2 Schema generique pour les procedures dautoreglage du PID . . . . . . . . . 33
2.3 Principe de fonctionnement de la commande predictive : Prediction de
la commande et de la sortie `a linstant k sur un horizon ni (gauche) ;
Reiteration `a linstant suivant (droite) . . . . . . . . . . . . . . . . . . . . . 38
2.4 Procedure de synth`ese de la loi de commande predictive . . . . . . . . . . . 39
2.5 Structure de controle predictif pour la regulation thermique dans les batiments 44
2.6 B atiment multi-zone (a) et structure des interconnexions (b) . . . . . . . . 46
2.7 Schema de controle centralise (a) et decentralise (b) pour le cas de trois
sous-syst`emes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
2.8 Schema de controle distribue . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.9 Caracteristiques des dierentes categories dalgorithmes MPC . . . . . . . . 56
3.1 Utilisation dune commande predictive classique . . . . . . . . . . . . . . . . 62
3.2 Construction du vecteur doccupation, (k), pour N
1
= 1 et N
2
= 4 . . . . . 63
3.3 Structure du schema de controle . . . . . . . . . . . . . . . . . . . . . . . . 69
3.4 Structure du regulateur polynomial avec la partie feedforward . . . . . . . . 73
3.5 Inuence de la dimension de lhorizon de commande, N
u
, et de la ponderation,
, sur lindice de confort (a) et sur la consommation energetique (b), sur
une journee de simulation, avec une temperature initiale y(0) = 12
o
C. La
periode doccupation considere est de 9h `a 19h et la dimension de lhorizon
de prediction est denie par N
1
= 1 et N
2
= 16. La temperature de consigne
est xe `a 20
o
C. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
3.6 Reponses temporelles du syst`eme en boucle fermee pour N
u
{1, 3, 16},
= 1, N
1
= 1, N
2
= 16 et une periode doccupation de 9h `a 19h, avec une
temperature initiale y(0) = 16
o
C (a et b) et y(0) = 12
o
C (c et d) . . . . . . 75
193
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
194 LISTE DES FIGURES
3.7

Evolution de lhorizon de prediction (N
1
= 1, N
2
= 2, N
2
= 4) . . . . . . . 77
3.8 Comparaison en termes dindices de performances entre le controleur predictif
`a horizon de prediction constant (GPCHC) et deux congurations `a horizon
de prediction variable (GPCHV1 et GPCHV2) . . . . . . . . . . . . . . . . 79
3.9

Evolution des principaux signaux, en conguration GPCHC et GPCHV1 . . 81
3.10

Evolution temporelle de la structure du vecteur yyy
(l(k))
j
(k) pour le cas de
trois zones avec : N
2
= 6, N
2,j
= 2, H
j
= N
3
1
\{j}, j N
3
1
. . . . . . . . . . 89
3.11 Conguration du batiment simule . . . . . . . . . . . . . . . . . . . . . . . . 95
3.12 Scenario 1 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) . . . . . . . . . . . . 98
3.13 Scenario 2 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) pour N
u,i
=N
2,i

N
10
2
, N
2,i
= 10,
i
= 1, i N
3
1
. . . . . . . . . . . . . . . . . . . . . . . . . 99
3.14 Scenario 3 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) pour N
u,i
=N
2,i

N
10
2
, N
2,i
= 10,
i
= 1, i N
3
1
. . . . . . . . . . . . . . . . . . . . . . . . . 100
3.15 Scenario 4 : signaux de sortie (a) et de commande (b) pour les huit premiers
jours de lannee et indicateurs de performance (c et d) pour N
u,i
=N
2,i

N
10
2
, N
2,i
= 10,
i
= 1, i N
3
1
. . . . . . . . . . . . . . . . . . . . . . . . . 101
3.16 Scenario 2 :

Evolution de la vitesse de convergence et du rayon spectral
de la matrice en fonction du prol doccupation, pour la conguration
DiMPCHV1, avec : N
2
= 6, N
2,j
= 3, j N
3
1
. . . . . . . . . . . . . . . . . 102
3.17 Scenario 4 :

Evolution de la vitesse de convergence et du rayon spectral
de la matrice en fonction du prol doccupation, pour la conguration
DiMPCHV1, avec : N
2
= 6, N
2,j
= 3, j N
3
1
. . . . . . . . . . . . . . . . . 102
4.1 Inuence du param`etre de ponderation
i
sur les indices de performance . . 115
4.2

Evolution temporelle des signaux de sortie (a) et de commande (b) et des
indicateurs de performance (c et d) pour les huit premiers jours de lannee . 116
4.3 Schema-bloc de controle centralise pour le batiment trois-zones . . . . . . . 118
4.4 Schema-bloc de controle decentralise pour le batiment trois-zones . . . . . . 118
4.5 Schema-bloc de controle distribue pour le batiment trois-zones . . . . . . . 119
4.6 Prol doccupation et limites de confort dans le cadre de la commande
predictive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
4.7 Allure de la fonction de penalite . . . . . . . . . . . . . . . . . . . . . . . . 122
4.8 Schema de commande distribuee base sur la methode de decomposition de
Dantzig-Wolfe, utilisant le mod`ele decouple (`a gauche) et le mod`ele couple
(`a droite) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.9 Schema-bloc de controle distribue base sur la methode de decomposition de
Dantzig-Wolfe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
4.10 B atiment compose de s zones disposees en serie . . . . . . . . . . . . . . . . 132
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
LISTE DES FIGURES 195
4.11 Inuence du nombre de sous-syst`emes, s, sur la vitesse de convergence . . . 133
4.12 Inuence de la taille de lhorizon de commande, N
u
, sur la vitesse de conver-
gence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.13 Inuence du param`etre sur loptimalite de la solution distribuee . . . . . . 134
4.14 Inuence du nombre de sous-syst`emes, s, sur les performances de lalgo-
rithme 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138
4.15 Inuence de la taille de lhorizon de commande, N
u
, sur les performances
de lalgorithme 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.16 Inuence du gain statique de couplage sur les performances de lalgorithme 4140
4.17 Resultats de simulation sur une journee utilisant la commande DiMPCDW
et respectivement PI, dans la conguration PO 2, = 0, 5, T
0
= 16
o
C . . . 142
4.18 Simulation DiMPCDW avec puissance maximale, u
t
, variable dans le temps 143
5.1 Exemple de levolution du domaine admissible du PMR . . . . . . . . . . . 154
5.2 Schema de commande distribuee base sur la methode de decomposition de
Benders, utilisant le mod`ele decouple (`a gauche) et le mod`ele couple (`a droite)155
5.3 Inuence du nombre de zones, s, sur les performances de lalgorithme 5, en
utilisant le solveur Simplexe de MATLAB (`a gauche), la methode du point
interieur (au milieu) et le solveur CPLEX de IBM (`a droite) . . . . . . . . . 157
5.4 Inuence de la taille de lhorizon de commande, N
u
, (`a gauche) et du nombre
dinstants doccupation par zone, N
i
o
, (`a droite) . . . . . . . . . . . . . . . . 158
5.5 Inuence de lerreur, , qui denit la condition darret . . . . . . . . . . . . 159
5.6 Exemple de batiment multizone multisource (`a gauche) et structure de la
matrice de contraintes du PL associe (`a droite) . . . . . . . . . . . . . . . . 160
5.7 Schema de controle distribue base sur la methode de decomposition de Benders162
5.8 Inuence du nombre de sous-syst`emes sur les performances de lalgorithme 6163
5.9 Inuence de lhorizon de commande sur les performances de lalgorithme 6 . 164
5.10 Inuence du gain statique de couplage () sur les performances de lalgo-
rithme 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164
5.11 B atiment multizone et multisource . . . . . . . . . . . . . . . . . . . . . . . 165
5.12 DiMPCB - signaux principaux sur une journee (PO 1, T
0
= 16
o
C) . . . . . 168
5.13 DiMPCB - signaux principaux sur une journee (PO 2, T
0
= 16
o
C), tarica-
tion xe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
5.14 DiMPCB - signaux principaux sur une journee (PO 2, T
0
= 16
o
C), tarica-
tion variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
6.1 Recapitulatif des probl`emes et des solutions proposees dans le manuscrit . . 174
A.1 Conguration du batiment monozone (`a gauche) et trois zones (`a droite) . . 181
A.2 Entrees et sorties du mod`ele SIMBAD multizone . . . . . . . . . . . . . . . 182
A.3 Schema bloc du mod`ele de simulation . . . . . . . . . . . . . . . . . . . . . 184
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
196 LISTE DES FIGURES
A.4 Conditions climatiques mesurees pour la ville de Rennes, en janvier 1998 :
temperature de lair exterieur, rayonnement solaire direct et rayonnement
solaire dius . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185
A.5 Schema du batiment deux zones . . . . . . . . . . . . . . . . . . . . . . . . 186
B.1 Representation schematique des r`egles de transformation de primal en dual
et vice-versa [39] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Liste des tableaux
3.1 Resultats comparatifs (confort et energie) entre les controleurs de type GPC
`a crit`ere dynamique et PI avec anticipation de la consigne . . . . . . . . . . 80
3.2 Resultats comparatifs DeMPCHV1 - DiMPCHV1 pour les quatre scenarios
doccupation, avec les param`etres : N
u,i
=N
2,i
= 2, N
2,i
= N
2,i
= 10,

i
= 1,
i
= 0, i N
3
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.1 Resultats comparatifs entre les structures predictives `a crit`ere lineaire par
rapport `a la structure distribuee `a crit`ere quadratique pour les quatre
scenarios doccupation, avec les param`etres : N
u,i
= N
2,i
= 10,
i
= 0,
i N
3
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
4.2 Prols doccupation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.3 Comparaison en termes de co uts de chauage . . . . . . . . . . . . . . . . . 141
5.1 Prols doccupation pour le cas multizone et multisource . . . . . . . . . . . 166
5.2 Comparaison en termes de co uts de chauage pour le cas multizone et mul-
tisource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
A.1 Composition des parois du batiment monozone . . . . . . . . . . . . . . . . 183
197
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
198 LISTE DES TABLEAUX
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Index
Combinaison
conique, 124
convexe, 124
Contraintes
couplees, 119
locales, 109
Couplage
par les entrees, 51
par les sorties, 83
Decomposition
de Benders, 149
de Dantzig-Wolfe, 124
Dualite
des PL, 189
faible, 191

Equation de prediction, 66
Fonction
de co ut, 37
de penalite, 121
Forme standard PL, 110
Horizon
de prediction sur la commande, 40
inferieur de prediction sur la sortie, 40
superieur de prediction sur la sortie, 40
Indice
de confort, 71
de consommation, 70
Matrice
bloc-angulaire duale, 149
bloc-angulaire primale, 124
MPC, 39
`a crit`ere lineaire, 107
`a crit`ere quadratique, 39
centralise, 46
decentralise, 47
distribue, 49
Probl`eme
matre, 126
matre restreint, 127
relaxe, 124
Prol doccupation, 63
Rayon, 125
extremal, 125
spectral, 93
Regulateur RST, 68
Sequence
dechange, 86
de commandes, 65
de sorties, 66
Sommet, 125
Variables
couplantes, 149
duales, 126
199
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
200 INDEX
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Bibliographie
[1] www.homesprogramme.com.
[2] Towards energy ecient buildings in Europe. Technical report, EuroACE, 2004.
[3] Climate change 2007 : Synthesis report. Technical report, Intergovernmental Panel
on Climate Change, 2007.
[4] Les chires cles du batiment 2007. Technical report, ADEME, 2007.
[5] World energy outlook. Technical report, International Energy Agency, 2008.
[6] World energy outlook. Technical report, International Energy Agency, 2009.
[7] Energy yearly statistics 2008. Technical report, EUROSTAT, 2010.
[8] World energy outlook. Technical report, International Energy Agency, 2010.
[9] P. A. Agachi, Z. K. Nagy, M. V. Cristea, and A. Imre-Lucaci. Model based control :
case studies in process engineering. Wiley-VCH Verlag GmbH & Co. KGaA, 2006.
[10] W. Al-Gherwi, H. Budman, and A. Elkamel. An online algorithm for robust distri-
buted model predictive control. In International Symposium on Advanced Control
of Chemical Processes, Jul. 2009.
[11] W. Al-Gherwi, H. Budman, and A. Elkamel. Selection of control structure for distri-
buted model predictive control in the presence of model errors. Journal of Process
Control, 20(3) :270284, 2010.
[12] M. Alamir, M. Yacine Lamoudi, and P. Beguery. Unied NMPC control for multi-
variable control in smart buildings. In IFAC World Congress, Aug. 2011.
[13] M. Alamir, A. Murilo, R. Amari, P. Tona, R. Furhapter, and P. Ortner. Lecture
Notes in Control and Information Sciences, chapter On the use of parameterized
NMPC in real-time automotive control, pages 139 149. Springer-Verlag, 2009.
[14] K. J.

Astr om, T. Hagglund, and A. Wallenborg. Automatic tuning of digital control-
lers with applications to HVAC plants. Automatica, 29(5) :13331343, 1993.
[15] S. Atthajariyakul and T. Leephakpreeda. Neural computing thermal comfort index
for HVAC systems. Energy Conversion and Management, 46(15-16) :25532565,
2005.
[16] P. Bacot. Analyse modale des syst`emes thermiques. PhD thesis, Universite Paris VI,
1984.
201
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
202 BIBLIOGRAPHIE
[17] J. Bai, S. Wang, and X. Zhang. Development of an adaptive Smith predictor-based
self-tuning PI controller for an HVAC system in a test room. Energy and Buildings,
40(12) :22442252, 2008.
[18] T. Basar and G. J. Olsder. Dynamic noncooperative game theory. Academic Press,
1999.
[19] W. A. Beckman, L. Broman, A. Fiksel, S. A. Klein, E. Lindberg, M. Schuler, and
J. Thornton. Trnsys the most complete solar energy system modelling and simula-
tion software. In Renewable energy climate and the environment : Work Renewable
Energy Congress, Sep. 1994.
[20] A. Bemporad, F. Borrelli, and M. Morari. Model predictive control based on linear
programming - the explicit solution. IEEE Transactions on Automatic Control,
47(12) :1974 1985, 2002.
[21] A. Bemporad, M. Morari, V. Dua, and E. N. Pistikopoulos. The explicit linear
quadratic regulator for constrained systems. Automatica, 38(1) :320, 2002.
[22] J. F. Benders. Partitioning procedures for solving mixed-variables programming
problems. Numerische Mathematik, 4 :238252, 1962.
[23] D. P. Bertsekas. Separable dynamic programming and approximate decomposition
methods. IEEE Transactions on Automatic Control, 52(5) :911916, 2007.
[24] Q. Bi, W. Cai, Q. Wang, C. Hang, E. Lee, Y. Sun, K. Liu, Y. Zhang, and B. Zou.
Advanced controller auto-tuning and its application in HVAC systems. Control
Engineering Practice, 8(6) :633644, 2000.
[25] B. Birdsall, W. F. Buhl, K. L. Ellington, A. E. Erdam, and F. C. Winkelmann.
Overview of the DOE-2 building analysis program. Technical report, Simulation
Research Group, Lawrence Berkeley Laboratory, University of California, Berkeley,
CA, 1990.
[26] P. Boucher and D. Dumur. La commande predictive. EDITIONS TECHNIP, 1996.
[27] R. Bourdais and H. Gueguen. Distributed predictive control for complex hybrid
system. the refrigeration system example. In IFAC Large Scale Systems, Jul. 2010.
[28] R. Cagienard, P. Grieder, E. C. Kerrigan, and M. Morari. Move blocking strategies
in receding horizon control. Journal of Process Control, 17(6) :563570, 2007.
[29] F. Calvino, M. L. Gennusa, G. Rizzo, and G. Scaccianoce. The control of indoor
thermal comfort conditions : introducing a fuzzy adaptive controller. Energy and
Buildings, 36(2) :97102, 2004.
[30] E. F. Camacho and C. Bordons. Model Predictive Control in the Process Industry.
Second Edition. Springer-Verlag, London, England, 2004.
[31] E. Camponogara, D. Jia, B. H. Krogh, and S. Talukdar. Distributed model predictive
control. IEEE Control Systems Magazine, 22(1) :4452, 2002.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 203
[32] G. Chaloulos, P. Hokayem, and J. Lygeros. Distributed hierarchical mpc for conict
resolution in air trac control. In American Control Conference, pages 39453950,
Jun. 2010.
[33] T. Y. Chen. Application of adaptive predictive control to a oor heating system
with a large thermal lag. Energy and Buildings, 34(1) :4551, 2002.
[34] R. Cheng, J. F. Forbes, and W. S. Yip. Dantzig-Wolfe decomposition and plant-wide
MPC coordination. Computers and Chemical Engineering, 32(7) :15071522, 2008.
[35] J. A. Clark. The ESP system towards a new generation of building energy analysis
program. In Building Energy Simulation Conference, 1985.
[36] D. Clarke. Advances in model-based predictive control. Oxford University Press,
1994.
[37] D. W. Clarke, C. Mohtadi, and P. S. Tus. Generalized predictive control - Part
I. the basic algorithm and Part II. extensions and interpretations. Automatica,
23(2) :137160, 1987.
[38] Climatisation and Development Group. Overview of the hourly analysis program.
Technical report, CARRIER, 12 Rue de Paris, 78230, France, 1992.
[39] A. J. Conejo, E. Castillo, R. Minguez, and R. Garcia-Bertrand. Decomposition
techniques in mathematical programming. Engineering and Science Applications.
Springer-Verlag, 2006.
[40] V. Congradac and F. Kulic. HVAC system optimization with CO
2
concentration
control using genetic algorithms. Energy and Buildings, 41(5) :571577, 2009.
[41] J. A. Crabb, N. Murdoch, and J. M. Penman. A simplied thermal response model.
Building Services Engineering Research & Technology, 8(1) :1319, 1987.
[42] CSTB, http ://www.cstb.fr. SIMBAD Building and HVAC Toolbox, 4.0 edition,
2005.
[43] G. B. Dantzig and M. N. Thapa. Linear Programming 2 : Theory and Extensions.
Springer-Verlag, 2003.
[44] G. B. Dantzig and P. Wolfe. Decomposition principle for linear programs. Operation
Research, (8) :101111, 1960.
[45] S. L. de Oliveira Kothare and M. Morari. Contractive model predictive control
for constrained nonlinear systems. IEEE Transactions on Automatic Control,
45(6) :10531071, 2000.
[46] M. Defoort, A. Kokosy, T. Floquet, W. Perruquetti, and J. Palos. Motion planning
for cooperative unicycle-type mobile robots with limited sensing ranges : A distri-
buted receding horizon approach. Robotics and Autonomous Systems, 57(11) :1094
1106, 2009.
[47] M. D. Doan, T. Keviczky, I. Necoara, M. Diehl, and B. De Schutter. A distributed
version of Hans method for DMPC using local communications only. Journal of
Control Engineering and Applied Informatics, 11(3) :615, 2009.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
204 BIBLIOGRAPHIE
[48] M. D. Doan, T. Keviczky, and B. De Schutter. An improved distributed version of
Hans method for distributed MPC of canal systems. In Symposium on Large Scale
Systems : Theory and Applications, Jul. 2010.
[49] A. I. Dounis, M. J. Santamouris, C. C. Lefas, and A. Argiriou. Design of a fuzzy set
environment comfort system. Energy and Buildings, 22(1) :8187, 1995.
[50] A.I. Dounis and C. Caraiscos. Advanced control systems engineering for energy
and comfort management in a building environment - a review. Renewable and
Sustainable Energy Reviews, 13(6-7) :12461261, 2009.
[51] X. Du, Y. Xi, and S. Li. Distributed model predictive control for large-scale systems.
In American Control Conference, pages 31423143, Jun. 2001.
[52] D. Dumur, P. Boucher, K. M. Murphy, and F. Deque. Comfort control in residen-
tial housing using predictive controllers. In International Conference on Control
Application, pages 265270, Oct. 1997.
[53] W. B. Dunbar and R. M. Murray. Distributed receding horizon control for multi-
vehicle formation stabilization. Automatica, 42(4) :549558, 2006.
[54] G. Eftaxias, G. Sutherland, and M. Santanouris. A building simulation toolbox for
MATLAB/SIMULINK, Instalation Guide ans User Manual. Group Building Envi-
ronmental Studies, Department of Applied Physics, University of Athens, 1999.
[55] P. G. Ellis and P. A. Torcellini. Simulating tall buildings usig energyplus. In Inter-
national IBPSA Conference, pages 279286, Aug. 2005.
[56] P. O. Fanger. Thermal Comfort. McGraw-Hill Inc., 1970.
[57] L. Farina and L. Benvenuti. Positive realizations of linear systems. Systems &
Control Letters, 26(1) :19, 1995.
[58] M. Farza, M. MSaad, and L. Rossignol. Observer design for a class of mimo nonlinear
systems. Automatica, 40(1) :135143, 2004.
[59] M. Farza, M. MSaad, M. Triki, and T. Maatoug. High gain observer for a class of
non-triangular systems. Systems & Control Letters, 60(1) :2735, 2011.
[60] P. M. Ferreira and A. E. Ruano. Choice of RBF model structure for predicting
greenhouse inside air temperature. In IFAC World Congress, pages 9196, Aug.
2002.
[61] G. Fraisse. La regulation thermique des batiments tertiaires : application de la lo-
gique oue `a la regulation centrale du chauage en regime intermittent. PhD thesis,
Institut National des Sciences Appliquees de Lyon, 1997.
[62] G. Fraisse, J. Virgone, and J. J. Roux. Thermal control of a discontinuously occu-
pied building using a classical and a fuzzy logic approach. Energy and Buildings,
26(3) :303316, 1997.
[63] R. Z. Freire, G. H. C. Oliveira, and N. Mendes. Development of regression equa-
tions for predicting energy and hygrothermal performance of buildings. Energy and
Buildings, 40(5) :810820, 2008.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 205
[64] R. Z. Freire, G. H. C. Oliveira, and N. Mendes. Predictive controllers for thermal
comfort optimization and energy savings. Energy and Buildings, 40(7) :13531365,
2008.
[65] A. M. Georion. Generalized Benders decomposition. Journal of Optimization
Theory and Applications, 10(4) :237260, 1972.
[66] C. Ghiaus. Fuzzy model and control of a fan-coil. Energy and Buildings, 33(6) :545
551, 2001.
[67] C. Ghiaus and I. Hazyuk. Calculation of optimal thermal load of intermittently
heated buildings. Energy and Buildings, 42(8) :12481258, 2010.
[68] L. Giovanini and J. Balderud. Game approach to distributed model predictive
control. In International Control Conference, Aug. 2006.
[69] P. Giselsson and A. Rantzer. Distributed model predictive control with suboptimality
and stability guarantees. In Conference on Decision and Control, pages 72727277,
Dec. 2010.
[70] P. A. Gonzalez and J. M. Zamarre no. Prediction of hourly energy consumption
in buildings based on a feedback articial neural network. Energy and Buildings,
37(6) :595601, 2005.
[71] M. C. B. Gough. Component based building energy system simulation. International
Journal of Ambient Energy, 7 :137143, 1986.
[72] A. Grancharova and T. A. Johansen. Explicit approaches to constrained model
predictive control : a survey. Modeling, identication and control, 25(3) :131157,
2004.
[73] P. Gruber, M. Gwerder, and J. Todtli. Predictive control for heating applications.
In Clima World Congress, Sep. 2001.
[74] M. Gwerder, D. Gyalistras, F. Oldewurtel, B. Lehmann, K. Wirth, V. Stauch, and
J. Todtli. Potential assessment of rule-based control for integrated room automation.
In REHVA World Congress, May 2010.
[75] M. Gwerder and J. Todtli. Predictive control for integrated room automation. In
REHVA World Congress Clima, Oct. 2005.
[76] D. Gyalistras and M. Gwerder. Use of weather and occupancy forecasts for optimal
building climate control (opticontrol) : Two years progress report. Technical report,
Terrestrial Systems Ecology ETH Zurich, 2010.
[77] T. Halil, O. Farhi, and Y. Chervenkov. Embedded fuzzy controller for adaptive
heating system control. In Energy saving control in plants and buildings, pages 75
80, Oct. 2006.
[78] S. P. Han and G. Lou. A parallel algorithm for a class of convex programs. SIAM
Journal on Control and Optimization, 26(2) :345355, 1988.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
206 BIBLIOGRAPHIE
[79] I. Hazyuk and C. Ghiaus. On the physical meaning of minimization criterion for
model predictive control. In International Conference on Automation Quality and
Testing Robotics, pages 16, May 2010.
[80] M. Heidarinejad, J. Liu, D. M. de la Pena, and P. D. Christodes. Handling com-
munication disruptions in distributed model predictive control. In International
Symposium on Dynamics and Control of Process Systems, pages 296301, Jul. 2010.
[81] G. P. Henze and R. E. Hindman. Control of air-cooled chiller condenser fans using
clustering neural networks. ASHRAE Transactions, 108(4574), 2002.
[82] D. R. Saer II and F. J. Doyle III. Analysis of linear programming in model predictive
control. Computers & Chemical Engineering, 28(12) :2749 2763, 2004.
[83] L. Itard, F. Meijer, E. Vrinr, and H. Hoiting. Building renovation and modernisation
in Europe : state of the art review. Technical report, 2008.
[84] V. Javalera, B. Morcego, and V. Puig. Negotiation and learning in distributed MPC
of large scale systems. In American Control Conference, pages 31683173, Jun. 2010.
[85] D. Jia and B. Krogh. Min-max feedback model predictive control for distributed
control with communication. In American Control Conference, May 2002.
[86] D. Jia and B. H. Krogh. Distributed model predictive control. pages 27672772,
Jun. 2001.
[87] S. A. Kalogirou and M. Bojic. Articial neural networks for the prediction of the
energy consumption of a passive solar building. Energy, 25(5) :479491, 2000.
[88] T. Keviczky, F. Borrelli, and G. J. Balas. A study on decentralized receding horizon
control for decoupled systems. Technical report, University of Minnesota, Minnea-
polis, 2004.
[89] T. Keviczky, F. Borrelli, and G. J. Balas. Stability analysis of decentralized RHC for
decoupled systems. In Conference on Decision and Control and European Control
Conference, pages 16891694, Dec. 2005.
[90] T. Keviczky, F. Borrelli, and G. J. Balas. Decentralized receding horizon control for
large scale dynamically decoupled systems. Automatica, 42(12) :21052115, 2006.
[91] D. Kolokotsa, D. Tsiavos, G. S. Stavrakakis, K. Kalaitzakis, and E. Antonidakis.
Advanced fuzzy logic controllers design and evaluation for buildings occupants
thermal-visual comfort and indoor air quality satisfaction. Energy and Buildings,
33(6) :531543, 2001.
[92] K. I. Krakow and S. Lin. PI control of fan speed to maintain constant discharge
pressure. ASHRAE Transactions : Research, 101(2) :398407, 1995.
[93] M. T. Lah, B. Zupancic, and A. Krainer. Fuzzy control for the illumination and
temperature comfort in a test chamber. Building and Environment, 40(12) :1626
1637, 2005.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 207
[94] I. D. Landau, R. Lozano, M. MSaad, and A. Karimi. Adaptive Control. Second
Edition. Springer-Verlag, 2011.
[95] Y. D. Landau. Adaptive control. Springer-Verlag, New York, 1998.
[96] L. K. Lawrie. Day-to-day use of energy analysis software. Energy Engineering,
89(5) :4151, 1992.
[97] S. Leirens, C. Zamora, R. R. Negenborn, and B. De Schutter. Coordination in urban
water supply networks using distributed model predictive control. In American
Control Conference, pages 39573962, Jun. 2010.
[98] S. Li, Y. Zhang, and Q. Zhu. Nash-optimization enhanced distributed model predic-
tive control applied to the Shell benchmark problem. Information Sciences, 170(2-
4) :329349, 2005.
[99] W. Li and C. G. Cassandras. Centralized and distributed cooperative receding hori-
zon control of autonomous vehicle missions. Mathematical and Computer Modelling,
43(9-10) :12081228, 2006.
[100] J. Liang and R. Du. Design of intelligent comfort control system with human lear-
ning and minimum power control strategies. Energy Conversion and Management,
49(4) :517528, 2008.
[101] Z. Liao and A. L. Dexter. The potential for energy saving in heating systems through
improving boiler controls. Energy and Buildings, (36) :261271, 2004.
[102] Z. Liao and A. L. Dexter. A simplied physical model for estimating the average air
temperature in multi-zone heating systems. Building and Environment, 39(9) :1013
1022, 2004.
[103] J. Liu, X. Chen, D. Munoz de la Pena, and Panagiotis D. Christodes. Sequential and
iterative architectures for distributed model predictive control of nonlinear process
systems. Part I : Theory. In American Control Conference, pages 31483155, Jun.
2010.
[104] J. Liu, X. Chen, D. Munoz de la Pena, and Panagiotis D. Christodes. Sequential
and iterative architectures for distributed model predictive control of nonlinear pro-
cess systems. Part II : Application to a catalytic alkylation of benzene process. In
American Control Conference, pages 31563161, Jun. 2010.
[105] J. Liu, D. Mu noz de la Pe na, and P. D. Christodes. Distributed model predictive
control of nonlinear systems subject to asynchronous and delayed measurements.
Automatica, 46(1) :5261, 2010.
[106] W. Liu, Z. Lian, and B. Zhao. A neural network evaluation model for individual
thermal comfort. Energy and Buildings, 39(10) :11151122, 2007.
[107] D. L. Loveday, G. S. Virk, J. Y. M. Cheung, and D. Azzi. Intelligence in buildings :
the potential of advanced modelling. Automation in Construction, 6(5-6) :447461,
1997.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
208 BIBLIOGRAPHIE
[108] L. Lu, W. Cai, Y. S. Chai, and L. Xie. Global optimization for overall HVAC systems
- Part I : Problem formulation and analysis. Energy Conversion and Management,
46(7-8) :9991014, 2005.
[109] D. Luenberger. An introduction to observers. IEEE Transactions on Automatic
Control, 16(6) :596602, 1971.
[110] P. Lute and D. van Paassen. Optimal indoor temperature control using a predictor.
IEEE Control Systems Magazine, 15 :410, 1995.
[111] Y. Ma, F. Borrelli, B. Hencey, B. Hencey, B. Coey, S. Bengea, and P. Haves. Model
predictive control for the operation of building cooling system. In American Control
Conference, pages 51065111, Jun. 2010.
[112] Y. Ma, F. Borrelli, B. Hencey, A. Packard, and S. Borto. Model predictive control
of thermal energy storage in building cooling systems. In Conference on Decision
and Control and Chinese Control Conference, pages 392397, Dec. 2009.
[113] J. M. Maestre, D. Munoz de la Pena, and E. F. Camacho. A distributed MPC
scheme with low communication requirements. In American Control Conference,
pages 27972802, Jun. 2009.
[114] J. M. Maestre, D. Munoz de la Pena, and E. F. Camacho. Distributed model pre-
dictive control based on a cooperative game. Optimal Control Applications and
Methods, 32(2) :153176, 2010.
[115] L. Magni and R. Scattolini. Stabilizing decentralized model predictive control of
nonlinear systems. Automatica, 42(7) :12311236, 2006.
[116] P. Malisani, F. Chaplais, N. Petit, and D. Feldmann. Thermal building model iden-
tication using time-scaled identication methods. In Conference on Decision and
Control, pages 308315, Dec. 2010.
[117] K. Marik, J. Rojicek, P. Stluka, and J. Vass. Advanced HVAC control : Theory vs.
reality. In IFAC World Congress, Aug. 2011.
[118] D. Q. Mayne, J. B. Rawlings, C. V. Rao, and P. O. M. Scokaert. Constrained model
predictive control : Stability and optimality. Automatica, 36(6) :789814, 2000.
[119] K. Menighed, C. Aubrun, and J-J. Yame. Distributed state estimation and model
predictive control : Application to fault tolerant control. In International Conference
on Control and Automation, pages 936941, Dec. 2009.
[120] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. Building temperature regula-
tion using a distributed model predictive control. Energy and Buildings, 42(9) :1445
1452, 2010.
[121] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. Commande predictive dis-
tribuee pour la regulation thermique des batiments. In Conference Internationale
Francophone dAutomatique, Jun. 2010.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 209
[122] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. Distributed model predictive
control based on Benders decomposition applied to multisource multizone building
temperature regulation. In Conference on Decision and Control, pages 39143919,
Dec. 2010.
[123] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. Distributed model predictive
control for building temperature regulation. In American Control Conference, pages
31743179, Jun. 2010.
[124] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. A distributed MPC ap-
plied to multisource temperature regulation in buildings. In IFAC Workshop on
Distributed Estimation and Control in Networked Systems, pages 9196, Sep. 2010.
[125] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. A dynamic horizon distribu-
ted predictive control approach for temperature regulation in multi-zone buildings.
In Mediterranean Conference on Control and Automation, pages 622627, Jun. 2010.
[126] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. Distributed MPC for multi-
zone temperature regulation with coupled constraints. In IFAC World Congress,
Aug. 2011.
[127] P-D. Morosan, R. Bourdais, D. Dumur, and J. Buisson. A distributed MPC strategy
based on Benders decomposition applied to multi-source multi-zone temperature
regulation. Journal of Process Control, 21(5) :729737, 2011.
[128] P-D. Morosan, R. Bourdais, and H. Gueguen. Apports de la commande predictive
pour la regulation thermique des batiments. In STIC et Environnement, Jun. 2009.
[129] P-D. Morosan, R. Bourdais, and H. Gueguen. Apports de la commande predictive
pour la regulation thermique des batiments. Journal Europeen des Syst`emes Auto-
matises, 44(4-5) :479492, 2010.
[130] M. Mossolly, K. Ghali, and N. Ghaddar. Optimal control strategy for a multi-zone
air conditioning system using a genetic algorithm. Energy, 34(1) :5866, 2009.
[131] N. Motee and B. Sayyar-Rodsari. Optimal partitioning in distributed model predic-
tive control. In American Control Conference, pages 53005305, Jun. 2003.
[132] J. Nash. Non-cooperative games. The Annals of Mathematics, Second Series,
54(2) :286295, 1951.
[133] N. Nassif, S. Kajl, and R. Sabourin. Optimization of HVAC control system strategy
using two-objective genetic algorithm. HVAC&R Research, 11(3) :459486, 2005.
[134] I. Necoara, D. Doan, and J. A. K. Suykens. Application of the proximal center
decomposition method to distributed model predictive control. In Conference on
Decision and Control, pages 29002905, Dec. 2008.
[135] R. R. Negenborn. Multi-agent model predictive control with applications to power
networks. PhD thesis, University of Delft, 2007.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
210 BIBLIOGRAPHIE
[136] R. R. Negenborn and B. De Schutter. A distributed model predictive control ap-
proach for the control of irrigation canals. In International Conference on Infrastruc-
ture Systems and Services : Building Networks for a Brighter Future, pages 16, Nov.
2008.
[137] R. R. Negenborn, B. De Schutter, and H. Hellendoorn. Multi-agent model predictive
control of transportation networks. In International Conference on Networking,
Sensing and Control, pages 296301, Aug. 2006.
[138] H. M. Newman and M. D. Morris. Direct digital control of building systems : theory
and practice. John Wiley & Sons, 1994.
[139] S. Olaru. Contribution `a letude de la commande predictive sous contraintes par
approche geometrique. PhD thesis, SUPELEC, 2005.
[140] F. Oldewurtel, D. Gyalistras, M. Gwerder, C. N. Jones, A. Parisio, V. Stauch, B. Leh-
mann, and M. Morari. Increasing energy eciency in building climate control using
weather forecasts and model predictive control. In REHVA World Congress, May
2010.
[141] F. Oldewurtel, C. N. Jones, and M. Morari. A tractable approximation of chance
constrained stochastic MPC based on ane disturbance feedback. In Conference on
Decision and Control, pages 47314736, Dec. 2008.
[142] F. Oldewurtel, A. Parisio, C. N. Jones, M. Morari, D. Gyalistras, M. Gwerder,
V. Stauch, B. Lehmann, and K. Wirth. Energy ecient building climate control
using stochastic model predictive control and weather predictions. In American
Control Conference, Jun. 2010.
[143] F. Oldewurtel, A. Ulbig, A. Parisio, G. Andersson, and M Morari. Reducing peak
electricity demand in building climate control using real-time pricing and model
predictive control. In Conference on Decision and Control, Dec. 2010.
[144] G. H. C. Oliveira and L. H. Ushijima. A hybrid predictive control scheme for hygro-
thermal process. IFAC, pages 36413646, 2008.
[145] G. Pannocchia, J. B. Rawlings, and S. J. Wright. Fast, large-scale model predictive
control by partial enumeration. Automatica, 43(5) :852860, 2007.
[146] B. Paris, J. Eynard, S. Grieu, T. Talbert, and M. Polit. Heating control schemes for
energy management in buildings. Energy and Buildings, 42(8) :19081917, 2010.
[147] A. Parisio. Handling Uncertainty with Application to Indoor Climate Control and
Resource Allocation Planning. PhD thesis, University of Sannio, 2009.
[148] C. Park, D. Clark, and G. Kelly. HVACSIM building systems and equipment simu-
lation program : buildings load calculation, 1986.
[149] L. Perez-Lombard, J. Ortiz, and C. Pout. A review on buildings energy consumption
information. Energy and Buildings, 40(3) :394398, 2008.
[150] S. Privara, J. Siroky, L. Ferkl, and J. Cigler. Model predictive control of a building
heating system : The rst experience. Energy and Buildings, 43(2-3) :564572, 2011.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 211
[151] A. I. Propoi. Use of linear programming methods for synthesizing sampled-data
automatic systems. Automation and Remote Control, 24(7) :837844, 1963.
[152] S. J. Qin and T. A. Badgwell. A survey of industrial model predictive control
technology. Control Engineering Practice, 11(7) :733764, 2003.
[153] R. L. Raard, C. J. Tomlin, and S. P. Boyd. Distributed optimization for cooperative
agents : Application to formation ight. In Conference on Decision and Control,
pages 24532459, Dec. 2004.
[154] Y. Raenel, E. Blanco, J. Virgone, P. Neveux, G. Scorletti, and G. Thomas. Re-
ducing the energy consumption of space heating in buildings : Design of an optimal
controller. In IFAC World Congress, pages 1109811105, Jul. 2008.
[155] D. M. Raimondo, L. Magni, and R. Scattolini. Decentralized MPC of nonlinear
systems : An input-to-state stability approach. International Journal of Robust and
Nonlinear Control, 17(17) :16511667, 2007.
[156] L. R. Randy and S. E. Haupt. Practical Genetic Algorithms. Second Edition. John
Wiley & Sons, 2004.
[157] A. Rantzer. On prize mechanisms in linear quadratic team theory. In Conference
on Decision and Control, pages 11121116, Dec. 2007.
[158] A. Rantzer. Dynamic dual decomposition for distributed control. In American
Control Conference, pages 884888, Jun. 2009.
[159] C. V. Rao and J. B. Rawlings. Linear programming and model predictive control.
Journal of Process Control, 10(2-3) :283289, 2000.
[160] J. B. Rawlings and B. T. Stewart. Coordinating multiple optimization-based control-
lers : New opportunities and challenges. Journal of Process Control, 18(9) :839845,
2008.
[161] P. O. Readio, P. G. Schwendinger, and A. J. Hulse. Method and apparatus for
controlling a multi-source heating system. US Patent 0118933, 2005.
[162] R. Riadi, R. Tawegoum, A. Rachid, and G. Chasseriaux. Centralized & decentralized
temperature generalized predictive control of a passive-HVAC process. In IFAC
World Congress, pages 1086910874, Jul. 2008.
[163] A. Richards and J. How. A decentralized algorithm for robust constrained model
predictive control. In American Control Conference, pages 42614266, Jun. 2004.
[164] G. J. Ros-Moreno, M. Trejo-Perea, R. Casta neda-Miranda, V. M. Hernandez-
Guzman, and G. Herrera-Ruiz. Modelling temperature in intelligent buildings by
means of autoregressive models. Automation in Construction, 16(5) :713722, 2007.
[165] J. A. Rossiter. Model based predictive control. A practical approach. CRC Press
LLC, 2003.
[166] R. Scattolini. Architectures for distributed and hierarchical model predictive control
- a review. Journal of Process Control, 19(5) :723731, 2009.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
212 BIBLIOGRAPHIE
[167] H. Scheu, J. Busch, and W. Marquardt. Nonlinear distributed dynamic optimization
based on rst order sensitivities. In American Control Conference, pages 15741579,
Jun. 2010.
[168] J. Singh, N. Singh, and J. K. Sharma. Fuzzy modeling and control of HVAC systems
- a review. Journal of Scientic & Industrial Research, 65(6) :470476, 2006.
[169] A. T. P. So, W. L. Chan, T. T. Chow, and W. L. Tse. New HVAC control by system
identication. Building and Environment, 30(3) :349357, 1995.
[170] M. Soroush and H. M. Soroush. Nonlinear predictive control : theory and practice,
chapter Long-prediction-horizon non-linear model predictive control, pages 189199.
The Institution of Engineering and Technology, 2001.
[171] J. M. Sousa, R. Babuika, and H. B. Verbruggen. Fuzzy predictive control applied to
an air-conditioning system. Control Engineering Practice, 5(10) :13951406, 1997.
[172] E. Sowell. Simulation problem analysis research kernel. Lawrence Berkeley National
Laboratory Simulation Research Group and Ayres Sowell Associates, 1997.
[173] S. Soyguder, M. Karakose, and H. Alli. Design and simulation of self-tuning PID-type
fuzzy adaptive control for an expert HVAC system. Expert Systems with Applica-
tions, 36(3) :45664573, 2009.
[174] B. T. Stewart, J. B. Rawlings, and S. J. Wright. Hierarchical cooperative distributed
model predictive control. In American Control Conference, pages 39633968, Jun.
2010.
[175] C. N. Stoica. Robustication de lois de commande predictives multivariables. PhD
thesis, SUPELEC, 2008.
[176] B. Tashtoush, M. Molhim, and M. Al-Rousan. Dynamic model of an HVAC system
for control analysis. Energy, 30(10) :17291745, 2005.
[177] M. Terziyska, Y. Todorov, and M. Petrov. Adaptive supervisory tuning of nonlinear
model predictive controller for a heat exchanger. In Energy saving control in plants
and buildings, pages 9398, Oct. 2006.
[178] P. T. Thach and K. Hiroshi. A generalized Dantzig-Wolfe decomposition principle for
a class of nonconvex programming problems. Mathematical Programming, 62(2) :239
260, 1993.
[179] R. Thompson and A. Dexter. A fuzzy decision-making approach to temperature
control in air-conditioning systems. Control Engineering Practice, 13(6) :689698,
2005.
[180] M. Vaccarini, S. Longhi, and M. R. Katebi. Unconstrained networked decentralized
model predictive control. Journal of Process Control, 19(2) :328339, 2009.
[181] M. Vallon. Modelisation hygro-thermo-aeraulique des b atiments multizones : propo-
sition dune strategie de resolution du syst`eme couple. PhD thesis, Institut National
des Sciences Appliquees de Lyon, 1999.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 213
[182] A. N. Venkat. Distributed Model Predictive Control : Theory and Applications. PhD
thesis, University of Wisconsin-Madison, 2006.
[183] A. N. Venkat, I. A. Hiskens, J. B. Rawlings, and S. J. Wright. Distributed MPC
strategies with application to power system automatic generation control. IEEE
Transactions on Control Systems Technology, 16(6) :11921206, 2008.
[184] A. N. Venkat, J. B. Rawlings, and S. J. Wright. Stability and optimality of distributed
model predictive control. In Conference on Decision and Control and European
Control Conference, pages 66806685, Dec. 2005.
[185] J. C. Visier and C. Bicard. Pratique de lintermittence du chauage dans les locaux
`a occupation discontinue. Technical report, CSTB, 1988.
[186] D. Wang, C. C. Federspiel, and F. Rubinstein. Modeling occupancy in single person
oces. Energy and Buildings, 37(2) :121126, 2005.
[187] L. Wang. Model Predictive Control System Design and Implementation Using MAT-
LAB . Springer, 2009.
[188] S. Wang and E. J. Davison. On the stabilisation of decentralized control systems.
IEEE Transactions on Automatic Control, 18(5) :473478, 1973.
[189] M. Xu and S. Li. Practical generalized predictive control with decentralized identi-
cation approach to HVAC systems. Energy Conversion and Management, 48(1) :292
299, 2007.
[190] Y. Yan, J. Zhou, Y. Lin, W. Yang, P. Wang, and G. Zhang. Adaptive optimal control
model for building cooling and heating sources. Energy and Buildings, 40(8) :1394
1401, 2008.
[191] I-H. Yang, M-S. Yeo, and K-W. Kim. Application of articial neural network to
predict the optimal start time for heating system in building. Energy Conversion
and Management, 44(17) :27912809, 2003.
[192] Z. Yu, Y. Zhou, and A. Dexter. Hierarchical fuzzy rule-based control of renewable
energy building systems. In CISBAT, Renewables in a changing climate - Innovation
in the Built Environment, Sep. 2007.
[193] L. Zadeh and B. Whalen. On optimal control and linear programming. IRE Tran-
sactions on Automatic Control, 7(4) :45 46, 1962.
[194] M. Zaheer-uddin and N. Tudoroiu. Neuro-PID tracking control of a discharge air
temperature system. Energy Conversion and Management, 45(15-16) :24052415,
2004.
[195] Y. Zhang and S. Li. Networked model predictive control based on neighbourhood
optimization for serially connected large-scale systems. Journal of Process Control,
17(1) :3750, 2007.
[196] Y. Zheng, S. Li, and X. Wang. Distributed model predictive control for plant-wide
hot-rolled strip laminar cooling process. Journal of Process Control, 19(9) :1427
1437, 2009.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
214 BIBLIOGRAPHIE
[197] J. B. Ziegler and N. B. Nichols. Optimum settings for automatic controllers. ASME
Transactions, 64 :759768, 1942.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
BIBLIOGRAPHIE 215
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1
Titre : Commande predictive distribuee. Approches appliquees `a la regulation ther-
mique des batiments
Les exigences croissantes sur lecacite energetique des batiments, levolution du mar-
che energetique, le developpement technique recent ainsi que les particularites du poste de
chauage ont fait du MPC le meilleur candidat pour la regulation thermique des batiments
`a occupation intermittente. Cette th`ese presente une methodologie basee sur la commande
predictive distribuee visant un compromis entre loptimalite, la simplicite et la exibilite
de limplantation de la solution proposee. Le developpement de lapproche est progressif :
`a partir du cas dune seule zone, la demarche est ensuite etendue au cas multizone et / ou
multisource, avec la prise en compte des couplages thermiques entre les zones adjacentes.
Apr`es une formulation quadratique du crit`ere MPC pour mieux satisfaire les objectifs
economiques du controle, la formulation lineaire est retenue. Pour repartir la charge de
calcul, des methodes de decomposition lineaire (comme Dantzig-Wolfe et Benders) sont
employees. Lecacite des algorithmes distribues proposes est illustree par diverses simu-
lations.
Mots cles : Commande Predictive, Commande distribuee, Syst`emes de grande taille,
Methodes de Decomposition Lineaires, Syst`emes de Chauage des B atiments,

Economie
denergie.
Title : Distributed model predictive control. Approaches applied to building tempe-
rature regulation
The increasing requirements on energy eciency of buildings, the evolution of the
energy market, the technical developments and the characteristics of the heating systems
made of MPC the best candidate for thermal control of intermittently occupied buildings.
This thesis presents a methodology based on distributed model predictive control, aiming
a compromise between optimality, on the one hand, and simplicity and exibility of the
implementation of the proposed solution, on the other hand. The development of the
approach is gradually. The mono-zone case is initially considered, then the basic ideas
of the solution are extended to the multi-zone and / or multi-source case, including the
thermal coupling between adjacent zones. Firstly we consider the quadratic formulation of
the MPC cost function, then we pass towards a linear criterion, in order to better satisfy the
economic control objectives. Thus, linear decomposition methods (such as Dantzig-Wolfe
and Benders) represent the mathematical tools used to distribute the computational charge
among the local controllers. The eciency of the distributed algorithms is illustrated by
simulations.
Keywords : Model Predictive Control, Distributed Control, Large-scale Systems, Linear
Decomposition Methods, Building Heating Systems, Energy Saving.
t
e
l
-
0
0
6
4
1
3
1
1
,

v
e
r
s
i
o
n

1

-

1
5

N
o
v

2
0
1
1