Vous êtes sur la page 1sur 149

Mod`

eles stochastiques pour la reconstruction


tridimensionnelle denvironnements urbains
Florent Lafarge

To cite this version:


Florent Lafarge.
Mod`eles stochastiques pour la reconstruction tridimensionnelle
denvironnements urbains. Human-Computer Interaction. Ecole Nationale Superieure des
Mines de Paris, 2007. French. <NNT : 2007ENMP1471>. <tel-00179695>

HAL Id: tel-00179695


https://tel.archives-ouvertes.fr/tel-00179695
Submitted on 16 Oct 2007

HAL is a multi-disciplinary open access


archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.

Larchive ouverte pluridisciplinaire HAL, est


destinee au depot et `a la diffusion de documents
scientifiques de niveau recherche, publies ou non,
emanant des etablissements denseignement et de
recherche francais ou etrangers, des laboratoires
publics ou prives.

THESE
pour obtenir le grade de
Docteur de lEcole des Mines de Paris
Spcialit Gostatistique

prsente et soutenue publiquement par


Florent LAFARGE
le 2 octobre 2007

MODELES STOCHASTIQUES POUR LA RECONSTRUCTION


TRIDIMENSIONNELLE DENVIRONNEMENTS URBAINS

Directeurs de thse : Josiane Zerubia et Marc Pierrot-Deseilligny

Jury
M.

Michel SCHMITT

Prsident

M.
M.

Henri MAITRE
Patrick PEREZ

Rapporteurs

M.
M.
M.
M.
Mme
M.

Xavier DESCOMBES
Christian LANTUEJOUL
Marc PIERROT-DESEILLIGNY
Anuj SRIVASTAVA
Josiane ZERUBIA
Jean-Philippe CANTOU

Examinateurs

Examinateur invit

Remerciements
Jai eu la chance dtre bien encadr durant ces trois annes. Je le dois en premier lieu
Josiane Zerubia qui jexprime ma reconnaissance. Je la remercie de mavoir accueilli dans
le projet Ariana. Je remercie Marc Pierrot-Deseilligny pour ses nombreux conseils aviss et
sa disponibilit. Merci Didier Boldo pour laide prcieuse quil ma apporte au quotidien.
Je remercie enfin Xavier Descombes, la personne qui ma donn got la recherche. Il a su
mclairer et maider dans des moments importants.
Je tiens remercier Michel Schmitt de mavoir fait lhonneur de prsider le jury de
thse. Je souhaite exprimer ma gratitude Henri Matre et Patrick Prez qui ont accept
avec gentillesse dtre rapporteurs. Ils ont pris le temps de lire mon travail avec attention
et leurs analyses ont t prcieuses. Je remercie Christian Lantuejoul et Anuj Srivastava
davoir accept dtre examinateurs. Les discussions avec eux ont t fructueuses. Merci
Jean-Philippe Cantou pour avoir suivi mes travaux durant ces trois annes depuis Toulouse.
Je remercie le CNES et lIGN de mavoir accord une bourse de financement.
Merci aux membres du projet Ariana et du laboratoire Matis pour leur convivialit. En
particulier, ceux qui mont support dans leur bureau : Guillaume, Maria, Olivier, Gilles,
Frdric, Clment, Nesrine, Mathieu, Mlanie, Emilie, Arnaud. Un grand merci tout particulirement Guillaume pour tous les bons moments passs en B121.
Cette thse naurait pas vu le jour sans laide dun certain nombre de personnes . Merci
Mathias de mavoir expliqu et confi ses codes. Merci David, Grgroire et Mlanie pour
toutes les fois o ils mont fourni des donnes et lanc des calculs. Merci Mathieu pour les
discussions techniques et sa bonne humeur. Merci Pierre et Yann pour leur contribution
ce travail au travers de leur stage dingnieur. Merci Corinne, Alain et Franois pour leur
disponibilit et leur gentillesse sur les questions pratiques. Merci aux personnes qui mont
aid dans la rdaction du manuscrit : Aurlie, Emilie, Mlanie, mon pre.
Enfin et surtout, je remercie toute ma famille pour son soutien.

Avant propos
Cadre de la thse
Les travaux prsents dans cette thse ont dbut le 1 er octobre 2004. Ils ont t mens
sous la direction de Josiane Zerubia, Directrice de Recherche lINRIA, de Marc PierrotDeseilligny, Directeur de Recherche lIGN, et de Xavier Descombes, Charg de Recherche
lINRIA. Cette thse a t effectue au sein du laboratoire Matis de lIGN, et du projet
Ariana commun lINRIA et lI3S. Le laboratoire Matis est spcialis dans les problmes
de strorestitution. Un de ses objectifs est notamment la mise en production de mthodes
automatiques et semi-automatiques de modlisation tridimensionnelle denvironnements urbains. Le Projet Ariana aborde les problmes inverses en tldtection par des approches
variationnelles et stochastiques. Pendant la dure de sa thse, lauteur a bnfici dune
bourse CNES, cofinance par lIGN.
Le sujet de cette thse a t mis en place par lINRIA, lIGN et le CNES. Lobjectif
initial consistait tudier la complmentarit des travaux de thses mens, dune part par
Mathias Ortner au sein du projet Ariana entre 2001 et 2004 sur lextraction automatique
de btiments, et dautre part, par Hassan Jibrini raliss entre 1998 et 2002 au laboratoire
Matis en collaboration avec lENST sur la reconstruction 3D de btiments. Les donnes
utilises (des simulations PLEIADES, fournies par le CNES) devaient galement permettre
dvaluer le potentiel des futurs satellites PLEIADES, dans le cadre du programme ORFEO, en matire de reconstruction 3D denvironnements urbains. Le principal intrt qui
se dgage de cette tude rside dans la reconstruction de zones urbaines sans lutilisation
de base de donnes 2D. Cette perspective est particulirement intressante pour la modlisation des villes ne possdant pas de cadastre, situation rpandue dans les pays en voie de
dveloppement.
Organisation du manuscrit
Le manuscrit prsente un processus de modlisation tridimensionnelle denvironnements urbains. Il est articul de manire linaire. Le chapitre 1 introduit la problmatique de
notre tude. Le chapitre 2 expose le processus dextraction des objets urbains. Le chapitre 3
dtaille la reconstruction tridimensionnelle de ces objets. Le chapitre 4 prsente et analyse
les rsultats obtenus.
Le droulement des recherches na toutefois pas t linaire. Des modles intermdiaires de reconstruction 3D et des mthodes doptimisation alternatives ont t dvelopps

4
au cours de la thse. Ceux-ci sont rsums dans les annexes du manuscrit.
Les notations utilises dans le manuscrit sont indpendantes entre les diffrents chapitres.

Table des matires


Avant propos

Introduction
1.1 Problmatique . . . . . . . . . . . . . . . . . . . . .
1.1.1 Les enjeux de la modlisation urbaine en 3D
1.1.2 Lapport de la tldtection . . . . . . . . . .
1.2 Etat de lart . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Les donnes . . . . . . . . . . . . . . . . . .
1.2.2 Lautomaticit . . . . . . . . . . . . . . . .
1.2.3 Les zones urbaines . . . . . . . . . . . . . .
1.2.4 Les modlisations 3D . . . . . . . . . . . . .
1.2.5 Les approches . . . . . . . . . . . . . . . . .
1.2.6 Bilan . . . . . . . . . . . . . . . . . . . . .
1.3 Le contexte de notre tude . . . . . . . . . . . . . .
1.3.1 Donnes spatiales et simulations PLEIADES
1.3.2 Vers de lurbain dense en automatique . . . .
1.4 La stratgie . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Lapproche structurelle . . . . . . . . . . . .
1.4.2 Les outils stochastiques . . . . . . . . . . .
1.4.3 Dmarche gnrale . . . . . . . . . . . . . .

Extraction des btiments


2.1 Caricatures de btiments par agencement de rectangles : rappel et
de travaux antrieurs . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Processus ponctuels marqus . . . . . . . . . . . . . . . .
2.1.2 Formulation de lnergie . . . . . . . . . . . . . . . . . .
2.1.3 Commentaires . . . . . . . . . . . . . . . . . . . . . . .
2.2 Rgularisation en supports structuraux . . . . . . . . . . . . . . .
2.2.1 Connexion des supports . . . . . . . . . . . . . . . . . .
2.2.2 Dtection des discontinuits des hauteurs de toit . . . . .

analyse
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .

32
33
33
38
39
39
43

Reconstruction 3D des btiments


3.1 Bibliothque de modles 3D . . . . . . . . . . . . . . . .
3.1.1 Typologie des toits et adquation avec les donnes
3.1.2 La bibliothque propose . . . . . . . . . . . . . .
3.2 Formulation Baysienne . . . . . . . . . . . . . . . . . .

.
.
.
.

47
48
48
51
53

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.

7
8
8
9
10
10
14
16
17
20
20
21
21
25
26
26
27
30
31

TABLE DES MATIRES

3.3

3.4

3.2.1 Vraisemblance . . . . . . .
3.2.2 A priori . . . . . . . . . . .
Optimisation . . . . . . . . . . . .
3.3.1 Echantillonneur RJMCMC .
3.3.2 Noyaux de propositions . .
3.3.3 Recuit simul . . . . . . . .
3.3.4 Des mthodes alternatives .
Estimation des paramtres . . . . .
3.4.1 Paramtres de la densit . .
3.4.2 Paramtres de loptimisation

Evaluation
4.1 Evaluation qualitative . . .
4.2 Evaluation quantitative . .
4.3 Influence du recuit simul .
4.4 Influence des supports 2D .
4.5 Les limites dutilisation . .
4.6 Extension du contexte . . .

Conclusion

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

56
58
60
61
63
66
69
72
72
73

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

75
76
84
86
91
94
96
101

Bibliographie
6

Annexes
A - Processus 3D paramtrique partir demprises rectangulaires .
B - Processus 3D par squeltisation des artes fatires . . . . . .
C - Rappel sur les chanes de Markov . . . . . . . . . . . . . . .
D - Calcul des noyaux de propositions . . . . . . . . . . . . . . .
E - Processus 3D aprs simplification squentielle des supports 2D
F - Rsultats supplmentaires . . . . . . . . . . . . . . . . . . . .

107
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

117
118
124
128
133
134
137

Chapitre 1

Introduction

Introduction

1.1 Problmatique
La moiti de la population mondiale vit, aujourdhui, dans les villes. En 1950, moins
de 30% des hommes habitaient en milieu urbain. Daprs une tude rcente des Nations
Unies1 , ils seront plus de 60% en 2030. Le milieu urbain devient progressivement lenvironnement naturel de lhomme. Devant ce bouleversement dmographique, connatre et
matriser lespace urbain est un enjeu essentiel. En particulier, la reconstruction vectorielle
tridimensionnelle des villes tend devenir un outil de plus en plus important dans de nombreux secteurs, quils soient publics, industriels ou militaires.

1.1.1 Les enjeux de la modlisation urbaine en 3D


La constitution de bases de donnes urbaines tridimensionnelles reprsente un enjeu important dans de nombreux domaines. Dans le secteur public, les applications se focalisent
principalement autour de lamnagement urbain. Ces bases de donnes sont utiles dans des
tudes concernant limplantation despaces verts, le positionnement de lampadaires (simulation dclairage), ou bien encore limpact de la construction de btiments dans un environnement. Elles peuvent galement se rvler tre efficaces pour le suivi de lvolution des
villes et pour la gestion des risques tels que les inondations ou les sismes. Dans le secteur
industriel, les modlisations 3D de villes intressent beaucoup les oprateurs de tlphonie mobile. Elles leur permettent de simuler la propagation des ondes lectromagntiques
et ainsi amliorer le dveloppement de leurs rseaux de tlcommunication. Lindustrie cinmatographique, ainsi que celles du jeu vido et de lautomobile, sont galement demandeuses de ces modlisations 3D. Enfin, il existe des applications militaires comme laide
la prparation doprations ou au guidage dengins autonomes tels que les drnes. Les
possibilits dutilisation sont donc trs nombreuses. Le lecteur pourra trouver dans [Fritsch,
1999], une gamme dapplications possibles.
Le procd historique dacquisition de modlisation 3D de ville est le relev topomtrique de btiments. Des oprateurs saisissent manuellement des points dintrt sur le terrain. Ces points sont ensuite reports lintrieur dune scne virtuelle, et permettent ainsi
de modliser le btiment en 3D. Bien que trs prcise, cette mthode est lente et coteuse.
Elle est utilise principalement pour la modlisation de btiments remarquables. Cependant, pour une reconstruction "en masse", cest--dire de villes entires, ce procd devient
trs vite pnible. Il nest dautant pas adapt que les modlisations urbaines ont besoin de
mises jour frquentes. Dans ce contexte, il est ncessaire de se tourner vers des procds
o lintervention humaine est moindre. Limagerie terrestre est une des principales alternatives, notamment pour aborder les problmes lis la reconstruction et la texturation des
faades. On peut citer cet effet les travaux de [Wang et al., 2002; Zhao et Shibasaki, 2001;
Frueh et al., 2005; Penard et al., 2006]. Le recours la tldtection, cest--dire aux mthodes permettant dextraire des informations partir de donnes ariennes et satellitaires,
est galement trs pris.
1 "Perspectives

de lurbanisation mondiale : la rvision 2001" publi en 2002 dans le volume 39(3) du


magazine "Chronique de lONU".

1.1 Problmatique

1.1.2 Lapport de la tldtection

Lacquisition rapide et massive de donnes urbaines, la couverture importante des avions


et satellites, ou bien encore les avances rcentes dans le domaine spatial concernant le cot
et la qualit des images satellitaires, font de la tldtection le moyen le plus efficace aujourdhui pour aborder la modlisation urbaine en 3D. Le temps mis pour acqurir des donnes
ariennes ou satellitaires sur une ville est notamment beaucoup plus court que le temps mis
par un gomtre pour effectuer un relev topographique. Il existe principalement trois types
de capteurs permettant dacqurir des donnes ariennes et satellitaires : les capteurs optiques, LASER et RADAR. Nous reviendrons sur ces diffrents types de donnes dans la
partie 1.2.1.
La modlisation urbaine en 3D par la tldtection prsente de nombreuses difficults
qui doivent tre prises en compte lors de la mise en place des processus. Voici les principales dentre elles :
La diversit des objets : Les scnes urbaines ne sont pas uniquement constitues de
btiments. Arbres, pelouses, haies, voitures, routes, trottoirs, ponts ou bien encore rivires : voici un panel dobjets que lon trouve rgulirement dans le paysage urbain
et qui doivent tre pris en compte lors de la mise en place du processus de modlisation 3D. Ces objets diffrent par des caractristiques de forme, de taille, de radiomtrie ou bien encore de texture. Bien souvent une tape de classification, prliminaire
au processus de reconstruction 3D, est ncessaire afin de localiser et didentifier ces
diffrents types dobjets dans la scne.
La densit des objets : Le nombre dobjets peut varier de manire importante dune
scne urbaine une autre. Lhtrognit de la rpartition des objets constitue une
source de difficults. Les zones urbaines denses posent notamment des problmes relatifs la reconnaissance et lextraction des objets.
La complexit des btiments : Afin de modliser efficacement les zones urbaines, il
est important de connatre et comprendre les diffrents types de btiments, et surtout
les lois qui rgissent leur construction. Or, ces dernires sont la fois trs varies
et complexes. Elles dpendent de nombreux facteurs tels que le contexte historique
(diffrentes vagues de construction au cours des poques) ou laspect gographique (
diffrentes chelles : nationale, rgionale, intra-urbaine). Tout ceci contribue crer
un certain dsordre au sein des zones urbaines, et rend difficile leur analyse, en particulier les tudes sur les typologies de btiments.
La spcificit des donnes : Les diffrents types de donnes utiliss en tldtection ont chacun leurs caractristiques propres en matire de reconstruction 3D. Tous
rencontrent des difficults pour extraire des informations 3D dans une scne. Nous
dtaillerons ces difficults par la suite.

10

Introduction

1.2 Etat de lart


Comme cela a t soulign prcdemment, la reconstruction 3D de scnes urbaines en
tldtection est un problme complexe. De nombreux systmes ont t dvelopps dans
des contextes varis. Dans cette partie, nous nous penchons sur les mthodes existantes
et tentons den dgager les points forts et les inconvnients. Cette tude est dterminante
pour le choix du systme qui sera propos dans le cadre de cette thse. Les mthodes de
reconstruction peuvent tre classes en fonction de cinq critres principaux :
Le type des donnes utilises - optique (monoscopie, stroscopie, multiscopie),
LASER, RADAR, produits drivs.
Le niveau dautomaticit du systme - automatique, automatique avec donnes cadastrales, semi-automatique.
La complexit des zones urbaines reconstruites - urbain dense, peri-urbain, zones
dactivit et dhabitats collectifs.
Le degr de gnralit de la modlisation 3D - prismatique, paramtrique, structurelle, polydrique.
Le type dapproche utilis - "Top-Down", "Bottom-Up", "Hypothesize-And-Verify".

1.2.1 Les donnes


Les donnes utilises pour la modlisation urbaine 3D doivent pouvoir fournir, directement ou indirectement, des informations tridimensionnelles sur la scne observe. Nous
voquons brivement ici, les principaux types de donnes possdant cette spcificit.
Rsolution des donnes
La rsolution des donnes est un point important permettant de choisir le niveau de
dtails de la modlisation 3D finale. Celle-ci dpend fortement du type de donnes utilis.
Dans ce paragraphe, nous nous efforons dtablir un lien entre la rsolution de donnes
optiques ariennes, et le niveau de dtails pouvant tre exig pour la reconstruction 3D.
Dune manire gnrale, on peut distinguer quatre gammes de rsolution :
>1m - ce sont des rsolutions trs basses pour traiter les problmes de reconstruction
en 3D de btiments. On peut cependant esprer fournir une modlisation par toits
plats (i.e. avec une simple estimation de la hauteur des btiments).
entre 1m et 50cm - cette gamme permet de proposer des modlisations assez simples
et gnralises, laissant apparatre les principaux plans de toits qui constituent un
btiment.
entre 50cm et 20cm - ces rsolutions sont adaptes pour fournir des reconstructions
dtailles des toitures, cest--dire prenant en compte les dcrochements de toits et
les petits pans mineurs qui constituent la toiture dun btiment.
<20cm - cette gamme permet dobtenir des modlisations trs dtailles et compltes,
en reconstruisant notamment des objets urbains trs intressants tels que les superstructures des toitures (chemine, chien-assis,...). On peut citer cet effet les travaux
de [Brdif et al., 2007].
Ces gammes de rsolution correspondent des donnes optiques ariennes. Avec des donnes optiques satellitaires, cela nest plus forcment valable, celles-ci ayant une moins
bonne qualit dimage rsolution identique.

1.2 Etat de lart

11

Monoscopie
La monoscopie consiste extraire des informations tridimensionnelles partir dune
seule image. [McGlone et Shufelt, 1994] et [Lin et Nevatia, 1998] proposent des approches
reposant sur le "shape from shadow", cest--dire en utilisant les informations inhrentes
lombre des objets. Ce type de procds fournit des modlisations assez pauvres, o les
btiments sont reprsents par des parallpipdes rectangles dont la hauteur est estime en
fonction de la projection de lombre dans limage. De plus, en considrant lombre comme
unique information tridimensionnelle, ces mthodes manquent de robustesse. Aujourdhui,
les systmes base de monoscopie tendent disparatre.
Stroscopie
La stroscopie est le procd de rfrence, du moins celui qui a focalis lattention des
chercheurs durant la dernire dcennie. Cette technique permet de calculer le relief dune
scne partir de deux images prises des points de vue diffrents. La vision humaine utilise
ce processus et permet lhomme dvoluer naturellement dans un environnement en ayant
cette notion de distance par rapport aux objets qui lentourent. Ce procd doit grer deux
difficults principales :
La mise en correspondance qui consiste retrouver les pixels homologues dans le
couple dimages (galement appele appariement). Cette opration est loin dtre
vidente et fait appel des mesures de corrlation parfois trs complexes. Les algorithmes doivent faire face aux changements de luminosit, aux bruits, aux dformations des images ou bien encore aux zones homognes.
Les zones doccultation qui rendent localement impossible la mise en correspondance
puisquun point de la premire image na pas dhomologue dans la seconde. Or ces
points sont frquents en stroscopie et obligent les algorithmes introduire des informations a priori.
Le paramtre principal lors dune prise de vue stroscopique est le rapport B/H (base sur
hauteur), o B reprsente la distance entre les deux centres de prise de vue, et H, la hauteur
entre la base des prises de vue et la scne observe (voir Figure 1.1). Ce rapport permet de
dterminer la prcision altimtrique thorique du relief en fonction de la prcision planimtrique. La valeur de ce rapport soulve un compromis entre la difficult dappariement et la
prcision altimtrique. En thorie, un B/H faible (i.e. deux images dont les prises de vue
sont trs proches) permettra une mise en correspondance relativement facile en restreignant
notamment les zones doccultation, cependant la prcision altimtrique sera mauvaise. Et
inversement. En pratique, ce principe nest pas toujours linaire et lon observe parfois des
intervalles de B/H clairement avantageux.
Ce procd, qui fournit des informations 3D fiables, a t utilis dans de nombreux
travaux. Les algorithmes proposs doivent cependant grer les zones doccultation. Face
ce problme, certains optent pour une modlisation 3D simplifie. Cest le cas notamment
de [Paparoditis et al., 1998] proposant uniquement des toits plats ou [Dang, 1994] reconstruisant des btiments parallpipdiques. Dautres, comme [Gruen, 1998; Gruen et Wang,
1998], voluent dans un contexte semi-automatique, cest--dire en permettant un oprateur dintervenir et de rectifier les erreurs de reconstructions. [Fuchs, 2001] et [Jibrini,
2002] ont propos des modles intressants permettant des reconstructions relativement
complexes.

12

Introduction

F IG . 1.1 Principe de la stroscopie

Multiscopie
La multiscopie est une extension de la stroscopie, dans le cas o lappariement est
ralis avec plus de deux vues. Cest aujourdhui la mthode dextraction dinformation 3D
la plus efficace. Ce procd permet de limiter les problmes doccultation et daccrotre la
prcision du relief. La multiscopie est notamment trs utile pour la dtection et la texturation
de faades grce aux nombreux angles de vue quelle offre. La plupart des travaux raliss
proposent des modlisations 3D relativement dtailles, avec des formes de btiments gnriques [Willuhn et Ade, 1996; Henricsson, 1998; Baillard et Zisserman, 1999; Heuel et al.,
2000; Scholze et al., 2002; Taillandier, 2004; Durupt et Taillandier, 2006]. Par ailleurs, une
partie importante des mthodes mises en place introduit de fortes connaissances a priori sur
les structures urbaines afin de rduire les temps de calcul et proposer des modlisations 3D
plus simples, comme par exemple [Jaynes et al., 1997; Collins et al., 1998; Fischer et al.,
1998; Noronha et Nevatia, 2001].
LASER
Contrairement ce qui prcde, les donnes LASER nutilisent pas une gomtrie
image. En effet, ces donnes ont un chantillonnage spatial irrgulier, ce qui rend les traitements plus difficiles que dans le cas de limagerie optique. Le second dfaut majeur est le
cot dacquisition, qui reste lev malgr le dveloppement important du LASER ces dix
dernires annes. Malgr cela, ces donnes possdent des caractristiques trs intressantes.
Les principales qualits du LASER rsident dans la prcision et la fiabilit des points relevs. Une caractristique galement profitable est le phnomne dit de double cho : le
signal mis est rflchi par la vgtation, mais galement par le sol aprs avoir travers
cette dernire, ce qui est particulirement intressant pour lextraction de la vgtation et
la discrimination bti / vgtation. Plusieurs mthodes de modlisation urbaine 3D utilisant
des donnes LASER ont t proposes [Haala et Brenner, 1999; Maas et Vosselman, 1999;
Rottensteiner et Briese, 2002; Bretar, 2006]. La prcision des points LASER permet, en

1.2 Etat de lart

13

gnral, dobtenir des rsultats robustes.


RADAR
Lintrt majeur de limagerie RADAR rside dans le caractre "tout temps" de lacquisition. Les images RADAR peuvent, en effet, tre prises aussi bien la nuit que par temps
nuageux, ce qui rend leur utilisation intressante notamment dans le domaine militaire et
pour la gestion de catastrophes naturelles. Ces donnes occasionnent cependant des inconvnients pnalisants pour la modlisation urbaine en 3D : difficults dinterprtation de
limage, double (voire triple) chos, bruits varis et importants qui donnent un signal trs
dgrad, rsolution relativement faible par rapport aux autres types de donnes. [Soergel
et al., 2005] se propose dtudier la faisabilit des applications lies la reconstruction
urbaine. Peu de travaux ont t raliss dans ce domaine. On peut citer les modles mis
en place par [Gamba et al., 2000; Simonetto et al., 2003; Tupin et Roux, 2003; Cellier,
2007]. Les modlisations 3D obtenues partir de donnes RADAR restent trs gnralises et nont pas encore atteint le niveau de complexit des reconstructions fournies par les
donnes optiques et LASER.
Produits drivs
Il existe galement des produits drivs des donnes voques prcdemment. Cest le
cas en particulier des Modles Numriques dElvation (MNE). Un MNE dcrit le relief
dune zone urbaine travers une grille rgulire de points en chacun desquels est associe
une information de hauteur. Ce produit est trs intressant puisquil sassimile directement
une description gomtrique tridimensionnelle dune scne.
Les MNE sont obtenus partir de diffrents types de donnes. La plupart sont gnrs
partir dimages optiques stroscopiques, et plus gnralement multiscopiques, par mise
en correspondance. Parmi les mthodes proposes, on retient notamment [Collins, 1996;
Baillard, 1997; Roy et Cox, 1998]. La figure 1.2 montre un MNE optique 25cm de rsolution sous deux dclinaisons : un MNE raster qui dcrit laltimtrie de la zone pixel par pixel,
et un MNE ombr qui prsente la scne en perspective avec un jeu dombre pour une visualisation plus raliste. Cette figure montre aussi le bruit important prsent dans les MNE, et
particulirement sur les plans de toits. Ce bruit souligne le problme dincertitude en vision
stroscopique et les difficults traiter les ambiguits [Senegas, 2002; De Joinville, 2003].
Les MNE obtenus partir de donnes LASER sont galement trs intressants. En effet,
les MNE LASER sont rputs pour leur qualit, et en particulier, pour la bonne et franche
localisation des faades de btiments, et plus gnralement la bonne retranscription des discontinuits altimtriques qui est bien souvent un problme pour les MNE optiques. Enfin,
il existe galement des MNE gnrs partir de donnes RADAR, comme par exemple
[Tison, 2004]. Compars aux MNE optiques et LASER, ces derniers sont malheureusement
limits, principalement par les inconvnients inhrents au RADAR.
Les MNE constituent de bonnes descriptions tridimensionnelles de scnes malgr un
bruit important. Beaucoup de mthodes de reconstruction de btiments les utilisent donc
comme donnes initiales. Cest le cas des processus proposs par [Weidner et Forstner,
1995; Vinson et Cohen, 2002; Flamanc et al., 2003; Ortner, 2004]. Certains travaux, comme
par exemple [Chehata et al., 2005], proposent de gnrer des MNE dits hybrides, cest-

14

Introduction

F IG . 1.2 Extrait de MNE 25 cm - version RASTER (gauche) et version ombre (droite)


- IGN.

-dire dans lesquels sont introduites des contraintes planaires permettant de modliser les
facettes de toits et de faades.
Il existe un deuxime produit driv : lorthoimage. Lorthoimagerie consiste "redresser"
une image de sorte la rendre superposable une carte. Les orthoimages sont notamment
trs utiles pour la dtection des contours des btiments, comme on peut le constater dans
[Vinson et Cohen, 2002]. Le calcul des orthoimages est fond sur celui des MNE. Par consquent, les orthoimages souffrent des mmes problmes que les MNE en matire de mise en
correspondance.

1.2.2 Lautomaticit
Un critre majeur dans la classification des mthodes est le niveau dautomaticit. Celuici caractrise le degr dintervention de loprateur mais galement lapport ventuel de
donnes cadastrales. En effet, les bases de donnes 2D fournissent une information structurelle trs forte. Lutilisation du cadastre comme une donne source change fondamentalement lapproche mettre en uvre. Nous prsentons trois degrs dautomaticit de processus : semi-automatique, automatique avec cadastre et automatique sans cadastre.
Processus semi-automatiques
Les mthodes semi-automatiques sont, lheure actuelle, les seules capables de produire grande chelle des modlisations 3D urbaines avec un taux derreur trs faible. Il
existe plusieurs processus particulirement intressants. Cest le cas du CC-modeler, dvelopp par [Gruen et Wang, 1998], o loprateur saisit les points correspondant au bord
du btiment, puis ceux correspondant des points cl de la topologie du toit comme les
extrmits dartes fatires. Le systme peut alors reconstruire le btiment sous une forme
polydrique. Cependant, ce processus ne gre pas les points errons (i.e. les erreurs ou inexactitudes de loprateur). Propos par [Flamanc et Maillet, 2005], BATI3D est un systme
interactif permettant le partitionnement du cadastre, voire sa modification, par un oprateur.
Les btiments sont ensuite reconstruits automatiquement par une des diffrentes mthodes

1.2 Etat de lart

15

incorpores au systme. [Li et al., 1999; Nevatia et Price, 2002] proposent un systme relativement complet o loprateur est peu sollicit comparativement aux systmes prcdents.
Une extension de ce systme a t propose, permettant un niveau de reconstruction 3D trs
dtaill grce la modlisation dlments structuraux urbains tels que des fentres, des
colonnes ou bien encore des pontons [Lee et Nevatia, 2003].
Processus automatiques avec donnes cadastrales
La reconstruction dune zone urbaine sans lintervention dun oprateur est un problme complexe. Cest pourquoi certains processus sappuient sur des donnes cadastrales
qui, quand elles existent, offrent une information structurelle trs forte sur les btiments. Le
cadastre fournit les emprises au sol des structures urbaines, ce qui permet de saffranchir
dune tape de focalisation/extraction des btiments. Le processus propos par [Brenner
et al., 2001] est fond sur une classification des diffrentes jonctions triples par intersections des plans. Le rsultat est convainquant, malgr une modlisation 3D trs simplifie
due notamment au fait que les ventuelles discontinuits altimtriques ne sont pas prises
en compte. [Jibrini, 2002] propose une mthode gnrant des hypothses de plans par des
transformes de Hough 3D. Lintersection des plans forment alors un ensemble de facettes
possibles parmi lesquelles on doit choisir la meilleure selon des critres de complexit sur
la forme des toits, et dattache aux donnes. Bien que les modlisations 3D soient trs gnriques, le processus souffre dun problme combinatoire puisque le nombre de plans dtects et le nombre de facettes possibles sont extrmement levs. Il existe galement beaucoup
dautres processus, par exemple [Suveg et Vosselman, 2001; Flamanc et al., 2003].
Processus automatiques
Cette catgorie soulve de nombreuses difficults de mise en uvre, puisquil faut
la fois localiser les btiments, extraire leur emprise au sol, et les reconstruire en 3D. La
majorit des mthodes proposes dans la littrature se situe cependant dans ce contexte. Les
processus tout automatiques ayant un taux faible derreurs constituent un des principaux
objectifs de demain dans le domaine. Ils permettraient de produire grande chelle des
modlisations 3D urbaines sans cot oprateur.
Dans le contexte tout automatique, il faut distinguer deux types de processus : ceux qui
utilisent une focalisation des btiments, et ceux qui utilisent une extraction des btiments.
La focalisation et lextraction sont des termes proches, mais lutilisation de lune ou lautre
a des consquences diffrentes sur lapplicabilit et lautomaticit du processus.
Focalisation des emprises Les processus fonds sur une focalisation demprises permettent de reconstruire une une des structures urbaines connexes. Pour ce faire, il est
ncessaire de dfinir a priori une zone englobante dans laquelle se trouve une unique structure urbaine connexe. Ces zones englobantes de focalisation sont dfinies de manire automatique. En pratique, le processus fonctionne pour les btiments relativement bien isols,
principalement sur des zones pri-urbaines, mais montre ses limites sur des zones urbaines
denses o la densit leve des structures urbaines ne permet pas un bon fonctionnement
de lalgorithme de focalisation. Les travaux utilisant cette stratgie sont nombreux, on peut
citer notamment [Baillard et Zisserman, 1999; Scholze et al., 2002; Taillandier, 2004].

16

Introduction

Extraction des emprises Les processus fonds sur une extraction des emprises ne
procdent pas "btiment par btiment" comme pour un procd de focalisation, mais ils
traitent des zones entires. Cela est ralis gnralement en deux tapes : extraction des
emprises de btiments dune scne (sous formes de polygones dans la plupart des cas), puis
reconstruction en 3D des btiments partir des emprises extraites. Les mthodes dextraction des emprises dpassent la simple notion de btiments isols et prennent en compte les
interactions existantes entre btiments voisins, voire lots de btiments. Par consquent, ces
mthodes sont bien adaptes aux zones denses. Cependant, elles sont plus complexes et plus
difficiles mettre en uvre.
[Oriot, 2003; Bailloeul et al., 2005] utilisent des contours actifs avec des contraintes linaires. Ces processus rencontrent cependant des problmes relatifs linitialisation des
contours. De plus, ce type doutil variationnel nest pas particulirement bien adapt lextraction de formes rectilignes. [Vestri, 2000] propose un algorithme intressant de vectorisation des contours de btiments pralablement extraits partir dune segmentation de MNE.
Les travaux proposs par [Vinson et Cohen, 2002] et [Ortner et al., 2007] permettent dextraire les emprises sous forme dun agencement de rectangles, le premier par un modle de
rectangle dformable, le second en utilisant des processus ponctuels marqus qui sont des
outils probabilistes sans contrainte dinitialisation.

1.2.3 Les zones urbaines


Le degr de complexit des zones urbaines reconstruites est un critre prendre en
compte pour classer les mthodes. Nous distinguons trois grandes familles de zones urbaines : les zones dactivit, les zones pri-urbaines et les zones urbaines denses. Les processus de reconstruction sont plus ou moins adapts certaines de ces familles. Il est assez
rare de trouver des mthodes fournissant des rsultats convaincants sur chacun de ces types
de zones.
Zones urbaines denses
Les zones urbaines denses correspondent aux centres-villes, et plus gnralement des
zones o la concentration de btiments est trs leve. La figure 1.3-(droite) prsente une
telle zone, en loccurrence, une partie du centre-ville dAmiens. Outre une forte densit de
btiments, ces zones sont caractrises par une variabilit importante des formes de toits,
lexistence dinteractions entre structures voisines, et une complexit de lenvironnement
due aux diffrents types dobjets qui le composent. Pour ces raisons, ce type de zones gnre
des difficults importantes dans la mise en place dun processus de reconstruction.
Dailleurs, quand on se penche sur la littrature, peu de mthodes automatiques ont t
appliques dans un contexte urbain dense. Avec lutilisation de donnes cadastrales, les
mthodes proposes par [Jibrini, 2002; Flamanc et al., 2003; Durupt et Taillandier, 2006]
fournissent de bonnes modlisations 3D sur de telles zones.
Zones pri-urbaines
Les zones pri-urbaines reprsentent les quartiers pavillonnaires ou rsidentiels. Ces
zones regroupent principalement deux types dhabitations : les habitats individuels (i.e. des

1.2 Etat de lart

17

maisons espaces entre elles) et les habitats groups de style maisons mitoyennes. La densit de btiments est relativement faible, et bien souvent, une part importante de vgtation
est prsente (voir figure 1.3-(centre)). La variabilit des btiments est peu prononce, tant au
niveau de la forme des toits que de la hauteur des constructions. Les difficults gnres par
ce type de zones sont donc plus faciles traiter que celles gnres par les zones urbaines
denses.
Beaucoup de processus automatiques sans donnes cadastrales ont t tests sur ce type
de zones, notamment [Baillard et Zisserman, 1999; Fuchs, 2001; Scholze et al., 2002;
Taillandier, 2004]. Le fait que les btiments soient principalement de petites structures assez
simples et isoles, permet en effet dextraire les emprises assez facilement.
Zones dactivit et dhabitats collectifs
Les zones dactivit et dhabitats collectifs sont caractrises par un mme type de
constructions : des btiments volumineux, possdant souvent des toits plats (de type hangars, entrepts ou grands immeubles), et gnralement espacs entre eux (voir figure 1.3(gauche)). Ces zones sont, en thorie, les moins difficiles reconstruire. Elles sont souvent
utilises pour tester les modles dits prismatiques, cest--dire estimant les toits par des
plans horizontaux. Cest le cas des travaux mens par [Collins et al., 1998; Lin et Nevatia,
1998; Noronha et Nevatia, 2001; Vinson et Cohen, 2002].

F IG . 1.3 Diffrents types de zones urbaines - zone dactivits (gauche), pri-urbaine


(centre), et urbaine dense (droite) - IGN.

1.2.4 Les modlisations 3D


Il existe diffrents types de modlisations 3D, plus ou moins complexes et dtaills.
Le choix de la modlisation dpend bien souvent des donnes utilises et de leurs caractristiques (principalement la rsolution). Les modlisations sont gnralement des associations de facettes planes connectes entre elles. Une facette plane est, en effet, un trs bon
moyen de modliser la fois les faades et les pans de toits. Les quatre principaux types
de modlisations 3D, savoir les modlisations prismatiques, paramtriques, structurelles
et polydriques, sont prsents dans la suite.

18

Introduction

Prismatique
Les modlisations prismatiques se caractrisent par un degr de libert planimtrique
important puisque les emprises des btiments sont des formes polygonales quelconques,
mais cependant avec une description altimtrique trs simplifie : les formes de toits possibles sont, en effet, restreintes la plus simple existante : la forme plate. La figure 1.4-(a)
schmatise cette modlisation. Une reconstruction prismatique est donc intressante lorsque
lon cherche une bonne description planimtrique avec une simple estimation des hauteurs
de btiments, et peut savrer efficace pour la description des zones dactivit ou lorsque
les donnes sont faiblement rsolues. A cet effet, on peut citer les processus mis en uvre
par [Collins et al., 1998; Lin et Nevatia, 1998; Noronha et Nevatia, 2001; Vinson et Cohen,
2002].

F IG . 1.4 Les diffrents types de modlisations 3D - prismatique (a), paramtrique (b),


structurelle (c), et polydrique (d).

Paramtrique
Une reconstruction paramtrique fournit des formes de btiments assez simples, et par
consquent, une description relativement gnrale des zones urbaines. Elle apporte, cependant, davantage de prcision que les modlisations prismatiques sur la forme de la toiture

1.2 Etat de lart

19

en proposant bien souvent des toits bi-pentes, quatre-pentes et des attaques en V. Certains
processus consistent choisir parmi une collection dhypothses de formes simples de toits
comme [Weidner et Forstner, 1995; Garcin et al., 2001; Suveg et Vosselman, 2001; Flamanc
et Maillet, 2005], dautres utilisent des algorithmes de squeltisation des emprises afin de
modliser les artes fatires [Gruen et Wang, 1998]. Les modlisations paramtriques sont
intressantes pour traiter des donnes faible rsolution : la simplicit des modles ncessite, en compensation, un apport de connaissances a priori sur les structures urbaines permettant de faire face au manque dinformation des donnes. Par ailleurs, en modlisant un
btiment par un jeu simple de paramtres, la combinatoire des processus est peu complexe,
ce qui leur confre bien souvent de la robustesse.
Structurelle
Les modlisations structurelles dcrivent un btiment comme un assemblage de modules lmentaires simples. Ces modules, qui sont souvent eux-mmes des modles paramtriques, reprsentent par exemple des terminaisons de btiments (terminaison droite,
attaque en V,...) ou des jonctions entre modules (jonctions en "L", en "T",...). Les modlisations structurelles sapparentent ainsi un jeu de "LEGO". L encore, ce type de
modlisation est adapt aux donnes faiblement rsolues. Il constitue un bon compromis
entre les modlisations paramtriques et les modlisations polydriques du point de vue de
la gnricit. Il ncessite nanmoins la mise en place de lois grammaticales, cest--dire
de contraintes sur lassemblage des modules entre eux. [Fischer et al., 1998] propose une
reconstruction structurelle relativement simple, nutilisant quune seule sorte de modules
(des coins) pour gnrer des hypothses de btiments. [Fuchs, 2001] prsente un processus
plus abouti, avec notamment une grammaire de modles plus complte, formalis par une
recherche disomorphisme de sous-graphes avec tolrance derreur. La complexit algorithmique est cependant assez importante.
Polydrique
Les modlisations polydriques sont les plus utilises car elles sont trs gnriques et
permettent de reconstruire une large gamme de structures urbaines sous forme de facettes
planes connexes. Cette importante gnricit impose des contraintes sur la qualit des donnes, en particulier une trs bonne rsolution. Beaucoup de mthodes [Henricsson, 1998;
Ameri, 2000; Heuel et al., 2000; Taillandier, 2004] ne limitent pas a priori les formes
reconstruire. Cela engendre cependant une complexit algorithmique trs importante. Dans
les travaux de [Baillard et Zisserman, 1999], la modlisation est obtenue par intersections
de demi-plans qui sont gnrs partir de segments 3D (les demi-plans potentiels tournent
autour des segments 3D). Celle propose par [Scholze et al., 2002] est relativement similaire : des segments 3D sont extraits, puis groups en facettes travers une interprtation
smantique. La modlisation de [Heuel et al., 2000] est fonde sur la dtection de coins
3D ( trois artes) constituant la base de la structure topologique. [Ameri, 2000] extrait des
plans 3D qui sont intersects selon un diagramme de Vorono modlisant les interactions
entre plans voisins. Ces mthodes fournissent, en gnral, des rsultants convaincants. Cependant, quand les btiments ont des formes relativement simples, ce type de processus
nest pas adapt en raison des temps de calcul importants mis pour explorer lespace des

20

Introduction

solutions.

1.2.5 Les approches


Le dernier critre permettant de caractriser les mthodes de reconstruction est lapproche utilise. Il existe trois grandes familles dapproches : bottom-up, top-down et hypothesizeand-verify.
Bottom-up
Les approches "bottom-up" partent de primitives pour proposer la reconstruction finale,
sans prendre en compte dventuelles connaissances a priori sur les btiments que lon
cherche reconstruire. Les approches "bottom-up" sont donc gnriques et ncessitent des
donnes de bonne qualit. Un inconvnient souvent inhrent ce type dapproches est le
manque de robustesse. En effet, lextraction de primitives est sujet aux problmes de surdtection et de sous-dtection qui influence le rsultat final. De plus, labsence (ou du moins
le manque) de connaissances a priori sur les btiments gnre parfois des rsultats peu
ralistes cause dune combinatoire importante. Dans la majorit des processus "bottomup", les primitives extraites sont des segments 3D ou/et des plans 3D. Il existe galement des
primitives de nature diffrente comme, par exemple, des hypothses de faades [Taillandier,
2004] ou des coins 3D [Heuel et al., 2000].
Top-Down
Dans les approches "top-down", linverse, des connaissances a priori sur les btiments
sont introduites. On part ainsi dun ensemble de modles connus lavance pour alors choisir celui qui prsente la meilleure cohrence avec les donnes. Ces approches sont gnralement plus robustes que les approches "bottom-up", mais se trouvent limites par la librairie
de modles dfinie a priori. Parmi les processus "top-down", on trouve par exemple [Fuchs,
2001; Garcin et al., 2001; Suveg et Vosselman, 2001; Vinson et Cohen, 2002; Flamanc et al.,
2003].
Hypothesize-And-Verify
Les approches "hypothesize-and-verify" sont des approches hybrides entre les approches
"bottom-up" et "top-down". Elles consistent, dans un premier temps, formuler des hypothses partir de primitives par une approche "bottom-up", puis dans un second temps,
vrifier ces hypothses par une approche "top-down". Ces approches sont utilises notamment dans [Willuhn et Ade, 1996; Fischer et al., 1998; Noronha et Nevatia, 2001; Scholze
et al., 2002].

1.2.6 Bilan
Dans ce paragraphe, nous nous sommes penchs sur les mthodes existantes et leurs
caractristiques. Cette tude fait ressortir deux points importants :

1.3 Le contexte de notre tude

21

Des contextes dtude trs varis. Comme nous venons de le voir, il existe beaucoup de critres permettant de classer les mthodes existantes. En consquence, il
est souvent difficile de comparer les mthodes entre elles. Plus prcisment, pour effectuer une comparaison pertinente entre deux systmes, il parat ncessaire que les
donnes soient identiques (ou du moins dune qualit quivalente, principalement la
rsolution), que les scnes reconstruites soient dun mme degr de complexit, et
enfin que le niveau dautomaticit soit le mme.
Deux grandes familles de processus. Bien quil soit difficile de comparer les mthodes entre elles, on peut distinguer deux grandes familles de processus. La premire
utilise des donnes de basse qualit et fournit des modlisations 3D peu gnriques,
partir de librairies de modles, en utilisant des approches de type "top-down". La seconde famille, spcifique des donnes de meilleure qualit, propose des reconstructions gnriques fondes sur des approches "bottom-up". Ces deux familles illustrent
bien le compromis existant entre la gnricit des modlisations et la robustesse des
processus.

1.3 Le contexte de notre tude


Dans cette partie, nous dtaillons le contexte de notre tude, en particulier les donnes
utilises, le type de zones reconstruire et le niveau dautomaticit exig. Ce contexte est
trs spcifique : il nexiste pas, actuellement, de processus dvelopp suivant nos contraintes.
Il nous est donc malheureusement impossible de comparer pertinemment nos travaux avec
des mthodes existantes. Nammoins, nous essayerons de donner des lments de comparaison avec certaines dentre elles.

1.3.1 Donnes spatiales et simulations PLEIADES


Grce aux rcents progrs raliss dans le domaine spatial, la modlisation 3D urbaine
peut, dornavant, tre aborde partir dimages satellitaires optiques rsolution submtrique. Les intrts de lutilisation de ce type de donnes sont multiples. Tout dabord,
le cot dacquisition au km2 de donnes satellitaires est sensiblement infrieur celui de
donnes ariennes. La large fauche des capteurs spatiaux permet de traiter des zones de
grande superficie. Acqurir de telles zones en arien est long et coteux. De plus, grce
la couverture trs tendue des satellites, il est possible dobtenir rapidement des images sur
nimporte quelle partie du globe (du moins, pour les constellations de satellites majeures).
Les donnes satellitaires prsentent nanmoins plusieurs inconvnients par rapport aux
images ariennes. Le principal concerne la qualit des images. La rsolution des satellites
nouvelle gnration, bien que sub-mtrique, est encore loin dgaler celle des images ariennes. Dans le cas des futurs satellites PLEIADES par exemple, la rsolution sera de 0, 7
mtre (i.e. une densit de 2 pixels/m 2 ), ce qui contraste fortement avec la rsolution des
images ariennes comprise entre 0, 25 mtre (i.e. une densit de plus de 16 pixels/m 2 ) dans
[Taillandier, 2004; Flamanc et Maillet, 2005; Durupt et Taillandier, 2006] et 0, 08 mtre
(i.e. une densit de plus de 140 pixels/m 2 ) dans [Baillard et Zisserman, 1999; Scholze
et al., 2002]. Outre la rsolution, dautres indicateurs soulignent la moins bonne qualit des
images satellitaires, comme par exemple le rapport signal sur bruit (130 pour PLEIADES

22

Introduction

vs 300 pour les images ariennes fournies par le capteur IGN). Lacquisition des images
satellitaires optiques est galement davantage dpendante des conditions mtorologiques,
principalement de la couverture nuageuse.
Les satellites PLEIADES
Le projet PLEIADES est une constellation de deux satellites offrant au nadir une rsolution spatiale de 0, 7 mtre en panchromatique pour une fauche de 20 km. Ils disposeront de
quatre bandes spectrales (bleue, verte, rouge et proche infra rouge) avec une rsolution de
2,8 mtres. Cette constellation, prvue oprationnellement pour 2010, permettra un accs
journalier en tout point du globe. Par ailleurs, ces satellites offriront des capacits dacquisition stroscopique particulirement intressantes. Des prises de vue tri-stroscopiques
le long de la trace (i.e. ralises quasi-simultanment) seront possibles, avec un rapport B/H
pouvant varier entre 0, 15 et 0, 8.
Dans le cadre de cette thse, des simulations PLEIADES fournies par le CNES sont utilises. Ces simulations ont t gnres partir dimages ariennes, dgrades afin de respecter les caractristiques PLEIADES (rsolution, rapport signal sur bruit,...). Nous disposons
de deux jeux de simulations : le jeu original 0, 7 mtre de rsolution, un autre 0, 5 mtre 2 .
Les images tri-stroscopiques simules ont un rapport B/H valant 0, 2, ce qui facilite la
mise en correspondance, mais confre une prcision altimtrique moyenne.
Le contenu informatif des images PLEIADES
La rsolution sub-mtrique des satellites PLEIADES permet denvisager de nombreuses
applications en tldtection, en particulier la reconstruction en 3D de btiments. Il est important danalyser le contenu informatif des images PLEIADES afin den connatre le potentiel en matire de modlisation urbaine 3D.
De manire gnrale, la rsolution de ces images ne permet pas lextraction des superstructures de toit (chemine ou chien-assis), des dcrochements de toit ou des petits pans de toit.
Elle permet cependant dextraire la forme gnrale des toits, i.e. les principaux plans qui
composent une toiture. La figure 1.5 montre deux btiments prsents travers trois jeux
de donnes. Le premier jeu correspond des images ariennes 0, 25m, images partir
desquelles ont t gnres les simulations PLEIADES. Les deux autres jeux reprsentent
respectivement les simulations PLEIADES 0, 5m et 0, 7m. On peut noter une nette dgradation de la qualit image entre le jeu arien et les deux jeux de simulations PLEIADES.
Cette dgradation est notamment symbolise par la diffrence de qualit des superstructures de toits. Les chemines sont facilement identifiables sur le jeu arien (une quarantaine
de pixels pour une chemine), mais pas sur les jeux satellitaires (quelques pixels) o elles
apparaissent plutt comme du bruit au sein des principaux pans de toits. La diffrence de
qualit se manifeste galement lorsque lon cherche extraire des primitives de ces images,
telles que des segments 3D par lalgorithme de [Taillandier et Deriche, 2002]. Trs bruites,
les donnes satellitaires ne permettent pas dobtenir des segments 3D dintrt de manire
robuste.
2 Ces

deux jeux de simulations ont t fournis en 2004. A ce moment, la rsolution finale des satellites
PLEIADES navait pas encore t dfinie et une incertitude entre 0, 5 et 0, 7 mtre demeurait.

1.3 Le contexte de notre tude

23

F IG . 1.5 Diffrents jeux de donnes optiques - images ariennes 25cm de rsolution


(haut), simulations PLEIADES 0, 5m (centre) et 0, 7m (bas) - IGN/CNES.

24

Introduction

F IG . 1.6 MNE associs aux donnes de la figure 1.5, gnrs par lalgorithme MICMAC
- IGN.

1.3 Le contexte de notre tude

25

Les MNE PLEIADES


Les MNE gnrs partir des images PLEIADES sont intressants analyser. Ils permettent de mettre en avant les informations 3D pouvant tre extraites, et ainsi destimer le
niveau de dtails de la modlisation finale. De nombreux algorithmes de gnration de MNE
ont t dvelopps. LInstitut Gographique National a principalement mis au point deux
processus dappariement, [Baillard, 1997] et [Pierrot-Deseilligny et Paparoditis, 2006]. Le
plus rcent, et galement le plus performant, est lalgorithme MICMAC (Multi Images Correspondances par Mthodes Automatiques de Corrlation). Lapproche de MICMAC est
fonde sur une analyse multi-rsolution formule par un problme de minimisation nergtique. Lnergie combine un terme dattache aux donnes avec un terme a priori permettant dintroduire des contraintes de rgularisation. Elle est optimise par une technique
de "graph-cut", fonde sur les travaux de [Roy et Cox, 1998]. La figure 1.6 prsente les
MNE obtenus par MICMAC en tri-stroscopie, correspondant aux donnes prsentes sur
la figure 1.5. La qualit des MNE obtenus confirme ce qui a t dit dans le paragraphe prcdent : les donnes satellitaires permettent, au mieux, dextraire les plans de toits principaux
des btiments. Dans le chapitre 3, nous reviendrons de manire plus dtaille sur le potentiel
des MNE "satellitaires" concernant la restitution des formes de toits.
Un MNE comme unique donne dentre ?
Nous venons de voir que les MNE de type PLEIADES transposaient bien les informations contenues dans les images, savoir les plans principaux des toits. La question de
lutilisation dun MNE comme unique donne dentre se pose. Ltude sapparenterait,
dans ce cas, un problme de rgularisation dune nappe 3D.
Comme nous lavons vu prcdemment, les simulations PLEIADES ne permettent pas dextraire, de manire robuste, des primitives 3D tels que des plans ou des segments 3D. Nous
pourrions envisager de mettre en place une mthode qui, via un terme dattache aux donnes, calculerait la vraisemblance dune solution directement partir des images par un
procd dappariement. Cependant, une telle mthode serait extrmement complexe puisquil faudrait galement quelle gre le manque dinformation des donnes (et donc un
apport de connaissances a priori). Les travaux mens par [Garcin et al., 2001] tmoignent
de la difficult concilier ces deux aspects. Avec une qualit moyenne dimage, lutilisation dun MNE comme unique donne dentre est donc une option tout fait intressante.
Dailleurs, de nombreuses mthodes comme [Vinson et Cohen, 2002; Ortner, 2004; Durupt
et Taillandier, 2006] ont choisi cette solution.

1.3.2 Vers de lurbain dense en automatique


Lintrt du tout-automatique
Notre tude se situe dans un contexte automatique, cest--dire sans lintervention dun
oprateur, et sans donnes cadastrales. Dans le cadre satellitaire, ces processus automatiques sont trs intressants, en particulier pour les pays en voie de dveloppement. Tout
dabord, les bases de donnes cadastrales de ces pays sont souvent incompltes, parfois obsoltes, voire inexistantes. Par ailleurs, lacquisition de donnes ariennes ou terrestres y

26

Introduction

est gnralement difficile et onreuse cause du manque de moyens locaux et du besoin de


sous-traitance des pays plus dvelopps.
De lurbain dense
Parmi les diffrents types de zones urbaines, celles qui suscitent le plus dintrt de la
part des urbanistes, industriels et militaires, sont les zones urbaines denses. Lurbain dense
correspond galement aux zones les plus difficiles modliser. Sans donnes cadastrales,
les processus fonds sur une focalisation des btiments sont mal adapts. Il est donc ncessaire de proposer des processus dextraction des emprises dans ce contexte.
Il est intressant que les processus soient applicables sur dautres types de zones urbaines
(i.e. pri-urbaines et dactivit). Cependant, dvelopper un algorithme qui fonctionne pour
lurbain dense ne garantit pas forcement de bons rsultats sur dautres types de zones. En
effet, la densit importante des btiments et lexistence dinteractions fortes entre les structures voisines dans le cadre urbain dense, engendrent des processus avec de fortes connaissances a priori, difficilement transposables dautres contextes urbains.

1.4 La stratgie
Dans cette partie, nous dfinissons et justifions la stratgie choisie, et voquons brivement les diffrentes tapes permettant la mise en place de la mthode propose.

1.4.1 Lapproche structurelle


Le contexte impos par ltude oriente fondamentalement le choix de lapproche. Celle
qui apparat la plus lgitime est lapproche structurelle. Son choix se justifie par les raisons
suivantes :
Nous avons vu que la qualit des donnes permettait, au mieux, de reconstruire les
pans de toits principaux, cest--dire la forme gnrale des toitures. Ce premier point
signifie que les modlisations polydriques de btiments ne sont pas adaptes notre
contexte, celles-ci exigeant des donnes dune meilleure qualit. Dautre part, des
modlisations prismatiques, voire paramtriques, seraient relativement grossires, et
ne permettraient pas dexploiter tout le potentiel des images. Une modlisation structurelle apparat donc comme un compromis intressant.
Le premier point est renforc par limpossibilit dutiliser les mthodes classiques
dextraction de primitives 3D, due principalement un important bruit dans les donnes. Cela favorise lutilisation dapproches "top-down" face aux approches "bottomup". Ces premires sont spcialement adaptes aux modlisations fondes sur lutilisation dune bibliothque de modles.
Le contexte de notre tude (traiter des zones urbaines denses en automatique partir
de donnes satellitaires) est particulirement difficile et exigeant. Face cela, il est
ncessaire dintroduire de fortes connaissances a priori sur les structures urbaines.
Lapproche structurelle est alors idale, puisque par dfinition, elle permet de modliser des btiments en assemblant des modules urbains lmentaires travers des
connaissances a priori sur les modles et leur assemblage.

1.4 La stratgie

27

Par ailleurs, la modlisation structurelle est trs intressante en elle-mme travers son
aspect volutif (on choisit les types de modles constituant la bibliothque, on peut notamment ajouter ou enlever des types de modles en fonction de lapplication). Elle a galement
t peu exploite dans la littrature, ce qui rend intressant son approfondissement.

1.4.2 Les outils stochastiques


Les modles probabilistes sont des outils trs utiles pour traiter les problmes de traitement dimages. Utiliss initialement au niveau pixlique pour aborder les problmes de
segmentation et de restauration dimages [Geman et Geman, 1984; Besag, 1986], ils se sont
ensuite tendus la notion dobjet [Stoyan et al., 1987; Grenander et al., 1991; Pennec,
1996; Descombes, 2004], cest--dire en associant des variables alatoires, non plus des
pixels, mais des objets et des formes paramtriques relativement complexes. Les modles
probabilistes sont particulirement intressants car ils permettent :
dintroduire des contraintes gomtriques sur la nature et la forme des objets recherchs (dans notre cas, divers modles paramtriques 3D constituant la bibliothque de
modules urbains),
dutiliser des informations statistiques sur lagencement gomtrique des objets dans
la scne (dans notre cas, modliser efficacement les lois dassemblage, points fondamentaux dune approche structurelle permettant de reprsenter un btiment comme
une association de modules urbains),
de traiter des espaces dtat de trs grande dimension (traiter des scnes urbaines
entires composes de plusieurs centaines de btiments par des objets paramtriquement complexes).
Pour ces raisons, les modles stochastiques sont particulirement adapts la mise en place
dune approche structurelle. Dans la suite, nous prsentons brivement ce type doutils,
ainsi que certaines de leurs proprits. Pour un point de vue plus complet sur ces techniques
et leurs volutions, on pourra consulter [Prez, 2003; Descombes, 2004].
Modles probabilistes pour les problmes inverses
Les problmes inverses sont trs rpandus en traitement dimages. Ce type de problme
consiste retrouver une grandeur x travers une donne observe y. Cest le cas de notre
tude : on cherche une configuration de formes paramtriques 3D partir dune image, plus
prcisment dun MNE. Pour aborder ce type de problme, on fait appel deux processus
alatoires :
Y , correspond aux donnes ou observations (gnralement une ou plusieurs images
et/ou primitives extraites dimages).
X, correspond aux configurations dobjets ou tiquettes (i.e. une variable alatoire
dfinie dans lensemble des configurations dobjets possibles).
Dans de nombreux cas, la loi a posteriori P(X = x|Y = y) est utilise pour modliser le
problme inverse. Par cette loi, on mesure la probabilit dune ralisation x connaissant les
donnes observes y.
Un estimateur de X particulirement intressant est celui qui permet de trouver la ralisation qui maximise la probabilit a posteriori : cest lestimateur du Maximum A Posteriori

28

Introduction

(XMAP ) :

XMAP = arg max P(X = x|Y = y)


x

(1.1)

Formulation Baysienne
Pour mettre en place la loi a posteriori, on utilise gnralement une formulation Baysienne. La formule de Bayes permet dexprimer la loi a posteriori travers la loi marginale
des observations P(Y = y), la loi des observations conditionnellement X P(Y = y|X = x)
et la loi a priori P(X = x) :
P(X = x|Y = y) =

P(Y = y|X = x)P(X = x)


P(Y = y)

(1.2)

Les observations tant connues, la loi marginale des observations peut tre omise pour loptimisation :
P(X = x|Y = y) P(Y = y|X = x)P(X = x)
(1.3)
Pour rsumer, la loi a posteriori est directement proportionnelle au produit de deux lois : la
loi conditionnelle des observations, ou vraisemblance, qui mesure la cohrence des donnes
avec une ralisation x, et la loi a priori, qui impose des contraintes de rgularisation sur x.
Dans de nombreux cas, lhypothse dindpendance conditionnelle des donnes est ralise
afin de simplifier le calcul de la vraisemblance. En indiant par i les diffrents composants
de X, on a alors :
(1.4)
P(Y = y|X = x) = P(Yi = yi |Xi = xi )
i

Le cadre Markovien
Rechercher lestimateur du MAP est souvent un problme doptimisation trs difficile,
principalement d la complexit du calcul de la loi a priori. Le cadre Markovien permet
de simplifier cela en restreignant le problme doptimisation globale des problmes doptimisation locaux [Winkler, 1995; Li, 1995]. Concrtement, on contraint chaque lment
dune ralisation x une dpendance locale, cest--dire considrer quil est en interaction
uniquement avec les lments qui lui sont proches.
Cette notion de proximit se caractrise travers la mise en place dun systme de voisinage,
not V . La proprit de Markovianit de X se formule alors par lexpression suivante :
P(Xi = xi |X j = x j , i 6= j) = P(Xi = xi |X j = x j , j V (i))

(1.5)

o i et j indicent les lments du processus X.


Un des principaux intrts du cadre Markovien est la possibilit dexprimer la loi a priori
travers une nergie U, appele nergie de Gibbs. La loi a priori peut ainsi scrire :
P(X = x) =

1
exp U(x)
Z

(1.6)

o Z est une constante de normalisation dfinie par Z = x exp U(x), et U, une nergie
pouvant se dcomposer en une somme de potentiels, cest--dire dnergies dinteraction
entre lments voisins. Dune manire gnrale, la recherche de lestimateur du MAP peut
donc sapparenter un problme de minimisation nergtique.

1.4 La stratgie

29

Recherche du MAP et techniques doptimisation


La recherche de lestimateur du MAP cache bien souvent un problme doptimisation
difficile, non convexe, dans un espace dtat trs vaste. Plusieurs techniques doptimisation sont envisageables. Celles-ci peuvent tre classes en deux catgories : les algorithmes
dterministes et les algorithmes probabilistes.
Algorithmes dterministes Ce sont, pour la plupart, des algorithmes sous-optimaux, cest-dire ne permettant pas de trouver le minimum global dune fonction, mais seulement des
minima locaux. Par consquent, ils dpendent fortement des conditions initiales. Nous abordons brivement dans ce paragraphe quelques algorithmes utiliss en traitement dimages.
Les techniques de descente de gradient permettent rapidement datteindre un minimum local, la drive de la fonction doit cependant tre facilement calculable ou du moins estimable en tout point. Les techniques fondes sur la thorie des graphes, particulirement les
mthodes de coupure de graphe ("graph-cut"), sont particulirement prises [Greig et al.,
1989; Boykov et al., 1999]. LICM ("Iterated Conditional Modes"), prsent dans [Besag,
1986], est une mthode doptimisation itrative fonde sur un parcours dterministe des lments. Son efficacit est cependant assez limite puisquelle ne permet pas loptimisation
de problmes non convexes et est dpendante de la configuration initiale. Cette mthode est
souvent utilise pour traiter les problmes de rgularisation dimages. Le GNC ("Graduated Non Convexity"), propos par [Blake et Zisserman, 1987], permet loptimisation dune
classe particulire de fonctions non convexes, par une approximation itrative en fonctions
convexes. Cette classe est malheureusement assez restreinte. On peut galement citer des algorithmes pour les modles causaux, tels que [Viterbi, 1967; Forney, 1973] sur des chanes
ou [Lafert, 1996] sur des quadrabres, qui permettent doptimiser globalement une squence
dtats.
Algorithmes probabilistes Ce type dalgorithmes se place dans une autre optique : trouver le minimum global dune fonction non convexe, sans tenir compte des contraintes de
temps et sans dpendance aux conditions initiales. La plupart sont fonds sur une relaxation stochastique de type recuit simul [Metropolis et al., 1953]. Une famille importante
dalgorithmes est celle utilisant les chantillonneurs de type Monte Carlo par Chanes de
Markov [Hastings, 1970; Green, 1995; Robert, 1996]. Cela consiste construire une chane
de Markov temps discret sur lespace dtat, qui converge vers la solution dsire. Les
transitions correspondent des perturbations simples de la configuration courante, ce qui
permet de les simuler facilement, surtout lorsque la fonction (ou nergie) a t mise en
place dans un cadre Markovien. En pratique, on atteint rarement le minimum global, mais
une solution proche en utilisant des relaxations "rapides". Une autre famille intressante est
celle des processus de diffusion, fonds notamment sur les quations de Langevin [Geman
et Huang, 1986; Grenander et Miller, 1994]. Ils sapparentent des techniques de descente
de gradient dans lesquelles une partie alatoire, de type mouvement Brownien, a t ajoute
afin de permettre la trajectoire de sortir des puits nergtiques.
Enfin, dautres algorithmes, comme ceux fonds sur le filtrage particulaire [Doucet et al.,
2000; Prez, 2003] ou les algorithmes gntiques [Mitchell, 1996], consistent suivre les
volutions de particules ou individus correspondant des tats. Un des avantages de ces

30

Introduction

algorithmes rside dans le fait quils fournissent non pas une solution, mais un ensemble
dtats intressants.

1.4.3 Dmarche gnrale


Pour rsumer, la mthode que nous souhaitons mettre en place, utilise comme unique
donne dentre un MNE. Ce dernier a t pralablement gnr partir dimages optiques
satellitaires, en loccurrence des simulations PLEIADES. Lobjectif est de reconstruire automatiquement des zones urbaines denses. Pour ce faire, nous avons opt pour une modlisation structurelle formule dans un cadre stochastique. La dmarche de ce travail se
dcompose en trois parties rsumes ci-dessous.

F IG . 1.7 Illustration de la dmarche gnrale

Extraction des btiments


La premire tape, aborde dans le chapitre 2, consiste extraire les btiments partir
dun MNE. Premirement, nous utilisons des travaux antrieurs, dvelopps dans le projet
Ariana, fonds sur les processus ponctuels marqus afin dextraire des caricatures des emprises de btiments travers un agencement de rectangles. Ensuite, nous rgularisons cet
agencement afin dobtenir des supports 2D adapts une approche structurelle, en loccurrence un agencement de quadrilatres quelconques qui sont connects entre voisins et qui
correspondent des parties spcifiques dun btiment.
Reconstruction des btiments
Ltape de reconstruction des btiments est traite dans le chapitre 3. Aprs avoir dfini
une bibliothque de modles 3D, nous reconstruisons les btiments en recherchant la configuration optimale de modles 3D se fixant sur les supports prcdemment extraits. Cette
configuration correspond la ralisation qui maximise une densit mesurant la cohrence
entre la ralisation et le MNE, mais galement prenant en compte des connaissances a priori
telles que les lois dassemblage des modules.
Exprimentations
Dans le chapitre 4, nous discutons de la pertinence de cette approche en analysant les
rsultats obtenus. Nous abordons galement linfluence de la technique doptimisation et
des supports 2D sur les rsultats et voquons les limites de notre mthode.

Chapitre 2

Extraction des btiments

32

Extraction des btiments

Dans ce chapitre, nous prsentons le processus mis en place pour extraire les emprises
de btiments partir dun MNE. Dans le cadre de notre approche structurelle, lobjectif de
cette premire tape est de fournir les supports 2D (ou emprises) des modules urbains composant un btiment. Cela signifie que le rsultat attendu devra satisfaire certaines contraintes
relatives :
la nature des supports 2D - Ce doit tre des objets gomtriques facilement paramtrables, et de plus, chacun doit correspondre une partie spcifique dun btiment
afin de modliser au mieux les jonctions de toitures ou les discontinuits de hauteurs
de toits par exemple.
la connexion des supports entre eux - Les supports voisins doivent pouvoir se connecter parfaitement entre eux, cest--dire sans recouvrement surfacique. Cest un point
important qui permet dviter la prsence dartefacts, et galement de faciliter la mise
en place des lois dassemblage.
Ce problme est donc plus complexe quune simple extraction surfacique de btiments. Le
processus propos se dcompose en deux tapes. Premirement, nous extrayons des caricatures des emprises de btiments travers un agencement de rectangles. Pour cela, nous utilisons des travaux antrieurs fonds sur les processus ponctuels marqus. Une fois la forme
gnrale des emprises obtenue, un processus de rgularisation est appliqu afin davoir des
emprises plus prcises et mieux adaptes une approche structurelle, cest--dire des supports structuraux. Ainsi, cette seconde tape permet de transformer un agencement de
rectangles en objets plus complexes (en loccurrence des quadrilatres et triangles quelconques) qui sont connects entre voisins, puis de les diviser en supports possdant des
hauteurs de toit diffrentes.

2.1 Caricatures de btiments par agencement de rectangles :


rappel et analyse de travaux antrieurs
La premire tape consiste extraire une description gnrale des emprises de btiments. La mthode doit tre automatique et sans focalisation, avec pour unique donne
dentre un MNE satellitaire, cest--dire dune qualit moyenne. Bien que nous ne cherchons quune forme gnrale demprises, ce problme est difficile comme nous avons pu le
souligner dans la partie 1.2.2.
Pour ce faire, nous utilisons les travaux dOrtner [Ortner, 2004; Ortner et al., 2007]. Ils
consistent extraire les emprises de btiments sous la forme dun agencement de rectangles.
Ces objets sont probablement les formes gomtriques les plus simples permettant une description gnrale des emprises de btiments. Le cadre gnral de ces travaux est fond sur
les processus ponctuels marqus : il sagit de variables alatoires dont les ralisations sont
des configurations dobjets gomtriques. Face la complexit et la diversit des formes de
btiments, une telle approche est particulirement intressante car elle fournit une modlisation des emprises travers des objets gomtriques simples. De plus, ces travaux prennent
en compte des connaissances a priori sur la disposition spatiale des objets entre eux. Le

2.1 Caricatures de btiments par agencement de rectangles : rappel et analyse de


travaux antrieurs
33
problme est dfini travers la minimisation dune fonction dnergie. La configuration de
rectangles qui minimise lnergie est trouve au moyen dun recuit simul. Dans la suite de
cette partie, nous prsentons ces travaux, sans toutefois rentrer dans les dtails.

2.1.1 Processus ponctuels marqus


Considrons un processus ponctuel X dfini sur le compact K = [0, X max ] [0,Ymax ] qui
reprsente une image. X est une application mesurable dun espace probabilis (, A , P)
dans lensemble des configurations de points de K :
, xi K, n N, X() = {x1 , ..., xn }

(2.1)

Un processus ponctuel marqu est un processus ponctuel o chaque point est associ une marque, cest--dire des paramtres permettant de dfinir un objet. Un processus
ponctuel marqu est dfini sur U = K M o M est lespace des marques (dans notre cas,
lespace des paramtres du rectangle duquel on exclut le centre) :

M = [ , ] [Lmin , Lmax ] [lmin , lmax ]
2 2

(2.2)

On note C , lespace des configurations finies dobjets de U.


C=

nN

(K M)n

(2.3)

La figure 2.1 reprsente une ralisation dun processus ponctuel dans K, une ralisation dun
processus ponctuel marqu dans U, et un lment de U. Pour davantage de dtails sur les
processus ponctuels et leurs applications, le lecteur pourra consulter [Van Lieshout, 2000;
Descombes, 2004].

F IG . 2.1 Illustration dun processus ponctuel marqu - ralisation dun processus ponctuel
dans K (gauche), lment de U (avec (Xc ,Yc ) K, le centre du rectangle, (, L, l) M,
lorientation, la longueur et la largeur du rectangle) (centre), ralisation dun processus
ponctuel marqu dans U (droite).

2.1.2 Formulation de lnergie


Considrons un processus ponctuel marqu X spcifi par une densit non normalise
h(.) dfinie dans C . La densit h(.) se dcompose en diffrents termes qui peuvent tre

34

Extraction des btiments

dfinis travers des nergies. Ainsi, pour une configuration x C , la densit est donne
par :
h(x) = exp (Uext (x) +Uint (x) +Uexcl (x))

(2.4)

Ces trois termes nergtiques sont prsents brivement dans la suite. Pour plus de dtails,
le lecteur pourra consulter [Ortner, 2004; Ortner et al., 2007].
Terme dattache aux donnes Uext
Ce terme permet de mesurer la qualit dune configuration de rectangles connaissant les
donnes, en loccurrence un MNE. Il peut tre dcompos en une somme dnergies U d (.)
associes chaque objet de la configuration, cest--dire tel que U ext (x) = ux Ud (u). Ainsi,
pour chaque rectangle u x, une nergie locale dattache aux donnes est calcule grace
un algorithme fond sur la comparaison entre les discontinuits prsentes dans le MNE et
les contours du rectangle.
La figure 2.2-(a) prsente un extrait de MNE, ainsi quun rectangle sur lequel des coupes
ont t disposes. Afin de mesurer la qualit du positionnement du rectangle par rapport au
MNE, on extrait, sur chaque coupe, des points dintrt correspondant des discontinuits
du MNE (voir figure 2.2-(b)). Ces points dintrt sont dtects par un algorithme de simplification de profil dtaill dans [Ortner et al., 2007]. On vrifie ensuite la cohrence entre
ces points et le contour rectangulaire de lobjet en utilisant trois critres. Le premier critre
permet de calculer un taux de volume, cest--dire de vrifier si la surface dfinie par les
points dintrt a un recouvrement compatible avec celle du rectangle (voir la figure 2.2-(c)
- les lignes grises reprsentent des segments utiliss pour calculer le taux de volume). Le
second critre correspond un taux de moment, et permet de mesurer lorientation du rectangle relativement aux points dintrt (voir la figure 2.2-(d) - les lignes grises reprsentent
des segments utiliss pour calculer le taux de moment). Enfin, le troisime critre vrifie si
les points dintrt sont bien localiss relativement aux contours du rectangle (voir la figure
2.2-(e) - les points dintrt suffisamment proches des contours du rectangle sont entours).

F IG . 2.2 Energie dattache aux donnes : un extrait de MNE avec un rectangle propos (a),
points dintrt dtects (b), taux de volume (c), taux de moment (d), taux de localisation
(e).

2.1 Caricatures de btiments par agencement de rectangles : rappel et analyse de


travaux antrieurs
35
Energie interne Uint
Lnergie interne Uint (x) permet de donner une structure spatiale particulire la configuration x. Cest un terme de rgularisation qui prend en compte trois types dinteractions
entre objets voisins. Le premier permet de favoriser lalignement des rectangles. Cela est
particulirement efficace pour extraire les longues structures urbaines, souvent parallles
aux rseaux routiers, sans pour autant perdre la notion de connexit entre les objets. Le
deuxime type dinteractions, dit de pavage, agit sur les configurations parallles de rectangles afin de modliser les configurations de btiments juxtaposs. Enfin, les interactions
de compltion favorisent le raccordement des rectangles trs proches par lajout de rectangles complmentaires. Cela permet dobtenir des configurations dont les rectangles sont
embots les uns aux autres, ce qui est particulirement utile dans le cas des zones urbaines
denses. La figure 2.3 illustre ces trois types dinteractions.

F IG . 2.3 Energie interne : interactions dalignement (a), interactions de pavage (b), interactions de compltion (c)

Energie dexclusion Uexcl


Ce terme permet dviter la prsence dobjets redondants. Il empche, principalement,
les interactions attractives de provoquer une accumulation inutile dobjets certains endroits. Ce terme pnalise ainsi les objets ayant un taux de recouvrement important avec
dautres objets.
Optimisation
Une fois la densit h dfinie, lobjectif est de trouver la configuration de rectangles xb
qui maximise h :
xb = arg max h(x)
(2.5)
x

Un chantillonneur de Monte Carlo par Chanes de Markov Sauts Rversibles (RJMCMC)


[Green, 1995], coupl un recuit simul est particulirement adapt pour aborder les problmes fonds sur une modlisation par processus ponctuels marqus [Van Lieshout, 2000].
Cet chantillonneur consiste construire une chane de Markov temps discret sur lespace
dtat. Un des principaux avantages rside dans le fait que la chane converge asymptotiquement vers la densit dsire quelque soit la configuration initiale. Les transitions de cette

36

Extraction des btiments

chane correspondent des transformations locales de la configuration dobjets, appeles


mouvements ou sauts. Ces mouvements sont simuls par des noyaux de propositions. Nous
ne rentrerons pas dans les dtails de cet algorithme (le lecteur pourra se rfrer [Ortner,
2004] ou la partie 3.3.1 du manuscrit), cependant il est intressant de dcrire les diffrents
noyaux de propositions qui gnrent les transformations dobjets.
La figure 2.4 prsente les noyaux utiliss. Les deux premiers types de noyaux sont les
naissances et morts uniformes, qui permettent respectivement dajouter et de supprimer
alatoirement un rectangle dans la configuration dobjets. Ces deux transformations, qui
correspondent des sauts dans des espaces de dimension suprieure (naissance) et infrieure (mort), sont les deux noyaux de base, suffisant pour garantir que la chane de Markov
puisse atteindre nimporte quelle configuration de lespace dtat. Il est cependant important de dfinir dautres noyaux, plus pertinents, afin dacclrer la convergence du processus. Ainsi, on introduit des noyaux de naissance et mort dans un voisinage [Van Lieshout,
2000; Lacoste et al., 2005], permettant dajouter/supprimer des objets dans un voisinage
de rectangles de la configuration courante. Trois autres noyaux sont galement introduits,
savoir la rotation, la dilatation et la translation : il sagit de perturbations visant modifier
les paramtres des objets.

F IG . 2.4 Les diffrents noyaux de propositions qui rgissent lchantillonneur RJMCMC


Lchantillonneur RJMCMC ncessite une relaxation stochastique pour assurer la convergence du processus. Il est ainsi coupl un recuit simul [Metropolis et al., 1953]. Ainsi,
1
la densit h(.) est remplace par h(.) Tt o Tt est une squence de temprature qui tend
vers 0 quand t tend vers linfini. En pratique, une dcroissance gomtrique, dtaille dans
[Van Laarhoven et Aarts, 1987], est utilise. Ce schma de dcroissance est particulirement
efficace pour obtenir une solution approche de manire relativement rapide. Au dbut de
lalgorithme (i.e. quand la temprature est leve), le processus nest pas trs slectif, ce
qui permet dexplorer les diffrents modes de la densit. Quand la temprature dcrot, les
configurations dobjets ayant une densit leve sont favorises. A basse temprature, le
processus est proche de la solution optimale. La figure 2.5 prsente un exemple de lvolution dune configuration dobjets au cours de la dcroissance de temprature.

2.1 Caricatures de btiments par agencement de rectangles : rappel et analyse de


travaux antrieurs
37

F IG . 2.5 Processus doptimisation - Exemple de lvolution dune configurations dobjets


au cours de la dcroissance de temprature (haut), dcroissance nergtique associe, et
dcroissance de temprature (bas).

38

Extraction des btiments

2.1.3 Commentaires
La figure 2.6 prsente des rsultats obtenus partir de MNE de type PLEIADES, correspondant deux btiments de la ville dAmiens (France). De manire gnrale, ces rsultats
sont satisfaisants aussi bien du point de vue du recouvrement surfacique que de la localisation des faades. La figure 6.14, prsente en annexe F, montre les rsultats obtenus sur trois
zones urbaines denses de la ville dAmiens. Nous reviendrons plus en dtail sur la qualit
de ces rsultats dans le chapitre 4.
Cette mthode fournit la forme gnrale des emprises de btiments travers un agencement de rectangles. Il est possible denvisager directement lutilisation de ces rectangles
comme supports de modles paramtriques 3D base rectangulaire. Cela a t test travers deux processus de reconstruction, prsents dans lannexe A. Cependant, ces processus fournissent des rsultats peu convaincants, dus notamment la prsence de nombreux
artefacts dans les modlisations 3D de btiments. Lutilisation de rectangles comme supports est, en effet, limite : ces formes gomtriques sont trop simples pour permettre une
bonne connexion des supports entre eux, comme on peut le constater sur la figure 2.7. Outre
laspect visuel des rsultats, ces processus ncessitent des formulations nergtiques complexes, cest--dire intgrant des interactions nombreuses et varies, afin dassembler entre
eux les modles 3D base rectangulaire. Cela a linconvnient dintroduire beaucoup de
paramtres dans lalgorithme, et par consquent, de le rendre peu robuste.
Pour dvelopper une mthode efficace, il est ncessaire de rgulariser a posteriori les
agencements de rectangles. Lobjectif est damliorer la connexion des rectangles voisins
(voir figure 2.7). Pour ce faire, les rectangles doivent tre transforms en objets gomtriquement plus complexes. Ce problme est trait dans la seconde partie de ce chapitre.

F IG . 2.6 Rsultats dextraction de btiments par agencement de rectangles.

2.2 Rgularisation en supports structuraux

39

F IG . 2.7 Illustrations de mauvaises connexions entre rectangles voisins (haut), engendrant


la prsence dartefacts dans les modlisations 3D (bas)

2.2 Rgularisation en supports structuraux


La partie prcdente nous a permis dobtenir la forme gnrale des emprises de btiments travers des agencements de rectangles. Lobjectif est dsormais de rgulariser ces
configurations de rectangles en supports structuraux, cest--dire en emprises plus prcises
et adaptes une approche structurelle.
Pour ce faire, nous procdons en deux tapes. Dabord, nous transformons les rectangles
en objets gomtriquement plus complexes, pouvant se connecter entre voisins sans recouvrement de surface et sans que la forme gnrale des emprises soit change. Ensuite, nous
effectuons une division des objets possdant des hauteurs de toit diffrentes.

2.2.1 Connexion des supports


Le but est de transformer un agencement de rectangles en un agencement dobjets gomtriques dont les lments voisins peuvent se connecter sans recouvrement de surface.
En excluant les formes courbes, les polygones sont les objets naturellement adapts ce
problme. Nous introduisons ds lors la notion de connexion entre deux polygones :
Dfinition 1 soient P1 et P2 , deux polygones, et S1 et S2 , leur surface respective. P1 et P2
seront dits connects si les deux conditions suivantes sont vrifies :

S1 S2 = 0/
P1 et P2 ont au moins une arte commune
Les polygones sont toutefois des objets pouvant tre trs complexes. Or, il est important
quils puissent tre dcrits travers un nombre restreint de paramtres, afin de ne pas com-

40

Extraction des btiments

plexifier la combinatoire du processus de reconstruction. La solution consiste limiter les


formes polygonales considres des quadrilatres et triangles quelconques. La figure 2.8
illustre une transformation de deux rectangles en une association de quadrilatres et triangles connects.

F IG . 2.8 Illustration dune transformation de deux rectangles voisins en une association


de quadrilatres quelconques connects

La mthode retenue consiste transformer localement les couples de rectangles voisins


en association de quadrilatres quelconques connects (ces quadrilatres pouvant tre des
triangles). La relation de voisinage, permettant de dfinir si deux rectangles sont voisins,
consiste vrifier si lintersection de leur "sur-rectangle" est non vide (cette relation est
dtaille en annexe A). La figure 2.9 permet de schmatiser le problme : les points A et B
doivent tre mis en relation dans le secteur extrieur, de mme que les points C et D dans le
secteur intrieur1 . Ce problme nest pas trivial notamment cause des nombreuses dispositions possibles de paires de rectangles voisins. Ces dernires dpendent de la largeur des
rectangles, de leur orientation relative, et de la distance les sparant. La figure 2.9 prsente
quelques exemples de dispositions possibles.

F IG . 2.9 Deux rectangles voisins (gauche), diffrents exemples de dispositions de deux


rectangles voisins (droite).

Prs dune centaine de dispositions de couples de rectangles sont possibles : il nest pas
envisageable de les traiter au cas par cas. Il faut dfinir un processus gnral de transforma1 La frontire sparant le secteur intrieur du secteur extrieur est dfinie par les deux mdianes des rectangles. Dans certaines situations (mdianes parallles disjointes), ces deux secteurs ne sont pas reprsents.
Les points A, B, C et D sont alors dfinis comme les deux paires de points de chaque rectangle ayant la distance
deux deux la plus courte.

2.2 Rgularisation en supports structuraux

41

tion des couples de rectangles voisins. Nous proposons seize configurations diffrentes de
transformations permettant de traiter les dispositions possibles. La figure 2.10 schmatise
ces seize configurations. Dans le secteur extrieur, quatre possibilits de mise en relation des
points A et B sont permises. Celles-ci sont fondes sur des intersections issues de droites
prolongeant les artes des rectangles. Concernant le secteur intrieur, les quatre mmes possibilits sont autorises. Finalement, quatre quatre configurations sont proposes.

F IG . 2.10 Les quatre possibilits de mise en relation du secteur extrieur (gauche), les
quatre possibilits de mise en relation du secteur intrieur (droite).

Afin de choisir la configuration la mieux adapte parmi les seize pour une disposition
de rectangles donne, nous dfinissons une fonction de cot C qui prend en compte la disposition relative des rectangles, mais galement le MNE. Il peut arriver que la configuration
choisie ne soit pas pertinente. Ainsi, la configuration choisie doit avoir un cot infrieur
un cot de rfrence Cre f , sans quoi la transformation nest pas applique et les deux rectangles restent inchangs. La fonction de cot C se dcompose en trois termes :
un terme dattache au MNE, qui value la qualit de la configuration par rapport au
MNE.
un terme de recouvrement surfacique, qui favorise les taux de recouvrement levs
entre les deux rectangles et les quadrilatres proposs.
un terme de correspondance des contours, qui permet de comparer la pertinence des
contours des quadrilatres relativement ceux des deux rectangles initiaux.
Ces trois critres sont pondrs entre eux par deux poids 1 et 2 . La fonction de cot
sexprime donc par :
C = CMNE + 1Crecouvrement + 2Ccontour

(2.6)

1 and 2 ont t fixs respectivement 0, 5 et 0, 8. Le cot de rfrence C re f , qui permet


dautoriser ou non la transformation, est fix 0, 2.

42

Extraction des btiments

Critre dattache au MNE


Ce terme permet de mesurer la qualit de la configuration propose par rapport au MNE.
Pour cela, nous calculons le taux de pixels inclus dans les quadrilatres proposs, dont la
valeur est suprieure laltitude dun btiment dun demi tage (en pratique, 1, 5 mtre).
Plus ce taux est lev, plus la configuration est favorise et donc plus le cot est faible.
En notant N, le nombre de ces pixels, et Nt , le nombre total de pixels contenu dans les
quadrilatres, le critre dattache au MNE sexprime par :
CMNE = 1

N
Nt

(2.7)

Critre de recouvrement surfacique


Ce critre prend en compte le recouvrement surfacique entre les deux rectangles initiaux, et les quadrilatres proposs. Nous voulons que la surface avant et aprs transformation soit sensiblement inchange. Soit S R , la surface de lunion des deux rectangles, et S Q ,
la surface de lunion des quadrilatres proposs. Le critre de recouvrement est donn par :
Crecouvrement =

| SQ SR |
SR

(2.8)

Critre de cohrence des contours


Ce terme mesure la cohrence des contours entre les deux rectangles initiaux, et les
quadrilatres proposs. Il est indispensable au bon fonctionnement du processus puisquil
permet dviter les configurations complexes et peu ralistes, comme celle schmatise sur
la figure 2.11. Notons Lin (respectivement Lout ), la longueur totale intrieure (respectivement extrieure) des quadrilatres proposs. Notons galement L 1 et L2 , les longueurs des
deux rectangles. Le cot de ce critre est :
Ccontour =

| Lout + Lin 2(L1 + L2 ) |


2(L1 + L2 )

(2.9)

Pour un agencement de rectangles complet, nous traitons localement tous les couples de
rectangles voisins par ce procd. Le rsultat est une association de quadrilatres connects,
comme le montre la figure 2.13 (centre - emprises bleu). La forme gnrale des emprises a
t conserve. De plus, grce au terme dattache au MNE utilis dans la fonction de cot,
nous pouvons remarquer que les petits artefacts gnrs par le recouvrement de rectangles
ont t limins, ce qui permet damliorer nettement la qualit des contours des emprises.
Le processus mis en place est relativement simple. Cependant, il constitue une tape
ncessaire la mise en place de notre approche structurelle. En thorie, le rsultat de cette
tape aurait pu tre obtenu directement en utilisant une approche par processus ponctuels
marqus, cest--dire une approche similaire celle dveloppe dans la partie 2.1, o les
objets auraient t des quadrilatres quelconques. En pratique, cela nest pas envisageable :
les objets, bien que simples, sont dj paramtriquement trop complexes pour esprer des
temps de calculs abordables.

2.2 Rgularisation en supports structuraux

43

F IG . 2.11 Critre de cohrence des contours : configuration pnalise (gauche), configuration favorise (droite).

2.2.2 Dtection des discontinuits des hauteurs de toit


Dans ce paragraphe, lobjectif est de dtecter, lintrieur des emprises, les ventuelles
discontinuits des hauteurs de toits. Les emprises quadrilatrales obtenues prcdemment
peuvent, en effet, contenir diffrentes structures urbaines au sein dun mme quadrilatre.
Ces structures urbaines sont diffrentiables, dans une grande majorit de cas, grce leur
hauteur de toit. La figure 2.13 illustre ce problme. Il sagit donc de localiser les ventuelles
discontinuits des hauteurs de toit, et le cas chant, de diviser le quadrilatre en plusieurs
quadrilatres correspondant chacun une structure urbaine. Nous restreignons ce problme
aux emprises de tailles importantes, cest--dire susceptibles dinclure plusieurs structures
urbaines. Pour cette raison, les quadrilatres dont la surface est infrieur 100m 2 , ainsi que
les triangles ne seront pas traits.
Le partitionnement des emprises est effectu de manire dtecter les discontinuits
de hauteurs de toit perpendiculairement au grand axe de lemprise (cest--dire laxe de la
longueur de lemprise). Ce procd fournit un partitionnement certes trs simple, mais en
pratique, cette hypothse est souvent vrifie notamment pour les longues structures le long
des rseaux routiers.
Pour ce faire, nous calculons, pour chaque quadrilatre, un profil dartes fatires dans
le sens de la longueur. Ce profil est obtenu partir du MNE, en estimant la hauteur de
toit moyenne dans une fentre glissante. Ensuite, nous extrayons les forts gradients par un
seuillage sur la drive du profil. Le seuil utilis est un paramtre qui a t fix 3 : cela
signifie que la variation altimtrique du profil doit tre au moins trois fois plus importante
que sa variation planimtrique. Il est frquent, au niveau dune discontinuit, de dtecter
plusieurs forts gradients proximit les uns des autres : il faut, dans ce cas, raliser une
accumulation de gradients afin de localiser lendroit prcis o se situe la discontinuit de
hauteur de toit. Trs simplement, nous choisissons de prendre le barycentre de ces forts
gradients. Ces diffrentes tapes sont illustres sur la figure 2.12. La figure 2.13 prsente

44

Extraction des btiments

deux exemples de rsultats (bas - emprises rouges). Les discontinuits y sont correctement
dtectes. Sur lexemple de droite, nous dtectons galement des discontinuits au niveau
dun dcrochement de toiture. Dans notre contexte, cela nest pas trs prjudiciable : il est
prfrable de sur-dtecter les discontinuits plutt que den omettre. Dans la suite, nous
nommerons ces emprises des supports structuraux.
Les supports structuraux fournissent des informations planimtriques, proches de donnes cadastrales. Ils apportent galement des connaissances sur la structuration des btiments. Ces supports structuraux ont t utiliss dans une mthode paramtrique simple de
reconstruction 3D, fonde sur un processus de squeltisation des artes fatires. Cette mthode, simple mais peu prcise, prsente un intrt mineur. Elle est prsente en annexe B.

F IG . 2.12 Dtection des discontinuits des hauteurs de toit - emprise initiale (a), estimation du profil du toit (b), seuillage de la drive du profil (c), accumulation des gradients
(d), emprises finales avec les discontinuits en rouge (e).

2.2 Rgularisation en supports structuraux

45

F IG . 2.13 Deux exemples de rgularisation en supports structuraux - emprises rectangulaires initiales (haut), emprises quadrilatrales aprs connexion des rectangles (centre),
emprises quadrilatrales aprs extraction des discontinuits de hauteurs de toit (bas).

Chapitre 3

Reconstruction 3D des btiments

48

Reconstruction 3D des btiments

Dans ce chapitre, nous prsentons ltape de reconstruction en 3D des btiments. Les


donnes dentre sont constitues par un MNE et les supports structuraux 2D extraits dans
le chapitre prcdent. Tout dabord, nous mettons en place une bibliothque de modles
3D reprsentant des modules lmentaires de btiments. Nous reconstruisons alors chaque
btiment en recherchant la configuration optimale dlments de cette bibliothque se fixant
sur les supports structuraux. Dans un cadre stochastique, cette configuration correspond la
ralisation qui maximise une densit. Deux problmes majeurs se posent alors : Comment
dfinir cette densit ? Comment trouver la ralisation qui la maximise ? Les rponses ces
deux questions induisent la mise en place de paramtres. La dernire partie de ce chapitre
est consacre lestimation de ces paramtres.

3.1 Bibliothque de modles 3D


La premire tape consiste dfinir une bibliothque de modles 3D. La dfinition
de la bibliothque est un point fondamental puisque celle-ci permet de fixer le niveau de
gnricit de la modlisation 3D. Elle doit tre reprsentative du paysage urbain et tre
galement en adquation avec les donnes que nous utilisons. Par ailleurs, les modles 3D
doivent tre des objets simples dfinis travers un nombre restreint de paramtres afin de
ne pas exploser la combinatoire de notre mthode.

3.1.1 Typologie des toits et adquation avec les donnes


Afin de proposer une bibliothque pertinente, nous procdons en deux tapes. Dabord,
nous tudions la typologie des structures urbaines et, plus spcifiquement, la morphologie
des toitures. Lobjectif est de dterminer les formes de toits dont loccurrence nest pas
ngligeable dans un paysage urbain donn. Ensuite, nous vrifions ladquation entre ces
formes et les donnes utilises : la qualit des MNE doit tre suffisante pour permettre la
reconnaissance de ces diffrentes formes.
Morphologie des toitures dans le paysage urbain europen
Il existe une trs grande varit de toitures travers le monde. Il nest pas envisageable
de les rassembler dans une mme bibliothque : cela serait la fois trs fastidieux mettre
en place et trs pnalisant au niveau des temps de calcul. Nous devons donc nous focaliser
sur un type de zones et nous limiter aux formes de toits les plus reprsentatives. Nous dcidons de construire notre bibliothque par rapport aux centres-villes europens. Les raisons
de ce choix rsident dans laspect gnral des btiments europens et les donnes tests utilises (villes dAmiens et de Toulouse).
Pour dterminer les formes de toits les plus communes, nous nous sommes appuys sur
les travaux de [Ching, 1996; Gaminet, 1999; Allain, 2004]. Nous avons ainsi mis en avant
trois grandes familles de toits, illustres sur la figure 3.1.
Les mono-plans - Ils sont souvent utiliss pour construire de grandes structures,
limage des centres-villes amricains. Ils sont prsents dans les zones urbaines denses
mais galement dans les zones dactivit. Nous pouvons distinguer trois dclinaisons

3.1 Bibliothque de modles 3D

49

possibles : les trs classiques toits plats, les toits terrasse (qui sont des drivs des
toits plats auxquels on ajoute un module souvent de forme paralllpipdique permettant soit laccs la terrasse, soit limplantation de machineries dascenseurs), et
enfin les toits en appentis (qui sont des mono-plans inclins, correspondant souvent
des modules annexes de la structure principale dun btiment).

F IG . 3.1 Formes de toit les plus communes

Les multi-plans - Ils constituent la famille de toits la plus rpandue dans le paysage
urbain europen. Nous avons distingu six dclinaisons. La premire est le bi-plan
symtrique, trs courant. Sur le mme principe, mais avec larte fatire situe de
manire dissymtrique par rapport au support, nous avons deux autres dclinaisons :
le toit dissymtrique pente constante et le toit dissymtrique pente variable. La
quatrime, du nom de son crateur, est le toit Mansart, toit tri-plan intermdiaire
entre le toit plat et le bi-plan symtrique. Il est relativement rpandu sur les structures
anciennes (historiquement, ce toit au volume habitable important a t imagin au
17e sicle pour contrer la taxe dhabitation fonde sur le nombre dtages). Enfin, les
deux dernires dclinaisons sont les toits briss convexes et concaves. Ce sont des
quadri-plans composs de deux plans extrieurs de mme pente et de deux plans intrieurs de mme pente. Le toit convexe, qui possde un volume habitable important,
est frquent en centre-ville ; son homologue concave est lui plutt rpandu au sein
des zones pri-urbaines.
Les non planaires - Ce sont des toitures courbes. Elles sont principalement utilises pour la construction ddifices remarquables dans les centres-villes, et aussi
de grands btiments type entrepts dans les zones dactivit. Nous distinguons deux

50

Reconstruction 3D des btiments


dclinaisons : les toits elliptiques (i.e. courbs suivant une demi-ellipse) et les toits
semi-elliptiques (i.e. courbs suivant un quart dellipse).

Adquation entre la morphologie de toits et la qualit des MNE PLEIADES


La qualit des MNE PLEIADES doit tre suffisante pour permettre la reconnaissance
des formes de toits prcdemment cites. Ce point nest pas trivial car ces MNE sont des
donnes particulirement bruites. Pour vrifier cela, nous comparons les profils de MNE
avec les profils rels associs.
La figure 3.2 prsente quatre couples de profil qui sont reprsentatifs du potentiel des
MNE PLEIADES. Ces profils ont t extraits partir du centre-ville dAmiens. Le premier
couple illustre le profil dun toit bi-plan symtrique. Nous constatons que le positionnement
de larte fatire peut tre restitu sans grande ambigut. De plus, les discontinuits des
faades sont relativement franches. La reconnaissance des bi-plans, symtriques ou dissymtriques, ne doit donc pas poser de difficults majeures. Le deuxime point positif rside
dans la bonne restitution des plans horizontaux, comme le montrent les deuxime et troisime couples de profil de la figure 3.2. Par contre, les artes des brisures de plans, spcifiques aux toits briss, ne sont pas distinguables. De plus, les profils des MNE ont une
tendance tre concaves comme on peut le constater sur le premier couple : la prsence
des toits briss concaves dans la bibliothque porterait confusion. Il nest donc pas envisageable dinclure les toitures brises dans la bibliothque. Le dernier couple de profil
illustre la restitution dun toit courb. Celle-ci est bonne comme nous pouvons le constater,
condition que la structure soit dune taille importante (i.e. avec une largeur de support
dau moins une vingtaine de mtres).

F IG . 3.2 Potentiel des MNE PLEIADES en matire de restitution des formes de toits profil rel en rouge, profil du MNE en bleu.
Pour rsumer, lexception des toitures brises, les MNE PLEIADES montrent des caractristiques intressantes pour permettre une reconnaissance efficace des formes de toits
regroupes sur la figure 3.1. Une simple tude des profils des MNE ne garantit pas, cependant, une distinction correcte des diffrentes formes de toit retenues. Celle-ci devra tre

3.1 Bibliothque de modles 3D

51

confirmer dans le chapitre 4 lors de lvaluation des rsultats.

3.1.2 La bibliothque propose


La bibliothque que nous utilisons, note M , est compose de diffrents modles auxquels on associe une forme de toit F (dtaille dans la partie prcdente) et une variante
V (spcifique aux terminaisons ou jonctions de modules). Chaque lment de cette bibliothque est ainsi caractris par un modle spcifi par le couple (F , V ) auquel est associ
un jeu de paramtres = (F,V ).
Les diffrentes formes de toit F et leurs paramtres F
On dispose de neuf formes de toit, proposes dans la partie prcdente (plat F 11 , terrasse
F12 , en appentis F13 , bi-plan symtrique F21 , bi-plan dissymtrique pente constante F 22 ,
bi-plan dissymtrique pente variable F 23 , mansart F24 , elliptique F31 et semi-elliptique
F32 ). La figure 3.3 prsente ces diffrentes formes de toit. Chacune des neuf formes pos-

sde son propre jeu de paramtres, que nous appelons les paramtres de formes F. Ils sont
communs toutes les variantes du modle. Ils correspondent des paramtres altimtriques
(hauteur de gouttire et hauteur de fatire) et galement planimtriques (dissymtrie de
larte fatire, largeur du plateau dun toit mansart,...). Le nombre de paramtres varie
entre un (pour le toit plat) et six (pour le toit terrasse). Ils sont valeurs continues dans des
compacts de R. Pour chaque type de toit, ces paramtres sont dtaills dans la table 3.2.

F IG . 3.3 Les diffrentes formes de toits F de la bibliothque

52

Reconstruction 3D des btiments

Les diffrentes variantes V et leurs paramtres V


Chaque type de toit possde un certain nombre de variantes possibles V (au plus six)
permettant de dcrire diffrentes situations de terminaisons et jonctions de toits. Il en existe
six diffrentes (la forme de base (note V ), les variantes avec attaque en V simple (VV )
et double (V2V ), et les variantes de jonction en L (V L ), en T (VT ) et en croix (V+ )). Elles
sont illustres sur la figure 3.4 dans le cas dun toit bi-plan symtrique, seul modle de la
bibliothque possder ces six variantes. Ces variantes sont plus ou moins spcifiques
diffrentes situations de voisinage :
les modules isols, qui correspondent des btiments trs simples dont le support est
un quadrilatre sans voisin,
les modules de terminaison, qui ont exactement un voisin,
les modules de jonction, qui ont au moins deux voisins.
La figure 3.4 montre les variantes qui sont prfrentielles selon la situation de voisinage
du module et qui, par la suite, devront tre favorises dans notre modle. Chaque variante
possde un jeu de paramtres spcifiques not V . On trouve des paramtres dorientation
du modle, valeur discrte. Le support ayant quatre cts, 2 permet dorienter le modle suivant quatre directions. Si le modle a deux symtries axiales, il naura plus que
deux orientations possibles : dans ce cas, on utilise le paramtre 1 valeur dans {1, 2}. On
trouve galement un paramtre dfinissant la profondeur dune attaque en V. Ces paramtres sont illustrs sur la figure 3.5.

F IG . 3.4 Illustration des variantes dans le cas du modle bi-plan symtrique

Les paramtres de chaque modle sont rsums dans la table 3.1. Il faut noter que, dans
le cas de supports 2D triangulaires, certains modles peuvent tre dgnrs en fonction
de la valeur du paramtre dorientation. Ces modles sont logiquement interdits. Du point
de vu de la gnricit, les modles qui composent la bibliothque peuvent paraitrent assez

3.2 Formulation Baysienne

53

F IG . 3.5 Paramtres et - variante ayant deux symtries axiales (droite), variante nen
possdant quune (gauche).

restreints au premier abord. Cependant, en assemblant ces modles les un aux autres, cette
bibliothque permet de modliser une gamme trs importante de structures urbaines. Par
exemple, bien que nous ne disposons pas de modles spcifiques aux toits "dusine" dans la
bibliothque, on peut facilement les restituer en assemblant des modles de toits en appentis
de manire parallle.
Il est important de noter que cette bibliothque est volutive et peut tre tendue
dautres modles afin de gagner en gnricit. Inversement, il est facile de la restreindre
des modles trs reprsentatifs dun environnement urbain, afin de gagner en robustesse
et en temps de calcul. Le contenu de la bibliothque joue donc un rle important dans le
processus global de reconstruction.

3.2 Formulation Baysienne


Dans cette partie, nous proposons une densit de probabilit permettant de caractriser
la qualit dune configuration de modles 3D tant donn un MNE. Cette densit est dfinie
dans un cadre baysien : elle permet de mesurer la cohrence entre la configuration dobjets
3D et le MNE, et galement de prendre en compte des connaissances a priori sur lagencement des objets entre eux. Ce dernier point est fondamental pour la mise en place de la loi
dassemblage des modles 3D.
La formulation de la densit requiert quelques notations, dveloppes ci-dessous.
Soient S, un ensemble de sites, et = {(s)/s S}, un MNE o (s) reprsente
llvation au site s.
Soit Q , la configuration de quadrilatres et triangles reprsentant les supports 2D
structuraux associe au MNE . On note N, le nombre de quadrilatres inclus dans
Q.
Soit Si , le sous-ensemble de S dont les sites sont lintrieur du quadrilatre i Q et

54

Reconstruction 3D des btiments

Formes
.
de toit

Paramtres de formes F

F11
F12
F13

Hg
Hg , Ht , 1 , 2 , 3 , 4
Hg , Ht

F21

Hg , Ht

F22

Hg , Ht ,

F23

Hg , Ht ,

F24

Hg , Ht ,

F31

Hg , Ht

F32

Hg , Ht

Variantes
Variantes possibles V Paramtres des variantes V
V
V
V
VL
V
VV
V2V
VL
VT
V+
V
VV
V2V
VL
V
VL
V
VL
VT
V+
V
VL
VT
V+
V
VL

2
2
1
2 ,
1 ,
2
2
1
2 ,
1 ,
2
2
2
1
2
2
1
2
2
2
2

TAB . 3.1 Table rcapitulative des paramtres de chaque modle

Paramtres
Hg
Ht
1 , 2 , 3 , 4

1
2

Signification
Hauteur de gouttire dun btiment
Hauteur de fatire dun btiment
Position du support rectangulaire du toit terrasse
Dissymtrie de larte fatire
Largeur du plateau dun toit mansart
Orientation dun modle axialement symtrique
Orientation dun modle non symtrique
Profondeur de lattaque en V

Domaine de dfinition
[Hgmin , Hgmax ]
[Htmin , Htmax ]
[0, 1] 4
[0, 1]
[0, 1]
{1, 2}
{1, 2, 3, 4}
[0, 1]

TAB . 3.2 Les paramtres et leur signification

3.2 Formulation Baysienne

55

dont llvation est suprieure la hauteur dun demi-tage 1 He . On a donc Si = {s


int(i)/(s) > He }.
Soit Y = (Yi )iQ , les donnes de notre problme inverse, o Y i = {(s)/s Si }.
Soit x, une configuration de lespace dtat C , qui correspond une configuration
dobjets 3D paramtriques spcifis par la bibliothque M et les supports structuraux Q . On crit cette configuration x = (x i )iQ = (mi , i )iQ o chaque objet xi est
caractris la fois par un modle de toit 2 Mmi = (F fi , Vvi ) M , et par un ensemble
de paramtres i = (Fi ,Vi ) associ Mmi . Dans la suite, xi = (mi , i ) et Mmi seront
appels respectivement un objet et un modle.
Soit dm , le nombre de paramtres valeurs continues dcrivant le modle M m .
Soit enfin Sxi , la fonction de Si valeur dans R qui associe laltitude du toit de lobjet
xi pour chaque site de Si .
En notant la fonction caractristique
de M est donne par :
(u) =

{.} ,

kN?

la mesure associe lensemble des modles


{m=k} m ()

(3.1)

o u = (m, ) est un objet de la bibliothque et m (.), la mesure associe au modle m. La


majorit des modles ont la fois des paramtres continus et discrets. Dans ce cas, m ()
(c)
(d)
(c)
est le produit de deux mesures m ((c) ) m ((d) ) o m (.) correspond la mesure de
(d)
Lebesgue sur Rdm relativement aux paramtres continus (c) du modle , et m (.) correspond la mesure de comptage sur N relativement au paramtre discret (d) du modle
(cest--dire, le paramtre dorientation du modle ). Pour les modles ne possdant pas
de paramtres discrets, m (.) correspond simplement la mesure de Lebesgue sur R dm .
On peut maintenant considrer lespace mesurable (C , B (C ), N (.)) associ lensemble
des configurations dobjets C . On peut dsormais dfinir la variable alatoire X, distribue
dans lespace des configurations dobjets C suivant une densit non normalise h(.) selon
la mesure N (.).
Dans notre problme inverse, h(.) reprsente la densit a posteriori dune configuration
dobjets x, tant donn Y . Dans un cadre baysien, cette densit peut sexprimer sous la
forme suivante :
h(x) = h(x/Y ) h p (x)L (Y /x)
(3.2)
L (Y /x) est la vraisemblance, cest--dire la loi des observations. Elle permet de mesurer la
cohrence entre les donnes Y et une configuration dobjets x. Le deuxime terme, h p (x),
1 Lors

de la phase dextraction des emprises de btiments, certains supports ne sont pas correctement placs
comme on peut le constater sur la figure 2.13. Il est important dexclure les pixels correspondant au sol qui sont
lintrieur des supports, sinon le calcul de lattache aux MNE se trouverait fortement biais. Ces pixels sont
donc retirs de lensemble des donnes en seuillant un demi-tage du sol.
2 Lindice m dun modle est dfini par le couple dindices ( f , v ) o f {11, 12, 13, 21, 22, 23, 24, 31, 32}
i
i i
i
et vi {,V, 2V, L, T, +}.

56

Reconstruction 3D des btiments

correspond la loi a priori. Cette loi permet dintroduire des connaissances sur lagencement des objets. Le but est de mettre en place une vraisemblance et un a priori qui modlisent de manire pertinente notre problme.
Densit non normalise et nergie de Gibbs
Comme cela a t soulign dans la partie 1.4.2, il est possible dexprimer une densit
normalise hnorm par une nergie U travers la loi de Gibbs. Cette relation peut savrer
tre trs utile lors de la mise en place des diffrents termes qui composent une densit, mais
galement lors de la phase doptimisation afin de poser le problme sous une formulation
nergtique. Si x C , cette loi sexprime par :
hnorm (x) =

1
exp U(x)
Z

(3.3)

o Z est une constante de normalisation qui scrit :


Z=

xC

exp U(x)

(3.4)

Cependant, dans de nombreux problmes o lespace des configurations est trs grand, cette
constante de normalisation est trs difficilement calculable ou estimable. Cest notre cas :
lensemble des configurations dobjets est trs important cause notamment de la taille de
notre bibliothque, et des nombreux paramtres valeurs continues inhrents aux diffrents
modles de toit. Le nombre dobjets contenus dans une scne peut galement tre lev
(plusieurs centaines en gnral). Il est toutefois possible de dcomposer la scne en plusieurs problmes indpendants correspondant des btiments ou pts de maisons, afin de
rduire le nombre dobjets ( quelques dizaines en gnral).
Pour cette raison, nous utilisons des densits non normalises. Cela nest pas prjudiciable
dans la mesure o les mthodes doptimisation que nous utilisons sont adaptes ce type de
densits. Ainsi, une densit non normalise h peut sexprimer travers une nergie U par :
h(x) = exp U(x)

(3.5)

3.2.1 Vraisemblance
La vraisemblance est une densit qui mesure la cohrence entre les donnes observes
Y et une configuration dobjets x. Afin de simplifier sa mise en place, nous considrons
lhypothse dindpendance conditionnelle des donnes. Cette hypothse est plausible dans
la mesure o les donnes locales Yi ne se recouvrent pas entre elles. La vraisemblance peut
ainsi sexprimer sous la forme du produit des vraisemblances locales L (Y i /xi ) des objets :
L (Y /x) =

L (Yi /xi )

(3.6)

iQ

Pour estimer la pertinence dun objet x i par rapport une partie de MNE, la solution gnralement utilise consiste introduire une distance qui compare pixel pixel laltitude du toit
de lobjet avec celle du MNE. Plusieurs distances peuvent correspondre notre problme,
parmi lesquelles la distance de Cauchy ou de Tukey [Xu et Zhang, 1996]. Cette dernire est

3.2 Formulation Baysienne

57

dailleurs particulirement efficace pour traiter les problmes dont les donnes sont bruites
puisque les valeurs aberrantes ont une pnalisation constante. Lutilisation de cette distance
nest cependant pas ncessaire puisque nous excluons les valeurs aberrantes dans la dfinition des donnes Yi . Nous utilisons plus classiquement une distance en norme L . Nous
exprimons ds lors la vraisemblance par :
L (Y /x) =

Z(xi ) exp (i) (Sx , Yi )


i

iQ

(3.7)

o Z(xi ) est la constante de normalisation de la vraisemblance locale, et (i) (., .) corres-

pond la distance en norme L , dfinie de Rcard(Si ) Rcard(Si ) dans R.


Cette distance sexprime par :

(i) (Sxi , Yi ) =

|Sx (s) (s)|

sSi

! 1

(3.8)

La distance utilise est fonde sur une comparaison entre les pixels du MNE et laltitude
du toit de lobjet xi note Sxi . Bien que relativement simple, elle permet de modliser efficacement lattache aux donnes de notre problme. La manire dont est dfinie cette distance,
cest--dire travers une diffrence "pixel pixel" sans autre intervention de paramtres de
lobjet xi dans lexpression, permet par ailleurs de rendre la constante de normalisation Z(x i )
indpendante3 de lobjet xi . Cela signifie que le calcul de cette constante de normalisation
nest pas ncessaire : on rsonne donc avec des vraisemblances locales non normalises.
Le choix de se tourne gnralement vers la norme L 1 , voire la norme L2 . La norme L2
est particulirement sensible aux fortes variations. Cette norme nest donc pas spcialement
adapte notre problme puisque les MNE que nous utilisons sont fortement bruits 4 . La
norme L1 est plus robuste au bruit. Cependant, nous avons remarqu exprimentalement
que les profils des toits sur les MNE utiliss sont gnralement concaves pour dcrire, par
exemple, des bi-plans symtriques (voir la figure 3.2). La norme L 1 ragit mal cette concavit en ayant tendance sous-estimer la pente du toit. La norme L 1,5 constitue, au regard
des exprimentations ralises, un bon compromis entre les normes L 1 et L2 . Dun point de
vue algorithmique, la norme L1,5 est lgrement plus lente calculer que la norme L 2 ou L1 ,
ce qui reprsente son principal dfaut.
En dfinitive, la vraisemblance est dfinie de manire relativement simple, sans introduction de paramtres qui pourraient faire perdre de la robustesse au processus global.
3 Pour

vrifier cela, il suffit dcrire lexpression de la constante de normalisation Z(xi ) et de poser le changement de variable u(s) = Sxi (s) (s) quand on intgre sur les donnes, lexpression obtenue ne dpend alors
plus de xi . Cela suppose juste que les donnes soient intgres sur un espace non born.
4 En plus du bruit caractrisant les erreurs de mise en correspondance, nous devons galement faire face aux
petits lments de toiture comme les chemines ou chien-assis qui sont perus, notre chelle de reconstruction,
comme du bruit au sein des principaux plans de toit.

58

Reconstruction 3D des btiments

3.2.2 A priori
La densit a priori constitue un point fondamental de notre approche structurelle. Ce
terme permet de rgulariser la configuration dobjets afin de combler le manque dinformation contenu dans les donnes et, galement, davoir un rendu visuel de bonne qualit. Pour
cela, les diffrents modules lmentaires constituant un btiment doivent tre correctement
assembls entre eux.
Ce terme doit tre dfini simplement et faire intervenir peu de paramtres. La mthode
prsente en annexe A, dont la priori est compos de trois types diffrents dinteractions
pondrs entre eux par des paramtres, prsente un manque de robustesse et souligne la
ncessit de minimiser le nombre de types dinteractions. Nous nous imposons ainsi une
contrainte sur le nombre de paramtres introduire dans la priori. Plus prcisment, ce
terme ne devra comporter quun seul paramtre, cest--dire le nombre minimal permettant la pondration avec le terme de vraisemblance. Nous cherchons donc modliser la
priori travers un seul type dinteractions devant regrouper les diffrentes contraintes sur
lassemblage des modules entres eux.
Relation de voisinage sur les supports des objets
La premire tape consiste dfinir une relation de voisinage sur Q , cest--dire sur
la configuration des supports des objets. De manire naturelle, nous utilisons la relation
de connexion entre quadrilatres, dfinie dans la partie 2.2.1. Ainsi, deux quadrilatres i
et j Q sont dits voisins sils sont connects. Cette relation de voisinage est note V .
Lensemble des voisins du quadrilatre i sont ainsi nots V (i). i ./ j reprsente lensemble
des paires de supports voisins dans Q . Par abus de langage, nous nommerons par la suite
"objets voisins", les objets dont les supports 2D sont voisins.
Loi dassemblage entre deux objets voisins
Afin davoir une densit a priori simple et efficace, nous dfinissons une loi dassemblage permettant de tester si deux objets voisins peuvent se raccorder entre eux. Deux objets
xi = (mi , i ) et x j = (m j , j ) seront dits assemblables (not xi a x j ) sils vrifient les trois
points suivants :
Compatibilit des formes de toit - les deux objets doivent avoir le mme type de
toit. Cela signifie que deux objets voisins, lun ayant par exemple un toit mansart,
lautre un toit elliptique, ne seront pas assemblables. Une exception est faite pour
les toits plats avec les toits terrasse qui peuvent parfaitement se raccorder entre eux.
Pour rsumer, la compatibilit des formes de toit est satisfaite si F fi = F f j ou si
{F fi , F f j } = {F11 , F12 }.
Compatibilit des artes fatires - Les artes fatires des deux objets doivent tre
disposes dans le prolongement de lune par rapport lautre. En dautres termes,
nous voulons que la continuit planimtrique des artes fatires dun objet lautre
soit possible. Cette contrainte est vrifie par un test sur les paramtres spcifiques

3.2 Formulation Baysienne

59

des variantes des modles, prenant en compte les paramtres dorientation et les possibilits de jonction des variantes donnes par la figure 3.4.
Continuit des hauteurs de toit - Les hauteurs des deux modules doivent tre proches
afin de permettre une continuit altimtrique des artes fatires. Cela revient tester
si larte commune aux deux supports est une discontinuit de hauteur de toits, procd tabli dans la partie 2.2.2.
La premire contrainte assure que les deux objets aient la mme forme de toit. Les deux
autres contraintes garantissent la possibilit de continuit des artes fatires dun objet
lautre.
Formulation de la priori
La densit a priori que nous proposons consiste favoriser les paires dobjets voisins
qui sont assemblables. Cette interaction ne doit cependant pas tre binaire. En effet, la loi
dassemblage nassure pas lassemblage parfait de deux objets, mais garantit juste que certaines conditions indispensables leur assemblage sont vrifies. Ainsi, nous introduisons
une fonction g qui mesure la distance entre les paramtres de forme de deux objets assemblables.
Nous exprimons alors la densit a priori h p travers une nergie de Gibbs U p (i.e.
h p (x) = exp U p (x)) par :
x C , U p (x) =

i./ j

{xi a x j } g(xi , x j )

(3.9)

o R+ reprsente le poids qui pondre limportance de la densit a priori par rapport


la vraisemblance. La fonction g est valeurs dans [1, 0]. Elle permet duniformiser les
paramtres de deux objets voisins en les attirant vers un assemblage homogne, sans la
prsence dartefacts. Plus prcisment, la fonction g est formule de la manire suivante :
g(xi , x j ) =

k k |Fi,(k) Fj,(k) |
D(xi , x j )
1 =
1
Dmax
Dmax

(3.10)

o Fi,(k) et Fj,(k) correspondent au k ieme lment de lensemble des paramtres de forme des
objets xi et x j respectivement. Dmax = max D(xi , x j ) reprsente la valeur maximale de la
xi ,x j

distance. Les k sont des poids qui sont introduits dans cette distance afin de normaliser les
valeurs des paramtres selon le systme mtrique. Ces poids sont connus et sont calculs
en tenant compte de la rsolution en XY, de la rsolution en Z et de la configuration de
quadrilatres Q .
La figure 3.6 illustre le principe de cette interaction. Si les deux objets ont des formes de
toit diffrentes (configuration en haut droite) ou si la continuit des artes fatires nest
pas assure (configuration en bas droite), les deux objets ne sont pas assemblables : lnergie associe ces configurations est nulle. A linverse, si les deux objets sont assemblables
(les autres configurations de la figure), lnergie est ngative : ces configurations sont favorises. Grce la fonction g, elles seront dautant plus favorises que les objets seront

60

Reconstruction 3D des btiments

paramtriquement proches. La configuration de gauche est ainsi la meilleure : lassemblage


entre les deux objets est parfaitement homogne.
En dfinitive, la densit a priori permet de favoriser lassemblage dobjets de manire
proportionnelle la qualit de lassemblage. Elle ninterdit toutefois pas les configurations
ne satisfaisant pas la loi dassemblage : celles-ci ne sont juste pas favorises. Les interactions proposes sont de cardinal deux. Nous aurions pu imaginer introduire des interactions
de cardinal trois et quatre, favorisant spcifiquement les cas de jonctions en "T" et en "+".
Cela aurait, cependant, complexifi la densit a priori et introduit de nouveaux paramtres
pondrateurs.

F IG . 3.6 Principe de lnergie a priori - exemples de divers cas dinteraction entre deux
objets.
Finalement, la densit h(.) que nous proposons sexprime sous la forme suivante :
!
h(x) = exp

3
2

(i) (Sx , Yi ) +

iQ

i./ j

{xi a x j } g(xi , x j )

(3.11)

Un seul paramtre pondrateur intervient dans cette densit : il sagit de . Cela accorde de
la robustesse au processus et permet de limiter les problmes engendrs par le rglage des
paramtres. Dans la suite, lnergie de Gibbs associe la densit non normalise h sera
note U (U = ln h).

3.3 Optimisation
Lobjectif consiste trouver la configuration dobjets qui maximise la densit h(.). Cela
revient dterminer lestimateur du Maximum A Posteriori (MAP) x MAP :
xMAP = arg max h(x)
xC

(3.12)

3.3 Optimisation

61

Cest un problme doptimisation non convexe dans un espace C trs grand, dont les variables sont, pour la plupart, valeurs continues dans des compacts de R. De plus, comme
les modles de la bibliothque M sont dfinis par un nombre diffrent de paramtres, C est
une union despaces de dimension variable.
Trs peu dalgorithmes peuvent tre utiliss efficacement sous ces contraintes. Ds lors,
deux options sont possibles :
Soit utiliser un algorithme stochastique adapt aux caractristiques de notre problme, mais relativement coteux en temps de calcul - Nous pensons en particulier
aux mthodes de Monte Carlo par Chanes de Markov (MCMC) [Robert et Casella,
1999] .
Soit simplifier notre problme doptimisation afin dutiliser des techniques moins
coteuses - Nous envisageons notamment de restreindre lespace dtat (discrtisation des paramtres) ou de simplifier la densit propose (modifier la relation de voisinage en squence dobjets par exemple, ou poser des hypothses sur lnergie U
afin de la rendre drivable).
Nous optons pour la premire solution. Lalgorithme doptimisation stochastique par MCMC
que nous proposons est dtaill dans la suite de cette partie. Pour comprendre son fonctionnement, le lecteurs pourra consulter lannexe C dans laquelle la dfinition des chanes de
Markov, leurs proprits et les conditions de convergence sont rappeles. Cependant, nous
voquons galement des mthodes doptimisation alternatives fondes sur une simplification de notre problme. Celles-ci sont abordes dans le dernier paragraphe de cette partie.

3.3.1 Echantillonneur RJMCMC


Les techniques dchantillonnage de Monte Carlo par Chanes de Markov (MCMC)
consistent simuler une chane de Markov discrte (Xt )tN sur lespace des configurations
qui converge vers une mesure cible. Les transitions de cette chane correspondent des
perturbations locales de la configuration courante. Elles sont locales, ce qui signifie quen
gnral, seul un composant (ou objet) de la configuration courante est concern par une
perturbation. Cette chane est conue de manire tre ergodique. Cela permet, sous certaines conditions de relaxation probabiliste que nous dtaillerons dans la suite, dassurer la
convergence de la chane vers la mesure cible quelle que soit la configuration initiale. Ces
algorithmes construisent itrativement les diffrents tats de la chane travers la mise en
place des transitions. Celles-ci sont dfinies en deux tapes : une phase de proposition de
perturbation de ltat courant, suivie dune phase de dcision o lon choisit daccepter ou
de refuser la perturbation.
Ce type dalgorithmes a t introduit initialement par Metropolis [Metropolis et al.,
1953]. Hastings [Hastings, 1970] a ensuite propos un formalisme plus gnral dans lequel
les probabilits de transitions ne sont plus forcement symtriques. Enfin, la dernire extension, celle de Green [Green, 1995], permet ces chantillonneurs de traiter les cas o
lespace des configurations est de dimension variable. Cette dernire, appele chantillonneur de Monte Carlo par Chanes de Markov sauts rversibles (RJMCMC pour "Reversible

62

Reconstruction 3D des btiments

Jump Markov Chain Monte Carlo" en anglais), est particulirement efficace pour aborder les
problmes de reconnaissance dobjets multiples. Plusieurs travaux ont dailleurs dmontr
lefficacit de lalgorithme RJMCMC dans ce type de problmes. On peut citer notamment
[Dick et al., 2004] qui reconstruit des btiments remarquables partir dimagerie terrestre
en utilisant des objets 3D paramtriques multiples tels que des colonnes, des fentres ou
bien encore des pontons. Il est aussi utilis par [Brenner et Ripperda, 2006] pour extraire
des faades de btiments. Cet chantillonneur est galement bien adapt dans le cadre des
processus ponctuels marqus comme cela a t soulign dans la partie 2.1, entre autres avec
les travaux de [Lacoste et al., 2005; Perrin et al., 2005; Ortner et al., 2007].
Afin de construire une chane de Markov pour notre problme, plusieurs outils doivent
tre introduits :
La mesure cible de la chane dfinie sur C et spcifie par la densit a posteriori
h (elle est, dans notre cas, non normalise, cest--dire connue une constante de
normalisation prs).
Les noyaux de proposition de perturbations Q k (., .) dfinis sur C B (C ). Ils permettent de proposer des perturbations de diffrents types k que nous dtaillons dans
la partie 3.3.2.
Une mesure symtrique k (., .) associe au noyau Qk (., .) et dfinie sur C C , telle
que (.)Qk (., .) soit absolument continue par rapport k (., .). Cette condition permet
dassurer lexistence et lunicit de la drive de Radon-Nikodym f k (., .) dfinie par :
fk (x, y) =

(dx)Qk (x, dy)


k (dx, dy)

(3.13)

Ds lors, on dfinit la probabilit dacceptation dune proposition x y par min(1, R k (x, y))
o Rk reprsente le taux de Green :
Rk (x, y) =

fk (y, x)
(dy)Qk (y, dx)
=
fk (x, y) (dx)Qk (x, dy)

(3.14)

Cette probabilit dacceptation est dfinie de manire vrifier la condition de rversibilit


de la chane (impliquant la stationnarit de ), condition ncessaire pour obtenir lergodicit
de la chane.
Pour rsumer, lchantillonneur RJMCMC peut se formuler de la manire suivante. A
litration t, si Xt = x :
1- Choisir un noyau de proposition Q k (x, .) avec la probabilit qk .
2- Proposer selon Qk une nouvelle configuration y.
3- Accepter x(t+1) = y avec la probabilit min(1, Rk (x, y)), et conserver x(t+1) = x
sinon.

3.3 Optimisation

63

3.3.2 Noyaux de propositions


La mise en place des noyaux de propositions constitue un point fondamental dans lefficacit de lchantillonneur. Il est possible dutiliser les noyaux dits "classiques", qui permettent de proposer des perturbations uniformment sur lespace dtat. Ces noyaux sont
suffisants pour garantir lirrductibilit de la chane puisquils permettent datteindre nimporte quelle configuration de lespace dtat. Cependant, il est prfrable dutiliser galement dautres noyaux plus pertinents et mieux adapts notre problme. Lobjectif est
dacclrer la convergence du processus en proposant plus rgulirement des configurations dintrt. La mise en place de ces noyaux est, cela dit, un problme dlicat. Il ne suffit
pas, en effet, de proposer en quantit importante des configurations dintrt pour acclrer lalgorithme, car ce nest pas pour autant quelles seront acceptes. En effet, le taux de
Green prend en compte la perturbation rciproque et, si celle-ci est peu probable, le rapport
Qk (y,dx)
Qk (x,dy) sera faible. Et la proposition, bien que pertinente, sera facilement rejete.
Les noyaux de propositions se calculent de manire relativement simple pour lchantillonneur dHastings, les propositions tant fondes sur des modifications de paramtres.
Pour lchantillonneur de Green, la mise en place des noyaux est plus dlicate puisquil
faut grer le changement de dimension des objets. Considrons deux modles M m et Mn
et une perturbation (appele galement saut) dun objet x i = (m, i ) vers xbi = (n, bi ) de
telle sorte que la configuration courante x = (x p ) pQ soit perturbe en la configuration
y = (x p ) pQ {i} xbi . Lide introduite par Green consiste crer une bijection entre lespace
des paramtres des modles Mm et Mn . Pour cela, i est complt en simulant umn mn (.)
travers (i , umn ), et bi en simulant vnm nm (.) travers (bi , vmn ) de manire ce que
lapplication mn entre (i , umn ) et (bi , vmn ) soit une bijection :
(bi , vmn ) = mn (i , umn )

(3.15)

Le rapport des noyaux prsent dans le taux de Green peut alors sexprimer par :


(k) (k)
Jnm nm (vnm ) mn (i , umn )
Qk (y, dx)
= (k) (k)
(i , umn )
Qk (x, dy) Jmn
mn (umn )

(3.16)

o Jmn reprsente la probabilit de faire un saut du modle M m vers le modle Mn . Calculer la bijection mn est un problme difficile quand les modles M m et Mn diffrent par
de nombreux paramtres. Dans notre cas, les modles possdent entre un et six paramtres
seulement, ce qui facilite le calcul des bijections, dtaill en annexe D.
La mise en place des noyaux de proposition seffectue en spcifiant la fois les probabilits Jmn de saut entre modles et les distributions mn des paramtres de compltion du
modle Mn par rapport au modle Mm . Nous proposons trois types de noyaux, cest--dire
trois jeux de distributions (Jmn , mn ).
Noyau Q1 : perturbation uniforme
Il constitue le noyau de base, du moins le plus simple que lon puisse mettre en place
tout en garantissant lapriodicit de la chane. Le nouvel tat est propos de manire

64

Reconstruction 3D des btiments


uniforme sur lespace des configurations. En dautres termes, nous tirons alatoirement une proposition, sans a priori. Ce noyau est intressant dans la mesure o, mme
sil nest pas frquemment propos (0 < q 1 << 1), il permet de garantir lapriodicit
de la chane sous certaines conditions de relaxation. Cependant, la convergence est
trs lente comme nous avons pu le constater travers la mthode de reconstruction
(1) (1)
prsente en annexe A. Le jeu de distributions (Jmn , mn )m,n de ce noyau est donn
par :
(1)

Jmn =

1
card(M )

(1)

mn = UKmn

(3.17)

(3.18)

o UKmn est une distribution uniforme sur le compact Kmn qui reprsente le domaine
de dfinition des paramtres de compltion du modle M n par rapport au modle Mm .
Noyau Q2 : perturbation dirige par les donnes
Ce noyau permet dexplorer, de manire plus pertinente que le noyau Q 1 , lespace
des configurations en introduisant des connaissances provenant des donnes, comme
lillustrent notamment les travaux de [Tu et Zhu, 2002]. Comme nous lavons soulign prcdemment, il est difficile dextraire dans le MNE des informations fiables
sur les objets. Les seuls paramtres pouvant tre estims avec robustesse sont les paramtres altimtriques, cest--dire Hg et Ht , respectivement la hauteur de gouttire
et la hauteur de fatire dun objet. Il est trs intressant davoir une estimation de
ces paramtres car ce sont les plus utiliss dans la bibliothque (voir la table 3.1). De
plus, ces deux paramtres sont importants dans la mesure o ils constituent la principale source derreur lors des reconstructions de btiments. La mthode estimant ces
cg et H
bt , les
deux paramtres partir du MNE est prsente en annexe B-2. On note H
estimations de Hg et Ht fournies par cette mthode.
Pour ces deux paramtres, il faut utiliser des distributions plus pertinentes que la
cg et H
bt . Nous choisissons la distridistribution uniforme, de prfrence centres en H
bution gaussienne. Ainsi, les distributions nm des paramtres de compltion suivent
les mmes lois (uniformes) que pour le noyau Q 1 , lexception des paramtres Hg et
cg , 1 ) et N (H
bt , 2 ) respectivement.
Ht qui sont tirs suivant des lois normales N ( H
Les variances 1 et 2 sont des paramtres qui sont fixs respectivement 1 et 0, 5
mtre. Ces valeurs ont t choisies en fonction de la prcision fournie par la mthode
cg et H
bt .
destimation de H

Concernant le choix du modle, il est envisageable de mettre en place une mthode


estimant la probabilit dun modle de toits partir dun MNE. Nous nutiliserons
(2)
pas le MNE pour dfinir les probabilits Jnm , mais simplement des informations a
priori sur loccurrence des diffrents modles en milieu urbain, fournies dans les
tables 3.3 et 3.4 travers un systme de poids (plus le poids est important, plus
loccurrence est forte). Les Jmn sont calcules indpendamment du modle de dpart

3.3 Optimisation

65

Mm . Si Mn = (F p , Vq ), on dfinit Jmn par :


(f)

Jmn =

Pp

(v)

Pk

kF

Forme
Poids P( f )

Pq

(f)

(3.19)

(v)

Pk0

k0 VF p

F11

F12

F13

F21

F22

F23

F24

F31

F32

TAB . 3.3 Occurrence des formes de toits


Variante
Poids P(v)

VV

V2V

VL

VT

V+

TAB . 3.4 Occurrence des variantes


Noyau Q3 : perturbation de rgularisation
Dans notre application, le rendu visuel du rsultat est un aspect trs important. En
particulier, les diffrents modules constituant un btiment doivent tre correctement
assembls entre eux afin de minimiser le nombre dartefacts. En pratique, lalgorithme doptimisation que nous utilisons procde en deux phases : une premire dans
laquelle il explore lespace des configurations et favorise les modes de forte densit
et une seconde dans laquelle il cherche ajuster minutieusement les objets dans une
configuration courante proche de loptimale. Cette seconde phase, qui est capitale
pour le rendu visuel du rsultat, est longue et fastidieuse puisque la grande majorit
des propositions sont mauvaises et donc rejetes.
Lide de ce noyau consiste alors proposer des objets paramtriquement proches de
leurs voisins afin dacclrer la rgularisation de la configuration dobjets. Contrairement au noyau Q2 qui prend en compte des informations provenant des donnes
pour orienter les propositions, ce noyau utilise des informations provenant des objets voisins de lobjet concern par une proposition. Le modle de lobjet est propos
parmi ceux des objets voisins (on y inclut le modle courant de lobjet en question,
afin davoir la rversibilit du saut). Les probabilits Jmn de saut entre modles sont
ainsi donnes par :
NF
(3)
(3.20)
Jmn = n
Nt
o NFn reprsente le nombre de voisins de lobjet concern dont la forme de toit est
Fn , et Nt , le nombre total de voisins. Chaque paramtre du modle est propos suivant
une loi gaussienne dont lesprance correspond la moyenne des paramtres voisins.
(3)
mn = (N (Fbk , 2 ))k

(3.21)

o Fbk est la moyenne des kieme paramtres des objets voisins dont la forme est F n .
Ce noyau agit dans un espace de configurations rduit en proposant de "petites" perturbations. Cela permet par ailleurs davoir des perturbations rciproques tout--fait

66

Reconstruction 3D des btiments


probables et un taux de Green non nul. Lutilisation de ce noyau est dangereuse car
il va avoir tendance geler la configuration courante dans un optimum local. Cest
pour cette raison quil doit tre employ uniquement en fin de processus, cest--dire
quand la configuration courante est proche de la solution optimale.

3.3.3 Recuit simul


Lchantillonneur RJMCMC est coupl avec un algorithme de relaxation stochastique,
en loccurrence un recuit simul, afin de permettre la convergence vers la solution dsire.
1
Pour ce faire, la densit h(.) est remplace par la densit h(.) Tt dans le taux de Green. Tt
est une suite de tempratures qui tend vers 0 quand t tend vers linfini. Le recuit simul
permet dassurer la convergence du processus vers loptimum global, quelle que soit la
configuration initiale dobjets, en utilisant une dcroissance de temprature logarithmique.
En pratique, on prfre utiliser des schmas de dcroissance plus rapides, convergeant vers
une solution approche de loptimum global. La dcroissance gomtrique est, dans ce cas,
le schma de rfrence :
Tt = To .t
(3.22)
o et T0 sont respectivement le coefficient de dcroissance et la temprature initiale. Davantage de dtails sur ce schma de dcroissance pourront tre trouvs dans [Van Laarhoven
et Aarts, 1987]. Il existe galement dautres schmas intressants qui consistent adapter la
dcroissance de la temprature en fonction de la variation de lnergie [Haario et Saksman,
1991; Varanelli, 1996; Perrin et al., 2005]. De manire gnrale, ces schmas ralentissent la
dcroissance de la temprature lorsquon est proche de la temprature critique 5 .

F IG . 3.7 Illustration dune dcroissance dnergie par un schma gomtrique

5 La temprature critique est une temprature thorique durant laquelle le processus doit choisir entre plusieurs puits nergtiques. Elle correspond gnralement la priode pendant laquelle la variation dnergie est
forte. Le processus doit donc faire le bon choix cette temprature, cest pourquoi plusieurs schmas adaptatifs
consistent ralentir la dcroissance cet endroit.

3.3 Optimisation

67

F IG . 3.8 Deux exemples simples dvolution de configuration dobjets au cours de la dcroissance de temprature (bas), simulations PLEIADES et vrits terrain associes (haut).

68

Reconstruction 3D des btiments

Le processus de dcroissance se dcompose en deux phases 6 . La figure 3.7 reprsente


une volution dnergie typique pour une dcroissance de temprature gomtrique relativement lente. Au dbut de lalgorithme, cest--dire quand la temprature est leve, lchantillonneur explore les modes de la densit. Cest la phase dexploration, durant laquelle les
configurations dobjets ayant une densit leve sont favorises au fur et mesure que la
temprature dcrot. Quand la configuration commence se stabiliser ( faible temprature),
on entre dans la seconde phase qui correspond un ajustement minutieux des objets de la
configuration7 . Le taux de rejet de propositions est alors trs important. La figure 3.8 illustre
deux exemples simples dvolution de configuration dobjets au cours de la dcroissance de
temprature.
Les noyaux Q2 et Q3 permettent de proposer des perturbations adaptes ces deux
phases. Q2 est un noyau dexploration, utile pour la premire phase. Q 3 doit tre choisi
principalement durant la seconde phase, afin de rgulariser la configuration dobjets.
Le pige des minima locaux
Le principal danger lors de lutilisation du recuit simul consiste utiliser un schma
de dcroissance trop rapide. Le processus risque alors de ne pas slectionner le bon mode
de densit. Cela lamne rester bloqu dans un minimum local de lnergie.

F IG . 3.9 Illustration du pige des minima locaux.


6 Parfois,

on considre quil existe une phase supplmentaire, prliminaire aux deux autres. Cest, comme
on peut le voir sur la figure 3.7, un plateau nergtique o une large majorit de propositions sont acceptes et
qui permet de sassurer que la temprature initiale est assez leve.
7 Durant cette phase de rgularisation, on se trouve rgulirement pig dans de petits puits nergtiques
(voir le prochain paragraphe). Cest pour cette raison quil nest pas possible dutiliser en fin de processus un
algorithme dterministe de type descente de gradient pour rgulariser la configuration.

3.3 Optimisation

69

La figure 3.9 illustre ce problme. La configuration correspondante au point bleu reprsente un minimum local de notre nergie : deux groupes dobjets, relativement bien attachs
aux donnes, se sont rgulariss entre eux. Or la configuration optimale (point rouge) correspond un seul groupe dobjets, dont tous les lments voisins sont assembls entre eux.
Ainsi, pour passer du point bleu au point rouge, il faut casser au moins la rgularisation dun
des deux groupes dobjets pour que les lments concerns sassemblent progressivement
avec les objets de lautre groupe. Pour raliser cela, il faut que le processus visite des configurations intermdiaires dont le niveau nergtique est mauvais (ou du moins suprieur
lnergie du point bleu). La dcroissance de temprature doit tre assez lente pour assurer
la visite de ces configurations intermdiaires.

3.3.4 Des mthodes alternatives


La mthode doptimisation stochastique par MCMC qui vient dtre propose est adapte aux caractristiques de notre problme, mais est relativement coteuse en temps de
calcul. Cette partie constitue un apart dans lequel nous voquons plusieurs mthodes alternatives permettant de simplifier notre problme doptimisation, et qui soulvent des pistes
intressantes pour le futur.
Modlisation par chanes de Markov caches aprs simplification des supports 2D
La premire mthode consiste transformer notre modle en processus causaux dans
lesquels un btiment est considr comme une association de squences dobjets (voir la
figure 3.10), tout en rduisant fortement lespace des configurations par une discrtisation
des paramtres. Nous simplifions ainsi les supports 2D de manire obtenir des squences
de quadrilatres connects (ces quadrilatres ont donc au plus deux voisins).

F IG . 3.10 Simplification des emprises en squences de supports 2D.


Pour chaque squence de N supports, nous utilisons une chane de Markov cache hoN dont le graphe de dpendance est illustr sur la figure 3.11. X = (X )
mogne (Xt ,Yt )t=1
t t
reprsente les tats cachs (i.e. la squence x dobjets paramtriques 3D) et Y = (Yt )t , la squence des observations correspondantes. La probabilit de transition P(Xt+1 = xt+1 |Xt =
xt ) et la vraisemblance locale P(Yt = yt |Xt = xt ) sont directement calcules partir de lexpression de la densit h dfinie dans le chapitre 3.2. Lespace des configurations est discrtis afin dutiliser un processus doptimisation causal, en loccurrence lalgorithme de
Viterbi [Viterbi, 1967; Forney, 1973]. Le pas de discrtisation des paramtres joue un rle

70

Reconstruction 3D des btiments

important dans le processus : il dtermine le degr de prcision de la modlisation, mais


galement les temps de calcul.

N
F IG . 3.11 Graphe de dpendance de la chane de Markov cache (Xt ,Yt )t=1

Cette simplification en squences dobjets est pnalisante dans la mesure o les jonctions complexes (jonctions en T ou en +) ne pourront plus tre restitues correctement
puisque les chanes de Markov caches sont indpendantes entre elles. Une des solutions
consisterait utiliser une modlisation par graphe hirarchique deux niveaux : le niveau
infrieur correspondant aux squences dobjets, le niveau suprieur permettant dintroduire
des lois de dpendance entre les squences. Une autre possibilit pourrait tre dutiliser les
techniques de propagation des messages. Les mthodes de "belief propagation" semblent
tre bien adaptes, dautant que les graphes de notre problme possdent souvent peu de
cycles. Les approches utilisant un formalisme fonde sur les modles graphiques ouvrent,
en tout cas, des perspectives particulirement intressantes.
En dfinitive, cette mthode est intressante pour obtenir rapidement une modlisation
approche (i.e. avec un pas de discrtisation de lordre de deux mtres, une bonne rgularisation, mais sans restitution des jonctions complexes) avec des temps de calcul trs faibles
(de lordre dune seconde pour un btiment). Si lon souhaite un degr de prcision suprieur, le processus par optimisation stochastique est alors mieux adapt. Cette mthode
alternative est prsente de manire plus dtaille en annexe E.

Utilisation des mthodes de diffusion ?


Parmi les techniques doptimisation relativement rapides, les mthodes utilisant les gradients nergtiques pour se dplacer dans lespace des configurations sont trs efficaces.
Si lnergie est convexe, une simple descente de gradient est suffisante pour atteindre la
solution optimale. Dans le cas contraire, il existe des techniques de diffusion stochastique
notamment les mthodes fondes sur les quations diffrentielles stochastiques [Kloeden et
Platen, 1992; Salomon et al., 2002; Descombes et Zhizhina, 2004] ou celles couples des
processus de sauts ("Jump-Diffusion") [Grenander et Miller, 1994; Srivastava et al., 2002;
Han et al., 2004].
Dans ce paragraphe, nous regardons dans quelles mesures nous pourrions utiliser ce
type de techniques doptimisation. La principale contrainte est la drivabilit de lnergie.
Du moins, la drive de lnergie doit tre facilement calculable ou estimable en tout point.

3.3 Optimisation

71

Lnergie de notre problme est donne par lexpression suivante :


U(x) =

3
2

(i) (Sx , Yi ) +
i

iQ

i./ j

{xi a x j } g(xi , x j )

(3.23)

Or U(x) nest pas drivable en tout point de son espace dtat. Le terme a priori contient
une fonction caractristique et une fonction g non drivables en tout point. Cest galement
le cas du terme dattache aux donnes, o les fonctions dquations des toits S xi sont C1
par morceaux (les toits tant des associations connexes de plans). Une solution simple permettant de contourner le problme consiste restreindre lespace dtat et/ou modifier la
formulation de U. Ainsi, nous pourrions simplifier le problme en considrant lhypothse
suivante : les configurations dans lesquelles les objets voisins ne sont pas assemblables sont
improbables. Cela signifie que lon rduit lespace aux configurations dans lesquelles les
objets voisins sont assemblables. De plus, nous pourrions modifier certaines fonctions de
manire redfinir notre nergie sous la forme :
b =
U(x)

3
2

(i) (Sx , Yi ) + g0 (xi , x j )

iQ

(3.24)

i./ j

b diffre de U par
o g0 est une fonction de distance analogue g mais dfinie en norme L 2 . U
b
les normes utilises dans la priori. Ds lors, si lon drive U par rapport au k ieme paramtre
de lobjet Xi , on obtient lexpression suivante :
b
dU(x)
(k)

dxi

2 (S , Yi ) +
(k) (i) xi

dxi

jV (i)

dg0 (xi , x j )

(3.25)

(k)

dxi

La dernire difficult concerne les fonctions dquation des toits S xi qui sont C1 par morceaux. Cela rend, par consquent, le terme dattache aux donnes non drivable sur les
bords des diffrentes parties des supports de toit. Une solution possible consiste ngliger
la variation des diffrentes parties des supports dans lexpression de la drive. Dans ce cas,
nous avons :
3

2 (S ,Y )
d(i)
xi i
(k)

dxi

 23
3
2
|z

Y
|
dm
i
Si


R
 13
p
R
3
dz(p)
(p)
(p)
2
Si |z Yi | dm
p S(p) sign(z Yi ) |z Yi | (k) dm
=

d
(k)
dxi

R

o
du

(p)
les Si
toit, C 1

dxi

(3.26)
correspondent aux diffrentes parties du support S i , chacune associe un plan
(p)
sur Si . z est lquation du toit et m reprsente la mesure de Lebesgue dans R 2 .

Notre problme pourrait donc tre abord par des processus de diffusion, notamment
par des techniques de "jump-diffusion" adaptes aux problmes de reconnaissance dobjets
multiples. Il faudrait alors voir dans quelles mesures les hypothses et approximations ralises pour calculer le gradient de lnergie pnalisent les rsultats. Il serait particulirement
intressant dapprofondir les recherches dans cette direction.

72

Reconstruction 3D des btiments

3.4 Estimation des paramtres


Ltape de reconstruction 3D fait intervenir diffrents types de paramtres au niveau de
la formulation de la densit et, surtout, au niveau de la technique doptimisation. Dans cette
partie, nous prsentons les mthodes utilises pour estimer ces paramtres.

3.4.1 Paramtres de la densit


La densit propose a t mise en place de manire minimiser le nombre de paramtres. On distingue deux types de paramtres : les paramtres physiques et les paramtres
pondrateurs. Les paramtres physiques, peu nombreux, ne posent pas de problme de rglage puisquils ont un sens physique dans lapplication. Par exemple, le paramtre H e ,
introduit afin dexclure les pixels aberrants des donnes Y , reprsente la hauteur dun demitage, soit 1, 5 mtre. Il existe galement Hgmin ,Hgmax , Htmin et Htmax permettant de dfinir
les domaines de dfinition de Hg et Ht . Ces quatre paramtres physiques ont t fixs respectivement 2, 30, 2 et 6 mtres. En rglant de la sorte, on ralise lhypothse que les
btiments ne dpassent pas une trentaine de mtres de hauteur. Cela est le cas sur nos zones
test.
Lestimation du paramtre pondrateur de la densit est plus dlicate. Il existe diffrentes mthodes permettant destimer ce genre de paramtres, comme les algorithmes EM
[Dempster et al., 1977] ou SEM [Celeux et Diebolt, 1986]. Ces algorithmes sont cependant
trs gnraux et ne sont pas spcifiquement adapts notre problme destimation.
Si lon cherche rgler manuellement, la dmarche intuitive va consister rechercher par
dichotomie la valeur de qui maximise la vraisemblance tout en garantissant une qualit de
rgularisation suffisante pour avoir un rendu visuel correct. Formellement, cela peut scrire
sous le problme doptimisation suivant :
b
= arg maxL (Y (e) /b
x() )

sousU p (b
x() ) + NI

NI

(3.27)

o xb() = arg maxh(x, ).


x

Y (e) est un chantillon reprsentatif de donnes dont on connat N I , le nombre de paires

dobjets voisins qui doivent tre assembls. est un paramtre fix qui permet de dfinir la
qualit minimale de la rgularisation exige. Cette estimation de revient introduire un
nouveau paramtre qui a lui un sens physique puisquil correspond, en mtres, lcart
moyen maximal tolr entre les paramtres des modules assemblables.

En considrant que, sur lchantillon Y (e) , on connat parfaitement les NI cas rels dassemblage, cest--dire les paires dobjets voisins qui doivent tre assembls, le terme a priori
se simplifie et scrit sous une somme de fonctions g. Sous cette hypothse, la vraisemblance et la priori de xb() voluent de manire oppose en fonction de . Si lon diminue
, la priori a moins de poids dans h. La rgularisation est alors de moins bonne qualit. A
linverse, lattache aux donnes est meilleure. Lestimation de peut tre faite itrativement
par un principe dichotomique de la manire suivante :

3.4 Estimation des paramtres

73

Prendre un 0 relativement grand, et qui vrifie la contrainte U p (b


x(0 ) )+0 NI NI .
A t,
tant que U p (b
x(t ) ) + 0 NI NI , prendre t = t1 Pt avec Pt = P0 .
ensuite, prendre t = t1 Pt si U p (b
x(t ) )+0 NI NI , et prendre t = t1 +Pt
Pt1
sinon, avec Pt = 2 .
Sarrter quand Pt < Plimite : b
= t .

Pt correspond au pas dexploration litration t. Ce processus est assez long puisquil faut,
chaque itration, calculer xb(t ) par un recuit simul. Il est donc trs important de choisir
un chantillon de donnes Y (e) de taille relativement petite (quelques btiments), mais reprsentatif de Y . En dfinitive, cet algorithme automatique destimation de procde dune
manire similaire un rglage manuel par un oprateur. Il est noter que cette estimation
est effectue une seule fois pour une gamme donne de MNE.

3.4.2 Paramtres de loptimisation


Le processus doptimisation fait intervenir plusieurs paramtres, certains relatifs au recuit simul comme la temprature initiale, les autres lchantillonneur MCMC comme par
exemple les probabilits qi de proposition des noyaux Qi .
Daprs [Salamon et al., 2002], le schma de dcroissance du recuit simul et les paramtres qui en dcoulent doivent prendre en compte plusieurs lments : lnergie optimiser, son chelle, son nombre de minima locaux ainsi que leur taille. En pratique, les
informations relatives aux minima locaux sont difficilement accessibles. On utilise surtout
des informations lies la variation de lnergie.
Coefficient de dcroissance de la temprature - Le coefficient de dcroissance
peut, au cours du recuit, varier et tre adapt aux variations dnergie [Varanelli, 1996;
Perrin et al., 2005]. Le gain de temps est cependant relativement faible dans notre cas.
Nous prfrons utiliser plus classiquement un coefficient de dcroissance constant qui
1
dpend du nombre dobjets N dans la scne. En pratique, on prend = 0.9999 N .
Temprature initiale T0 - Elle est estime en fonction des variations de lnergie sur
un chantillon de configurations alatoires, partir des travaux de [White, 1984]. On
choisit, en effet, T0 comme deux fois lcart-type de U calcul temprature infinie
sur lchantillon des configurations 8 :
q
T0 = 2.(UT = ) = 2. hUT2= i hUT = i2
(3.28)
o hUi est la moyenne empirique de lnergie calcule sur lchantillon dexemples.
En pratique, on constate, au dbut de la dcroissance dnergie, un petit plateau durant
lequel les propositions sont trs majoritairement acceptes : cela permet de confirmer
que cette estimation de la temprature initiale est efficace.

8 En

pratique, plusieurs centaines de configurations sont ncessaires pour une estimation robuste, ce qui est,
en temps de calcul, ngligeable par rapport au processus doptimisation global.

74

Reconstruction 3D des btiments


Temprature finale T f inal - Il existe principalement deux moyens de dterminer la
temprature finale, cest--dire la fin du processus. Le premier, propos par [White,
1984], consiste choisir T f inal de lordre de la plus petite chelle dnergie (ce qui
sous-entend avoir un problme discret), cest--dire prendre la plus petite variation dnergie dun mouvement simple. La seconde solution, plus usuelle, est celle
que nous retenons : lalgorithme est arrt quand lnergie na pas volu durant un
certain nombre ditrations. En pratique, on teste si le taux dacceptation des propositions calcul sur 1000 itrations est nul.

La majorit des paramtres intervenant dans lchantillonneur MCMC, notamment les


distributions des diffrents paramtres, ont t explicits dans la partie 3.3.2. Il reste cependant dterminer les probabilits q i de proposition des noyaux Qi qui doivent tre en
corrlation avec le schma de dcroissance de lnergie. En effet, durant la phase dexploration du processus, le noyau dirig par les donnes Q 2 doit tre majoritairement propos. Les
trois noyaux sont alors choisis selon les probabilits q 2 = 3q1 = 3q3 = 0, 6. Lorsque lon
entre dans la phase dajustement minutieux des objets 9 , cest le noyau de rgularisation Q 3
qui doit tre propos en priorit : on choisit alors q 3 = 3q1 = 3q2 .

9 En

pratique, le changement de phase est dtect quand le taux dacceptation des propositions calcul sur
1000 itrations devient infrieur 0, 05.

Chapitre 4

Evaluation

76

Evaluation

Dans ce chapitre, nous discutons de la pertinence de lapproche propose en analysant


les rsultats obtenus. Nous abordons galement linfluence des techniques doptimisation
sur les rsultats et voquons les limites de notre mthode. Les donnes utilises sont des
MNE de type PLEIADES dont les caractristiques sont dtailles dans le chapitre 1. La vrit terrain planimtrique est fournie par lInstitut Gographique National (IGN), et correspond aux plans cadastraux nationaux. La vrit terrain 3D, prsente sous forme dimages
RASTER, est galement fournie par lIGN. Elle a t ralise par strorestitution de points
3D par des oprateurs. Sur certains rsultats prsents, des textures gnriques ont t appliques afin damliorer le rendu visuel.

4.1 Evaluation qualitative


Dans cette partie, nous valuons qualitativement les rsultats du processus dextraction
des supports 2D (Chapitre 2) et du processus de reconstruction 3D (Chapitre 3). Plusieurs
jeux de rsultats sont illustrs. Les figures 4.1 et 4.2 prsentent lextraction et la reconstruction de divers btiments (possdant des formes de toit varies, des discontinuits de hauteur
de toiture, des structures ouvertes et fermes, et des cas de jonctions complexes). Les figures 4.3, 4.4 et 4.5 montrent les rsultats obtenus sur trois zones urbaines denses de la ville
dAmiens.
Extraction des supports 2D
Les rsultats fournis par le processus dextraction des supports 2D sont, de manire gnrale, satisfaisants. Plusieurs points intressants peuvent tre dgags :
Prcision des contours - Le processus restitue les contours des btiments avec prcision. Cela est principalement d la mthode dextraction de rectangles de [Ortner, 2004] dont le critre dattache aux donnes est fond sur les discontinuits de
faades, critre permettant dobtenir de meilleures performances que par des considrations surfaciques avec les MNE utiliss. Certains polygones sont toutefois mal
positionns, ce qui est le cas notamment du support de gauche du btiment B3 de
la figure 4.2. Cela engendre des dcalages de 1 2 mtres dans le positionnement
des faades, qui sexpliquent par la technique doptimisation : en pratique, celle-ci
permet rarement datteindre en des temps raisonnables loptimum global, mais une
solution approche.
Dtection des discontinuits des hauteurs de toit - La dtection des discontinuits des hauteurs de toit est galement convaincante. Les discontinuits prsentes sont
quasiment toutes correctement situes, avec trs peu de sous-dtection. Leur localisation est relativement prcise malgr la simplicit du processus mis en place comme
nous pouvons le voir sur la figure 4.2 - btiment B3. Un processus de localisation
fond sur une mthode plus complexe quun simple barycentre, pourrait permettre
nanmoins de gagner un peu plus en prcision.

4.1 Evaluation qualitative

77

Connexion des supports 2D - Le processus de transformation des rectangles en quadrilatres connects donne satisfaction comme on peut le constater sur les figures 4.3,
4.4 et 4.5. La fonction de cot utilise (quation 2.6) permet dobtenir une bonne rgularisation des supports. Cela est notamment d au cot de rfrence C re f qui permet
dviter la prsence de mauvaises configurations de transformation. La robustesse apporte par ce cot a une contre partie : il nautorise pas la transformation de certains
rectangles gnrant des jonctions complexes dans certains cas, comme notamment
pour le btiment B4 de la figure 4.2 o la double jonction en T na pas t restitue.
Le processus dextraction des supports 2D prsente nanmoins des dfauts relativement
pnalisant pour des applications lies lamnagement urbain par exemple. Il sagit de la
sur-dtection de vgtation et la sous-dtection de petites structures urbaines.
Sur-dtection de vgtation - Les arbres prsents dans les zones urbaines sont dtects comme tant des btiments par le processus dextraction de rectangles. On peut
le constater sur la figure 4.4 (en haut de limage) o deux ranges darbres sont extraites. Cette sur-dtection est gnante pour de nombreuses applications. Cependant,
il est envisageable de coupler le processus dextraction demprises avec un masque
de vgtation urbain. Etant donn le masque, ce procd serait simple mettre en
uvre puisquil suffirait de soustraire les zones de vgtation au MNE pour que le
processus dextraction nait plus ces sur-dtections.
Sous-dtection de petites structures - La majorit des petites structures urbaines
situes dans les cours intrieures des lots de btiments ne sont pas dtectes comme
on peut le voir sur les figures 4.3, 4.4 et 4.5. Ces petites structures correspondent
des btiments dun tage, souvent des garages. Le processus dextraction de rectangles, fond sur la dtection des discontinuits de faades, rencontre des difficults
pour faire la distinction entre le sol et ces structures de faible hauteur. Une solution
consisterait dtecter ces petites structures dans les cours intrieures a posteriori, en
utilisant par exemple un algorithme de segmentation par ligne de partage des eaux
("watershed").
Emprises non rectilignes - Le processus propos a t mis en place pour traiter des
formes rectilignes, formes "naturelles" dans le milieu urbain. Cependant, certaines
structures, souvent des ouvrages remarquables limage du btiment B6 de la figure
4.2, possdent des emprises courbes. Le rsultat est, dans ce cas, particulirement
mauvais comme on pouvait sy attendre. Il ny a pas de relle solution permettant de
faire face ce dfaut.

Reconstruction 3D
Les reconstructions 3D obtenues dpendent de la qualit de lextraction des supports
2D. Les dfauts de cette premire tape, souligns prcdemment, sont donc visibles sur les
rsultats 3D. Cela nempche pas dobtenir des modlisations 3D de btiments globalement
satisfaisantes.

78

Evaluation

Niveau de gnralisation des btiments - Les plans principaux des btiments sont
correctement restitus, ce qui constituait notre objectif initial. Cela est suffisant pour
une majorit des btiments. Certaines structures, comme lhtel de ville dAmiens
(voir le btiment B1 de la figure 4.1), possdent cependant des dcrochements de
toits et des avances de faades. Ces "dtails" ne sont pas restitus par notre processus. La bibliothque de modles est pourtant assez riche pour modliser la plupart
de ces lments : un partitionnement plus pertinent des supports 2D pourrait tre une
solution pour obtenir une modlisation plus dtaille. Le niveau de gnralisation des
btiments reste tout de mme acceptable compte tenu de la qualit des donnes.
Restitution des diffrentes formes de toit - De manire gnrale, les diffrentes
formes de toit sont correctement identifies comme on peut le constater sur la figure
4.1. Bien que relativement simple, la distance introduite dans le terme dattache aux
donnes permet une bonne distinction des diffrentes formes contenues dans la bibliothque. Par ailleurs, quand lidentification de la forme de toit dun module nest
pas vidente, le terme a priori apporte une aide la dcision en prenant en compte la
forme de toit des modules voisins : cest un des principaux avantages de la formulation baysienne. Il existe cependant des confusions entre les formes de toit proches,
particulirement avec le toit mansart. Lorsque le paramtre de largeur de plateau
de ce dernier est proche de 0 (respectivement de 1), la distinction avec le bi-plan symtrique (respectivement avec le toit plat) sera dlicate. Ce type de confusions nest
pas pnalisant du point de vue de la fidlit altimtrique des modlisations. Du point
de vue de la qualit visuelle, cela peut tre plus gnant pour certaines applications.
Une solution simple consisterait restreindre le domaine de dfinition de certains
paramtres de formes de toit. Cela ncessiterait nanmoins de dfinir des paramtres
supplmentaires (des marges dans les domaines de dfinition) et complexifierait la
rsolution de la mthode doptimisation dtaille dans la partie 3.3.
Qualit de lassemblage des objets - Dans les problmes de reconstruction 3D, le
rendu visuel est un des critres majeurs permettant dvaluer les rsultats. Cet aspect
visuel dpend majoritairement, dans notre cas, de la qualit dassemblage des objets,
et plus prcisment de la pertinence du terme a priori dvelopp dans la partie 3.2.2.
De ce point de vue, les btiments reconstruits sur la figure 4.1 sont trs satisfaisants.
Ce point est soulign sur la figure 4.2 - btiment B2. Comparativement au modle
prsent dans lannexe A, il y a trs peu dartefacts, et les assemblages des modules
sont dans leur configuration optimale quand cela a lieu dtre. Quand des ruptures de
toits sont prsentes (comme sur le btiment B2 ou le btiment B3), les modules ne
sont pas, juste titre, assembls. La priori propos est donc efficace.
Jonctions complexes - Les cas de jonctions complexes sont souvent mal restitus,
comme on peut le voir sur la figure 4.2 travers la double jonction en T du btiment
B4. Ce dfaut est inhrent la mauvaise connexion des quadrilatres dans certaines
situations, lors de la phase dextraction des emprises. La modlisation des btiments
concerns reste cependant acceptable, le principal inconvnient provenant de labsence de petites parties dartes fatires au niveau des jonctions concernes.

4.1 Evaluation qualitative

79

F IG . 4.1 Diffrents exemples de btiments reconstruits (4 ieme colonne) associs avec les
simulations PLEIADES (1ere colonne), la vrit terrain (2ieme colonne) et les supports 2D
extraits (3ieme colonne).

80

Evaluation

F IG . 4.2 Extraits des btiments prsents sur la figure 4.1 soulignant certains dfauts
(en jaune) et points positifs (en bleu) - btiments reconstruits (2 ieme colonne), supports 2D
extraits (1iere colonne).

4.1 Evaluation qualitative

81

F IG . 4.3 Reconstruction 3D dun extrait dAmiens - zone A - (bas) associe avec une
simulation PLEIADES et lextraction des supports 2D (haut).

82

Evaluation

F IG . 4.4 Reconstruction 3D dun extrait dAmiens - zone B - (bas) associe avec une
simulation PLEIADES et lextraction des supports 2D (haut).

4.1 Evaluation qualitative

83

F IG . 4.5 Reconstruction 3D dun extrait dAmiens - zone C - (bas) associe avec une
simulation PLEIADES et lextraction des supports 2D (haut).

84

Evaluation

4.2 Evaluation quantitative


La fidlit la ralit des rsultats est un point tout aussi important que la qualit du
rendu visuel. Dans les applications techniques, cela constitue mme le critre majeur permettant dvaluer un processus de reconstruction 3D. Les rsultats prsents dans la partie
prcdente sont analyss quantitativement en planimtrie et en altimtrie.
Qualit planimtrique
Les erreurs planimtriques des zones A, B et C (figures 4.3, 4.4 et 4.5) sont dtailles
dans le tableau 4.1 et illustres sur la figure 4.6. Le taux gnral de sur-dtection (en terme
de surface) est de 9.7%. Cette valeur est principalement due au problme de vgtation soulign dans la partie prcdente. On constate galement certains endroits des sur-dtections
proximit des contours des emprises. Elles correspondent des dcalages de 1 2 mtres
du positionnement des faades dont les causes ont t expliques prcdemment. Le taux de
sous-dtection est relativement lev : 15.3%. Cependant, si lon exclut les sous-dtections
des petites structures dun tage situes dans les cours intrieures, ce taux chute 4.5%, ce
qui constitue une valeur tout fait satisfaisante.
Dune manire gnrale, lvaluation planimtrique fournit des rsultats corrects qui
pourraient tre trs nettement amliors en rsolvant les problmes de sous-dtection des
petites structures et de sur-dtection de la vgtation. Les temps de calcul mis pour extraire
les supports 2D sont de lordre de 3 heures pour une zone denviron 0, 5 km 2 (soit environ
500 objets) avec un processeur 3 GHz. Cette dure correspond, trs majoritairement, aux
temps de calcul du processus dextraction des rectangles.
sur-dtection
Zone A

7.9%

sous-dtection
petites structures dun tage
14.3%

Zone B

11.6%

8.1%

5.4%

Zone C

9%

11.3%

4.6%

le reste
2.9%

TAB . 4.1 Erreurs planimtriques des zones A, B et C.

Qualit altimtrique
Lvaluation altimtrique fournit des rsultats globalement satisfaisants puisque lerreur
quadratique moyenne en Z entre les reconstructions et la vrit terrain (calcule sur les
emprises communes des btiments) est de 2, 3 mtres, cest--dire une valeur lgrement
infrieure la hauteur dun tage. Cette erreur a t nettement amliore par rapport celle
obtenue partir du processus propos en annexe A (cest--dire 3, 2 mtres).
Cette erreur quadratique moyenne en Z reste toutefois leve. Cela sexplique par des
erreurs locales importantes (i.e. suprieures 3 mtres) certains endroits qui sont dues

4.2 Evaluation quantitative

F IG . 4.6 Carte derreur planimtrique des zones A, B et C.

F IG . 4.7 Carte derreur altimtrique des btiments reconstruits sur la figure 4.1.

85

86

Evaluation

plusieurs raisons : un mauvais positionnement des faades entranant des erreurs altimtriques de plusieurs tages, des inexactitudes dans le MNE principalement dues des
corrlations de surfaces non lambertiennes (transparence des verrires, spcularit sur les
ardoises,...), et des dtails de toitures non restitus comme des avances de faades, des dcrochements de toit ou des superstructures.
La figure 4.7 prsente, de manire dtaille, la carte derreur en Z des btiments reconstruits sur la figure 4.1. Plusieurs points attirent lattention. Tout dabord, il est difficile
dobtenir une estimation prcise des pentes de toits comme on peut le constater sur certaines
parties de toitures composes la fois de pixels bleu et rouges. Ce manque de prcision est
d au bruit prsent dans le MNE, mais galement aux imprcisions gnres par le positionnement des supports 2D. Ensuite, on peut voir que certaines discontinuits de hauteurs
de toit ne sont pas trs bien localises (voir les petites zones rouges et bleu fonc). Cela
pourrait tre amlior en reconsidrant le processus daccumulation des gradients fond
sur une opration barycentrique dans la partie 2.2.2. Enfin, de nombreuses petites erreurs
peuvent tre localises sur les plans de toits qui pnalisent localement lerreur quadratique
moyenne : il sagit de superstructures, principalement des chemines et chien-assis.
Les temps de calcul mis par le processus de reconstruction 3D sont acceptables malgr
lutilisation de techniques doptimisation stochastiques. Par exemple, moins dune minute
est ncessaire pour obtenir les btiments prsents sur la figure 4.1. Les zones reconstruites
sur les figures 4.3, 4.4 et 4.5 sont, elles, ralises en une vingtaine de minutes environ.

4.3 Influence du recuit simul


Lalgorithme doptimisation mis en place dans la partie 3.3 joue un rle fondamental sur
la qualit des rsultats et les temps de calcul. Nous analysons, dans cette partie, la pertinence
des trois noyaux de propositions tablis dans la partie 3.3.2, et particulirement le noyau
dirig par les donnes Q2 et le noyau de rgularisation Q3 . Nous discutons galement de
lapport dune discrtisation de lespace dtat.
Efficacit des noyaux de propositions
Les trois noyaux de propositions mis en place dans la partie 3.3.2 ont chacun un rle prcis. Nous analysons ici leur pertinence et leur efficacit au sein du processus doptimisation.
Le noyau uniforme Q1 est le noyau de rfrence. Il permet datteindre la configuration optimale sous des temps de calculs importants. La figure 4.10 illustre lvolution des
configurations dobjets durant le recuit simul en utilisant le noyau uniforme. Les variations
altimtriques des objets sont importantes, ce qui prouve que ce noyau nest pas particulirement pertinent pour notre problme.
Les courbes illustres sur la figure 4.8-(haut) correspondent deux dcroissances nergtiques, lune utilisant uniquement le noyau uniforme, lautre utilisant la combinaison des
trois noyaux propose dans la partie 3.3.3. Ce graphe permet de voir la pertinence de notre
schma de dcroissance : malgr une dcroissance plus rapide ( = 0, 9997), la configuration finale de notre schma de dcroissance a une nergie meilleure (U = 971) que le schma

4.3 Influence du recuit simul

87

uniforme ( = 0, 9999 et U = 986). Le gain de temps est, par consquent, trs intressant.
Il est difficile de le dfinir avec exactitude puisque, en pratique, aucune configuration finale
nest identique une autre avec des schmas de dcroissance diffrents. On peut cependant
affirmer que le gain de temps est au moins dun facteur 3.
Le graphe sur la figure 4.8-(bas) montre la dcroissance nergtique dun schma utilisant le noyau Q2 durant la phase dexploration du recuit et le noyau Q 3 durant la phase
de rgularisation. La temprature initiale est trs basse, car estime avec le noyau Q 2 (voir
le principe de lestimation de la temprature initiale dans la partie 3.4.2). Durant la phase
dexploration, lnergie de la configuration courante varie peu, celle-ci tant dj initialement bonne. Quand on entre dans la phase de rgularisation, on constate une lgre descente
nergtique qui amne la convergence. Cette descente est provoque par lutilisation du
noyau Q3 qui ajuste et rgularise les paramtres des objets de la configuration. En pratique,
lutilisation dun tel schma nest pas recommande : on se trouve assez rgulirement
pig dans des minima locaux. Il est important dinclure dans le schma de dcroissance
un noyau uniforme qui explore alatoirement lespace dtat, et de ne pas utiliser que des
noyaux focalisant leurs propositions sur des configurations a priori qui peuvent parfois tre
mauvaises. Lutilisation du noyau uniforme est donc indispensable pour faire face aux ventuelles erreurs destimation des paramtres intervenant dans les noyaux Q 2 et Q3 .
La figure 4.9 prsente deux graphes, le premier illustrant un schma de dcroissance
fond uniquement sur lutilisation du noyau Q 2 , et le second, sur lutilisation du noyau de
rgularisation Q3 . Comme nous lavons soulign dans le paragraphe prcdent, lnergie
volue peu en utilisant le noyau dexploration Q 2 . La convergence est relativement lente
(mme si elle est plus rapide que pour un noyau uniforme). La solution obtenue, bien que
souvent moyennement rgularise, a cependant lavantage dtre fidle aux donnes, cest-dire au MNE. Le noyau Q3 (voir figure 4.9-(bas)) fonctionne de manire inverse. La solution est bien rgularise, mais peut tre altimtriquement loigne de la ralit. Le schma
de dcroissance illustre ces propos : la convergence rapide et brutale caractrise une bonne
qualit de rgularisation. Par contre, lnergie de la solution peut tre trs mauvaise : le
rsultat est quantitativement mdiocre. Lutilisation de ce noyau est donc particulirement
dangereuse car elle force la convergence vers une configuration rgularise de la configuration courante. Il doit tre utilis en fin de processus, proximit de la solution globale.
Discrtisation de lespace dtat ?
La mthode de reconstruction en 3D a t prsente en utilisant un espace dtat dont
les variables sont, pour la plupart, valeurs continues sur des compacts de R. Il nest cependant pas exclu de discrtiser cet espace dtat afin notamment de rduire les temps de
calcul. Concrtement, cela revient introduire un pas de discrtisation (en mtre). Plus le
pas sera important, moins la prcision de la modlisation sera grande, et plus les temps de
calcul seront faibles. Fixer un pas de discrtisation revient donc jouer sur le compromis
temps de calcul / prcision de la modlisation.
La discrtisation de lespace dtat prsente galement un autre avantage : la qualit
de la rgularisation. Celle-ci est un critre important dans notre approche structurelle puis-

88

Evaluation

F IG . 4.8 Dcroissance nergtique x = t, y = U - avec le noyau Q 1 en rouge, avec la


combinaison (Q1 , Q2 , Q3 ) en noir (haut), avec la combinaison (Q 2 , Q3 ) en vert (bas).

4.3 Influence du recuit simul

89

F IG . 4.9 Dcroissance nergtique x = t, y = U - avec le noyau Q 1 en rouge, avec le noyau

Q2 en bleu (haut), avec le noyau Q3 en mauve (bas).

90

Evaluation

F IG . 4.10 Evolution de la configuration dobjets au cours dun schma de dcroissance


utilisant le noyau uniforme ( lire de gauche droite, et de haut en bas).

4.4 Influence des supports 2D

91

quelle permet le bon assemblage des modules 3D entre eux. Avec un espace discrtis, les
paramtres dobjets voisins peuvent prendre la mme valeur, et lassemblage peut ainsi tre
optimal. Quand lespace dtat nest pas discrtis, il est trs difficile dobtenir, sous des
temps de calcul raisonnables, un assemblage parfait sans la prsence de petits dcalages
dajustement des paramtres. Cet inconvnient a toutefois des consquences mineures sur
la qualit du rendu visuel, surtout quand les facettes de toits et de faades sont textures.
Au vu de la rsolution planimtrique et altimtrique de nos donnes, la discrtisation
de lespace dtat est une opration tout fait intressante. En effet, devant la prcision dcimtrique des MNE, il nest pas particulirement pertinent dexiger une prcision absolue
pour la modlisation 3D. Le choix du pas de discrtisation dpend des contraintes dutilisations. Un pas pris 20cm apparat comme un bon compromis entre la prcision et les temps
de calcul.

4.4 Influence des supports 2D


Les modlisations 3D obtenues par lapproche propose dpendent fortement de la qualit de lextraction des supports 2D. Il est intressant de comprendre linfluence des supports 2D sur la qualit des reconstructions. Les rsultats prsents jusqualors montrent
des reconstructions globales de btiments, cest--dire en modlisant uniquement les plans
principaux des toitures. Cependant, notre bibliothque de modles est assez riche pour permettre de modliser certains dtails comme par exemple des dcrochements de toits ou des
avances de faades. En dautres termes, en considrant des supports 2D plus prcis, est-il
possible dobtenir des modlisations 3D plus dtailles ?
La figure 4.11 permet dapporter une rponse. Sur celle-ci, on compare le rsultat 3D
obtenu par le processus de modlisation 3D intgral avec celui obtenu uniquement par la
mthode de reconstruction 3D o les supports 2D ont t extraits par un oprateur (et qui
sont, par consquent, trs dtaills). La diffrence de qualit est trs nette. En ayant pris
soin de partitionner correctement les supports 2D, on arrive obtenir un niveau de dtails
comparable celui propos par la plupart des mthodes dites gnriques. Sur lhtel de ville
dAmiens, on restitue notamment les deux avances de faades prsentent dans la cour intrieure ainsi que le dcrochement de toit central. La figure 4.12 montre trois autres rsultats
convaincants obtenus avec une extraction manuelle des supports 2D. On remarque notamment quil est possible dobtenir de bons rsultats sur les btiments dont les emprises sont
courbes. Il suffit pour cela de partitionner assez finement les supports 2D en approximant
la courbe par une ligne brise.
En dfinitive, la mthode de reconstruction 3D ne permet pas uniquement dobtenir
des modlisations globales. Elle peut fournir des modlisations avec un trs bon niveau de
dtails, comparable aux modlisations gnriques. Cela est conditionn par la qualit des
supports 2D. Dans ltat actuel de nos recherches, la mthode dextraction des supports ne
permet pas datteindre un niveau de description dtaill. Cest l une des principales limites
de notre approche.

92

Evaluation

F IG . 4.11 Influence des supports 2D sur la reconstruction - exemple avec lhtel de ville
dAmiens - Simulation PLEIADES et vrit terrain 3D (haut), supports 2D automatiques et
reconstruction associe (centre), supports 2D manuels et reconstruction associe (bas)

4.4 Influence des supports 2D

93

F IG . 4.12 Trois exemples de reconstructions obtenues avec une saisie manuelle des supports 2D

94

Evaluation

4.5 Les limites dutilisation


Dans cette partie, nous dtaillons les principales limites dutilisation de notre approche
en spcifiant les situations dans lesquelles notre mthode ne permet pas dobtenir des rsultats optimaux. Cest le cas des zones urbaines trs denses pour lesquelles les discontinuits
de faades sont mal restitues dans le MNE, et galement des zones pri-urbaines constitues de petites structures isoles.
Mauvaises restitutions des discontinuits de faades dans le MNE
La premire limite est directement donne par la qualit du MNE, et plus prcisment
son potentiel restituer les discontinuits de faades. En effet, la premire tape de notre
mthode consiste extraire la forme globale des emprises de btiments travers un agencement de rectangles en utilisant les travaux dOrtner [Ortner, 2004]. Ces derniers sont fonds
sur une dtection des discontinuits de faades dans le MNE : si celles-ci ne sont pas distinguables, lalgorithme fournira inexorablement des rsultats non exploitables. La nettet
des discontinuits dans le MNE est donc une condition ncessaire. La figure 4.13 illustre
ces propos : les rsultats obtenus sur la zone prsente sont inexploitables car le processus
dextraction narrive pas localiser les emprises de btiments. Mme un utilisateur prouve
visuellement beaucoup de difficults pour identifier sur le MNE les diffrents lments de
la scne, comme par exemple la route situe verticalement au centre de limage. Ce problme apparat lorsque lon traite des zones urbaines trs denses o, limage de la figure
4.13, les btiments ont t construits les uns sur les autres au fil du temps (souvent dans les
quartiers anciens), les teintes des toitures sont homognes, et les routes sparant les lots de
btiments sont trs troites. Tous ces facteurs contribuent rendre la corrlation des images
stroscopiques dlicate.

F IG . 4.13 Extrait du centre-ville de Toulouse - Simulation PLEIADES (gauche), MNE


associ (droite)

4.5 Les limites dutilisation

95

Petites structures isoles


Le processus automatique de modlisation 3D a t propos afin de traiter les zones urbaines denses. La phase dextraction travers lutilisation de processus ponctuels marqus,
comme la phase de reconstruction utilisant des relations dassemblage de modules urbains,
sont spcifiquement adapts une forte densit dobjets complexes et varis. Dans le cadre
des zones pri-urbaines, les objets sont des btiments relativement simples, trs petits, possdant souvent des emprises rectangulaires et des toits bi-plans symtriques. Bien que la
modlisation 3D de ces zones prsente beaucoup moins de difficults, notre processus nest
cependant pas rellement appropri.

F IG . 4.14 Reconstruction 3D automatique dun extrait dun quartier pavillonnaire


dAmiens (bas), orthoimage PLEIADES et supports 2D extraits sur le MNE associs (haut).

96

Evaluation

Nous avons test le processus sur une zone pavillonnaire prsente sur la figure 4.14.
Pour ce faire, les termes permettant dintroduire des interactions entre les objets ont t ngligs (seuls les termes dattache aux donnes ont t pris en compte). Nos a priori sont, en
effet, inutiles dans le cadre pri-urbain et leur utilisation peut mme provoquer des ambiguts et erreurs travers une "sur-connexion" dobjets. Les maisons sont en gnral correctement localises comme on peut le constater sur la figure 4.14. Cependant, lorsque deux
maisons sont trs proches lune de lautre ou lorsque des arbres sont disposs entre elles,
le processus dextraction distingue une seule structure. Le principal point ngatif provient
de la mauvaise reconnaissance des formes de toit. Les btiments sont trs petits dun point
de vue surfacique sur le MNE 0, 7 mtre de rsolution : il est trs difficile de restituer
la forme correcte du toit. De plus, les structures sont isoles et nont pas dobjets voisins :
les interactions de connexion entre objets ne peuvent pas tre utilises pour aider dans la
dcision. Ces raisons expliquent pourquoi un nombre non ngligeable de maisons ont une
forme de toit errone. En dfinitive, notre processus fournit des rsultats exploitables sur ce
type de zones, mais nest toutefois pas adapt.

4.6 Extension du contexte


Dans cette partie, nous quittons le contexte tout-automatique de notre tude et analysons le comportement de notre processus de reconstruction 3D. Celui-ci a t intgr la
plateforme de modlisation urbaine de lIGN. Cette plateforme permet dintroduire de nombreux lments dans les scnes 3D (Modle Numrique de Terrain (MNT), textures partir
des orthoimages,...) soignant le rendu visuel. Cette plateforme permet de grer la saisie manuelle des supports 2D par un oprateur. Les figures 6.15, 6.16, et 6.17 prsentes en annexe
F montrent les rsultats obtenus sur cette plateforme par notre processus de reconstruction
3D partir de MNE PLEIADES sur Toulouse (avec une saisie oprateur des emprises).

Comparaison avec les outils existants sur la plateforme de reconstruction IGN


Un des principaux intrts de cette intgration rside dans la possibilit de comparer,
dans un contexte identique, notre processus de reconstruction 3D celui dj prsent sur
la plateforme, fond sur les travaux de [Taillandier, 2004; Durupt et Taillandier, 2006]. La
figure 4.15 prsente trois btiments reconstruits par les deux processus (lhtel de ville
dAmiens, la prison de Toulouse et la piscine dAmiens).
Dune manire gnrale, les deux types de reconstructions sont trs proches. Les temps de
calculs mis par le processus original sont beaucoup plus courts (quelques secondes pour un
btiments contre prs dune minute pour notre processus). Notre processus prsente nanmoins deux avantages. Le premier, typiquement associ aux approches structurelles, est la
qualit de la rgularisation des toits et de leurs jonctions. Cela joue, par consquent, sur
la prsence dartefacts comme on peut le constater avec les reconstructions de la prison de
Toulouse. Le second avantage rside, comme on peut le voir sur les reconstructions de la
piscine dAmiens, dans la possibilit de modliser des toits courbs. Le processus original
doit approximer la surface courbe par une succession de monoplans. Cela donne un rsultat visuel mdiocre et gnre des artefacts au niveau des connexions des monoplans.

4.6 Extension du contexte

97

F IG . 4.15 Comparaison entre deux processus de reconstruction 3D partir dune saisie


manuelle des emprises - celui prsent dans le chapitre 3 (gauche), celui fond sur les
travaux de [Taillandier, 2004; Durupt et Taillandier, 2006] (droite).

98

Evaluation

On peut, par ailleurs, noter que les deux processus proposent des terminaisons de btiments souvent errones. Cest le cas de lhtel de ville dAmiens sur lequel les deux tourelles au premier plan sont des toits avec doubles attaques en V. Notre processus propose
une attaque en V simple tandis que le processus original propose lui un toit pyramidal. On
retrouve galement ce problme sur la prison de Toulouse : plusieurs terminaisons sont,
dans les deux cas, mal restitues. Ce point souligne la difficult reconnatre les terminaisons des btiments, qui sont gnralement de trs petites structures, partir des MNE
PLEIADES.
Rsultats partir dimages ariennes haute rsolution
Nous avons constat, dans la partie 4.4, que notre processus de reconstruction 3D ne se
limitait pas une utilisation "satellitaire" travers des modlisations globales de btiments
(principaux pans de toit). Le processus peut galement fournir des modlisations plus dtailles (avec des avances de faades, des dcrochements de toit,...) sous rserve davoir un
partitionnement prcis des supports 2D. Nous prsentons ici des rsultats obtenus dans un
contexte arien, partir de donnes haute rsolution (0, 25 cm). Des rsultats complmentaires sont illustrs en annexe F.
La figure 4.16 prsente le rsultat obtenu sur lUniversit des Sciences dAmiens partir
dun MNE arien 0, 25cm. La qualit de la modlisation est trs satisfaisante. De nombreux dtails sont restitus comme par exemple des balcons ou de petites cours intrieures.
La prcision altimtrique est trs bonne et les formes de toit sont correctement restitues
comme on peut le constater sur la figure 6.18. Le processus sadapte trs bien des MNE
ariens haute rsolution.
Reconstruction de superstructures partir dimages ariennes trs haute rsolution
Le processus 3D permet galement de reconstruire les superstructures des btiments
partir dimages ariennes trs haute rsolution ( 0, 1 mtre). Les superstructures sont des
lments contenus sur les toits des btiments, le plus souvent correspondant des chemines, des chien-assis et des verrires.
La figure 4.17 prsente un rsultat obtenu sur un extrait de toit contenant des diffrentes
sortes de superstructures. La qualit de la modlisation est globalement satisfaisante. Les
rsultats obtenus sont encourageants. Les superstructures sont majoritairement bien reconstruites. Les chemines sont modlises par des toits plats. Les chien-assis et verrires sont
eux reconstruits respectivement par des attaques en V et par des bi-plans et toits en appentis. Des erreurs frquentes sont toutefois prsentes, principalement sur les chemines. Cela
sexplique par le fait que notre bibliothque de modles nest pas spcifiquement adapte
pour la reconnaissances de ces petites formes. Pour amliorer les rsultats, il faudrait inclure
des modles de superstructures dans la bibliothque et introduire, dans la formulation de la
densit, des connaissances a priori sur la taille des objets et des interactions dinclusion
superstructures/toits. Des rsultats complmentaires sont prsents en annexe F.

4.6 Extension du contexte

99

F IG . 4.16 Reconstruction 3D de lUniversit des Sciences dAmiens partir dimages


ariennes (0, 25 mtre) et dune extraction manuelle des supports 2D.

100

Evaluation

F IG . 4.17 Reconstruction 3D dun extrait de toit contenant des superstructures partir


dimages ariennes (0, 1 mtre) et dune extraction manuelle des supports 2D.

Chapitre 5

Conclusion

102

Conclusion

Synthse des travaux effectus


Les travaux prsents dans cette thse ont permis dvaluer un processus automatique
de modlisation tridimensionnelle de zones urbaines fond sur une approche structurelle. Le
contexte satellitaire imposait de travailler avec des donnes au contenu informatif faible par
rapport aux images ariennes. Lutilisation doutils stochastiques a permis de traiter cette
problmatique.
Contributions
La contribution majeure de ces travaux a consist proposer un processus original de
modlisation 3D fond sur une approche structurelle. Une telle approche nest pas nouvelle
dans le domaine. Cependant, les mthodes dveloppes sur ce principe [Fischer et al., 1998;
Fuchs, 2001] ont t amliores, aussi bien du point de vue de lautomaticit du processus
(sans cadastre, sur des zones urbaines denses), que de la gnricit des modlisations (bibliothque compose de neuf types de toits, de divers modules de jonctions et terminaisons,
et surtout volutive). Cette mthode a t labore en deux phases.
La premire tape a consist reprendre les travaux dOrtner [Ortner, 2004] afin dobtenir des caricatures de btiments sous formes dagencements de rectangles. Nous avons
alors propos un processus permettant de rgulariser ces agencements de rectangles en supports 2D adapts une approche structurelle. Le rsultat correspond des agencements de
quadrilatres quelconques connects entre voisins et associs des parties spcifiques dun
btiment.
La deuxime tape a constitu le coeur de la thse : la reconstruction en 3D des btiments partir des supports 2D extraits dans ltape prcdente. Nous avons propos une
bibliothque de toits adapte au paysage europen, relativement complte, varie et volutive. La seconde contribution de cette partie a t de formuler le problme dassemblage
des modules travers une densit dfinie dans un cadre baysien, tout en prenant soin de
faire intervenir un minimum de paramtres pour ne pas perdre en robustesse. La dernire
contribution rside dans la mise en place dun schma doptimisation original fond sur les
techniques MCMC. Nous avons notamment propos deux noyaux de propositions adapts
aux problmes o rendu visuel ( travers la rgularisation des modules 3D) et fidlit la
ralit ( travers lattache aux donnes) sont dgale importance.
Dautres processus de reconstruction ont t brivement prsents en annexe. Certains
constituent des modles intermdiaires (annexe A) dont les rsultats sont peu convaincants.
Ils ont toutefois permis de comprendre la manire daborder certaines difficults de notre
problme, et ont ainsi amen proposer le processus structurel dcrit dans le manuscrit.
Dautres modles (annexes B et E) sont des algorithmes proposant une modlisation simplifie, pouvant tre efficaces sous des contraintes dutilisation spcifiques comme des temps
de calcul faibles.
Ce travail a galement permis dvaluer le potentiel des futurs satellites PLEIADES en
matire de modlisation 3D denvironnement urbain. Nous avons dmontr que les MNE
gnrs partir de simulations PLEIADES ont une qualit suffisante pour permettre une

103
modlisation globale automatique des btiments en utilisant des approches robustes de type
objets. Cependant, la densit des zones urbaines ne doit pas tre trop leve. A limage
du centre-ville de Toulouse, les environnements trs denses semblent difficilement modlisables par un processus automatique.
Intrts du processus propos
Le processus de modlisation tridimensionnelle mis en place prsente plusieurs points
de satisfaction qui justifient lutilisation doutils stochastiques au sein dune approche objet
structurelle.
La mthode permet dobtenir de manire relativement robuste des rsultats satisfaisants, aussi bien du point de vue quantitatif que qualitatif, dans un cadre difficile
(images satellitaires de qualit moyenne pour la problmatique de modlisation urbaine 3D, mthode automatique sans utilisation de donnes cadastrales et sans focalisation sur des btiments, zones urbaines denses relativement complexes et varies).
Le processus est volutif dans la mesure o on peut ajouter ou supprimer avec facilit
des modles 3D dans la bibliothque. On peut donc esprer adapter notre mthode
sur des paysages urbains diffrents des zones europennes en crant de nouveaux
modles de formes de toit inclure dans la bibliothque.
La mthode ne fonctionne pas uniquement partir de donnes satellitaires. Elle peut,
en effet, tre utilise des rsolutions plus fines, typiquement partir de donnes
ariennes. Avec un partitionnement prcis des supports 2D, elle permet dobtenir,
partir de MNE ariens haute et trs haute rsolution, des modlisations dtailles avec
des avances de faades, des dcrochements de toits et mme des superstructures.
Lapproche permet dutiliser de manire spare soit le processus dextraction des
supports 2D (chapitre 2), soit le processus de reconstruction 3D (chapitre 3). Intgr la plateforme de modlisation 3D de lIGN, ce dernier constitue un processus
semi-automatique intressant permettant de fournir des modlisations trs dtailles
partir dun partitionnement manuel des supports 2D.
Les limites
Le processus automatique de modlisation 3D possde nanmoins plusieurs dfauts relativement pnalisant en vue dune utilisation grande chelle.
Le processus rencontre des difficults dans certaines situations. Ainsi, le MNE utilis
doit imprativement avoir des discontinuits de faades franches, sans quoi le processus dextraction des supports fournit des rsultats inexploitables. Par ailleurs, la
mthode ne permet pas, partir de MNE 0, 7 mtre de rsolution, une bonne restitution des toits pour les petites structures isoles style maisons mitoyennes. Enfin,
le processus connat des problmes de sur et sous-dtections. La vgtation nest pas
gre, ce qui engendre une confusion entre arbres et btiments. De mme, les petites

104

Conclusion
structures dans les cours intrieures sont difficilement, voire pas du tout, dtectes.
Ltape dextraction des supports 2D, comme ltape de reconstruction 3D font appel
des mthodes doptimisation stochastiques qui sont assez lentes. Les temps de calculs du processus restent trs importants malgr les techniques dacclration mises
en place.
Le processus est particulirement dpendant de la mthode dextraction des supports
2D. La mthode de reconstruction 3D ne permet pas, en effet, de corriger les ventuelles erreurs de positionnement des supports 2D. De ce fait, le processus peut tre
sujet des accumulations derreurs au cours des deux phases successives de la modlisation. Il parat important, afin de gagner en robustesse, dintroduire, entre les deux
phases du processus, une mthode permettant lvaluation et la correction ventuelle
des supports 2D.

Perspectives
Les perspectives damlioration du processus sarticulent essentiellement autour de trois
axes de recherche : lextraction des supports 2D, loptimisation de la mthode de reconstruction 3D, et la gestion des dtails dans les modlisations.
Lextraction des supports 2D
Comme nous avons pu le voir prcdemment, la qualit des reconstructions dpend
fortement de la qualit des supports 2D qui ont t extraits. Le processus automatique dextraction des supports permet essentiellement de reconstruire la forme gnrale des toits. Or,
avec des supports plus prcis et mieux partitionns, on obtiendrait des modlisations plus
dtailles. Lenjeu est donc important. Deux pistes paraissent particulirement intressantes.
La premire consiste reprendre le processus dextraction propos et chercher affiner
le partitionnement des supports. La mthode prendrait ainsi en compte diffrents niveaux
de dtails et permettrait dextraire notamment les avances de toits et les dcrochements
de faades. Dans le mme temps, on pourrait mettre en place une mthode permettant de
dtecter les petites structures lintrieur des cours intrieures.
La seconde solution consiste proposer un nouveau processus dextraction. La piste la
plus intressante est probablement apporte par les champs polygonaux de Markov [Arak
et Surgailis, 1989]. Les processus ponctuels marqus sont des outils stochastiques efficaces
pour extraire des objets dans les images. Ces objets doivent, cependant, tre paramtriquement simples pour avoir des temps de calcul raisonnables (au plus cinq six paramtres par
objet). Or, les emprises de btiments sont des formes complexes pouvant difficilement tre
dcrites par des objets simples sans lutilisation a posteriori dun processus de transformation en objets plus complexes. Les champs polygonaux de Markov peuvent potentiellement
fournir des descriptions beaucoup plus fines travers des polygones [Kluszczynski et al.,
2004], tout en gardant les aspects intressants des modlisations stochastiques (introduction
de contraintes gomtriques sur les polygones, mises en place dinteractions, possibilit

105
dutiliser des espaces dtat continus,...).
Loptimisation
Dans la partie 3.3.4, nous avons voqu et discut de lutilisation de techniques doptimisation alternatives celle propose dans le manuscrit. Il apparat important dapprofondir
cette direction. Nous avons montr que les processus de diffusion sauts pouvaient tre utiliss pour optimiser notre nergie. Ce type dalgorithmes est particulirement intressant
dans la mesure o les temps de calcul seraient significativement rduits. Une autre possibilit pourrait tre dutiliser les techniques fondes sur les modles graphiques. Un procd
intressant consisterait utiliser une modlisation par graphe hirarchique deux niveaux :
le niveau infrieur correspondant des squences dobjets (dont loptimisation locale est relativement simple et rapide), le niveau suprieur permettant dintroduire des lois de dpendance sur le raccordement des squences entre elles. On pourrait galement se pencher sur
les techniques de propagation des messages. Les mthodes de "belief propagation" semblent
tre particulirement bien adaptes, dautant que les graphes de notre problme possdent
souvent peu de cycles.
Nous pourrions galement imaginer utiliser des modles de reconstruction 3D peu prcis mais rapides ( limage de ceux proposs en annexe) comme une initialisation pour un
modle dterministe plus prcis. Ainsi, les rsultats fournis par le processus prsent en
annexe E permettraient de donner le type de toit des objets ainsi quune estime des valeurs des paramtres. Nous pourrions alors utiliser ces informations pour fournir une bonne
initialisation un processus dterministe rapide et prcis.
La gestion des dtails
Il semble particulirement intressant dadapter plus spcifiquement la mthode de reconstruction 3D des objets reprsentant des niveaux de dtails diffrents. On pourrait ainsi
alimenter la bibliothque dobjets permettant la restitution de nombreux dtails situs sur
les toits ou cot des faades. Les rsultats encourageants obtenus sur la reconstruction de
superstructures permettent denvisager la mise en place dune densit a posteriori plus complexe, permettant de grer des interactions dinclusion entre les objets (notamment entre les
superstructures et les toits).

Bilan
Lapproche structurelle est, dune manire gnrale, une solution trs intressante pour
aborder la modlisation 3D denvironnements urbains. Dun intrt limit dans les milieux
pri-urbains, cette approche est particulirement bien adapte pour traiter les zones urbaines
denses. A mi-chemin entre une modlisation purement paramtrique et une modlisation
polydrique, elle apparat comme un compromis trs intressant permettant notamment de
concilier les deux aspects majeurs de lvaluation dune scne 3D : la fidlit la ralit et
la qualit du rendu visuel.
Lapproche structurelle idale serait un processus monolithique, cest--dire quelle permettrait de raliser simultanment la phase dextraction des supports 2D et la phase de

106

Conclusion

reconstruction 3D. Mais au vu du problme combinatoire extrmement complexe quelle


engendrerait, une telle approche semble difficilement concevable aujourdhui pour traiter
des environnements urbains denses.
La modlisation 3D denvironnement urbain par tldtection reste un thme de recherche trs ouvert. La mise en production dun processus compltement automatique est,
au vu de la problmatique, un objectif qui semble lointain. Pour latteindre, des progrs
concernant la physique des capteurs et la qualit des donnes en gnral seront probablement ncessaires.

Bibliographie
Allain, R., 2004. Morphologie Urbaine : Gographie, amnagement et architecture de la
ville. A. Colin.
Ameri, B., 2000. Feature based model verification : A new concept for hypothesis validation in building reconstruction. Dans : Proc. of the XIXth ISPRS Congress. Vol. 33, B3.
Amsterdam, Pays-Bas, pp. 2435.
Arak, T., Surgailis, D., 1989. Markov fields with polygonal realisations. Probability Theory
and Related Fields 80, 543579.
Baillard, C., 1997. Analyse dimages ariennes stroscopique pour la restitution 3D des
milieux urbains. Dtection et caractristique du sursol. Thse de doctorat, Ecole Nationale Suprieure des Tlcommunications de Paris.
Baillard, C., Zisserman, A., 1999. Automatic reconstruction of piecewise planar models
from multiple views. Dans : Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Corfu, Grce.
Bailloeul, T., Prinet, V., Serra, B., Marthon, P., 2005. Spatio-temporal prior shape constraint
for level set segmentation. Dans : Proc. Energy Minimization Methods in Computer Vision and Pattern Recognition. St. Augustine, Etats-Unis.
Besag, J., 1986. On statistical analysis of dirty pictures. Journal of the Royal Statistical
Society 48 (3), 259302.
Blake, A., Zisserman, A., 1987. Visual reconstruction. Dans : MIT Press. M.A., Cambridge.
Boykov, Y., Veksler, O., Zabih, R., 1999. Fast approximate energy minimization via graph
cuts. Dans : IEEE proc. of International Conference on Computer Vision. Corfu, Grce.
Brdif, M., Boldo, D., Pierrot-Deseilligny, M., Matre, H., 2007. 3D building reconstruction
with parametric roof superstructures. Dans : Proc. of the IEEE International Conference
on Image Processing. San Antonio, Etats-Unis.
Brenner, C., Haala, N., Fritsch, D., 2001. Towards fully automated 3D city model generation. Dans : Proc. of the Workshop on Automatic Extraction of Man-Made Objects from
Aerial and Space Images. Ascona, Suisse.
Brenner, C., Ripperda, N., 2006. Extraction of facades using RJMCMC and constraint equations. Dans : Proc. of the ISPRS Commission III Symposium on Photogrammetric and
Computer Vision. Bonn, Allemagne.

108

BIBLIOGRAPHIE

Bretar, F., 2006. Couplage de donnes laser aroport et photogrammtriques pour lanalyse de scnes tridimensionnelles. Thse de doctorat, Ecole Nationale Suprieure des
Tlcommunications de Paris.
Celeux, G., Diebolt, J., 1986. Lalgorithme SEM : un algorithme dapprentissage probabiliste pour la reconnaissance de mlange de densits. Revue de Statistique Applique
34(2), 3552.
Cellier, F., 2007. Reconstruction 3d de btiments en interfromtrie rso haute rsolution,
approche par gestion dhypothses. Thse de doctorat, Ecole Nationale Superieure des
Telecommunications de Paris.
Chehata, N., Pierrot-Deseilligny, M., Stamon, G., 2005. Hybrid digital elevation models
computation constrained by 3d-primitives : A global optimization algorithm using graph
cuts. Dans : Proc. of the IEEE International Conference on Image Processing. Genova,
Italie.
Ching, F., 1996. Building Construction Illustrated : A Visual Dictionary of Architecture,
Form, Space and Order. John Wiley & Sons.
Cocquerez, J., Philipp, S. (Eds.), 1995. Analyse dimages : filtrage et segmentation. MASSON.
Collins, R., 1996. A space-weep approach to true multi-image matching. Dans : Proc. of the
IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society,
San Francisco, Etats-Unis, pp. 358365.
Collins, R., Jaynes, C., Cheng, Y.-Q., Wang, X., Stolle, F., Riseman, E., Hanson, A., 1998.
The ascender system : Automated site modeling from multiple aerial images. Computer
Vision and Image Understanding 72 (2), 143162.
Dang, T., 1994. Interpretation et restitution automatique des batiments isoles a partir dun
couple stereoscopique dimages aeriennes. These de doctorat, Ecole Nationale Superieure
des Telecommunications de Paris.
De Joinville, O., 2003. Evaluation de la qualite dune cartographie urbaine a laide dimages
aeriennes a haute resolution. Thse de doctorat, Ecole Nationale Superieure des Telecommunications de Paris.
Dempster, A., Laird, N., Rubin, D., 1977. Maximum likelihood from incomplete data via
the EM algorithm. Journal of the Royal Statistical Society B 39, 138.
Descombes, X., 2004. Mthodes stochastiques en analyse dimage : des champsde markov
aux processus ponctuels marqus. Habilitation diriger des recherches, Universite de
Nice Sophia Antipolis.
Descombes, X., Zhizhina, E., 2004. Applications of gibbs fields methods to image processing problems. Problems of Information Transmission 40 (3), 108125.
Dick, A., Torr, P., Cipolla, R., Nov 2004. Modelling and interpretation of architecture from
several images. International Journal of Computer Vision 60 (2), 111134.

BIBLIOGRAPHIE

109

Doucet, A., Godsill, S., Andrieu, C., 2000. On Sequential Monte Carlo Sampling Methods
for Bayesian Filtering. Statistics and Computing 10 (3), 197208.
Durupt, M., Taillandier, F., 2006. Automatic building reconstruction from a digital elevation model and cadastral data : an operational approach. Dans : Proc. of the ISPRS
Commission III Symposium on Photogrammetric and Computer Vision. ISPRS, Bonn,
Allemagne.
Fischer, A., Kolbe, T., Lang, F., Cremers, A., Forstner, W., Plumer, L., Steinhage, V., 1998.
Extracting buildings from aerial images using hierarchical aggregation in 2D and 3D.
Computer Vision and Image Understanding 72 :2, 163185.
Flamanc, D., Maillet, G., 2005. Evaluation of 3d city model production from pleiades-hr
images and 2d ground maps. Dans : URBAN, GRSS/ISPRS Joint Workshop on Data
Fusion and Remote Sensing over Urban Areas. Tempe, Etats-Unis.
Flamanc, D., Maillet, G., Jibrini, H., Sep 2003. 3-d city models : an operational approach
using aerial images and cadastral maps. Dans : ISPRS Conference Photogrammetric
Image Analysis (PIA). Munich, Allemagne, pp. 5358.
Forney, J., 1973. The Viterbi algorithm. Proceedings of the IEEE 13, 268278.
Fritsch, D., 1999. Virtual cities and landscape models - what has photogrammetry to offer ?
Dans : Proceedings of the Photogrammetric Week. pp. 314.
Frueh, C., Jain, S., Zakhor, A., 2005. Data processing algorithms for generating textured
3D building facade meshes from laser scans and camera images. International Journal of
Computer Vision 61 (2), 159184.
Fuchs, F., 2001. Contribution la reconstruction du bti en milieu urbain, laide dimages
ariennes stroscopiques grande chelle. Etude dune approche structurelle. Thse de
doctorat, Universite Ren Descartes - Paris 5.
Gamba, P., Houshmand, B., Saccani, M., 2000. Detection and extraction of buildings from
interferometric sar data. IEEE Transactions on Geoscience and Remote Sensing 38 (1),
611617.
Gaminet, O., 1999. Architecture et Urbanisme : lespace moderne et la ville. Editions de
lEcole Polytechnique.
Garcin, L., Descombes, X., Zerubia, J., Le Men, H., 2001. Buiding extraction using a Markov point process. Dans : Proc. of the IEEE International Conference on Image Processing. Thessalonique, Grce.
Geman, S., Geman, D., 1984. Stochastic relaxation, gibbs distribution ans the Bayesian
restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence
6, 721741.
Geman, S., Huang, C., 1986. Diffusion for global optimization. Journal of Control and
Optimization 24 (5), 10311043.

110

BIBLIOGRAPHIE

Green, P., 1995. Reversible Jump Markov Chains Monte Carlo computation and Bayesian
model determination. Biometrika 57, 97109.
Greig, D., Porteous, T., Seheult, A., 1989. Exact maximum a posteriori estimation for binar
images. Journal of the Royal Statistical Society 51 (B), 271279.
Grenander, U., Chow, Y., Keenan, D. M., 1991. Hands : a pattern theoretic study of biological shapes. Springer-Verlag New York, Inc., New York, Etats-Unis.
Grenander, U., Miller, M., 1994. Representations of Knowledge in Complex Systems. Journal of the Royal Statistical Society 56 (4).
Gruen, A., 1998. Tobago - a semi-automated approach for the generation of 3D building
models. ISPRS Journal of Photogrammetry and Remote Sensing 53 (2), 108118.
Gruen, A., Wang, X., 1998. CC-modeler : a topology generator for 3D city models. ISPRS
Journal of Photogrammetry and Remote Sensing 53 (5), 286295.
Haala, N., Brenner, C., 1999. Extraction of buildings and trees in urban environments. ISPRS Journal of Photogrammetry and Remote Sensing 54 (2-3), 130137.
Haario, H., Saksman, E., 1991. Simulated annealing process in general state space. Advances in Applied Probability (23), 866893.
Han, F., Tu, Z., Zhu, S., 2004. Range Image Segmentation by an Effective Jump-Diffusion
Method. IEEE Trans. on Pattern Analysis and Machine Intelligence 26 (9), 11381153.
Hastings, W., 1970. Monte Carlo sampling using Markov chains and their applications.
Biometrica 57(1), 97109.
Henricsson, O., 1998. The role of color attributes and similarity grouping in 3D building
reconstruction. Computer Vision and Image Understanding 72 (2), 163184.
Heuel, S., Lang, F., Forstner, W., 2000. Topological and geometrical reasoning in 3D grouping for reconstructing polyhedral surfaces. Dans : Proc. of the XIXth ISPRS Congress.
Amsterdam, Pays-Bas.
Jaynes, C., Hanson, A., Riseman, E., Schultz, H., 1997. Building reconstruction from optical
and range images. Dans : Proc. of the IEEE Conference on Computer Vision and Pattern
Recognition. San Juan, Porto Rico.
Jibrini, H., 2002. Reconstruction automatique de btiments en modles polyhdriques 3D
partir de donnes cadastrales vectorises 2D et un couple dimages ariennes haute
rsolution. Thse de doctorat, Ecole Nationale Suprieure des Tlcommunications de
Paris.
Kada, M., 2006. 3D building generalization based on half-space modeling. Dans : workshop
ISPRS, commission II. Hannovre, Allemagne.
Kloeden, P., Platen, E., 1992. Numerical solution of stochastic differential equations.
Springer-Verlag, New York.

BIBLIOGRAPHIE

111

Kluszczynski, R., VanLieshout, M. N. M., Schreiber, T., 2004. Image segmentation by polygonal markov fields. Research Report 0409, PNA.
Lacoste, C., Descombes, X., Zerubia, J., October 2005. Point processes for unsupervised
line network extraction in remote sensing. IEEE Trans. Pattern Analysis and Machine
Intelligence 27 (10), 15681579.
Lafert, J., 1996. Contribution lanalyse dimages par modles markoviens sur des graphes
hirarchiques. applications la fusion de donnes multirsolutions. Thse de doctorat,
Universit de Rennes 1.
Lee, S., Nevatia, R., 2003. Interactive 3D building modeling using a hierarchical representation. Dans : IEEE Workshop on Higher-Level Knowledge in 3D Modeling and Motion
(HLK). Nice, France.
Li, J., Nevatia, R., Noronha, S., 1999. User assisted modeling of buildings from aerial
images. Dans : Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Fort Collins, Etats-Unis.
Li, S., 1995. Markov Random Field modeling in computer vision. Springer-Verlag.
Lin, C., Nevatia, R., 1998. Building detection and description from a single intensity image.
Computer Vision and Image Understanding 72 (2), 101121.
Maas, H., Vosselman, G., 1999. Two algorithms for extracting building models from raw
laser altimetry data. ISPRS Journal of Photogrammetry and Remote Sensing 54, 153
163.
McGlone, J., Shufelt, J., 1994. Projective and object space geometry for monocular building
extraction. Rapport technique, Carnegie Mellon University.
Metropolis, M., Rosenbluth, A., Teller, A., Teller, E., 1953. Equation of state calculations
by fast computing machines. Journal of Chemical Physics 21, 10871092.
Mitchell, M., 1996. Introduction to genetic algorithms. Dans : MIT Press. M.A., Cambridge.
Nevatia, R., Price, K., 2002. Automatic and interactive modeling of buildings in urban environments from aerial images. Dans : Proc. of the IEEE International Conference on
Image Processing. Rochester, Etats-Unis.
Noronha, S., Nevatia, R., 2001. Detection and modeling of buildings from multiple aerial
images. IEEE Transactions on Pattern Analysis and Machine Intelligence 23 (5), 501
518.
Oriot, H., 2003. Statistical snakes for building extraction from stereoscopic aerial images.
Dans : ISPRS Conference on Photographic Image Analyses. Hannovre, Allemagne.
Ortner, M., 2004. Processus ponctuels marqus pour lextraction automatique de caricatures
de btiments partir de Modles Numriques dElvation. Thse de doctorat, Universit
de Nice Sophia Antipolis.

112

BIBLIOGRAPHIE

Ortner, M., Descombes, X., Zerubia, J., 2007. Building outline extraction from digital elevation models using marked point processes. International Journal of Computer Vision
72 (2), 107132.
Palubinskas, G., Descombes, X., Kruggel, F., August 1998. An unsupervised clustering
method using the entropy minimization. Dans : Proc. International Conference on Pattern
Recognition. Brisbane, Australie.
Paparoditis, N., Cord, M., Jordan, M., Cocquerez, J.-P., 1998. Building detection and reconstruction from mid-and high-resolution aerial imagery. Computer Vision and Image
Understanding 72 (2), 122142.
Penard, L., Paparoditis, N., Pierrot-Deseilligny, M., 2006. Reconstruction 3D automatique
de faades de btiments en multi-vues. Dans : Reconnaissance des Formes et Intelligence
Artificielle. Tours, France.
Pennec, X., 1996. Lincertitude dans les problmes de reconnaissance et de recalage applications en imagerie mdicale et biologie molculaire. Thse de doctorat, Ecole Polytechnique, Palaiseau, France.
Perrin, G., Descombes, X., Zerubia, J., November 2005. Adaptive simulated annealing for
energy minimization problem in a marked point process application. Dans : Proc. Energy
Minimization Methods in Computer Vision and Pattern Recognition. St Augustine, EtatsUnis.
Pierrot-Deseilligny, M., Paparoditis, N., 2006. A multiresolution and optimization-based
image matching approach : an application to surface reconstruction from SPOT5-HRS
stereo imagery. Dans : Workshop ISPRS commission I. Ankara, Turquie.
Prez, P., 2003. Modles et algorithmes pour lanalyse probabilistiques des images. Habilitation diriger des recherches, Universite de Rennes 1.
Robert, C., 1996. Mthodes de Monte Carlo par Chanes de Markov. Statistique mathmatique et probabilit. Economica.
Robert, C., Casella, G., 1999. Monte Carlo Statistical Methods. Springer-Verlag, New York.
Rottensteiner, F., Briese, C., 2002. A new method for building extraction in urban areas
from high-resolution lidar data. Dans : Proc. of the ISPRS Commission III Symposium
on Photogrammetric and Computer Vision. Vol. 34. Graz, Autriche.
Roy, S., Cox, I., 1998. A maximum-flow formulation of the n-camera stereo correspondence problem. Dans : Proc. of the IEEE International Conference on Computer Vision.
Bombay, Inde.
Salamon, P., Sibani, P., Frost, R., 2002. Facts, conjectures, and improvements for simulated
annealing. SIAM Monographs on Mathematical Modeling and Computation. Society for
Industrial and Applied Mathematics, Philadelphia.

BIBLIOGRAPHIE

113

Salomon, M., Perrin, G., Heitz, F., 2002. Parallel sampling with stochastic differential equations for 3D deformable matching of medical images. Dans : Proc. International Conference on Parallel and Distributed Processing Techniques and Applications. Las Vegas,
Etats-Unis.
Scholze, S., Moons, T., Van Gool, L., 2002. A probabilistic approach to building roof reconstruction using semantic labelling. Dans : Proc. of the DAGM Conference. Vol. 2449
de Lecture Notes in Computer Science. Zurich, Suisse.
Senegas, J., 2002. Mthodes de Monte Carlo en vision stroscopique -Application ltude
de Modles Numriques de Terrain. Thse de doctorat, Ecole des Mines de Paris.
Simonetto, E., Oriot, H., Garello, R., Le Caillec, J., 2003. Radargrammetric processing for
3D building extraction from high-resolution airborne SAR data. Dans : IEEE International Geoscience and Remote Sensing Symposium. Toulouse, France.
Soergel, U., Michaelsen, E., Thoennessen, U., Stilla, U., 2005. Potential of high-resolution
sar images for urban analysis. Dans : URBAN, GRSS/ISPRS Joint Workshop on Data
Fusion and Remote Sensing over Urban Areas. Tempe, Etats-Unis.
Srivastava, A., Grenander, U., Jensen, G., Miller, M., 2002. Jump-Diffusion Markov processes on orthogonal groups for object recognition. Journal of Statistical Planning and
Inference 103(1/2), 1737.
Stoyan, D., Kendall, W., Mecke, J., 1987. Stochastic Geometry and its Applications. John
Wiley and Sons.
Suveg, I., Vosselman, G., 2001. 3D building reconstruction by map based generation and
evaluation of hypotheses. Dans : British Machine Vision Conference. Manchester, Angleterre.
Taillandier, F., 2004. Reconstruction de bti en milieu urbain : une approche multi-vues.
Thse de doctorat, Ecole Polytechnique.
Taillandier, F., Deriche, R., 2002. Reconstruction of 3D linear primitives from multiple
views for urban areas modelisation. Dans : Proc. of the ISPRS Commission III Symposium on Photogrammetric and Computer Vision. Graz, Autriche.
Tison, C., 2004. Interfromtrie RSO haute rsolution en milieu urbain : application au
calcul de MNS urbain. Thse de doctorat, Ecole Nationale Suprieure des Tlcommunications de Paris.
Tu, Z., Zhu, S., 2002. Image Segmentation by Data-Driven Markov Chain Monte Carlo.
IEEE Trans. on Pattern Analysis and Machine Intelligence 24 (5), 657673.
Tupin, F., Roux, M., 2003. Detection of building outlines based on the fusion of sar and
optical features. ISPRS Journal of Photogrammetry and Remote Sensing 58 (1), 7182.
Van Laarhoven, P., Aarts, E., 1987. Simulated Annealing : Theory and Applications. D.
Reidel, Boston.

114

BIBLIOGRAPHIE

Van Lieshout, M., 2000. Markov point processes and their applications. Dans : Imperial
College Press. Londre.
Varanelli, J., 1996. On the acceleration of the simulated annealing. Thse de doctorat, University of Virginia, Charlottesville, Etats-Unis.
Vestri, C., 2000. Outils pour la reconstruction automatique de btiments partir dimagerie
arienne. Thse de doctorat, Universit de Nice-Sophia Antipolis.
Vinson, S., Cohen, L., 2002. Multiple rectangle model for buildings segmentation and 3D
scene reconstruction. Dans : Proc. of the International Conference on Pattern Recognition. Quebec, Canada.
Viterbi, A., 1967. Error bounds for convolutional codes and an asymptotically optimum
decoding algorithm. IEEE Transactions on Information Theory 13, 260269.
Wang, X., Totaro, S., Taillandier, F., Hanson, A., Teller, S., 2002. Recovering facade texture and microstructure from real-world images. Dans : Proc. of ISPRS Commission III
Symposium on Photogrammetric Computer Vision. Graz, Autriche.
Weidner, U., Forstner, W., 1995. Towards automatic building reconstruction from highresolution digital elevation models. ISPRS Journal of Photogrammetry and Remote Sensing 50 (4), 3849.
White, S., 1984. Concepts of scale in simulated annealing. Dans : IEEE proc. of International Conference on Computer Design. pp. 646651.
Willuhn, W., Ade, F., 1996. A rule-based system for house reconstruction from aerial
images. Dans : Proc. of the International Conference on Pattern Recognition. Vienne,
Autriche.
Winkler, G., 1995. Image analysis, random fields and Markov chain Monte Carlo methods
a mathematical introduction. Springer.
Xu, G., Zhang, Z., 1996. Epipolar Geometry in stereo, motion and object recognition. Kluwer Academic Publishers.
Zhao, H., Shibasaki, R., 2001. Reconstructing textured CAD model of urban environment
using vehicle-borne laser range scanners and line cameras. Lecture Notes in Computer
Science 2095, 284297.

BIBLIOGRAPHIE

115

Publications de lauteur
Journaux
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Automatic building
extraction from DEMs using an object approach. Journal of Photogrammetry and
Remote Sensing, paratre, 2007.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Automatic 3D Building Reconstruction from DEMs. Revue Franaise de Photogrammtrie et de Tldtection (SFPT), paratre, 2007.
F. Lafarge, X. Descombes, J. Zerubia et S. Mathieu. Dtection de feux de fort par
analyse statistique dvnements rares partir dimages infrarouges thermiques. Traitement du Signal , Vol.24(1), 2007.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Modle Paramtrique pour la Reconstruction Automatique en 3D de Zones Urbaines Denses partir
dImages Satellitaires Haute Rsolution. Revue Franaise de Photogrammtrie et de
Tldtection (SFPT) 180 :pages 4-12, 2005.
Confrences
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. 3D city modeling
based on Hidden Markov Model. IEEE ICIP07, San Antonio, Etats-Unis, Sept. 2007.
F. Lafarge, X. Descombes et J. Zerubia. Forest Fire Detection based on Gaussian
Field Analysis. EURASIP EUSIPCO07, Poznan, Pologne, Sept. 2007.
O. Tournaire, N. Paparoditis et F. Lafarge. Rectangular road marking detection with
marked point processes. ISPRS PIA07, Munich, Allemagne, Sept. 2007.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. An Automatic Building Reconstruction Method : A Structural Approach Using HR Images. IEEE ICIP06,
Atlanta, Etats-Unis, Oct. 2006.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Automatic 3D Building Reconstruction from DEMs : an Application to PLEIADES Simulations. In
Proc. ISPRS Commission I Symposium, Marne La Vallee, France, Juil. 2006.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. An automatic 3D city
model : A Bayesian approach using satellite images. IEEE ICASSP06, Toulouse,
France, Mai 2006.
F. Lafarge, X. Descombes et J. Zerubia. Textural kernel for SVM classification in
remote sensing : application to forest fire detection and urban area extraction. IEEE
ICIP05, Gne, Italie, Sept. 2005.
F. Lafarge, X. Descombes, J. Zerubia et S. Mathieu-Marni. Dtection de feux de
fort partir dimages satellitaires IRT par analyse statistique dvnements rares.
GRETSI05, Louvain la neuve, Belgique, Sept. 2005.
Rapports
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. A structural approach
for 3D building reconstruction. Rapport de Recherche 6048, INRIA, Nov. 2006.

116

BIBLIOGRAPHIE
F. Lafarge, P. Trontin, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. An automatic building extraction method : Application to the 3D-city modeling. Rapport de
Recherche 5925, INRIA, Mai 2006.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. A parametric model for automatic 3D building reconstruction from HR satellite images. Rapport de
Recherche 5687, INRIA, Sept. 2005.
F. Lafarge, X. Descombes et J. Zerubia. Dtection de feux de fort par analyse statistique de la radiomtrie dimages satellitaires. Rapport de Recherche 5369, INRIA,
Nov. 2004.
F. Lafarge, X. Descombes et J. Zerubia. Noyaux texturaux pour les problmes de
classification par SVM en tldtection. Rapport de Recherche 5370, INRIA, Nov.
2004.
F. Lafarge. Dtection de feux de fort par analyses radiomtriques et texturales. Rapport de DEA, SUPAERO, Sep. 2004.

Workshops
Une approche structurelle pour la modlisation urbaine en 3D partir dimages satellitaires THR et de donnes cadastrales. Atelier PNTS "La trs haute rsolution
spatiale en tldtection", Nantes, France, Sep. 2007.
3D city modelling using RJMCMC sampler. EURANDOM workshop on image analysis and inverse problems, Eindhoven, Pays-Bas, Dec. 2006.
A structural approach for automatic 3D city modeling. Mathematical methods for
multi-channel image processing workshop (MULTIM), Pkin, Chine, Juil. 2006.
Urban 3D reconstruction from PLEIADES simulations. 6th WORKSHOP CNESDLR, DLR, Oberpfaffenoffen, Allemagne, Nov. 2005.
Textural kernel for SVM classification applied to remote sensing. 5th WORKSHOP
CNES-DLR, DLR, Oberpfaffenoffen, Allemagne, Nov. 2004.
Sminaires et communications diverses
Reconstruction en 3D de btiments par approche stochastique. DGA, Arcueil, France,
Janv. 2007.
Reconstruction en 3D de btiments partir de simulations PLEIADES. Journes
CNES jeunes chercheurs (JC 2 ), Toulouse, France, Oct. 2006.
Modles paramtriques pour la reconstruction en 3D de zones urbaines partir de
donnes satellitaires. Journes de la recherche IGN, Saint-Mand, France, Mars 2006.
Parametric models for building 3D reconstruction using satellite data. MTA-SZTAKI,
Acadmie des Sciences, Budapest, Hongrie, Dec. 2005.
Parametric 3D city models using satellite data. University of science, Szeged, Hongrie, Nov. 2005.

Chapitre 6

Annexes

118

Annexes

A - Processus 3D paramtriques partir demprises rectangulaires


Deux modles de reconstruction 3D, partir dun MNE et des emprises rectangulaires
associes, sont prsents dans cette annexe. Ces deux modles sont les premiers processus
de reconstruction 3D de btiments que nous avons proposs. Les rsultats obtenus sont
limits, surtout au niveau du rendu visuel. Cependant, ces deux modles sont lorigine de
rflexions qui nous ont amens proposer le processus prsent dans le corps de la thse.

1- Modle simple
Dans le premier modle, nous cherchons fixer sur chaque emprise rectangulaire, un
modle de btiments 6 paramtres. La principale difficult consiste grer les interactions entre les modles voisins. Pour ce faire, nous utilisons une formulation nergtique
baysienne.
Modle paramtrique de btiments
Le modle de btiments retenu est schmatis sur la figure 6.1. Il est dfini travers
2 paramtres altimtriques (la hauteur de gouttire et la hauteur de larte fatire) et 4
paramtres morphologiques (avec la contrainte que laire du plan suprieur soit nulle : a +
b = l ou c + d = L, sans quoi, la configuration est peu raliste). Ce modle est intressant
dans la mesure o il permet de gnrer diffrents types de toits, notamment des toits plats
(Hg = Hc ), des bi-plans symtriques et dissymtriques (a = b = 0 ou c = d = 0), ou des
attaques en V (a = b = 2l et (c, d) 6= (0, 0) par exemple).

F IG . 6.1 Modle 3D paramtrique base rectangulaire (1 er modle)

Formulation nergtique
Lnergie est mise en place dans un cadre baysien. Soient y, un MNE marqu de N
rectangles, et x, une configuration de N modles paramtriques dont les supports corres-

119
pondent aux rectangles de y. Notons C , lensemble des configurations x possibles. Alors,
nous dfinissons lnergie U dune configuration x C , connaissant y, par :
U(x) = Ud (x) +U p (x)

(6.1)

Ud correspond lnergie dattache aux donnes. En considrant lhypothse dindpendance conditionnelle des donnes (cest--dire notamment que nous ngligeons le recouvrement des rectangles, hypothse quelque peu discutable), cette nergie peut tre dcompose
en une somme dnergies locales associes chacun des N modles paramtriques de la
configuration x :
(6.2)
Ud (x) = Udl (xi )
xi x

o Udl (xi ) correspond la distance en norme L 1 entre les pixels inclus dans le rectangle i
et la cte des points correspondant du modle x i (distance au sens de la somme "pixels par
pixels").
U p (x) reprsente lnergie a priori de la configuration x. Elle se dcompose en 3 termes :
(1)

(2)

(3)

U p (x) = U p (x) +U p (x) +U p (x)

(6.3)

Les deux derniers termes sont des interactions sur les paires de rectangles voisins. Deux
rectangles sont considrs comme voisins si lintersection de leur sur-rectangle (i.e. rectangle de longueur L + et de largeur l + - en pratique, = 1m) est nulle. La figure 6.2
illustre la relation de voisinage que lon note .

F IG . 6.2 Illustration de la relation de voisinage - paire de rectangles non voisins (gauche),


paire de rectangles voisins (droite).
(1)

U p (x) est une nergie qui mesure la complexit des N modles de x. Pour ce faire,
les modles, tant axialement symtriques par rapport la largeur et/ou la longueur
de leur emprise rectangulaire, sont favoriss. Cest le cas des toits les plus courants
tels que les toits plats ou les bi-plans. Ainsi, en notant n f (x) et nF (x), le nombre de
modles de x ayant respectivement une et deux symtries, et ( f , F ), un couple de
(1)
poids valeurs relles ngatives, nous exprimons U p (x) par :
(1)

U p (x) = f n f (x) + F nF (x)

(6.4)

(2)

U p (x) correspond des interactions dordre 2 permettant lajustement des hauteurs


de gouttires entre les modles voisins, tout en autorisant les sauts suprieurs la
hauteur dun tage (not H f - en pratique, 3 mtres). Nous avons :
U p (x) = fh (|Hgi Hg j |)
(2)

i j

(6.5)

120

Annexes
o fh est la fonction relle reprsente sur la figure 6.3, et i j reprsente les paires
de modles voisins.
(3)

U p (x) favorise la continuit des artes fatires sur un btiment, toujours par des
interactions dordre 2. Plus prcisment, ce terme permet lattraction des extrmits
des artes fatires des modles voisins. En notant e i et e j , les extrmits des artes
fatires des modles xi et x j (dans R3 ), nous avons :
U p (x) = r dc (ei , e j )
(3)

(6.6)

i j

dc (., .) est une fonction correspondant la distance en norme L 2 dans R3 si |(Hgi +


Hci ) (Hg j + Hc j )| < H f et valant 0 sinon. r est un poids valeur relle positive.

F IG . 6.3 Illustration des interactions dordre 2 - attraction des extrmits des artes fatires (gauche), ajustement des hauteurs de gouttires (droite)

Optimisation par la dynamique de Metropolis


Lnergie U(x) est une fonction non convexe qui est dfinie sur un espace dtat de
grande dimension. Afin de trouver la configuration qui minimise U, nous utilisons lalgorithme de Metropolis [Metropolis et al., 1953]. Cette technique procde itrativement selon
une relaxation stochastique gre par une temprature Tt qui dcrot vers 0 quand t tend vers
linfini. Si litration t, la configuration courante est x (t) = x, alors lalgorithme consiste
:
choisir alatoirement le rectangle i (parmi les N)
tirer un nouveau jeu de paramtres xbi , permettant de dfinir une nouvelle configuration dobjets xb = (x1 , ..., xi1 , xbi , xi+1 , ..., xN )
accepter x(t+1) = xb
si U(b
x) U(x) 0
ou si U(b
x) U(x) > 0 et p < exp U(bx)U(x)
o p est tir uniformment entre [0, 1]
Tt
(t+1)
sinon accepter x
=x
mettre jour la temprature Tt
Nous choisissons une dcroissance de temprature gomtrique, dtaille dans [Van Laarhoven et Aarts, 1987]. En pratique, nous navons aucune garantie datteindre la configuration
optimale, mais une configuration relativement proche. Les temps de calcul sont, de plus,
trs importants. Le deuxime modle, prsent ci-dessous, permet de rduire efficacement
les temps de calcul.

121

2- Modle objets multiples


Cette deuxime mthode est une version amliore de la premire, utilisant la mme approche nergtique. Elle diffre par le modle 3D paramtrique de btiments mis en place,
et galement par la technique doptimisation utilise. La fonction nergtique est, elle, inchange.
Vers une collection de modles paramtriques
Le principal inconvnient du modle 3D paramtrique prsent sur la figure 6.1 est quil
est trop gnrique. La plupart des jeux de paramtres correspondent des modles 3D peu
ralistes. Les jeux de paramtres intressants reprsentant des toits plats, des bi-plans et des
attaques en V, sont tirs de manire peu frquente par lalgorithme de Metropolis.
La solution consiste se limiter une collection de modles 3D spcifiques tels que les
toits plats, les bi-plans et les attaques en V. De cette manire, nous restreignons fortement la
taille de lespace dtats. La figure 6.4 reprsente une collection de modles correspondant
des types de toit de forte occurrence (6 au total). Ils possdent de 1 5 paramtres. H g et Hc
reprsentent toujours la hauteur de gouttire et la hauteur de larte fatire du modle. ,
et sont des paramtres de formes contenus dans [0, 1]. oriente le modle par rapport
son support 2D (il prend 4 valeurs possibles). Cette collection de modles permet de rduire
fortement lespace des configurations.

F IG . 6.4 Collection de Modles 3D "spcifiques" base rectangulaire

Optimisation par RJMCMC


Nous cherchons toujours optimiser lnergie U. Cependant, lespace de recherche de la
solution est dsormais une union de sous-espaces de dimension varie. En effet, les modles
3D de la collection ont un nombre de paramtres variant entre 1 et 5.
Nous chantillonnons notre espace dtats par lalgorithme de Green [Green, 1995] que
nous couplons un recuit simul. Cette technique doptimisation est utilise plusieurs

122

Annexes

reprise dans le manuscrit, cest pourquoi nous ne nous attarderons pas la dtailler ici.
Nous prcisons juste que les sauts sont proposs de manire uniforme sur lespace des
configurations, et que le schma de dcroissance de temprature est identique celui utilis
dans le premier modle.

3- Rsultats
Les rsultats obtenus par ces deux modles sont visuellement identiques, le deuxime
modle tant une version amliore du premier dans lequel nous avons restreint lespace
des configurations. Le deuxime modle a des temps de calcul rduit dun facteur 3 environ
par rapport au premier modle. Pour un btiment compos dune dizaine demprises rectangulaires, environ 5 minutes seront ncessaires pour le premier modle, tandis que le second
mettra un peu moins de 2 minutes, sur un PC standard (2 Ghz).
La figure 6.5 prsente les reconstructions de deux btiments. Ces rsultats donnent plusieurs points de satisfaction. Dabord, la forme gnrale des btiments est globalement respecte comparativement aux vrits terrain associes. Ensuite, le terme de rgularisation
permet un ajustement efficace des hauteurs de gouttire et une bonne connexion des extrmits des artes fatires.
Cependant, ces modlisations possdent des dfauts trs pnalisants. Les discontinuits des hauteurs de toits ne sont pas retranscrites. Linconvnient majeur est la prsence de
nombreux artefacts, dus une mauvaise connexion des supports rectangulaires voisins. Des
algorithmes de simplifications de formes 3D, comme celui propos par [Kada, 2006], ne
sont pas adapts ce type dartefacts, et ne sauraient rsoudre le problme. Ce dfaut ne
peut pas tre trait dans le processus de reconstruction 3D : la solution qui simpose consiste
repenser les supports 2D. Nous abordons ce problme dans la partie 2.2. Les rsultats prsents sur la figure 6.6 soulignent la prsence importante des artefacts, pnalisant fortement
le rendu visuel des reconstructions. Les valuations altimtriques sont toutefois correctes.
Lerreur quadratique moyenne en Z est de 3,2 mtres.
Lnergie inhrente ces deux modles est rgie par un jeu de paramtres pondrateurs.
Ce jeu comporte 4 potentiels ( f , F , h et r ), particulirement difficiles rgler. Cela
reprsente un inconvnient majeur qui rend le processus de reconstruction peu robuste. La
solution consiste proposer une nergie plus pertinente, et dpendant de moins de paramtres.

123

F IG . 6.5 Rsultat sur deux btiments - emprises rectangulaires (gauche), rsultats 3D


(centre), vrits terrain (droite).

F IG . 6.6 Rsultat sur une zone dense - emprises rectangulaires, rsultat 3D et exemples
dartefacts (haut), vrit terrain et carte dvaluation (bas).

124

Annexes

B - Processus 3D par squeltisation des artes fatires


La mthode de reconstruction 3D prsente dans cette annexe est fonde sur un processus de squeltisation des artes fatires partir de supports structuraux (prsents dans le
chapitre 2). Cette approche est relativement simple, rapide et robuste. Cependant, la complexit de la modlisation 3D est de bas niveau. Les toits sont, en effet, limits des bi-plans
symtriques et des toits plats. Les seules inconnues du modle sont la hauteur de gouttire
et la hauteur de fatire dterminer pour chaque support 2D.

1-Squeltisation des supports 2D


La forme des toits, et plus prcisment la disposition des artes fatires, est entirement dfinie par un algorithme de squeltisation des supports 2D. Pour un btiment, nous
schmatisons les relations de connexion entre supports par un graphe dont chaque noeud
correspond un support. La mthode consiste rechercher le plus long chemin simple, lequel va permettre de dfinir larte fatire principale du btiment (voir la figure 6.7 - chane
rouge). Ensuite, les noeuds non parcourus sont traits indpendemment, en squeltisant les
supports associs (voir la figure 6.7 - chanes bleues).

F IG . 6.7 Illustration de la squeletisation des supports - la chane principale en rouge,


chanes secondaires en bleu

2-Estimation des diffrentes hauteurs


Pour chaque support 2D, nous estimons la hauteur de gouttire ainsi que la hauteur
darte fatire en nous focalisant sur des rgions dintrt lintrieur du support. Ces
a
masques sont illustrs sur la figure 6.8, o b = 10
et c = 4a . Les valeurs des pixels du MNE
contenus dans ces deux masques sont ensuite classes de manire dcroissante dans deux
tables. Lestimation de la hauteur de gouttire est donne par la moyenne des valeurs ranges
entre 20% et 80% de toutes les valeurs de la table des gouttires. Lestimation de la hauteur
darte fatire est, quant- elle, effectue en calculant la moyenne des valeurs ranges entre
10% et 20% de toutes les valeurs de la table des artes fatires.

3-Rgularisation des hauteurs


Pour chaque support dun btiment, nous avons estim les deux inconnues du modle,
savoir la hauteur de gouttire ainsi que la hauteur de fatire. Or, chaque support a un couple
unique dinconnues. Il est ncessaire de rgulariser ces valeurs entre les supports voisins,
cest--dire faire en sorte que la continuit du toit dun support un autre soit prserve sil

125

F IG . 6.8 Illustration des masques sur lesquels les diffrentes hauteurs sont estimes

y a lieu dtre. La figure 6.9 prsente un btiment non rgularis, ainsi que son homologue
rgularis par la mthode que nous proposons.
Nous utilisons, pour chaque groupe de supports connects, lalgorithme du "K-means",
prsent dans [Cocquerez et Philipp, 1995], incluant un terme permettant de pnaliser les
nombres de classes levs. Cet algorithme sapparente celui propos par [Palubinskas
et al., 1998] utilisant un terme entropique pour minimiser le nombre de classes. Lavantage
dun tel algorithme est que le nombre de classes nest pas connu a priori.
Considrons un ensemble de supports connects compos de N lments. Notons H gi
lestimation de la hauteur de gouttire du i eme lment de cet ensemble. Lalgorithme du
"K-means" avec terme de rgularisation consiste rechercher les c j , centrode de la j eme
classe, qui maximisent le critre J dfinie par :

J=

d 2 (Hgi , c j ) C

(6.7)

j=1 i=1

o C reprsente le nombre de classes (non connu a priori). En pratique, on calcule ce terme


pour chaque possibilit de nombre de classes (cest--dire pour chaque C [1, N]). On
conserve alors le nombre de classes et les centroides c j associs qui minimisent le critre J.
Le critre J est compos de deux termes. Le premier correspond au critre classique de
lalgorithme du "K-means". Le second, qui est pondr par le paramtre R +? , reprsente
un a priori sur les classes. Ce terme favorise linairement les nombres de classes faibles.
Finalement, le centrode c j du ieme support correspond la valeur rgularise de la hauteur
de gouttire pour ce support. Le paramtre a t fix 90. Une valeur trop faible de
rend la modlisation 3D mal rgularise. A linverse, un trop lev uniformisera lexcs
les toits et fera disparatre les discontinuits des hauteurs de toit dtectes dans le chapitre
2 du manuscrit. Le mme procd est appliqu pour rgulariser les hauteurs darte fatire.

126

Annexes

4-Quelques rsultats
Les figures 6.10 et 6.11 prsentent les rsultats de cette mthode. Les modlisations obtenues, bien que trs simples, fournissent une description gnrale des btiments qui peut
tre intressante pour des applications exigeant de la robustesse et un faible temps de calcul.

F IG . 6.9 Illustration de la rgularisation des hauteurs - supports 2D et MNE (gauche),


modlisation non rgularise (centre), modlisation rgularise (droite).

F IG . 6.10 Rsultat sur lhtel de ville dAmiens - supports 2D et MNE (gauche), modlisation obtenue (centre), vrit terrain 3D (droite).

127

F IG . 6.11 Rsultats sur trois zones urbaines - supports 2D et MNE (gauche), modlisations
3D (droite).

128

Annexes

C - Rappel sur les chanes de Markov


La mise en place des algorithmes dchantillonnage prsents dans la partie 3.3.1 du
manuscrit reposent sur la construction dune chane de Markov convergeant vers la mesure
chantillonner. Cette annexe fournit des rappels sur les chanes de Markov et leur convergence, notions utiles pour la comprhension du fonctionnement de ces chantillonneurs.

1- Dfinitions
Dfinition 2 Une suite de variables alatoires (Xn ) valeurs dans un espace E muni de sa
tribu B est une chane de Markov si :
p(Xt+1 A|X0 = x0 , ..., Xt = xt ) = p(Xt+1 A|Xt = xt )

A B

(6.8)

Lvolution dune chane de Markov (cest--dire le passage de Xt Xt+1 ) a ainsi la proprit


de ne pas dpendre du pass de la chane, mais uniquement de son tat courant (Xt = xt ).
Cette proprit est particulirement intressante lors de la mise en uvre informatique puisquil nest pas ncessaire de garder en mmoire les tats passs du processus pour effectuer
les calculs.
Une chane de Markov est homogne si son volution est indpendante de linstant t. Dans
la suite, nous considrons uniquement ce type de chanes de Markov.
Dfinition 3 Un noyau de transition est une fonction P dfinie sur E B telle que :
x E, P(x, .) est une mesure de probabilit
A B , P(., A) est mesurable.
Le noyau de transition P associ une chane de Makov homogne est donn par :
P(x, A) = p(Xt+1 A|Xt = x)

(6.9)

2- Stationnarit
La proprit de stationnarit est essentielle pour un chantillonneur de type Monte Carlo
par chane de Markov. La chane construire (Xt ) doit en effet avoir une mesure stationnaire
. Cette proprit est quivalente linvariance de par rapport (Xt ).
Proprit 1 Une mesure est stationnaire ou invariante pour la chane de Markov de
noyau de transition P si :
(A) =

P(x, A)d(x)

A B

(6.10)

Afin dtablir la stationnarit de pour un noyau P, on vrifie la rversibilit de la chane


de Markov. En effet, la rversibilit tant plus facile vrifier que la stationnarit, la plupart des algorithmes dchantillonnage vrifient la condition de rversibilit qui implique
linvariance pour .
Proprit 2 Une chane de Markov est rversible si son noyau de transition P vrifie
lquation :
Z
Z
A

P(x, B)d(x) =

P(y, A)d(y)

A, B B

(6.11)

129
En dautres termes, la probabilit de passer de A B est, sous , est la mme que la
probabilit de passer de B A.

3- Convergence
Dans cette partie, nous prsentons les notions dirrductibilit, dapriodicit, de rcurrence et dergodicit qui vont permettre de garantir la convergence de la chane de Markov
vers sa mesure stationnaire. La convergence de la chane de Markov vers sa mesure invariante sexprime par :
Pt (x, A) (A)
t

x E, A B

(6.12)

o Pt (x, A) = p(Xt A|X0 = x).


Irrductibilit
Proprit 3 Une chane de Markov (Xt ) sur un espace mesurable (E, B ) est -irrductible
sil existe une mesure non nulle sur B telle que x E, A B ,
(A) > 0 k N : Pk (x, A) > 0

(6.13)

La convergence dune chane de Markov ncessite sa -irrductibilit (galement appele


plus simplement irrductibilit). Lirrductibilit signifie que la chane a une probabilit non
nulle datteindre en temps fini tout ensemble -probable quelque soit la condition initiale.
Si une chane de Makov (Xt ) est -irrductible et si elle possde une mesure invariante ,
alors :
est lunique mesure invariante pour le noyau P
(Xt ) est -irrductible
(A) = 0 (A) = 0
La -irrductibilit dune chane peut donc tre dmontre travers une tude sur une autre
mesure.
Apriodicit
Proprit 4 Soit (Xt ), une chane de Markov -irrductible. Les ensembles A 1 , ..., Am de B
forment un m-cycle si :
x A1
x Am1
x Am
et

=
..
.

P(x, A2 ) = 1

=
=
(m
i=1 Ai ) = 1

P(x, Am ) = 1
P(x, A1 ) = 1

Le plus grand entier d pour lequel un d-cycle est form est appel la priode de la chane.
Si d = 1, la chane est dite apriodique.

130

Annexes

Lapriodicit de la chane est ncessaire pour avoir sa convergence. Pour avoir en pratique
lapriodicit dune chane, on vrifie la condition suffisante suivante :
x E : P(x, {x}) > 0

(6.14)

Si cette condition est vrifie, la chane est dite fortement apriodique. Lapriodicit
dune chane est donc toujours vrifie ds que la probabilit de rester dans ltat courant
est positive (cest--dire avec une probabilit de rejet non nulle dans les algorithmes de type
Metropolis-Hastings).
Lorsque la chane est -irrductible et apriodique, on obtient la convergence pour
presque tout x E :
kPt (x, .) k 0 x E\N
(6.15)
t

o N B tel que (N) = 0, et k.k reprsente la norme en variation totale (cest--dire


k1 2 k = sup|1 (A) 2 (A)|).
A

Rcurrence au sens de Harris


Afin dintroduire la convergence indpendamment de toute condition initiale, la notion
de rcurrence au sens de Harris est introduite.
Proprit 5 une chane de Markov est rcurrente au sens de Harris si :
p({t/Xt A}|X0 = x) = 1

x E , A B /(A) > 0

(6.16)

La rcurrence au sens de Harris dune chane implique son irrductibilit (cest--dire sa


-irrductibilit o est la mesure stationnaire de la chane). Si lespace dtat est fini,
lirrductibilit et la rcurrence au sens de Harris sont quivalentes.
Ergodicit
Proprit 6 Une chane de Markov de mesure stationnaire converge ergodiquement vers
si elle est apriodique et rcurrente au sens de Harris. Lergodicit dune chane est
quivalente :
kPt (x, .) k 0 x E
(6.17)
t

La convergence ergodique dune chane permet dassurer la convergence dune mesure


vers une autre mesure indpendamment de la condition initiale.
Pour vrifier la rcurrence au sens de Harris dans le cas des espaces dtat non finis, on
utilise le concept des ensembles petits.
Dfinition 4 Un ensemble C B est dit petit sil existe un entier m, un rel > 0 et une
mesure de probabilit sur B tels que :
Pm (x, A) (A)

x C , A B

(6.18)

131
Proprit 7 Soit (Xt ), une chane de Markov irrductible et apriodique. Soient C, un ensemble petit de B , et une fonction V : E R telle que lensemble {x/V (x) n} est petit
pour nimporte quel n N et que :
E[V (X1 )|X0 = x] V (x)

x E\C

(6.19)

o E[V (X1 )|X0 = x] reprsente lesprance de V (X1 ) sous la mesure de probabilit P(x,.).
Alors la chane est rcurrente au sens de Harris.
Lquation 6.19 est appele la condition de drift pour la rcurrence.
Ergodicit gomtrique
Proprit 8 Une chane de Markov est gomtriquement ergodique sil existe une constante
r > 1 telle que

rt kPt (x, .) k <

x E

t=1

(6.20)

Lergodicit gomtrique est une proprit plus forte que lergodicit. Elle impose que la
convergence de Pt vers se fasse avec une vitesse gomtrique puisque lquation 6.20
implique linquation suivante :
kPt (x, .) k M r t

(6.21)

rt kPt (x, .) k. Lquation 6.20 peut tre dmontre par une condition
avec M = t=1
de drift gomtrique consistant dmontrer lexistence dune fonction V : [1, [, des
constantes b < et < 1, et un ensemble petit C B tel que :

E[V (X1 )|X0 = x] V (x) + b

C (x)

x E\C

(6.22)

Le principal intrt de la proprit dergodicit gomtrique rside dans ltablissement du


Thorme de la Limite Centrale, particulirement utile pour contrler la convergence des
algorithmes de type MCMC.
Thorme de la limite centrale
Soit g(X), une statistique dintrt telle que g soit intgrable :
g = E [g(X)] =

g(x)d(x)

(6.23)

o est la mesure stationnaire dune chane de Markov rcurrente au sens de Harris.


Soit galement une estime gbt obtenue partir dune ralisation tronque quelconque X1 , ..., Xt :
gbt =

1 t
g(Xi )
t i=1

(6.24)

Si la fonction g satisfait la condition de Lyapunov :


Z

|g(x)|2+ d(x) <

(6.25)

132

Annexes

avec > 0, alors le Thorme de la Limite Centrale implique :

t(gbt g ) N (0, 2 )

o :

2 = Var (g(X)) + 2 Cov (g(Xt )g(Xt+i ))

(6.26)

(6.27)

i=1

Le Thorme de la Limite Centrale permet de contrler la convergence des algorithmes


MCMC dans la mesure o, lorsque 2 > 0, on peut vrifier si les moyennes gbt convergent
vers la quantit g . La principale difficult de ce rsultat est lestimation de la quantit 2 .
Par ailleurs, on ne dispose pas dindication concernant le nombre dchantillons ncessaires
pour raliser un calcul fiable.

133

D - Calcul des noyaux de proposition


La bibliothque M est compose de 26 modles. Parmi ces modles, il y a 12 jeux de
paramtres diffrents. Il sagit donc de dterminer 12 2 = 144 bijections et paramtres de
compltion associs. Cela est long et fastidieux, cest pourquoi nous dtaillons dans cette
annexe quelques cas varis de calculs.
Pour reprendre le problme, on considre deux modles M m et Mn et une perturbation
dun objet x = (m, ) par xb = (n, b
). Le principe est alors de crer une bijection entre lespace
des paramtres des modles Mm et Mn . Pour cela, est complt en simulant u mn mn (.)
travers (, umn ), et b
en simulant vnm nm (.) travers (b
, vmn ) de sorte que lapplication
mn entre (, umn ) et (b
, vmn ) soit une bijection (cest--dire (b
, vmn ) = mn (, umn )).

Lobjectif est alors, connaissant les deux modles, de dterminer la bijection permettant
de passer paramtriquement de lun lautre, afin notamment de calculer le jacobien associ
prsent dans le taux de Green. Cette bijection dpend de la manire dont on a dfini les paramtres de compltion umn et vmn . Les paramtres utiliss dans les modles ont t dfinis
de manire simplifier au maximum le calcul des noyaux (leur domaine de dfinition est
principalement lintervalle unitaire [0, 1]).

Considrons, dans un premier cas, un saut du modle (F 11 , V ) (modle not M1 ) vers


le modle (F21 , V ) (not M2 ). Paramtriquement, on saute de = Hg vers b
= (Hg , Ht , 1 ).
Le paramtre Hg tant commun aux deux modles, il sagit uniquement de complter le modle M1 par u1 2 = (Ht , 1 ). On a ainsi b
= 1 2 (, u1 2 ) avec 1 2 correspondant la fonction
identit : le dterminant du jacobien vaut 1. Il faut noter que, grce la condition de rversibilit de la chane, le taux de Green du saut inverse se calcule simplement en prenant
linverse du taux de Green du saut normal (cela divise par deux le nombre de calculs des
bijections).
Considrons maintenant un second cas dans lequel on effectue un saut du modle terrasse (F12 , V ) (not M1 ) vers le modle bi-plan dissymtrique avec attaque en V (F 22 , VV )
(not M2 ). On a = (Hg , Ht , 1 , 2 , 3 , 4 ) et b
= (Hg , Ht , , 2 , ). Les paramtres communs sont Hg et Ht . De plus, il existe, quelque soit le noyau utilis parmi les trois possibles, une relation directe identitaire entre les paramtres 1 , 2 dun ct et , de lautre.
Il nest, par contre, pas possible de trouver une bijection entre 3 et 2 . Ainsi les paramtres de compltion sont u1 2 = 2 et v2 1 = (3 , 4 ). On a (b
, v2 1 ) = 1 2 (, u1 2 ) o 1 2
correspond, comme dans le premier cas, la fonction identit et dont le dterminant du
jacobien vaut 1. Dans le cas du noyau uniforme par exemple, on aura dans le taux de Green
(1)
(1)
2 1 (v2 1 ) = U[0,1]2 (v2 1 ) = 1 en considrant que 3 et 4 sont indpendants, et 1 2 (u1 2 ) = 14 .

134

Annexes

E - Processus 3D aprs simplification squentielle des supports 2D


Cette annexe prsente un modle simplifi de la mthode de reconstruction prsente
dans le chapitre 3. Lide consiste considrer chaque btiment comme une association de
squences dobjets (voir figure 3.10). Pour ce faire, nous utilisons un principe similaire
celui utilis dans lannexe B-1. Pour un btiment donn, nous schmatisons les relations de
connexion entre supports par un graphe dont chaque noeud correspond un quadrilatre.
La mthode consiste rechercher le plus long chemin simple dans ce graphe, lequel correspond la premire squence extraite. On met alors jour le nouveau graphe en considrant
uniquement les noeuds non parcourus, puis on y extrait le plus long chemin simple. Et lon
itre le procd jusqu ce que le graphe ne contienne plus de noeuds.
Ds lors, lobjectif est doptimiser, suivant lnergie U mise en place dans la partie 3.2,
chaque squence dobjets de manire indpendante. Pour chaque squence de N supports,
N dont le
le problme est modlis par une chane de Markov cache homogne (Xt ,Yt )t=1
graphe de dpendance est donn par la figure 3.11. Les probabilits de transition de la
chane P(Xt+1 = xt+1 |Xt = xt ) correspondent aux intractions de cardinal deux de lnergie
U, et les probabilits des observations conditionnellement aux tats P(Yt = yt |Xt = xt ) sont
donnes par les vraisemblances locales associes U :
P(yt /xt ) =
P(xt+1 |xt ) =

1
exp (t) (Sxt , yt )
Ztl

1
exp
Ztp

(6.28)

{xt+1 a xt } g(xt+1 , xt )

(6.29)

o Ztl et Ztp sont des constantes de normalisations.


Lalgorithme de Viterbi [Viterbi, 1967], qui est une mthode doptimisation dterministe adapte aux problmes causaux, permet de trouver la squence optimale dobjets de la
chane de Markov cache. Il peut tre utiliser avec des distributions non normalises, ce qui
p
vite le calcul des constantes de normalisation Ztl et Zt pour chaque lment t de la chane.
Notons t (i), la probabilit du chemin optimal qui permet datteindre ltat i du t ieme support
de la squence, connaissant les observations Y (t (i) reprsente la probabilit du MAP de
la sous-chane finissant t avec Xt fix).
t (i) = max P(y1 , ..., yt1 , X1 = x1 , ..., Xt1 = xt1 , Xt = i)

(6.30)

x1 ,...,xt1

Par rcurrence, t+1 peut tre dtermin partir de t :


t+1 ( j) = max P(y1 , ..., yt , X1 = x1 , ..., Xt = xt , Xt+1 = j)
x1 ,...,xt

= max P(Xt+1 = j|Xt = xt ) max P(y1 , ..., yt , X1 = x1 , ..., Xt = xt )


xt

x1 ,...,xt1

= max ai j P(yt |Xt = i) max P(y1 , ..., yt1 , X1 = x1 , ..., Xt1 = xt1 , Xt = i)
i

x1 ,...,xt1

135
Nous obtenons ainsi la relation suivante :
t+1 ( j) = max [ai j Li (yt )t (i)]
i

(6.31)

o Li (yt ) = P(yt |Xt = i) reprsente la vraisemblance locale du t ieme elment de la chane,


et ai j , la probabilit de transition de ltat i vers ltat j. On note t+1 ( j), largument qui
correspond la valeur maximale de t+1 ( j) :
t+1 ( j) = arg max [ai j Li (yt )t (i)]
i

(6.32)

Lalgorithme de Viterbi consiste :


A t = 1 : initialiser 1 (i) = P(X1 = i), i (dans notre cas, on prend les P(X1 ) quiprobables).
Pour t = 2...N : calculer et mmoriser dans une table le couple ( t ( j), t ( j)), j.
calculer le MAP donn par : xbN = arg maxi Li (yN )N (i)
Lire le chemin optimal dans la table par : xbt = t+1 (b
xt+1 ), pour t = N 1, ..., 1.

F IG . 6.12 Rsultats sur lhtel de ville dAmiens avec diffrents pas de discrtisation de
lespace dtat
Lagorithme de Viterbi procde par une recherche exhaustive de la solution en parcourant lensemble des solutions pour chaque lment de la chane. Les temps de calcul
dpendent donc de la taille de lespace des configurations. Il est important de discrtiser
pertinement cet espace afin davoir des temps de calcul raisonnables et dviter les problmes de saturation de mmoire. La figure 6.12 montre les rsultats obtenus sur lhtel de
ville dAmiens avec diffrents pas de discrtisation. La valeur du pas de discrtisation est directement lie au degr de prcision (en mtre) de la modlisation par rapport aux donnes.
Sur la figure de droite, le pas de discrtisation est trs fin (0, 2 mtre), et par consquent le
rsultat est trs prcis. Cependant, les temps de calcul sont extrmement levs (environ 13
heures). Comparativement aux temps de calcul mis travers loptimisation par MCMC, ce
rsultat nest clairement pas intressant, tout comme celui du centre de la figure. Par contre,

136

Annexes

sur le rsultat de gauche, on obtient une solution, certes trs gnrale (2.5 mtres de prcision), mais avec des temps de calcul trs faibles (de lordre dune seconde). Il faut noter
que, quel que soit le pas choisi, les rsultats sont trs bien rgulariss.
Pour rsumer, cet algorithme est intressant pour obtenir rapidement une modlisation
approche (i.e. avec un pas de discrtisation de lordre de deux mtres) sous des temps de
calcul trs faibles (de lordre dune seconde pour un btiment). Ces performances pourraent
tre clairement amliores par une restriction intelligente de lespace des configurations (par
exemple, en estimant les hauteurs des objets par un procd analogue celui prsent dans
lannexe B-2. Le pas de discrtisation ne doit cependant pas tre trop important (suprieur
trois mtres) sinon on risque dobtenir des modlisations trs rrones avec notamment une
mauvaise reconnaissance des formes de toit.
On peut notamment imaginer utiliser les rsultats de cet algorithme comme une bonne
initialisation pour un modle dterministe plus complexe. Les rsultats permettent, en effet,
de donner le type de modles des objets ainsi quune estime des valeurs des paramtres.

137

F - Rsultats supplmentaires
Cette annexe prsente des rsultats subsidiaires relatifs diffrentes parties du manuscrit. La figure 6.14 illustre les resultats de la mthode dextraction des caricatures de btiments par agencement de rectangles (prsente dans la partie 2.1) sur les zones test A,
B et C. La figure 6.13 montre un rsultat du processus automatique complet sur une zone
dAmiens non localement plate partir dun MNE PLEIADES. Les autres figures prsentent
des rsultats du processus de reconstruction 3D par extraction manuelle des supports 2D
partir de MNE PLEIADES 0, 7 mtre (Figures 6.15, 6.16 et 6.17), de MNE ariens 0, 25
mtre (Figures 6.18 et 6.19) et de MNE ariens 0, 1 mtre permettant la reconstruction des
superstructures (Figure 6.20).

F IG . 6.13 Rsultat du processus automatique complet sur une zone dAmiens non localement plate partir dun MNE PLEIADES

138

Annexes

F IG . 6.14 Rsultats de lextraction des caricatures des btiments par agencement de rectangles sur les zones A, B et C.

139

F IG . 6.15 Reconstruction 3D du CHU de Rangueil (Toulouse) partir de simulations


PLEIADES et dune extraction manuelle des supports 2D.

140

Annexes

F IG . 6.16 Reconstruction 3D du quartier Saint-Michel de Toulouse partir de simulations


PLEIADES et dune extraction manuelle des supports 2D.

141

F IG . 6.17 Reconstruction 3D du centre-ville de Toulouse (zone du Capitole) partir de


simulations PLEIADES et dune extraction manuelle des supports 2D.

142

Annexes

F IG . 6.18 Reconstruction 3D du centre ville dAmiens partir dimages ariennes (0, 25


mtre) et dune extraction manuelle des supports 2D.

143

F IG . 6.19 Reconstruction 3D avec texturation des rsultats prsents sur les figures 6.16
et 6.18.

144

Annexes

F IG . 6.20 Reconstruction 3D dun btiment et de ses superstructures partir dimages


ariennes (0, 1 mtre) et dune extraction manuelle des supports 2D.

____________

RESUME
____________

Cette thse aborde le problme de la reconstruction tridimensionnelle de zones urbaines partir


d'images satellitaires trs haute rsolution. Le contenu informatif de ce type de donnes est
insuffisant pour permettre une utilisation efficace des nombreux algorithmes dvelopps pour des
donnes ariennes. Dans ce contexte, l'introduction de connaissances a priori fortes sur les zones
urbaines est ncessaire. Les outils stochastiques sont particulirement bien adapts pour traiter cette
problmatique.
Nous proposons une approche structurelle pour aborder ce sujet. Cela consiste modliser un
btiment comme un assemblage de modules urbains lmentaires extraits d'une bibliothque de
modles 3D paramtriques. Dans un premier temps, nous extrayons les supports 2D de ces modules
partir d'un Modle Numrique d' Elvation (MNE). Le rsultat est un agencement de quadrilatres
dont les lments voisins sont connects entre eux. Ensuite, nous reconstruisons les btiments en
recherchant la configuration optimale de modles 3D se fixant sur les supports prcdemment
extraits. Cette configuration correspond la ralisation qui maximise une densit mesurant la
cohrence entre la ralisation et le MNE, mais galement prenant en compte des connaissances a
priori telles que des lois d'assemblage des modules. Nous discutons enfin de la pertinence de cette
approche en analysant les rsultats obtenus partir de donnes satellitaires (simulations PLEIADES).
Des exprimentations sont galement ralises partir dimages ariennes mieux rsolues.
Mots cl : reconstruction 3D, zones urbaines, images satellitaires, approche structurelle, recuit
simul, MCMC, Modle Numrique d'Elvation.

_______________

ABSTRACT
_______________

This thesis tackles the problem of the 3D building reconstruction from very high resolution satellite
images. The information provided by this kind of data are not accurate enough to allow an efficient use
of the varied algorithms developped in an aerial framework. In this context, it is necessary to introduce
strong prior knowledge related to the urban areas. The stochastic tools are especially well adapted to
deal with this problem.
A structural approach is proposed to address this topic. It consists in modeling a building through an
assembling of basic urban structures which are extracted fom a library of 3D parametric models. First,
the 2D supports of these structures are extracted from a Digital Elevation Model (DEM). The result is a
quadrilateral layout of which the neighboring elements are connected. Then, the buildings are
reconstructed by finding the optimal configuration of 3D models which are fixed onto the extracted
supports. This configuration corresponds to the realization which maximizes a density. The last one
measures the coherence between the realization and the DEM, and takes into account prior
knowledge such as the assembling law of the structures. Finally, we discuss on the relevance of this
approach by analysing the obtained results from satellite data (PLEIADES simulations). Experiments
are also carried on from higher resolution aerial images.
Keywords : 3D reconstruction, urban areas, satellite images, structural approach, simulated
annealing, MCMC, Digital Elevation Model.

Vous aimerez peut-être aussi