Académique Documents
Professionnel Documents
Culture Documents
THESE
pour obtenir le grade de
Docteur de lEcole des Mines de Paris
Spcialit Gostatistique
Jury
M.
Michel SCHMITT
Prsident
M.
M.
Henri MAITRE
Patrick PEREZ
Rapporteurs
M.
M.
M.
M.
Mme
M.
Xavier DESCOMBES
Christian LANTUEJOUL
Marc PIERROT-DESEILLIGNY
Anuj SRIVASTAVA
Josiane ZERUBIA
Jean-Philippe CANTOU
Examinateurs
Examinateur invit
Remerciements
Jai eu la chance dtre bien encadr durant ces trois annes. Je le dois en premier lieu
Josiane Zerubia qui jexprime ma reconnaissance. Je la remercie de mavoir accueilli dans
le projet Ariana. Je remercie Marc Pierrot-Deseilligny pour ses nombreux conseils aviss et
sa disponibilit. Merci Didier Boldo pour laide prcieuse quil ma apporte au quotidien.
Je remercie enfin Xavier Descombes, la personne qui ma donn got la recherche. Il a su
mclairer et maider dans des moments importants.
Je tiens remercier Michel Schmitt de mavoir fait lhonneur de prsider le jury de
thse. Je souhaite exprimer ma gratitude Henri Matre et Patrick Prez qui ont accept
avec gentillesse dtre rapporteurs. Ils ont pris le temps de lire mon travail avec attention
et leurs analyses ont t prcieuses. Je remercie Christian Lantuejoul et Anuj Srivastava
davoir accept dtre examinateurs. Les discussions avec eux ont t fructueuses. Merci
Jean-Philippe Cantou pour avoir suivi mes travaux durant ces trois annes depuis Toulouse.
Je remercie le CNES et lIGN de mavoir accord une bourse de financement.
Merci aux membres du projet Ariana et du laboratoire Matis pour leur convivialit. En
particulier, ceux qui mont support dans leur bureau : Guillaume, Maria, Olivier, Gilles,
Frdric, Clment, Nesrine, Mathieu, Mlanie, Emilie, Arnaud. Un grand merci tout particulirement Guillaume pour tous les bons moments passs en B121.
Cette thse naurait pas vu le jour sans laide dun certain nombre de personnes . Merci
Mathias de mavoir expliqu et confi ses codes. Merci David, Grgroire et Mlanie pour
toutes les fois o ils mont fourni des donnes et lanc des calculs. Merci Mathieu pour les
discussions techniques et sa bonne humeur. Merci Pierre et Yann pour leur contribution
ce travail au travers de leur stage dingnieur. Merci Corinne, Alain et Franois pour leur
disponibilit et leur gentillesse sur les questions pratiques. Merci aux personnes qui mont
aid dans la rdaction du manuscrit : Aurlie, Emilie, Mlanie, mon pre.
Enfin et surtout, je remercie toute ma famille pour son soutien.
Avant propos
Cadre de la thse
Les travaux prsents dans cette thse ont dbut le 1 er octobre 2004. Ils ont t mens
sous la direction de Josiane Zerubia, Directrice de Recherche lINRIA, de Marc PierrotDeseilligny, Directeur de Recherche lIGN, et de Xavier Descombes, Charg de Recherche
lINRIA. Cette thse a t effectue au sein du laboratoire Matis de lIGN, et du projet
Ariana commun lINRIA et lI3S. Le laboratoire Matis est spcialis dans les problmes
de strorestitution. Un de ses objectifs est notamment la mise en production de mthodes
automatiques et semi-automatiques de modlisation tridimensionnelle denvironnements urbains. Le Projet Ariana aborde les problmes inverses en tldtection par des approches
variationnelles et stochastiques. Pendant la dure de sa thse, lauteur a bnfici dune
bourse CNES, cofinance par lIGN.
Le sujet de cette thse a t mis en place par lINRIA, lIGN et le CNES. Lobjectif
initial consistait tudier la complmentarit des travaux de thses mens, dune part par
Mathias Ortner au sein du projet Ariana entre 2001 et 2004 sur lextraction automatique
de btiments, et dautre part, par Hassan Jibrini raliss entre 1998 et 2002 au laboratoire
Matis en collaboration avec lENST sur la reconstruction 3D de btiments. Les donnes
utilises (des simulations PLEIADES, fournies par le CNES) devaient galement permettre
dvaluer le potentiel des futurs satellites PLEIADES, dans le cadre du programme ORFEO, en matire de reconstruction 3D denvironnements urbains. Le principal intrt qui
se dgage de cette tude rside dans la reconstruction de zones urbaines sans lutilisation
de base de donnes 2D. Cette perspective est particulirement intressante pour la modlisation des villes ne possdant pas de cadastre, situation rpandue dans les pays en voie de
dveloppement.
Organisation du manuscrit
Le manuscrit prsente un processus de modlisation tridimensionnelle denvironnements urbains. Il est articul de manire linaire. Le chapitre 1 introduit la problmatique de
notre tude. Le chapitre 2 expose le processus dextraction des objets urbains. Le chapitre 3
dtaille la reconstruction tridimensionnelle de ces objets. Le chapitre 4 prsente et analyse
les rsultats obtenus.
Le droulement des recherches na toutefois pas t linaire. Des modles intermdiaires de reconstruction 3D et des mthodes doptimisation alternatives ont t dvelopps
4
au cours de la thse. Ceux-ci sont rsums dans les annexes du manuscrit.
Les notations utilises dans le manuscrit sont indpendantes entre les diffrents chapitres.
Introduction
1.1 Problmatique . . . . . . . . . . . . . . . . . . . . .
1.1.1 Les enjeux de la modlisation urbaine en 3D
1.1.2 Lapport de la tldtection . . . . . . . . . .
1.2 Etat de lart . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Les donnes . . . . . . . . . . . . . . . . . .
1.2.2 Lautomaticit . . . . . . . . . . . . . . . .
1.2.3 Les zones urbaines . . . . . . . . . . . . . .
1.2.4 Les modlisations 3D . . . . . . . . . . . . .
1.2.5 Les approches . . . . . . . . . . . . . . . . .
1.2.6 Bilan . . . . . . . . . . . . . . . . . . . . .
1.3 Le contexte de notre tude . . . . . . . . . . . . . .
1.3.1 Donnes spatiales et simulations PLEIADES
1.3.2 Vers de lurbain dense en automatique . . . .
1.4 La stratgie . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Lapproche structurelle . . . . . . . . . . . .
1.4.2 Les outils stochastiques . . . . . . . . . . .
1.4.3 Dmarche gnrale . . . . . . . . . . . . . .
analyse
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
32
33
33
38
39
39
43
.
.
.
.
47
48
48
51
53
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
8
8
9
10
10
14
16
17
20
20
21
21
25
26
26
27
30
31
3.3
3.4
3.2.1 Vraisemblance . . . . . . .
3.2.2 A priori . . . . . . . . . . .
Optimisation . . . . . . . . . . . .
3.3.1 Echantillonneur RJMCMC .
3.3.2 Noyaux de propositions . .
3.3.3 Recuit simul . . . . . . . .
3.3.4 Des mthodes alternatives .
Estimation des paramtres . . . . .
3.4.1 Paramtres de la densit . .
3.4.2 Paramtres de loptimisation
Evaluation
4.1 Evaluation qualitative . . .
4.2 Evaluation quantitative . .
4.3 Influence du recuit simul .
4.4 Influence des supports 2D .
4.5 Les limites dutilisation . .
4.6 Extension du contexte . . .
Conclusion
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
56
58
60
61
63
66
69
72
72
73
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
75
76
84
86
91
94
96
101
Bibliographie
6
Annexes
A - Processus 3D paramtrique partir demprises rectangulaires .
B - Processus 3D par squeltisation des artes fatires . . . . . .
C - Rappel sur les chanes de Markov . . . . . . . . . . . . . . .
D - Calcul des noyaux de propositions . . . . . . . . . . . . . . .
E - Processus 3D aprs simplification squentielle des supports 2D
F - Rsultats supplmentaires . . . . . . . . . . . . . . . . . . . .
107
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
117
118
124
128
133
134
137
Chapitre 1
Introduction
Introduction
1.1 Problmatique
La moiti de la population mondiale vit, aujourdhui, dans les villes. En 1950, moins
de 30% des hommes habitaient en milieu urbain. Daprs une tude rcente des Nations
Unies1 , ils seront plus de 60% en 2030. Le milieu urbain devient progressivement lenvironnement naturel de lhomme. Devant ce bouleversement dmographique, connatre et
matriser lespace urbain est un enjeu essentiel. En particulier, la reconstruction vectorielle
tridimensionnelle des villes tend devenir un outil de plus en plus important dans de nombreux secteurs, quils soient publics, industriels ou militaires.
1.1 Problmatique
10
Introduction
11
Monoscopie
La monoscopie consiste extraire des informations tridimensionnelles partir dune
seule image. [McGlone et Shufelt, 1994] et [Lin et Nevatia, 1998] proposent des approches
reposant sur le "shape from shadow", cest--dire en utilisant les informations inhrentes
lombre des objets. Ce type de procds fournit des modlisations assez pauvres, o les
btiments sont reprsents par des parallpipdes rectangles dont la hauteur est estime en
fonction de la projection de lombre dans limage. De plus, en considrant lombre comme
unique information tridimensionnelle, ces mthodes manquent de robustesse. Aujourdhui,
les systmes base de monoscopie tendent disparatre.
Stroscopie
La stroscopie est le procd de rfrence, du moins celui qui a focalis lattention des
chercheurs durant la dernire dcennie. Cette technique permet de calculer le relief dune
scne partir de deux images prises des points de vue diffrents. La vision humaine utilise
ce processus et permet lhomme dvoluer naturellement dans un environnement en ayant
cette notion de distance par rapport aux objets qui lentourent. Ce procd doit grer deux
difficults principales :
La mise en correspondance qui consiste retrouver les pixels homologues dans le
couple dimages (galement appele appariement). Cette opration est loin dtre
vidente et fait appel des mesures de corrlation parfois trs complexes. Les algorithmes doivent faire face aux changements de luminosit, aux bruits, aux dformations des images ou bien encore aux zones homognes.
Les zones doccultation qui rendent localement impossible la mise en correspondance
puisquun point de la premire image na pas dhomologue dans la seconde. Or ces
points sont frquents en stroscopie et obligent les algorithmes introduire des informations a priori.
Le paramtre principal lors dune prise de vue stroscopique est le rapport B/H (base sur
hauteur), o B reprsente la distance entre les deux centres de prise de vue, et H, la hauteur
entre la base des prises de vue et la scne observe (voir Figure 1.1). Ce rapport permet de
dterminer la prcision altimtrique thorique du relief en fonction de la prcision planimtrique. La valeur de ce rapport soulve un compromis entre la difficult dappariement et la
prcision altimtrique. En thorie, un B/H faible (i.e. deux images dont les prises de vue
sont trs proches) permettra une mise en correspondance relativement facile en restreignant
notamment les zones doccultation, cependant la prcision altimtrique sera mauvaise. Et
inversement. En pratique, ce principe nest pas toujours linaire et lon observe parfois des
intervalles de B/H clairement avantageux.
Ce procd, qui fournit des informations 3D fiables, a t utilis dans de nombreux
travaux. Les algorithmes proposs doivent cependant grer les zones doccultation. Face
ce problme, certains optent pour une modlisation 3D simplifie. Cest le cas notamment
de [Paparoditis et al., 1998] proposant uniquement des toits plats ou [Dang, 1994] reconstruisant des btiments parallpipdiques. Dautres, comme [Gruen, 1998; Gruen et Wang,
1998], voluent dans un contexte semi-automatique, cest--dire en permettant un oprateur dintervenir et de rectifier les erreurs de reconstructions. [Fuchs, 2001] et [Jibrini,
2002] ont propos des modles intressants permettant des reconstructions relativement
complexes.
12
Introduction
Multiscopie
La multiscopie est une extension de la stroscopie, dans le cas o lappariement est
ralis avec plus de deux vues. Cest aujourdhui la mthode dextraction dinformation 3D
la plus efficace. Ce procd permet de limiter les problmes doccultation et daccrotre la
prcision du relief. La multiscopie est notamment trs utile pour la dtection et la texturation
de faades grce aux nombreux angles de vue quelle offre. La plupart des travaux raliss
proposent des modlisations 3D relativement dtailles, avec des formes de btiments gnriques [Willuhn et Ade, 1996; Henricsson, 1998; Baillard et Zisserman, 1999; Heuel et al.,
2000; Scholze et al., 2002; Taillandier, 2004; Durupt et Taillandier, 2006]. Par ailleurs, une
partie importante des mthodes mises en place introduit de fortes connaissances a priori sur
les structures urbaines afin de rduire les temps de calcul et proposer des modlisations 3D
plus simples, comme par exemple [Jaynes et al., 1997; Collins et al., 1998; Fischer et al.,
1998; Noronha et Nevatia, 2001].
LASER
Contrairement ce qui prcde, les donnes LASER nutilisent pas une gomtrie
image. En effet, ces donnes ont un chantillonnage spatial irrgulier, ce qui rend les traitements plus difficiles que dans le cas de limagerie optique. Le second dfaut majeur est le
cot dacquisition, qui reste lev malgr le dveloppement important du LASER ces dix
dernires annes. Malgr cela, ces donnes possdent des caractristiques trs intressantes.
Les principales qualits du LASER rsident dans la prcision et la fiabilit des points relevs. Une caractristique galement profitable est le phnomne dit de double cho : le
signal mis est rflchi par la vgtation, mais galement par le sol aprs avoir travers
cette dernire, ce qui est particulirement intressant pour lextraction de la vgtation et
la discrimination bti / vgtation. Plusieurs mthodes de modlisation urbaine 3D utilisant
des donnes LASER ont t proposes [Haala et Brenner, 1999; Maas et Vosselman, 1999;
Rottensteiner et Briese, 2002; Bretar, 2006]. La prcision des points LASER permet, en
13
14
Introduction
-dire dans lesquels sont introduites des contraintes planaires permettant de modliser les
facettes de toits et de faades.
Il existe un deuxime produit driv : lorthoimage. Lorthoimagerie consiste "redresser"
une image de sorte la rendre superposable une carte. Les orthoimages sont notamment
trs utiles pour la dtection des contours des btiments, comme on peut le constater dans
[Vinson et Cohen, 2002]. Le calcul des orthoimages est fond sur celui des MNE. Par consquent, les orthoimages souffrent des mmes problmes que les MNE en matire de mise en
correspondance.
1.2.2 Lautomaticit
Un critre majeur dans la classification des mthodes est le niveau dautomaticit. Celuici caractrise le degr dintervention de loprateur mais galement lapport ventuel de
donnes cadastrales. En effet, les bases de donnes 2D fournissent une information structurelle trs forte. Lutilisation du cadastre comme une donne source change fondamentalement lapproche mettre en uvre. Nous prsentons trois degrs dautomaticit de processus : semi-automatique, automatique avec cadastre et automatique sans cadastre.
Processus semi-automatiques
Les mthodes semi-automatiques sont, lheure actuelle, les seules capables de produire grande chelle des modlisations 3D urbaines avec un taux derreur trs faible. Il
existe plusieurs processus particulirement intressants. Cest le cas du CC-modeler, dvelopp par [Gruen et Wang, 1998], o loprateur saisit les points correspondant au bord
du btiment, puis ceux correspondant des points cl de la topologie du toit comme les
extrmits dartes fatires. Le systme peut alors reconstruire le btiment sous une forme
polydrique. Cependant, ce processus ne gre pas les points errons (i.e. les erreurs ou inexactitudes de loprateur). Propos par [Flamanc et Maillet, 2005], BATI3D est un systme
interactif permettant le partitionnement du cadastre, voire sa modification, par un oprateur.
Les btiments sont ensuite reconstruits automatiquement par une des diffrentes mthodes
15
incorpores au systme. [Li et al., 1999; Nevatia et Price, 2002] proposent un systme relativement complet o loprateur est peu sollicit comparativement aux systmes prcdents.
Une extension de ce systme a t propose, permettant un niveau de reconstruction 3D trs
dtaill grce la modlisation dlments structuraux urbains tels que des fentres, des
colonnes ou bien encore des pontons [Lee et Nevatia, 2003].
Processus automatiques avec donnes cadastrales
La reconstruction dune zone urbaine sans lintervention dun oprateur est un problme complexe. Cest pourquoi certains processus sappuient sur des donnes cadastrales
qui, quand elles existent, offrent une information structurelle trs forte sur les btiments. Le
cadastre fournit les emprises au sol des structures urbaines, ce qui permet de saffranchir
dune tape de focalisation/extraction des btiments. Le processus propos par [Brenner
et al., 2001] est fond sur une classification des diffrentes jonctions triples par intersections des plans. Le rsultat est convainquant, malgr une modlisation 3D trs simplifie
due notamment au fait que les ventuelles discontinuits altimtriques ne sont pas prises
en compte. [Jibrini, 2002] propose une mthode gnrant des hypothses de plans par des
transformes de Hough 3D. Lintersection des plans forment alors un ensemble de facettes
possibles parmi lesquelles on doit choisir la meilleure selon des critres de complexit sur
la forme des toits, et dattache aux donnes. Bien que les modlisations 3D soient trs gnriques, le processus souffre dun problme combinatoire puisque le nombre de plans dtects et le nombre de facettes possibles sont extrmement levs. Il existe galement beaucoup
dautres processus, par exemple [Suveg et Vosselman, 2001; Flamanc et al., 2003].
Processus automatiques
Cette catgorie soulve de nombreuses difficults de mise en uvre, puisquil faut
la fois localiser les btiments, extraire leur emprise au sol, et les reconstruire en 3D. La
majorit des mthodes proposes dans la littrature se situe cependant dans ce contexte. Les
processus tout automatiques ayant un taux faible derreurs constituent un des principaux
objectifs de demain dans le domaine. Ils permettraient de produire grande chelle des
modlisations 3D urbaines sans cot oprateur.
Dans le contexte tout automatique, il faut distinguer deux types de processus : ceux qui
utilisent une focalisation des btiments, et ceux qui utilisent une extraction des btiments.
La focalisation et lextraction sont des termes proches, mais lutilisation de lune ou lautre
a des consquences diffrentes sur lapplicabilit et lautomaticit du processus.
Focalisation des emprises Les processus fonds sur une focalisation demprises permettent de reconstruire une une des structures urbaines connexes. Pour ce faire, il est
ncessaire de dfinir a priori une zone englobante dans laquelle se trouve une unique structure urbaine connexe. Ces zones englobantes de focalisation sont dfinies de manire automatique. En pratique, le processus fonctionne pour les btiments relativement bien isols,
principalement sur des zones pri-urbaines, mais montre ses limites sur des zones urbaines
denses o la densit leve des structures urbaines ne permet pas un bon fonctionnement
de lalgorithme de focalisation. Les travaux utilisant cette stratgie sont nombreux, on peut
citer notamment [Baillard et Zisserman, 1999; Scholze et al., 2002; Taillandier, 2004].
16
Introduction
Extraction des emprises Les processus fonds sur une extraction des emprises ne
procdent pas "btiment par btiment" comme pour un procd de focalisation, mais ils
traitent des zones entires. Cela est ralis gnralement en deux tapes : extraction des
emprises de btiments dune scne (sous formes de polygones dans la plupart des cas), puis
reconstruction en 3D des btiments partir des emprises extraites. Les mthodes dextraction des emprises dpassent la simple notion de btiments isols et prennent en compte les
interactions existantes entre btiments voisins, voire lots de btiments. Par consquent, ces
mthodes sont bien adaptes aux zones denses. Cependant, elles sont plus complexes et plus
difficiles mettre en uvre.
[Oriot, 2003; Bailloeul et al., 2005] utilisent des contours actifs avec des contraintes linaires. Ces processus rencontrent cependant des problmes relatifs linitialisation des
contours. De plus, ce type doutil variationnel nest pas particulirement bien adapt lextraction de formes rectilignes. [Vestri, 2000] propose un algorithme intressant de vectorisation des contours de btiments pralablement extraits partir dune segmentation de MNE.
Les travaux proposs par [Vinson et Cohen, 2002] et [Ortner et al., 2007] permettent dextraire les emprises sous forme dun agencement de rectangles, le premier par un modle de
rectangle dformable, le second en utilisant des processus ponctuels marqus qui sont des
outils probabilistes sans contrainte dinitialisation.
17
maisons espaces entre elles) et les habitats groups de style maisons mitoyennes. La densit de btiments est relativement faible, et bien souvent, une part importante de vgtation
est prsente (voir figure 1.3-(centre)). La variabilit des btiments est peu prononce, tant au
niveau de la forme des toits que de la hauteur des constructions. Les difficults gnres par
ce type de zones sont donc plus faciles traiter que celles gnres par les zones urbaines
denses.
Beaucoup de processus automatiques sans donnes cadastrales ont t tests sur ce type
de zones, notamment [Baillard et Zisserman, 1999; Fuchs, 2001; Scholze et al., 2002;
Taillandier, 2004]. Le fait que les btiments soient principalement de petites structures assez
simples et isoles, permet en effet dextraire les emprises assez facilement.
Zones dactivit et dhabitats collectifs
Les zones dactivit et dhabitats collectifs sont caractrises par un mme type de
constructions : des btiments volumineux, possdant souvent des toits plats (de type hangars, entrepts ou grands immeubles), et gnralement espacs entre eux (voir figure 1.3(gauche)). Ces zones sont, en thorie, les moins difficiles reconstruire. Elles sont souvent
utilises pour tester les modles dits prismatiques, cest--dire estimant les toits par des
plans horizontaux. Cest le cas des travaux mens par [Collins et al., 1998; Lin et Nevatia,
1998; Noronha et Nevatia, 2001; Vinson et Cohen, 2002].
18
Introduction
Prismatique
Les modlisations prismatiques se caractrisent par un degr de libert planimtrique
important puisque les emprises des btiments sont des formes polygonales quelconques,
mais cependant avec une description altimtrique trs simplifie : les formes de toits possibles sont, en effet, restreintes la plus simple existante : la forme plate. La figure 1.4-(a)
schmatise cette modlisation. Une reconstruction prismatique est donc intressante lorsque
lon cherche une bonne description planimtrique avec une simple estimation des hauteurs
de btiments, et peut savrer efficace pour la description des zones dactivit ou lorsque
les donnes sont faiblement rsolues. A cet effet, on peut citer les processus mis en uvre
par [Collins et al., 1998; Lin et Nevatia, 1998; Noronha et Nevatia, 2001; Vinson et Cohen,
2002].
Paramtrique
Une reconstruction paramtrique fournit des formes de btiments assez simples, et par
consquent, une description relativement gnrale des zones urbaines. Elle apporte, cependant, davantage de prcision que les modlisations prismatiques sur la forme de la toiture
19
en proposant bien souvent des toits bi-pentes, quatre-pentes et des attaques en V. Certains
processus consistent choisir parmi une collection dhypothses de formes simples de toits
comme [Weidner et Forstner, 1995; Garcin et al., 2001; Suveg et Vosselman, 2001; Flamanc
et Maillet, 2005], dautres utilisent des algorithmes de squeltisation des emprises afin de
modliser les artes fatires [Gruen et Wang, 1998]. Les modlisations paramtriques sont
intressantes pour traiter des donnes faible rsolution : la simplicit des modles ncessite, en compensation, un apport de connaissances a priori sur les structures urbaines permettant de faire face au manque dinformation des donnes. Par ailleurs, en modlisant un
btiment par un jeu simple de paramtres, la combinatoire des processus est peu complexe,
ce qui leur confre bien souvent de la robustesse.
Structurelle
Les modlisations structurelles dcrivent un btiment comme un assemblage de modules lmentaires simples. Ces modules, qui sont souvent eux-mmes des modles paramtriques, reprsentent par exemple des terminaisons de btiments (terminaison droite,
attaque en V,...) ou des jonctions entre modules (jonctions en "L", en "T",...). Les modlisations structurelles sapparentent ainsi un jeu de "LEGO". L encore, ce type de
modlisation est adapt aux donnes faiblement rsolues. Il constitue un bon compromis
entre les modlisations paramtriques et les modlisations polydriques du point de vue de
la gnricit. Il ncessite nanmoins la mise en place de lois grammaticales, cest--dire
de contraintes sur lassemblage des modules entre eux. [Fischer et al., 1998] propose une
reconstruction structurelle relativement simple, nutilisant quune seule sorte de modules
(des coins) pour gnrer des hypothses de btiments. [Fuchs, 2001] prsente un processus
plus abouti, avec notamment une grammaire de modles plus complte, formalis par une
recherche disomorphisme de sous-graphes avec tolrance derreur. La complexit algorithmique est cependant assez importante.
Polydrique
Les modlisations polydriques sont les plus utilises car elles sont trs gnriques et
permettent de reconstruire une large gamme de structures urbaines sous forme de facettes
planes connexes. Cette importante gnricit impose des contraintes sur la qualit des donnes, en particulier une trs bonne rsolution. Beaucoup de mthodes [Henricsson, 1998;
Ameri, 2000; Heuel et al., 2000; Taillandier, 2004] ne limitent pas a priori les formes
reconstruire. Cela engendre cependant une complexit algorithmique trs importante. Dans
les travaux de [Baillard et Zisserman, 1999], la modlisation est obtenue par intersections
de demi-plans qui sont gnrs partir de segments 3D (les demi-plans potentiels tournent
autour des segments 3D). Celle propose par [Scholze et al., 2002] est relativement similaire : des segments 3D sont extraits, puis groups en facettes travers une interprtation
smantique. La modlisation de [Heuel et al., 2000] est fonde sur la dtection de coins
3D ( trois artes) constituant la base de la structure topologique. [Ameri, 2000] extrait des
plans 3D qui sont intersects selon un diagramme de Vorono modlisant les interactions
entre plans voisins. Ces mthodes fournissent, en gnral, des rsultants convaincants. Cependant, quand les btiments ont des formes relativement simples, ce type de processus
nest pas adapt en raison des temps de calcul importants mis pour explorer lespace des
20
Introduction
solutions.
1.2.6 Bilan
Dans ce paragraphe, nous nous sommes penchs sur les mthodes existantes et leurs
caractristiques. Cette tude fait ressortir deux points importants :
21
Des contextes dtude trs varis. Comme nous venons de le voir, il existe beaucoup de critres permettant de classer les mthodes existantes. En consquence, il
est souvent difficile de comparer les mthodes entre elles. Plus prcisment, pour effectuer une comparaison pertinente entre deux systmes, il parat ncessaire que les
donnes soient identiques (ou du moins dune qualit quivalente, principalement la
rsolution), que les scnes reconstruites soient dun mme degr de complexit, et
enfin que le niveau dautomaticit soit le mme.
Deux grandes familles de processus. Bien quil soit difficile de comparer les mthodes entre elles, on peut distinguer deux grandes familles de processus. La premire
utilise des donnes de basse qualit et fournit des modlisations 3D peu gnriques,
partir de librairies de modles, en utilisant des approches de type "top-down". La seconde famille, spcifique des donnes de meilleure qualit, propose des reconstructions gnriques fondes sur des approches "bottom-up". Ces deux familles illustrent
bien le compromis existant entre la gnricit des modlisations et la robustesse des
processus.
22
Introduction
vs 300 pour les images ariennes fournies par le capteur IGN). Lacquisition des images
satellitaires optiques est galement davantage dpendante des conditions mtorologiques,
principalement de la couverture nuageuse.
Les satellites PLEIADES
Le projet PLEIADES est une constellation de deux satellites offrant au nadir une rsolution spatiale de 0, 7 mtre en panchromatique pour une fauche de 20 km. Ils disposeront de
quatre bandes spectrales (bleue, verte, rouge et proche infra rouge) avec une rsolution de
2,8 mtres. Cette constellation, prvue oprationnellement pour 2010, permettra un accs
journalier en tout point du globe. Par ailleurs, ces satellites offriront des capacits dacquisition stroscopique particulirement intressantes. Des prises de vue tri-stroscopiques
le long de la trace (i.e. ralises quasi-simultanment) seront possibles, avec un rapport B/H
pouvant varier entre 0, 15 et 0, 8.
Dans le cadre de cette thse, des simulations PLEIADES fournies par le CNES sont utilises. Ces simulations ont t gnres partir dimages ariennes, dgrades afin de respecter les caractristiques PLEIADES (rsolution, rapport signal sur bruit,...). Nous disposons
de deux jeux de simulations : le jeu original 0, 7 mtre de rsolution, un autre 0, 5 mtre 2 .
Les images tri-stroscopiques simules ont un rapport B/H valant 0, 2, ce qui facilite la
mise en correspondance, mais confre une prcision altimtrique moyenne.
Le contenu informatif des images PLEIADES
La rsolution sub-mtrique des satellites PLEIADES permet denvisager de nombreuses
applications en tldtection, en particulier la reconstruction en 3D de btiments. Il est important danalyser le contenu informatif des images PLEIADES afin den connatre le potentiel en matire de modlisation urbaine 3D.
De manire gnrale, la rsolution de ces images ne permet pas lextraction des superstructures de toit (chemine ou chien-assis), des dcrochements de toit ou des petits pans de toit.
Elle permet cependant dextraire la forme gnrale des toits, i.e. les principaux plans qui
composent une toiture. La figure 1.5 montre deux btiments prsents travers trois jeux
de donnes. Le premier jeu correspond des images ariennes 0, 25m, images partir
desquelles ont t gnres les simulations PLEIADES. Les deux autres jeux reprsentent
respectivement les simulations PLEIADES 0, 5m et 0, 7m. On peut noter une nette dgradation de la qualit image entre le jeu arien et les deux jeux de simulations PLEIADES.
Cette dgradation est notamment symbolise par la diffrence de qualit des superstructures de toits. Les chemines sont facilement identifiables sur le jeu arien (une quarantaine
de pixels pour une chemine), mais pas sur les jeux satellitaires (quelques pixels) o elles
apparaissent plutt comme du bruit au sein des principaux pans de toits. La diffrence de
qualit se manifeste galement lorsque lon cherche extraire des primitives de ces images,
telles que des segments 3D par lalgorithme de [Taillandier et Deriche, 2002]. Trs bruites,
les donnes satellitaires ne permettent pas dobtenir des segments 3D dintrt de manire
robuste.
2 Ces
deux jeux de simulations ont t fournis en 2004. A ce moment, la rsolution finale des satellites
PLEIADES navait pas encore t dfinie et une incertitude entre 0, 5 et 0, 7 mtre demeurait.
23
24
Introduction
F IG . 1.6 MNE associs aux donnes de la figure 1.5, gnrs par lalgorithme MICMAC
- IGN.
25
26
Introduction
1.4 La stratgie
Dans cette partie, nous dfinissons et justifions la stratgie choisie, et voquons brivement les diffrentes tapes permettant la mise en place de la mthode propose.
1.4 La stratgie
27
Par ailleurs, la modlisation structurelle est trs intressante en elle-mme travers son
aspect volutif (on choisit les types de modles constituant la bibliothque, on peut notamment ajouter ou enlever des types de modles en fonction de lapplication). Elle a galement
t peu exploite dans la littrature, ce qui rend intressant son approfondissement.
28
Introduction
(XMAP ) :
(1.1)
Formulation Baysienne
Pour mettre en place la loi a posteriori, on utilise gnralement une formulation Baysienne. La formule de Bayes permet dexprimer la loi a posteriori travers la loi marginale
des observations P(Y = y), la loi des observations conditionnellement X P(Y = y|X = x)
et la loi a priori P(X = x) :
P(X = x|Y = y) =
(1.2)
Les observations tant connues, la loi marginale des observations peut tre omise pour loptimisation :
P(X = x|Y = y) P(Y = y|X = x)P(X = x)
(1.3)
Pour rsumer, la loi a posteriori est directement proportionnelle au produit de deux lois : la
loi conditionnelle des observations, ou vraisemblance, qui mesure la cohrence des donnes
avec une ralisation x, et la loi a priori, qui impose des contraintes de rgularisation sur x.
Dans de nombreux cas, lhypothse dindpendance conditionnelle des donnes est ralise
afin de simplifier le calcul de la vraisemblance. En indiant par i les diffrents composants
de X, on a alors :
(1.4)
P(Y = y|X = x) = P(Yi = yi |Xi = xi )
i
Le cadre Markovien
Rechercher lestimateur du MAP est souvent un problme doptimisation trs difficile,
principalement d la complexit du calcul de la loi a priori. Le cadre Markovien permet
de simplifier cela en restreignant le problme doptimisation globale des problmes doptimisation locaux [Winkler, 1995; Li, 1995]. Concrtement, on contraint chaque lment
dune ralisation x une dpendance locale, cest--dire considrer quil est en interaction
uniquement avec les lments qui lui sont proches.
Cette notion de proximit se caractrise travers la mise en place dun systme de voisinage,
not V . La proprit de Markovianit de X se formule alors par lexpression suivante :
P(Xi = xi |X j = x j , i 6= j) = P(Xi = xi |X j = x j , j V (i))
(1.5)
1
exp U(x)
Z
(1.6)
o Z est une constante de normalisation dfinie par Z = x exp U(x), et U, une nergie
pouvant se dcomposer en une somme de potentiels, cest--dire dnergies dinteraction
entre lments voisins. Dune manire gnrale, la recherche de lestimateur du MAP peut
donc sapparenter un problme de minimisation nergtique.
1.4 La stratgie
29
30
Introduction
algorithmes rside dans le fait quils fournissent non pas une solution, mais un ensemble
dtats intressants.
Chapitre 2
32
Dans ce chapitre, nous prsentons le processus mis en place pour extraire les emprises
de btiments partir dun MNE. Dans le cadre de notre approche structurelle, lobjectif de
cette premire tape est de fournir les supports 2D (ou emprises) des modules urbains composant un btiment. Cela signifie que le rsultat attendu devra satisfaire certaines contraintes
relatives :
la nature des supports 2D - Ce doit tre des objets gomtriques facilement paramtrables, et de plus, chacun doit correspondre une partie spcifique dun btiment
afin de modliser au mieux les jonctions de toitures ou les discontinuits de hauteurs
de toits par exemple.
la connexion des supports entre eux - Les supports voisins doivent pouvoir se connecter parfaitement entre eux, cest--dire sans recouvrement surfacique. Cest un point
important qui permet dviter la prsence dartefacts, et galement de faciliter la mise
en place des lois dassemblage.
Ce problme est donc plus complexe quune simple extraction surfacique de btiments. Le
processus propos se dcompose en deux tapes. Premirement, nous extrayons des caricatures des emprises de btiments travers un agencement de rectangles. Pour cela, nous utilisons des travaux antrieurs fonds sur les processus ponctuels marqus. Une fois la forme
gnrale des emprises obtenue, un processus de rgularisation est appliqu afin davoir des
emprises plus prcises et mieux adaptes une approche structurelle, cest--dire des supports structuraux. Ainsi, cette seconde tape permet de transformer un agencement de
rectangles en objets plus complexes (en loccurrence des quadrilatres et triangles quelconques) qui sont connects entre voisins, puis de les diviser en supports possdant des
hauteurs de toit diffrentes.
(2.1)
Un processus ponctuel marqu est un processus ponctuel o chaque point est associ une marque, cest--dire des paramtres permettant de dfinir un objet. Un processus
ponctuel marqu est dfini sur U = K M o M est lespace des marques (dans notre cas,
lespace des paramtres du rectangle duquel on exclut le centre) :
M = [ , ] [Lmin , Lmax ] [lmin , lmax ]
2 2
(2.2)
nN
(K M)n
(2.3)
La figure 2.1 reprsente une ralisation dun processus ponctuel dans K, une ralisation dun
processus ponctuel marqu dans U, et un lment de U. Pour davantage de dtails sur les
processus ponctuels et leurs applications, le lecteur pourra consulter [Van Lieshout, 2000;
Descombes, 2004].
F IG . 2.1 Illustration dun processus ponctuel marqu - ralisation dun processus ponctuel
dans K (gauche), lment de U (avec (Xc ,Yc ) K, le centre du rectangle, (, L, l) M,
lorientation, la longueur et la largeur du rectangle) (centre), ralisation dun processus
ponctuel marqu dans U (droite).
34
dfinis travers des nergies. Ainsi, pour une configuration x C , la densit est donne
par :
h(x) = exp (Uext (x) +Uint (x) +Uexcl (x))
(2.4)
Ces trois termes nergtiques sont prsents brivement dans la suite. Pour plus de dtails,
le lecteur pourra consulter [Ortner, 2004; Ortner et al., 2007].
Terme dattache aux donnes Uext
Ce terme permet de mesurer la qualit dune configuration de rectangles connaissant les
donnes, en loccurrence un MNE. Il peut tre dcompos en une somme dnergies U d (.)
associes chaque objet de la configuration, cest--dire tel que U ext (x) = ux Ud (u). Ainsi,
pour chaque rectangle u x, une nergie locale dattache aux donnes est calcule grace
un algorithme fond sur la comparaison entre les discontinuits prsentes dans le MNE et
les contours du rectangle.
La figure 2.2-(a) prsente un extrait de MNE, ainsi quun rectangle sur lequel des coupes
ont t disposes. Afin de mesurer la qualit du positionnement du rectangle par rapport au
MNE, on extrait, sur chaque coupe, des points dintrt correspondant des discontinuits
du MNE (voir figure 2.2-(b)). Ces points dintrt sont dtects par un algorithme de simplification de profil dtaill dans [Ortner et al., 2007]. On vrifie ensuite la cohrence entre
ces points et le contour rectangulaire de lobjet en utilisant trois critres. Le premier critre
permet de calculer un taux de volume, cest--dire de vrifier si la surface dfinie par les
points dintrt a un recouvrement compatible avec celle du rectangle (voir la figure 2.2-(c)
- les lignes grises reprsentent des segments utiliss pour calculer le taux de volume). Le
second critre correspond un taux de moment, et permet de mesurer lorientation du rectangle relativement aux points dintrt (voir la figure 2.2-(d) - les lignes grises reprsentent
des segments utiliss pour calculer le taux de moment). Enfin, le troisime critre vrifie si
les points dintrt sont bien localiss relativement aux contours du rectangle (voir la figure
2.2-(e) - les points dintrt suffisamment proches des contours du rectangle sont entours).
F IG . 2.2 Energie dattache aux donnes : un extrait de MNE avec un rectangle propos (a),
points dintrt dtects (b), taux de volume (c), taux de moment (d), taux de localisation
(e).
F IG . 2.3 Energie interne : interactions dalignement (a), interactions de pavage (b), interactions de compltion (c)
36
38
2.1.3 Commentaires
La figure 2.6 prsente des rsultats obtenus partir de MNE de type PLEIADES, correspondant deux btiments de la ville dAmiens (France). De manire gnrale, ces rsultats
sont satisfaisants aussi bien du point de vue du recouvrement surfacique que de la localisation des faades. La figure 6.14, prsente en annexe F, montre les rsultats obtenus sur trois
zones urbaines denses de la ville dAmiens. Nous reviendrons plus en dtail sur la qualit
de ces rsultats dans le chapitre 4.
Cette mthode fournit la forme gnrale des emprises de btiments travers un agencement de rectangles. Il est possible denvisager directement lutilisation de ces rectangles
comme supports de modles paramtriques 3D base rectangulaire. Cela a t test travers deux processus de reconstruction, prsents dans lannexe A. Cependant, ces processus fournissent des rsultats peu convaincants, dus notamment la prsence de nombreux
artefacts dans les modlisations 3D de btiments. Lutilisation de rectangles comme supports est, en effet, limite : ces formes gomtriques sont trop simples pour permettre une
bonne connexion des supports entre eux, comme on peut le constater sur la figure 2.7. Outre
laspect visuel des rsultats, ces processus ncessitent des formulations nergtiques complexes, cest--dire intgrant des interactions nombreuses et varies, afin dassembler entre
eux les modles 3D base rectangulaire. Cela a linconvnient dintroduire beaucoup de
paramtres dans lalgorithme, et par consquent, de le rendre peu robuste.
Pour dvelopper une mthode efficace, il est ncessaire de rgulariser a posteriori les
agencements de rectangles. Lobjectif est damliorer la connexion des rectangles voisins
(voir figure 2.7). Pour ce faire, les rectangles doivent tre transforms en objets gomtriquement plus complexes. Ce problme est trait dans la seconde partie de ce chapitre.
39
S1 S2 = 0/
P1 et P2 ont au moins une arte commune
Les polygones sont toutefois des objets pouvant tre trs complexes. Or, il est important
quils puissent tre dcrits travers un nombre restreint de paramtres, afin de ne pas com-
40
Prs dune centaine de dispositions de couples de rectangles sont possibles : il nest pas
envisageable de les traiter au cas par cas. Il faut dfinir un processus gnral de transforma1 La frontire sparant le secteur intrieur du secteur extrieur est dfinie par les deux mdianes des rectangles. Dans certaines situations (mdianes parallles disjointes), ces deux secteurs ne sont pas reprsents.
Les points A, B, C et D sont alors dfinis comme les deux paires de points de chaque rectangle ayant la distance
deux deux la plus courte.
41
tion des couples de rectangles voisins. Nous proposons seize configurations diffrentes de
transformations permettant de traiter les dispositions possibles. La figure 2.10 schmatise
ces seize configurations. Dans le secteur extrieur, quatre possibilits de mise en relation des
points A et B sont permises. Celles-ci sont fondes sur des intersections issues de droites
prolongeant les artes des rectangles. Concernant le secteur intrieur, les quatre mmes possibilits sont autorises. Finalement, quatre quatre configurations sont proposes.
F IG . 2.10 Les quatre possibilits de mise en relation du secteur extrieur (gauche), les
quatre possibilits de mise en relation du secteur intrieur (droite).
Afin de choisir la configuration la mieux adapte parmi les seize pour une disposition
de rectangles donne, nous dfinissons une fonction de cot C qui prend en compte la disposition relative des rectangles, mais galement le MNE. Il peut arriver que la configuration
choisie ne soit pas pertinente. Ainsi, la configuration choisie doit avoir un cot infrieur
un cot de rfrence Cre f , sans quoi la transformation nest pas applique et les deux rectangles restent inchangs. La fonction de cot C se dcompose en trois termes :
un terme dattache au MNE, qui value la qualit de la configuration par rapport au
MNE.
un terme de recouvrement surfacique, qui favorise les taux de recouvrement levs
entre les deux rectangles et les quadrilatres proposs.
un terme de correspondance des contours, qui permet de comparer la pertinence des
contours des quadrilatres relativement ceux des deux rectangles initiaux.
Ces trois critres sont pondrs entre eux par deux poids 1 et 2 . La fonction de cot
sexprime donc par :
C = CMNE + 1Crecouvrement + 2Ccontour
(2.6)
42
N
Nt
(2.7)
| SQ SR |
SR
(2.8)
(2.9)
Pour un agencement de rectangles complet, nous traitons localement tous les couples de
rectangles voisins par ce procd. Le rsultat est une association de quadrilatres connects,
comme le montre la figure 2.13 (centre - emprises bleu). La forme gnrale des emprises a
t conserve. De plus, grce au terme dattache au MNE utilis dans la fonction de cot,
nous pouvons remarquer que les petits artefacts gnrs par le recouvrement de rectangles
ont t limins, ce qui permet damliorer nettement la qualit des contours des emprises.
Le processus mis en place est relativement simple. Cependant, il constitue une tape
ncessaire la mise en place de notre approche structurelle. En thorie, le rsultat de cette
tape aurait pu tre obtenu directement en utilisant une approche par processus ponctuels
marqus, cest--dire une approche similaire celle dveloppe dans la partie 2.1, o les
objets auraient t des quadrilatres quelconques. En pratique, cela nest pas envisageable :
les objets, bien que simples, sont dj paramtriquement trop complexes pour esprer des
temps de calculs abordables.
43
F IG . 2.11 Critre de cohrence des contours : configuration pnalise (gauche), configuration favorise (droite).
44
deux exemples de rsultats (bas - emprises rouges). Les discontinuits y sont correctement
dtectes. Sur lexemple de droite, nous dtectons galement des discontinuits au niveau
dun dcrochement de toiture. Dans notre contexte, cela nest pas trs prjudiciable : il est
prfrable de sur-dtecter les discontinuits plutt que den omettre. Dans la suite, nous
nommerons ces emprises des supports structuraux.
Les supports structuraux fournissent des informations planimtriques, proches de donnes cadastrales. Ils apportent galement des connaissances sur la structuration des btiments. Ces supports structuraux ont t utiliss dans une mthode paramtrique simple de
reconstruction 3D, fonde sur un processus de squeltisation des artes fatires. Cette mthode, simple mais peu prcise, prsente un intrt mineur. Elle est prsente en annexe B.
F IG . 2.12 Dtection des discontinuits des hauteurs de toit - emprise initiale (a), estimation du profil du toit (b), seuillage de la drive du profil (c), accumulation des gradients
(d), emprises finales avec les discontinuits en rouge (e).
45
F IG . 2.13 Deux exemples de rgularisation en supports structuraux - emprises rectangulaires initiales (haut), emprises quadrilatrales aprs connexion des rectangles (centre),
emprises quadrilatrales aprs extraction des discontinuits de hauteurs de toit (bas).
Chapitre 3
48
49
possibles : les trs classiques toits plats, les toits terrasse (qui sont des drivs des
toits plats auxquels on ajoute un module souvent de forme paralllpipdique permettant soit laccs la terrasse, soit limplantation de machineries dascenseurs), et
enfin les toits en appentis (qui sont des mono-plans inclins, correspondant souvent
des modules annexes de la structure principale dun btiment).
Les multi-plans - Ils constituent la famille de toits la plus rpandue dans le paysage
urbain europen. Nous avons distingu six dclinaisons. La premire est le bi-plan
symtrique, trs courant. Sur le mme principe, mais avec larte fatire situe de
manire dissymtrique par rapport au support, nous avons deux autres dclinaisons :
le toit dissymtrique pente constante et le toit dissymtrique pente variable. La
quatrime, du nom de son crateur, est le toit Mansart, toit tri-plan intermdiaire
entre le toit plat et le bi-plan symtrique. Il est relativement rpandu sur les structures
anciennes (historiquement, ce toit au volume habitable important a t imagin au
17e sicle pour contrer la taxe dhabitation fonde sur le nombre dtages). Enfin, les
deux dernires dclinaisons sont les toits briss convexes et concaves. Ce sont des
quadri-plans composs de deux plans extrieurs de mme pente et de deux plans intrieurs de mme pente. Le toit convexe, qui possde un volume habitable important,
est frquent en centre-ville ; son homologue concave est lui plutt rpandu au sein
des zones pri-urbaines.
Les non planaires - Ce sont des toitures courbes. Elles sont principalement utilises pour la construction ddifices remarquables dans les centres-villes, et aussi
de grands btiments type entrepts dans les zones dactivit. Nous distinguons deux
50
F IG . 3.2 Potentiel des MNE PLEIADES en matire de restitution des formes de toits profil rel en rouge, profil du MNE en bleu.
Pour rsumer, lexception des toitures brises, les MNE PLEIADES montrent des caractristiques intressantes pour permettre une reconnaissance efficace des formes de toits
regroupes sur la figure 3.1. Une simple tude des profils des MNE ne garantit pas, cependant, une distinction correcte des diffrentes formes de toit retenues. Celle-ci devra tre
51
sde son propre jeu de paramtres, que nous appelons les paramtres de formes F. Ils sont
communs toutes les variantes du modle. Ils correspondent des paramtres altimtriques
(hauteur de gouttire et hauteur de fatire) et galement planimtriques (dissymtrie de
larte fatire, largeur du plateau dun toit mansart,...). Le nombre de paramtres varie
entre un (pour le toit plat) et six (pour le toit terrasse). Ils sont valeurs continues dans des
compacts de R. Pour chaque type de toit, ces paramtres sont dtaills dans la table 3.2.
52
Les paramtres de chaque modle sont rsums dans la table 3.1. Il faut noter que, dans
le cas de supports 2D triangulaires, certains modles peuvent tre dgnrs en fonction
de la valeur du paramtre dorientation. Ces modles sont logiquement interdits. Du point
de vu de la gnricit, les modles qui composent la bibliothque peuvent paraitrent assez
53
F IG . 3.5 Paramtres et - variante ayant deux symtries axiales (droite), variante nen
possdant quune (gauche).
restreints au premier abord. Cependant, en assemblant ces modles les un aux autres, cette
bibliothque permet de modliser une gamme trs importante de structures urbaines. Par
exemple, bien que nous ne disposons pas de modles spcifiques aux toits "dusine" dans la
bibliothque, on peut facilement les restituer en assemblant des modles de toits en appentis
de manire parallle.
Il est important de noter que cette bibliothque est volutive et peut tre tendue
dautres modles afin de gagner en gnricit. Inversement, il est facile de la restreindre
des modles trs reprsentatifs dun environnement urbain, afin de gagner en robustesse
et en temps de calcul. Le contenu de la bibliothque joue donc un rle important dans le
processus global de reconstruction.
54
Formes
.
de toit
Paramtres de formes F
F11
F12
F13
Hg
Hg , Ht , 1 , 2 , 3 , 4
Hg , Ht
F21
Hg , Ht
F22
Hg , Ht ,
F23
Hg , Ht ,
F24
Hg , Ht ,
F31
Hg , Ht
F32
Hg , Ht
Variantes
Variantes possibles V Paramtres des variantes V
V
V
V
VL
V
VV
V2V
VL
VT
V+
V
VV
V2V
VL
V
VL
V
VL
VT
V+
V
VL
VT
V+
V
VL
2
2
1
2 ,
1 ,
2
2
1
2 ,
1 ,
2
2
2
1
2
2
1
2
2
2
2
Paramtres
Hg
Ht
1 , 2 , 3 , 4
1
2
Signification
Hauteur de gouttire dun btiment
Hauteur de fatire dun btiment
Position du support rectangulaire du toit terrasse
Dissymtrie de larte fatire
Largeur du plateau dun toit mansart
Orientation dun modle axialement symtrique
Orientation dun modle non symtrique
Profondeur de lattaque en V
Domaine de dfinition
[Hgmin , Hgmax ]
[Htmin , Htmax ]
[0, 1] 4
[0, 1]
[0, 1]
{1, 2}
{1, 2, 3, 4}
[0, 1]
55
{.} ,
kN?
(3.1)
de la phase dextraction des emprises de btiments, certains supports ne sont pas correctement placs
comme on peut le constater sur la figure 2.13. Il est important dexclure les pixels correspondant au sol qui sont
lintrieur des supports, sinon le calcul de lattache aux MNE se trouverait fortement biais. Ces pixels sont
donc retirs de lensemble des donnes en seuillant un demi-tage du sol.
2 Lindice m dun modle est dfini par le couple dindices ( f , v ) o f {11, 12, 13, 21, 22, 23, 24, 31, 32}
i
i i
i
et vi {,V, 2V, L, T, +}.
56
correspond la loi a priori. Cette loi permet dintroduire des connaissances sur lagencement des objets. Le but est de mettre en place une vraisemblance et un a priori qui modlisent de manire pertinente notre problme.
Densit non normalise et nergie de Gibbs
Comme cela a t soulign dans la partie 1.4.2, il est possible dexprimer une densit
normalise hnorm par une nergie U travers la loi de Gibbs. Cette relation peut savrer
tre trs utile lors de la mise en place des diffrents termes qui composent une densit, mais
galement lors de la phase doptimisation afin de poser le problme sous une formulation
nergtique. Si x C , cette loi sexprime par :
hnorm (x) =
1
exp U(x)
Z
(3.3)
xC
exp U(x)
(3.4)
Cependant, dans de nombreux problmes o lespace des configurations est trs grand, cette
constante de normalisation est trs difficilement calculable ou estimable. Cest notre cas :
lensemble des configurations dobjets est trs important cause notamment de la taille de
notre bibliothque, et des nombreux paramtres valeurs continues inhrents aux diffrents
modles de toit. Le nombre dobjets contenus dans une scne peut galement tre lev
(plusieurs centaines en gnral). Il est toutefois possible de dcomposer la scne en plusieurs problmes indpendants correspondant des btiments ou pts de maisons, afin de
rduire le nombre dobjets ( quelques dizaines en gnral).
Pour cette raison, nous utilisons des densits non normalises. Cela nest pas prjudiciable
dans la mesure o les mthodes doptimisation que nous utilisons sont adaptes ce type de
densits. Ainsi, une densit non normalise h peut sexprimer travers une nergie U par :
h(x) = exp U(x)
(3.5)
3.2.1 Vraisemblance
La vraisemblance est une densit qui mesure la cohrence entre les donnes observes
Y et une configuration dobjets x. Afin de simplifier sa mise en place, nous considrons
lhypothse dindpendance conditionnelle des donnes. Cette hypothse est plausible dans
la mesure o les donnes locales Yi ne se recouvrent pas entre elles. La vraisemblance peut
ainsi sexprimer sous la forme du produit des vraisemblances locales L (Y i /xi ) des objets :
L (Y /x) =
L (Yi /xi )
(3.6)
iQ
Pour estimer la pertinence dun objet x i par rapport une partie de MNE, la solution gnralement utilise consiste introduire une distance qui compare pixel pixel laltitude du toit
de lobjet avec celle du MNE. Plusieurs distances peuvent correspondre notre problme,
parmi lesquelles la distance de Cauchy ou de Tukey [Xu et Zhang, 1996]. Cette dernire est
57
dailleurs particulirement efficace pour traiter les problmes dont les donnes sont bruites
puisque les valeurs aberrantes ont une pnalisation constante. Lutilisation de cette distance
nest cependant pas ncessaire puisque nous excluons les valeurs aberrantes dans la dfinition des donnes Yi . Nous utilisons plus classiquement une distance en norme L . Nous
exprimons ds lors la vraisemblance par :
L (Y /x) =
iQ
(3.7)
(i) (Sxi , Yi ) =
sSi
! 1
(3.8)
La distance utilise est fonde sur une comparaison entre les pixels du MNE et laltitude
du toit de lobjet xi note Sxi . Bien que relativement simple, elle permet de modliser efficacement lattache aux donnes de notre problme. La manire dont est dfinie cette distance,
cest--dire travers une diffrence "pixel pixel" sans autre intervention de paramtres de
lobjet xi dans lexpression, permet par ailleurs de rendre la constante de normalisation Z(x i )
indpendante3 de lobjet xi . Cela signifie que le calcul de cette constante de normalisation
nest pas ncessaire : on rsonne donc avec des vraisemblances locales non normalises.
Le choix de se tourne gnralement vers la norme L 1 , voire la norme L2 . La norme L2
est particulirement sensible aux fortes variations. Cette norme nest donc pas spcialement
adapte notre problme puisque les MNE que nous utilisons sont fortement bruits 4 . La
norme L1 est plus robuste au bruit. Cependant, nous avons remarqu exprimentalement
que les profils des toits sur les MNE utiliss sont gnralement concaves pour dcrire, par
exemple, des bi-plans symtriques (voir la figure 3.2). La norme L 1 ragit mal cette concavit en ayant tendance sous-estimer la pente du toit. La norme L 1,5 constitue, au regard
des exprimentations ralises, un bon compromis entre les normes L 1 et L2 . Dun point de
vue algorithmique, la norme L1,5 est lgrement plus lente calculer que la norme L 2 ou L1 ,
ce qui reprsente son principal dfaut.
En dfinitive, la vraisemblance est dfinie de manire relativement simple, sans introduction de paramtres qui pourraient faire perdre de la robustesse au processus global.
3 Pour
vrifier cela, il suffit dcrire lexpression de la constante de normalisation Z(xi ) et de poser le changement de variable u(s) = Sxi (s) (s) quand on intgre sur les donnes, lexpression obtenue ne dpend alors
plus de xi . Cela suppose juste que les donnes soient intgres sur un espace non born.
4 En plus du bruit caractrisant les erreurs de mise en correspondance, nous devons galement faire face aux
petits lments de toiture comme les chemines ou chien-assis qui sont perus, notre chelle de reconstruction,
comme du bruit au sein des principaux plans de toit.
58
3.2.2 A priori
La densit a priori constitue un point fondamental de notre approche structurelle. Ce
terme permet de rgulariser la configuration dobjets afin de combler le manque dinformation contenu dans les donnes et, galement, davoir un rendu visuel de bonne qualit. Pour
cela, les diffrents modules lmentaires constituant un btiment doivent tre correctement
assembls entre eux.
Ce terme doit tre dfini simplement et faire intervenir peu de paramtres. La mthode
prsente en annexe A, dont la priori est compos de trois types diffrents dinteractions
pondrs entre eux par des paramtres, prsente un manque de robustesse et souligne la
ncessit de minimiser le nombre de types dinteractions. Nous nous imposons ainsi une
contrainte sur le nombre de paramtres introduire dans la priori. Plus prcisment, ce
terme ne devra comporter quun seul paramtre, cest--dire le nombre minimal permettant la pondration avec le terme de vraisemblance. Nous cherchons donc modliser la
priori travers un seul type dinteractions devant regrouper les diffrentes contraintes sur
lassemblage des modules entres eux.
Relation de voisinage sur les supports des objets
La premire tape consiste dfinir une relation de voisinage sur Q , cest--dire sur
la configuration des supports des objets. De manire naturelle, nous utilisons la relation
de connexion entre quadrilatres, dfinie dans la partie 2.2.1. Ainsi, deux quadrilatres i
et j Q sont dits voisins sils sont connects. Cette relation de voisinage est note V .
Lensemble des voisins du quadrilatre i sont ainsi nots V (i). i ./ j reprsente lensemble
des paires de supports voisins dans Q . Par abus de langage, nous nommerons par la suite
"objets voisins", les objets dont les supports 2D sont voisins.
Loi dassemblage entre deux objets voisins
Afin davoir une densit a priori simple et efficace, nous dfinissons une loi dassemblage permettant de tester si deux objets voisins peuvent se raccorder entre eux. Deux objets
xi = (mi , i ) et x j = (m j , j ) seront dits assemblables (not xi a x j ) sils vrifient les trois
points suivants :
Compatibilit des formes de toit - les deux objets doivent avoir le mme type de
toit. Cela signifie que deux objets voisins, lun ayant par exemple un toit mansart,
lautre un toit elliptique, ne seront pas assemblables. Une exception est faite pour
les toits plats avec les toits terrasse qui peuvent parfaitement se raccorder entre eux.
Pour rsumer, la compatibilit des formes de toit est satisfaite si F fi = F f j ou si
{F fi , F f j } = {F11 , F12 }.
Compatibilit des artes fatires - Les artes fatires des deux objets doivent tre
disposes dans le prolongement de lune par rapport lautre. En dautres termes,
nous voulons que la continuit planimtrique des artes fatires dun objet lautre
soit possible. Cette contrainte est vrifie par un test sur les paramtres spcifiques
59
des variantes des modles, prenant en compte les paramtres dorientation et les possibilits de jonction des variantes donnes par la figure 3.4.
Continuit des hauteurs de toit - Les hauteurs des deux modules doivent tre proches
afin de permettre une continuit altimtrique des artes fatires. Cela revient tester
si larte commune aux deux supports est une discontinuit de hauteur de toits, procd tabli dans la partie 2.2.2.
La premire contrainte assure que les deux objets aient la mme forme de toit. Les deux
autres contraintes garantissent la possibilit de continuit des artes fatires dun objet
lautre.
Formulation de la priori
La densit a priori que nous proposons consiste favoriser les paires dobjets voisins
qui sont assemblables. Cette interaction ne doit cependant pas tre binaire. En effet, la loi
dassemblage nassure pas lassemblage parfait de deux objets, mais garantit juste que certaines conditions indispensables leur assemblage sont vrifies. Ainsi, nous introduisons
une fonction g qui mesure la distance entre les paramtres de forme de deux objets assemblables.
Nous exprimons alors la densit a priori h p travers une nergie de Gibbs U p (i.e.
h p (x) = exp U p (x)) par :
x C , U p (x) =
i./ j
{xi a x j } g(xi , x j )
(3.9)
k k |Fi,(k) Fj,(k) |
D(xi , x j )
1 =
1
Dmax
Dmax
(3.10)
o Fi,(k) et Fj,(k) correspondent au k ieme lment de lensemble des paramtres de forme des
objets xi et x j respectivement. Dmax = max D(xi , x j ) reprsente la valeur maximale de la
xi ,x j
distance. Les k sont des poids qui sont introduits dans cette distance afin de normaliser les
valeurs des paramtres selon le systme mtrique. Ces poids sont connus et sont calculs
en tenant compte de la rsolution en XY, de la rsolution en Z et de la configuration de
quadrilatres Q .
La figure 3.6 illustre le principe de cette interaction. Si les deux objets ont des formes de
toit diffrentes (configuration en haut droite) ou si la continuit des artes fatires nest
pas assure (configuration en bas droite), les deux objets ne sont pas assemblables : lnergie associe ces configurations est nulle. A linverse, si les deux objets sont assemblables
(les autres configurations de la figure), lnergie est ngative : ces configurations sont favorises. Grce la fonction g, elles seront dautant plus favorises que les objets seront
60
F IG . 3.6 Principe de lnergie a priori - exemples de divers cas dinteraction entre deux
objets.
Finalement, la densit h(.) que nous proposons sexprime sous la forme suivante :
!
h(x) = exp
3
2
(i) (Sx , Yi ) +
iQ
i./ j
{xi a x j } g(xi , x j )
(3.11)
Un seul paramtre pondrateur intervient dans cette densit : il sagit de . Cela accorde de
la robustesse au processus et permet de limiter les problmes engendrs par le rglage des
paramtres. Dans la suite, lnergie de Gibbs associe la densit non normalise h sera
note U (U = ln h).
3.3 Optimisation
Lobjectif consiste trouver la configuration dobjets qui maximise la densit h(.). Cela
revient dterminer lestimateur du Maximum A Posteriori (MAP) x MAP :
xMAP = arg max h(x)
xC
(3.12)
3.3 Optimisation
61
Cest un problme doptimisation non convexe dans un espace C trs grand, dont les variables sont, pour la plupart, valeurs continues dans des compacts de R. De plus, comme
les modles de la bibliothque M sont dfinis par un nombre diffrent de paramtres, C est
une union despaces de dimension variable.
Trs peu dalgorithmes peuvent tre utiliss efficacement sous ces contraintes. Ds lors,
deux options sont possibles :
Soit utiliser un algorithme stochastique adapt aux caractristiques de notre problme, mais relativement coteux en temps de calcul - Nous pensons en particulier
aux mthodes de Monte Carlo par Chanes de Markov (MCMC) [Robert et Casella,
1999] .
Soit simplifier notre problme doptimisation afin dutiliser des techniques moins
coteuses - Nous envisageons notamment de restreindre lespace dtat (discrtisation des paramtres) ou de simplifier la densit propose (modifier la relation de voisinage en squence dobjets par exemple, ou poser des hypothses sur lnergie U
afin de la rendre drivable).
Nous optons pour la premire solution. Lalgorithme doptimisation stochastique par MCMC
que nous proposons est dtaill dans la suite de cette partie. Pour comprendre son fonctionnement, le lecteurs pourra consulter lannexe C dans laquelle la dfinition des chanes de
Markov, leurs proprits et les conditions de convergence sont rappeles. Cependant, nous
voquons galement des mthodes doptimisation alternatives fondes sur une simplification de notre problme. Celles-ci sont abordes dans le dernier paragraphe de cette partie.
62
Jump Markov Chain Monte Carlo" en anglais), est particulirement efficace pour aborder les
problmes de reconnaissance dobjets multiples. Plusieurs travaux ont dailleurs dmontr
lefficacit de lalgorithme RJMCMC dans ce type de problmes. On peut citer notamment
[Dick et al., 2004] qui reconstruit des btiments remarquables partir dimagerie terrestre
en utilisant des objets 3D paramtriques multiples tels que des colonnes, des fentres ou
bien encore des pontons. Il est aussi utilis par [Brenner et Ripperda, 2006] pour extraire
des faades de btiments. Cet chantillonneur est galement bien adapt dans le cadre des
processus ponctuels marqus comme cela a t soulign dans la partie 2.1, entre autres avec
les travaux de [Lacoste et al., 2005; Perrin et al., 2005; Ortner et al., 2007].
Afin de construire une chane de Markov pour notre problme, plusieurs outils doivent
tre introduits :
La mesure cible de la chane dfinie sur C et spcifie par la densit a posteriori
h (elle est, dans notre cas, non normalise, cest--dire connue une constante de
normalisation prs).
Les noyaux de proposition de perturbations Q k (., .) dfinis sur C B (C ). Ils permettent de proposer des perturbations de diffrents types k que nous dtaillons dans
la partie 3.3.2.
Une mesure symtrique k (., .) associe au noyau Qk (., .) et dfinie sur C C , telle
que (.)Qk (., .) soit absolument continue par rapport k (., .). Cette condition permet
dassurer lexistence et lunicit de la drive de Radon-Nikodym f k (., .) dfinie par :
fk (x, y) =
(3.13)
Ds lors, on dfinit la probabilit dacceptation dune proposition x y par min(1, R k (x, y))
o Rk reprsente le taux de Green :
Rk (x, y) =
fk (y, x)
(dy)Qk (y, dx)
=
fk (x, y) (dx)Qk (x, dy)
(3.14)
3.3 Optimisation
63
(3.15)
Le rapport des noyaux prsent dans le taux de Green peut alors sexprimer par :
(k) (k)
Jnm nm (vnm ) mn (i , umn )
Qk (y, dx)
= (k) (k)
(i , umn )
Qk (x, dy) Jmn
mn (umn )
(3.16)
o Jmn reprsente la probabilit de faire un saut du modle M m vers le modle Mn . Calculer la bijection mn est un problme difficile quand les modles M m et Mn diffrent par
de nombreux paramtres. Dans notre cas, les modles possdent entre un et six paramtres
seulement, ce qui facilite le calcul des bijections, dtaill en annexe D.
La mise en place des noyaux de proposition seffectue en spcifiant la fois les probabilits Jmn de saut entre modles et les distributions mn des paramtres de compltion du
modle Mn par rapport au modle Mm . Nous proposons trois types de noyaux, cest--dire
trois jeux de distributions (Jmn , mn ).
Noyau Q1 : perturbation uniforme
Il constitue le noyau de base, du moins le plus simple que lon puisse mettre en place
tout en garantissant lapriodicit de la chane. Le nouvel tat est propos de manire
64
Jmn =
1
card(M )
(1)
mn = UKmn
(3.17)
(3.18)
o UKmn est une distribution uniforme sur le compact Kmn qui reprsente le domaine
de dfinition des paramtres de compltion du modle M n par rapport au modle Mm .
Noyau Q2 : perturbation dirige par les donnes
Ce noyau permet dexplorer, de manire plus pertinente que le noyau Q 1 , lespace
des configurations en introduisant des connaissances provenant des donnes, comme
lillustrent notamment les travaux de [Tu et Zhu, 2002]. Comme nous lavons soulign prcdemment, il est difficile dextraire dans le MNE des informations fiables
sur les objets. Les seuls paramtres pouvant tre estims avec robustesse sont les paramtres altimtriques, cest--dire Hg et Ht , respectivement la hauteur de gouttire
et la hauteur de fatire dun objet. Il est trs intressant davoir une estimation de
ces paramtres car ce sont les plus utiliss dans la bibliothque (voir la table 3.1). De
plus, ces deux paramtres sont importants dans la mesure o ils constituent la principale source derreur lors des reconstructions de btiments. La mthode estimant ces
cg et H
bt , les
deux paramtres partir du MNE est prsente en annexe B-2. On note H
estimations de Hg et Ht fournies par cette mthode.
Pour ces deux paramtres, il faut utiliser des distributions plus pertinentes que la
cg et H
bt . Nous choisissons la distridistribution uniforme, de prfrence centres en H
bution gaussienne. Ainsi, les distributions nm des paramtres de compltion suivent
les mmes lois (uniformes) que pour le noyau Q 1 , lexception des paramtres Hg et
cg , 1 ) et N (H
bt , 2 ) respectivement.
Ht qui sont tirs suivant des lois normales N ( H
Les variances 1 et 2 sont des paramtres qui sont fixs respectivement 1 et 0, 5
mtre. Ces valeurs ont t choisies en fonction de la prcision fournie par la mthode
cg et H
bt .
destimation de H
3.3 Optimisation
65
Jmn =
Pp
(v)
Pk
kF
Forme
Poids P( f )
Pq
(f)
(3.19)
(v)
Pk0
k0 VF p
F11
F12
F13
F21
F22
F23
F24
F31
F32
VV
V2V
VL
VT
V+
(3.21)
o Fbk est la moyenne des kieme paramtres des objets voisins dont la forme est F n .
Ce noyau agit dans un espace de configurations rduit en proposant de "petites" perturbations. Cela permet par ailleurs davoir des perturbations rciproques tout--fait
66
5 La temprature critique est une temprature thorique durant laquelle le processus doit choisir entre plusieurs puits nergtiques. Elle correspond gnralement la priode pendant laquelle la variation dnergie est
forte. Le processus doit donc faire le bon choix cette temprature, cest pourquoi plusieurs schmas adaptatifs
consistent ralentir la dcroissance cet endroit.
3.3 Optimisation
67
F IG . 3.8 Deux exemples simples dvolution de configuration dobjets au cours de la dcroissance de temprature (bas), simulations PLEIADES et vrits terrain associes (haut).
68
on considre quil existe une phase supplmentaire, prliminaire aux deux autres. Cest, comme
on peut le voir sur la figure 3.7, un plateau nergtique o une large majorit de propositions sont acceptes et
qui permet de sassurer que la temprature initiale est assez leve.
7 Durant cette phase de rgularisation, on se trouve rgulirement pig dans de petits puits nergtiques
(voir le prochain paragraphe). Cest pour cette raison quil nest pas possible dutiliser en fin de processus un
algorithme dterministe de type descente de gradient pour rgulariser la configuration.
3.3 Optimisation
69
La figure 3.9 illustre ce problme. La configuration correspondante au point bleu reprsente un minimum local de notre nergie : deux groupes dobjets, relativement bien attachs
aux donnes, se sont rgulariss entre eux. Or la configuration optimale (point rouge) correspond un seul groupe dobjets, dont tous les lments voisins sont assembls entre eux.
Ainsi, pour passer du point bleu au point rouge, il faut casser au moins la rgularisation dun
des deux groupes dobjets pour que les lments concerns sassemblent progressivement
avec les objets de lautre groupe. Pour raliser cela, il faut que le processus visite des configurations intermdiaires dont le niveau nergtique est mauvais (ou du moins suprieur
lnergie du point bleu). La dcroissance de temprature doit tre assez lente pour assurer
la visite de ces configurations intermdiaires.
70
N
F IG . 3.11 Graphe de dpendance de la chane de Markov cache (Xt ,Yt )t=1
Cette simplification en squences dobjets est pnalisante dans la mesure o les jonctions complexes (jonctions en T ou en +) ne pourront plus tre restitues correctement
puisque les chanes de Markov caches sont indpendantes entre elles. Une des solutions
consisterait utiliser une modlisation par graphe hirarchique deux niveaux : le niveau
infrieur correspondant aux squences dobjets, le niveau suprieur permettant dintroduire
des lois de dpendance entre les squences. Une autre possibilit pourrait tre dutiliser les
techniques de propagation des messages. Les mthodes de "belief propagation" semblent
tre bien adaptes, dautant que les graphes de notre problme possdent souvent peu de
cycles. Les approches utilisant un formalisme fonde sur les modles graphiques ouvrent,
en tout cas, des perspectives particulirement intressantes.
En dfinitive, cette mthode est intressante pour obtenir rapidement une modlisation
approche (i.e. avec un pas de discrtisation de lordre de deux mtres, une bonne rgularisation, mais sans restitution des jonctions complexes) avec des temps de calcul trs faibles
(de lordre dune seconde pour un btiment). Si lon souhaite un degr de prcision suprieur, le processus par optimisation stochastique est alors mieux adapt. Cette mthode
alternative est prsente de manire plus dtaille en annexe E.
3.3 Optimisation
71
3
2
(i) (Sx , Yi ) +
i
iQ
i./ j
{xi a x j } g(xi , x j )
(3.23)
Or U(x) nest pas drivable en tout point de son espace dtat. Le terme a priori contient
une fonction caractristique et une fonction g non drivables en tout point. Cest galement
le cas du terme dattache aux donnes, o les fonctions dquations des toits S xi sont C1
par morceaux (les toits tant des associations connexes de plans). Une solution simple permettant de contourner le problme consiste restreindre lespace dtat et/ou modifier la
formulation de U. Ainsi, nous pourrions simplifier le problme en considrant lhypothse
suivante : les configurations dans lesquelles les objets voisins ne sont pas assemblables sont
improbables. Cela signifie que lon rduit lespace aux configurations dans lesquelles les
objets voisins sont assemblables. De plus, nous pourrions modifier certaines fonctions de
manire redfinir notre nergie sous la forme :
b =
U(x)
3
2
iQ
(3.24)
i./ j
b diffre de U par
o g0 est une fonction de distance analogue g mais dfinie en norme L 2 . U
b
les normes utilises dans la priori. Ds lors, si lon drive U par rapport au k ieme paramtre
de lobjet Xi , on obtient lexpression suivante :
b
dU(x)
(k)
dxi
2 (S , Yi ) +
(k) (i) xi
dxi
jV (i)
dg0 (xi , x j )
(3.25)
(k)
dxi
La dernire difficult concerne les fonctions dquation des toits S xi qui sont C1 par morceaux. Cela rend, par consquent, le terme dattache aux donnes non drivable sur les
bords des diffrentes parties des supports de toit. Une solution possible consiste ngliger
la variation des diffrentes parties des supports dans lexpression de la drive. Dans ce cas,
nous avons :
3
2 (S ,Y )
d(i)
xi i
(k)
dxi
23
3
2
|z
Y
|
dm
i
Si
R
13
p
R
3
dz(p)
(p)
(p)
2
Si |z Yi | dm
p S(p) sign(z Yi ) |z Yi | (k) dm
=
d
(k)
dxi
R
o
du
(p)
les Si
toit, C 1
dxi
(3.26)
correspondent aux diffrentes parties du support S i , chacune associe un plan
(p)
sur Si . z est lquation du toit et m reprsente la mesure de Lebesgue dans R 2 .
Notre problme pourrait donc tre abord par des processus de diffusion, notamment
par des techniques de "jump-diffusion" adaptes aux problmes de reconnaissance dobjets
multiples. Il faudrait alors voir dans quelles mesures les hypothses et approximations ralises pour calculer le gradient de lnergie pnalisent les rsultats. Il serait particulirement
intressant dapprofondir les recherches dans cette direction.
72
sousU p (b
x() ) + NI
NI
(3.27)
dobjets voisins qui doivent tre assembls. est un paramtre fix qui permet de dfinir la
qualit minimale de la rgularisation exige. Cette estimation de revient introduire un
nouveau paramtre qui a lui un sens physique puisquil correspond, en mtres, lcart
moyen maximal tolr entre les paramtres des modules assemblables.
En considrant que, sur lchantillon Y (e) , on connat parfaitement les NI cas rels dassemblage, cest--dire les paires dobjets voisins qui doivent tre assembls, le terme a priori
se simplifie et scrit sous une somme de fonctions g. Sous cette hypothse, la vraisemblance et la priori de xb() voluent de manire oppose en fonction de . Si lon diminue
, la priori a moins de poids dans h. La rgularisation est alors de moins bonne qualit. A
linverse, lattache aux donnes est meilleure. Lestimation de peut tre faite itrativement
par un principe dichotomique de la manire suivante :
73
Pt correspond au pas dexploration litration t. Ce processus est assez long puisquil faut,
chaque itration, calculer xb(t ) par un recuit simul. Il est donc trs important de choisir
un chantillon de donnes Y (e) de taille relativement petite (quelques btiments), mais reprsentatif de Y . En dfinitive, cet algorithme automatique destimation de procde dune
manire similaire un rglage manuel par un oprateur. Il est noter que cette estimation
est effectue une seule fois pour une gamme donne de MNE.
8 En
pratique, plusieurs centaines de configurations sont ncessaires pour une estimation robuste, ce qui est,
en temps de calcul, ngligeable par rapport au processus doptimisation global.
74
9 En
pratique, le changement de phase est dtect quand le taux dacceptation des propositions calcul sur
1000 itrations devient infrieur 0, 05.
Chapitre 4
Evaluation
76
Evaluation
77
Connexion des supports 2D - Le processus de transformation des rectangles en quadrilatres connects donne satisfaction comme on peut le constater sur les figures 4.3,
4.4 et 4.5. La fonction de cot utilise (quation 2.6) permet dobtenir une bonne rgularisation des supports. Cela est notamment d au cot de rfrence C re f qui permet
dviter la prsence de mauvaises configurations de transformation. La robustesse apporte par ce cot a une contre partie : il nautorise pas la transformation de certains
rectangles gnrant des jonctions complexes dans certains cas, comme notamment
pour le btiment B4 de la figure 4.2 o la double jonction en T na pas t restitue.
Le processus dextraction des supports 2D prsente nanmoins des dfauts relativement
pnalisant pour des applications lies lamnagement urbain par exemple. Il sagit de la
sur-dtection de vgtation et la sous-dtection de petites structures urbaines.
Sur-dtection de vgtation - Les arbres prsents dans les zones urbaines sont dtects comme tant des btiments par le processus dextraction de rectangles. On peut
le constater sur la figure 4.4 (en haut de limage) o deux ranges darbres sont extraites. Cette sur-dtection est gnante pour de nombreuses applications. Cependant,
il est envisageable de coupler le processus dextraction demprises avec un masque
de vgtation urbain. Etant donn le masque, ce procd serait simple mettre en
uvre puisquil suffirait de soustraire les zones de vgtation au MNE pour que le
processus dextraction nait plus ces sur-dtections.
Sous-dtection de petites structures - La majorit des petites structures urbaines
situes dans les cours intrieures des lots de btiments ne sont pas dtectes comme
on peut le voir sur les figures 4.3, 4.4 et 4.5. Ces petites structures correspondent
des btiments dun tage, souvent des garages. Le processus dextraction de rectangles, fond sur la dtection des discontinuits de faades, rencontre des difficults
pour faire la distinction entre le sol et ces structures de faible hauteur. Une solution
consisterait dtecter ces petites structures dans les cours intrieures a posteriori, en
utilisant par exemple un algorithme de segmentation par ligne de partage des eaux
("watershed").
Emprises non rectilignes - Le processus propos a t mis en place pour traiter des
formes rectilignes, formes "naturelles" dans le milieu urbain. Cependant, certaines
structures, souvent des ouvrages remarquables limage du btiment B6 de la figure
4.2, possdent des emprises courbes. Le rsultat est, dans ce cas, particulirement
mauvais comme on pouvait sy attendre. Il ny a pas de relle solution permettant de
faire face ce dfaut.
Reconstruction 3D
Les reconstructions 3D obtenues dpendent de la qualit de lextraction des supports
2D. Les dfauts de cette premire tape, souligns prcdemment, sont donc visibles sur les
rsultats 3D. Cela nempche pas dobtenir des modlisations 3D de btiments globalement
satisfaisantes.
78
Evaluation
Niveau de gnralisation des btiments - Les plans principaux des btiments sont
correctement restitus, ce qui constituait notre objectif initial. Cela est suffisant pour
une majorit des btiments. Certaines structures, comme lhtel de ville dAmiens
(voir le btiment B1 de la figure 4.1), possdent cependant des dcrochements de
toits et des avances de faades. Ces "dtails" ne sont pas restitus par notre processus. La bibliothque de modles est pourtant assez riche pour modliser la plupart
de ces lments : un partitionnement plus pertinent des supports 2D pourrait tre une
solution pour obtenir une modlisation plus dtaille. Le niveau de gnralisation des
btiments reste tout de mme acceptable compte tenu de la qualit des donnes.
Restitution des diffrentes formes de toit - De manire gnrale, les diffrentes
formes de toit sont correctement identifies comme on peut le constater sur la figure
4.1. Bien que relativement simple, la distance introduite dans le terme dattache aux
donnes permet une bonne distinction des diffrentes formes contenues dans la bibliothque. Par ailleurs, quand lidentification de la forme de toit dun module nest
pas vidente, le terme a priori apporte une aide la dcision en prenant en compte la
forme de toit des modules voisins : cest un des principaux avantages de la formulation baysienne. Il existe cependant des confusions entre les formes de toit proches,
particulirement avec le toit mansart. Lorsque le paramtre de largeur de plateau
de ce dernier est proche de 0 (respectivement de 1), la distinction avec le bi-plan symtrique (respectivement avec le toit plat) sera dlicate. Ce type de confusions nest
pas pnalisant du point de vue de la fidlit altimtrique des modlisations. Du point
de vue de la qualit visuelle, cela peut tre plus gnant pour certaines applications.
Une solution simple consisterait restreindre le domaine de dfinition de certains
paramtres de formes de toit. Cela ncessiterait nanmoins de dfinir des paramtres
supplmentaires (des marges dans les domaines de dfinition) et complexifierait la
rsolution de la mthode doptimisation dtaille dans la partie 3.3.
Qualit de lassemblage des objets - Dans les problmes de reconstruction 3D, le
rendu visuel est un des critres majeurs permettant dvaluer les rsultats. Cet aspect
visuel dpend majoritairement, dans notre cas, de la qualit dassemblage des objets,
et plus prcisment de la pertinence du terme a priori dvelopp dans la partie 3.2.2.
De ce point de vue, les btiments reconstruits sur la figure 4.1 sont trs satisfaisants.
Ce point est soulign sur la figure 4.2 - btiment B2. Comparativement au modle
prsent dans lannexe A, il y a trs peu dartefacts, et les assemblages des modules
sont dans leur configuration optimale quand cela a lieu dtre. Quand des ruptures de
toits sont prsentes (comme sur le btiment B2 ou le btiment B3), les modules ne
sont pas, juste titre, assembls. La priori propos est donc efficace.
Jonctions complexes - Les cas de jonctions complexes sont souvent mal restitus,
comme on peut le voir sur la figure 4.2 travers la double jonction en T du btiment
B4. Ce dfaut est inhrent la mauvaise connexion des quadrilatres dans certaines
situations, lors de la phase dextraction des emprises. La modlisation des btiments
concerns reste cependant acceptable, le principal inconvnient provenant de labsence de petites parties dartes fatires au niveau des jonctions concernes.
79
F IG . 4.1 Diffrents exemples de btiments reconstruits (4 ieme colonne) associs avec les
simulations PLEIADES (1ere colonne), la vrit terrain (2ieme colonne) et les supports 2D
extraits (3ieme colonne).
80
Evaluation
F IG . 4.2 Extraits des btiments prsents sur la figure 4.1 soulignant certains dfauts
(en jaune) et points positifs (en bleu) - btiments reconstruits (2 ieme colonne), supports 2D
extraits (1iere colonne).
81
F IG . 4.3 Reconstruction 3D dun extrait dAmiens - zone A - (bas) associe avec une
simulation PLEIADES et lextraction des supports 2D (haut).
82
Evaluation
F IG . 4.4 Reconstruction 3D dun extrait dAmiens - zone B - (bas) associe avec une
simulation PLEIADES et lextraction des supports 2D (haut).
83
F IG . 4.5 Reconstruction 3D dun extrait dAmiens - zone C - (bas) associe avec une
simulation PLEIADES et lextraction des supports 2D (haut).
84
Evaluation
7.9%
sous-dtection
petites structures dun tage
14.3%
Zone B
11.6%
8.1%
5.4%
Zone C
9%
11.3%
4.6%
le reste
2.9%
Qualit altimtrique
Lvaluation altimtrique fournit des rsultats globalement satisfaisants puisque lerreur
quadratique moyenne en Z entre les reconstructions et la vrit terrain (calcule sur les
emprises communes des btiments) est de 2, 3 mtres, cest--dire une valeur lgrement
infrieure la hauteur dun tage. Cette erreur a t nettement amliore par rapport celle
obtenue partir du processus propos en annexe A (cest--dire 3, 2 mtres).
Cette erreur quadratique moyenne en Z reste toutefois leve. Cela sexplique par des
erreurs locales importantes (i.e. suprieures 3 mtres) certains endroits qui sont dues
F IG . 4.7 Carte derreur altimtrique des btiments reconstruits sur la figure 4.1.
85
86
Evaluation
plusieurs raisons : un mauvais positionnement des faades entranant des erreurs altimtriques de plusieurs tages, des inexactitudes dans le MNE principalement dues des
corrlations de surfaces non lambertiennes (transparence des verrires, spcularit sur les
ardoises,...), et des dtails de toitures non restitus comme des avances de faades, des dcrochements de toit ou des superstructures.
La figure 4.7 prsente, de manire dtaille, la carte derreur en Z des btiments reconstruits sur la figure 4.1. Plusieurs points attirent lattention. Tout dabord, il est difficile
dobtenir une estimation prcise des pentes de toits comme on peut le constater sur certaines
parties de toitures composes la fois de pixels bleu et rouges. Ce manque de prcision est
d au bruit prsent dans le MNE, mais galement aux imprcisions gnres par le positionnement des supports 2D. Ensuite, on peut voir que certaines discontinuits de hauteurs
de toit ne sont pas trs bien localises (voir les petites zones rouges et bleu fonc). Cela
pourrait tre amlior en reconsidrant le processus daccumulation des gradients fond
sur une opration barycentrique dans la partie 2.2.2. Enfin, de nombreuses petites erreurs
peuvent tre localises sur les plans de toits qui pnalisent localement lerreur quadratique
moyenne : il sagit de superstructures, principalement des chemines et chien-assis.
Les temps de calcul mis par le processus de reconstruction 3D sont acceptables malgr
lutilisation de techniques doptimisation stochastiques. Par exemple, moins dune minute
est ncessaire pour obtenir les btiments prsents sur la figure 4.1. Les zones reconstruites
sur les figures 4.3, 4.4 et 4.5 sont, elles, ralises en une vingtaine de minutes environ.
87
uniforme ( = 0, 9999 et U = 986). Le gain de temps est, par consquent, trs intressant.
Il est difficile de le dfinir avec exactitude puisque, en pratique, aucune configuration finale
nest identique une autre avec des schmas de dcroissance diffrents. On peut cependant
affirmer que le gain de temps est au moins dun facteur 3.
Le graphe sur la figure 4.8-(bas) montre la dcroissance nergtique dun schma utilisant le noyau Q2 durant la phase dexploration du recuit et le noyau Q 3 durant la phase
de rgularisation. La temprature initiale est trs basse, car estime avec le noyau Q 2 (voir
le principe de lestimation de la temprature initiale dans la partie 3.4.2). Durant la phase
dexploration, lnergie de la configuration courante varie peu, celle-ci tant dj initialement bonne. Quand on entre dans la phase de rgularisation, on constate une lgre descente
nergtique qui amne la convergence. Cette descente est provoque par lutilisation du
noyau Q3 qui ajuste et rgularise les paramtres des objets de la configuration. En pratique,
lutilisation dun tel schma nest pas recommande : on se trouve assez rgulirement
pig dans des minima locaux. Il est important dinclure dans le schma de dcroissance
un noyau uniforme qui explore alatoirement lespace dtat, et de ne pas utiliser que des
noyaux focalisant leurs propositions sur des configurations a priori qui peuvent parfois tre
mauvaises. Lutilisation du noyau uniforme est donc indispensable pour faire face aux ventuelles erreurs destimation des paramtres intervenant dans les noyaux Q 2 et Q3 .
La figure 4.9 prsente deux graphes, le premier illustrant un schma de dcroissance
fond uniquement sur lutilisation du noyau Q 2 , et le second, sur lutilisation du noyau de
rgularisation Q3 . Comme nous lavons soulign dans le paragraphe prcdent, lnergie
volue peu en utilisant le noyau dexploration Q 2 . La convergence est relativement lente
(mme si elle est plus rapide que pour un noyau uniforme). La solution obtenue, bien que
souvent moyennement rgularise, a cependant lavantage dtre fidle aux donnes, cest-dire au MNE. Le noyau Q3 (voir figure 4.9-(bas)) fonctionne de manire inverse. La solution est bien rgularise, mais peut tre altimtriquement loigne de la ralit. Le schma
de dcroissance illustre ces propos : la convergence rapide et brutale caractrise une bonne
qualit de rgularisation. Par contre, lnergie de la solution peut tre trs mauvaise : le
rsultat est quantitativement mdiocre. Lutilisation de ce noyau est donc particulirement
dangereuse car elle force la convergence vers une configuration rgularise de la configuration courante. Il doit tre utilis en fin de processus, proximit de la solution globale.
Discrtisation de lespace dtat ?
La mthode de reconstruction en 3D a t prsente en utilisant un espace dtat dont
les variables sont, pour la plupart, valeurs continues sur des compacts de R. Il nest cependant pas exclu de discrtiser cet espace dtat afin notamment de rduire les temps de
calcul. Concrtement, cela revient introduire un pas de discrtisation (en mtre). Plus le
pas sera important, moins la prcision de la modlisation sera grande, et plus les temps de
calcul seront faibles. Fixer un pas de discrtisation revient donc jouer sur le compromis
temps de calcul / prcision de la modlisation.
La discrtisation de lespace dtat prsente galement un autre avantage : la qualit
de la rgularisation. Celle-ci est un critre important dans notre approche structurelle puis-
88
Evaluation
89
90
Evaluation
91
quelle permet le bon assemblage des modules 3D entre eux. Avec un espace discrtis, les
paramtres dobjets voisins peuvent prendre la mme valeur, et lassemblage peut ainsi tre
optimal. Quand lespace dtat nest pas discrtis, il est trs difficile dobtenir, sous des
temps de calcul raisonnables, un assemblage parfait sans la prsence de petits dcalages
dajustement des paramtres. Cet inconvnient a toutefois des consquences mineures sur
la qualit du rendu visuel, surtout quand les facettes de toits et de faades sont textures.
Au vu de la rsolution planimtrique et altimtrique de nos donnes, la discrtisation
de lespace dtat est une opration tout fait intressante. En effet, devant la prcision dcimtrique des MNE, il nest pas particulirement pertinent dexiger une prcision absolue
pour la modlisation 3D. Le choix du pas de discrtisation dpend des contraintes dutilisations. Un pas pris 20cm apparat comme un bon compromis entre la prcision et les temps
de calcul.
92
Evaluation
F IG . 4.11 Influence des supports 2D sur la reconstruction - exemple avec lhtel de ville
dAmiens - Simulation PLEIADES et vrit terrain 3D (haut), supports 2D automatiques et
reconstruction associe (centre), supports 2D manuels et reconstruction associe (bas)
93
F IG . 4.12 Trois exemples de reconstructions obtenues avec une saisie manuelle des supports 2D
94
Evaluation
95
96
Evaluation
Nous avons test le processus sur une zone pavillonnaire prsente sur la figure 4.14.
Pour ce faire, les termes permettant dintroduire des interactions entre les objets ont t ngligs (seuls les termes dattache aux donnes ont t pris en compte). Nos a priori sont, en
effet, inutiles dans le cadre pri-urbain et leur utilisation peut mme provoquer des ambiguts et erreurs travers une "sur-connexion" dobjets. Les maisons sont en gnral correctement localises comme on peut le constater sur la figure 4.14. Cependant, lorsque deux
maisons sont trs proches lune de lautre ou lorsque des arbres sont disposs entre elles,
le processus dextraction distingue une seule structure. Le principal point ngatif provient
de la mauvaise reconnaissance des formes de toit. Les btiments sont trs petits dun point
de vue surfacique sur le MNE 0, 7 mtre de rsolution : il est trs difficile de restituer
la forme correcte du toit. De plus, les structures sont isoles et nont pas dobjets voisins :
les interactions de connexion entre objets ne peuvent pas tre utilises pour aider dans la
dcision. Ces raisons expliquent pourquoi un nombre non ngligeable de maisons ont une
forme de toit errone. En dfinitive, notre processus fournit des rsultats exploitables sur ce
type de zones, mais nest toutefois pas adapt.
97
98
Evaluation
On peut, par ailleurs, noter que les deux processus proposent des terminaisons de btiments souvent errones. Cest le cas de lhtel de ville dAmiens sur lequel les deux tourelles au premier plan sont des toits avec doubles attaques en V. Notre processus propose
une attaque en V simple tandis que le processus original propose lui un toit pyramidal. On
retrouve galement ce problme sur la prison de Toulouse : plusieurs terminaisons sont,
dans les deux cas, mal restitues. Ce point souligne la difficult reconnatre les terminaisons des btiments, qui sont gnralement de trs petites structures, partir des MNE
PLEIADES.
Rsultats partir dimages ariennes haute rsolution
Nous avons constat, dans la partie 4.4, que notre processus de reconstruction 3D ne se
limitait pas une utilisation "satellitaire" travers des modlisations globales de btiments
(principaux pans de toit). Le processus peut galement fournir des modlisations plus dtailles (avec des avances de faades, des dcrochements de toit,...) sous rserve davoir un
partitionnement prcis des supports 2D. Nous prsentons ici des rsultats obtenus dans un
contexte arien, partir de donnes haute rsolution (0, 25 cm). Des rsultats complmentaires sont illustrs en annexe F.
La figure 4.16 prsente le rsultat obtenu sur lUniversit des Sciences dAmiens partir
dun MNE arien 0, 25cm. La qualit de la modlisation est trs satisfaisante. De nombreux dtails sont restitus comme par exemple des balcons ou de petites cours intrieures.
La prcision altimtrique est trs bonne et les formes de toit sont correctement restitues
comme on peut le constater sur la figure 6.18. Le processus sadapte trs bien des MNE
ariens haute rsolution.
Reconstruction de superstructures partir dimages ariennes trs haute rsolution
Le processus 3D permet galement de reconstruire les superstructures des btiments
partir dimages ariennes trs haute rsolution ( 0, 1 mtre). Les superstructures sont des
lments contenus sur les toits des btiments, le plus souvent correspondant des chemines, des chien-assis et des verrires.
La figure 4.17 prsente un rsultat obtenu sur un extrait de toit contenant des diffrentes
sortes de superstructures. La qualit de la modlisation est globalement satisfaisante. Les
rsultats obtenus sont encourageants. Les superstructures sont majoritairement bien reconstruites. Les chemines sont modlises par des toits plats. Les chien-assis et verrires sont
eux reconstruits respectivement par des attaques en V et par des bi-plans et toits en appentis. Des erreurs frquentes sont toutefois prsentes, principalement sur les chemines. Cela
sexplique par le fait que notre bibliothque de modles nest pas spcifiquement adapte
pour la reconnaissances de ces petites formes. Pour amliorer les rsultats, il faudrait inclure
des modles de superstructures dans la bibliothque et introduire, dans la formulation de la
densit, des connaissances a priori sur la taille des objets et des interactions dinclusion
superstructures/toits. Des rsultats complmentaires sont prsents en annexe F.
99
100
Evaluation
Chapitre 5
Conclusion
102
Conclusion
103
modlisation globale automatique des btiments en utilisant des approches robustes de type
objets. Cependant, la densit des zones urbaines ne doit pas tre trop leve. A limage
du centre-ville de Toulouse, les environnements trs denses semblent difficilement modlisables par un processus automatique.
Intrts du processus propos
Le processus de modlisation tridimensionnelle mis en place prsente plusieurs points
de satisfaction qui justifient lutilisation doutils stochastiques au sein dune approche objet
structurelle.
La mthode permet dobtenir de manire relativement robuste des rsultats satisfaisants, aussi bien du point de vue quantitatif que qualitatif, dans un cadre difficile
(images satellitaires de qualit moyenne pour la problmatique de modlisation urbaine 3D, mthode automatique sans utilisation de donnes cadastrales et sans focalisation sur des btiments, zones urbaines denses relativement complexes et varies).
Le processus est volutif dans la mesure o on peut ajouter ou supprimer avec facilit
des modles 3D dans la bibliothque. On peut donc esprer adapter notre mthode
sur des paysages urbains diffrents des zones europennes en crant de nouveaux
modles de formes de toit inclure dans la bibliothque.
La mthode ne fonctionne pas uniquement partir de donnes satellitaires. Elle peut,
en effet, tre utilise des rsolutions plus fines, typiquement partir de donnes
ariennes. Avec un partitionnement prcis des supports 2D, elle permet dobtenir,
partir de MNE ariens haute et trs haute rsolution, des modlisations dtailles avec
des avances de faades, des dcrochements de toits et mme des superstructures.
Lapproche permet dutiliser de manire spare soit le processus dextraction des
supports 2D (chapitre 2), soit le processus de reconstruction 3D (chapitre 3). Intgr la plateforme de modlisation 3D de lIGN, ce dernier constitue un processus
semi-automatique intressant permettant de fournir des modlisations trs dtailles
partir dun partitionnement manuel des supports 2D.
Les limites
Le processus automatique de modlisation 3D possde nanmoins plusieurs dfauts relativement pnalisant en vue dune utilisation grande chelle.
Le processus rencontre des difficults dans certaines situations. Ainsi, le MNE utilis
doit imprativement avoir des discontinuits de faades franches, sans quoi le processus dextraction des supports fournit des rsultats inexploitables. Par ailleurs, la
mthode ne permet pas, partir de MNE 0, 7 mtre de rsolution, une bonne restitution des toits pour les petites structures isoles style maisons mitoyennes. Enfin,
le processus connat des problmes de sur et sous-dtections. La vgtation nest pas
gre, ce qui engendre une confusion entre arbres et btiments. De mme, les petites
104
Conclusion
structures dans les cours intrieures sont difficilement, voire pas du tout, dtectes.
Ltape dextraction des supports 2D, comme ltape de reconstruction 3D font appel
des mthodes doptimisation stochastiques qui sont assez lentes. Les temps de calculs du processus restent trs importants malgr les techniques dacclration mises
en place.
Le processus est particulirement dpendant de la mthode dextraction des supports
2D. La mthode de reconstruction 3D ne permet pas, en effet, de corriger les ventuelles erreurs de positionnement des supports 2D. De ce fait, le processus peut tre
sujet des accumulations derreurs au cours des deux phases successives de la modlisation. Il parat important, afin de gagner en robustesse, dintroduire, entre les deux
phases du processus, une mthode permettant lvaluation et la correction ventuelle
des supports 2D.
Perspectives
Les perspectives damlioration du processus sarticulent essentiellement autour de trois
axes de recherche : lextraction des supports 2D, loptimisation de la mthode de reconstruction 3D, et la gestion des dtails dans les modlisations.
Lextraction des supports 2D
Comme nous avons pu le voir prcdemment, la qualit des reconstructions dpend
fortement de la qualit des supports 2D qui ont t extraits. Le processus automatique dextraction des supports permet essentiellement de reconstruire la forme gnrale des toits. Or,
avec des supports plus prcis et mieux partitionns, on obtiendrait des modlisations plus
dtailles. Lenjeu est donc important. Deux pistes paraissent particulirement intressantes.
La premire consiste reprendre le processus dextraction propos et chercher affiner
le partitionnement des supports. La mthode prendrait ainsi en compte diffrents niveaux
de dtails et permettrait dextraire notamment les avances de toits et les dcrochements
de faades. Dans le mme temps, on pourrait mettre en place une mthode permettant de
dtecter les petites structures lintrieur des cours intrieures.
La seconde solution consiste proposer un nouveau processus dextraction. La piste la
plus intressante est probablement apporte par les champs polygonaux de Markov [Arak
et Surgailis, 1989]. Les processus ponctuels marqus sont des outils stochastiques efficaces
pour extraire des objets dans les images. Ces objets doivent, cependant, tre paramtriquement simples pour avoir des temps de calcul raisonnables (au plus cinq six paramtres par
objet). Or, les emprises de btiments sont des formes complexes pouvant difficilement tre
dcrites par des objets simples sans lutilisation a posteriori dun processus de transformation en objets plus complexes. Les champs polygonaux de Markov peuvent potentiellement
fournir des descriptions beaucoup plus fines travers des polygones [Kluszczynski et al.,
2004], tout en gardant les aspects intressants des modlisations stochastiques (introduction
de contraintes gomtriques sur les polygones, mises en place dinteractions, possibilit
105
dutiliser des espaces dtat continus,...).
Loptimisation
Dans la partie 3.3.4, nous avons voqu et discut de lutilisation de techniques doptimisation alternatives celle propose dans le manuscrit. Il apparat important dapprofondir
cette direction. Nous avons montr que les processus de diffusion sauts pouvaient tre utiliss pour optimiser notre nergie. Ce type dalgorithmes est particulirement intressant
dans la mesure o les temps de calcul seraient significativement rduits. Une autre possibilit pourrait tre dutiliser les techniques fondes sur les modles graphiques. Un procd
intressant consisterait utiliser une modlisation par graphe hirarchique deux niveaux :
le niveau infrieur correspondant des squences dobjets (dont loptimisation locale est relativement simple et rapide), le niveau suprieur permettant dintroduire des lois de dpendance sur le raccordement des squences entre elles. On pourrait galement se pencher sur
les techniques de propagation des messages. Les mthodes de "belief propagation" semblent
tre particulirement bien adaptes, dautant que les graphes de notre problme possdent
souvent peu de cycles.
Nous pourrions galement imaginer utiliser des modles de reconstruction 3D peu prcis mais rapides ( limage de ceux proposs en annexe) comme une initialisation pour un
modle dterministe plus prcis. Ainsi, les rsultats fournis par le processus prsent en
annexe E permettraient de donner le type de toit des objets ainsi quune estime des valeurs des paramtres. Nous pourrions alors utiliser ces informations pour fournir une bonne
initialisation un processus dterministe rapide et prcis.
La gestion des dtails
Il semble particulirement intressant dadapter plus spcifiquement la mthode de reconstruction 3D des objets reprsentant des niveaux de dtails diffrents. On pourrait ainsi
alimenter la bibliothque dobjets permettant la restitution de nombreux dtails situs sur
les toits ou cot des faades. Les rsultats encourageants obtenus sur la reconstruction de
superstructures permettent denvisager la mise en place dune densit a posteriori plus complexe, permettant de grer des interactions dinclusion entre les objets (notamment entre les
superstructures et les toits).
Bilan
Lapproche structurelle est, dune manire gnrale, une solution trs intressante pour
aborder la modlisation 3D denvironnements urbains. Dun intrt limit dans les milieux
pri-urbains, cette approche est particulirement bien adapte pour traiter les zones urbaines
denses. A mi-chemin entre une modlisation purement paramtrique et une modlisation
polydrique, elle apparat comme un compromis trs intressant permettant notamment de
concilier les deux aspects majeurs de lvaluation dune scne 3D : la fidlit la ralit et
la qualit du rendu visuel.
Lapproche structurelle idale serait un processus monolithique, cest--dire quelle permettrait de raliser simultanment la phase dextraction des supports 2D et la phase de
106
Conclusion
Bibliographie
Allain, R., 2004. Morphologie Urbaine : Gographie, amnagement et architecture de la
ville. A. Colin.
Ameri, B., 2000. Feature based model verification : A new concept for hypothesis validation in building reconstruction. Dans : Proc. of the XIXth ISPRS Congress. Vol. 33, B3.
Amsterdam, Pays-Bas, pp. 2435.
Arak, T., Surgailis, D., 1989. Markov fields with polygonal realisations. Probability Theory
and Related Fields 80, 543579.
Baillard, C., 1997. Analyse dimages ariennes stroscopique pour la restitution 3D des
milieux urbains. Dtection et caractristique du sursol. Thse de doctorat, Ecole Nationale Suprieure des Tlcommunications de Paris.
Baillard, C., Zisserman, A., 1999. Automatic reconstruction of piecewise planar models
from multiple views. Dans : Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Corfu, Grce.
Bailloeul, T., Prinet, V., Serra, B., Marthon, P., 2005. Spatio-temporal prior shape constraint
for level set segmentation. Dans : Proc. Energy Minimization Methods in Computer Vision and Pattern Recognition. St. Augustine, Etats-Unis.
Besag, J., 1986. On statistical analysis of dirty pictures. Journal of the Royal Statistical
Society 48 (3), 259302.
Blake, A., Zisserman, A., 1987. Visual reconstruction. Dans : MIT Press. M.A., Cambridge.
Boykov, Y., Veksler, O., Zabih, R., 1999. Fast approximate energy minimization via graph
cuts. Dans : IEEE proc. of International Conference on Computer Vision. Corfu, Grce.
Brdif, M., Boldo, D., Pierrot-Deseilligny, M., Matre, H., 2007. 3D building reconstruction
with parametric roof superstructures. Dans : Proc. of the IEEE International Conference
on Image Processing. San Antonio, Etats-Unis.
Brenner, C., Haala, N., Fritsch, D., 2001. Towards fully automated 3D city model generation. Dans : Proc. of the Workshop on Automatic Extraction of Man-Made Objects from
Aerial and Space Images. Ascona, Suisse.
Brenner, C., Ripperda, N., 2006. Extraction of facades using RJMCMC and constraint equations. Dans : Proc. of the ISPRS Commission III Symposium on Photogrammetric and
Computer Vision. Bonn, Allemagne.
108
BIBLIOGRAPHIE
Bretar, F., 2006. Couplage de donnes laser aroport et photogrammtriques pour lanalyse de scnes tridimensionnelles. Thse de doctorat, Ecole Nationale Suprieure des
Tlcommunications de Paris.
Celeux, G., Diebolt, J., 1986. Lalgorithme SEM : un algorithme dapprentissage probabiliste pour la reconnaissance de mlange de densits. Revue de Statistique Applique
34(2), 3552.
Cellier, F., 2007. Reconstruction 3d de btiments en interfromtrie rso haute rsolution,
approche par gestion dhypothses. Thse de doctorat, Ecole Nationale Superieure des
Telecommunications de Paris.
Chehata, N., Pierrot-Deseilligny, M., Stamon, G., 2005. Hybrid digital elevation models
computation constrained by 3d-primitives : A global optimization algorithm using graph
cuts. Dans : Proc. of the IEEE International Conference on Image Processing. Genova,
Italie.
Ching, F., 1996. Building Construction Illustrated : A Visual Dictionary of Architecture,
Form, Space and Order. John Wiley & Sons.
Cocquerez, J., Philipp, S. (Eds.), 1995. Analyse dimages : filtrage et segmentation. MASSON.
Collins, R., 1996. A space-weep approach to true multi-image matching. Dans : Proc. of the
IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society,
San Francisco, Etats-Unis, pp. 358365.
Collins, R., Jaynes, C., Cheng, Y.-Q., Wang, X., Stolle, F., Riseman, E., Hanson, A., 1998.
The ascender system : Automated site modeling from multiple aerial images. Computer
Vision and Image Understanding 72 (2), 143162.
Dang, T., 1994. Interpretation et restitution automatique des batiments isoles a partir dun
couple stereoscopique dimages aeriennes. These de doctorat, Ecole Nationale Superieure
des Telecommunications de Paris.
De Joinville, O., 2003. Evaluation de la qualite dune cartographie urbaine a laide dimages
aeriennes a haute resolution. Thse de doctorat, Ecole Nationale Superieure des Telecommunications de Paris.
Dempster, A., Laird, N., Rubin, D., 1977. Maximum likelihood from incomplete data via
the EM algorithm. Journal of the Royal Statistical Society B 39, 138.
Descombes, X., 2004. Mthodes stochastiques en analyse dimage : des champsde markov
aux processus ponctuels marqus. Habilitation diriger des recherches, Universite de
Nice Sophia Antipolis.
Descombes, X., Zhizhina, E., 2004. Applications of gibbs fields methods to image processing problems. Problems of Information Transmission 40 (3), 108125.
Dick, A., Torr, P., Cipolla, R., Nov 2004. Modelling and interpretation of architecture from
several images. International Journal of Computer Vision 60 (2), 111134.
BIBLIOGRAPHIE
109
Doucet, A., Godsill, S., Andrieu, C., 2000. On Sequential Monte Carlo Sampling Methods
for Bayesian Filtering. Statistics and Computing 10 (3), 197208.
Durupt, M., Taillandier, F., 2006. Automatic building reconstruction from a digital elevation model and cadastral data : an operational approach. Dans : Proc. of the ISPRS
Commission III Symposium on Photogrammetric and Computer Vision. ISPRS, Bonn,
Allemagne.
Fischer, A., Kolbe, T., Lang, F., Cremers, A., Forstner, W., Plumer, L., Steinhage, V., 1998.
Extracting buildings from aerial images using hierarchical aggregation in 2D and 3D.
Computer Vision and Image Understanding 72 :2, 163185.
Flamanc, D., Maillet, G., 2005. Evaluation of 3d city model production from pleiades-hr
images and 2d ground maps. Dans : URBAN, GRSS/ISPRS Joint Workshop on Data
Fusion and Remote Sensing over Urban Areas. Tempe, Etats-Unis.
Flamanc, D., Maillet, G., Jibrini, H., Sep 2003. 3-d city models : an operational approach
using aerial images and cadastral maps. Dans : ISPRS Conference Photogrammetric
Image Analysis (PIA). Munich, Allemagne, pp. 5358.
Forney, J., 1973. The Viterbi algorithm. Proceedings of the IEEE 13, 268278.
Fritsch, D., 1999. Virtual cities and landscape models - what has photogrammetry to offer ?
Dans : Proceedings of the Photogrammetric Week. pp. 314.
Frueh, C., Jain, S., Zakhor, A., 2005. Data processing algorithms for generating textured
3D building facade meshes from laser scans and camera images. International Journal of
Computer Vision 61 (2), 159184.
Fuchs, F., 2001. Contribution la reconstruction du bti en milieu urbain, laide dimages
ariennes stroscopiques grande chelle. Etude dune approche structurelle. Thse de
doctorat, Universite Ren Descartes - Paris 5.
Gamba, P., Houshmand, B., Saccani, M., 2000. Detection and extraction of buildings from
interferometric sar data. IEEE Transactions on Geoscience and Remote Sensing 38 (1),
611617.
Gaminet, O., 1999. Architecture et Urbanisme : lespace moderne et la ville. Editions de
lEcole Polytechnique.
Garcin, L., Descombes, X., Zerubia, J., Le Men, H., 2001. Buiding extraction using a Markov point process. Dans : Proc. of the IEEE International Conference on Image Processing. Thessalonique, Grce.
Geman, S., Geman, D., 1984. Stochastic relaxation, gibbs distribution ans the Bayesian
restoration of images. IEEE Transactions on Pattern Analysis and Machine Intelligence
6, 721741.
Geman, S., Huang, C., 1986. Diffusion for global optimization. Journal of Control and
Optimization 24 (5), 10311043.
110
BIBLIOGRAPHIE
Green, P., 1995. Reversible Jump Markov Chains Monte Carlo computation and Bayesian
model determination. Biometrika 57, 97109.
Greig, D., Porteous, T., Seheult, A., 1989. Exact maximum a posteriori estimation for binar
images. Journal of the Royal Statistical Society 51 (B), 271279.
Grenander, U., Chow, Y., Keenan, D. M., 1991. Hands : a pattern theoretic study of biological shapes. Springer-Verlag New York, Inc., New York, Etats-Unis.
Grenander, U., Miller, M., 1994. Representations of Knowledge in Complex Systems. Journal of the Royal Statistical Society 56 (4).
Gruen, A., 1998. Tobago - a semi-automated approach for the generation of 3D building
models. ISPRS Journal of Photogrammetry and Remote Sensing 53 (2), 108118.
Gruen, A., Wang, X., 1998. CC-modeler : a topology generator for 3D city models. ISPRS
Journal of Photogrammetry and Remote Sensing 53 (5), 286295.
Haala, N., Brenner, C., 1999. Extraction of buildings and trees in urban environments. ISPRS Journal of Photogrammetry and Remote Sensing 54 (2-3), 130137.
Haario, H., Saksman, E., 1991. Simulated annealing process in general state space. Advances in Applied Probability (23), 866893.
Han, F., Tu, Z., Zhu, S., 2004. Range Image Segmentation by an Effective Jump-Diffusion
Method. IEEE Trans. on Pattern Analysis and Machine Intelligence 26 (9), 11381153.
Hastings, W., 1970. Monte Carlo sampling using Markov chains and their applications.
Biometrica 57(1), 97109.
Henricsson, O., 1998. The role of color attributes and similarity grouping in 3D building
reconstruction. Computer Vision and Image Understanding 72 (2), 163184.
Heuel, S., Lang, F., Forstner, W., 2000. Topological and geometrical reasoning in 3D grouping for reconstructing polyhedral surfaces. Dans : Proc. of the XIXth ISPRS Congress.
Amsterdam, Pays-Bas.
Jaynes, C., Hanson, A., Riseman, E., Schultz, H., 1997. Building reconstruction from optical
and range images. Dans : Proc. of the IEEE Conference on Computer Vision and Pattern
Recognition. San Juan, Porto Rico.
Jibrini, H., 2002. Reconstruction automatique de btiments en modles polyhdriques 3D
partir de donnes cadastrales vectorises 2D et un couple dimages ariennes haute
rsolution. Thse de doctorat, Ecole Nationale Suprieure des Tlcommunications de
Paris.
Kada, M., 2006. 3D building generalization based on half-space modeling. Dans : workshop
ISPRS, commission II. Hannovre, Allemagne.
Kloeden, P., Platen, E., 1992. Numerical solution of stochastic differential equations.
Springer-Verlag, New York.
BIBLIOGRAPHIE
111
Kluszczynski, R., VanLieshout, M. N. M., Schreiber, T., 2004. Image segmentation by polygonal markov fields. Research Report 0409, PNA.
Lacoste, C., Descombes, X., Zerubia, J., October 2005. Point processes for unsupervised
line network extraction in remote sensing. IEEE Trans. Pattern Analysis and Machine
Intelligence 27 (10), 15681579.
Lafert, J., 1996. Contribution lanalyse dimages par modles markoviens sur des graphes
hirarchiques. applications la fusion de donnes multirsolutions. Thse de doctorat,
Universit de Rennes 1.
Lee, S., Nevatia, R., 2003. Interactive 3D building modeling using a hierarchical representation. Dans : IEEE Workshop on Higher-Level Knowledge in 3D Modeling and Motion
(HLK). Nice, France.
Li, J., Nevatia, R., Noronha, S., 1999. User assisted modeling of buildings from aerial
images. Dans : Proc. of the IEEE Conference on Computer Vision and Pattern Recognition. Fort Collins, Etats-Unis.
Li, S., 1995. Markov Random Field modeling in computer vision. Springer-Verlag.
Lin, C., Nevatia, R., 1998. Building detection and description from a single intensity image.
Computer Vision and Image Understanding 72 (2), 101121.
Maas, H., Vosselman, G., 1999. Two algorithms for extracting building models from raw
laser altimetry data. ISPRS Journal of Photogrammetry and Remote Sensing 54, 153
163.
McGlone, J., Shufelt, J., 1994. Projective and object space geometry for monocular building
extraction. Rapport technique, Carnegie Mellon University.
Metropolis, M., Rosenbluth, A., Teller, A., Teller, E., 1953. Equation of state calculations
by fast computing machines. Journal of Chemical Physics 21, 10871092.
Mitchell, M., 1996. Introduction to genetic algorithms. Dans : MIT Press. M.A., Cambridge.
Nevatia, R., Price, K., 2002. Automatic and interactive modeling of buildings in urban environments from aerial images. Dans : Proc. of the IEEE International Conference on
Image Processing. Rochester, Etats-Unis.
Noronha, S., Nevatia, R., 2001. Detection and modeling of buildings from multiple aerial
images. IEEE Transactions on Pattern Analysis and Machine Intelligence 23 (5), 501
518.
Oriot, H., 2003. Statistical snakes for building extraction from stereoscopic aerial images.
Dans : ISPRS Conference on Photographic Image Analyses. Hannovre, Allemagne.
Ortner, M., 2004. Processus ponctuels marqus pour lextraction automatique de caricatures
de btiments partir de Modles Numriques dElvation. Thse de doctorat, Universit
de Nice Sophia Antipolis.
112
BIBLIOGRAPHIE
Ortner, M., Descombes, X., Zerubia, J., 2007. Building outline extraction from digital elevation models using marked point processes. International Journal of Computer Vision
72 (2), 107132.
Palubinskas, G., Descombes, X., Kruggel, F., August 1998. An unsupervised clustering
method using the entropy minimization. Dans : Proc. International Conference on Pattern
Recognition. Brisbane, Australie.
Paparoditis, N., Cord, M., Jordan, M., Cocquerez, J.-P., 1998. Building detection and reconstruction from mid-and high-resolution aerial imagery. Computer Vision and Image
Understanding 72 (2), 122142.
Penard, L., Paparoditis, N., Pierrot-Deseilligny, M., 2006. Reconstruction 3D automatique
de faades de btiments en multi-vues. Dans : Reconnaissance des Formes et Intelligence
Artificielle. Tours, France.
Pennec, X., 1996. Lincertitude dans les problmes de reconnaissance et de recalage applications en imagerie mdicale et biologie molculaire. Thse de doctorat, Ecole Polytechnique, Palaiseau, France.
Perrin, G., Descombes, X., Zerubia, J., November 2005. Adaptive simulated annealing for
energy minimization problem in a marked point process application. Dans : Proc. Energy
Minimization Methods in Computer Vision and Pattern Recognition. St Augustine, EtatsUnis.
Pierrot-Deseilligny, M., Paparoditis, N., 2006. A multiresolution and optimization-based
image matching approach : an application to surface reconstruction from SPOT5-HRS
stereo imagery. Dans : Workshop ISPRS commission I. Ankara, Turquie.
Prez, P., 2003. Modles et algorithmes pour lanalyse probabilistiques des images. Habilitation diriger des recherches, Universite de Rennes 1.
Robert, C., 1996. Mthodes de Monte Carlo par Chanes de Markov. Statistique mathmatique et probabilit. Economica.
Robert, C., Casella, G., 1999. Monte Carlo Statistical Methods. Springer-Verlag, New York.
Rottensteiner, F., Briese, C., 2002. A new method for building extraction in urban areas
from high-resolution lidar data. Dans : Proc. of the ISPRS Commission III Symposium
on Photogrammetric and Computer Vision. Vol. 34. Graz, Autriche.
Roy, S., Cox, I., 1998. A maximum-flow formulation of the n-camera stereo correspondence problem. Dans : Proc. of the IEEE International Conference on Computer Vision.
Bombay, Inde.
Salamon, P., Sibani, P., Frost, R., 2002. Facts, conjectures, and improvements for simulated
annealing. SIAM Monographs on Mathematical Modeling and Computation. Society for
Industrial and Applied Mathematics, Philadelphia.
BIBLIOGRAPHIE
113
Salomon, M., Perrin, G., Heitz, F., 2002. Parallel sampling with stochastic differential equations for 3D deformable matching of medical images. Dans : Proc. International Conference on Parallel and Distributed Processing Techniques and Applications. Las Vegas,
Etats-Unis.
Scholze, S., Moons, T., Van Gool, L., 2002. A probabilistic approach to building roof reconstruction using semantic labelling. Dans : Proc. of the DAGM Conference. Vol. 2449
de Lecture Notes in Computer Science. Zurich, Suisse.
Senegas, J., 2002. Mthodes de Monte Carlo en vision stroscopique -Application ltude
de Modles Numriques de Terrain. Thse de doctorat, Ecole des Mines de Paris.
Simonetto, E., Oriot, H., Garello, R., Le Caillec, J., 2003. Radargrammetric processing for
3D building extraction from high-resolution airborne SAR data. Dans : IEEE International Geoscience and Remote Sensing Symposium. Toulouse, France.
Soergel, U., Michaelsen, E., Thoennessen, U., Stilla, U., 2005. Potential of high-resolution
sar images for urban analysis. Dans : URBAN, GRSS/ISPRS Joint Workshop on Data
Fusion and Remote Sensing over Urban Areas. Tempe, Etats-Unis.
Srivastava, A., Grenander, U., Jensen, G., Miller, M., 2002. Jump-Diffusion Markov processes on orthogonal groups for object recognition. Journal of Statistical Planning and
Inference 103(1/2), 1737.
Stoyan, D., Kendall, W., Mecke, J., 1987. Stochastic Geometry and its Applications. John
Wiley and Sons.
Suveg, I., Vosselman, G., 2001. 3D building reconstruction by map based generation and
evaluation of hypotheses. Dans : British Machine Vision Conference. Manchester, Angleterre.
Taillandier, F., 2004. Reconstruction de bti en milieu urbain : une approche multi-vues.
Thse de doctorat, Ecole Polytechnique.
Taillandier, F., Deriche, R., 2002. Reconstruction of 3D linear primitives from multiple
views for urban areas modelisation. Dans : Proc. of the ISPRS Commission III Symposium on Photogrammetric and Computer Vision. Graz, Autriche.
Tison, C., 2004. Interfromtrie RSO haute rsolution en milieu urbain : application au
calcul de MNS urbain. Thse de doctorat, Ecole Nationale Suprieure des Tlcommunications de Paris.
Tu, Z., Zhu, S., 2002. Image Segmentation by Data-Driven Markov Chain Monte Carlo.
IEEE Trans. on Pattern Analysis and Machine Intelligence 24 (5), 657673.
Tupin, F., Roux, M., 2003. Detection of building outlines based on the fusion of sar and
optical features. ISPRS Journal of Photogrammetry and Remote Sensing 58 (1), 7182.
Van Laarhoven, P., Aarts, E., 1987. Simulated Annealing : Theory and Applications. D.
Reidel, Boston.
114
BIBLIOGRAPHIE
Van Lieshout, M., 2000. Markov point processes and their applications. Dans : Imperial
College Press. Londre.
Varanelli, J., 1996. On the acceleration of the simulated annealing. Thse de doctorat, University of Virginia, Charlottesville, Etats-Unis.
Vestri, C., 2000. Outils pour la reconstruction automatique de btiments partir dimagerie
arienne. Thse de doctorat, Universit de Nice-Sophia Antipolis.
Vinson, S., Cohen, L., 2002. Multiple rectangle model for buildings segmentation and 3D
scene reconstruction. Dans : Proc. of the International Conference on Pattern Recognition. Quebec, Canada.
Viterbi, A., 1967. Error bounds for convolutional codes and an asymptotically optimum
decoding algorithm. IEEE Transactions on Information Theory 13, 260269.
Wang, X., Totaro, S., Taillandier, F., Hanson, A., Teller, S., 2002. Recovering facade texture and microstructure from real-world images. Dans : Proc. of ISPRS Commission III
Symposium on Photogrammetric Computer Vision. Graz, Autriche.
Weidner, U., Forstner, W., 1995. Towards automatic building reconstruction from highresolution digital elevation models. ISPRS Journal of Photogrammetry and Remote Sensing 50 (4), 3849.
White, S., 1984. Concepts of scale in simulated annealing. Dans : IEEE proc. of International Conference on Computer Design. pp. 646651.
Willuhn, W., Ade, F., 1996. A rule-based system for house reconstruction from aerial
images. Dans : Proc. of the International Conference on Pattern Recognition. Vienne,
Autriche.
Winkler, G., 1995. Image analysis, random fields and Markov chain Monte Carlo methods
a mathematical introduction. Springer.
Xu, G., Zhang, Z., 1996. Epipolar Geometry in stereo, motion and object recognition. Kluwer Academic Publishers.
Zhao, H., Shibasaki, R., 2001. Reconstructing textured CAD model of urban environment
using vehicle-borne laser range scanners and line cameras. Lecture Notes in Computer
Science 2095, 284297.
BIBLIOGRAPHIE
115
Publications de lauteur
Journaux
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Automatic building
extraction from DEMs using an object approach. Journal of Photogrammetry and
Remote Sensing, paratre, 2007.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Automatic 3D Building Reconstruction from DEMs. Revue Franaise de Photogrammtrie et de Tldtection (SFPT), paratre, 2007.
F. Lafarge, X. Descombes, J. Zerubia et S. Mathieu. Dtection de feux de fort par
analyse statistique dvnements rares partir dimages infrarouges thermiques. Traitement du Signal , Vol.24(1), 2007.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Modle Paramtrique pour la Reconstruction Automatique en 3D de Zones Urbaines Denses partir
dImages Satellitaires Haute Rsolution. Revue Franaise de Photogrammtrie et de
Tldtection (SFPT) 180 :pages 4-12, 2005.
Confrences
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. 3D city modeling
based on Hidden Markov Model. IEEE ICIP07, San Antonio, Etats-Unis, Sept. 2007.
F. Lafarge, X. Descombes et J. Zerubia. Forest Fire Detection based on Gaussian
Field Analysis. EURASIP EUSIPCO07, Poznan, Pologne, Sept. 2007.
O. Tournaire, N. Paparoditis et F. Lafarge. Rectangular road marking detection with
marked point processes. ISPRS PIA07, Munich, Allemagne, Sept. 2007.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. An Automatic Building Reconstruction Method : A Structural Approach Using HR Images. IEEE ICIP06,
Atlanta, Etats-Unis, Oct. 2006.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. Automatic 3D Building Reconstruction from DEMs : an Application to PLEIADES Simulations. In
Proc. ISPRS Commission I Symposium, Marne La Vallee, France, Juil. 2006.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. An automatic 3D city
model : A Bayesian approach using satellite images. IEEE ICASSP06, Toulouse,
France, Mai 2006.
F. Lafarge, X. Descombes et J. Zerubia. Textural kernel for SVM classification in
remote sensing : application to forest fire detection and urban area extraction. IEEE
ICIP05, Gne, Italie, Sept. 2005.
F. Lafarge, X. Descombes, J. Zerubia et S. Mathieu-Marni. Dtection de feux de
fort partir dimages satellitaires IRT par analyse statistique dvnements rares.
GRETSI05, Louvain la neuve, Belgique, Sept. 2005.
Rapports
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. A structural approach
for 3D building reconstruction. Rapport de Recherche 6048, INRIA, Nov. 2006.
116
BIBLIOGRAPHIE
F. Lafarge, P. Trontin, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. An automatic building extraction method : Application to the 3D-city modeling. Rapport de
Recherche 5925, INRIA, Mai 2006.
F. Lafarge, X. Descombes, J. Zerubia et M. Pierrot-Deseilligny. A parametric model for automatic 3D building reconstruction from HR satellite images. Rapport de
Recherche 5687, INRIA, Sept. 2005.
F. Lafarge, X. Descombes et J. Zerubia. Dtection de feux de fort par analyse statistique de la radiomtrie dimages satellitaires. Rapport de Recherche 5369, INRIA,
Nov. 2004.
F. Lafarge, X. Descombes et J. Zerubia. Noyaux texturaux pour les problmes de
classification par SVM en tldtection. Rapport de Recherche 5370, INRIA, Nov.
2004.
F. Lafarge. Dtection de feux de fort par analyses radiomtriques et texturales. Rapport de DEA, SUPAERO, Sep. 2004.
Workshops
Une approche structurelle pour la modlisation urbaine en 3D partir dimages satellitaires THR et de donnes cadastrales. Atelier PNTS "La trs haute rsolution
spatiale en tldtection", Nantes, France, Sep. 2007.
3D city modelling using RJMCMC sampler. EURANDOM workshop on image analysis and inverse problems, Eindhoven, Pays-Bas, Dec. 2006.
A structural approach for automatic 3D city modeling. Mathematical methods for
multi-channel image processing workshop (MULTIM), Pkin, Chine, Juil. 2006.
Urban 3D reconstruction from PLEIADES simulations. 6th WORKSHOP CNESDLR, DLR, Oberpfaffenoffen, Allemagne, Nov. 2005.
Textural kernel for SVM classification applied to remote sensing. 5th WORKSHOP
CNES-DLR, DLR, Oberpfaffenoffen, Allemagne, Nov. 2004.
Sminaires et communications diverses
Reconstruction en 3D de btiments par approche stochastique. DGA, Arcueil, France,
Janv. 2007.
Reconstruction en 3D de btiments partir de simulations PLEIADES. Journes
CNES jeunes chercheurs (JC 2 ), Toulouse, France, Oct. 2006.
Modles paramtriques pour la reconstruction en 3D de zones urbaines partir de
donnes satellitaires. Journes de la recherche IGN, Saint-Mand, France, Mars 2006.
Parametric models for building 3D reconstruction using satellite data. MTA-SZTAKI,
Acadmie des Sciences, Budapest, Hongrie, Dec. 2005.
Parametric 3D city models using satellite data. University of science, Szeged, Hongrie, Nov. 2005.
Chapitre 6
Annexes
118
Annexes
1- Modle simple
Dans le premier modle, nous cherchons fixer sur chaque emprise rectangulaire, un
modle de btiments 6 paramtres. La principale difficult consiste grer les interactions entre les modles voisins. Pour ce faire, nous utilisons une formulation nergtique
baysienne.
Modle paramtrique de btiments
Le modle de btiments retenu est schmatis sur la figure 6.1. Il est dfini travers
2 paramtres altimtriques (la hauteur de gouttire et la hauteur de larte fatire) et 4
paramtres morphologiques (avec la contrainte que laire du plan suprieur soit nulle : a +
b = l ou c + d = L, sans quoi, la configuration est peu raliste). Ce modle est intressant
dans la mesure o il permet de gnrer diffrents types de toits, notamment des toits plats
(Hg = Hc ), des bi-plans symtriques et dissymtriques (a = b = 0 ou c = d = 0), ou des
attaques en V (a = b = 2l et (c, d) 6= (0, 0) par exemple).
Formulation nergtique
Lnergie est mise en place dans un cadre baysien. Soient y, un MNE marqu de N
rectangles, et x, une configuration de N modles paramtriques dont les supports corres-
119
pondent aux rectangles de y. Notons C , lensemble des configurations x possibles. Alors,
nous dfinissons lnergie U dune configuration x C , connaissant y, par :
U(x) = Ud (x) +U p (x)
(6.1)
Ud correspond lnergie dattache aux donnes. En considrant lhypothse dindpendance conditionnelle des donnes (cest--dire notamment que nous ngligeons le recouvrement des rectangles, hypothse quelque peu discutable), cette nergie peut tre dcompose
en une somme dnergies locales associes chacun des N modles paramtriques de la
configuration x :
(6.2)
Ud (x) = Udl (xi )
xi x
o Udl (xi ) correspond la distance en norme L 1 entre les pixels inclus dans le rectangle i
et la cte des points correspondant du modle x i (distance au sens de la somme "pixels par
pixels").
U p (x) reprsente lnergie a priori de la configuration x. Elle se dcompose en 3 termes :
(1)
(2)
(3)
(6.3)
Les deux derniers termes sont des interactions sur les paires de rectangles voisins. Deux
rectangles sont considrs comme voisins si lintersection de leur sur-rectangle (i.e. rectangle de longueur L + et de largeur l + - en pratique, = 1m) est nulle. La figure 6.2
illustre la relation de voisinage que lon note .
U p (x) est une nergie qui mesure la complexit des N modles de x. Pour ce faire,
les modles, tant axialement symtriques par rapport la largeur et/ou la longueur
de leur emprise rectangulaire, sont favoriss. Cest le cas des toits les plus courants
tels que les toits plats ou les bi-plans. Ainsi, en notant n f (x) et nF (x), le nombre de
modles de x ayant respectivement une et deux symtries, et ( f , F ), un couple de
(1)
poids valeurs relles ngatives, nous exprimons U p (x) par :
(1)
(6.4)
(2)
i j
(6.5)
120
Annexes
o fh est la fonction relle reprsente sur la figure 6.3, et i j reprsente les paires
de modles voisins.
(3)
U p (x) favorise la continuit des artes fatires sur un btiment, toujours par des
interactions dordre 2. Plus prcisment, ce terme permet lattraction des extrmits
des artes fatires des modles voisins. En notant e i et e j , les extrmits des artes
fatires des modles xi et x j (dans R3 ), nous avons :
U p (x) = r dc (ei , e j )
(3)
(6.6)
i j
F IG . 6.3 Illustration des interactions dordre 2 - attraction des extrmits des artes fatires (gauche), ajustement des hauteurs de gouttires (droite)
121
122
Annexes
reprise dans le manuscrit, cest pourquoi nous ne nous attarderons pas la dtailler ici.
Nous prcisons juste que les sauts sont proposs de manire uniforme sur lespace des
configurations, et que le schma de dcroissance de temprature est identique celui utilis
dans le premier modle.
3- Rsultats
Les rsultats obtenus par ces deux modles sont visuellement identiques, le deuxime
modle tant une version amliore du premier dans lequel nous avons restreint lespace
des configurations. Le deuxime modle a des temps de calcul rduit dun facteur 3 environ
par rapport au premier modle. Pour un btiment compos dune dizaine demprises rectangulaires, environ 5 minutes seront ncessaires pour le premier modle, tandis que le second
mettra un peu moins de 2 minutes, sur un PC standard (2 Ghz).
La figure 6.5 prsente les reconstructions de deux btiments. Ces rsultats donnent plusieurs points de satisfaction. Dabord, la forme gnrale des btiments est globalement respecte comparativement aux vrits terrain associes. Ensuite, le terme de rgularisation
permet un ajustement efficace des hauteurs de gouttire et une bonne connexion des extrmits des artes fatires.
Cependant, ces modlisations possdent des dfauts trs pnalisants. Les discontinuits des hauteurs de toits ne sont pas retranscrites. Linconvnient majeur est la prsence de
nombreux artefacts, dus une mauvaise connexion des supports rectangulaires voisins. Des
algorithmes de simplifications de formes 3D, comme celui propos par [Kada, 2006], ne
sont pas adapts ce type dartefacts, et ne sauraient rsoudre le problme. Ce dfaut ne
peut pas tre trait dans le processus de reconstruction 3D : la solution qui simpose consiste
repenser les supports 2D. Nous abordons ce problme dans la partie 2.2. Les rsultats prsents sur la figure 6.6 soulignent la prsence importante des artefacts, pnalisant fortement
le rendu visuel des reconstructions. Les valuations altimtriques sont toutefois correctes.
Lerreur quadratique moyenne en Z est de 3,2 mtres.
Lnergie inhrente ces deux modles est rgie par un jeu de paramtres pondrateurs.
Ce jeu comporte 4 potentiels ( f , F , h et r ), particulirement difficiles rgler. Cela
reprsente un inconvnient majeur qui rend le processus de reconstruction peu robuste. La
solution consiste proposer une nergie plus pertinente, et dpendant de moins de paramtres.
123
F IG . 6.6 Rsultat sur une zone dense - emprises rectangulaires, rsultat 3D et exemples
dartefacts (haut), vrit terrain et carte dvaluation (bas).
124
Annexes
125
F IG . 6.8 Illustration des masques sur lesquels les diffrentes hauteurs sont estimes
y a lieu dtre. La figure 6.9 prsente un btiment non rgularis, ainsi que son homologue
rgularis par la mthode que nous proposons.
Nous utilisons, pour chaque groupe de supports connects, lalgorithme du "K-means",
prsent dans [Cocquerez et Philipp, 1995], incluant un terme permettant de pnaliser les
nombres de classes levs. Cet algorithme sapparente celui propos par [Palubinskas
et al., 1998] utilisant un terme entropique pour minimiser le nombre de classes. Lavantage
dun tel algorithme est que le nombre de classes nest pas connu a priori.
Considrons un ensemble de supports connects compos de N lments. Notons H gi
lestimation de la hauteur de gouttire du i eme lment de cet ensemble. Lalgorithme du
"K-means" avec terme de rgularisation consiste rechercher les c j , centrode de la j eme
classe, qui maximisent le critre J dfinie par :
J=
d 2 (Hgi , c j ) C
(6.7)
j=1 i=1
126
Annexes
4-Quelques rsultats
Les figures 6.10 et 6.11 prsentent les rsultats de cette mthode. Les modlisations obtenues, bien que trs simples, fournissent une description gnrale des btiments qui peut
tre intressante pour des applications exigeant de la robustesse et un faible temps de calcul.
F IG . 6.10 Rsultat sur lhtel de ville dAmiens - supports 2D et MNE (gauche), modlisation obtenue (centre), vrit terrain 3D (droite).
127
F IG . 6.11 Rsultats sur trois zones urbaines - supports 2D et MNE (gauche), modlisations
3D (droite).
128
Annexes
1- Dfinitions
Dfinition 2 Une suite de variables alatoires (Xn ) valeurs dans un espace E muni de sa
tribu B est une chane de Markov si :
p(Xt+1 A|X0 = x0 , ..., Xt = xt ) = p(Xt+1 A|Xt = xt )
A B
(6.8)
(6.9)
2- Stationnarit
La proprit de stationnarit est essentielle pour un chantillonneur de type Monte Carlo
par chane de Markov. La chane construire (Xt ) doit en effet avoir une mesure stationnaire
. Cette proprit est quivalente linvariance de par rapport (Xt ).
Proprit 1 Une mesure est stationnaire ou invariante pour la chane de Markov de
noyau de transition P si :
(A) =
P(x, A)d(x)
A B
(6.10)
P(x, B)d(x) =
P(y, A)d(y)
A, B B
(6.11)
129
En dautres termes, la probabilit de passer de A B est, sous , est la mme que la
probabilit de passer de B A.
3- Convergence
Dans cette partie, nous prsentons les notions dirrductibilit, dapriodicit, de rcurrence et dergodicit qui vont permettre de garantir la convergence de la chane de Markov
vers sa mesure stationnaire. La convergence de la chane de Markov vers sa mesure invariante sexprime par :
Pt (x, A) (A)
t
x E, A B
(6.12)
(6.13)
=
..
.
P(x, A2 ) = 1
=
=
(m
i=1 Ai ) = 1
P(x, Am ) = 1
P(x, A1 ) = 1
Le plus grand entier d pour lequel un d-cycle est form est appel la priode de la chane.
Si d = 1, la chane est dite apriodique.
130
Annexes
Lapriodicit de la chane est ncessaire pour avoir sa convergence. Pour avoir en pratique
lapriodicit dune chane, on vrifie la condition suffisante suivante :
x E : P(x, {x}) > 0
(6.14)
Si cette condition est vrifie, la chane est dite fortement apriodique. Lapriodicit
dune chane est donc toujours vrifie ds que la probabilit de rester dans ltat courant
est positive (cest--dire avec une probabilit de rejet non nulle dans les algorithmes de type
Metropolis-Hastings).
Lorsque la chane est -irrductible et apriodique, on obtient la convergence pour
presque tout x E :
kPt (x, .) k 0 x E\N
(6.15)
t
x E , A B /(A) > 0
(6.16)
x C , A B
(6.18)
131
Proprit 7 Soit (Xt ), une chane de Markov irrductible et apriodique. Soient C, un ensemble petit de B , et une fonction V : E R telle que lensemble {x/V (x) n} est petit
pour nimporte quel n N et que :
E[V (X1 )|X0 = x] V (x)
x E\C
(6.19)
o E[V (X1 )|X0 = x] reprsente lesprance de V (X1 ) sous la mesure de probabilit P(x,.).
Alors la chane est rcurrente au sens de Harris.
Lquation 6.19 est appele la condition de drift pour la rcurrence.
Ergodicit gomtrique
Proprit 8 Une chane de Markov est gomtriquement ergodique sil existe une constante
r > 1 telle que
x E
t=1
(6.20)
Lergodicit gomtrique est une proprit plus forte que lergodicit. Elle impose que la
convergence de Pt vers se fasse avec une vitesse gomtrique puisque lquation 6.20
implique linquation suivante :
kPt (x, .) k M r t
(6.21)
rt kPt (x, .) k. Lquation 6.20 peut tre dmontre par une condition
avec M = t=1
de drift gomtrique consistant dmontrer lexistence dune fonction V : [1, [, des
constantes b < et < 1, et un ensemble petit C B tel que :
C (x)
x E\C
(6.22)
g(x)d(x)
(6.23)
1 t
g(Xi )
t i=1
(6.24)
(6.25)
132
Annexes
t(gbt g ) N (0, 2 )
o :
(6.26)
(6.27)
i=1
133
Lobjectif est alors, connaissant les deux modles, de dterminer la bijection permettant
de passer paramtriquement de lun lautre, afin notamment de calculer le jacobien associ
prsent dans le taux de Green. Cette bijection dpend de la manire dont on a dfini les paramtres de compltion umn et vmn . Les paramtres utiliss dans les modles ont t dfinis
de manire simplifier au maximum le calcul des noyaux (leur domaine de dfinition est
principalement lintervalle unitaire [0, 1]).
134
Annexes
1
exp (t) (Sxt , yt )
Ztl
1
exp
Ztp
(6.28)
{xt+1 a xt } g(xt+1 , xt )
(6.29)
(6.30)
x1 ,...,xt1
x1 ,...,xt1
= max ai j P(yt |Xt = i) max P(y1 , ..., yt1 , X1 = x1 , ..., Xt1 = xt1 , Xt = i)
i
x1 ,...,xt1
135
Nous obtenons ainsi la relation suivante :
t+1 ( j) = max [ai j Li (yt )t (i)]
i
(6.31)
(6.32)
F IG . 6.12 Rsultats sur lhtel de ville dAmiens avec diffrents pas de discrtisation de
lespace dtat
Lagorithme de Viterbi procde par une recherche exhaustive de la solution en parcourant lensemble des solutions pour chaque lment de la chane. Les temps de calcul
dpendent donc de la taille de lespace des configurations. Il est important de discrtiser
pertinement cet espace afin davoir des temps de calcul raisonnables et dviter les problmes de saturation de mmoire. La figure 6.12 montre les rsultats obtenus sur lhtel de
ville dAmiens avec diffrents pas de discrtisation. La valeur du pas de discrtisation est directement lie au degr de prcision (en mtre) de la modlisation par rapport aux donnes.
Sur la figure de droite, le pas de discrtisation est trs fin (0, 2 mtre), et par consquent le
rsultat est trs prcis. Cependant, les temps de calcul sont extrmement levs (environ 13
heures). Comparativement aux temps de calcul mis travers loptimisation par MCMC, ce
rsultat nest clairement pas intressant, tout comme celui du centre de la figure. Par contre,
136
Annexes
sur le rsultat de gauche, on obtient une solution, certes trs gnrale (2.5 mtres de prcision), mais avec des temps de calcul trs faibles (de lordre dune seconde). Il faut noter
que, quel que soit le pas choisi, les rsultats sont trs bien rgulariss.
Pour rsumer, cet algorithme est intressant pour obtenir rapidement une modlisation
approche (i.e. avec un pas de discrtisation de lordre de deux mtres) sous des temps de
calcul trs faibles (de lordre dune seconde pour un btiment). Ces performances pourraent
tre clairement amliores par une restriction intelligente de lespace des configurations (par
exemple, en estimant les hauteurs des objets par un procd analogue celui prsent dans
lannexe B-2. Le pas de discrtisation ne doit cependant pas tre trop important (suprieur
trois mtres) sinon on risque dobtenir des modlisations trs rrones avec notamment une
mauvaise reconnaissance des formes de toit.
On peut notamment imaginer utiliser les rsultats de cet algorithme comme une bonne
initialisation pour un modle dterministe plus complexe. Les rsultats permettent, en effet,
de donner le type de modles des objets ainsi quune estime des valeurs des paramtres.
137
F - Rsultats supplmentaires
Cette annexe prsente des rsultats subsidiaires relatifs diffrentes parties du manuscrit. La figure 6.14 illustre les resultats de la mthode dextraction des caricatures de btiments par agencement de rectangles (prsente dans la partie 2.1) sur les zones test A,
B et C. La figure 6.13 montre un rsultat du processus automatique complet sur une zone
dAmiens non localement plate partir dun MNE PLEIADES. Les autres figures prsentent
des rsultats du processus de reconstruction 3D par extraction manuelle des supports 2D
partir de MNE PLEIADES 0, 7 mtre (Figures 6.15, 6.16 et 6.17), de MNE ariens 0, 25
mtre (Figures 6.18 et 6.19) et de MNE ariens 0, 1 mtre permettant la reconstruction des
superstructures (Figure 6.20).
F IG . 6.13 Rsultat du processus automatique complet sur une zone dAmiens non localement plate partir dun MNE PLEIADES
138
Annexes
F IG . 6.14 Rsultats de lextraction des caricatures des btiments par agencement de rectangles sur les zones A, B et C.
139
140
Annexes
141
142
Annexes
143
F IG . 6.19 Reconstruction 3D avec texturation des rsultats prsents sur les figures 6.16
et 6.18.
144
Annexes
____________
RESUME
____________
_______________
ABSTRACT
_______________
This thesis tackles the problem of the 3D building reconstruction from very high resolution satellite
images. The information provided by this kind of data are not accurate enough to allow an efficient use
of the varied algorithms developped in an aerial framework. In this context, it is necessary to introduce
strong prior knowledge related to the urban areas. The stochastic tools are especially well adapted to
deal with this problem.
A structural approach is proposed to address this topic. It consists in modeling a building through an
assembling of basic urban structures which are extracted fom a library of 3D parametric models. First,
the 2D supports of these structures are extracted from a Digital Elevation Model (DEM). The result is a
quadrilateral layout of which the neighboring elements are connected. Then, the buildings are
reconstructed by finding the optimal configuration of 3D models which are fixed onto the extracted
supports. This configuration corresponds to the realization which maximizes a density. The last one
measures the coherence between the realization and the DEM, and takes into account prior
knowledge such as the assembling law of the structures. Finally, we discuss on the relevance of this
approach by analysing the obtained results from satellite data (PLEIADES simulations). Experiments
are also carried on from higher resolution aerial images.
Keywords : 3D reconstruction, urban areas, satellite images, structural approach, simulated
annealing, MCMC, Digital Elevation Model.