Académique Documents
Professionnel Documents
Culture Documents
Traduo:
Dr. Hermann Johann Heinrich Kux
Prof. Dr. Raul Queiroz Feitosa*
Reviso:
M.Sc. Gilson Alexandre Ostwald Pedro da Costa*
*PUC-Rio
INPE
So Jos dos Campos
2008
Informao bibliogrfica da Biblioteca Alem (Deutsche Bibliothek):
O documento original em idioma alemo desta verso para o portugus, encontra-se em:
http://www.tnt.uni-hannover/staff/pahl/diss.pdf
Arquitetura de um sistema baseado
em conhecimento para a interpretao de dados
de sensoriamento remoto de mltiplos sensores
por
2003
Reviso:
2
Interpretao de Imagens baseada em conhecimento
Srie de Documentos do Instituto de Processamento de Informaes da Universidade (Institut
fr Informationsverarbeitung TNT) da Universidade Leibniz de Hannover.
Prefcio do editor
A interpretao de imagens constitui uma disciplina jovem no mbito do Processamento de
Informaes. A disponibilidade de novos e incrementados sensores e um aumento da
capacidade de processadores para a interpretao, levaram a uma ampla utilizao de
sistemas de processamento de imagens em quase todos os setores da moderna economia
partindo da tecnologia de comunicao e de diverso, passando pela tecnologia de medicina,
de segurana, de trfego, de automatizao, de qualidade e de sensoriamento remoto, at o
monitoramento e controle dos recursos naturais a nvel mundial.
3
Resumo
Este trabalho trata do projeto da arquitetura de um sistema baseado em conhecimento, para a
interpretao de dados de sensoriamento remoto de mltiplos sensores. O sistema comanda a
seqncia da interpretao de fotografias areas e imagens de satlite e gera uma descrio
simblica de cenas. A descrio simblica da cena estruturada sob a forma de uma rvore.
Cada n da rvore corresponde a um objeto visual. A localizao geogrfica exata de cada
objeto indicada em imagens rotuladas atravs de um valor de identificao especfico. Com
ajuda da rvore e das imagens rotuladas possvel produzir mapas com diferentes graus de
detalhamento.
No projeto da arquitetura aqui apresentada, deu-se nfase especial criao de uma interface
simples e flexvel para a conexo com programas externos de processamento de dados. Tais
programas so aplicados tanto para a segmentao como para a classificao da imagem,
bem como para a avaliao e agrupamento das hipteses. Nesta arquitetura as funes e o
conhecimento especficos sobre o problema esto separados, de forma totalmente inovadora,
da estratgia de anlise, que independente do problema. Desta forma, o sistema adequado
a projetos em que rotinas de segmentao de imagens para diferentes classes de objetos j
esto disponveis, mas falta uma estratgia de anlise.
1
Sigla em alemo de Amtliches Topographisches-Kartographisches Informations-System,
Sistema de Informao Topogrfico-Cartogrfico Oficial da Alemanha (N.d.T.)
4
Prefcio
Este trabalho resultou da minha atividade como colaborador cientfico no Institut fr
Theoretische Nachrichtentechnik und Informationsverarbeitung (Instituto de Teoria de
Telecomunicaes e Tecnologia da Informao) da Universidade de Hannover2.
Agradeo especialmente ao Prof. Dr.-Ing C.-E. Liedtke pelas excelentes condies de trabalho,
a agradvel atmosfera de trabalho, bem como pela orientao. Com os seus numerosos
estmulos em relao a este tema bem como atravs de discusses motivadoras ele fomentou
fortemente o desenvolvimento deste trabalho e o acompanhou cientificamente.
Ao Prof. Dr.-Ing. H. Garbe agradeo por sua disposio em participar da minha banca
examinadora.
Colaboraram ainda para o sucesso deste trabalho especialmente a boa atmosfera de trabalho
e os simpticos colegas com as suas discusses crticas, a sua solicitude e as suas sugestes
tcnicas. Inicialmente quero mencionar aqui os meus colegas Jrgen Bckner e Oliver Stahlhut
e agradecer-lhes pelo excelente trabalho de equipe realizado. Tambm os meus colegas
Jochen Wingbermhle, Stefan Growe, Markus Gerke e Snke Mller estiveram a todo tempo
disponveis para as ajudas adequadas.
Neste perodo, Oliver Stahlhut, Niko Meine, Matthias Schuh e muitos outros, cuidaram de
disponibilizar de uma perfeita infra-estrutura, sem que para tanto sempre aparecessem
pessoalmente.
Finalmente o meu agradecimento vai para todos aqueles que, na fase quente do trabalho se
disponibilizaram para as leituras de correo e consulta. Nesta fase, tiveram especial realce os
meus colegas Daniel Schaper, Torsten Wiebesiek, Jrgen Bckner e Jochen Wingbermhle.
Meus pais Manfred e Elisabeth Pahl e minha irm Ulrike Pahl foram de grande ajuda nesta
etapa do trabalho.
Alm disso, h ainda a minha famlia que, durante um certo tempo, teve que renunciar um
pouco minha presena. Vai aqui mais uma vez um muito obrigado minha esposa Johanna
que neste perodo teve que cuidar mais intensivamente dos nossos trs filhos Magdalena (4),
Jonathan (2) e Tobias (0). E como do feitio de crianas, elas me lembravam do essencial:
conforme insistia Jonathan: papai temos que ir novamente ao Zoolgico....
5
ndice
Notaes___________________________________________________________________ 7
1. Introduo ________________________________________________________________ 8
1.1. Estado da arte _________________________________________________________ 9
1.2. Objetivos e estrutura do trabalho _________________________________________ 10
2. Fundamentos da foto-interpretao ___________________________________________ 12
2.1. Descrio dos possveis dados de sensoriamento remoto ______________________ 12
2.2. Procedimentos de segmentao __________________________________________ 17
2.3. Formas de representao do conhecimento _________________________________ 19
3. Concepo de um sistema de anlise de imagens eficiente baseado em ______________ 21
conhecimento ______________________________________________________________ 21
3.1. Caractersticas de sistemas de anlise de imagens existentes ___________________ 21
3.2. Concepo do novo sistema de anlise de imagens GeoAIDA __________________ 26
4. Arquitetura de um sistema de interpretao de cenas baseada em conhecimento
GeoAIDA__________________________________________________________________ 29
4.1 Biblioteca base para o processamento de dados de sensores remotos _____________ 29
4.2. Descrio funcional da anlise de dados ____________________________________ 36
4.3. Descrio do processo de interpretao de uma imagem _______________________ 41
4.4. Realizao tcnica _____________________________________________________ 46
4.5. Visualizao do resultado________________________________________________ 55
4.6. Requisitos aos operadores externos _______________________________________ 58
4.7. Sistema experimental para o projeto de operadores ___________________________ 62
5. Exemplos de aplicaes ____________________________________________________ 63
5.1. Operadores especiais___________________________________________________ 63
5.2. Exemplos de uma classificao de uso do solo baseada em foto-interpretao ______ 68
5.3. Exemplo de anlise de uso do solo apoiada em dados de satlite ________________ 73
6. Avaliao e Perspectivas ___________________________________________________ 75
6.1. Anlise multi-hierrquica ________________________________________________ 75
6.2. Seleo automtica de operadores ________________________________________ 75
6.3. Avaliao quantitativa da qualidade _______________________________________ 76
6.4. Interpretao multi-temporal de conjuntos de dados ___________________________ 76
7. Resumo ________________________________________________________________ 79
Glossrio__________________________________________________________________ 81
Bibliografia ________________________________________________________________ 86
6
Notaes
Digitalizao de imagens
r = Fluxo de radiao sobre um ponto na imagem
r,min = Fluxo de radiao mnimo sobre um ponto na imagem
r,max = Fluxo de radiao mxima sobre um ponto na imagem
b = Valor quantizado do fluxo de radiao sobre um ponto na imagem
D (x,y) = Intensidade (densidade de fluxo de radiao no ponto (x,y))
Rede semntica
N = N de uma rede TN
N = Sub-n de um n N
N = Sub-n de um n N
S = N de uma rede semntica TS
H = N de uma rede de instancias hipottica TH
I = N de uma rede de instancias TI
TN = rvore constituda de ns N
TS = Rede (rvore) constituda de ns S
TH = Rede (rvore) constituda de ns H
TI = Rede (rvore) constituda de ns I
P = Imagem parcial, associada a um n N
P = Recorte de uma imagem P
TPI = rvore
7
P1 = Probabilidade de ocorrncia de uma determinada luminncia
P2 = Probabilidade de que cada clique pertena mesma classe
P3 = Probabilidade para a diferena de luminncia de cada clique dentro de uma regio
P4 = Probabilidade de diferena de luminncia de cada clique no limite da regio
i = Ponderao para os potenciais P1
1. Introduo
Os dados de sensoriamento remoto so utilizados para as mais diferentes aplicaes.
Inicialmente estes dados serviam principalmente como apoio para a criao de mapas.
Atualmente as tarefas de monitoramento avanaram para reas como proteo ambiental [58]
[94], proteo a catstrofes, ecologia e desenvolvimento urbano [3], bem como reconhecimento
areo de regies em crise. Alm disso, h os Sistemas de Informaes Geogrficas (SIG) [53],
usados, por exemplo, para o planejamento de rotas e para o auxlio navegao, que
dependem fortemente de dados atualizados.
Antes do analista comear com a interpretao propriamente dita, ele procurar obter uma
primeira e grosseira viso de conjunto, atravs de informaes adicionais, tais como data e
local do levantamento. Ao observar a cena ele inicialmente reconhecer objetos maiores que
podero ser subdivididos em objetos cada vez menores, at as menores estruturas que se
pode observar, tendo em vista a resoluo finita dos dados usados [39]. Alguns objetos ento
somente so identificveis exatamente atravs da observao de seus objetos menores,
enquanto outros objetos so mais facilmente identificveis quando se considera um contexto
maior. A qualquer momento possvel introduzir informaes no processo de interpretao, por
exemplo, a partir de mapas ou de um SIG. Estas informaes direcionam a anlise e produzem
um contexto para o prosseguimento da interpretao.
O tema deste trabalho o projeto de uma arquitetura eficiente para a interpretao automtica
de dados de sensoriamento remoto, imitando o procedimento do especialista sobre o tema.
Uma base hierrquica de conhecimento, que reflete a condio multi-escala existente em
dados de sensoriamento remoto, deve ser aplicada aqui para comandar a anlise. Tal como o
observador humano que a qualquer tempo pode introduzir informao adicional disponvel, no
processo de interpretao, a anlise automtica tambm dever estar em condies de
8
direcionar a interpretao a partir de informaes adicionais. Para a deteco de classes de
objetos especiais nas imagens areas e de satlite, devero ser aplicados procedimentos j
disponveis. A integrao destes programas de interpretao de imagens deve ocorrer sobre
uma interface de configurao flexvel. Para a anlise estrutural, que agrupa partes de objetos
em objetos maiores, tambm est prevista uma interface para a conexo com programas
externos de avaliao, de modo a possibilitar a modelagem de relaes de objetos especiais,
que durante a realizao deste trabalho no podiam ser previstas. Atravs desta conceituao
aberta, a arquitetura a ser desenvolvida dever ser adequada a aplicaes posteriores, em
projetos existentes, de modo a permitir a agregao de componentes baseados em
conhecimento de mais alto nvel.
Para resolver as situaes de conflito e de ambigidades, tanto o ERNEST como AIDA utilizam
uma procura heurstica, continuando a anlise somente da alternativa mais promissora, para a
qual necessrio um sistema de avaliao. Os sistemas ACRONYM, SPAM e SIGMA por
outro lado consideram inicialmente todas as possveis alternativas e s no final procedem a
uma escolha. No entanto, este mtodo no aplicvel na maioria dos casos prticos, devido
complexidade das cenas do sensoriamento remoto. Em [42] e [83] o sistema AIDA foi ampliado
para a interpretao multi-temporal.
9
classes ou hipteses. A cada regra podero ser associadas medidas de confiabilidade, que
permitiro avaliar as classes produzidas como resultado da interpretao. Esta concepo
baseada exclusivamente em pixels no inclui relaes de vizinhana na anlise.
A idia fundamental em que se baseia o eCognition que informaes semnticas
importantes no se encontram em pixels, mas em objetos e em suas relaes mtuas [6].
Atravs de uma segmentao baseada na tcnica de evoluo fractal (Fractal Net Evolution),
que forma segmentos a partir de critrios de homogeneidade [18], constri-se uma rede
hierrquica de objetos de imagem. Desta forma, cada objeto de imagem conhece os seus
vizinhos, podendo ser definidas relaes entre eles. Isto ocorre com a ajuda de uma hierarquia
de classes, que pode ser denominada de rede semntica. A classificao propriamente dita
ocorre ou por associao a uma regio anteriormente definida ou atravs de algum
procedimento de clculo previamente estabelecido. As relaes entre ns de um mesmo nvel,
ou mesmo com ns de nveis superiores ou inferiores podem ser igualmente consideradas.
Uma desvantagem desta abordagem que o procedimento de segmentao, que at agora
no foi publicado, fixo. Alm disso, todos os dados de entrada precisam ter a mesma
resoluo. Uma classificao confivel somente pode ser efetuada atravs de uma boa base
de regras. Por isso, na referncia [13] aplica-se o Structural Analyzing and Mapping System)
[11] para avaliar atributos e relaes entre objetos a serem considerados para a construo da
base de regras no eCognition.
10
fortemente o nmero de combinaes a serem consideradas no nvel das primitivas da
imagem. Esta hierarquia de hipteses de objetos dever ser verificada em seguida, iniciando
pelos ns folha. Eventuais conflitos devem, na medida do possvel, ser resolvidos localmente
em cada rvore parcial, atravs de operadores de avaliao externos.
Uma outra parte do trabalho cuida do problema de como os resultados obtidos podem ser
apresentados sinteticamente a um usurio potencial. Para isso o modelo de conhecimento e a
hierarquia de objetos obtida, devem ser associados interativamente com uma representao
semelhante a um mapa.
O captulo 2 descreve a estrutura das imagens digitais utilizadas e suas caractersticas mais
importantes para a extrao automtica de objetos. O requisito bsico para uma interpretao
de imagens uma segmentao. Para tanto os mtodos fundamentais de segmentao so
apresentados. Considerando que a atribuio de significado somente possvel atravs da
incluso de conhecimento prvio, so apresentadas algumas importantes formas de
representao do conhecimento.
Explicaes de termos tcnicos bem como abreviaes encontram-se num glossrio no final
deste trabalho.
11
2. Fundamentos da foto-interpretao
A interpretao de dados de sensoriamento remoto envolve uma seqncia de passos. No
inicio est a aquisio de dados. Aqui diferentes procedimentos so usados que influenciam os
passos seguintes. Em todos os casos os dados, no entanto, precisam ser divididos em
segmentos com caractersticas similares, antes que, com ajuda de conhecimento prvio, possa
ser associado um significado aos mesmos. Nas prximas sees estes temas sero
apresentados detalhadamente. A Seo 2.1 trata das caractersticas importantes dos diversos
dados de entrada. Na Seo 2.2 so apresentados alguns algoritmos de segmentao
freqentemente usados. A Seo 2.3 fornece uma viso de conjunto de possveis
procedimentos sobre como introduzir conhecimento no processo de interpretao de imagens.
Imagens a cores, de nveis de cinza ou infra-vermelhos podem ser obtidas por sensores
passivos a bordo de aeronaves ou satlites. Os sensores diferenciam-se to-somente por sua
sensibilidade em determinadas faixas do espectro eletromagntico. Nos levantamentos
aerofotogramtricos para os escritrios alemes de geodsia regional, freqentemente so
ainda usadas cmeras mtricas (RMK) [59][96] que registram a fotografia area num filme.
Para poderem ser processados em computador, tais filmes precisam ser digitalizados.
Para poder processar imagens em computadores, tais dados devem estar disponveis em
forma digital. O processo de digitalizao das imagens feito atravs de sensores digitais
durante a aquisio da imagem, enquanto que em sistemas analgicos a digitalizao
realizada posteriormente atravs de um scanner. Este processo pode ser subdividido em 2
passos, a saber, a rasterizao da imagem e a quantizao dos nveis de brilho rasterizados,
ou, em imagens coloridas, da saturao e do valor da cor. A qualidade da posterior
interpretao da imagem depende essencialmente da qualidade do processo de digitalizao.
r = D(x,y)dxdy
12
intensidade expressa a caracterstica do material ou estrutura. Espera-se que cada aresta real
na imagem provoque uma alterao de brilho com largura de pelo menos um pixel. (Figura
2.1).
Rasterizao
Fig. 2.1: Devido s caractersticas integradoras dos sensores sensveis luz, a rasterizao da geometria provoca a
suavizao das arestas.
Aqui n representa a largura mxima de um valor digital em bits, sendo que r, min o valor
de brilho real, que dever ser associado ao valor digital 0, o que via de regra constitui o brilho
mnimo disponvel. De modo similar r ,max , o brilho mximo, associado ao valor digital 2n 1.
13
Fig. 2.2: Quantizao da intensidade da imagem: (a) representao otimizada da dinmica
da imagem, (b) representao de um intervalo da dinmica real sobre a escala dinmica da
imagem, diminui o erro de quantizao, (c) mal aproveitamento da dinmica da imagem
com concomitante aumento do erro de quantizao.
A figura 2.2 ilustra este processo de quantizao. Para tanto, a curva (a) descreve o processo
de quantizao otimizado em relao dinmica de brilho completa. s vezes uma
quantizao conforme a curva (b) pode ser adequada, quando, p.ex. somente contedos
insignificantes da imagem desaparecem devido saturao na regio do preto ou na regio do
branco; neste caso, o erro de quantizao reduzido numa certa faixa de intensidades ao
mesmo tempo que detalhes se tornam mais visveis. Uma quantizao conforme a curva (c)
deve ser evitada na medida do possvel, visto que se perde parte da informao a ser
representada. Alm disso, o erro de quantizao ampliado desnecessariamente. O caso (c)
ocorre quando r, min escolhido for menor do que o brilho mnimo disponvel na imagem, e/ou
quando r ,max for maior do que o brilho mximo. Considerando que a forma otimizada da curva
somente pode ser determinada se o brilho mnimo e mximo forem conhecidos, via de regra
conveniente digitalizar com um nmero maior de bits do que o estritamente necessrio. Deve-
se, contudo, ter em mente que uma reduo da largura dos intervalos, provoca um erro no-
linear de quantizao.
Modelos Digitais de Elevao podem, desde que incluam a modelagem de objetos, ser muito
teis na interpretao de dados de sensoriamento remoto, visto que nestes dados podem ser
reconhecidas inequivocamente estruturas, enquanto nas fotografias areas textura e estrutura
se misturam. Em Modelos Digitais de Terreno produzidos a partir de uma medio geodsica
do terreno, objetos artificiais so desconsiderados propositalmente. A obteno destes
modelos custosa e praticamente no passvel de automatizao.
14
disparidade, sobre feies extradas de ambas as imagens. Somente para as posies das
feies so determinados os valores de disparidade.
O sistema de varredura a laser um sensor ativo. O sensor envia um raio de luz e mede o
tempo que a luz leva para percorrer o caminho de ida e volta, do sensor ao alvo (vide Figura
2.3). O tempo do percurso da luz uma medida direta da distncia entre o sensor e alvo.
Repetindo-se as medies, desviando-se o raio de medio atravs de um espelho, linha a
linha, para diversas posies e movendo-se concomitantemente a plataforma do sensor
paralelamente superfcie e verticalmente clula de varredura, cria-se um mapa de
profundidade da cena observada.
Fig. 2.3:(a) No sistema de varredura laser a distncia da aeronave para o solo medida atravs do tempo de
percurso da luz. A partir da posio do sensor, da orientao da medio unitria e da distncia medida, determina o
local e a altitude de um objeto.(b) O sistema de varredura laser trabalha orientado por linhas, e por isso, no solo,
tambm se origina um padro de varredura linear. A distncia da fibra determinada pela distncia das clulas na
unidade de varredura. A densidade das linhas depende da velocidade de vo e da velocidade de rotao do espelho
de desvio (veja tambm Fig. 2.4).
Na Figura 2.4 est ilustrada a estrutura do sistema de varredura a laser da firma TopoSys
(http://www.toposys.de). Atravs de um espelho de rotao inclinado, o raio laser dirigido
para um feixe de fibra de vidro e de l para o solo. A cada lance de fibra de vidro do emissor
corresponde um lance do receptor, o qual registra o sinal refletido e que, atravs do segundo
espelho de desvio, que est rigidamente acoplado ao espelho emissor, altera o seu curso para
o receptor. A distncia dos lances de fibra de vidro individuais determina, junto com a altura de
vo, a distncia dos pontos de medio na superfcie da terra em direo linha de varredura.
15
Na direo do vo, o espaamento dos pontos de medio determinado pela velocidade do
vo.
Fig. 2.4: Princpio de uma unidade de varredura da Firma TopoSys. Com um espelho giratrio,inclinado, a luz do laser
direcionada para um feixe de fibra de vidro e de l para o solo, originando-se da o padro de varredura
apresentado na Fig. 2.3.
Visto que, ao contrrio de procedimentos de medio anteriores, est sendo medido um tempo,
no h necessidade de integrao sobre uma superfcie auxiliar e nem da funcionalidade de
passa baixa da integral. O sistema de varredura a laser representa bordas nitidamente.
Modelos altimtricos obtidos com sistemas de varredura a laser so, por isso, excelentes
dados de entrada para a deteco de objetos artificiais. Mesmo a medio de aglomeraes de
casas em reas centrais de cidades com alta densidade de construes possvel, visto que,
est se trabalhando com um ngulo de medio de 90 7 (vide Figura 2.5a).
Fig. 2.5: Caractersticas importantes de um sistema de varredura a laser: (a) quanto menor for o ngulo de varredura,
tanto mais ngremes podem ser as bordas mensurveis. O TopoSys Scanner com um ngulo de visada de 7
permite por exemplo medir inclinaes superiores a 800%. Por isso tambm possvel medir grandes
conjuntos de casas em zonas centrais de cidades com alta densidade de construes. (b) Devido a deteco do
primeiro e ltimo pulso de laser refletido, possvel a medio concomitante de dossis de rvores e solos florestais.
Ao deparar com uma borda, resultam vrias reflexes, das quais a primeira e a ltima so
registradas. Com essas medies designadas como First pulse e Last pulse possvel por
exemplo, medir vegetao semi-transparente luz, na qual o primeiro pulso se origina no
dossel da vegetao e o ltimo no solo (vide figura 2.5b).
16
2.2. Procedimentos de segmentao
Em princpio pode-se distinguir entre tcnicas de segmentao baseadas em arestas e regies,
e procedimentos de segmentao baseados num modelo fsico. Os procedimentos de
segmentao orientados por um modelo fsico possuem somente opes limitadas de
aplicaes (vide referncias [50][56]), enquanto os procedimentos baseados em arestas e
regies tm aplicao geral. Enquanto os procedimentos baseados em arestas permitem obter
aproximadamente os mesmos resultados tanto para imagens preto/branco como para coloridas
(vide referncias [79][81]), os procedimentos baseados em regies se beneficiam
significativamente do uso de imagens coloridas.
No crescimento de regies (region growing), parte-se de uma regio inicial e determina-se para
cada pixel vizinho se h similaridade com relao a algum atributo da regio; em caso
afirmativo, o pixel agregado regio. A variante mais simples do crescimento de regio o
simples encadeamento. Aqui cada pixel considerado como um n de um grafo. Se em dois
pixels vizinhos o limiar de uma medida de similaridade for ultrapassado, ambos os pontos so
conectados por um arco. Visto que a existncia de um arco no grafo basta para fundir duas
regies, esta variante do crescimento de regio no adequada para cenas complexas.
17
No encadeamento de centride no so comparados pares de pixels, porm so comparados o
valor de um pixel com o valor mdio de um segmento ainda no necessariamente definido.
Cada pixel agregado leva a uma alterao do valor mdio do segmento. A vantagem deste
procedimento que todos os pixels de um segmento so considerados na deciso, se um novo
pixel deve ser agregado regio. A desvantagem, no entanto que o resultado depende do
ponto de partida da segmentao. Uma detalhada viso de conjunto das vantagens e
desvantagens de cada um dos procedimentos de crescimento de regies, encontra-se em
[106].
Ilha do Plano 1
Ilha do Plano 0
Ilha do Plano 2
Pixel
Fig. 2.6: Diviso de uma imagem numa estrutura hierrquica com ilhas hexagonais que se sobrepem.
18
No pr-processamento o rudo das imagens suprimido atravs de um procedimento de
vizinho mais prximo simtrico [84]. O especial neste procedimento que, ao contrrio dos
procedimentos de suavizao simples, as arestas das imagens so preservadas, visto que o
clculo do valor mdio considera somente a metade dos pixels vizinhos, ou seja, a metade
cujos valores se encontram mais prximos ao pixel central.
Por sua vez, no conhecimento explcito deve-se discriminar entre conhecimento declarativo e
conhecimento de procedimento. O conhecimento declarativo descreve as relaes entre
objetos do mundo real. A vantagem desta forma de representao a sua fcil leitura. O custo
para se determinar uma soluo concreta , no entanto, muito maior do que na representao
atravs de conhecimento de procedimento. Tal conhecimento descreve o uso de conhecimento
e com isto fornece uma orientao direta de como resolver o problema. A execuo do mesmo
mais eficiente, por outro lado, porm, a descrio do conhecimento para tarefas complexas
muito custosa e pouco amigvel para a manuteno.
19
conceitos, dentre os quais, na rea da interpretao de dados de sensoriamento remoto, so
usados principalmente regras e redes semnticas.
Fig. 2.7: Exemplo de um frame genrico do tipo Casa e uma Instncia. Na Instncia os Slots recebem
valores concretos. No Slot Is-a o tipo de Instncia arquivado.
20
3. Concepo de um sistema de anlise de imagens
eficiente baseado em conhecimento
Numa considerao geral, para a soluo de problemas complexos h duas estratgias
distintas:
Como exemplos de sistemas que utilizam regras para o controle da anlise podem ser
mencionados aqui os seguintes: ACRONYM [21], AIDA [67][43], BPI [70][100], ERNEST
[80][93], MESSIE [30], MOSES [85][86], SIGMA [72] e SPAM [73]. Os sistemas SPAM e BPI
tambm armazenam o conhecimento sobre a cena em regras, enquanto os sistemas AIDA,
ERNEST, MOSES, SIGMA e VISIONS [47] utilizam redes semnticas para isto.
3.1.1. VISIONS
21
Esquema de Esquemas Instncias de
Rede Estratgicos Esquema
Funes de
Avaliao
Instncias de
Rotinas de Nvel Esquema
Baixo
Fig. 3.1: A arquitetura do sistema VISIONS divide-se em trs nveis diferentes de abstrao. O
processamento de imagem ocorre no nvel mais baixo. O nvel intermedirio resume dados brutos
dirigidos por modelos e dirigidos por dados (model- and data-driven) para unidades maiores. O nvel
superior contm o conhecimento aplicativo especfico e gerencia as instncias.
No nvel inferior o trabalho dirigido por dados (data driven). A imagem segmentada e
descries simples dos assim chamados Tokensets (conjuntos de smbolos) so gerados. Para
determinados Tokensets as respectivas caractersticas so arquivadas.
3.1.2. ERNEST
ERNEST [60][61] foi desenvolvido nas Universidades de Erlangen e Bielefeld. Trata-se de uma
linguagem de representao do conhecimento com uma estratgia de controle orientada a
problemas, baseada em redes semnticas. Contrastando com as redes semnticas usuais,
ERNEST utiliza um nmero fixo de tipos de ns e bordas com significado determinado. O
conceito de n representa uma classe de objetos. Uma instncia est diretamente associada a
22
uma parte do sinal. O conceito modificado representa um resultado intermedirio da anlise.
Os ns esto conectados com um dos trs tipos de arcos. A especializao (is-a) constitui o
mecanismo de hereditariedade. O arco parte-de (part-of) subdivide um conceito em seus
componentes. Um outro tipo de arco, parte-de (cdpart-of) conecta uma parte do conceito que
somente est definido num certo contexto. Para separar claramente o conhecimento em
diferentes planos de abstrao, foi introduzido um tipo de arco concretizao-de (con-of).
O objetivo da anlise associar o sinal de entrada aos conceitos, isto , devem ser geradas
instncias dos conceitos. Considerando que o sinal freqentemente ambguo, pode-se
esperar instncias concorrentes e conceitos modificados, que valem para diferentes opes de
interpretao do sinal de entrada. ERNEST utiliza o algoritmo A*, para poder tomar uma
deciso quanto melhor interpretao. Cada n do espao de busca representa uma
interpretao coerente do sinal do sensor e contm assim a base do conhecimento completa,
adaptada ao sinal. A inferncia no espao de busca, e com isso a gerao de instncias e de
conceitos modificados, baseia-se em seis regras independentes de problemas. Por exemplo
uma instncia somente pode ser gerada, quando todas as suas partes estiverem instanciadas.
As regras esto integradas implicitamente no algoritmo de controle, que tambm independe do
problema.
Automvel Automvel
Imagem imagem
Fig. 3.2: ERNEST: Exemplo simplificado de uma base de conhecimento ( esquerda) e base de conhecimento
instanciada ( direita) para um automvel.
A Figura 3.2 ( esquerda) mostra, a ttulo de exemplo, uma base de conhecimento simples e
muito pequena de um sistema para reconhecer um automvel. Neste modelo, o carro se
compe dos componentes: roda da frente, roda de trs e carroceria. Estes componentes so
associados aos dados brutos de imagem, elipse e polgono, que podem ser detectados numa
imagem de entrada. A Figura 3.2 ( direita) mostra a base de conhecimento instanciada para
uma associao concreta de instncias a uma imagem de entrada.
3.1.3. AIDA
O sistema AIDA (Automatic Image Data Analyzer) [67][101] foi desenvolvido na Universidade
de Hannover inicialmente para a interpretao baseada em conhecimento de fotografias areas
e imagens estreo [41] livremente escolhidas e, posteriormente, estendido para o
reconhecimento de estruturas multi-temporais [42]. Na Figura 3.3 est representada a
arquitetura de AIDA. Como dados de entrada AIDA aceita dados de diferentes sensores, como
23
de cmeras mtricas (RMK) e SAR (Synthetic Aperture Radar). O conhecimento sobre a cena
a ser interpretada gerenciado num modelo de cena genrico. Informaes sobre a cena a ser
interpretada podem ser obtidas de um SIG, sendo que foi implementada uma conexo especial
para o sistema ATKIS [62][44] (Sistema de Informao Topogrfico-Cartogrfico Oficial) usado
na Alemanha. No mdulo de processamento de imagens ocorre a segmentao dos dados do
sensor com a posterior extrao dos dados brutos da imagem. Estes dados brutos dos
diferentes sensores so fusionados na unidade de trabalho simblica e agrupados para
estruturas complexas. A estas estruturas associado um significado simblico. Ao lado desta
estratgia comandada por dados (data driven), a anlise tambm pode ser comandada por
modelos (model driven). Para tanto o sistema envia, a partir do modelo de cena genrico,
hipteses sobre os objetos esperados nos dados de sensoriamento remoto e os verifica a
seguir. O sistema finalmente fornece uma descrio simblica da cena.
De forma igual ao ERNEST, o sistema AIDA tambm usa uma rede semntica como base de
conhecimento (vide Figura 3.4). Esta constitui-se de ns e arcos. Os ns armazenam o
conhecimento de modelos sobre os objetos a serem esperados na cena. Os arcos modelam o
tipo do relacionamento entre os ns. Em AIDA diferenciam-se arcos hierrquicos de arcos
topolgicos.
24
Rua
Rodovia
Linha Faixa
Fig. 3.4: AIDA diferencia na rede semntica entre diferentes tipos de arcos. Arcos
hierrquicos descrevem relaes entre objetos de diferentes nveis na hierarquia
(p.ex.rodovia uma rua). Arcos topolgicos descrevem relaes entre objetos do
mesmo nvel hierrquico (p.ex. chapa divisora central da rodovia encontra-se entre
pistas de rolagem).
is-a: A hereditariedade clssica produzida com o arco is-a. O n filho herda todas as
caractersticas do n pai.
part-of: O n filho parte do n-pai. Um nmero mnimo e mximo de ns-filho deste tipo pode
ser indicado. A diferena entre mximo e mnimo descreve o nmero dos ns opcionais.
25
3.2. Concepo do novo sistema de anlise de imagens
GeoAIDA
Os sistemas aqui apresentados possuem muitas caractersticas comuns. Todos os sistemas
utilizam, por exemplo, uma rede semntica para a representao do modelo de conhecimento.
VISIONS combina os ns da rede atravs de arcos part-of. Conexes transversais entre os ns
so possveis atravs de estratgias de esquemas, que precisam ser novamente trabalhados
para cada problema. ERNEST disponibiliza dois outros tipos de arcos, is-a e con-of, que
implementam um mecanismo de hereditariedade, ou seja, que permitem a conexo de ns em
diferentes nveis de abstrao. AIDA finalmente amplia a rede semntica atravs da
representao de relaes de vizinhana, dentro de um plano de hierarquia, atravs de um
arco, que descreve relaes atribudas. A associao s primitivas da imagem se faz atravs
de um arco data-of. Tanto ERNEST como AIDA utilizam para a procura da melhor soluo, um
algoritmo A*, ou seja, processado preferencialmente o conjunto de solues mais promissor.
No sistema VISIONS o processamento de imagem um componente fixo. VISIONS e AIDA
conectam os dados respectivamente somente nos ns-folha da rede semntica. Em nveis
mais elevados continua se trabalhando estruturalmente com estes ns.
Por isso, para a aplicao na anlise de dados geogrficos foi desenvolvido um sistema
sucessor que utiliza as experincias obtidas com AIDA, e otimizado para dados de
sensoriamento remoto. Em funo da principal rea de aplicao do novo sistema, o programa
foi denominado GeoAIDA. As diferenas entre ambos os sistemas so resumidas a seguir:
Em AIDA a associao com os dados ocorre conceitualmente no plano mais baixo. A anlise
ento rene os dados brutos reconhecidos na imagem em estruturas maiores. A escolha de
estruturas alternativas conformes ao modelo ocorre aqui atravs de um algoritmo A*. Isto pode
resultar, no entanto, no caso de um grande volume de dados brutos, num tempo
computacional muito longo. Em GeoAIDA a conexo de dados pode ocorrer em cada n da
rede semntica (vide Figura 3.5). Os assim chamados operadores holsticos segmentam os
dados de imagem em regies menores. Estas regies ento so processadas mais adiante por
operadores especficos de regies. Se num n no houver um operador de segmentao, a
anlise continua convencionalmente atravs dos componentes do n (estruturalmente).
26
Rede Semntica Conexo de Dados
Cena
Conhecimento Prvio
Regio SIG
Planos Hierrquicos
Fig. 3.6: Subdiviso do problema em problemas parciais: (a) os problemas A1 e A2 so independentes um do outro,
podem ser resolvidos individualmente e levam a uma soluo total do problema A. (b) A1 depende de A2. Para a
soluo do problema A por isso inicialmente necessria a soluo do problema A2, e assim com a soluo do
problema A1, a soluo total de A pode ser obtida. (c) A1 e A2 dependem em ambas as direes um do outro. O
problema total A ento somente pode ser resolvido, via de regra, iterativamente.
27
disjuntos, ser necessrio tomar uma deciso a favor de uma soluo parcial. Com
relao interpretao de dados de sensoriamento remoto isto significa que duas
classes de objetos, podem ser reconhecidas de modo independente. O processamento
pode ocorrer em paralelo.
Em todos os trs casos podero ocorrer superposies dos conjuntos de solues. Por isso
desejvel que a soluo dos problemas parciais venha acompanhada de uma avaliao da
qualidade da sua classificao. Com base nisso pode ocorrer, na fuso de solues parciais,
uma resoluo de conflitos. No GeoAIDA tanto a soluo parcial como tambm a fuso de
solues parciais so efetuadas por programas externos..
28
4. Arquitetura de um sistema de interpretao de cenas
baseada em conhecimento - GeoAIDA
O Sistema GeoAIDA consiste de vrios componentes, que podem ser utilizados
independentemente um do outro (veja Fig. 4.1). No nvel mais baixo so disponibilizadas
bibliotecas C e C++, que permitem a leitura e manipulao de imagens, assim como o
processamento simblico de conjuntos de objetos.
29
Entrada/Sada de imagem
Bibliotecas
Classe da imagem, Manipulao da imagem, Reclculo das geo-coordenadas,
Processamento simblico dos volumes de objetos, Parser XML
Programas
Gerador de f
Banco de Filtro
Projeto
dados de
imagem
Sistema d
Recorte de Experimental para
Visualizao de
Dados de O Projeto do
Dados e Imagens
Imagem Operador
e
Mapa com - Editor para Rede Semntica; Operadores
Multi-detalhe - Comando da Anlise;
- Visualizao do Resultado
Figura 4.1: Viso geral do projeto GeoAIDA: Os dados relativos a imagens so mantidos num banco de dados
(a). Atravs do gerador de projetos (b) podem ser selecionados segmentos da imagem (c). O sistema
experimental (d) possibilita a criao interativa de operadores a partir de programas de filtragem prontos ou
desenvolvidos especialmente para a aplicao (f) ou o uso de operadores j existentes (e). Atravs do
programa de visualizao de imagens e dados (g) pode-se avaliar os resultados (c) do sistema experimental
(d), ou seja, o gerador de projetos (b) como tambm os resultados (i) do GeoAIDA (h).Para o processamento
de imagem todos os programas utilizam bibliotecas comuns.
Para trabalhar com dados de sensores remotos foi desenvolvido, por isso, um formato de
dados, que independente da arquitetura do computador, do intervalo de valores em 8 bit, 16
bits, 32 bits e em ponto flutuante, de escala e translao, e que suporta a transformao de tipo
no momento da leitura do dado.
30
O formato consiste de um cabealho na forma de texto (ASCII), seguido dos dados raster (texto
ou binrio) linha-a-linha. Este formato tem a vantagem, de que o cabealho pode ser gerado
com qualquer editor. Um arquivo vlido consiste, portanto, da simples concatenao do
cabealho e dos dados primrios (raw data). O cabealho contm informao sobre o tipo do
dado, o tamanho e os valores mnimo e mximo dos dados. Opcionalmente, as coordenadas
geogrficas, assim como comentrios, podem ser acrescentadas. O arquivo como um todo
pode ser comprimido com o uso de programas corriqueiros de compresso para reduzir seu
tamanho.
Para passar da idia rapidamente para o prottipo, os tipos de imagens devem corresponder
tanto quanto possvel aos tipos mais simples de dados. O gerenciamento da memria
necessrio para as imagens deve estar encapsulado na classe imagem. Tendo em vista que os
dados de sensoriamento remoto so tipicamente volumosos, deve-se evitar a replicao dos
dados.
No sistema GeoAIDA este objetivo alcanado atravs da estrutura mostrada na figura 4.2
Figura 4.2: Na Classe Imagem GeoAIDA os tipos de dados so completamente encapsulados. Uma funo
desenvolvida para um determinado tipo de dados pode ser usada desta maneira utilizando um outro tipo de
dados. Atravs do uso de compartilhamento de dados implcito pode-se trabalhar de modo igualmente
simples, como com tipos de dados simples, sem se utilizar mais memria do que o estritamente
necessrio.
31
A independncia do tipo de dados deriva de uma classe base ImageBase, que contm todos os
mtodos da classe de tipo especfico na forma de mtodos virtuais. Destas derivam as classes
de tipo especfico ImageT<type>, para as quais se recomenda o uso de Templates, uma vez
que os textos fonte de classe de tipo especfico se distinguem apenas nos tipos de dados
utilizados. A classe de tipo especfico ImageT<type> contm, conforme o nmero de canais,
ponteiros do container de dados bidimensional Array2DT<type>, o qual contm os prprios
dados da imagem. Estes containers de dados so derivados da classe SharedData, atravs da
qual se faz o gerenciamento da memria. A cpia dos dados, p.ex. numa atribuio, se d
atravs de uma simples cpia dos ponteiros aos dados propriamente ditos e incremento dos
contadores de referncia. No caso de um acesso de escrita, verifica-se se h mais de uma
referncia aos dados. Em caso afirmativo, deve-se fazer uma cpia dos dados. Acessos de
leitura de vrias fontes mesma rea de dados so permitidos.
32
benefcio da simplicidade s se mostra uma dimenso da imagem. A imagem possui nesta
dimenso xsize pontos, que vo de 0 a xsize -1. A rea limitada pelas coordenadas geogrficas
xgW (West) e geogrficas xgE (East).
Coordenadas Geogrficas
Pixel
Figura 4.3: Vrias possibilidades de associao de pixels a coordenadas geogrficas: (a) pixel 0 e pixel xsize esto nos
limites das coordenadas, 9(b) O 0-simo pixel fica no limite xgW mais a esquerda das coordenadas, e direita fica o
pixel xsize (=0-simo pixel da prxima regio), (c) como b) com exceo de que o limite direito da imagem est sobre a
coordenada xgE , d) pixels se localizam no meio da grade de coordenadas geogrficas
33
Figura 4.4: Clculo da transformao entre coordenadas geogrficas e pixels com 3 exemplos de regies:
(a) mostra a bounding box em pixels e coordenadas geogrficas contendo os pixels por inteiro, (b) contm
pixels por inteiro, (c) a regio que tem um nico pixel associado.
Impondo-se a condio de que todo pixel esteja inteiramente contido na regio descrita e que
duas regies adjacentes no contenham pontos comuns, resulta o seguinte procedimento para
transformao entre coordenadas geogrficas e da imagem (veja Fig. 4.4):
34
A tabela 4.1 resume o procedimento de transformao entre coordenadas individuais
geogrficas e coordenadas da imagem, assim como entre retngulos envoltrios (bounding
boxes).
Uma biblioteca com funes para o processamento de conjuntos de objetos j foi desenvolvida
em [25]. Ela permite a leitura de conjuntos de objetos, a definio de parmetros de forma e de
vizinhana (que podem ser utilizados em algum clculo), o agrupamento de objetos, assim
como a disponibilizao de grupos de objetos para processamento subseqente no GeoAIDA.
A biblioteca foi expandida neste trabalho e seu campo de aplicao estendido classificao
de segmentos de imagem. Em particular um processamento simblico controlado por um
parser para o processamento de objetos foi aperfeioado (vide item 4.6.2).
Tabela 4.1: Procedimento para transformao de retngulos envoltrios (bounding boxes) entre
coordenadas da imagem e geogrficas de acordo com a Fig. 4.4.
35
Marcadores iniciais so iniciados com o caractere <. Logo aps o < tem-se o nome do
marcador. Pode-se seguir ao nome do marcador uma lista de atributos que definem certas
caractersticas ao n que est sendo descrito. O marcador inicial termina com o caractere >. Se
o n no contm sub-ns, o marcador inicial pode ser encerrado tambm com />. Neste caso
no necessrio ter nenhum marcador final.
O marcador final se inicia com os caracteres </. Segue-se o nome do marcador que deve
corresponder a um marcador inicial anterior. O marcador final no tem atributos.
No exemplo a seguir so representados um total de trs ns. Dois do tipo region e um do tipo
subregion. Subegion filho do n region Knoten2. O n region com nome Knoten1 e o
n subregion so ns simples sem filhos. Portanto as suas descries podem ser fechadas
com />, enquanto que o segundo n requer um marcador final ( </region> ). Ambos os ns
region possuem respectivamente os atributos id e name; subregion possui id e label. O
atributo label Baum Oskar mostra, como se podem utilizar caracteres especiais integrando
o caractere \ (barra invertida) no valor do atributo.
36
Operadores externos
Entrada Resultado
Foto Floresta
area
Indstria
Figura 4.5: Construo do analisador de cena GeoAIDA: Como dados de entrada pode-se ter qualquer dado de
sensores remotos, assim como dados de GIS. Em conjunto com um modelo da cena representado numa rede
semntica e com o auxlio de operadores externos, o controle do sistema produz o resultado na forma de uma
descrio da simblica da cena e a label image associada, da qual se podem facilmente construir mapas
temticos.
Entende-se neste texto como base de dados todos os dados de entrada disponveis para a
interpretao da cena. Estes podem ser imagens de diversos sensores, como VIS, Laserscan,
IR ou SAR. Por outro lado podem ser utilizados tambm informaes de bancos de dados
como GIS ou resultados de uma interpretao anterior. Considerando que a ligao entre estes
dados feita por operadores externos, restries podem resultar apenas dos operadores de
imagem e de processamento de dados. O GeoAIDA gerencia apenas regies bidimensionais,
que esto associadas aos ns de uma rede de hipteses ou rede de instncias.
37
4.2.2. Rede Semntica
O modelo de conhecimento sobre a cena a ser interpretada est representado numa rede
semntica (figura 4.6). A associao dos ns estritamente hierrquica, isto , cada n tem
exatamente um n superior (n pai). O n mais superior o n cena. Cada n corresponde a
uma classe de objeto potencialmente presente na cena. Pode-se associar atributos a cada n.
Alm de atributos genricos como Name e Class, pode-se associar a cada n um operador top-
down e um operador bottom-up. Idealmente o operador top-down deve ser capaz de detectar
na imagem objetos do tipo da classe do n, tais operadores so chamados de operadores
holsticos
Cena
Regio
N N
Com operador Top-down holstico Sem operador Top-down holstico
.
Figura 4.6: Exemplo de uma rede semntica conceitual. A rede conceitual no GeoAIDA construda de forma
estritamente hierrquica. Nos ns faz-se distino entre objetos que podem ser encontrados por operadores de
processamento de imagens diretamente na imagem (holstico), e objetos que podem ser definidos apenas
estruturalmente, isto atravs de seus componentes. O significado dos arcos atravs da estrutura hierrquica
corresponde genericamente a uma relao part-of, a qual inclui a relao is-a como subconjunto.
38
Node: Casa
General Attributes:
Name: Casa
Objectclass: Casa
Color: 255:0:0
TopDown-Operator: Detect_Building
TopDown MultiClass: False
BottomUp-Operator: None
TopDown Attributes:
Input-Data: Laserscan
Height-Step[m]: 2
Min-Size[m 2]: 30
Max-Size[m 2]: 200
BottomUp Attributes:
A figura 4.7 mostra um exemplo de um n Casa de uma rede semntica. O atributo Name
define o nome com o qual o n aparece na rede. O atributo Class usado pelo GeoAIDA para
a identificao das regies classificadas, segundo as quais os operadores top-down e bottom-
up so executados. A cor definida atravs do atributo Color usada para representar objetos
deste tipo na rede semntica e no mapa resultante da interpretao. Os atributos operador-
bottom-up e operador-top-down definem os operadores que devem ser ativados para a
deteco e validao de objetos desta classe na correspondente posio na anlise. Quando o
atributo Top-Down-Multi-Class ativado, significa, que o operador top-down capaz de
detectar classes distintas. Com este tipo de operador pode-se instanciar objetos da classe do
n como tambm objetos de classes descendentes (filhas) do mesmo n superior (pai). Os
atributos Top-Down-Attributes servem para a configurao do operador top-down selecionado.
O operador top-down mencionado no exemplo requer uma imagem de altitude como dado de
entrada, um degrau de altura a ser detectado, assim como os tamanhos mximo e mnimo da
regio a ser reconhecida. Como o n apresentado um n folha, no se requer um operador
bottom-up.
39
P Figura 4.8: Funcionamento de um operador top-down: o operador top-down recebe como entrada o segmento de
imagem a ser processado. Uma mscara pode restringir mais ainda a rea a ser trabalhada. Ele gera como sada
uma imagem rotulada e a correspondente lista de regies classificadas que descreve os objetos encontrados mais
detalhadamente.
40
Figura 4.9: Operao de um operador bottom-up: este operador recebe uma lista de ns hipotticos com a
imagem rotulada correspondente. Estes ns so avaliados, o que pode alterar as correspondentes imagens
rotuladas e agrupar em classes de objeto de nvel superior. Uma imagem rotulada gerada com os grupos
produzidos .
A anlise com o GeoAIDA produz uma rede de instncias que contm todos os objetos
verificados. A ordenao dos ns estritamente hierrquica, ou seja, as regies associadas
aos ns de nvel mais baixo esto completamente contidas nas regies associadas aos ns de
nvel mais alto. Adicionalmente, os ns de um nvel da hierarquia so disjuntos no que diz
respeito s regies associadas. Por isso possvel representar todos os objetos de uma rvore
de instncias num mapa 2D (veja seo 4.5.1).
41
P descreve uma imagem parcial, qual o n N est associado. P est, portanto, associado ao
n N. Na rede de hipteses TN todos os P so subconjuntos de P. Na rede de instncias
todos os pares Pk e Pl so disjuntos.
Figura 4.10: Seqncia da interpretao da cena: a fase top-down trabalhada comandada por modelos. A partir da rede
semntica TS gerada a rede de hipteses TH e tenta-se, atravs dos operadores top-down, encontrar os objetos
correspondentes no material de dados P. Na fase bottom-up os conflitos entre os objetos encontrados so dissolvidos
(comandados por dados), de modo que as regies Pi correspondentes so disjuntas, que por sua vez so agrupadas
para objetos antepostos.Resulta uma rede de instncias parcial.
42
Ao mesmo tempo o operador bottom-up agrupa a nova rede de instncias parcial I e gera
novos ns hipotticos Hk, ou seja, de um n Hi podem surgir neste passo mltiplas hipteses
Hk. O controle ento passado ao n superior H, que realiza a avaliao e agrupamento para
o n H. Este procedimento chamado avaliao bottom-up de H. A avaliao bottom-up
repetida at que o n mais superior da rede de hipteses seja alcanado. Com a confirmao
do n raiz hipottico, chega-se rede (de instncias) resultado, com a confirmao das
instncias parciais daquele ponto para as folhas.
O exemplo a seguir mostra com se pode produzir um mapa temtico com o GeoAIDA a partir
de imagens de sensoriamento remoto (visuais), imagens de altitude (laserscan) e dados GIS. A
rede conceitual apresentada na figura 4.6. O objetivo classificar a imagem (veja figura 4.15
parte de cima) em indstria,assentamento, floresta, gramneas e plantao. Esto disponveis
como operadores de segmentao um operador para o reconhecimento de edificaes, assim
como um classificador baseado em textura para floresta, pastagem e plantao. Os ns da
rede semntica que tm operadores holsticos associados aparecem em cinza. As classes
assentamento e indstria so reconhecidas a partir de suas caractersticas estruturais.
Cena
Regio
A anlise se inicia com o n S Cena. A partir deste n S se gera um n H Cena_1. Para criar
hipteses para seus ns filhos ativam-se os operadores top-down de todos os sub-ns neste
caso Regio. A figura 4.11 mostra o resultado do operador top-down, que neste exemplo
atravs de uma consulta a uma base GIS subdividiu Cena_1 nas regies 1 at 5. O GeoAIDA
gera a partir da os ns H Regio_1 at Regio_5.
43
Figura 4.12: Exemplo de aplicao do algoritmo de extrao de edificaes para diferenciar nas regies da figura
4.11 entre rea Habitada 1...2 (edificaes presentes) e Agricultura 1...3 (sem edificaes).
No prximo passo procura-se gerar hipteses para os sub-ns dos ns Regio 1 at Regio 5.
Como sub-ns, de acordo com a rede conceitual podem surgir as hipteses rea Habitada e
Agricultura. Para cada regio chamam-se os operadores top-down associados aos ns S rea
Habitada e Agricultura (veja figura 4.12). O operador top-down para rea Habitada verifica se
h edificaes na rea analisada. Em caso afirmativo a regio classificada como Vila. O
operador para Agricultura executa a funo inversa, ou seja, ele classifica regies sem
edificaes como Agricultura. Desta maneira formam-se as regies 2 e 5 que se tornam reas
Habitadas, enquanto as Regies 1, 3 e 4 se tornam Agricultura. GeoAIDA gera a partir das
regies encontradas ns H vila rea habitada 1, rea habitada 2, agricultura
1, agricultura 2 e agricultura 3 .
rea
Urbana
Assentamento
Casa
Figura 4.13: Exemplo para a diferenciao de reas habitadas e reas industriais, atravs da procura de
2
pequenas edificaes (30-150 m ).
44
O texto considera daqui para diante somente o ramo rea Habitada. De acordo com a rede
conceitual uma rea habitada pode ser um Assentamento ou uma Indstria. Tendo em vista
que no h nenhum operador top-down associado a Assentamento e a Indstria, so gerados
para cada rea habitada as hipteses Assentamento e Indstria (figuras 4.13 e 4.14). Um
assentamento consiste de casas e jardins. Por isso os ns H Assentamentos chamam os
operadores top-down para Casa e Jardim. A figura 4.13 mostra um exemplo de resultado da
segmentao de Casa. O operador j utilizado para distinguir rea Habitada e Agricultura a
partir de dados de laser (laserscan) novamente utilizado aqui. Seus parmetros so agora
ajustados para a deteco de edificaes (casas) com terrenos entre 30 m2 e 150 m2. Na
regio rea habitada 1 detecta-se apenas uma casa. Na regio rea habitada 2 detectam-se 9.
O mesmo operador ajustado para a deteco de edificaes com terrenos entre 150 m2 e 500
m2 para a deteco de edifcios utilizados com fins comerciais (figura 4.14).
rea
Urbana
Indstria
Edifcio
Figura 4.14: Exemplo o reconhecimento de edifcios usados para fins comerciais atravs de uma procura por
2
objetos de tamanho entre 150 e 500 m .
45
Figura 4.15: Vista geral de uma imagem de entrada e de sada para uma interpretao de cena: acima, dados
de entrada (imagem, laserscan, GIS) abaixo: resultados dos operadores (operador de textura, procura de
edificaes), resultado final.
46
Figura 4.16: Viso geral esquemtica das funes do GeoAIDA
O controle da anlise recursivo e realizado atravs de uma Mquina de Estados Finita (FSM
sigla de Finite State Machine) associada a cada n instncia. Graas implementao atravs
de FSM a anlise paralelizvel, uma vez que cada fase a ser executada independente de
eventos externos. Eventos externos podem ser p. ex. a execuo de um operador ou a gerao
de uma rede de instncias de nvel mais baixo. O FSM pode estar nos estados TD_START,
TD_EVALUATE, START_CHILDREN, BU_START e BU_EVALUATE e passa no caso mais
comum por estes estados nesta ordem. H ainda os estados de erro, que no sero tratados
aqui para no prejudicar a compreenso do texto. Na fase TD_START o operador top-down
iniciado, a fase TD_EVALUATE calcula o resultado do operador top-down. Na prxima fase
START_CHILDREN so geradas hipteses iniciais para os ns inferiores, para os quais foram
geradas novas hipteses a partir do resultado da ltima execuo do operador top-down. Nesta
fase as FSM para os ns inferiores so colocadas em operao. Segue-se a fase BU_START,
na qual a avaliao das hipteses iniciada atravs da ativao de operadores bottom-up. Na
ltima fase BU_EVALUATE os resultados desta avaliao so computados.
Os passos do programa a serem executados em cada fase so apresentados nas figuras 4.14,
4.18, 4.19, 4.20 e 4.21 em pseudocdigo. O programa INode denota a classe de um n
47
instanciado. snode o n modelo da rede semntica correspondente ao n instncia atual.
state armazena a fase para a qual deve passar a FSM na prxima chamada.
Fase TD_START_ Na fase TD_START (veja figura 4.18) so gerados os comandos para o
operador top-down e o recorte da imagem, necessrios para a execuo do operador top-
down. O estado da FSM alterado para TD_EVALUATE. Finalmente a linha de comando a ser
executada juntamente com o objeto que deseja executar esta operao registrada no
gerenciador de tarefas. Isto leva o programa a ser executado assim que houver capacidade
suficiente de memria disponvel. Ao ser concludo o programa externo, o gerenciador de
tarefas chama a FSM do n hipottico requisitante, que se encontrar a partir da na fase
TD_EVALUATE.
48
Estes novos ns so pendurados agora na rede de instncias, e incrementado o contador
dos sub-ns do n de nvel superior a serem processados. O estado da FSM do novo n
alterado para START_CHILDREN. Caso o n da rede semntica possua sub-ns, sero
criadas para estes hipteses atravs da ativao do n FSM hnode.fsm(). Se, ao contrrio,
o n hipottico um n folha, inicia-se a FSM do n de nvel superior. Depois que a lista dos
novos ns tiver sido processada, as hipteses so eliminadas da rede de instncias,
chamada a FSM do n de nvel superior e as hipteses so finalmente apagadas.
49
Figura 4.21: FSM: Fase BU_EVALUATE.
geoType: define o tipo de coordenadas geogrficas. At aqui somente GK/1, GK/2 e GK/3
(Gauss-Krger) so suportados. Outros tipos, como UTM, seriam desejveis.
type: define o tipo da imagem. No momento so suportados os tipos LASER, VIS, SAR, IR e
VIDEO. Em princpio qualquer tipo de imagem pode ser utilizada, desde que haja imagens
deste tipo para a regio escolhida.
Key: serve para identificar a imagem inequivocamente dentro da sua classe type.
50
Name: o nome da imagem.
Uma descrio de regio surge como resultado de um operador top-down. Ela consiste de uma
lista de marcadores de tipo regio. Os seguintes atributos devem ser definidos.
Class: define a classe a que pertence a regio. Somente as regies que correspondem
classe do n que fez a chamada podem ser transferidas para a rede de instncias.
id: a partir do id pode-se encontrar a regio na imagem rotulada (valor dos pixels
correspondentes).
File: o nome do arquivo da imagem que contm esta regio. Mltiplas regies podem utilizar
uma mesma imagem rotulada. A diferenciao se faz atravs do id.
llx, lly, urx, ury: descrevem o retngulo envoltrio (bounding box) da regio em pixels no
arquivo da imagem rotulada dada. Neste caso valem as relaes llx <= x<=urs e ury<=y<=lly,
isto , a regio est completamente contida no retngulo envoltrio.
Name; o prefixo do nome da regio. Tem utilidade apenas para a visualizao. Caso no
seja dado nenhum name, um nome automaticamente definido a partir do nome da classe e
de um nmero seqencial.
51
4.4.3.3. Lista de ns
Agrupar os ns;
Gerar a imagem rotulada dos ns;
Gerar a imagem rotulada dos grupos de ns.
</group>
nodes e groups podem ter qualquer atributo. Os seguintes atributos esto presentes em
todos os nodes de um arquivo de entrada.
id: a partir do id pode-se encontrar a regio na imagem rotulada (valor dos pixels).
File: o nome do arquivo da imagem rotulada que contm esta regio. Mltiplas regies
podem utilizar uma mesma imagem rotulada. A diferenciao se faz atravs do id.
llx, lly, urx, ury: descrevem o retngulo envoltrio da regio em pixels no arquivo da imagem
rotulada dado. Neste caso valem as relaes llx <= x<=urs e ury<=y<=lly, isto , a regio est
completamente contida no retngulo envoltrio.
Name: o nome do n.
Addr: fornece o endereo deste atributo na memria. Este atributo no pode ser alterado sob
nenhuma hiptese, por que ele quem indica a associao deste n rede de instncias.
Em cada n, o operador bottom-up para ns que foram agregados deve definir o valor, o
atributo addr e, quando for o caso, definir o valor dos atributos alterados. Quando novos ns
so gerados, deve-se definir o valor dos atributos id, file, llx, urx, lly, e ury. Os ns grupo
52
recebem pelo menos os atributos id, file, llx, urx, lly e ury. Qualquer atributo pode ser definido
tanto para os ns individuais como para os ns grupo. Estes fluem para dentro do processo de
interpretao.
Para que o GeoAIDA tome conhecimento das formas corretas de chamada de operadores,
todos os operadores disponveis so descritos em arquivos XML, que so lidos na inicializao
do GeoAIDA. O marcador <operator> serve para descrio de operador. Caractersticas dos
operadores, tais como nome programa executvel, so descritos atravs de atributos. No caso
em que o operador permite a configurao atravs de parmetros de linhas de comando, esta
descrita atravs do marcador <attribute>. O parmetro definido com <attribute >
pode ser indicado no editor do GeoAIDA como atributos especficos de operandos.
O elemento <attribute > est associado ao correspondente operador:
tip: o atributo tip pode conter um texto de ajuda em formato HTML, que ser mostrado ao
usurio quando o ponteiro do mouse est posicionado sobre o nome do operador na lista
apresentada pelo sistema. (Balloon-Help).
cmd: o formato da chamada para execuo (linha de comando) definido neste atributo.
Atributos da rede semntica ou da rede de instncias podem ser passados ao comando
emoldurando-os com @. Atributos especficos de operadores so associados da mesma
maneira, sendo que devem ser definidos dentro da descrio do operador com o tag marcador
<attribute> .
runglobal: pode assumir os valores true or false. Se o runglobal tiver o valor true,
toda a imagem ou todas as imagens sero repassadas ao operador correspondente para
processamento. Isto faz sentido para operadores que trabalham melhor sobre grandes recortes
de imagem, pois exploram, por exemplo, a distribuio estatstica dentro da imagem.
label: define o nome que identifica o atributo na GUI (Graphic User Interface).
53
value: atravs da caracterstica value pode-se atribuir um valor inicial ao atributo, que ser
assumido, caso o usurio no defina nenhum valor.
type: o tipo de um atributo pode ser STRING, INT, DOUBLE, ENUM, BOOL ou IMAGE.
Dependo do tipo, podem ser estabelecidas outras caractersticas especficas ao atributo.
min: pode-se determinar os valores mnimos para atributos do tipo INT e DOUBLE.
imagetype: esta caracterstica s pode ser definida para atributos do tipo IMAGE. Imagetype
determina que tipo de imagem que est associada ao atributo. No momento os tipos
suportados so LASER, VIS, SAR, IR e VIDEO. Em princpio possvel operar com qualquer
tipo de imagem, desde que haja no banco de dados imagens deste tipo para a regio
selecionada.
options: Num atributo do tipo ENUM pode-se definir as possveis alternativas. Trata-se de uma
lista de valores separados por vrgula.
Alm dos atributos especficos de operadores, que podem ser definidos por <attribute>
dentro do objeto operator, h atributos oriundos da rede semntica e da rede de instncias
que podem ser passados ao operador atravs das linhas de comando. Estes so atributos que
em geral descrevem os dados a serem processados, como p. ex.:
output: arquivo de sada para a descrio das regies nos operadores top-down, ou para a
descrio de ns nos operadores bottom-up.
Por outro lado, h atributos que descrevem a imagem solicitada pelo operador. Os nomes
abaixo devem ser complementados com um prefixo que o nome do atributo IMAGE do
operador a ser chamado.
54
<attribute name =gis type=STRING cmd=-- gis @gis@/>
<attribute name =vis type=IMAGE imagetype=VIS/>
</operator>
Quando o operador chamado num processo top-down so definidos, alm dos atributos
especficos do operador min, max, gis, os atributos gerais geoWest, geoNorth, geoEast,
geoSouth, minRes, maxRes e output e os atributos especficos da imagem vis_file,
vis_x_res, vis_y_res, vis_size_x e vis_size_y, que derivam do atributo
especfico de operando vis. Os valores destes atributos so introduzidos na posio que lhes
corresponde na linha de comando.
55
Rede Hierrquica Padres
O mtodo de constituio dos dados descrito na seo anterior permite agora uma
implementao simples de um mapa interativo. O mapa consiste de 3 componentes: da rede
semntica, da rede de instncias, e da imagem rotulada, que descreve a localizao espacial
de todos os objetos (veja figura 4.23).
Rede de Instncias
Figura 4.23: Interface com o usurio do GeoAIDA com a visualizao da funo mapa interativo.
56
Seleo do nvel de detalhamento na rede semntica com a adaptao automtica da
imagem rotulada da rede de instncias;
Nas figuras 4.24 e 4.25 demonstra-se o efeito da superposio das rvores parciais da rede
semntica e o correspondente resultado sobre a imagem rotulada.
Figura 4.24: Mapa interativo para a visualizao do estado com a superposio sobre a imagem (direita) e a
correspondente rede semntica (esquerda).
Figura 4.25: Mapa interativo para a visualizao dos resultados com a superposio sobre a imagem (direita) e a
correspondente rede semntica (esquerda).
57
A figura 4.26 mostra um mapa em que apenas uma regio foi aberta na rede de instncias. Em
seguida so fechadas as classes subordinadas rea habitada atravs da rede semntica e
posteriormente aquelas mesmas classes so novamente abertas na rede de instncias.
Basicamente o GeoAIDA considera dois tipos de operadores, aos quais se impem diferentes
exigncias:
1. Operadores top-down devem encontrar objetos de uma dada classe numa determinada
rea geogrfica. Esta rea apresenta-se tanto em coordenadas geogrficas quanto na
forma de recortes de imagem.
58
4.6.1. Operadores de interpretao de imagens
Muito embora aplicaes como a consulta a um banco de dados GIS sejam possveis, a
aplicao mais corriqueira de operadores top-down a interpretao de imagens. Muito
freqentemente a interpretao pode ser subdividida nos passos mostrados na figura 4.27.
A atribuio uma seqncia de passos para determinar os parmetros de uma regio, e pode
ser executada de forma relativamente independente da formulao do problema. A
59
classificao exige uma estreita adaptao ao resultado que se espera da interpretao. Por
isso, no existe uma estratgia geral de soluo, e faz sentido deixar a cargo de um intrprete
o passo da classificao, como se procede na avaliao e agrupamento da fase Bottom-Up
(veja seo 4.6.2).
Um operador baseado na varincia dos dados da imagem, que diferencia entre objetos
artificiais e naturais;
60
Figura 4.28: Estrutura de dados do interpretador para o processamento de conjuntos de objetos: na
estrutura de dados global (a) h uma pilha (b), que pode receber elementos de diferentes tipos, entre os
quais, uma lista de ns (d) que por seu turno podem tambm conter uma pilha (b), assim como seus ns
podem t-las.
O prprio interpretador possui uma estrutura de dados global (a), na qual esto contidos
atributos, uma pilha (b) e a lista de ns lidos (e). A lista de ns contm os ns (f). Cada n por
seu turno contm atributos e uma pilha local (b). A pilha (b) pode agora receber elementos (c)
do tipo String, Number, NodePointerList (d) e Stack (b). A estrutura de dados NodePointerList
(d) serve como container de grupos para os ns. Os ns (f) so aqui gerenciados apenas como
ponteiros, isto cada n s existe fisicamente uma vez na memria, mesmo que
eventualmente vrios grupos (NodePointerList) pertenam a ele. Adicionalmente o
NodePointList pode conter atributos e uma pilha.
O interpretador recebe uma linha de comando, que ele inicialmente subdivide em elementos
individuais (tokens). Em seguida determina-se o tipo do token. Tratando-se de um dado
(Number, String) armazenado na pilha global. Tratando-se, ao contrrio de uma funo, ela
executada.
Alm das operaes bsicas, como + , -, *, /, < ,<, = h funes que processam a pilha. dup
produz uma cpia do elemento mais alto da pilha. As variantes nl.dup e node.dup trabalham
no local correspondente da pilha. drop elimina o elemento mais alto da pilha (possui variantes
com em dup).
O comando select serve para selecionar ns com determinadas caractersticas. Com set e
get (e suas variantes nl. e node.) pode-se definir e ler atributos. Com as funes
node.run e nl.run pode-se executar sub-rotinas em pilhas de ns e pilhas de grupos.
61
Funes especiais calculam atributos como parmetros de forma de objetos ou a relao entre
objetos.
O exemplo a seguir mostra como segmentos de uma imagem colorida podem ser subdivididos
em Unknown, Greenland e Shadow. Escreve-se uma lista de ns no agrupados, na forma
como se espera ter o resultado de um operador top-down:
( 1) nodelist
( 2) Unknownnode.push class node.set
( 3) meancolor node.get
( 4) dup 80 > swap 280 < * node.run
( 5) select
( 6) Greenland node.push class node.set.
( 7) drop
( 8) nodelist
( 9) meanbrightness node.get 10 < select
(10) Shadow node.push class node.set
(11) drop
(12) nodelist
Inicialmente a lista de ns trazida pilha (linha 1). Na linha 2 atribui-se o valor Unknown ao
atributo class de todos os ns. A linha 3 carrega o valor do atributo meancolor, que contm o
canal C da cor no sistema CSV, para a pilha local de cada n. Na linha 4 executa-se um
comando local na pilha do n que determina, se a cor est no intervalo do verde. O resultado
deste comando leva na linha 5 seleo dos ns que sero associados classe Greenland.
Para estes ns o valor do atributo class definido como Greenland. A linha remove os ns
classificados como Greenland da pilha. Na linha 8 uma lista de todos os ns novamente
trazida para a pilha. Desta vez analisa-se o brilho dos ns (linha 9) e se atribui os ns escuros
classe Shadow (linha 10). A linha 11 tambm remove esta lista da pilha. A linha 12 garante
que no final haja na pilha uma lista com todos os ns, a qual ento ser transmitida para o
arquivo de sada.
62
Figura 4.29: No sistema experimental para projeto de operadores, cada caixa corresponde a um programa
executvel, o qual pode ser ativado atravs de um clique. Verifica-se a dependncia a outros programas e
estes so iniciados na ordem correta.
63
5. Exemplos de aplicaes
GeoAIDA constitui a implementao de uma arquitetura de um sistema baseado em
conhecimento, para controlar a interpretao automtica de dados de sensoriamento remoto.
Assim sendo, no contm nenhuma funcionalidade para o processamento de imagens ou
avaliao. Estas funcionalidades precisam ser disponibilizadas atravs de mdulos externos.
Para mostrar a capacidade de trabalho do sistema, necessria a utilizao do GeoAIDA em
reas de aplicao da interpretao de dados de sensoriamento remoto. Neste captulo so
apresentados dois exemplos de aplicao nos quais GeoAIDA utilizado: o primeiro vem da
rea de classificao de uso do solo e baseia-se em fotografias areas combinadas com dados
de SIG, o segundo da rea de interpretao de imagens de satlite. Antes porm sero
descritos alguns operadores para o processamento de imagens e avaliao de hipteses,
desenvolvidos no mbito do Projeto GeoAIDA, que foram aplicados em diferentes pontos dos
exemplos de aplicao escolhidos.
Alm disso, foi desenvolvido um conceito geral para a avaliao de hipteses, usado como
operador bottom-up. Considerando que estes operadores sero utilizados nos exemplos de
aplicaes posteriormente descritos, eles sero sucintamente descritos a seguir.
No mbito do Projeto GeoAIDA foi desenvolvido um procedimento que precisa para a deteco
de prdios to-somente dos dados altimtricos e que no trabalha com modelos paramtricos.
Trata-se de um procedimento de crescimento de regies (Region Growing). Partindo dos dados
altimtricos do Laserscan, inicialmente so detectados saltos de altitudes. Regies contnuas,
nas quais os valores altimtricos vizinhos se diferenciam por menos do que um determinado
limiar, recebem um rtulo. Regies muito pequenas, que ocorrem p.ex. em reas de florestas,
permanecem no-classificadas; regies grandes demais so associadas ao plano de fundo.
64
Fig. 5.1: Segmentao de prdios com dados de Laserscan: comea-se esquerda em cima na imagem,
com as direes de partida mostradas na tabela. A direo de trabalho mantida, enquanto os pixels
estiverem no caminho para a regio. Posteriormente feita a escolha da prxima direo de trabalho de
acordo com a tabela.
A segmentao ocorre conforme apresentado na Figura 5.1. A procura iniciada com o pixel
superior esquerdo na imagem. A Tabela da direita apresenta a seqncia da alterao de
direo. A partida dada na linha Start com direo para a esquerda. Se isto no for possvel,
ocorre a mudana para baixo. Sendo alcanado o limite da regio, procede-se mudana
segundo a ordem da Tabela de Direes, cuja coluna esquerda contm a direo atual. As
direes ali indicadas como contrrias so testadas. Este procedimento recursivo repetido
at que no seja mais possvel nenhuma alterao de direo e o mais alto nvel de recurso
tenha sido alcanado. Ento o prximo pixel que ainda no pertena a uma regio procurado
na imagem e a partir dele procede-se de modo correspondente.
Na Figura 5.2 mostrada a aplicao do procedimento aos dados laser no centro da cidade de
Karlsruhe (Alemanha). Os dados altimtricos se encontram num raster de 0,5 m (resoluo
espacial) com uma resoluo (altimtrica) de 0,1 m. Aqui foi usado o valor de limiar de altitude
de 1 m. No mnimo 100 e no mximo 10.000 clulas no raster formam uma regio. Conforme
mostrado por esta figura, atravs desta escolha de parmetros so reconhecidos
essencialmente prdios com ptios internos fechados. reas de florestas bem como reas
verdes geralmente no so consideradas porque no representam reas conectadas
suficientemente grandes.
65
Fig. 5.2: Resultado da segmentao de plats de altitude em dados de
Laserscan
Um ptio interno fechado caracteriza-se pelo fato de estar rodeado por plats mais elevados.
Para delimitar a classe Ptio (Hof) da classe Prdio (Gebude), precisam ser determinadas
inicialmente as regies vizinhas de uma regio. Se as regies vizinhas forem todas elas mais
altas que a regio observada, ento a respectiva regio ser classificada como Ptio. A
Figura 5.3 mostra o resultado desta classificao tendo como exemplo o centro da cidade de
Karlsruhe. A classe Prdio est em vermelho, a classe Ptio est representada em verde.
66
5.1.2. Classificao baseada em textura
Imagens de superfcies naturais (no alteradas) podem ser descritas eficientemente atravs de
modelos de textura, que se baseiam em processos estocsticos bidimensionais. Uma possvel
implementao de um modelo estocstico para a classificao supervisionada de textura foi
descrita em [38]. Supervisionada neste contexto significa que se analisa uma amostra de
textura contendo as classes esperadas na imagem, com relao s suas caractersticas
estocsticas de primeira e segunda ordem. O modelo de primeira ordem aqui descreve a
densidade de probabilidade do processo de textura. A densidade calculada a partir do
histograma de luminncia de todos os elementos de cada classe de treinamento.
Em imagens com vrios canais pesquisada, alm disso, a dependncia dos canais entre si.
As probabilidades Pi formam o potencial VK de uma clique K. O logaritmo da probabilidade
utilizado como funo potencial, de modo a transformar a multiplicao de probabilidades
conjuntas, em soma dos potenciais ponderados:
A varincia de uma imagem pode ser utilizada como medida de sua estrutura. Com a
diminuio da resoluo da imagem, uma elevada varincia um indicador de estruturas
maiores. Verificou-se empiricamente que objetos artificiais, como por exemplo prdios,
provocam varincias particularmente elevadas em imagens com resoluo maior do que um
pixel/metro.
Por isso, no mbito deste projeto, foi desenvolvido um operador de segmentao baseado em
varincia, que permite determinar espaos de busca para objetos artificiais. Para tanto,
inicialmente determinada a varincia numa janela de tamanho pr-definido para toda a
imagem. Atravs de uma anlise do histograma da varincia (vide item 2.2.1) executada uma
segmentao inicial.
67
Considerando que a varincia em reas edificadas tambm muito grande, a segmentao
assim originada bastante esburacada. Estes buracos so fechados na medida em que
pequenas reas contguas so fundidas s suas redondezas.
Para obter um espao de busca o mais contnuo possvel, o prximo passo fundir regies
prximas. Se duas regies esto ligadas em vrios pontos, originam-se novamente buracos
que so novamente fechados. No ltimo passo as estruturas finas so eliminadas.
A Figura 5.5 explicita o procedimento de procura. Neste exemplo h trs alternativas para a
extenso da seo de estrada. Uma extenso da estrada termina quando um determinado
valor de custo for ultrapassado (vide equaes 5.1 a 5.3 abaixo). Os custos totais ctotal
compem-se da soma dos custos de procura j acumulados caccum e uma avaliao ponderada
dos custos restantes cremain . w designa aqui a profundidade de procura permitida e l um fator
de ponderao. celement denota os custos de um elemento da estrada.
68
Fig. 5.5: Procura do percurso de estrada otimizado
O seguinte problema precisava ser resolvido: embora o conjunto de funes necessrias seja
relativamente fixo, a combinao necessria depende, no entanto, da aplicao. Isto levou
soluo de implementar de modo eficiente em C++ as funes para a determinao de
atributos de objetos como forma e cor e para o agrupamento com base nas relaes entre
objetos tais como prximo um do outro, e transportar a combinao das funes atravs do
editor de redes semnticas interno ao GeoiAIDA, para o interpretador descrito na seo 4.6.2.
Visto que a biblioteca de funes e o interpretador so unidades separadas, que esto
conectadas entre si atravs de uma interface, extenses de funes so facilmente integrveis
ao interpretador.
Como preparo para a anlise de uso do solo, inicialmente projetada uma rede semntica
baseada na hierarquia ATKIS (vide Figura 5.6). As classes de objetos rea Urbana, rea de
cultivo, Vila, Indstria, Campo Agrcola, Gramado e Floresta derivam diretamente do catlogo
ATKIS.
69
Fig. 5.6: Objetos do ATKIS transformados numa rede semntica; A classe
Regio serve como classe auxiliar para a diviso inicial da cena. Os objetos
Indstria e Assentamento sob as classes ATKIS so utilizados para uma
anlise estrutural, visto que as classes no podem ser diretamente
reconhecidas.
Freqentemente diferentes usos do solo so delimitados por ruas. Por isso foi inserido o n
Regio. As regies iniciais podem ser introduzidas atravs da rede viria, a qual retirada ou
de um SIG ou procurada pelo algoritmo de deteco de estradas descrito no item 5.1.4.
Locais de procura para as classes de objetos rea Urbana e Agricultura podem ser
determinados atravs de uma anlise de varincia conforme consta no item 5.1.3, j que a
varincia em resolues de imagem menores, maior em reas habitadas do que em reas
desabitadas devido a construes artificiais. Uma outra opo para se obter indicaes para
uma rea Urbana analisar a regio quanto a possveis prdios existentes (vide item 5.1.1).
Da cena representada na Figura 5.7, de Koblenz (Alemanha), esto disponveis uma fotografia
area, a informao altimtrica, bem como informaes sobre a rede viria, obtidas do ATKIS.
70
Fig. 5.7: Dados de entrada da cena Koblenz: foto area e Laserscan.
Fig. 5.8: Interpretao parcial da cena de Koblenz: (a) sub-diviso inicial da regio com base na rede viria, (b) objetos
de um Assentamento superpostos na foto area, (c) objetos de uma Vila em forma de mapa, (d) resultado final da
anlise de uso do solo.
Na Figura 5.9 encontram-se tanto indcios de uma rea de assentamento ( esquerda) como
de instalaes industriais ( direita). A legenda destes mapas encontra-se na Figura 5.6. Neste
caso, duas estratgias de soluo so possveis: pode ser tomada uma deciso a favor de uma
das duas alternativas, ou a regio dividida. No caso em que o nmero de casas relativamente
extenso das instalaes industriais desempenha um papel meramente secundrio, deve-se
ento assumir que mesmo assim se trata de uma rea industrial, porque mesmo em reas
industriais ocorrem isoladamente pequenos prdios. Esta a soluo para a situao
apresentada. A segunda opo de soluo seria a diviso da regio em Assentamento e
71
Indstria. Ambas as alternativas de soluo so realizveis atravs do operador de avaliao
genrico descrito em 5.1.5.
Fig. 5.9: Interpretao alternativa de uma regio parcial como rea de assentamento ( esquerda) ou rea de indstria
( direita).A legenda se encontra na Figura 5.6.
Na Figura 5.10 observa-se uma seo de um conjunto de dados multi-sensor de uma cena de
Ravensburg. Trata-se de uma imagem na regio do visvel e de outra no infravermelho com
uma resoluo de 1Pixel/25 cm e de um modelo altimtrico do Laserscan com uma resoluo
de 1 Pixel/m. Pela disponibilidade do canal no infravermelho a anlise de uso do solo torna-se
mais confivel, visto que, em combinao com a imagem visual, reas vegetadas se
diferenciam bem de superfcies impermeabilizadas. Alm disso, a associao com dados
Laserscan permite calcular a altura da vegetao, visto que a vegetao parcialmente
transparente luz e assim parte da radiao laser refletida em diferentes alturas da
vegetao. um padro no sistema de varredura a laser que o primeiro e o ltimo pulso sejam
registrados, de modo que a partir disso seja possvel derivar uma medida de altura da
vegetao.
72
Fig. 5.10: Dados de entrada da cena de Ravensburg: imagem no visvel, infravermelho e Laserscan.
Fig. 5.11: Cena de Ravensburg: esquerda ATKIS, direita a interpretao. Legenda: Straen= estradas, Wege =
caminhos, Wohnbebauung = Construo de residncias, Ortslage = reas construdas, Siedlung = Assentamento,
Acker = Campo agrcola, Grasland = Gramneas, Forst = Reflorestamento,
73
5.3. Exemplo de anlise de uso do solo apoiada em dados de
satlite
As interaes entre desenvolvimentos na rea do meio ambiente e atividades na agricultura e
indstria so um tema fundamental da Agenda 21 (da Repblica Federal da Alemanha n.d.t.).
Para estimular o uso no-destrutivo de recursos naturais, so absolutamente necessrios um
controle coordenado do meio-ambiente e um planejamento ambiental sistemtico. Um
monitoramento contnuo da superfcie terrestre atravs de satlites um instrumento til para
dar conta destas tarefas. No entanto, via de regra no h pessoal qualificado suficiente para
interpretar os dados de sensoriamento remoto. A aplicao de um sistema de interpretao
automtica permite reconhecer o tipo e volume das alteraes de uso do solo.
Para avaliar o resultado da interpretao automtica, foi elaborado um mapa de referncia pelo
especialista humano. A Figura 5.13 mostra esquerda o mapa de referncia e direita o
resultado da interpretao automtica. Aqui apareceram boas concordncias acima de 90%
para as classes Rocha e Floresta. A classificao errnea para Pastagem com 55% est
relativamente elevada, visto que Pastagem, em setores de sombras, foi classificada
erroneamente como Floresta. A incluso de informaes altimtricas aqui pode ajudar na
74
deteco inicial de reas sombreadas. Regies urbanas com baixa densidade populacional
tambm causam problemas, visto que aqui a informao textural muito fraca e por outro lado
a resoluo da imagem no suficiente para classificar estruturalmente estes setores, atravs
da deteco de prdios. Assim sendo 13% das reas urbanas foram classificadas
erroneamente como Pastagem e 33% como Floresta. Ao avaliar estes resultados h que se
considerar que o analista da imagem freqentemente utiliza um amplo conhecimento prvio,
que no pode ser obtido da imagem, como p.ex., o conhecimento do local, e assim diferentes
analistas de imagem chegam a diferentes resultados.
75
6. Avaliao e Perspectivas
Os exemplos apresentados nos itens 5.2 e 5.3 demonstram que, a arquitetura desenvolvida
neste trabalho satisfaz o objetivo de controlar a interpretao de dados de sensoriamento
remoto. Contrastando com os sistemas baseados em conhecimento disponveis at o
momento, a anlise de grandes cenas tambm possvel de forma eficiente. Isto por um lado
est fundamentado na estratgia de anlise hierrquica, a qual pode delimitar de antemo as
reas de busca para determinadas classes de objetos. Por outro lado foi otimizada uma
implementao que permite o paralelismo dos passos de anlise, o que possibilita uma
utilizao eficiente dos recursos computacionais. Alm disso, a concepo aberta para a
conexo de operadores externos de processamento de imagens e de avaliao, facilita o
preparo de aplicaes complexas em equipe, especialmente porque solues parciais
existentes so facilmente integrveis.
Os problemas a serem considerados so, por um lado, o complexo design da anlise, que
estaria numa ordem superior atual, e por outro lado questes referentes visualizao. O
usurio precisar ter por um lado vises individuais da cena, e por outro lado a visualizao
das associaes entre as hierarquias.
Uma ampliao do sistema nesta direo , em princpio, bastante simples. Aos operadores
precisa ser agregada uma descrio detalhada dos tipos de dados aceitveis, tal como agora j
76
est disponvel de forma incipiente. Alm disso, sero complementados por uma medida de
qualidade, que descreve a sua adequao com relao deteco de uma determinada classe
de objetos. No design dos operadores deve-se observar que os valores para os parmetros
sejam calculados, na medida do possvel, a partir dos prprios dados, para que uma
configurao manual se torne desnecessria. Eventualmente seriam adequados para a sua
execuo, sistemas baseados em agentes, tal como esto descritos em [25] como uma forma
de aproveitamento do conhecimento.
77
enquanto que a criao de um novo bairro residencial numa rea agrcola com construes na
vizinhana, bastante provvel. Neste procedimento, uma classificao inicial correta torna-se
mais importante. Alm disso, uma nica classificao errnea pode levar a um desvio nas
classificaes subseqentes.
Avaliao de expectativa. Uma avaliao de expectativa poderia ser obtida, por exemplo,
atravs de uma avaliao modificada, da lista de objetos originada pelo operador top-down
utilizando uma interpretao anterior e probabilidades de transio. As probabilidades de
transio aqui podem ser integradas como atributos dos objetos. A avaliao na interpretao
dos resultados top-down precisaria ser complementada.
Se por outro lado forem permitidas tolerncias absolutas, coloca-se a questo quanto ao valor
mximo aceitvel para estes desvios. Se numa grande rea florestal for cortada uma rvore,
esta alterao ser de pequeno interesse. Se, no entanto l for construda uma casa, trata-se
ento de uma mudana do uso do solo.
As mudanas na cena so melhor detectveis durante a fase bottom-up, visto que comeando
com as menores estruturas vo se formando objetos contguos cada vez maiores. Na maioria
das vezes as mudanas so visveis inicialmente nas pequenas estruturas, ao passo que
alteraes detectadas nos nveis mais elevados da hierarquia de objetos decorrem de
imprecises da interpretao, como pequenos deslocamentos das bordas dos objetos.
78
cortadas rvores, isto ocorre por motivos de economia florestal. Nas florestas tropicais da
Amrica do Sul por outro lado isto pode ser um indcio do incio de um desmatamento ilegal.
79
7. Resumo
O contedo do presente trabalho o projeto de uma arquitetura de um sistema baseado em
conhecimento para a interpretao automtica de dados de sensoriamento remoto. O sistema
controla a seqncia de interpretao de fotos areas e imagens de satlite e gera uma
descrio simblica de cenas, que agrega uma semntica aos objetos na imagem. A descrio
simblica de cenas efetuada na forma de uma rvore. Cada n corresponde a um objeto nos
dados (imagens) de entrada. A posio exata de cada objeto registrada com um valor de
identificao especifico do objeto em imagens rotuladas. Com ajuda da rvore de objetos
(instncias) e das imagens rotuladas, podem ser produzidos mapas com diferentes graus de
detalhamento.
Alm dos dados de sensoriamento remoto propriamente ditos, o sistema precisa para a
interpretao dos dados, de um modelo das classes de objetos esperados. Este modelo
estabelecido na forma de uma rvore, na qual sub-objetos estejam totalmente contidos em
super-objetos. Estas classes so designadas de ns. A cada n pode ser associado um
operador de processamento de imagem, que est em condies de extrair objetos daquela
classe do material de imagem disponibilizado, ou que pelo menos tenha a possibilidade de
indicar previamente as possveis reas de procura para objetos daquela classe.
80
As abordagens propostas at o momento para a interpretao de dados de sensoriamento
remoto podem ser subdivididas em duas categorias. Por um lado trabalha-se no
desenvolvimento de algoritmos que possam detectar poucas classes de objetos num
determinado contexto. Por outro lado h sistemas integrados, que tentam interpretar cenas
inteiras. Os sistemas mais promissores desta segunda categoria mantm o conhecimento
sobre a cena em redes semnticas. Tais redes semnticas correspondem a um modelo da
cena. Cada n da rede corresponde a um objeto que pode ocorrer na cena. As relaes entre
os objetos so modeladas em arcos, que conectam os ns. Para realizar uma anlise baseada
em regras, associam-se determinados significados aos arcos. Alguns sistemas permitem
somente a descrio de relaes hierrquicas como part-of, is-a, etc. Outros introduzem
relaes topolgicas para, por exemplo, descrever a vizinhana de objetos. A caracterstica
comum a todos estes procedimentos que o processamento de imagem propriamente dito
est somente vinculado no nvel dos ns folha. A interpretao efetuada atravs de anlise
estrutural a partir dos objetos brutos obtidos das imagens. Em funo do grande nmero de
objetos brutos existentes em dados de sensoriamento remoto e das muitas possibilidades de
combinaes da resultantes, estes procedimentos so pouco adequados para a interpretao
de dados de sensoriamento remoto.
O sistema apresentado neste trabalho tambm utiliza uma rede semntica para a descrio do
modelo de conhecimento. A rede semntica rigorosamente hierrquica e utilizada
concomitantemente para o controle da anlise. Os arcos tem uma importncia especial. Eles
conectam somente objetos em diferentes planos hierrquicos. O seu significado est vinculado
a operadores de avaliao, que, de acordo com cada exigncia especfica, podem ser
reproduzidos para todos os tipos de arcos possveis. Assim, relaes part-of podem ser
modeladas da mesma forma que relaes topolgicas entre objetos em um mesmo nvel
hierrquico.
A conexo com os dados ocorre em cada n da rede semntica, desde que se conhea um
procedimento capaz de restringir o espao de busca para objetos do correspondente tipo de
n. Estes procedimentos no esto limitados ao processamento de imagens. De modo
equivalente, por exemplo consultas em bancos de dados tambm podem ser integradas num
SIG. Atravs da restrio prvia do espao de busca nos nveis de objetos superiores, no
necessria uma busca completa de todas as combinaes de primitivas da imagem, procura
de solues apropriadas. Obtm-se assim um aumento de eficincia.
A estratgia de anlise orientada ao modelo hierrquico dividiu a cena inicial em setores cada
vez menores, os quais podem ser tratados independentemente. Atravs disso, obtm-se um
grau elevado de paralelismo, que viabiliza a utilizao do sistema em computadores com
mltiplos processadores ou em clusters de computadores.
Deu-se grande nfase na criao de uma interface simples e flexvel para o acoplamento a
programas externos de processamento de dados. Tais programas so utilizados tanto para a
segmentao e classificao como tambm para a avaliao. Por isso o sistema
especialmente adequado para projetos cooperativos, para coordenar a fuso de resultados
parciais de diferentes processos de anlise. Em projetos de verificao do ATKIS e na
interpretao de imagens de satlite referentes a mudanas de uso do solo em reas florestais
da Amrica do Sul, o conceito aqui elaborado comprovou a sua aplicabilidade universal.
81
Glossrio
Nota do Tradutor: Neste glossrio mantida a seqncia do original em alemo.
A*
Byteorder Dados que ultrapassam a faixa de valores [0...255], somente podem ser
armazenados em mais que um byte. Se os dados devem ser guardados num arquivo,
precisa ser decidido se inicialmente os bytes de valor mais elevado (Big-Endian-
System) ou os bytes de valor mais baixo (Little-Endian-System) sero arquivados. De
que forma os tipos de dados so arquivados, depende de como o processador trabalha
com os dados. No caso de processadores Intel por exemplo trata-se de Little-Endian-
Systems, enquanto a arquitetura Power PC, bem como muitos processadores RISC
utilizam Big-Endian. Ocorrem dificuldades na entrada dos dados de sistemas com
diferentes Byteorders. Somente quando o tamanho dos tipos de dados for conhecido,
os dados podem ser corretamente transformados.
Cache Como cache designa-se um arquivo de dados com curtos perodos de acesso, que
anteposto a um arquivo de dados mais lento. Dados frequentemente usados so
colocados no cache e podem ser rapidamente disponibilizados em caso de
necessidade. Caso os dados no estejam disponveis no cache precisa ser acessada a
memria principal. Os dados so transmitidos ao cache para que, no caso de novo
acesso, eles possam ser rapidamente disponibilizados. Aps cada acesso ao cache o
valor dos dados correspondentes aumentado. Caso o cache estiver cheio, aqueles
dados de menor valor so retirados.
82
CSV CSV um espao de cor, nos quais as cores so representadas pelas componentes
Cor (C), Saturao (S) e Valor de brilho (V). Este espao de cor mais indicado para
tarefas de segmentao, visto que nveis de cinza e cores esto separados.
E
eXtended Markup Language (XML) Em XML podem ser armazenadas hierarquias de objeto
com atributos. XML uma linguagem que pode ser designada como uma
generalizao de Hypertext Markup Language (HTML). Enquanto o HTML conhece um
conjunto fixo de objetos, em XML o significado dos objetos definido num arquivo
auxiliar. GeoAIDA no precisa destes arquivos auxiliares. O significado dos objetos
determinado especificamente no contexto.
F
FIFO FIFO sigla de First In First Out e significa que o dado que foi colocado inicialmente no
container de dados, deixa o container primeiramente. Isto corresponde ao modo de
trabalho de uma correia transportadora. O objeto que colocado primeiro na correia
transportadora, chega primeiro o seu final (vide LIFO).
Filter Um filtro um programa que submete dados a uma transformao, para torn-los mais
acessveis em relao a certas informaes.
Finite State Machine (FSM) Designa-se de Finite State Machine um autmato que somente
pode aceitar um nmero limitado de condies. Estas condies via de regra percorrem
uma seqncia pr-determinada, na qual ocorrncias externas podem alterar a
seqncia do trabalho.
G
GeoAIDA a sigla de Geo Automatic Image Data Analyzer e designa geralmente um projeto
com ferramentas para a avaliao de dados de sensoriamento remoto.
Especificamente GeoAIDA consiste num procedimento que, com ajuda de
conhecimento de modelos, interpreta automaticamente dados de sensoriamento
remoto.
Holistic O termo holistic designa algo como totalidade. No sistema GeoAIDA este termo
usado em conjunto com operadores. Um operador holstico um programa que permite
83
a deteco de uma ou vrias classes de objeto de modo
mgico, isto atravs de uma considerao total, no especificada em detalhe dos
dados de entrada, tendo como objetivo delimitar o nmero das possveis hipteses.
Hypertext Markup Language (HTML) A Hypertext Markup Language serve para descrever
textos estruturalmente.
Labelbild Uma imagem rotulada serve para descrever a posio e a extenso de objetos com
a preciso exata de um pixel, na medida em que aos pixels que se encontram dentro
dos limites do objeto associado um valor de identificao.
LIFO LIFO a sigla de Last In First Out e significa que a ltima data ajustada no continer de
dados, a primeira que deixa novamente o continer. Isto corresponde forma de
trabalho de uma pilha. O objeto que foi colocado por ltimo na pilha, dever ser o
primeiro novamente retirado (vide FIFO).
Pipe Como Pipe designa-se uma forma especial de arquivo, acessado por dois processos
que atuam simultaneamente: um processo registra seu resultado no arquivo enquanto
o outro l este arquivo. Pipes servem para a troca de dados entre dois processos que
ocorrem no mesmo computador. Pipes normalmente no possuem nome, ou seja eles
somente podem ser estruturados atravs de hereditariedade entre dois processos. Os
assim chamados Named Pipes no tm esta desvantagem. Aparecem no sistema de
arquivos e podem ser abertos por dois processos, como arquivos normais. Informaes
mais detalhadas encontram-se em [99].
84
Pixel Pixel a forma curta de Picture element e descreve um ponto da imagem.
Prozess Um processo designa uma programa com desenvolvimento prprio que, ao contrrio
de um Thread, est ativado e encapsulado por outros programas ativos simultnea
mente do ponto de vista da tcnica de armazenamento.
S
Script Um Script designa uma seqncia de linhas de comando que, sendo chamado o Script,
so executadas pelo Intrprete.
Socket Contrastando com Pipes, atravs de Sockets possvel a troca de dados entre
processos, que esto rodando em diversos computadores. Para isto, de cada lado
aberto um Socket, sobre o qual ocorre a transferncia de dados. Sockets so por
exemplo aplicados em diversos protocolos de redes. Informaes mais detalhadas
encontram-se em [99].
Spatial Espacial.
Standard Template Library (STL) STL uma coleo de continers de dados Template e das
funes Template que podem ser utilizadas sobre os mesmos.
Synthetic Aperture Radar (SAR) O radar de abertura sinttica designa um mtodo para
ampliar a abertura de uma antena sinteticamente para emitir e receber microondas em
fase coerente ao longo de um longo percurso de vo. Sistemas SAR podem ser
aerotransportados ou orbitais.
85
T
Task Task designa uma tarefa a ser resolvida. No contexto de computao considerado
como sinnimo de processo.
Token Como Token designa-se um smbolo que representa um certo assunto ou um certo
objeto.
Umgekehrt Polnische Notation (UPN) Uma UPN (Notao Polonesa Invertida) uma
notao ps-fixada, isto , so sempre indicados primeiro os operandos e depois os
operadores a serem usados sobre estes. O resultado colocado no local do operador e
continua-se com o processamento.
Visulelles Bild (VIS) Imagem visual. Com VIS designada uma imagem da faixa do visvel no
espectro da luz. Pode tratar-se aqui de uma imagem colorida ou de nvel de cinza.
86
Bibliografia
[4] Ackermann, F.: Digital Image Correlation: Performance and potential Application
In Photogrammetry. In Photogrammetric Record, Bd. 11, S. 429439. 1985.
[5] Aviad, Z., Carnine, P.: Road Finding for Road-Network Extraction. In
Computer Vision and Pattern Recognition, S. 814819. IEEE, 1988.
[6] Baatz, M., Heynen, M., Hofmann, P., Lingenfelder, I., Mimler, M., Schpe,
A., Willhauck, G.: eCognition User Guide. Definiens AG, Mnchen, 2000.
[7] Baatz, M., Schpe, A.: Object-oriented and multi-scale image analysis in
semantic networks. In Proc. 2nd International Symposium on Operationalisation
of Remote Sensing Conference and Exhibition. ITC, Enschede, 1999.
[9] Baillard, C. et al.: Segmentation of Urban Scenes from Aerial Stereo Imagery.
In Proc. of 14th Int. Conf. on Pattern Recognition. Brisbane, Australia, 1998.
[11] Barnsley, M., Barr, S.: A graph-based structural pattern recognition system
to infer land use from fine spatial resolution land cover data. Computers,
Environment and Urban Systems, Bd. 21:209225, 1997.
[12] Barzohar, M., Cooper, D.: Automatic Finding of Main Road in Aerial Images
by Using Geometric - Stochastic Models and Estimation. In Computer
Vision and Pattern Recognition, S. 459464. IEEE, 1993.
[13] Bauer, T., Steinnocher, K.: Per-parcel land use classification in urban
areas applying a rule-based technique. GIS, Vol. 6:2427, 2001.
[14] Baumgartner, A., Eckstein, W., Heipke, C., Hinz, S., Mayer, H., Radig, B.,
Steger, C., Wiedemann, C.: TUM-Research on Road Extraction. Christian
Heipke and Helmut Mayer, 1999.
[15] Baumgartner, A., Steger, C., Mayer, H., Eckstein, W., Ebner, H.: Automatic
Road Extraction based on Multi-Scale, Grouping, and Context.
In Photogrammetric Engineering & Remote Sensing, Bd. 65, S. 777786.
1999.
87
[16] Belknap, R., Hanson, A., Riseman, E.: The information fusion problem
and a rule-based hypotheses applied to complex aggregations of image
events. In Proc. of the IEEE Conference on Computer Vision and Pattern
Recognition, S. 2226. Miami, 1986.
[17] Beveridge, R., Hanson, A., Riseman, E.: Segmenting images using localized
histograms. Coins technical report, University of Massachusetts at
Amherst, 1986.
[19] Blaschke, T., Lang, S., Lorup, E., Strobl, J., Zeil, P.: Object-oriented image processing in
an integrated GIS/remote sensing environment for environmental applications. In Cremers,
A., Greve, K., Hg., Umweltinformatik 00. Metropolis, Bonn, 2000.
[22] Burns, J., Hanson, A., Riseman, E.: Extracting linear features. In 7th International
Conference on Pattern Recognition, Bd. I, 482485. Montreal, 1984.
[23] Burns, J., Hanson, A., Riseman, E.: Extracting straight lines. IEEE Trans on Pattern
Analysis and Machine Intelligence (PAMI), vol. 8:425455, 1986.
[24] Bckner, J.: Model Based Road Extraction for the Registration and Interpretation of
Remote Sensing Data. In ISPRS Commission IV Symposium on GIS - Between Visions
and Applications. Stuttgart, Germany, 7.9.- 10.9.98, 1998.
[25] Bckner, J.: Ein wissensbasiertes System zur automatischen Extraktion von semantischen
Informationen aus digitalen Fernerkundungsdaten. Dissertation, Institut fr Theoretische
Nachrichtentechnik und Informationsverarbeitung, Universitt Hannover, Hannover, 2002.
[26] Bckner, J., Mller, S., Pahl, M., Stahlhut, O.: Semantic Interpretation of Remote Sensing
Data. In Proc. ISPRS2002. Graz, Austria, 2002.
[27] Bckner, J., Pahl, M., Stahlhut, O.: Radiometric Equalization of Remote Sensing Data by
Utilization of Laserscan Data. In CCECE-2001 Canadian Conference on Electrical and
Computer Engineering. Toronto, Canada, 2001.
[28] Bckner, J., Pahl, M., Stahlhut, O., Liedtke, C.-E.: GeoAIDA - A Knowledge Based
Automatic Image Data Analyser for Remote Sensing Data. In CIMA 2001. Bangor, Wales,
UK, 2001.
[29] Bckner, J., Pahl, M., Stahlhut, O., Liedtke, C.-E.: A Knowledge-Based System for Context
Dependent Evaluation of Remote Sensing Data. In Pattern Recognition, 24th DAGM
Symposium, Nr. 2449 in LNCS, p. 5867. Springer, Zrich, Switzerland, 2002.
[30] Clement, V., Giraudon, G., Houzelle, S., Sadakly, F.: Interpretation of Remotely
Sensed Images in a Context of Multisensor Fusion Using a Multi-specialist
Architecture. IEEE Trans. on Geoscience and Remote Sensing, vol. 31(4):779791, 1993.
[31] Coleman, G. B., Andrews, H. C.: Image segmentation by clustering. Proceedings IEEE,
Vol. 67:773785, 1979.
88
[32] Collins, R. T., Jayens, C. O., Cheng, Y.-Q.,Wang, X., Stolle, F., Riseman, E. M., Hanson,
A. R.: The Ascender System: Automated Site Modeling from Multiple Aerial Images. In
Computer Vision and Image Understanding, Bd. 72, S. 143162. 1998.
[33] Curlander, J. C., McDonough, R. N.: Synthetic Aperture Radar, Systems and Signal
Processing. John Wiley & Sons, New York, 1991.
[34] Draper, B., Collins, R., Brolio, J., Hanson, A., Riseman, E.: The Schema System.
International Journal of Computer Vision, Bd. 2(3):209250, 1989.
[36] Fischer, A., Kolbe, T. H., Lang, F., Cremers, A. B., Frstner, W., Plmer, L., Steinhage, V.:
Extracting Buildings from Aerial Images Using Hierarchical Aggregation in 2D and 3D. In
Computer Vision and Image Understanding, vol.72, 185203. 1998.
[37] Gerke, M., Heipke, C., Straub, B.-M.: Building extraction from aerial imagery using a
generic scene model and invariant geometric moments. In Proceedings IEEE/ISPRS Joint
Workshop on Remote Sensing and data fusion over urban areas, S. 8589. 2001.
[38] Gimelfarb, G. L., Zalesny, A. V.: Probabilistic models of digital region maps based on
Markov random fields with short and long-range interaction. In Pattern Recognition Letters,
Vol.14, 789797. 1993.
[39] Gorte, B.: Probabilistic Segmentation of Remotely Sensed Images. Dissertation, ITC,
Twente, 1998.
[40] Gottlob, G., Frhwirt, T., Horn, W.: Expertensysteme. Springer Verlag, Wien, 1990.
[41] Grau, O.: Wissensbasierte 3D-Analyse von Gebudeszenen aus mehreren frei gewhlten
Stereofotos. Dissertation, Institut fr Theoretische Nachrichtentechnik und
Informationsverarbeitung, Universitt Hannover, Hannover, 2000.
[43] Growe, S., Tnjes, R.: A Knowledge Based Approach to Automatic Image Registration. In
Proceedings of International Conference on Image Processing (ICIP97), vol. III. Santa
Barbara, USA, 1997.
[44] Grnreich, D.: ATKIS - A Topographic Information System as a Basis for a GIS and Digital
Cartography in West Germany. Geol. Jb., Bd. A122:207215, 1992.
[45] Haala, N., Brenner, C.: Interpretation of Urban Surface Models Using 2D Building
Information. In Computer Vision and Image Understanding, vol. 72, S. 204214. 1998.
[46] Hanson, A., Riseman, E.: The VISIONS Image-Understanding System. In Brown, C., (ed.),
Advances in Computer Visions, p.1114. Lawrence Erlbaum Associates, Hillsdale, 1988.
[47] Hanson, A., Riseman, E. M.: Computer Visions Systems, Chapter VISIONS: A Computer
System for Interpreting Scenes, S. 303334. Academic Press, New York, 1978.
[48] Haralick, R. M., Riseman, E. R.: Image segmentation techniques. In Computer Vision,
Graphics, and Image Processing, Bd. 29, S. 100132. 1985.
[49] Hartmann, G.: Recognition of Hierarchically Encoded Images by Technical and Biological
Systems. In Biological Cybernetics, Bd. 57, S. 7384. 1987.
89
[50] Healey, G., Binford, T. O.: The role and use of color in a general vision system. In DARPA
Image Understanding Workshop, p. 599613. Los Angeles, 1987.
[51] Henricsson, O.: The Role of Color Attributes and Similarity Grouping in 3-D Building
Reconstruction. In Computer Vision and Image Understanding, Vol. 72, 163184. 1998.
[52] Horowitz, S. L., Pavlidis, T.: Picture segmentation by a tree traversal algorithm. Journal of
the ACM, Vol. 23:368388, 1976.
[53] Illert, A.: Konzepte zur Fortfhrung des ATKIS. Nachrichten aus dem Karten- und
Vermessungswesen, p. 6174, 1994. Reihe 1, Heft 111.
[54] Jain, A. K., Dubes, R. C.: Algorithms for Clustering Data. Prentice Hall, Englewood Cliffs,
NJ, 1988.
[55] Kettig, R. L., Landgrebe, D. A.: Computer Classification of Remotely Sensed Multispectral
Image Data by Extraction and Classification of Homogeneous Objects. In IEEE
Transactions on Geoscience Electronics, Vol. GE-14, p. 1926. 1976.
[56] Klinker, G. J., Shafer, S. A., Kanade, T.: A physical approach to color image
understanding. International Journal of Computer Vision, Vol. 4:738, 1990.
[57] Kohl, C., Hanson, A., Riseman, E.: A goal-directed intermediate level executive for image
interpretation. In 10th International Joint Conference on Artificial Intelligence, Vol. II, p.
811814. Milan, 1987.
[58] Kollewe, M., Spitzner, H.: A Link between Multispectral Remote Sensing Image Processing
and Ecological Analysis of Landscape Elements. In Proceedings of IGARSS95, p. 291
293. IEEE, 1995.
[60] Kummert, F.: Flexible Steuerung eines sprachverstehenden Systems mit homogener
Wissensbasis. Infix Verlag, Sankt Augustin, 1992.
[61] Kummert, F.: Interpretation von Bild- und Sprachsignalen Ein hybrider Ansatz. Shaker
Verlag, 1998.
[63] Lang, F.: Geometrische und semantische Rekonstruktion von Gebuden durch Ableitung
von 3D Gebudeecken. Dissertation, Universitt Bonn, 1999. Reihe Informatik, Shaker
Verlag.
[64] Le Besnerais, G., Oriot, H.: Disparity estimation for high resolution stereoscopic
reconstruction using the GNC approach. In Proc. IEEE Conf. on Image Processing.
Chicago, Illinois, 1998.
[65] Leberl, F. W.: Radargrammetric Image Processing. Artech House, Norwood, MA, 1990.
[66] Lehrer, N., Reynolds, G., Griffith, J.: Initial hypothesis formation in image understanding
using an automatically generated knowledge base. In Proc. DARPA Image Understanding
Workshop, 521537. Morgan Kaufmann Publishers, Inc., 1987.
[67] Liedtke, C.-E., Bckner, J., Grau, O., Growe, S., Tnjes, R.: AIDA: A System for the
Knowledge Based Interpretation of Remote Sensing Data. In 3rd Int. Airborne Remote
Sensing Conference & Exhibition, Vol. II, 313320. Copenhagen, Denmark, 1997.
90
[68] Liedtke, C.-E., Bckner, J., Pahl, M., Stahlhut, O.: Knowledge based system for the
interpretation of complex scenes. In Third International Workshop on Automatic Extraction
of Man-Made Objects from Aerial and Space Images. Ascona, Schweiz, 2001.
[71] Matsuyama, T.: Knowledged-Based Aerial Image Understanding Systems and Expert
Systems for Image Processing. In IEEE Transactions on Geoscience and Remote
Sensing, Bd. GE-25, 305316. 1987.
[73] McKeown, D., Harvey, W. A., McDermott, J.: Rule-Based Interpretation of Aerial Imagery.
IEEE Trans. on Pattern Analysis and Machine Intelligence (PAMI), Vol. 7(5):570585,
1985.
[74] Meinel, G., Neubert, M., Reder, J.: Pixelorientierte versus segmentorientierte Klassifikation
von IKONOS-Satellitenbilddaten ein Methodenvergleich. Zeitschrift fr Photogrammetrie,
Fernerkundung und Geoinformation, (3), 2001.
[75] Musser, D. R.: The STL Tutorial and Reference Guide: C++ Programming with the
Standard Template Library. Longman Publishing Group, 2001. ISBN 0-201-37923-6.
[76] Mller, S., Feitosa, R. Q., Mota, G. L. A., da Silva, V. V., da Costa, D. P., Tanisaki, K.:
GeoAIDA applied to SPOT satellite image interpretation.In 2nd GRSS/ISPRS Joint
Workshop on Data Fusion and Remote Sensing over urban areas, Berlin, Germany,
Proceedings 2003, 220-224.
[78] Nagin, P., Hanson, A., Riseman, E.: Studies in global and local histogram guided
relaxations algorithms. IEEE Trans. on Pattern Analysis and Machine Intelligence (PAMI),
Vol. 3:263277, 1982.
[79] Nevatia, R.: A color edge detector and its use in scene segmentation. IEEE Transactions
on Systems, Man, Cybernetics, Vol. 7(11):820826, 1977.
[80] Niemann, H., Sagerer, G., Schrder, S., Kummert, F.: ERNEST: A Semantic Network
System for Pattern Understanding,. IEEE Trans. on Pattern Analysis and Machine
Intelligence, Vol. 12(9):883905, 1990.
[81] Novak, C., Shafer, S.: Color edge detection. In Proc. Image Understanding Workshop,
p. 3537. 1987.
[82] Ohlander, R., Price, K., Reddy, D. R.: Picture segmentation using a recursive region
splitting method. Computer Graphics and Image Processing, vol. 8:313333, 1978.
[84] Pietikinen, M., Harwood, D.: Segmentation of color images using edge preserving
filters. In Cappellini, V., Marconi, R., Hg., Advances in Image Processing and Pattern
Recognition, p. 9499. North-Holland, 1986.
91
[85] Quint, F.: Kartengesttzte Interpretation monokularer Luftbilder. Dissertation,
Universitt Karlsruhe, Karlsruhe, 1997.
[86] Quint, F.: MOSES: A structural approach to aerial image understanding. In Gruen, A.,
Baltsavias, E., Henricsson, O. P., Hg., Automatic Extraction of Man-Made Objects from
Aerial and Space Images (II), p. 323332, Birkhuser, Basel, 1997.
[87] Rehrmann, V.: Stabile, echtzeitfhige Farbbildauswertung. Verlag Flbach, Koblenz, 1994.
[89] Rehrmann, V., Priese, L.: Fast and Robust Segmentation of Natural Color Scenes. In 3rd
Asian Conference on Computer Vision. Hong Kong, 1998.
[90] Reynolds, G., Beveridge, J.: Searching for geometric structure in images of natural scenes.
In Proc. DARPA Image Understanding Workshop, 257271. Morgan Kaufmann Publishers,
Inc., 1987.
[91] Riseman, E., Hanson, A.: A methodology for the development of knowledge-based vision
systems. In Proc. of the IEEE Workshop on Principles of Knowledge-Based Systems.
Denver, 1984.
[92] Riseman, E., Hanson, A., Belknap, R.: The information fusion problem: forming token
aggregations across multiple representations. Coins technical report, University of
Massachusetts at Amherst, 1987.
[93] Sagerer, G., Niemann, H.: Semantic Networks for Understanding Scenes. In Advances in
Computer Vision and Machine Intelligence. Plenum Press, New York/London, 1997.
[94] Schneider, W., Bartl, R., Burger, H., Steinwendner, J., Suppan, F. Aerial Photo
Interpretation and Satellite Image Analysis in Agricultural Sciences. Vermessung &
Geoinformation, Vol. 84(2):164173, 1996.
[95] Schreier, G.: SAR Geocoding: Data and Systems. Wichmann, Karlsruhe, 1993.
[97] Shahrabi, B. A.: Automatic Recognition and 3D Reconstruction of Buildings from Digital
Imagery. Dissertation, Fakultt fr Bauingenieur- und Vermessungswesen, Universitt
Stuttgart, Stuttgart, 2000.
[98] Skarbek, W., Koschan, A.: Color Image Segmentation - A Survey. Techn. Ber. 94-32,
Fachbereich Informatik, TU Berlin, 1994.
[99] Stevens, W.: Programmieren von UNIX-Netzwerken. Hanser Fachbuch, 2000. ISBN 3-446-
21334-1.
[100] Stilla, U., Michaelsen, E.: Semantic modelling of man-made objects by production nets. In
Gruen, A., Baltsavias, E., Henricsson, O. P., (eds.) Automatic Extraction of Man-Made
Objects from Aerial and Space Images (II), 4352. Birkhuser, Basel, 1997.
[102] Vosselmann, G., de Knecht, J.: Road Tracing by profile matching and Kalman filtering. In
Grn, A., Kbler, O., Agouris, P., Hg., Automatic Extraction of Man-Made Objects from
Aerial and Space images, 265274, Birkhuser, Basel, 1995.
92
[103] Weidner, U.: Digital Surface Models for Building Extraction. In Grn, A., (ed.) Automatic
Extraction of Man-Made Objects from Aerial and Space Images (II), 193202. Ascona,
1997.
[104] Weidner, U., Frstner, W.: Towards Automatic Building Extraction from High-Resolution
Digital Elevation Models. PandRS, Vol. 50(4):3849, 1995.
[106] Zucker, S. W.: Region growing: Childhood and adolescence. In Computer Graphics and
Image Processing, Vol. 5, 382399. 1976.
93