Vous êtes sur la page 1sur 10

Segmentao de Imagens Digitais: Uma Reviso

Marcus F. S. Saldanha1, Dr Corina da Costa Freitas1


1

Diviso de Processamento de Imagens Instituto Nacional de Pesquisas Espaciais (INPE) Av. dos Astronautas, 1758 12.227-010 So Jos dos Campos SP Brasil.
marcus@dpi.inpe.br, corina@dpi.inpe.br

Abstract. One of the main challenges in the processing of digital images is the rapid extraction of information from the images for analysis. A key issue in the extraction is to simplify the image, reducing the information to homogeneous regions, allowing a more appropriate representation. This task is the problem of segmentation. Due to the diversity of use and distinct types of data, there is no single solution for all applications of segmentation, which leads to various techniques and methods. Within this context, this study aims to present a brief review of theoretical foundations and the more usual approach adopted for the segmentation of images. Resumo. Um dos grandes desafios na rea de processamento de imagens digitais a extrao rpida de informaes a partir das imagens para a realizao de anlise. Uma questo fundamental na extrao a simplificao da imagem, reduzindo as informaes a regies homogneas, permitindo uma representao mais adequada. Essa tarefa consiste o problema da segmentao. Devido diversidade de uso e tipos distintos de dados, no existe uma soluo nica para todas as aplicaes da segmentao, o que d origem a diversas tcnicas e mtodos. Dentro deste contexto, este trabalho tem por objetivo apresentar uma breve reviso dos fundamentos tericos e das abordagens mais usuais adotadas para a segmentao de imagens.

1. Introduo
Atualmente, diversos campos da atividade humana tm recorrido a imagens para armazenar, exibir e fornecer informaes sobre o mundo que nos rodeia. O desafio que fica para pesquisadores e engenheiros extrair rapidamente informao valiosa a partir de dados brutos de imagens. Este o objetivo primrio do processamento de imagens, ou seja, converter dados de imagens brutas em informaes para fins prticos. De forma geral, funes de processamento que incluam reconhecimento e interpretao esto associadas com aplicaes de anlise de imagens nas quais o objetivo a extrao automtica ou mesmo parcialmente automtica de informao a partir de uma imagem (Gonzales e Woods, 1987). Uma questo central na extrao de informaes a partir de uma imagem digital a reduo das informaes dessa imagem em regies mais ou menos homogneas,

visando permitir uma anlise mais apropriada da imagem. Isto consiste o problema da segmentao, e tm dado origem ao desenvolvimento de vrias solues. Dentro deste enfoque, este trabalho tem como objetivos apresentar uma discusso a respeito de alguns fatores considerados relevantes para a conceituao e fundamentao da segmentao, bem como, realizar uma breve reviso dos algoritmos mais comumente utilizados na segmentao de imagens digitais.

2. Segmentao de Imagens: Conceito e Consideraes


A obteno de melhores resultados proveniente da anlise de informaes extradas de uma imagem esta intimamente ligada qualidade do tratamento feito sobre a fonte dos dados. Segundo Gonzalez e Woods (1987), as tcnicas de extrao de informao a partir de imagens pertencem rea do processamento referida como anlise de imagens, que para ser executada tem como passo inicial a realizao de uma segmentao. A definio para a segmentao de imagens esta diretamente relacionada rea na qual ser aplicada. Dentro da rea de viso computacional, a segmentao refere-se ao processo de decomposio de uma imagem digital em vrios segmentos (regies) que a formam (Jain, 1989). J para a rea de processamento digital de imagens de sensoriamento remoto a segmentao de imagem a parte da anlise de imagem que trata da definio de objetos geogrficos ou regies em uma imagem (Moik, 1980). Os objetos que compem uma imagem possuem duas caractersticas bsicas: (1) Eles exibem alguma uniformidade interna em relao a uma propriedade da imagem, e (2) eles contrastam em relao a sua vizinhana (Moik, 1980). Essas caractersticas so adotadas como referncia para a elaborao de diversos algoritmos de segmentao. J a abordagem para a segmentao de imagens que pode ser feita de baixo para cima (bottom-up) ou de cima para baixo (top-down). A primeira toma por base princpios de continuidade, agrupando pxeis da imagem de acordo com o grau de uniformidade dos nveis de cinza ou textura das regies, bem como, a suavidade e a continuidade dos limites dos contornos. Enquanto a segunda, utiliza conhecimentos a priori sobre um objeto, tais como, sua possvel forma ou textura para guiar a segmentao (Borenstein et al, 2004). A Figura 01 ilustra estas abordagens dando uma idia um pouco mais clara a respeito dos conceitos envolvidos.

(a) (b) (c) Figura 01 Abordagens adotadas para a segmentao de imagens digitais: (a) imagem de entrada; (b) abordagem bottom-up (trs colunas centrais); e, (c) abordagem top-down. Fonte: Adaptado de Borenstein et al, 2004.

A segmentao de imagens tem basicamente dois objetivos: (1) decompor a imagem em partes para posterior anlise; (2) realizar uma mudana de representao (Shapiro e Stockman, 2001). O resultado final esperado de um processo de segmentao um nmero finito de regies homogneas, que individualizam as diferentes regies contidas numa imagem (Figura 02). Sendo assim, a imagem seria formada por um conjunto de regies, conectadas pelas suas bordas e que no se sobrepe, de tal forma que cada pixel da imagem pertence unicamente a uma determinada regio (Acharya e Ray, 2005).

Figura 02 Resultado da segmentao de uma imagem do sensor ETM+/Landsat da regio de Miguelpolis (SP) composio 453. Fonte: Junior, 2007.

O conceito de segmentao da forma com que apresentado idealiza o mundo real de forma conveniente para diversas aplicaes. Entretanto, cabe lembrar que uma inveno da mente humana e que embora seja uma boa abordagem para materializar solues para trabalhos de anlise de imagens, pode em algumas situaes levar a resultados insatisfatrios (Davis, 2004). Pode-se dizer que a elaborao de algoritmos visando automatizao de processos de segmentao uma das tarefas mais difceis dentro da rea de processamento de imagens (Gonzale e Woods, 1987). Pois, a segmentao de imagem basicamente um problema de percepo psicofsica, no sendo susceptvel de uma soluo puramente analtica (Nikhil e Sankar, 1993). Dessa forma, para obter um resultado satisfatrio, qualquer algoritmo de segmentao, no importando modelo matemtico adotado, deve ser complementado por heursticas que envolvam tanto informao semntica como conhecimento a priori sobre as imagens que esto sendo processadas (Yong et al, 2004). O desenvolvimento dos algoritmos leva em considerao duas caractersticas bsicas dos pixels que envolvem dois conceitos: descontinuidade e similaridade. Por meio do uso desses conceitos, conforme estruturado por Gonzalez e Woods (1987), a segmentao feita usando-se deteco de bordas e deteco de similaridades. Por sua vez, os mtodos mais comuns empregados na segmentao podem ser divididos em trs grupos principais, de acordo com a forma como vem a imagem (Mezaris et al,

2003): Mtodos de segmentao no domnio espacial; Mtodos de segmentao no espao de medidas; e, Mtodos de segmentao no domnio da freqncia. Cabe lembrar, que a qualidade de segmentao de uma imagem influencia diretamente no resultado da fase de anlise e a escolha de uma tcnica de segmentao adequada implica no conhecimento dos detalhes das tcnicas existentes.

3. Mtodos Usados na Segmentao de Imagens 3.1. Deteco de Descontinuidades


As descontinuidades encontradas em uma imagem podem ser pontuais, linhas ou os limites (bordas) de um objeto. Essas feies sobressaem numa imagem, seja por possuir tons de cinza distintos a regio na quais esto inseridas ou por assinalarem mudanas bruscas de tons de cinza entre regies. Os algoritmos desenvolvidos para detectar essas descontinuidades usualmente usam a convoluo, implicando no uso de mscaras. Os mtodos de deteco de descontinuidades, mais particularmente os de deteco de linhas e de bordas, apresentam geralmente como resultados falhas de deteco. Portanto, esses mtodos devem ser seguidos de processamentos visando sanar essas falhas. As tcnicas de processamento que realizam esse tipo tratamento no sero abordadas aqui, maiores detalhes a respeito ver Gonzalez e Woods (1987) e Hough (1962). Deteco de pontos e linhas A idia que esta por trs dos algoritmos para a deteco de pontos e linhas que essas feies podem possuir tom de cinza muito diferente quando comparada aos seus vizinhos (Gonzales e Woods, 1987). Desta forma, a deteco pode ser realizada por meio da aplicao uma mscara que fornea uma resposta R e um adequado limiar no negativo T. Ao se aplicar a mscara sobre a imagem, os pontos que retornarem valores acima do limiar estabelecido so detectados, ou seja,

R >T .
Deteco de bordas

(3.1)

A deteco de bordas de longe, a abordagem mais comum para deteco de descontinuidades (Gonzales e Woods, 1987). Em uma imagem a borda definida como sendo o limite entre duas regies com diferentes propriedades. Devido ao processo de amostragem em uma imagem digital, a borda aparece com uma pequena suavizao em torno ao verdadeiro limite das regies. Essa transio pode ser representada por uma funo f(x). Dessa forma, a deteco de bordas pode ser realizada por meio da aplicao de operadores de diferenciao (Figura 03). A primeira derivada da funo f(x), apresenta um ponto de mnimo no ponto correspondente borda. A magnitude do valor dessa derivada, pode indicar a intensidade da borda. A segunda derivada da funo f(x), por sua vez, apresenta um cruzamento por zero no ponto correspondente a borda. O sinal dessa derivada pode ser usado para determinar se um pixel est localizado na parte clara ou escura da borda. Para o caso de uma imagem, espao bidimensional, a funo assume a forma f(x,y), sendo as duas direes representadas pelas derivadas parciais em funo de x (direo

vertical) e de y (direo horizontal). Nessa situao so usados operadores diferenciais de gradiente, que correspondem primeira derivada, e o laplaciano, correspondente a segunda derivada.
ponto mximo

f (x)

df (x) dx x
cruzamento por zero

df (x) dx 2

Figura 03 - Operadores de diferenciao aplicados sobre uma funo que modela a mudana brusca de nveis de cinza em um perfil (espao unidimensional) de uma imagem.

3.2. Deteco de Similaridades


A deteco de similaridade tem como fundamento a observao do interior dos objetos e no as fronteiras que os delimitam. Para tanto, parte da idealizao que os pixels que compe um objeto tm propriedades similares enquanto que pixels de objetos distintos tm propriedades distintas. A formulao bsica adotada para este tipo de abordagem dada por Fu e Mui (1981). Segundo o autor, se considerarmos R como sendo uma imagem, a segmentao a decomposio de R em n regies R1, R2, ..., Rn de tal forma que: a)

i =1

Ri = R

b) Ri conectada, i = 1, 2, ..., n c) Ri R j = , i j d) Pu (Ri ) = verdadeiro i e) Pu (Ri R j ) = falso i j Pode existir um nmero de possveis parties, mas a seleo de um conjunto adequado de regies depende da escolha da propriedade Pu associada regio, ou seja, do predicado de uniformidade dos pixels da regio (Pavlidas, 1977). Crescimento de regies O princpio do funcionamento da tcnica de crescimento por regies agrupar pixels ou sub-regies em regies maiores (Gonzales e Woods, 1987). Seu incio se d com a adoo de um conjunto de pixels sementes, a partir das quais realizado o crescimento das regies por meio da incluso, de pixels vizinhos que tenham atributos similares, tais como, intensidade, textura, cor, etc. O crescimento ocorre iterativamente at que cada pixel seja processado e sejam formadas diferentes regies cujas fronteiras

possam ser definidas por polgonos fechados e os pixels internos a essas compartilhem de certa similaridade. Por trs de seu funcionamento simples o crescimento de regies esconde algumas dificuldades relacionadas sua fundamentao. Uma dessas, diz respeito justamente ao incio do processo, que a escolha de sementes. Outra dificuldade est ligada natureza da aplicao e ao tipo de imagem disponvel, e diz respeito definio do critrio de similaridade a ser usado. Outro problema que apresenta o crescimento de regies o critrio de parada. Pirmides A idia que esta por trs da abordagem piramidal dividir a imagem em elementos de rea arbitrrios e disjuntos para ento, a partir desses, realizar a juno ou diviso das regies. A abordagem tradicional para essa tcnica subdividir a imagem em quadrantes usando convenientemente a estrutura de dados denominada quadtree (abreviatura da expresso em ingls quadratic picture tree). Nessa estrutura a imagem representada por um nodo pai (nvel n=0), enquanto que os quatro quadrantes so representados por quatro nodos filho (nvel n=1), e assim por diante em uma ordem pr-determinada. A Figura 04 ilustra uma imagem segmentada em 6 regies distintas, sua representao no grfico e respectiva matriz de adjacncia.
N1 N2

N4

N5 N3 N7

N6

N 1 N 2 N A= 3 N 4 N5 N 6 N 7

N1 1 1 0 1 1 0 0

N2 1 1 1 0 0 0 0

N3 0 1 1 1 0 0 1

N4 1 0 1 1 1 0 1

N5 1 0 0 1 1 1 0

N6 0 0 0 0 1 1 1

N7 0 0 1 1 0 1 1

(a)

(b)

(c)

Figura 04 - (a) Imagem com 6 regies distintas e respectivo (b) grfico de adjacncias, bem como, (c) a matriz de adjacncia oriunda do grfico.

Deteco de Bacias A deteco de bacias pode ser visto como uma combinao entre deteco de bordas e juno de regies (Erthal, 2008). Essa tcnica baseia-se no princpio de inundao de relevos topogrficos (Russ, 1998). Essa abordagem vem do princpio de que uma imagem em nveis de cinza pode ser vista como um relevo topogrfico, formado por vales, que representam as regies mais escuras da imagem, e por montanhas, que representam as pores mais claras (Roerdink e Meijster, 2000). possvel visualizar a inundao de duas maneiras distintas: a gua vinda de cima, como se fosse chuva; ou vinda de baixo, como se o relevo estivesse perfurado nos pontos de altitude mnima e fosse imerso em um lago (Roerdink e Meijster, 2000, e Wangenheim, 2009). Conforme as bacias vo sendo inundadas, guas provenientes de diferentes bacias se denominadas watersheds. Quando a gua atinge o maior pico no relevo, o processo termina (Meyer, 1994). O resultado da inundao a separao das regies que compe a imagem delimitada pelas linhas divisrias das bacias.

3.3. Segmentao no Espao de Atributos Limiarizao A limiarizao a forma mais simples de segmentar imagem digitais (Erthal, 2008), alm disso, uma das abordagens mais importantes para a segmentao (Gonzales e Woods, 1987). A idia que est por trs dessas tcnicas a que um objeto pode ser entendido como uma regio formada por pixels contguos que tenham em comum uma faixa de intensidades. Dessa forma, a limiarizao usa a intensidade dos pixels para distinguir as regies. O processo todo se baseia na anlise do histograma de freqncias da imagem, onde as faixas de intensidade correspondem s bandas do histograma. Um caso simples de ser entendido o de um histograma bimodal. Nessa situao o histograma apresenta dois picos separados por um vale entre eles. Esses picos podem representar duas regies distintas, como por exemplo, um fundo e um objeto. Seguindo o mesmo raciocnio, se o histograma de uma imagem for tri-modal poderamos ento obter a representao de trs regies distintas, como dois objetos e um fundo. Agrupamento (Clustering) Uma das idias principais das tcnicas de segmentao encontrar e individualizar as regies na imagem que tenham feies similares. Intuitivamente, padres pertencentes a um dado grupo devem ser mais similares entre si do que em relao a padres pertencentes a outros grupos (Zuben e Moscato, 2002). Tcnicas de agrupamento (do termo original em ingls clustering), encontradas na literatura de reconhecimento de padres possuem objetivos similares e, podem, segundo Jain (1989), ser aplicadas para a segmentao de imagens. Neste tipo de segmentao um conjunto de dados substitudo por grupos ou clusters. A definio de clusters, segundo Everitt et al. (2001), parte da idia que valores de atributos (x) so vistos como pontos no espao l-dim, assim, clusters so regies contnuas deste espao e que contm uma alta densidade de pontos, separadas de outras regies densas, por regies com baixa densidade de pontos. A partir desse ponto duas abordagens para fundamentao dos algoritmos podem ser encontradas. A primeira leva em considerao o conceito de agrupamento rgido (dos termos em ingls, hard, crisp) no qual cada ponto pertence a um nico grupo. A segunda considera o conceito de agrupamento nebuloso (do termo em ingls fuzzy) onde cada ponto pertence a todos os grupos at certo grau. A abordagem mais adequada para fins de aplicao na segmentao de imagens entretanto, a primeira, pois no fere os princpios de segmentao por regies estipulados por Fu e Mui (1981).A seguir abordado o algoritmo de agrupamento mais conhecido e comumente usado para a segmentao de imagens, o k-mdias. - Algoritmo k-mdias O k-mdias um algoritmo no supervisionado usado em reconhecimento de padres e segmentao de imagens, que gera clusters de n objetos baseados em atributos a partir de k parties, sendo k < n. O algoritmo presume que os atributos dos objetos formam um espao vetorial, e tem por fundamento principal minimizar a varincia intraagrupamento total, ou seja, a funo dada por

V = (x j i ) ,
k 2 i =1 x j Si

(3.20)
i

onde existem k clusters Si, i = 1, 2, ..., k, e pontos xj Si.

o centride ou ponto mdio de todos os

O algoritmo inicia pela partio dos pontos de entrada em k conjuntos iniciais, de forma randmica ou usando alguma heurstica. Calcula ento o ponto mdio, ou centride, de cada agrupamento. Constri uma nova partio pela associao de cada ponto ao centride mais prximo. Os centrides so re-calculados para os novos agrupamentos, e o algoritmo repetido pela aplicao alternada desses dois passos at convergncia, que obtida quando os pontos no mudarem mais de agrupamentos ou alternativamente se os centrides no mudarem de posio. Tambm pode ser adotado como critrio de parada para o algoritmo um nmero mximo de iteraes. Para fins de classificao o valor de k representa o nmero de classes definidas a priori pelo usurio. A principal desvantagem do k-mdias que em termos de desempenho o algoritmo no garante o resultado global timo. Pois, a qualidade da soluo final depende muito do dos conjuntos inicias de clusters, podendo na prtica, vir a se afastar muito do timo global. A Figura 05 ilustra a situao, na qual a escolha dos agrupamentos iniciais pode resultar em uma separao inadequada das classes envolvidas.

Figura 05 - Posicionamento inicial inadequado dos centrides no algoritmo k-mdias resultando em agrupamentos equivocados. Fonte: Wu et al., 2007.

Outro inconveniente do algoritmo que como o nmero de agrupamentos um parmetro de entrada uma escolha inapropriada de k pode retornar em resultados pobres. O algoritmo tambm assume que a varincia uma medida adequada do espalhamento do cluster o que para algumas situaes pode no refletir a verdade.

4. Concluses
A segmentao de fundamental importncia para a fase de anlise, pois por meio dela possvel se extrair informaes valiosas a partir das imagens digitais. Conforme foi citado no inicio deste trabalho e como pode ser notado durante o seu desenvolvimento, a escolha de uma tcnica de segmentao adequada est intimamente ligada natureza dos dados e ao tipo de aplicao. Portanto, o conhecimento dos detalhes relacionados a cada tcnica de segmentao de extrema importncia para uma boa utilizao dessas em aplicaes humanas.

Cabe lembrar, entretanto que as tcnicas vistas aqui e a maneira com foram apresentadas devem servir somente de referncia para estudos inicias a respeito do tema. Sendo necessrio, para um maior aprofundamento, consultas as fontes bibliogrficas apresentadas, bem como, consultas a peridicos especializados na rea de processamento digital de imagens, viso computacional e reconhecimento de padres. Referncias Bibliogrficas Acharya, T.; Ray, A. K. Image processing, principles and applications. New Jersey: John Wiley and Sons, Inc. 2005. Davis, E. R. Machine vision. 3. ed. Royal Holloway, University of London. Morgan Kaufmann Publishers. 2004. Erthal, G. J. Notas de aula da disciplina reconhecimento de padres. INPE, 2008. Fu, K. S.; Mui, J. K. A survey on image segmentation, Pattern Recognition 13. 1981. Gonzales, R. C.; Woods, R. E. Digital image processing. New York: Addison-Wesley Publishing Company, Inc, 1987. Hough, P. V. C.. Methodos and Means for Recognizing Complex Patterns. U.S. Patent. 1962. Jain, A. K. Fundamentals of digital image processing. New Jersey: Prentice-Hall, Inc. 1989. Junior, M. A. S. Segmentao Multi-Nveis e Multi-Modelos para Imagens de Radar e pticas. Tese de Doutorado do Curso de Ps-Graduao em Sensoriamento Remoto. INPE, So Jos dos Campos, 2007. Mezaris, V.; Kompatsiaris, I.; Strintzis, M. G. Still image objective segmentation evaluating using ground truth. 2003. Moik, J. G. Digital processing of remotely sensed images. Washington DC: Government Printing Office. 1980. Nikhil, R. P.; Sankar, K. P. A review on image segmentation techniques. Pattern Recognition, 26 (9). 1993. Pavlidas, T. Structural Patter Recognition. New York: Springer Verlag. 1977. Roerdink, J. B. and Meijster, A.. The watershed transform: Definitions, algorithms and parallelizations strategies. Fundamenta Informaticae, 41:187228. 2000. Russ, J. C.. The Image Processing Handbook. CRC Press, Boca Raton. 1998. Shapiro, L. G.; Stockman, G. C. Computer vision. New Jersey: Prentice-Hall, 2001. Wangenheim, A.; Mantelli, S. Tcnicas de segmentao simples de imagens. Seminrio Introduo Viso Computacional. Florianpolis: Universidade Federal de Santa Catarina. Obtido a partir de http://www.inf.ufsc.br/~visao/threshold.html, consultado em 02 de abril de 2009. Yong, X.; Feng, D.; Rongchun, Z.; Optimal selection of image segmentation algorithms based on performance prediction. Sydney: Australian Computer Society, Inc. 2004.

Meyer, F. Topographic distance and watershed lines. Signal Processing, 38:113125. 1994. Zuben, F. J. V.; Moscato, P. A. Tpicos em Engenharia de Computao V. DCA/FEEC/Unicamp. Obtido a partir de ftp://ftp.dca.fee.unicamp.br/pub/docs/ vonzuben/ia368_02/, consultado em 04 de maio de 2009. Wu X.; Kumar, V.; Quinlan, J. R.; Ghosh, J.; Yang, Q.; Motoda, H.; McLachlan, G. J.; Ng, A.; Liu; B.; Yu, P. S.; Zhou, Z.-H.; Steinbach, M.; Hand, D. J.; Steinberg, D. Top 10 algorithms in data mining. Springer-Verlag London Limited. 2007. Borenstein E.; Sharon E.; Ullman S. Combining Top-down and Bottom-up Segmentation. IEEE, Conference on Computer Vision and Pattern Recognition Workshop, vol 4, 2004.

Vous aimerez peut-être aussi