Técnicas de Reconhecimento Automatizado de Imagens Digitais

Fátima Aparecida Tagliaferro
0402007
TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE
PADRÕES BASEADOS EM IMAGENS DIGITAIS.
Jaguariúna
2007
Fátima Aparecida Tagliaferro
0402007
TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE
PADRÕES BASEADOS EM IMAGENS DIGITAIS.
Monografia apresentada a disciplina Trabalho

de Graduação III do Curso de Ciência da
Computação da Faculdade de Jaguariúna, sob
a orientação do Prof. Ms. Peter Jandl Junior,
como exigência para a conclusão do curso de
graduação.
Jaguariúna
2007
TAGLIAFERRO, Fátima Aparecida Tagliaferro. Técnicas de reconhecimento
automatizado de padrões baseados em imagens digitais. Monografia defendida e
aprovada na Faculdade de Jaguariúna em 13 de dezembro de 2007 pela banca
examinadora constituída pelos professores:
___________________________________
Prof. Ms. Peter Jandl Junior –
FAJ – Orientador
__________________________________
Prof. Ms. Christiane Novo Barbato –
FAJ
____________________________________
Prof. Ms. Ricardo Menezes Salgado –
FAJ
Dedico este trabalho a Deus e a minha família.
AGRADECIMENTOS
Em primeiro lugar agradeço a Deus por tudo porque sem ele, com certeza, eu não
estaria aqui e pela minha família que sempre esteve presente.
Agradeço também aos meus professores, pela dedicação e empenho, e em especial
ao meu orientador Prof. Ms. Peter Jandl Junior, que me ensinou a buscar soluções para o
meu projeto.
Aos funcionários da FAJ que sempre realizaram um excelente trabalho, em principal às
funcionárias da biblioteca e do Núcleo de Estágios.
Pela compreensão, ajuda e amizade: a turminha do Núcleo de Informática do Hospital
das Clínicas da Unicamp; ao Prof. Ricardo Menezes Salgado da Faculdade de Jaguariúna; e
ao Prof. Konradin Metze, coordenador do Grupo de Patologia Analítica Celular da Unicamp.
Como não poderia deixar de ser, agradeço também aos meus colegas de classe, aos
que partiram para novos horizontes e aos que hoje estão aqui partilhando da mesma vitória:
Elis C. M. Garavelli, José Antonio Garavelli e Luciani Vilas Boas.
Para evoluirmos e colhermos bons frutos é preciso descobrir uma fórmula balanceada
que permita desorganizar organizando. Ousando desorganizar nossos pensamentos, nós
nos tornamos capazes de formular novos pensamentos e assim, evoluímos e adquirimos
sabedoria, uma sabedoria afogada em informações e aflorada de dúvidas, uma sabedoria
que gera medo, mas que, com um pouco de imaginação, transforma-se em bons frutos.
No entanto, para que seja dado o primeiro passo rumo ao desconhecido, é necessário
um grande sonho, um sonho grande o suficiente que nos leve a superar os desafios
impostos no caminho, e amigos.
Não sei se consegui adquirir sabedoria, mas com toda certeza descobri muitas coisas
novas, das quais espero colher bons frutos no futuro.
Imagination is more important than knowledge.
Albert Einsten
TAGLIAFERRO, Fátima Aparecida. Técnicas de reconhecimento automatizado de
padrões baseados em imagens digitais. 2007. Monografia (Bacharelado em Ciência da
Computação) – Curso de Ciência da Computação da Faculdade de Jaguariúna, Jaguariúna.
RESUMO
O reconhecimento de padrões possui aplicações em muitos domínios, permitindo a

identificação de dados de maneira mais eficaz do que por meio da visão humana, porque
consegue eliminar ou reduzir os erros ocasionados pelo cansaço ou fadiga, por exemplo. A
área é dividida em: visão computacional; processamento de dados; computação gráfica; e
processamento de imagens. Isto também envolve: forma de aquisição da imagem,
identificação de estruturas, quantificação, visualização e interpretação. Este trabalho
pretendeu estudar as técnicas de reconhecimento de imagens digitais e realizar a
implementação de algoritmos aplicados ao problema de identificação e contagem de
células sangüíneas. O método escolhido consiste de pesquisa bibliográfica; estudo das
técnicas de reconhecimento; codificação e testes de algoritmos escolhidos; e análise dos
resultados obtidos. A classificação prévia das imagens determina os algoritmos adequados
para o reconhecimento. Softwares como o Scion Image foram usados para o
reconhecimento e contagem de células sanguíneas específicas em imagens digitais tipo
bitmap. A imagem dada é pré-processada para remoção de seu fundo e passa por
transformações adicionais para adequá-la ao reconhecimento. As células desejadas são
parametrizadas por meio de seus tamanhos mínimo e máximo, possibilitando obtenção de
sua contagem.
Palavras-chave: RECONHECIMENTO DE PADRÕES; IMAGENS DIGITAIS; VISÃO

COMPUTACIONAL.
TAGLIAFERRO, Fátima Aparecida. Técnicas de reconhecimento automatizado de
padrões baseados em imagens digitais. 2007. Monografia (Bacharelado em Ciência da
Computação) – Curso de Ciência da Computação da Faculdade de Jaguariúna, Jaguariúna.
ABSTRACT
The recognition of patterns has applications in many domains, allowing a data identification
in a more efficient way than by human vision, because it can eliminate or reduce the
mistakes caused by tiredness or fadigue for example. The area is divided in: computer
vision; data processing; computer graphics; and image processing. This also involves: way
of acquisition of the image; identification of structures; quantification; visualization and
comprehension. This work intended to study the techniques of recognition of digital images
and hold the implementation of the algorithms applied to the problem of identification and
counting of blood cells. The chosen method consists of a bibliographic research, study
of techniques of recognition, coding and testing of the chosen algorithms and analysis of
results. The previous classification of images determines the adequate algorithms to the
recognition. Softwares as the Scion Image were used to the recognition and counting of
specific blood cells in digital images as bitmap. The given image is pre-processed for
removal of its fund and undergoes additional changes to accommodate it to the recognition.
The desired cells are analyzed through their minimum and maximum sizes making their
counting possible.
Keywords: PATTERN RECOGNITION; DIGITAL IMAGE; COMPUTER VISION.

SUMÁRIO
LISTA DE FIGURAS......................................................................................................... 10
LISTA DE TABELAS......................................................................................................... 11
1 INTRODUÇÃO ............................................................................................................... 12
1.1 Metodologia................................................................................................................ 13
2 CONCEITO DE IMAGEM............................................................................................... 14
2.1 Visão Computacional................................................................................................ 15
2.2 Questões do processamento visual........................................................................ 17
2.3 Imagem Digital........................................................................................................... 19
3 ALGORITMOS................................................................................................................ 22
4 RECONHECIMENTO E INTERPRETAÇÃO.................................................................. 24
4.1 Métodos de decisão................................................................................................... 26
4.2 Classificador de distância mínima / distância Euclidiana..................................... 27
4.3 Classificador Bayesiano........................................................................................... 27
4.4 Filtros.......................................................................................................................... 28
4.5 Segmentação da imagem.......................................................................................... 29
5 TECNOLOGIA DE SOFTWARE.................................................................................... 30
5.1 Matlab.......................................................................................................................... 30
5.2 Scion Image................................................................................................................ 32
6 TESTES.......................................................................................................................... 33
6.1 Matlab.......................................................................................................................... 34
6.1.1 Pseudo-código........................................................................................................ 36
6.2 Scion Image................................................................................................................ 37
6.2.1 Pseudo-código........................................................................................................ 39
7 RESULTADOS............................................................................................................... 40
8 REFERÊNCIAS BIBLIOGRÁFICAS.............................................................................. 41
9 ASSINATURAS.............................................................................................................. 44
LISTA DE FIGURAS
Figura 1 - Rel. dos trabalhos pub. em congressos pelo Grupo Vision - USP.............. 12
Figura 2 - Velha Moça.................................................................................................. 13
Figura 3 - Macro-áreas da imagem digital.................................................................... 14
Figura 4 - Processo e elementos da visão computacional........................................... 15
Figura 5 - Fatos explícitos em imagens....................................................................... 17
Figura 6 - Diagrama de agulhas................................................................................... 17
Figura 7 - Generalização de volumes.......................................................................... 17
Representação numérica de uma imagem ampliada de 10 x 10 com 256
Figura 8 - 19
tons de cinza................................................................................................
Figura 9 - Vetor de componentes de imagens coloridas (RGB)................................... 19
Figura 10 - Relação entre comprimento e velocidade de onda...................................... 20
Figura 11 - Espectros de luz.......................................................................................... 20
Figura 12 - Espectro eletromagnético............................................................................ 20
Figura 13 - Nível alto de dificuldade no reconhecimento de imagem............................ 25
Figura 14 - Representação por cadeias......................................................................... 25
Figura 15 - Fronteira das classes usando o classificador bayesiano............................. 28
Figura 16 - Macro Threshold do Software Scion Image................................................. 29
Figura 17 - Tela de abertura do programa Matlab......................................................... 30
Figura 18 - Uso de matrizes no Matlab.......................................................................... 31
Figura 19 - Janela do Software SDC Morphology Toolbox for Matlab........................... 31
Figura 20 - Tela de abertura do programa Scion Image................................................ 32
Figura 21 - Elementos figurados do sangue.................................................................. 33
Figura 22 - Macro utilizada no Matlab............................................................................ 36
Figura 23 - Macro utilizada no Scion Image................................................................... 38
LISTA DE TABELAS
Tabela 1 - Funções da visão humana e da máquina.................................................... 16

Tabela 2 - Classificação das tarefas para sistemas de visão de computadores.......... 18
Tabela 3 - Seqüência de testes realizados no software Matlab................................... 35
Tabela 4 - Seqüência de testes realizados no software Scion Image.......................... 38
12
1 INTRODUÇÃO
Se há décadas atrás, não seria possível imaginar a robótica, o reconhecimento da fala

e a computação paralela, hoje é aceitável a idéia de que um computador possa fazer no
futuro próximo o reconhecimento de pessoas mantendo com elas um diálogo agradável.
Quando o tema deste trabalho foi escolhido, esperava-se encontrar um mundo ainda
inexplorado, no entanto, surpreendentemente, foi verificado que as técnicas de visão e
processamento digital encontram aplicações nos mais diversos domínios, como por
exemplo: medicina, automação industrial, cartografia, geologia, sensoriamento remoto etc.
Estas áreas são marcadas por envolverem métodos, conceitos e algoritmos de várias
disciplinas, como, matemática, física, engenharia elétrica e computação, sendo objeto de
estudos de diversas universidades de renome há muitos anos.
Em matéria sobre saúde animal do Jornal da USP, Miguel Glugoski reporta Arthur
Gruber, professor do Departamento de Parasitologia do Instituto de Ciências Biomédicas e
pesquisador da USP:
“... a utilização de algoritmos computacionais para a análise e

reconhecimento de formas tem sido freqüente em várias aplicações, como a
identificação de impressões digitais e faces humanas. Contudo, a aplicação
totalmente integrada e automatizada dessa tecnologia para o diagnóstico
remoto de agentes patogênicos é inédita no mundo e representa novo
paradigma na área de diagnóstico de parasitas. Em razão desse ineditismo,
um artigo científico do grupo da USP, descrevendo o sistema Coccimorph,
acaba de ser publicado no mais importante periódico cientifico da área de
reconhecimento de padrões, a revista Pattern Recognition, nos Estados
Unidos”(Gruber apud Glugoski, 2007).
Pode-se ter uma noção do crescimento da área, ao passar dos anos, através da
Figura 1, que mostra um gráfico com a relação dos trabalhos publicados, pelo grupo de
pesquisa de visão computacional da USP, em anais de congressos, ele foi obtido através de
um script desenvolvido na linguagem perl, fazendo a extração e compilação das publicações
de uma lista de códigos Lattes, do site do CNPq.
Figura 1 – Rel. das publicações em congressos (Mena-Chalco; César Jr, 2007).

13
O processo de classificação de imagens visual, feito pelo homem, é muito eficaz,

porém sujeito à falhas ocasionadas pelo cansaço, fadiga etc. Um diagnóstico utilizando
visão computacional não elimina ou substitui o profissional porém, ajuda a diminuir
estatísticas de erros em processos críticos.
“Um diagnóstico mais preciso evitaria estatísticas como essa, revelada em

trabalho da pesquisadora Maryellen Lissak Giger, publicado em 2000 na
revista Computing in Science and Engineering: 10% a 30% das mulheres
que fazem a mamografia e recebem resultado negativo têm, na verdade,
câncer de mama” (Angelo apud Moraes, 2007).
Outro fator importante, no processo, é que nem sempre profissionais com a mesma
competência possuem a mesma opinião sobre a mesma imagem. Na Figura 2, é possível
observar uma famosa imagem da qual o Prof. Metze comenta:
“À primeira vista, trata-se do perfil de uma jovem delicada, com cabelos

longos e uma gargantilha que lhe orna o pescoço. Focando o olhar nos
cabelos, porém, vemos as rugas de uma velha senhora de nariz enorme e
desdentada. “É uma brincadeira para demonstrar que a mesma imagem,
vista por dois observadores, pode gerar opiniões diferentes. Por isso,
experts nem sempre têm a mesma opinião sobre determinada imagem
microscópica”, justifica o anatomopatologista” (Metze apud Sugimoto,
2007).
Figura 2 - Velha Moça (CCS, 2007).
1.1 Metodologia
O objetivo deste trabalho foi fazer um estudo das técnicas usadas no reconhecimento
de imagens, além de um estudo de algoritmos de reconhecimento de imagens e a
implementação na contagem e identificação de células sangüíneas. Como em geral, as
soluções do campo de processamento de imagens requerem um extenso trabalho
experimental envolvendo simulações e teste, para a implementação dos algoritmos foram
utilizados os softwares Scion Image e Matlab.
No trabalho foram realizadas pesquisas bibliográficas, através de livros, revistas e
sites especializados, além de discussões com profissionais da área.
14
2 CONCEITO DE IMAGEM
Durante a vida, tudo o que é sentido, ouvido e visto é relacionado a padrões já pré-
estabelecidos, os recursos ópticos são os responsáveis por fazer o registro e a ampliação
destas sensações. O primeiro grande passo da humanidade para a evolução do registro
visual foi à descoberta da fotografia e, graças aos computadores, é possível transformar os
dados contidos nas imagens em informações quantificadas, expressando assim cor, brilho,
estrutura etc.
Os olhos humanos funcionam como se fossem câmeras fotográficas perfeitas, sendo
que em cada olho têm-se em torno de 125 milhões de receptores visuais, no entanto, as
ilusões de ótica demonstram que a visão compete por atenção do cérebro. (Pinker, 2007;
Menezes, 2007). O mecanismo de funcionamento dos olhos é composto de uma abertura
para passagem de luz, de uma lente e um anteparo, onde a imagem é recebida e registrada,
e é utilizado para a formação dos conceitos das macro-áreas da imagem digital.
As macro-áreas que trabalham com o conceito de imagem digital podem ser
representadas de acordo com a Figura 3. Dentro do processo de visão computacional, um
marco da computação gráfica com o conceito de visão computacional é o filme Matrix1,
originado da coleção de contos Animatrix, o filme faz uma fusão entre a computação gráfica
e o tradicional anime japonês. Para Albuquerque (2007), as áreas de processamento de
imagens e de computação gráfica apesar de serem vistas como totalmente opostas, tem
técnicas complementares, senão iguais.
PROCESSAMENTO DE DADOS
SÍMBOLOS
VISÃO COMPUTAÇÃO
COMPUTACIONAL GRÁFICA
IMAGENS
PROCESSAMENTO DE IMAGENS
Figura 3 – Macro-áreas da Imagem Digital (César Jr., 2007).
1
The Matrix; E.U.A.;1999; Mistura de ação e ficção científica. Direção: Larry e Andy Wachowshi.
15
2.1 Visão computacional
O conceito de imagem envolve todo o processo de visão computacional (Figura 4),

assim, compreender os aspectos de aquisição, processamento e análise desta, é de
extrema importância para o desenvolvimento de sistemas que envolvam o processamento e
análise de imagens. De uma forma simplificada um processo de visão computacional
consiste na extração de características e no reconhecimento e classificação destas (Jähne,
2000).
Os princípios físicos que envolvem a formação da imagem são:
• Formação: corresponde a aquisição, que pode ser através de um tomógrafo, por
exemplo;
• Identificação de estruturas: pré-processamento, segmentação, reconhecimento
das imagens;
• Quantificação e visualização: cálculos, computação gráfica, parametrizações;
• Interpretação: classificação, inteligência artificial, redes neurais, integração de
informações.
Figura 4 – Processo e elementos da visão computacional (Gonzaga, 2007).
A visão computacional pode ser entendida, desta forma, como uma multidão de
técnicas usadas para adquirir, processar, analisar e entender dados extremamente
complexos. Seguindo a regra de que é mais simples comparar sistemas sobre o ponto de
vista biológico, podem ser destacados alguns pontos comuns entre os sistemas de visão
biológico e o computacional, além de compará-los através de sua função (Tabela 1)(Jähne,
2000):
• Campo de radiação: usando a radiação é possível observar uma cena ou objeto;
16
• Câmera: realiza a coleta da radiação recebida do objeto fixando tudo em um só

ponto (como as lentes ópticas). Pode ser: um tomógrafo ou um espectrômetro;
• Sensor: faz a conversão do sinal de radiação recebido para um conjunto de dados
que possam ser processados;
• Unidade de Processamento: extrai um conjunto de características de um grande
volume de dados, mensurando e categorizando. Um componente importante é a
memória, pois ela permite coletar e armazenar conhecimento de uma cena e
apagar dados sem valor. Para Albuquerque (2007), o processamento de uma
imagem consiste em transformá-la de forma a facilitar a extração de
características,
• Atores: reagem ao resultado da observação de forma ativa, tornando-se parte
essencial da visão do sistema.
VISÃO HUMANA X VISÃO DE MÁQUINA

Tarefa Visão Humana Visão de Máquina
Passiva e ativa (controle da
Passiva, principalmente
iluminação) usando partículas
Visualização. pela reflexão da luz do
eletromagnéticas e radiação
sobre superfícies opacas.
acústica.
Formação da imagem. Sistema de refração óptica. Vários sistemas.
Sistemas motorizados que
Músculos controlam a simulam o movimento da pupila,
Controle da radiação.
pupila. com filtros em forma de círculos ou
túneis.
Sistema de foco automático
Músculos controlam a
Foco. baseado em vários princípios de
mudança de foco.
medidas de distância.
Sensibilidade linear, quantificada
Resolução da radiação. Sensibilidade logarítmica. em 8 e 16 bits e sensibilidade
logarítmica.
Scanners e robôs montados com
Movimento. Altamente móvel.
câmeras.
Processamento paralelo Processamento serial ainda
Processamento e
organizado dominante; processamento
análise.
hierarquicamente. paralelo, não usado geralmente.
Tabela 1 - Funções da visão humana e da máquina (Jähne, 2000).

17
2.2 Questões do processamento visual
Dentre os problemas particulares do processamento visual, os melhores

compreendidos são (Winston, 1988):
• Estéreo binocular: encontrar a distância do observador em relação à superfície,
usando dois pontos de observação ligeiramente diferentes;
• Sombreamento: determinar a direção da superfície a cada ponto, em uma
imagem, tirando proveito das partes sombreadas.
Para identificar, descrever e localizar objetos, são necessárias representações
intermediárias que explicitem várias espécies de conhecimento revelando vários tipos de
restrições e fatos, entre elas (Winston, 1988):
Valores de brilhância são explícitos em imagens;
Mudanças de brilhância, grupos com mudanças similares, bolhas e texturas são
fatos explícitos no espaço principal (Figura 5);
Figura 5 – Fatos explícitos em imagens (Winston, 1988).

Dados da superfície ficam explícitos no modelo de mundo 2 ½ D (usando
diagramas de agulhas Figura 6);
Figura 6 - Diagrama de agulhas (Winston, 1988).

Os volumes ficam explícitos no processo, assim como a distância do observador do
mundo, no modelo de mundo. Através do uso do conceito de cilindros
generalizados, um conceito simples assim como grandes idéias, consegue-se
distinguir formas variadas fazendo com que a forma bidimensional mova-se
através de uma linha chamada de eixo. A linha não precisa necessariamente ser
uma reta e a forma do objeto varia com a movimentação (Figura 7).
Figura 7 - Generalização de volumes (Winston, 1988).

Desenvolver sistemas de automação, recursos gráficos, reconhecimentos de padrões
e algoritmos para o tratamento da informação visual e fazer estudos de novos métodos são
as principais atividades de pesquisa em visão de computadores, concentrando-se em:
18
• Arquiteturas e subsistemas dedicados em tempo real;

• Determinação de movimento em uma seqüência de imagens;
• Fusão de imagens de satélites;
• Hipermídia e telesupervisão com o uso redes de computadores;
• Inspeção visual automática, usada para controle de qualidade;
• Utilização de processadores digitais de sinais.
A visão de computadores pode ser categorizada em partes distintas, de acordo com o
problema que busca solucionar (Tabela 2):
REFERÊNCIA TAREFA
Posição e distância;
Tamanho e área;
Geometria 2D e 3D. Profundidade e metrologia 3D;
Formatos 2D;
Formatos 3D.
Reflexão;
Cor;
Radiometria. Temperatura;
Fluorescência;
Espectro.
Movimento 2D;
Movimento.
Movimento 3D.
Contornos e linhas;
Ondas e escalas;
Estrutura espacial e textura.
Orientação local;
Texturas.
Segmentação;
Identificação de objetos;
Tarefas de alto nível.
Classificação de objetos;
Modelo e base de conhecimento.
Reconhecimento de objetos 3D;

Modelagem 3D. Síntese de objetos 3D;
Caminhos.
Tabela 2 - Classificação das tarefas para sistemas de visão de computadores (Jähne, 2000).
19
2.3 Imagem Digital
Uma imagem digital pode ser definida, geralmente, como uma função f(x,y), onde o
valor nas coordenadas x e y correspondem ao brilho (radiância) da imagem nos pontos da
coordenada (Gonzales and Woods, 1992 apud Silva, 2005). A imagem digital corresponde à
representação numérica do objeto, é uma função quantificada e amostrada, sendo a sua
menor unidade denominada de pixel (picture element). Na Figura 8, é possível visualizar a
representação de uma imagem com 256 tons de cinza.
Figura 8 – Repres. de uma imagem ampliada de 10x10 com 256 tons de cinza (Silva, 2005).
As imagens digitais coloridas são, em geral, funções quantificadas e apresentadas

como um vetor de três componentes de acordo com o modelo escolhido (Gattass, 2002),
onde cada componente varia de 0 a 255 de acordo com a cor (Figura 9): Segundo
Hashimoto (2003), os modelos são:
• Modelo RGB (Red, Blue e Green): formado pelas cores primárias;
• Modelo CMY (Cyan, Magenta e Yellow): modelo RGB com cores
secundárias;
• Modelo HSI (Hue, Saturation e Intensity): formado por uma cor dominante
(matiz), saturação (diluição da matiz na luz branca) e intensidade (quantidade
de luz refletida).
Figura 9 – Vetor de componentes de imagens coloridas (RGB).

20
As cores são sensações da luz que incide nos olhos. Analisando a luz como uma
onda, pode-se relacionar o seu comprimento λ , com a sua freqüência f e a sua velocidade
v , através de v = λf , de acordo com a Figura 10 (Gattass, 2002).
Figura 10 - Relação entre comprimento e velocidade de onda (Gattass, 2002).
De acordo com o comprimento da onda (Figura 11) e o seu espectro é possível obter
uma sensação de cor diferente.
Figura 11 - Espectros de luz (1 nm = 10-9 m) (Gattass, 2002).
Na Figura 12, é possível observar as mudanças de coloração de acordo com o

espectro eletromagnético.
Figura 12 - Espectro eletromagnético (Gattass, 2002).

21
A imagem a qual se quer representar em uma função, pode seguir diferentes formas
(INCOR-HC, 2007) e segundo a maioria dos estudos (Müller, Dalmolin e Araki, 1999), é
feita, principalmente, através do reconhecimento de padrões em imagens em tom de cinza e
falsa-cor. Dentre as formas de representação tem-se:
• Função contínua:
f(x,y)
f:Rn =>Rp
• Função discreta:
f(i,j)
f:Z+n => Z+p
• Pixel (picture element):
f(i,j)
• Voxel (volume element):
f(i,j,k)
• Spel (space element):
f(i,j,...n)
• Representação matricial:
F[i][j]
22
3 ALGORITMOS
A evolução dos algoritmos para visão de computadores foi por muito tempo
negligenciada e os resultados, por esse motivo, apresentavam muitos erros. O que causou
esta situação foi por um lado, certamente, a dificuldade de tratar os problemas e por outro, o
fato da comunidade ignorar tal problema. Os três maiores critérios para análise da
performance destes algoritmos são segundo (Jähne, 2000):
• Sucesso na solução do problema;

• Precisão;
• Rapidez.
O estudo dos algoritmos pode ser dividido, de acordo com estes critérios (Jähne,
2000), em:
• Estudo analítico: este é, matematicamente, o caminho mais rigoroso usado

para verificação dos algoritmos, checar erros de propagação e prever falhas
graves;
• Teste de performance com imagens geradas por computador: estes
testes são usados para controlar cuidadosamente as condições;
• Teste de performance com imagens do mundo real: este é o teste final de
uma aplicação.
Os algoritmos de reconhecimento são utilizados de forma conjunta, para melhores

resultados podendo agir de forma totalmente automatizada ou semi-automatizada, em geral,
os de uso comercial são patenteados. Como exemplo, têm-se a seguir algoritmos de
segmentação, que utilizam imagens de referência para fazer as comparações:
• Algoritmo genético de segmentação por Quadtree;

• Algoritmo genético com método de segmentação limiar Treshold;
• Algoritmo genético com método de segmentação por crescimento de regiões;
• Algoritmo Snake, usado para detecção de contorno da imagem e
segmentação.
Pode-se também fazer a interpretação de uma imagem através da análise de

agrupamentos (Cluster Analysis), sendo este um método estatístico que identifica grupos
23
através de suas características. O processo de análise de dados, usando o Cluster Analysis,

é dividido em quatro passos (Gonzaga, 2007):
1. Seleção das variáveis de agrupamento (características) e da medida de

distância (distância Euclidiana e distância de Pearson);
2. Seleção do algoritmo de agrupamento (hierárquico (árvores de grupo –
cluster tree) ou não-hierárquico (método k-means));
3. Realização da análise de agrupamento;
4. Interpretação dos agrupamentos.
Uma outra forma de fazer o reconhecimento de imagens é usando autômatos, para

Menezes (2000) a implementação de um autômato finito de reconhecimento consiste
basicamente em um algoritmo que controla a mudança de estado do autômato a cada
símbolo lido da entrada. Assim, o tempo de processamento necessário para aceitar ou
rejeitar é proporcional ao tamanho da entrada de forma exponencial. A construção de
reconhecedores usando autômatos de pilha é relativamente simples e imediata, porém não
é muito recomendado para entradas de tamanhos consideráveis, por consumirem muito
tempo. Os reconhecedores, segundo Menezes (2000) podem ser de dois tipos: Top-Down,
constrói-se uma árvore de derivação e ramos para a palavra a ser reconhecida, ou símbolos
terminais que compõem a palavra; e Bottom-Up, que é o oposto do Top-Down, parte dos
símbolos terminais indo em direção à raiz.
24
4 RECONHECIMENTO E INTERPRETAÇÃO
O reconhecimento de padrões em uma imagem depende muito da qualidade da

própria imagem, portanto, para que não ocorram erros no reconhecimento é necessário que
a imagem passe por um tratamento anterior, através, por exemplo, da correção da
iluminação, e/ou uso de colorantes químicos.
Outros aspectos importantes para o reconhecimento de uma imagem são:
• Definir anteriormente como será adquirida a imagem, de que tipo ela será
(bmp, jpeg, tiff etc) e qual será a sua escala de cores;
• Fazer o melhoramento da imagem, pois apesar dos cuidados tomados, a
imagem ainda pode sofrer interferências que prejudicam ou impossibilitam o
seu reconhecimento. Essas interferências são chamadas de ruídos, e sua
correção é feita através de filtros (filtro passa baixo, filtro passa alto etc);
• Segmentar a imagem ou escolher pedaços relevantes, diminuindo assim a área
de dados a ser analisada, assim como o tempo gasto para a análise. Podem
ser usados para isso, por exemplo, os algoritmos de segmentação por
Quadtree;
• Estabelecimento de parâmetros a serem seguidos e de tipos (área, perímetro,
descrição estrutural, topologia etc).
Somente após estas etapas é feito o reconhecimento e a classificação dos objetos, de
acordo com os padrões estabelecidos previamente, para que assim possam ser
minimizados possíveis erros no processamento da imagem.
Um padrão é uma descrição quantitativa (vetores) ou estrutural (strings) de um objeto
ou algum outro ponto de interesse, neste trabalho, referente a uma imagem digital. Um
padrão é formado por um ou mais descritores, ou características. O ato de gerar descritores
é chamado de “Extração de Características”. Os arranjos de padrões são representados da
seguinte forma (Gonzaga, 2007):
• Vetores – contém informações quantitativas;
• Cadeias e Árvores – contém informações estruturais.
Algumas aplicações são melhores descritas através da relação estrutural que
possuem, por exemplo o reconhecimento de digitais, onde não se mensura apenas a
imagem e sim são feitas relações espaciais entre padrões para determinar a qual classe o
membro pertence.
Pode-se dizer assim que o enfoque do reconhecimento de padrões pode ser dividido
em duas áreas principais: Teoria de decisão e Estrutura. Na primeira categoria, são
utilizados padrões quantitativos (comprimento, área, textura etc), na segunda, são utilizadas
strings que descrevem o relacionamento entre símbolos (Gonzalez, Woods e Eddins, 2004).
25
A área de reconhecimento de padrões trata da classificação de elementos extraídos

(César Júnior, Barrera e Costa, 2007) e da sua análise computadorizada ou semi-
computadorizada tornando possível a detecção de falhas. O processo de reconhecimento de
padrões apesar de ser aparentemente simples, envolve muitas variáveis, portanto fazer a
seleção das características que geram o vetor de características é de extrema importância,
pois influirá no desempenho do sistema (Gonzaga, 2007). Exemplos de como fazer a
seleção de características:
• Assinatura: a cada intervalo, é gerado um vetor de características;
• Momentos: calculam-se os momentos de um objeto e gera-se um vetor com
os primeiros momentos;
• Momentos por peça e vetor de características: gera-se um vetor com os
primeiros momentos.
Utilizar características através de diferentes métodos facilita o processo de
reconhecimento, no entanto, em alguns problemas de reconhecimento, é necessário
estabelecer (além das medidas quantitativas) relações espaciais. Neste caso, os problemas
são mais bem resolvidos utilizando abordagens estruturais (Gonzaga, 2007).
Na Figura 13, por exemplo, sem um conhecimento prévio da cena, ficaria muito difícil
fazer a identificação do dálmata presente na imagem.
Figura 13 - Nível alto de dificuldade no reconhecimento de imagem (César Jr, 2007).
As representações por cadeias geram estruturas padronizadas baseadas na

conectividade de primitivas, associadas à fronteira, vide exemplo Figura 14.
Figura 14 - Representação por cadeias (Gonzaga, 2007).

26
Para Bonventi Júnior e Costa (2007), na área de reconhecimento de padrões, e

também em visão de máquina, várias técnicas têm sido desenvolvidas e testadas, sendo a
classificação uma das principais tarefas.
O processo de reconhecimento de padrões passa pelas etapas de percepção,
extração, segmentação e classificação. A etapa de classificação irá variar de acordo com a
linha de pesquisa a ser seguida, porém, podemos dividi-la em: teorias adotadas (Bayer,
classificação linear, classificação não-linear, modelo de Markov etc); padrões a serem
reconhecidos (cor, formato, tamanho etc); métodos usados (estatístico, supervisionado e
não-supervisionado); e técnicas de reconhecimento utilizadas (gramáticas formais, redes
neurais, operadores morfológicos, geometria diferencial para análise de contornos, topologia
digital etc).
A seguir serão vistos:
• Método de decisão: função de decisão ou função discriminante;
• Classificação de padrões:
Classificador de distância mínima ou euclidiana;
Classificador Bayesiano.
• Filtros: lineares e não-lineares;
• Segmentação da imagem: Threshold e Edge.
Existem outros como, por exemplo, os classificadores por Redes Neurais ou por
Lógica Nebulosa (“Fuzzy Sets”). De acordo com Albuquerque (2007), não existe uma única
técnica que seja abrangente e que funcione para todos os problemas devido ao fato desta
estar associada ao reconhecimento e a análise das informações, e o processo de
reconhecimento por sua vez, em geral, só ocorre após uma fase de segmentação e
parametrização da imagem.
O tema central do conceito de reconhecimento de padrões é o conceito de “aprender”,
através de exemplos, de forma automática ou envolvendo no mínimo possível o homem
(Gonzalez, Woods e Eddins, 2004).
4.1 Métodos de decisão
Métodos de decisão (funções de decisão ou funções discriminantes) são para

Gonzaga (2007), x = (x1, x2, x3,..., xn)t um vetor de características n-dimensional e w1, w2, w3,...,
wm, uma classes de padrões. O reconhecimento consiste em encontrar funções “M” de
decisão d1(x), d2(x), ...,dm(x) tal que:
di(x) > dj(x) j = 1, 2, ..., M; j ≠ i
Ou seja: x ∈ wi se di(x) é o maior valor
27
A fronteira de decisão para wi e wj é dada pelos valores de x para os quais di(x) =

dj(x), ou seja:
di(x) - dj(x) = 0
Identifica-se à fronteira de decisão entre as duas classes através da função:
dij = di(x) - dj(x) = 0
Ou seja, se dij(x) > 0 , o padrão pertence à classe wi
e se dij(x) < 0 , então, o padrão pertence à classe wj.
4.2 Classificador de distância mínima / distância Euclidiana
Uma classe de padrões pode ser representada através de um valor médio ou por um
vetor protótipo, de acordo com Gonzaga (2007).
1
mj =
Nj
∑ x j = 1, 2, ..., M
x∈wj
Para definir, de acordo com Gonzaga (2007), a pertinência de um vetor de

características (x) desconhecido, pode-se atribuí-lo a classe mais próxima do seu protótipo.
A distância euclidiana é dada por:
Dj (x) = x - mj j = 1, 2, ..., M
Onde: a = (at a)1/2 é a norma euclidiana.
x ∈ wi se Di(x) for a menor distância

De acordo com Gonzaga (2007), é o equivalente:
dj (x) = xt mj - ½ m tj m j j= 1, 2, ..., M
x ∈ wi se di(x) for o maior valor

Sendo a fronteira de decisão entre as duas classes wi e wj :
dij = di(x) - dj(x) = xt (mi - mj ) - ½ (mi - mj ) t (mi - mj ) = 0
n = 2 ---- uma reta
n = 3 ---- um plano
n > 3 ---- um hiperplano
4.3 Classificador Bayesiano
De acordo com Gonzaga (2007), para resolver um problema que envolve duas classes
de padrões governados por densidades gaussianas, com médias m1 e m2 e desvios padrões
σ 1e σ 2 , pode-se resolver da seguinte forma:
28
dj (x) = p( x / wj) P(wj) =
1  (x − m j )2 
exp −  P(wj) j = 1,2
2πσ j  2σ 2j 
Na Figura 15, é possível identificar o ponto x 0, que equivale à fronteira entre as

classes.
Figura 15 - Fronteira das classes classificador bayesiano (Gonzaga, 2007).
4.4 Filtros
A utilização de filtros permite equalizar a intensidade de tons da imagem, de forma a

obter a redução de ruídos, o método usado para esse processamento é chamado de
histograma. O método tem um princípio simples, são considerados momentos de nível
contínuo que são normalizados dentro de um intervalo [0, 1], através de níveis de
intensidade fornecidos para entrada e saída, esse processo permite obter um nível de
densidade mais uniforme. Espacialmente os filtros podem ser lineares ou não-lineares
O conceito de filtro linear tem suas raízes em Fourier, com o processamento de sinais
em uma freqüência e o conceito espacial de filtros não-lineares esta baseado nas operações
com a vizinhança. Ou seja, enquanto os filtros lineares trabalham baseados em operações e
produtos lineares, os filtros não-lineares trabalham com operações não-lineares que
envolvem pixels vizinhos (Gonzalez, Woods e Eddins, 2004).
Dentre as formas de equalizar histogramas de imagens, através de filtros lineares
pode ser citado o filtro de freqüências passa-baixas Gaussiano2, e através de filtros não-
lineares, o filtro Mediano, que como o próprio nome diz utiliza o valor mediano (Gonzalez,
Woods e Eddins, 2004).
2
Método de Gauss – é um método que consiste na aplicação de operações elementares à matriz aumentada no
sistema, chegando-se assim a uma matriz escalonada, neste caso ele produz um efeito de desfocagem.
29
4.5 Segmentação da Imagem
A segmentação subdivide uma imagem em regiões ou objetos, o nível desta divisão

depende no entanto do problema a ser resolvido. A segmentação não é um processo trivial,
pois pode interferir no processo de análise da imagem, e é um passo essencial no processo
de reconhecimento de padrões e análise do problema. Os algoritmos de segmentação
monocromáticos são geralmente baseados em duas propriedades básicas de intensidade de
valores: continuidade e similaridade (Gonzalez, Woods e Eddins, 2004).
A detecção Edge em particular, foi o principal algoritmo de segmentação por muitos
anos, o método Threshold por sua vez é fundamental pois consegue diminuir o tempo de
processamento da imagem (Gonzalez, Woods e Eddins, 2004).
Além da detecção de ponto e da detecção de linha, certamente a detecção Edge é de
longe a mais utilizada para procurar por valores descontínuos. Dentre os diversos tipos de
máscaras para detectores Edge temos: Sobel; Prewitt; Canny e Roberts (Gonzalez, Woods
e Eddins, 2004).
A implementação do método Threshold por suas propriedades intuitivas e simples,
merece uma posição central na aplicação se segmentação das imagens (Gonzalez, Woods
e Eddins, 2004). Na Figura 16 um exemplo de macro que pode ser gerada no software
Scion Image.
Uma outra forma de facilitar o processo de segmentação de uma imagem é utilizando
os métodos: splitting e merging, de forma a atender de forma satisfatória as condições
estabelecidas. Uma particular técnica de divisão é chamada de Quadtree, que divide a
imagem em quadrantes e construindo assim uma árvore, onde cada subdivisão torna-se um
nó e a sua raiz é a imagem inicial (Gonzalez, Woods e Eddins, 2004).
Figura 16 – Macro Threshold do Software Scion Image.

30
5 TECNOLOGIA DE SOFTWARE
No mercado existem vários softwares que fazem os trabalhos de quantificações,

amostragens, conversões, edições etc, no entanto, os preços e as plataformas disponíveis
variam de acordo com o produto escolhido, entre eles tem-se:
• AVS (Advanced Visualization System);
• IBM Data Explorer;
• IDL (Interactive Data Language);
• Khoros;
• Mathlab;
• Paraview:
• ProEikon;
• Scion Image.
5.1 Matlab
Matlab (Figura 17) é um sistema interativo de matrizes (Figura 18) que pode ser usado
tanto para o ensino de matemática fundamental quanto para cálculos complexos de
engenharia. O nome é uma abreviação de MATrix LABoratory, e foi originalmente
desenvolvido, com a intenção de facilitar o acesso a matrizes, para os projetos LINPACK
(Linear System Package) e EISPACK (Eigen System Package). Hoje, o Matlab incorpora as
bibliotecas LAPACK (Linear Álgebra Package) e BLAS (Basic Linear Álgebra Subprograms)
O Matlab consegue executar uma seqüência de ações através de arquivos chamados
de “M-files”, que possuem a extensão “*.m”. Os M-files são de 2 tipos, os “scripts files”, que
são uma seqüência normal de passos do Matlab e os “function files”, que são funções
criadas para necessidades específicas (Gonzalez, Woods e Eddins, 2004).
Figura 17 – Tela de abertura do programa Matlab.

31
Figura 18 – Exemplo de uso de matrizes no Matlab.
Uma forma de utilizar o MatLab para análise e reconhecimento de padrões, é usando

SDC Morphology Toobox for Matlab (Figura 19), que é um software para análise e
processamento de sinais. Ele é composto por uma família de filtros chamados de
operadores morfológicos, que permitem a restauração, segmentação e análise das imagens
e sinais de forma quantitativa.
Figura 19 – Janela do Software SDC Morphology Toolbox for Matlab.

32
5.2 Scion Image for Windows
O software Scion Image (Figura 20), trabalha com fundamentos de densiometria3,

escalonando pixels com concentrações correspondentes. Outros exemplos do uso da
densiometria podem ser encontrados na ótica e na eletrônica. Scion Image é um programa
que foi baseado na plataforma NIH Image da Macintosh, sendo possível automatizar rotinas
através de macros, usando a linguagem de programação Pascal. Uma vantagem do
software para a área médica é a possibilidade de importar arquivos DICOM (Digital Imaging
and Communication in Medicine), que é um formato padrão usado principalmente na área de
radiologia.
Figura 20 – Tela de abertura do programa Scion Image.
3
A densiometria foi descrita como ciência graças a Pierre Bouguer (1729) e Johann Heindrich Lambert (1760)
que descreveram o processo de radiação (ou luz) (Andrade, 2000).
33
6 TESTES
Os testes dos algoritmos de reconhecimento foram implementados utilizando os

softwares: Matlab e Scion Image. Segundo Amabis e Martho (1990), as células sangüíneas,
chamadas também de elementos figurados do sangue (Figura 21), são de três tipos:
hemácias (ou eritrócitos ou glóbulos vermelhos), leucócitos (ou glóbulos brancos) e
plaquetas (ou tombócitos). Essas células ficam mergulhadas em um material intercelular
líquido do sangue, chamado de plasma.
Podem ser identificadas as seguintes características nestas células (Amabis e Martho,
1990; Junqueira e Carneiro, 1999):
• Hemácias: são células sem núcleo e com formato discóides, nos humanos
tem em média 7,5 µm de diâmetro e 2,6 µm de espessura;
• Glóbulos brancos: são maiores que as hemácias e apresentam um núcleo
volumoso. Existem vários tipos, entre eles: os linfócitos e os neutrófilos. Nos
humanos tem em média de 15 µm de diâmetro variando de acordo com o
tipo;
• Plaquetas: são fragmentos de células que se formam pelo rompimento dos
megacariócitos. Têm seu tamanho em torno de 3 µm.
GLÓBULOS BRANCOS
PLAQUETAS
GLÓBULOS VERMELHOS
Figura 21 – Células sangüíneas com hemácias, glóbulos brancos e plaquetas (Borja, 2007).
34
6.1 Matlab
O Matlab reconhece vários tipos de extensões de imagens porém, para o estudo das
técnicas de reconhecimento de imagens, os testes foram realizados com a imagem na
escala de tons cinza e com a extensão bitmap (“*.bmp”). O Matlab é um software completo e
permite a manipulação de matrizes de forma relativamente fácil. Permite fazer interfaces
com linguagens de programação “C” e “Java” por exemplo, de forma a tornar o processo de
reconhecimento de imagens o mais automatizado possível. Na Tabela 3, é possível
visualizar a seqüência de testes realizados no software Matlab.
Seqüência de Testes Matlab
Imagem inicial Matlab, em escala de cinza e com

extensão bitmap.
Imagem com filtro gaussiano (Matriz 7X7). A aplicação

do filtro gaussiano na imagem fez a correção e a
remoção de ruídos.
Aplicação da função Threshold.
Binarização da imagem e exportação da imagem para

um arquivo tipo texto, é necessário a criação de um
programa para fazer a tradução do arquivo do Matlab.
35
Contornos da imagem através da função Edge.
Threshold da imagem.
Histograma da imagem.
Tabela 3 – Seqüência de testes realizados no software MatLab.
Na Figura 22, é exibido o arquivo utilizado para gerar a rotina realizada na Tabela 3, a
rotina criada foi executada através de um ícone na área de trabalho mapeado para
“C:\MATLAB701\bin\win32\MATLAB.exe -nojvm -r celsang”. Foram feitas as etapas de
limpeza de ruídos, detecção de borda e Threshold, além de exibir o histograma para análise
da imagem. Com o software Matlab é possível conseguir mais liberdade na programação,
porém é necessário um conhecimento anterior do software e de suas funcionalidades.
No início do código é executada uma função que faz o tratamento da imagem para a
escala de cor cinza. Para a limpeza de ruídos da imagem é utilizado um filtro gaussiano e é
utilizada a função threshold. É feita a verificação da imagem para identificar se ela esta em
formato binário ou não, após essa rotina a imagem binária é salva, no entanto a visualização
do código binário só seria possível com a implementação de um programa que fizesse a
conversão do arquivo “*.m” para um arquivo “*.txt” .
É utilizada a função edge para detecção de contornos e novamente a função threshold
para alterar o fundo da imagem. A imagem é plotada para visualização.
36
Figura 22 – Macro utilizada no Matlab.
6.1.1 Pseudo-código
1. Início do programa
2. Ler imagem
3. Se imagem ≠ escala de cinza então
Converte imagem para escala de cinza
Armazena imagem em uma função “y”
Senão
Armazena imagem em uma função “y”
4. Aplicar filtro na imagem
5. Aplicar função threshold na imagem
6. Se imagem ≠ binário
Converte imagem para binário
Salva imagem binária
Senão
Salva imagem binária
7. Aplicar função edge na imagem
8. Plotar resultado na tela
6.2 Scion Image

Com o intuito de facilitar o reconhecimento e análise das células, a imagem original foi
alterada para a extensão bitmap (“*.bmp”) com coloração em escala de cinza. Na Tabela 4,
é possível visualizar a seqüência de testes realizada para o reconhecimento e diferenciação
das células, usando o programa Scion Image. O software se mostrou eficaz e de simples
utilização.
37
Seqüência de Testes Scion Image
Imagem inicial Scion Image, em escala de cinza e com

extensão bitmap.
Imagem após o processo de correção e remoção de

ruídos, usando-se um filtro gaussiano (Matriz 7X7)
para a equalização de valores.
A aplicação da função Threshold, faz com que o

volume de dados da imagem diminua e neste caso,
trabalha fechando os contornos da imagem de acordo
com a intensidade dos pixels.
A imagem gerada foi exportada para um arquivo tipo

texto.
Contornos da imagem gerados através da função

Edge.
Usando-se a função Analyze é feita a filtragem por

tamanho de partículas com densiometria de 50 a 300
pixels, para reconhecimento de plaquetas na imagem.
A função Analyse cruza as bordas de uma ponta a
outra até percorrer o objeto inteiro.
38
O mesmo processo de análise é feito filtrando-se o

tamanho de partículas de área de 500 a 600 pixels,
para reconhecimento de glóbulos vermelhos.
Filtragem analisando-se partículas com área de 610 a

2300 pixels, para reconhecimento de glóbulos
brancos.
Tabela 4 – Seqüência de testes realizados no software Scion Image.
Na Figura 23, é exibida a macro criada para gerar a rotina que fará o reconhecimento
das células de acordo com a densidade.
Figura 23 – Macro utilizada no Scion Image.
A macro da figura 23, faz o reconhecimento e a contagem de células sangüíneas de

acordo a densidade e de forma semi-automática. Para o seu funcionamento é necessário
“carregar” a imagem e a macro no software. Além disso, é exibida uma janela de diálogo
para que o usuário possa especificar o tamanho mínimo e o máximo das células sangüíneas
que ele está analisando.
39
No início do código, são declaradas as variáveis “min” e “max" que serão utilizadas na
busca de acordo com o tamanho do componente da imagem (o tamanho é dado em pixels),
também são zerados os contadores para evitar erros. Após isso, é criada no código uma
“matriz gaussiana” que servirá para a aplicação do filtro na matriz da imagem. Com a
finalidade de diminuir a área de análise da imagem é utilizada a função “Auto Threshold” e é
gerada uma imagem binária. Para a aplicação da função “Cross”, que determinará a
densiometria dos componentes, é chamada a função “TraceEdges” que traça os contornos
da imagem. A função “Cross” percorre de um ponto da borda até o outro para fazer o cálculo
da área para fazer a densiometria. São exibidas as telas de diálogo para entrada dos
valores mínimo e máximo das partículas que serão analisadas, além disso são definidos
alguns parâmetros que não estão inclusos na função “default” da função “AnalyzerParticles”.
O resultado é exibido na tela através da imagem.
Durante os testes, foi observado que na contagem das hemácias, devido à
sobreposição das mesmas e a qualidade da imagem (tonalidade), estas eram consideradas
uma única célula, sendo assim, como a análise foi feita através da densiometria, estas
apareceram na contagem de glóbulos brancos ao invés de aparecerem na de glóbulos
vermelhos.
6.2.1 Pseudo-código
1. Início do programa
2. Declarar variáveis “mínimo” e “máximo”
3. Zerar contador
4. Ler imagem
5. Criar matriz de ruído
6. Aplicar filtro na imagem utilizando a matriz de ruído
7. Aplicar função threshold
8. Gerar imagem binária
9. Aplicar função edge na imagem
10. Carregar valores padrão para a função
11. Aplicar função de análise nas partículas
12. Plotar resultado na tela
40
7 RESULTADOS
O reconhecimento de padrões em imagens em tons de cinza são, geralmente, mais

fáceis de serem implementados do que no caso de imagens coloridas, que trabalham com
três componentes.
Através da análise computadorizada automática ou semi-automática de imagens é
possível eliminar, ou ao menos diminuir grande parte dos erros inerentes do processo visual,
tornando possível à detecção de falhas que seriam imperceptíveis em uma linha de
produção, por exemplo, e eliminando a subjetividade. O processo de reconhecimento visual
de padrões, apesar de ser aparentemente simples, envolve muitas variáveis, portanto, foi
realizado um estudo das técnicas que envolvem o processo, que faz parte da área de
computação gráfica. O estudo mostrou-se não somente importante, mas também essencial
para o processo de reconhecimento de padrões, pois se as técnicas não forem bem
utilizadas e definidas o processo não será eficaz ou será muito lento.
Os testes foram feitos com o objetivo de fazer o reconhecimento de células
sangüíneas e a sua contagem, embora realizado com sucesso, na prática essa forma de
reconhecimento mostra-se de pouca eficiência, dado que já existem equipamentos que
fazem a análise de amostras sanguíneas instantaneamente. Devido ao tempo disponível,
foram feitas opções por métodos e processos simples, a fim de diminuir a complexidade.
Uma boa implementação de reconhecimento de imagens de células sangüíneas, seria a
identificação de organismos estranhos na imagem, como por exemplo bactérias, com base
em um banco de dados. Fora da área médica, um ramo interessante e lucrativo que esta
investindo em sistemas apoiados em imagens digitais é o setor bancário.
Finalmente, este estudo também mostrou que a escolha adequada de uma técnica de
reconhecimento mesmo que simples, depende principalmente da análise e do conhecimento
anterior do problema.
41
8 REFERÊNCIAS BIBLIOGRÁFICAS
ALBUQUERQUE, Marcelo P.; ALBUQUERQUE, Márcio. Processamento de imagens:

métodos e análises. Apostila de Imagens. Centro Brasileiro de Pesquisas
Físicas – CBPF / MCT. CAT. Disponível em: <
http://mesonpi.cat.cbpf.br/e2002/cursos/NotasAula/Apostila_Imagens.pdf>.
Acesso em: 12 de outubro de 2007.
AMABIS, José Mariano; MARTHO, Gilberto Rodrigues. Fundamentos da Biologia
Moderna. São Paulo, S.P.; Editora Moderna, 1990.
ANGELO, Michele Fulvia apud MORAES, Aline. Software pioneiro acessível via internet
permite análise mais detalhada de mamografias. Agência USP de Notícias.
USP. Reportagens 26/04/2007. Ano XXII nº 797. Disponível em: <
http://noticias.usp.br/acontece/obterNoticia?acesso=n&imprimir=s&print=s&cod
ntc=15949&codnucjrn=1>. Acesso em: 16 de maio de 2007.
BONVENTI JÚNIOR, Waldemar; COSTA, Anna Helena Reali. Classificação por
agrupamento nebuloso de padrões de cores em imagens. Departamento
de Engenharia de Computação e Sistemas Digitais, Escola Politécnica da
Universidade de São Paulo, São Paulo. Disponível em:
<http://www.lti.pcs.usp.br/publicacoes/BonventiCosta02-WORKCOMP.pdf>.
Acesso em: 27 de fevereiro de 2007.
BORJA, Fernando. Histologia. Centro de Saúde & Tecnologia Rural, Universidade
Federal de Campina Grande, Campus de Patos, Patos – P.B.. Disponível em: <
http://www.cstr.ufcg.edu.br/histologia/atlas_sangue_linfa.htm>. Acesso em: 05
de outubro de 2007.
CCS USP. Variedades – Ilusão de Ótica. Espaço Aberto. Coordenadoria de
Comunicação Social. Universidade de São Paulo. Ano IV – nº32.
janeiro/fevereiro de 1999. Disponível em: <
http://www.ccs.usp.br/espacoaberto/fevereiro99/variedades.html >. Acesso em:
08 de outubro de 2007.
CESAR JR, Roberto M. Imagens Digitais. Computer Vision Research Group at São
Paulo. Departamento de Ciência da Computação. Instituto de Matemática e
Estatística. Universidade de São Paulo. Disponível em:
<http://www.vision.ime.usp.br/~cesar/talks/mac420/imagensDigitais.pdf>.
Acesso em: 01 de abril de 2007.
42
CESAR JÚNIOR, Roberto M.; BARRERA, Junior; COSTA, Luciano da F. . Modelagem

por redes (grafos) e técnicas de reconhecimento de padrões: estrutura,
dinâmica e aplicações. Grupo de visão do IME-USP e IFSC-USP.
Universidade de São Paulo, São Paulo. Disponível em:
<http://www.vision.ime.usp.br/~jb/projects/sumario.pdf>. Acesso em: 27 de
fevereiro de 2007.
GATTASS, Marcelo. Introdução às cores. 21/08/2002. Computer Vision Research Group
at São Paulo. Departamento de Ciência da Computação. Instituto de
Matemática e Estatística. Universidade de São Paulo. Disponível em:
<http://www.vision.ime.usp.br/~ronaldo/mac0417-03/aula_02/02_Cor.pdf>.
Acesso em: 01 de abril de 2007.
GONZAGA, Adilson. Aula 9 – Reconhecimento e interpretação de imagens. SEL -
Departamento de Engenharia Elétrica de São Carlos. Universidade de São
Paulo. Disponível em: <http://iris.sel.eesc.sc.usp.br/sel886>. Acesso em: 25 de
março de 2007.
GONZALEZ, R. C.; WOODS, R. E. apud SILVA, Renato Ramos da. Reconhecimento de
imagens digitais utilizando redes neurais artificiais. 2005. 51 f. Monografia
(Graduação em Ciência da Computação). Universidade Federal de Lavras,
Lavras – MG.
GONZALEZ, Rafael C.; WOODS, Richard E.; EDDINS, Steven L.. Digital Image
Processing using MATLAB. Pearson Education, Inc. , 2004.
GRUBER, Arthur apud GLUGOSKI, Miguel. Diagnóstico a distancia é mais seguro.
Saúde Animal. Jornal da USP. Universidade de São Paulo. 9 a 15 de abril de
2007. ano XXII nº 797. Disponível em:
<http://www.usp.br/jorusp/arquivo/2007/jusp797/pag0405.htm>. Acesso em: 16
de maio de 2007.
HASHIMOTO, Ronaldo Fumio. Visão e processamento de imagens. Primeiro Semestre
de 2003. Aula 02. Disciplinas: MAC0417(Graduação)/ MAC5768(Pós-
graduação). Computer Vision Research Group at São Paulo. Departamento de
Ciência da Computação. Instituto de Matemática e Estatística. Universidade de
São Paulo. Disponível em: <http://www.vision.ime.usp.br/~ronaldo/mac0417-
03/aula_02.html>. Acesso em: 01 de abril de 2007.
INCOR-HC. Técnicas Avançadas de Processamento de Imagens Médicas. Indução,
motivação, princípios físicos e modelos. SF 15/06/2006. Fundação Zerbini.
Universidade de São Paulo. Disponível em:
43
<http://www.incor.usp.br/spdweb/cursos/downloads/ptc5750_introd_coracao200
6.pdf>. Acesso em: 01 de abril de 2007.
JÄHNE, Bernd. Computer Vision and Applications – A guide for students and
practitioners, Introduction, Academic Press, San Diego, CA, USA, 2000.
JUNQUEIRA, Luiz C.; CARNEIRO, José. Histologia Básica. 9ª Edição. Rio de Janeiro,
R.J..; Editora Guanabara Koogan, 1999.
MENA-CHALCO, Jesús P.; CESAR JR, Roberto Marcondes. ScriptLattes. Incubadora
Fapesp. CNPq. Disponível em: <http://scriptlattes.incubadora.fapesp.br/portal>.
Acesso em: 25 de março de 2007.
MENEZES, Luís Carlos (coord.) et al. Leituras de física. GREF Óptica para ver, fazer e
pensar. Universidade de São Paulo. Junho-1998. Disponível em:
<http://axpfep1.if.usp.br/~gref/optica/optica1.pdf. >. Acesso em: 01 de abril de
2007.
MENEZES, Paulo Fernando Blauth. Linguagens formais e autômatos. Instituto de
Informática da UFRGS. Número 3. 4ª Edição. Editora Sagra Luzzatto, 2000.
METZE, Konradin apud SUGIMOTO, Luiz. Detectando o imperceptível, descrevendo o
indescritível. Sala de Imprensa. Jornal da Unicamp. Universidade Estadual de
Campinas. Edição 278. 28 de fevereiro a 6 de março de 2005. Disponível em: <
http://www.unicamp.br/unicamp/unicamp_hoje/ju/fevereiro2005/ju278pag09.htm
l>. Acesso em: 08 de junho de 2007.
MÜLLER, Sonia Isoldi Marty Gama; DALMOLIN, Quintino; ARAKI, Hideo. Comparação
entre os métodos de máxima verossimilhança, distância mínima e o
método de Fisher para reconhecimento de padrões em imagens coloridas.
Boletim Ciências Geod. de Curitiba, Universidade Federal do Paraná. 1999.
Disponível em:
<http://calvados.c3sl.ufpr.br/ojs2/index.php/bcg/article/viewPDFInterstitial/1496/
1250>. Acesso em: 27 de fevereiro de 2007.
PINKER, Steven. The mystery of consciousness. Time. 12/02/2007. vol. 169 nº7.
SILVA, Renato Ramos da. Reconhecimento de imagens digitais utilizando redes
neurais artificiais. 2005. 51 f. Monografia (Graduação em Ciência da
Computação). Universidade Federal de Lavras, Lavras – MG.
WINSTON, Patrick Henry; Inteligência Artificial, tradução de Carlos Octávio Pavel, Rio
de Janeiro: LTC – Livros Técnicos e Científicos, 1988.
44
9 ASSINATURAS
________________________________ ________________________________
FÁTIMA APARECIDA TAGLIAFERRO PETER JANDL JUNIOR

Técnicas de Reconhecimento Automatizado de Imagens Digitais

Transféré par

Informations du document

Description originale:

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Técnicas de Reconhecimento Automatizado de Imagens Digitais

Transféré par

Droits d'auteur :

Formats disponibles

Fátima Aparecida Tagliaferro

TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE

PADRÕES BASEADOS EM IMAGENS DIGITAIS.

TÉCNICAS DE RECONHECIMENTO AUTOMATIZADO DE

PADRÕES BASEADOS EM IMAGENS DIGITAIS.

Monografia apresentada a disciplina Trabalho

automatizado de padrões baseados em imagens digitais. Monografia defendida e

aprovada na Faculdade de Jaguariúna em 13 de dezembro de 2007 pela banca

examinadora constituída pelos professores:

O reconhecimento de padrões possui aplicações em muitos domínios, permitindo a

Palavras-chave: RECONHECIMENTO DE PADRÕES; IMAGENS DIGITAIS; VISÃO

Keywords: PATTERN RECOGNITION; DIGITAL IMAGE; COMPUTER VISION.

Tabela 1 - Funções da visão humana e da máquina.................................................... 16

Se há décadas atrás, não seria possível imaginar a robótica, o reconhecimento da fala

“... a utilização de algoritmos computacionais para a análise e

Figura 1 – Rel. das publicações em congressos (Mena-Chalco; César Jr, 2007).

O processo de classificação de imagens visual, feito pelo homem, é muito eficaz,

“Um diagnóstico mais preciso evitaria estatísticas como essa, revelada em

“À primeira vista, trata-se do perfil de uma jovem delicada, com cabelos

Figura 2 - Velha Moça (CCS, 2007).

Figura 3 – Macro-áreas da Imagem Digital (César Jr., 2007).

2.1 Visão computacional

O conceito de imagem envolve todo o processo de visão computacional (Figura 4),

Figura 4 – Processo e elementos da visão computacional (Gonzaga, 2007).

• Câmera: realiza a coleta da radiação recebida do objeto fixando tudo em um só

VISÃO HUMANA X VISÃO DE MÁQUINA

Tabela 1 - Funções da visão humana e da máquina (Jähne, 2000).

2.2 Questões do processamento visual

Dentre os problemas particulares do processamento visual, os melhores

Figura 5 – Fatos explícitos em imagens (Winston, 1988).

Figura 6 - Diagrama de agulhas (Winston, 1988).

Figura 7 - Generalização de volumes (Winston, 1988).

• Arquiteturas e subsistemas dedicados em tempo real;

Reconhecimento de objetos 3D;

2.3 Imagem Digital

As imagens digitais coloridas são, em geral, funções quantificadas e apresentadas

Figura 9 – Vetor de componentes de imagens coloridas (RGB).

Figura 10 - Relação entre comprimento e velocidade de onda (Gattass, 2002).

Figura 11 - Espectros de luz (1 nm = 10-9 m) (Gattass, 2002).

Na Figura 12, é possível observar as mudanças de coloração de acordo com o

Figura 12 - Espectro eletromagnético (Gattass, 2002).

• Sucesso na solução do problema;

• Estudo analítico: este é, matematicamente, o caminho mais rigoroso usado

Os algoritmos de reconhecimento são utilizados de forma conjunta, para melhores

• Algoritmo genético de segmentação por Quadtree;

Pode-se também fazer a interpretação de uma imagem através da análise de

através de suas características. O processo de análise de dados, usando o Cluster Analysis,

1. Seleção das variáveis de agrupamento (características) e da medida de

Uma outra forma de fazer o reconhecimento de imagens é usando autômatos, para

O reconhecimento de padrões em uma imagem depende muito da qualidade da

A área de reconhecimento de padrões trata da classificação de elementos extraídos

Figura 13 - Nível alto de dificuldade no reconhecimento de imagem (César Jr, 2007).

As representações por cadeias geram estruturas padronizadas baseadas na

Figura 14 - Representação por cadeias (Gonzaga, 2007).

Para Bonventi Júnior e Costa (2007), na área de reconhecimento de padrões, e

4.1 Métodos de decisão

Métodos de decisão (funções de decisão ou funções discriminantes) são para

A fronteira de decisão para wi e wj é dada pelos valores de x para os quais di(x) =

4.2 Classificador de distância mínima / distância Euclidiana

Para definir, de acordo com Gonzaga (2007), a pertinência de um vetor de

Onde: a = (at a)1/2 é a norma euclidiana.

x ∈ wi se Di(x) for a menor distância