Vous êtes sur la page 1sur 36

CHAPITRE 4

Dtection des artes dune image

Une image comporte beaucoup trop dinformations pour que lon puisse tenter une analyse de cette dernire au niveau de ses valeurs dclairement en chaque pixel. Ainsi, une (petite) image de dimensions 256x256 comporte 65,536 pixels contenant chacun une valeur dclairement. Par contre, nous pouvons faire porter lanalyse sur les artes contenues dans limage, ce qui limite de beaucoup la complexit de lanalyse. Les artes sont dnies comme les variations brusques de lclairement et correspondent des attributs physiques de la scne tridimensionnelle observe. La dtection des artes nous permet de construire le croquis, le premier niveau de reprsentation interne du modle computationnel du systme de vision. Un algorithme de stroscopie pourrait tre appliqu par la suite et consiste identier une mme primitive sur les deux images dclairement gauche et droite et mesurer la diffrence de position des deux primitives, ce qui sera inversement proportionnel la profondeur de ce point caractristique. La section 4.1 tablit la relation entre les diffrents attributs physiques de la scne et les primitives dtectes sur les images dclairement. La dtection des primitives sur limage est dtaille la section 4.2 tandis que la section 4.3 prcise une mthode de dtection multirsolution ralise laide de rseaux neuroniques. Lalgorithme de stroscopie ncessite une localisation prcise des primitives apparies. Une mthode pour amincir les artes dtectes est prsente la section 4.4. Finalement, une analyse multirsolution permet dattnuer la prsence des artes bruites et fait lobjet de la section 4.5.

82

Dtection des artes dune image

Chapitre 4

4.1 ATTRIBUTS DE LA SCNE OBSERVE


La scne tridimensionnelle sous observation comporte plusieurs attributs que nous dsirons dtecter an de construire le croquis, le premier niveau de reprsentation interne du modle computationnel dun systme de vision. Ces primitives qui apparaissent sur les images dclairement dentre sont engendres par des phnomnes physiques qui se produisent dans la scne observe comme le montre la gure 4.1. Ces attributs physiques sont projets sur les deux

2 2 1

1. Occultations: masquage dun objet 3. Marques : texture, albdo, etc. par un autre 2. Artes 3D: discontinuit du vecteur 4. Ombre: discontinuit de lclairage incident normal n Figure 4.1 Principaux attributs dune scne tridimensionnelle. Phnomnes physiques pouvant intervenir dans une scne tridimensionnelle. Ces diffrents phnomnes sont projets sur limage dclairement sous forme de variations brusques dclairement.

plans-images et apparaissent comme des artes, ou variations brusques de

Section 4.1

Attributs de la scne observe

83

lclairement. Les attributs physiques de la scne qui sont traduits par des artes sur les images dclairement sont: 1. Le contour dun objet qui masque partiellement un autre objet de la scne observe. Ce contour doccultation empche de dtecter les attributs de lobjet masqu qui est derrire. 2. Les artes 3D, qui correspondent une discontinuit du vecteur normal la surface externe de lobjet. 3. Les diffrentes marques qui apparaissent sur des surfaces visibles de la scne. Ces marques peuvent provenir de la texture de la surface ou dun changement dalbdo caus, par exemple, par un trait de crayon. 4. Le contour de lombre projete sur des objets de la scne et provoque par une discontinuit de lclairage incident. Les artes de limage sont donc associes des attributs identiables de la scne tridimensionnelle sous observation. La dtection et la localisation prcise de ces attributs est une tape cruciale puisquelle permet dalimenter lalgorithme de stro, entre autre. Cet algorithme, rappelons le, consiste identier les mmes primitives sur les deux images dclairement et mesurer leur position relative. Cette diffrence de position, appele disparit, restitue la profondeur de cet attribut dans la scne. Une description plus complte des attributs dune scne implique une analyse de ces attributs plus dune rsolution spatiale. Lanalyse plus dune rsolution spatiale permet de mieux identier les primitives composant la scne et dliminer les fausses artes qui ne correspondent pas des attributs physiques de la scne mais sont plutt causes par des artefacts tels les bruits de numrisation et de quantication. Une stratgie dextraction des primitives dune image pourrait donc consister identier les artes chacun des niveaux de rsolution spatiale de la reprsentation multirsolution des images dclairement, damincir les artes dtectes chaque niveau an de mieux les localiser, puis dutiliser linformation dtecte aux autres niveaux de rsolution an de renforcer les artes correspondant des attributs physiques de la scne et liminer le plus possible les artes bruites.

84

Dtection des artes dune image

Chapitre 4

4.2 DTECTION DES VARIATIONS BRUSQUES DCLAIREMENT


Un attribut physique de la scne tridimensionnelle sous observation est projete sur le plan image par le processus de formation des images comme une variation brusque dclairement, ou arte. La gure 4.2 illustre une primitive de

I I 2I

Figure 4.2

Imagerie dune variation de normale la surface. Attribut de scne (variation de la normale la surface) et sa traduction sur limage dclairement I. La variation dclairement peut tre dtecte soit comme un maximum de la drive premire de limage ou soit comme un passage par zro de la drive seconde.

scne et sa traduction sur le plan image. La variation rsultante dclairement peut essentiellement tre dtecte de deux faons : 1. La variation peut tre dtecte par un maximum de la drive premire directionnelle de limage dclairement. Cette mthode possde lavantage dtre relativement peu bruite (il est reconnu que lopration de drivation est bruite parce quelle amplie les variations brusques) et se prte bien une ralisation neuronique puisque lactivit dun neurone reprsentant une arte sera justement maximale lorsquune arte sera dtecte cette position. On na donc pas besoin dune couche supplmentaire dont les neurones

Section 4.2

Dtection des variations brusques dclairement

85

sont activs en prsence darte. Par contre, une arte dtecte comme un maximum de la drive premire aura tendance tre large, surtout si les variations dclairement sont relativement douces. Il faudra donc prvoir un mcanisme damincissement an de pouvoir localiser prcisment les artes. 2. La variation peut tre dtecte par un passage par zro de la drive seconde de limage dclairement. Cette mthode possde lavantage de permettre une localisation prcise de larte puisque cest exactement le passage par zro qui dtermine la localisation de larte. Par interpolation, il est mme possible de localiser larte entre les pixels. De plus, il existe un oprateur simple, le Laplacien, qui permet de rendre la dtection isotrope, cest--dire quune connaissance a priori de lorientation de larte nest pas requise. Par contre, lopration de drive seconde gnre beaucoup plus de bruit que lopration de drive premire. Il sensuit quun plus grand nombre dartes bruites sont dtectes; ces artes ne correspondent pas des attributs physiques de la scne observe et il faudra donc trouver un moyen de les liminer, ou tout au moins den attnuer la quantit. Le choix dune mthode axe sur la dtection dun maximum de la drive premire ou sur un passage par zro de la drive seconde dpend principalement de la prcision recherche, du type dinformation recherche et du support choisi pour la ralisation matrielle. La recherche scientique dans le domaine de la dtection dartes a t et est encore passablement active tant du ct de la dtection par la drive premire que dans celle par la drive seconde. La plupart de ces mthodes dcrites dans la littrature ltrent dabord limage analyser an dattnuer le bruit inhrent au processus de diffrentiation. Cette ltration correspond analyser limage un niveau de rsolution spatiale donn. La littrature sur la dtection dartes est vaste. Nous nous limitons aux mthodes diffrentielles et mettons volontairement de ct dautres paradigmes

86

Dtection des artes dune image

Chapitre 4

de dtection dartes telles les mthodes morphologiques (Chen, & Yan, 1989; Jang, & Chin, 1990; Moran, 1990), les mthodes utilisant la transforme de Hough (Ballard, 1981; Princen, Illingworth, & Kittler, 1990), les mthodes bases sur la minimisation dun facteur cot (Tan, Gelfand, & Delp, 1992) ou les mthodes utilisant une approximation par splines (Zucker, David, Dobbins, & Iverson, 1988). Plusieurs bons articles ont t rdigs pour synthtiser les travaux sur la dtection des artes. Le lecteur intress peut consulter (Basseville, 1979), larticle rcent de (Boyer, & Sarkar, 1992) et larticle synthse de (Torre, & Poggio, 1986). La plupart des livres qui traitent de vision informatique abordent la dtection dartes comme tant une tape cruciale du processus de vision. Les livres suivants nous ont inspir dans nos travaux sur la dtection dartes : les deux manuels de rfrence classiques en intelligence articielle (Barr, Cohen, & Feigenbaum, 1989; Cohen, & Feigenbaum, 1982), le livre en franais de (Besanon, 1988), celui, classique, de (Gonzalez, & Wintz, 1977), un autre classique sur la vision informatique et biologique, le texte de (Levine, 1985) et enn, un texte rcent de (Jain, 1989). Comme nous lavons mentionn plus haut, la dtection dartes peut tre ralise soit en dtectant un maximum de la drive premire ou un passage par zro de la drive seconde. De plus, la dtection peut tre directionnelle ou isotrope. Une dtection directionnelle indique la prsence dune arte dans une direction spcie tandis quune dtection isotrope indique la prsence dune arte indpendamment de sa direction. Les sous-sections suivantes prcisent ltat de lart dans chacun de ces domaines de dtection dartes.

4.2.1 Maximum de la drive premire directionnelle


La dtection dartes par une mesure du maximum de la drive premire de limage calcule dans une direction spcie est une mthode de dtection qui a fait lobjet de nombreuses recherches. Cette mthode offre lavantage dtre peu bruyante cause de lutilisation de la drive premire et offre la possibilit dobtenir des artes minces en choisissant soigneusement la direction selon laquelle la drive est calcule. Il existe deux coles dominantes : ceux qui calculent la drive en chaque point dans une direction prcise et ceux qui calculent la drive en chaque point selon plusieurs directions dtermines lavance et qui choisissent la direction dominante comme tant la direction de larte.

Section 4.2

Dtection des variations brusques dclairement

87

Les mthodes bases sur le calcul de la drive en chaque point selon une direction spcie sont issues principalement des travaux de (Canny, 1986). Ce dernier a trouv que loprateur optimal pour trouver une arte bruite est la drive premire directionnelle (selon la direction du gradient) dune fonction gaussienne G de rsolution . Une arte est alors dnie comme le maximum local (dans la direction du gradient) de loprateur Gn convolu avec limage I. Loprateur Gn est dni : Gn = G n (4.1)

o n est la direction du gradient. Limage est donc convolue avec loprateur Gn, ou de faon quivalente, puisque les oprations de drivation et de convolution sont linaires : I *G n = I * G = ( I *G ) n n (4.2)

Limage peut dabord tre ltre par le ltre passe-bas gaussien, puis la drive directionnelle est calcule en chaque pixel de limage. Cest cette dernire approche qui est habituellement prconise lors de la ralisation dun dtecteur de Canny, tel par exemple dans le systme de traitement et danalyse dimages Aphelion. Les tapes pour la ralisation dun dtecteur de Canny sont alors : 1. I *G Convolution de limage avec un ltre passe-bas gaussien. 2. ( I *G ) = D x, D y Calcul du gradient selon laxe horizontal et vertical. 3. ( I *G ) = du gradient.
2 + D 2 Calcul de lamplitude Dx y

4. Un pixel est activ (indique la prsence dune arte) si son amplitude de gradient est maximum dans la direction du gradient. La valeur de lamplitude du pixel doit donc tre la plus grande par rapport aux deux valeurs damplitude (obtenues par interpolation linaire) de part et dautre du pixel dans la direction du gradient.

88

Dtection des artes dune image

Chapitre 4

Cette opration de slection a pour effet damincir considrablement la largeur dtecte des artes. 5. Slection des artes signicatives. Une opration de seuillage avec hystrsis est applique sur limage dartes obtenue ltape prcdente. Les pixels de limage dartes qui ont t activs ltape prcdente : - sont conservs si leur valeur damplitude de gradient est suprieure la valeur suprieure de seuil - ne sont pas conservs (mis zro) si lamplitude est infrieure la valeur infrieure de seuil - sont conservs si la valeur damplitude est comprise entre les deux valeurs de seuil et quun des pixels dartes voisins a t conserv parce que sa valeur damplitude dpassait la valeur suprieure du seuil. Cest un processus itratif qui volue de telle sorte que les pixels dont lamplitude de gradient est situe entre les deux valeurs de seuil sont convertis en pixels darte sil existe un parcours pouvant les relier un pixel darte dont lamplitude est suprieure au seuil suprieur. (Shu, 1989) utilise une technique semblable celle de Canny, mais rtrcit les artes tant selon laxe horizontal que selon laxe vertical, au lieu de rtrcir larte selon laxe dans la direction du gradient. Cette modication permet une simplication de la ralisation de lalgorithme par rseaux neuroniques puisque lamincissement peut alors tre ralis par deux circuits de comptition pr-connects, un selon laxe horizontal et lautre selon laxe vertical. Le dtecteur de Canny est potentiellement fort intressant parce quil effectue automatiquement, avant mme dappliquer le seuil avec hystrsis, un amincissement trs efcace des artes. Par contre, le choix du seuil suprieur pour enlever les artes de bruit est non-trivial et dpend beaucoup de limage ana-

Section 4.2

Dtection des variations brusques dclairement

89

lyser. Dans la mthode propose par Canny, une arte de bruit sera dnie en relation avec le choix dune valeur maximum et minimum pour le seuil. Nous proposons au contraire, dans notre dmarche, quune arte de bruit soit plutt dnie par rapport une reprsentation multirsolution de limage analyser. De cette faon, une arte de bruit est identie par rapport au contenu de limage, et non en fonction de la valeur arbitraire dun seuil. La seconde cole dominante, inspire par lquipe de Grossberg (Carpenter, Grossberg, & Mehanian, 1989; Gaussier, & Cocquerez, 1992; Grossberg, & Mingolla, 1985; Grossberg, & Todorovic, 1988; Grossberg, & Wyse, 1991), prne de dbuter lanalyse par une dtection des artes selon plusieurs directions pr-dnies puis de choisir larte en chaque pixel selon lorientation dominante dtecte et selon lorientation des artes dans le voisinage. Ces travaux sinspirent largement de ce qui est connu du fonctionnement du cortex visuel chez les mammifres (Hubel, & Wiesel, 1959) et se prtent donc particulirement bien une ralisation par rseaux neuroniques. La gure 4.3 illustre le fonctionnement de ce systme de dtection dartes. Les principales tapes de la dtection, qui correspondent aux diffrentes couches de cellules, sont : 1. Cellules simples : Cette couche constitue le premier tage du systme de dtection de contour. Les cellules simples dtectent une arte dans une direction et un sens donns et une rsolution spatiale spcique qui dpend de ltendue du champ rcepteur. Les artes sont dtectes selon 4 orientations : horizontale, 45o, verticale (tel quillustr sur la gure), et 135o. (Carpenter, et al., 1989) utilisent deux grosseur de champ rcepteur, et donc deux chelles spatiales danalyse. La spcication du champ rcepteur dtermine lopration effectue par la cellule. Une opration simple de diffrentiation entre le ct droit et gauche de la cellule est calcule dans le type de dtecteur propos par Carpenter et al, mais dautres champs rcepteurs sont possibles, telle lutilisation dune cellule de Gabor (Daugman, 1987) qui modlise assez bien les cellules simples biologiques ou lutilisation

90

Dtection des artes dune image

Chapitre 4

Max.

Figure 4.3

Systme BCS de Grossberg. Version simplie du systme BCS (Boundary Contour System) dvelopp par Grossberg et son quipe. La premire range est constitue de cellules simples qui dtectent les artes dans une direction et une orientation donnes. La seconde couche est constitue de cellules complexes qui ne sont sensibles qu lorientation de larte. Les troisime et quatrime couches constituent les deux couches de cellules hypercomplexes. Les deux couches sont des tages de comptition/coopration qui diminuent le bruit prs des artes et indiquent la prsence dune arte indpendamment de sa direction ou de son orientation. dune cellule de Grossberg-Todorovic (Grossberg, et al., 1988) qui est construite partir dune combinaison pondre de ltres orients simulant des Diffrences de Gaussiennes (plus de

Section 4.2

Dtection des variations brusques dclairement

91

dtails la sous-section 4.2.3). La fonction dactivation de la cellule simple en est une de rectication qui ne peut produire quune valeur de sortie positive ou nulle. 2. Cellules complexes : Le second tage du dtecteur est compos de cellules complexes qui produisent une dtection insensible la direction du contraste. Pour ce faire, chaque cellule complexe est connecte aux deux cellules simples de mme orientation et de mme rsolution spatiale mais de direction de contraste oppose. Les sorties de chacune des deux cellules simples sont alors additionnes et la cellule complexe est active lorsquune des deux cellules simples lest. chaque pixel de limage, on a une cellule complexe pour chacune des 4 orientations et pour chacune des 2 chelles spatiales, soit la moiti du nombre de cellules simples. 3. Cellules hyper-complexes : Les cellules hypercomplexes forment les deux derniers tages du dtecteur. Ce sont deux tages de comptition qui servent supprimer le bruit prs des artes alors que le bruit loin des artes est attnu grce leffet moyenneur des cellules simples et complexes. Le premier tage de comptition contribue spciquement la diminution du bruit prs des artes. Cet tage est un rseau de type centre excitateur - voisinage inhibiteur. Les cellules hyper-complexes au voisinage dune cellule complexe sont connectes par des liens de poids positif (liens dexcitation) si les cellules sont dans laxe dorientation de la cellule complexe et en plus, sont elles-mme orientes dans la mme direction que la cellule complexe. Toutes les autres cellules hyper-complexes dans le voisinage de la cellule complexe sont connectes cette dernire par des liens de poids ngatifs

92

Dtection des artes dune image

Chapitre 4

(liens dinhibition). Les dimensions du voisinage sont choisies en fonction des chelles spatiales utilises. Cet tage de comptition renforce les artes connectes, et donc les contours, et inhibe les artes isoles qui sont habituellement des artes bruites. Le second tage de comptition est simplement un rseau de type le gagnant emporte tout qui slectionne lactivit maximale chaque position de pixel. Les cellules hyper-complexes du dernier tage du dtecteur indiquent donc pour chaque position de pixel la prsence dune arte, quelque soit son orientation ou sa direction. 4. Interactions entre les deux chelles spatiales : Les cellules hyper-complexes possdent des champs rcepteurs dont les dimensions dpendent de lchelle spatiale. Les cellules hyper-complexes chelles nes suppriment le bruit prs des artes et indiquent prcisment la localisation des artes. Les cellules hypercomplexes chelle grossire suppriment bien le bruit loin des artes mais nindiquent pas prcisment la localisation des artes. Une combinaison de ces deux cellules permet dliminer encore plus le bruit prs et loin des artes. 5. Compltion du contour : Une dernire couche de cellules, appeles cellules bipolaires et non illustre la gure 4.3, permet de complter le contour. Ces cellules sont actives sil y a assez dactivation oriente de chaque ct (ou ple) du centre du champ rcepteur. Le modle de Grossberg est intressant parce quassez prs du modle biologique tel que nous le connaissons. Par contre, lopration du rseau complet dpend normment de facteurs quil faut xer assez intuitivement et le rseau lui-mme ncessite une quantit trs considrable de neurones et de connexions, ce qui provoque de nombreux problmes lors des simulations sur ordinateurs classiques.

Section 4.2

Dtection des variations brusques dclairement

93

De nombreuses applications ne ncessitent pas une dtection dartes orientes aussi prcise et complique que celle prconise par lquipe de Grossberg. Dans ces cas, un simple masque orient (par exemple, Sobel ou une drive de gaussienne (Wilson, & Bhalerao, 1992)) est convolu avec limage an de dcouvrir les artes sur limage une orientation donne. La description des artes orientes contenues dans limage analyser peut alors tre utilise, par exemple, pour caractriser et classier une image texture (Lepage, Laurendeau, & Gagnon, 1992) ou pour servir dentre un processus danalyse de limage de plus grande complexit tel un analyseur de Fourier (Freeman, & Adelson, 1990). Une autre application (Brzakovic, Patton, & Wang, 1991) utilise des masques orients pour trouver des artes candidates tandis que les artes rsultantes sont choisies selon des rgles heuristiques.

4.2.2 Maximum de la drive premire isotrope


La dtection dartes par une mesure du maximum de la drive premire isotrope consiste dtecter la prsence dune arte par une seule mesure indpendante de la direction de larte. Lamplitude du gradient local est gnralement utilise comme paramtre mesur. Cette mthode permet une ralisation simple du circuit de dtection mais noffre pas la robustesse de la mthode du maximum de la drive premire directionnelle lorsquutilise seule. La mthode de mesure du gradient utilise seule noffre pas une localisation prcise de larte et est plus susceptible de dtecter de fausses artes parce que cest une mthode de dtection ponctuelle qui ne tient pas compte des artes dtectes dans le voisinage. Le dtecteur dartes propos dans ce document (Lepage, & Poussart, 1991; Lepage, & Poussart, 1992) utilise cette mthode de dtection surtout cause de la simplicit du rseau neuronique rsultant. Lamincissement des artes de mme que la diminution du nombre de fausses artes sont obtenus grce une reprsentation multirsolution des images dclairement gauche et droite et une interaction entre les artes dtectes aux diffrentes chelles spatiales, comme il sera prcis la section suivante. Dautres auteurs proposent des mthodes qui vont dans le mme sens : (Chen, 1992) propose un oprateur morphologique qui prserve les artes lors dun changement de lchelle spatiale danalyse; (Fleck, 1992) mesure la drive par une diffrence nie et amliore la dtection en combinant des mesures de diffrence nie de diffrentes largeurs; et (McMichael, 1992) pour sa part, mesure le gradient de plusieurs images dune scne claire de diffrentes faons et combine ces mesures, ce qui attnue leffet de lombrage et renforce la dtection des artes de limage causes par des primitives de la scne.

94

Dtection des artes dune image

Chapitre 4

4.2.3 Passage par zro de la drive seconde directionnelle


La dtection dartes par une mesure du passage par zro de la drive seconde de limage calcule dans une direction spcie est une mthode de dtection qui a fait lobjet de relativement peu de recherche. Ce manque dintrt provient en grande partie de la popularit et de lefcacit des mthodes de dtection du passage par zro de la drive seconde non-directionnelle que nous tudions la sous-section suivante. Les mthodes non-directionnelles rsultent en un rseau neuronique de dtection plus simple et linaire, ce qui nest pas le cas pour une mesure de la drive seconde directionnelle. De plus, lutilisation de la drive seconde gnre intrinsquement plus de bruit que pour lutilisation de la drive premire. Quelques auteurs ont nanmoins explor cette avenue, parmi lesquels nous pouvons mentionner (Clark, & Lawrence, 1984)

4.2.4 Passage par zro de la drive seconde isotrope


La dtection dartes par une mesure du passage par zro de la drive seconde de limage calcule indpendamment de la direction est une mthode de dtection qui fait lobjet dune recherche diversie et qui suscite encore aujourdhui normment dintrt (Narbel, 1990; Ulupinar, & Medioni, 1990). Cet engouement pour cette mthode provient du fait quil existe un oprateur linaire simple du second ordre qui dtecte une variation brusque de lclairement indpendamment de la direction de la variation dclairement. Cet oprateur se nomme le Laplacien et opre sur un voisinage restreint du pixel dintrt. Lintrt pour cette mthode provient aussi du fait que loprateur de Laplacien peut facilement tre combin avec un ltre passe-bas gaussien et ainsi rendre la dtection dartes sensible lchelle spatiale. Un dernier avantage apprci de cette mthode est quelle permet, en principe, une localisation intra-pixel prcise de larte puisque cest un passage par zro de limage convolue qui indique la prsence dune arte et que ce passage peut tre interpol partir des valeurs positive et ngative mesures. La mthode de dtection du passage par zro de la drive seconde isotrope est issue principalement des travaux de Marr et Hildreth (Hildreth, 1983; Marr, & Hildreth, 1980). Le dtecteur de Marr-Hildreth, comme il est habituellement appel, sinspire des connaissances physiologiques du systme visuel des mammifres : on croit que les contrastes de limage rtinienne certaines chelles spatiales sont dabord accentus par un oprateur neuronique semblable celui propos par Marr et Hildreth et que les passages par zro de limage rsul-

Section 4.2

Dtection des variations brusques dclairement

95

tante de mme que leur orientation sont ensuite dtects pour former le croquis. Voyons plus en dtail loprateur de Marr-Hildreth. Les changements dclairement dans une image dclairement interviennent diffrentes chelles spatiales. Leur dtection optimale ncessite donc lutilisation doprateurs de diffrentes largeurs. Le ltre passe-bas gaussien est un oprateur qui permet danalyser, de voir limage diffrentes rsolutions spatiales. Cest ainsi quun ltre gaussien bande passante troite brouille limage de telle sorte que seuls les changements grossiers ( grande chelle) ressortent de limage ltre. Le ltre gaussien scrit :
1 -------------------- e 22 G ( x, y ) = -----------2 2 ( x2 + y2 )

(4.3)

Le paramtre indique le niveau de rsolution auquel limage est observe. Limage la rsolution est donc : I ( x, y ) = G ( x, y ) * I ( x, y ) (4.4)

Les artes sont ensuite trouves sur limage ltre laide du Laplacien, qui est un oprateur diffrentiel isotrope de second ordre, le plus petit ordre qui assure que loprateur soit linaire. Le Laplacien scrit : 0 1 0 2 2 1 4 1 + x2 y2 0 1 0

2 =

(4.5)

Lisotropie assure quune arte, cest--dire une variation brusque dclairement, soit dtecte quelle que soit son orientation dans limage. Limage rsultante est alors la convolution du Laplacien et de limage ltre : I sortie ( x, y ) = 2( G ( x, y ) * I ( x, y ) ) (4.6)

Puisque les deux ltres, le Laplacien 2 et le ltre gaussien G, sont linaires et invariants, ils peuvent tre combins en un seul oprateur, le Laplacien de

96

Dtection des artes dune image

Chapitre 4

gaussienne appel aussi chapeau mexicain cause de la forme de loprateur : 2G


1 2 r 2 -------- 2 ----- e 2 ( r ) = -----------2 4 2 r 2

(4.7)

avec r = x 2 + y 2 la distance radiale. La gure 4.4 illustre la forme (inverse) de loprateur de Laplacien de gaussienne. La largeur w de la portion ngative de loprateur est donne par : w = 2 2 (4.8)

La largeur du lobe central de loprateur est donc proportionnelle lchelle spatiale dobservation . (Grimson, 1981)propose 4 canaux diffrents spars chacun du prcdent dune octave pour lanalyse des artes de deux images stro dentre. Les canaux utiliss ont des largeurs du lobe central w de 4, 9, 17 et 35 pixels, ce qui correspondrait aux canaux danalyse du systme visuel humain (Wilson, & Bergen, 1979).

w Figure 4.4 Laplacien de gaussienne. Oprateur chapeau mexicain qui dtecte les variations dclairement en toute direction. Loprateur de Marr-Hildreth est illustr ici pour un facteur dchelle spatiale = 2.

Section 4.2

Dtection des variations brusques dclairement

97

Selon Marr et Hildreth, le Laplacien de gaussienne est la limite dune diffrence de gaussiennes DdG : 1 -e 2 G ( r ) DdG ( e, i ) = ---------------2 e
r 2 -------2 2 e

1 -e --------------2 i

r 2 -------2 i2

(4.9)

o e = reprsente la variance dexcitation (ltre gaussien positif) tandis que i reprsente la variance dinhibition (ltre gaussien ngatif). Lquation 4.9 approxime un Laplacien de gaussienne par une diffrence de deux distributions gaussiennes lorsque : i ----= 1, 6 e (4.10)

Les cellules ganglionnaires, qui constituent le premier tage de traitement du systme visuel chez les mammifres, ont un champ rcepteur qui ressemble beaucoup une diffrence de gaussiennes : le champ rcepteur excitateur est une gaussienne de variance e alors que le champ rcepteur inhibiteur est une gaussienne plus large dans une proportion qui laisse croire que la fonction de ces cellules est effectivement dappliquer lquivalent dun Laplacien de gaussienne sur limage rtinienne an daccentuer les contrastes contenus dans limage. La dtection des artes dune image est illustre la gure 4.5 o une cellule de type on-center (cellule P) est utilise en conjonction avec une cellule de type off-center (cellule Q). Ce principe de dtection peut facilement tre tendu la dtection dartes orientes de longueurs variables, comme il est illustr la gure 4.6.

4.2.5 Dtection des artes par apprentissage supervis


Les artes correspondent des variations brusques dclairement. De telles variations sont dtectes avec un oprateur de diffrentiation du premier ou du second ordre, oprateur qui sera le plus souvent combin avec un ltre passebas an de diminuer les artefacts gnrs par lopration de diffrentiation. La traduction neuronique de ces oprateurs rsulte en des connexions qui relient la couche image la couche du croquis avec des poids xes. Des recherches rcentes explorent diffrentes formes dapprentissage an de trouver dautres valeurs

98

Dtection des artes dune image

Chapitre 4

Figure 4.5

Diffrence de gaussiennes. Dtection dartes par deux oprateurs de diffrence de gaussiennes. Chaque cellule de dtection comprend un champ rcepteur dexcitation (cercle central) et un champ rcepteur dinhibition (cercle extrieur). P et Q sont deux cellules complmentaires qui produisent une sortie inverse lune par rapport lautre. La sortie de la cellule ET est active lorsque les deux cellules P et Q sont actives et donc quune arte est situe entre les deux cellules.

de poids des connexions qui parviennent la couche du croquis. Moura et Martins (Moura, & Martins, 1991) utilisent un rseau 3 tages. Les deux premiers tages sont interrelis par des liens poids xes qui ralisent un ltre passe-bas gaussien pour le premier tage et un masque de Sobel pour le second an de dtecter lamplitude et la direction du gradient. Le dernier tage en est un de satisfaction de contraintes pour liminer le bruit et construit des liens excitateurs entre des neurones voisins orients perpendiculairement au gradient et des liens inhibiteurs entre des neurones voisins orients paralllement au gradient. Bhathia (Bhatia, Srinivasan, & Ong, 1991) proposent, la mme poque, un rseau un seul tage, ltage du croquis, reli la couche de limage dclairement. Chaque emplacement du croquis est occup par quatre neurones, qui indiquent lclairement moyenne de mme que la force et la direction de lventuelle arte dtecte. Chaque groupe de 4 neurones du croquis sont interrelis par des liens inhibiteurs pour augmenter la comptition et chaque groupe est reli un champ rcepteur de 16x16 pixels en dessous, sur limage dclairement. Deux sries de connexions composent le champ rcepteur, une premire poids xes ralise un ltre gaussien et lautre srie doit tre entrane de faon non-supervise laide dune rgle hebbienne modie. Limage uti-

Section 4.2

Dtection des variations brusques dclairement

99

Figure 4.6

Diffrence de gaussiennes oriente. Dtection dartes orientes par des oprateurs aligns et complmentaires de diffrence de gaussienne. La sortie de la cellule ET est active lorsque toutes les cellules connectes la porte sont actives. La conguration des oprateurs dtermine la plage dorientations qui est dtecte (lignes pointilles sur la gure).

lise pour la phase dentranement est constitue de cercles concentriques pour avoir un bon chantillonnage dartes de force et dorientations varies. Par la suite, Etemad et Chellappa (Etemad, & Chellappa, 1993) proposent un rseau neuronique approximateur de fonctions et entran par rtro-propagation du gradient derreur pour rsoudre le problme de dtection dartes. Le rseau propos comporte une couche dentre de 3x3 qui balaie limage dclairement, dune couche cache et dune couche de sortie galement de 3x3 qui reprsente larte dtecte dbarrasse du bruit. Un ingnieux systme de vote entre les couches de sortie voisines permet de diminuer le bruit et les artefacts. Mkaouar et Lepage (Mkaouar, & Lepage, 1996) proposent le mme type de rseau rtro-propagation du gradient derreur, mais cette fois en utilisant une couche dentre de 5x5, 2 couches caches, et un seul neurone la sortie pour indiquer la prsence ou labsence dune arte au centre de la couche dentre. Les rsultats sont encourageants et des travaux se poursuivent pour interprter les congurations de poids obtenues et amliorer les performances en diminuant le temps ncessaire pour lapprentissage.

100

Dtection des artes dune image

Chapitre 4

4.2.6 Dtection multirsolution des artes par rseau neuronique


Les ralisations neuroniques de dtecteurs dartes multirsolution ne font pas lobjet de recherche rpandue probablement cause de la complexit des modes de reprsentation de linformation visuelle multirsolution. (Lepage, & Crevier, 1994) proposent une extraction multirsolution des artes base sur une reprsentation pyramidale et utilisant une neurone de vigilance chaque niveau de la pyramide pour contrler le renforcement des artes dans une direction basse haute rsolution. (Mkaouar, & Lepage, 1995) proposent une extraction multirsolution des artes en utilisant une pyramide pour acclrer les simulations et un ltre gaussien rcursif pour la gnration des niveaux de reprsentation multirsolution. Ce modle leur sert de base pour gnrer la base dapprentissage dans (Mkaouar, et al., 1996).

4.3 DTECTION NEURONIQUE DE LAMPLITUDE DU GRADIENT


Nous illustrons en dtail dans ce document une dtection dartes base sur la mesure du maximum de la drive premire de limage dclairement. An de diminuer le nombre dartes bruites dtectes et an damincir les artes dtectes, la dtection dartes est effectue plusieurs rsolutions spatiales et une interaction entre les artes dtectes aux diffrentes chelles aide obtenir un croquis prcis et peu bruit. Les images dclairement gauche et droite sont dcomposes en reprsentations multirsolutions selon une structure pyramidale. Chaque niveau de la pyramide reprsente limage dclairement correspondante une rsolution spatiale . Les artes de limage sont dabord dtectes chacun des niveaux des deux pyramides. An de dtecter le gradient de larte en chaque position de pixel de chacune des images, la drive partielle selon lhorizontale et la drive partielle selon la verticale sont calcules laide de connexions latrales dans le voisinage 3x3 du pixel dintrt. Des masques de Sobel sont utiliss pour la mesure des drives partielles. Le champ rcepteur pour la mesure des drives partielles est illustr la gure 4.7. La sortie du neurone au pixel dintrt est gal la somme de la valeur absolue des deux drives partielles, ce qui constitue une approximation de lamplitude du gradient cette position. Cette approximation savre sufsante pour les besoins de notre dtecteur puisquelle sera toujours positive, comme lamplitude, et quelle sera toujours plus grande

Section 4.4

Amincissement des artes

101

Gradient:

dx sortie = |dx| + |dy| Figure 4.7

dy

Champ rcepteur de gradient. Champ rcepteur pour la mesure dune approximation du gradient. Les masques sont des masques de Sobel. Un cercle noir indique une connexion avec un poids ngatif dont lamplitude est proportionnelle la grandeur du cercle.

que la valeur de lamplitude, et donc quelle accentuera la prsence dune arte. Les masques de Sobel utiliss ont comme valeurs de poids : 1 0 1 dx = 2 0 2 1 0 1 1 2 1 0 0 0 1 2 1

dy =

(4.11)

Les artes dtectes par une mthode de gradient sont la plupart du temps trop larges pour permettre une localisation prcise de celle-ci. Le module suivant de traitement, le module stro, ncessite une localisation prcise des artes apparies an dobtenir une mesure able et prcise de la disparit. Nous devons donc amincir les artes dtectes de telle sorte quun neurone activ reprsente une arte, et donc un maximum de la drive premire.

4.4 AMINCISSEMENT DES ARTES


Lamincissement des artes peut tre ralis de diffrentes faons (Jang, et al., 1990; Lam, Lee, & Suen, 1992). Nous proposons un simple rseau de comptition qui favorise les neurones les plus activs dans le groupe de comptition.

102

Dtection des artes dune image

Chapitre 4

Un rseau de comptition est construit pour tous les groupes de 2x2 neurones de toutes les couches des deux pyramides gauche et droite. Le rseau de comptition est illustr la gure 4.8 pour un groupe de 4 neurones. Le poids niveau n

Rseau de comptition. Chaque regroupement de 2x2 neurones est interconnect en rseau de comptition. La gure ne montre les connexions que pour un des neurones. Le mme schma se rpte pour les autres neurones. Le lien dexcitation a un poids de 0,3 tandis que les liens dinhibition provenant des autres neurones ont un poids de -0,1. La fonction dactivation des neurones est la fonction iac de Rumelhart-McClelland. Le circuit fonctionne de telle sorte que les un ou deux neurones les plus activs tendent vers une sortie pleinement active tandis que la sortie des autres neurones dcrot vers zro. des connexions dauto-excitation est de 0,3 tandis que le poids des connexions dinhibition est de -0,11. La fonction dactivation des neurones cette tape de la simulation est la fonction dactivation interactive et comptitive de Rumelhart & McClelland.Lquation dactivation iac est dcrite par lquation diffrentielle : dx = ( B x ) net Ax dx = ( x C ) net Ax net > 0 net 0 (4.12)

Figure 4.8

avec : dx : x(n+1) - x(n). Diffrentielle de la valeur dactivation


1. Plusieurs valeurs de poids pour les liens dinhibition et dexcitation ont t exprimentes. La combinaison mentionne dans le texte est celle qui a donn les meilleurs rsultats tant du point de vue vitesse de convergence vers un tat stable que du point de vue capacit conserver les artes les plus actives. Cette combinaison a t trouv de faon plutt empirique, quoiquun bon fonctionnement du rseau demande que le poids du lien dexcitation soit gal ou suprieur la somme de la valeur absolue des poids dinhibition.

Section 4.5

Renforcement des artes

103

entre linstant prsent n+1 et linstant prcdent n. x : la valeur dactivation au temps n. A : facteur de dcroissance. Paramtre de contre-raction qui fait que le neurone se comporte comme un systme discret du 1er ordre. Le facteur (1-A) dtermine le degr de contreraction. Une valeur de A unitaire indique labsence de contre-raction. B : valeur maximale atteinte par la valeur dactivation. C : valeur minimale atteinte par la valeur dactivation. net :

Wij Oj : valeur nette lentre du neurone.


j

Le comportement du rseau qui rsulte de cette conguration est tel que la sortie des un ou deux neurones les plus activs tend vers une valeur de pleine activation tandis que la sortie des autres neurones dcrot vers la valeur minimum dactivation du neurone, soit zro. Lamincissement des artes assure une localisation prcise des artes mais ne garantit pas que larte dtecte soit gnre par une primitive physique de la scne observe, et non une arte de bruit gnre par la camra ou le systme dchantillonnage. Linformation dtecte aux autres niveaux de la pyramide aide dans la dcision de garder ou de rejeter une arte dtecte.

4.5 RENFORCEMENT DES ARTES


Selon (Marr, 1982), un attribut physique de la scne observe apparat au moins deux chelles spatiales conscutives sur limage. Une arte qui napparat que sur la couche haute rsolution est probablement une arte de bruit et doit donc tre limine du croquis qui sera soumis lappariement stroscopique.

104

Dtection des artes dune image

Chapitre 4

La reprsentation des artes aux diffrents niveaux de rsolution spatiale de la pyramide est illustre la gure 4.9.

Figure 4.9

Comportement des artes multiple rsolutions. Comportement des artes dans une reprsentation pyramidale multirsolution. Les artes qui correspondent des caractristiques physiques de la scne observe sont prsentes au moins deux niveaux conscutifs. Les artes de bruit produites par le systme de camra ou par la nature discrte de lchantillonnage napparaissent quaux niveaux haute rsolution.

La recherche sur le comportement des artes le long de lespace dchelle est abondante et diversie. Lensemble de ces travaux a comme objectif didentier une arte sur une image faible rsolution et de projeter cette arte sur limage haute rsolution an de la localiser avec prcision. (Bergholm, 1987), dans un papier majeur pour la poursuite dartes travers lespace dchelles, propose une poursuite continue dune arte partir dune chelle rsolution grossire. Le changement dchelle est continu et la variation du facteur dchelle est telle que la position de larte poursuivie ne change pas plus dun seul pixel. Lu et Jain (Lu, & Jain, 1989; Lu, & Jain, 1992) dcrivent le comportement des artes le long de lchelle spatiale. Ils dtaillent le comportement de deux artes voisines qui peuvent se disloquer, se fusionner ou disparatre. (Mallat, & Zhong, 1992), pour leur part, tudient le comportement dun dtecteur de Canny travers lespace dchelles spatiales. Un dtecteur de Canny est quivalent trouver les maxima locaux dune transforme dondelettes. Larticle est une tude des proprits des artes multirsolutions travers la

Section 4.5

Renforcement des artes

105

thorie des ondelettes. Finalement, (Ziou, & Tabbone, 1991) dune part, puis (Perl, & Marsland, 1992) utilisent seulement deux chelles spatiales pour la poursuite des artes travers lespace dchelles. La recherche des artes multiples rsolutions spatiales prsuppose quaucune nouvelle arte nest gnre mesure que la rsolution est baisse. Le choix du ltre gaussien pour la gnration de la reprsentation multirsolution assure quil ny aura pas de nouvelles artes. De plus, loprateur de dtection des artes doit tre un oprateur de diffrentiation linaire, par exemple le passage par zro du laplacien, qui est un oprateur de drive seconde nondirectionnelle, et le maximum de la drive premire (Tihanyi, & Barron, 1990). Cette contrainte exclut explicitement le dtecteur de Canny, qui est un oprateur directionnel et non-linaire. Loprateur utilis pour les travaux de cette thse est la somme de lamplitude absolue des drives partielles selon lhorizontale et la verticale. Loprateur de valeur absolue, qui nest pas linaire, ne sert qu estimer lamplitude de la drive premire de limage. Lopration de dtection des artes par approximation de lamplitude du gradient remplit donc la condition de non-gnration dartes mesure que la rsolution diminue puisque ce sont les drives partielles de limage ltre qui sont calcules, des oprations de diffrentiation qui sont linaires. Nous utilisons, pour le renforcement des artes, les quatre chelles spatiales utilises pour la reprsentation multirsolution de chaque image dclairement gauche et droite. un niveau de rsolution spatiale donn, une arte est conserve (renforcement) si cette dernire est prsente au niveau de la pyramide juste au dessus (et donc de rsolution moindre). Larte doit tre carte, particulirement si elle se trouve au niveau de plus haute rsolution, si elle nest pas prsente au niveau au dessus : dans ce cas, on nest vraisemblablement pas en prsence dune arte cause par une primitive physique de la scne observe. Le renforcement dartes selon leur prsence aux niveaux de plus basse rsolution est ralis selon la rgle dapprentissage de renforcement, soit en modiant les poids du circuit damincissement dcrit la section prcdente selon que le neurone au niveau juste au dessus est activ ou non. Le processus de renforcement dartes est illustr la gure 4.10. Le renforcement dartes est ralis en modulant les poids du circuit damincissement par la valeur de sortie du neurone situ juste au dessus, au niveau suivant de moindre rsolution de la pyramide. Si ce neurone est activ, indiquant que larte se retrouve ce niveau de rsolution, le rseau damincissement opre normalement et son comportement dynamique est tel que dcrit la section prcdente. Les liens partant du neurone au niveau n+1 et qui modulent les poids du circuit de comptition ont un poids de 5. Si le neurone au niveau au dessus nest pas ou est peu activ, indiquant labsence

106

Dtection des artes dune image

Chapitre 4

niveau n+1

niveau n

Figure 4.10 Renforcement des artes. Le circuit damincissement dartes opre normalement si le neurone au niveau de rsolution juste au dessus est activ, indiquant la prsence de larte ce niveau de rsolution moindre. Si larte dtecte napparait pas au niveau au dessus, elle est considre comme une arte de bruit et le poids de toutes les connexions du circuit de comptition tend vers zro, entranant que lactivit des 4 neurones du groupe tendra vers zro, effaant larte de bruit dtecte. dartes cet endroit, les poids du circuit de comptition en dessous ont une valeur tendant vers zro, ce qui entrane que lactivit des 4 neurones du groupe dcrot vers zro, effaant ainsi la prsence dune arte de bruit.

4.6 RSULTATS EXPRIMENTAUX


Le rseau de dtection dartes fut dabord test sur une image passablement complexe qui est largement utilise dans la littrature pour vrier et comparer les rsultats de divers algorithmes de traitement dimage. Limage Lenna est illustre la gure 4.11. La premire tape de dtection latrale des artes chaque niveau de la pyramide est illustre la gure 4.12. Le croquis ainsi gnr nest le rsultat que de la dtection latrale des artes, cest--dire que la sortie de chaque neurone est une approximation de lamplitude du gradient cet emplacement. Les drives partielles selon x et y ncessaires au calcul du gradient sont approximes par des champs rcepteurs ayant la forme de masque de

Section 4.6

Rsultats exprimentaux

107

Figure 4.11 Image de Lenna. Image pour illustrer lalgorithme neuronique de dtection dartes. Sobel. Durant les tapes subsquentes de lalgorithme, les artes sont amincies grce aux rseaux de comptition 2x2 et sont renforces lorsque larte est prsente au niveau juste au dessus, et encore plus si larte est prsente plus dun niveau au dessus dans la pyramide. Le rsultat de lamincissement et du renforcement apparat la gure 4.13, o le croquis pleine rsolution aminci et ren-

Figure 4.13 Amincissement et renforcement des artes. Le rsultat de la dtection latrale dartes, gauche, est compar au rsultat du renforcement et de lamincissement aprs deux tops dhorloge. forc aprs deux tops dhorloge est compar au croquis pleine rsolution rsultant de la dtection latrale seulement. Les artes correspondant aux attributs physiques de la scne originale ont t conserves tandis que celles correspondant des dtails non-signicatifs ou produites par lerreur de quantication dans la production de limage ont t limines.

108

Dtection des artes dune image

Chapitre 4

= 2 3

= 3

= 3 / 2 = 0 (pleine rsolution) Figure 4.12 Croquis multirsolution de limage Lenna. Croquis de limage Lenna aux 4 niveaux de rsolution de la pyramide. Aucun amincissement ni renforcement ne sont appliqus.

CONCLUSION
La dtection des artes constitue la premire tape du systme de vision et produit le croquis, la premire forme de reprsentation interne de donnes du systme. Nous nous sommes dabord interrog sur la nature des artes dans une image et leur relation avec des attributs physiques de la scne observe dont nous tudions une reprsentation par image dclairement produite par une camra. Nous avons ensuite procd une analyse des mthodes classiques de dtection dartes. Puis, nous avons dcrit la mthode de dtection propose dans ce document, soit une technique neuronique multirsolution qui utilise

Section 4.6

Conclusion

109

linformation prsente plusieurs niveaux de rsolution spatiale an den arriver la construction dun croquis prcis qui reprsente les primitives physiques de la scne sous observation. Le croquis est la premire forme de reprsentation interne du systme de vision. Cette reprsentation interne sert dentre des algorithmes tel la stroscopie et lanalyse du mouvement. Ces algorithmes ncessitent une localisation prcise des artes de chacune des images gauche et droite et produisent lesquisse, une forme de reprsentation interne qui mesure la profondeur de la scne aux diffrents points caractristiques de cette dernire.

110

Dtection des artes dune image

Chapitre 4

RFRENCES
Ballard, D. H. (1981). Generalizing the Hough transform to detect arbitrary shapes. Pattern Recognition, 13(2), 111-122. Barr, A., Cohen, P. R., & Feigenbaum, E. A. (Ed.). (1989). The Handbook of Articial Intelligence . Reading, Mass.: Addison-Wesley. Basseville, M. (1979). Dtection de contours: mthodes et tudes comparatives. Ann. Tlcommunic., 34(11-12), 559-579. Bergholm, F. (1987). Edge Focusing. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-9(6), 726-741. Besanon, J. E. (1988). Vision par ordinateur en deux et trois dimensions . Paris: Eyrolles. Bhatia, P., Srinivasan, V., & Ong, S. H. (1991). Single-layer edge detector with competitive unsupervised learning. Proceedings of the International Joint Conference on Neural Networks, Singapore, 1, 634-639. Boyer, K. L., & Sarkar, S. (1992). Assessing the State of the Art in Edge Detection: 1992. Proceedings of the SPIE Applications of Articial Intelligence X: Machine Vision and Robotics, Orlando, Florida, 22-24 april, 1708, 353-362. Brzakovic, D., Patton, R., & Wang, R. L. (1991). Rule-Based Multitemplate Edge Detector. Computer Vision, Graphics and Image Processing: Graphical Models and Image Processing, 53(3), 258-268. Canny, J. (1986). A Computational Approach to Edge Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-8(6), 679-698. Carpenter, G. A., Grossberg, S., & Mehanian, C. (1989). Invariant Recognition of Cluttered Scenes by a Self-Organizing ART Architecture: CORT-X Boundary Segmentation. Neural Networks, 2, 169-181.

Section 4.6

Rfrences

111

Chen, J.-S. (1992). Generalized Adaptive Smoothing for multiscale edge detection. Proceedings of the SPIE Applications of Articial Intelligence X: Machine Vision and Robotics, Orlando, Florida, 22-24 april, 1708, 341-352. Chen, M.-H., & Yan, P.-F. (1989). A Multiscaling Approach Based on Morphological Filtering. IEEE Transactions on Pattern Analysis and Machine Intelligence, 11(7), 694-700. Clark, J. J., & Lawrence, P. D. (1984). A Hierarchical Image Analysis System Based Upon Oriented Zero Crossings of Bandpassed Images. In A. Rosenfeld (Ed.), Multiresolution Image Processing and Analysis (pp. 148168). New York: Springer-Verlag. Cohen, P. R., & Feigenbaum, E. A. (Ed.). (1982). The Handbook of Articial Intelligence . Reading, Mass.: Addison-Wesley. Daugman, J. G. (1987). Image Analysis and Compact Coding by Oriented 2D Gabor Primitives. Proceedings of the SPIE: Image Understanding and the Man-Machine Interface, 758, 19-30. Etemad, K., & Chellappa, R. (1993). A Neural Network Based Edge Detector. Proceedings of the IEEE Internatinal Conference on Neural Networks, San Francisco, CA, March 28 - April 1, 1, 132-137. Fleck, M. M. (1992). Multiple Widths Yield Reliable Finite Differences. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(4), 412-429. Freeman, W. T., & Adelson, E. H. (1990). Steerable Filters for Early Vision, Image Analysis, and Wavelet Decomposition. Proceedings of the 3rd ICCV90: Third International Conference on Computer Vision, Osaka, Japan, Dec. 4-7, 406-415. Gaussier, P., & Cocquerez, J.-P. (1992). Neural networks for complex scene recognition: simulation of a visual system with several cortical areas. Proceedings of the IJCNN '92 Baltimore - International Joint Conference on Neural Networks, Baltimore, Maryland, June 7-11, III, III-233 - III-259. Gonzalez, R. C., & Wintz, P. (1977). Digital Image Processing . London: Addison-Wesley.

112

Dtection des artes dune image

Chapitre 4

Grimson, W. E. L. (1981). From Images to Surfaces - A Computational Study of the Human Early Visual System . Cambridge, Mass.: The MIT Press. Grossberg, S., & Mingolla, E. (1985). Neural dynamics of perceptual grouping: Textures, boundaries, and emergent segmentations. Perception and Psychophysics, 38(2), 141-171. Grossberg, S., & Todorovic, D. (1988). Neural dynamics of 1-D and 2-D brightness perception: A unied model of classical and recent phenomena. Perception and Psychophysics, 43, 241-277. Grossberg, S., & Wyse, L. (1991). Invariant Recognition of Cluttered Scenes by a Self-Organizing ART Architecture: Figure-Ground Separation. Proceedings of the IEEE INNS International Joint Conference on Neural Networks - Seattle, Seattle, Washington, July 8-12, 1, I-633 - I-638. Hildreth, E. C. (1983). The Detection of Intensity Changes by Computer and Biological Vision Systems. Computer Vision, Graphics, and Image Processing, 22, 1-27. Hubel, D. H., & Wiesel, T. N. (1959). Receptive elds of single neurones in the cat's striate cortex. Journal of Physiology, 148, 574-591. Jain, A. K. (1989). Fundamentals of Digital Image Processing . Englewood Cliffs, NJ: Prentice Hall. Jang, B.-K., & Chin, R. T. (1990). Analysis of Thinning Algorithms Using Mathematical Morphology. IEEE Transactions on Pattern Analysis and Machine Intelligence, 12(6), 541-551. Lam, L., Lee, S.-W., & Suen, C. Y. (1992). Thinning Methodologies - A Comprehensive Survey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(9), 869-885. Lepage, R., & Crevier, D. (1994). Multiresolution neural network for the extraction of the primal sketch. Proceedings of the SPIE Intelligent Robots and Computer Vision XIII: Algorithms and Computer Vision, Boston, Massachusetts, 31 October - 2 November, 2353, 375-384.

Section 4.6

Rfrences

113

Lepage, R., Laurendeau, D., & Gagnon, R. (1992). Extraction of texture features with a multiresolution neural network. Proceedings of the SPIE: Applications of Articial Neural Networks III, Orlando, Florida, 21-24 april, 1709, 64-75. Lepage, R., & Poussart, D. (1991). A Neural Network for Multiresolution Edge Detection. Proceedings of the Canadian Conference on Electrical and Computer Engineering, Qubec (Qubec) Canada, September 25-27, 1, 25.1.1 - 25.1.4. Lepage, R., & Poussart, D. (1992). Multiresolution Edge Detection. Proceedings of the IJCNN '92 Baltimore - International Joint Conference on Neural Networks, Baltimore, Maryland, June 7-11, IV, IV-438 - IV-443. Levine, M. D. (1985). Vision in man and machine . New York: McGraw-Hill. Lu, Y., & Jain, R. C. (1989). Behavior of Edges in Scale Space. IEEE Transactions on Pattern Analysis and Machine Intelligence, 11(4), 337-356. Lu, Y., & Jain, R. C. (1992). Reasoning about Edges in Scale Space. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(4), 450-468. Mallat, S., & Zhong, S. (1992). Characterization of Signals from Multiscale Edges. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(7), 710-732. Marr, D. (1982). Vision - A Computational Investigation into the Human Representation and Processing of Visual Information . San Francisco: Freeman. Marr, D., & Hildreth, E. (1980). Theory of edge detection. Proceedings of the Royal Society of London, Series B, 207, 187-217. McMichael, D. (1992). Fusing Multiple Images and Extracting Features for Visual Inspection (No. 762). Control Systems Centre, UMIST, Manchester, UK. Mkaouar, M., & Lepage, R. (1995). Extraction des caractristiques d'une image par analyse multiple rsolutions spatiales. Proceedings of the Congrs canadien en gnie lectrique et informatique, Montral, Qubec, du 5 au 8 septembre, 1176-1179.

114

Dtection des artes dune image

Chapitre 4

Mkaouar, M., & Lepage, R. (1996). Le Perceptron multi-couches pour la dtection des artes d'une image. Proceedings of the Vision Interface '96, Toronto (Ontario) Canada, 21-24 mai, 41-48. Moran, C. J. (1990). A Morphological Transformation for Sharpening Edges of Features before Segmentation. Computer Vision, Graphics, and Image Processing, 49, 85-94. Moura, L., & Martins, F. C. M. (1991). Edge Detection Through Cooperation and Competition. Proceedings of the International Joint Conference on Neural Networks, Singapore, 3, 2588-2593. Narbel, P. (1990). The zero-crossings of the Laplacian of Gaussian and their limitations (No. 90.05). Geneva University. Perl, D., & Marsland, T. A. (1992). An adaptive neural network for image enhancement (ANNIE). Proceedings of the SPIE: Applications of Articial Neural Networks III, Orlando, Florida, 21-24 april, 1709, 76-86. Princen, J., Illingworth, J., & Kittler, J. (1990). A Hierarchical Approach to Line Extraction Based on the Hough Transform. Computer Vision, Graphics, and Image Processing, 52, 57-77. Shu, J. S.-P. (1989). One-pixel edge detection. Pattern Recognition, 22(6), 665673. Tan, H. L., Gelfand, S. B., & Delp, E. J. (1992). A Cost Minimization Approach to Edge Detection Using Simulated Annealing. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(1), 3-18. Tihanyi, E. Z., & Barron, J. L. (1990). Spatio-Temporal Edge Focusing (No. 267). Department of Computer Science, the University of Western Ontario, London, Ontario. Torre, V., & Poggio, T. A. (1986). On Edge Detection. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-8(2), 147-163. Ulupinar, F., & Medioni, G. (1990). Rening Edges Detected by a LoG Operator. Computer Vision, Graphics, and Image Processing, 51, 275-298.

Section 4.6

Rfrences

115

Wilson, H. R., & Bergen, J. R. (1979). A four mechanism model for spatial vision. Vision Research, 19, 19-32. Wilson, R., & Bhalerao, A. H. (1992). Kernel Designs for Efcient Multiresolution Edge Detection and Orientation Estimation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 14(3), 384-390. Ziou, D., & Tabbone, S. (1991). Fusion des contours dans un espace chelle. Proceedings of the Treizime Colloque sur le Traitement du Signal et des Images, Juan-les-Pins, 2, 1013 - 1016. Zucker, S. W., David, C., Dobbins, A., & Iverson, L. (1988). The Organization of Curve Detection: Coarse tangent elds and ne spline coverings. Proceedings of the Second International Conference on Computer Vision, Tampa, Florida, December 5-8, 568-577.

116

Dtection des artes dune image

Chapitre 4