Tipe-Cao Tien Dung PDF

Institut de la Francophonie pour lInformatique
Rapport final du Travail dIntrt

Personnel Encadr (TIPE)

Le sujet : Vido Surveillance

Superviseurs : M. Alain Boucher (IFI)
M. Thomas Martin (MICA)

Etudiant : Cao Tien Dung Promotion 11

Hanoi, Janvier 2007
Rapport final du Travail dIntrt Personnel Encadr Vido Surveillance

REMERCIEMENTS

Merci bien monsieur Alain Boucher et monsieur Thomas Martin qui m'aident
finir mon travail d'intrt personnel d'encadr.
Je tiens remercier mes professeurs et mes camarades (spcialement : Le Quoc
Anh, Promotion 12 qui me donne quelques documents) de l'IFI qui m'ont aid
beaucoup dans mon travail.
Enfin, je n'oublie jamais les noms des auteurs la fin de ce document.
Grce leurs excellents articles sur l'Internet, je retire les connaissances dans
un systme de vido surveillance.
Merci,

1

Table des matires

1. Introduction......................................................................................................................3
1.1. Problme.......................................................................................................................3
1.2. Modle de camra........................................................................................................4
2. Architecture gnrale du systme................................................................................4
3. Les techniques et Les algorithmes ...............................................................................6
3.1. Dtection du mouvement............................................................................................6
3.1.1. La diffrence temporelle des images ....................................................................6
3.1.2. Double de diffrence temporelle des images et Caractre de Contour.................7
3.1.3. Soustraction de limage de fond ...........................................................................8
3.1.4. Problme rest.....................................................................................................10
3.2. Localisation................................................................................................................11
3.3. Extraction des proprits ..........................................................................................13
3.4. Suivi du mouvement .................................................................................................14
3.4.1. Comparaison de la taille et lhistogramme .........................................................14
3.4.2. Le filtre de Kalman.............................................................................................15
3.4.3. Lobjet plus proche .............................................................................................16
3.4.4. Dtection de lintersection..................................................................................18
3.5. Conclusion du mouvement.......................................................................................19
4. Rsultat exprimental...................................................................................................20
4.1. Dtection du mouvement..........................................................................................21
4.2. Suivi du mouvement .................................................................................................23
4.3. Conclusion du mouvement.......................................................................................26
5. Conclusions & Perspectives ........................................................................................29
Rfrences .............................................................................................................................30

2

1. Introduction
1.1. Problme
Actuellement, lutilisation de la camra pour surveiller les mouvements
devient populaire. La camra apparat par tout : dans la rue, dans lappartement,
etc. Depuis quelques annes, grce au dveloppement de linformatique,
lexigence de surveillance automatique partir du film de camra en utilisant un
logiciel devient ncessairement.
Le centre MICA a un systme de camra qui est utilis pour surveiller les
gens entrer ou sortir du centre. La camra est fixe la fin de couloir. Lobjectif
de ce TIPE, nous allons tudier des diffrentes composantes dun systme de
vido surveillance pour surveiller automatiquement des objets mouvants. Tout
dabord, partir du film, qui est tourn par la camra, nous allons tudier la
faon comment on peut dtecter le mouvement dobjet dans le film dans les cas
diffrents? Par exemple : le jour, le soir, il pleut, il y a du soleil etc. Et puis, si
les objets sont dans la rgion que nous avons besoin de contrler (le couloir de
MICA), nous devons suivre ces objets de mouvement (l'objet apparat dans
combien de trame ou combien de temps, il y a combien d'objet mouvant dans la
scne etc.) ou comment on peut connatre un objet dans plusieurs images
conscutives. Finalement, reconnatre la position du dbut dobjet mouvant et la
position de la fin dobjet mouvant. Dans la partie pratique, on va construire un
systme pouvant au dtecter, suivre et enregistrer les dplacements des
personnes circulant partir de l'image de la camra de surveillance de lentre du
Centre MICA. La vitesse de traitement est deux images par seconde. Donc, on
ne discute pas de temps rel dans ce rapport. Ce rapport comporte :
Chapitre I : Introduction
Chapitre II: Architecture gnrale dun systme de vido surveillance
3
Chapitre III : Les techniques et les algorithmes
Chapitre IV : Rsultat exprimental
Chapitre V: Conclusions et perspectives

1.2. Modle de camra
Nous considrons un flux de vido comme une suite d'images 2D [1]. La
rsolution de la vido, exprime en nombre de pixels, dfinit la dimension de ces
images. La dure du temps entre deux images (t) est trs petite parce que nous
savons que la vitesse de film, en gnral, est de 24 60 images par seconde [2].
a dpend de taux de rafrachissement. Cette vitesse influence le suivi, la
reconnaissance et la conclusion du mouvement.

Image 2D
Figure 1: Un flux de vido.
On sait quil y a 3 mouvements [2]: le mouvement de lobjet, le mouvement
de la camra, et tous deux cas ci-dessus. Dans notre cas, la camra est fixe la
fin de couloir de centre MICA. Donc, il ny a que le mouvement de lobjet.

2. Architecture gnrale du systme
Chaque application de vido surveillance a une exigence diffrente. Elle a
aussi donc larchitecture diffrente. Dans le cas au centre MICA, il y a 5
composants principaux dans notre systme de vido surveillance:
Dtection du mouvement
Localisation
Extraction des proprits de lobjet
Suivi du mouvement
4
Conclusion du mouvement
Un systme de vido surveillance est un systme qui permet de dtecter et
suivre automatiquement du mouvement en basant sur le changement entre les
images conscutives dun flux vido et les proprits de lobjet comme : la taille,
la position, la vitesse
Extraction des
proprits
Localisation
Suivi du
mouvement
Conclusion du
mouvement
Dtection du
mouvement
Nettoyer
des bruits
Dans la rgion
de contrle
Oui
Non
Poubelle

Figure 2: Architecture gnrale du systme de vido surveillance

Ce schma montre larchitecture gnrale du systme de vido surveillance.
Tout dabord, partir de flux dimage 2D, on doit dtecter des objets mouvants.
Et puis, on dtermine la position dobjet. Sil est dans la rgion de contrle (dans
plusieurs des autres cas, on nintresse pas de cette tape), on va extraire des
proprits de ces objets. Si non, on nintresse pas de ces objets. Ensuite, quand
il y a les proprits dobjet, on applique des mthodes de suivi pour suivre ces
objets jusqu' ces objets sortent la rgion de contrle ou disparaissent (c'est--
dire, ils ne meuvent plus). En temps l, on peut conclure de ces mouvements
grce sa position.

5
3. Les techniques et Les algorithmes
3.1. Dtection du mouvement
Selon larchitecture ci-dessus, la dtection du mouvement est la premire
tape. Elle joue un rle trs important dans le systme de vido surveillance car
le rsultat de cette tape va influencer toutes les tapes aprs. Dans cette partie,
je prsenterai quelques mthodes pour dtection du mouvement. Notre systme
utilise limage couleur. Lide principale de cette partie, on comparera la
diffrence de pixel par pixel de deux images. Les rgions qui ont la grande
diffrence sont les rgions de lobjet mouvant.
3.1.1. La diffrence temporelle des images
La diffrence temporelle dtecte la rgion de mouvement grce la
diffrence de pixel par pixel de deux trames conscutives dans un flux vido [2,
4, 9]. Cette mthode adapte le changement de la scne. Mais elle est moins
defficacit parce que dans une dure du temps t, peut tre, on dtecte
seulement une partie d'objet, par exemple : la main, la tte etc. Et le vide (la
rgion o lobjet sest dplac lautre lieu) est aussi dtect. Dans ce cas l, cest
trs difficile extraire des proprits de mouvement (la taille, la position, la
vitesse etc.) et suivre le mouvement.

Figure 3: Un exemple de la diffrence temporelle

[4]. (a) une scne simple
avec deux objets, (b) les rgions rouges sont la diffrence entre
deux images conscutives.
6

Voici, cest lide principale de cette mthode: Soit I l'image linstant t et I
l'image linstant t-1. Lobjet du mouvement se compose les pixels qui satisfont
lquation suivante :
t t-1
max(| I (x, y)* c I (x, y) * c |, c=(R,G,B)) >= seuil
t t-1
Comme ci-dessus a dj expliqu, on peut amliorer cette mthode en faon
suivante : au lieu de soustraire limage linstant t-1, on soustrait la moyenne de
N images dernires [9]. Soit I
tm
la moyenne de N dernires images linstant t.
Lobjet du mouvement se compose les pixels qui satisfont lquation suivante :
max(| I (x, y)* c I (x, y)*c |, c=(R,G,B)) >= seuil
t tm
La moyenne de N images linstant t +1 est mise jours :
I
t+1 m
(x, y)* c = I
t
(x, y)* c + (1-)I
tm
(x, y)* c, c=(R,G,B).
O (0,1) est une constante et est dcid par la pratique.
3.1.2. Double de diffrence temporelle des images et Caractre
de Contour
Dans cette manire, on utilise aussi la diffrence de pixel par pixel des trames
conscutives dans un flux vido comme la partie 3.1.1. Mais on va utiliser trois
trames conscutives [14]. Cette faon nous donne le rsultat meilleur que ce-lui de
la partie 3.1.1, tandis quelle adapte aussi le changement de la scne. Voici, cest
lide principale de cette mthode: Soit I l'image linstant t, I l'image
linstant t-1 et I l'image linstant t-2. Lobjet du mouvement se compose les
pixels qui satisfont lquation suivante :
t t-1
t-2
I (x, y) = max(| I (x, y)* c I (x, y) * c |, c=(R,G,B)) >= seuil
1 t t-1
I (x, y)= max(| I (x, y)* c I (x, y) * c |, c=(R,G,B)) >= seuil
2 t-1 t-2
I
rsultat
(x, y) = I (x, y) I (x, y.
1 I 2
7
Nous extrayons la rgion des objets mouvants par la double mthode de
diffrence. Dans le cas, lobjet se dplace lentement ou il ny a quune partie
dobjet se dplace, nous ne pouvons pas obtenir compltement la forme dobjet.
Peut-tre, un objet sera divis en plusieurs rgions. Nous utilisons donc la
caractre de contour pour combiner ces rgions. Aprs avoir masqu l'image
linstant t-1 avec la rgion mouvante obtenue partir de la double mthode de
diffrence, le contour est calcul dans la rgion o le mouvement est produit. Le
contour est calcul partir de l'image F qui est limage linstant t-1 masque
avec R = I (x, y) I (x, y)
1 U 2
. Le contour est reprsent par
en utilisant un caractre de gradient avec l'intensit de l'image masque F. En
chaque pixel que le mouvement est dtect par l'intermdiaire de la double
mthode de diffrence dans l'armature courante, le coefficient est calcul. C'est--
dire, les pixels commands par le caractre maximal de contour sont choisis en
tant que points de caractre de contour parce que les valeurs propres minimum
plus grandes sont les caractres plus forts de contour.
Avec cette faon, linstant t, on va obtenir des objets mouvant linstant t-1.
C'est--dire, on est en retard de 0,5 seconde. Autre chose, si lobjet ne se dplace
pas pendant quelques secondes, cette manire ne peut pas dtecter le mouvement.
Dans ce cas, nous utilisons le contour dobjet avec le rsultat de dernire tape
pour dtecter le mouvement.
3.1.3. Soustraction de limage de fond
La troisime mthode, on utilise une image de fond [3, 4, 9, 11]. Cette mthode
est trs populaire et elle est utilise par plusieurs applications. Cette faon dtecte
la rgion de mouvement en soustrayant pixel par pixel limage courante limage
de fond.
8
3.1.3.1. Algorithme
Soit I l'image linstant t. B est l'image de fond linstant t. Lobjet du
mouvement se compose les pixels qui satisfont lquation suivante :
t t
max (| I (x, y)*c B
t t t
B (x, y)*c |, c=(R,G,B)) >= S (x, y)
O S (x, y) est seuil de la position (x, y) linstant t. Cette mthode nous
permet obtenir la forme complte d'objet et compter exactement les objets du
mouvement parce que l'image de fond n'a pas l'objet mouvant. Cependant, en rel,
l
t
e changement de lespace a lieu souvent (Spcialement, cest le changement de la
lumire : le matin, le soir, il y a du soleil, il pleut etc.). Cela influence le rsultat si
l'image de fond nest pas mise jours. Ou, dans un autre cas, lobjet stoppe dans
une dure du temps long. On a besoin de mettre jours cet objet limage de
fond. Evidemment, on a besoin dun seuil pour dterminer quun objet va
additionner de limage de fond sil a stopp dans N trames. Alors, on doit mettre
jours limage de fond.
Selon Yiithan Dedeolu [4], il y a une faon simple pour mettre jours
limage de fond et la matrice de seuil: soit O lensemble de lobjet mouvant.
BB
t+1
(x, y) =

S
t+1
(x, y) =
O , (0,1) sont les constantes et sont dcids par la pratique. est le taux
dinfluence de la diffrence entre limage et le fond. Il est aussi dcid par la
pratique.
Un problme, comment on peut choisir , et pour tout le cas? Cest trs
difficile. Ainsi, dans la partie pratique de ce TIPE, jai utilis une mthode qui est
9
plus simple que la mthode de Yiithan Dedeolu. Je mets jours seulement
limage de fond en manire suivante:
BB
t+1
(x, y) =

3.1.3.2. Cration dimage de fond
Je propose trois manires pour crer limage de fond :
Le calcul de moyenne de N premires images.
Nous choissions limage de fond qui a peu le changement ou quil ny
a pas de mouvement pendant une dure longe.
Nous choissions la premire image dans le flux vido. Aprs nous
pouvons la mthode de mis jours limage de fond que jai propos
ci-dessus pour crer limage de fond. Selon cette faon, aprs une
dure de temps x, nous avons limage de fond.

3.1.4. Problme rest
Aprs la rgion de mouvement est trouve par les mthodes ci-dessus. On va
utiliser quelques morphologies comme : lrosion et la dilatation [2, 9] pour
nettoyer les bruits et les objets qui ont la taille petite.
En plus, on va utiliser des seuls diffrents pour dterminer la taille minimale de
lobjet chaque rgion. Ce problme est trs ncessaire dans le cas de centre
MICA parce que le couloir est long. Les objets qui sont loin de la camra ont la
petite taille. Si on utilise seulement un seul, peut-tre, ces objets sont nettoys. Ici,
on utilise la coordonne axiale de Y pour diviser les rgions. On filtre lobjet en
utilisant lhauteur dobjet.
10

Seul =42
Seul = 50
Seul = 95
Seul = 120
Seul = 70
Figure 4: Les valeurs de seuil pour chaque rgion.
Dans le cas, il y a trop la lumire, on doit nettoyer lombre dobjet [5]. Dans la
mthode de la diffrence temporelle des images, on peut aussi utiliser la valeur de
seuil est une matrice pour adapter avec les rgions diffrentes (claire ou fonc)
dans image.

3.2. Localisation
Ltape suivante, on localisera lobjet mouvant dans la rgion de contrle ou
pas ? Si lobjet mouvant est dehors de la rgion de contrle, on nintresse pas
Un objet est appel dehors sil na aucun le pixel dans la rgion de contrle ou le
nombre de pixel de lobjet dans la rgion de contrle est moins dun seul ou les
points importants ne sont pas dans la rgion de contrle). Au contraire, on extraira
les proprits pour suivre et conclure de lobjet.
Dans notre cas, grce la camra fixe, la rgion de contrle est dtermine
facilement davant. Ces rgions sont spares par les lignes. En temps l, on
11
dterminera un pixel qui est dans ou dehors la rgion de contrle de la faon
suivante: le pixel gauche ou droit de la ligne. Evidemment, la direction de ligne
doit tre fixe avant.
Soit une ligne d qui est dtermine par deux point A(ax,ay) et B(bx,by). Un
point P(x, y) est droit de d (la direction A -> B) si et seulement si:
(x - ax) * (by - ay) - (y - ay) * (bx - ax) < 0
3 4
5
2
1
Figure 5: Division de limage en 5 rgions et on intresse
seulement aux objets dans la rgion 2.
Pour localisation, on a besoin de dterminer la position de lobjet. On
conservera la position haut-gauche (Pmin) et bas-droite (Pmax) du rectangle qui
enveloppe lobjet. Un objet est dans la rgion 2 si et seulement sil a le point
A(Pmin.x + (Pmax.x Pmix.x)/4, Pmax.y) ou le point B(Pmin.x + 3*(Pmax.x
Pmix.x)/4, Pmax.y) dans la rgion 2.

12
3.3. Extraction des proprits
Quand on a dj dtermin les objets mouvants qui a besoin de suivre, on va
extraire les proprits de ces objets. Il y a 4 proprits que lon intresse :
La taille de lobjet : On conservera la position haut-gauche et bas-droite
du rectangle qui enveloppe lobjet. Parce que lon na pas besoin des
proprits de lobjet que lon nintresse pas, dans la partie 3.2, on a
extrait seulement cette proprit pour dterminer la rgion de lobjet. Si
les objets mouvants sont dans la rgion de contrle, on continue extraire
les autres proprits de lobjet.
Lhistogramme de lobjet : Pour le calcul simple, on va rduire cet
histogramme de 256 M couleurs (environ 16 ou 24 couleurs). Pour
diminuer le temps de calcul, on nextrait que cette proprit quand
lobjet apparat la premire fois, ou dans le cas, le changement de la
taille de lobjet est grand parce que le changement de la taille de lobjet
amne le changement de lhistogramme de lobjet. Au contraire,
lhistogramme de lobjet linstant t est gal lhistogramme de lobjet
linstant t-1.
Le centre de lobjet [4] : Soit C
m
(x
c
,y
c
) le centre de lobjet m, N le
nombre de pixel de lobjet m. x
c
= N xi
N
i
, y
c
= N yi
N
i
.
La vitesse qui se compose dx et dy, les distances (sur laxis X et laxis
Y) entre le centre de lobjet linstant t et le centre de lobjet linstant
t-1. Si lobjet apparat la premire fois, dx et dy sont gaux zro.
Il y a un problme que lon ne peut pas oublier de compter le nombre dobjet
mouvant dans limage courante et dtiqueter [2] pour chaque objet.

13
3.4. Suivi du mouvement
Le problme est le plus difficile la vido surveillance, comment on peut
savoir que deux objets dans deux images conscutives sont lui-mme quand il y a
plus un objet mouvant dans limage? Suivi un objet, c'est--dire, on trouve la
correspondance entre les objets dans limage courante et les objets dans limage
dernire pour conclure quils sont les mmes. Il y a beaucoup de mthodes
diffrentes pour suivre. Mais chaque mthode utilise les proprits diffrentes.
Dans notre cas, grce aux proprits que lon a dj extraire ci-dessus, je
reprsenterai quelques mthodes pour suivre du mouvement.

3.4.1. Comparaison de la taille et lhistogramme
Avec cette mthode, on utilise la taille, la vitesse et lhistogramme de lobjet.
On va comparer la taille dobjet linstant t avec la taille dobjet linstant t-1.
Cette mthode est simple et rapide. Mais elle nest pas lefficacit quand la vitesse
change, les objets groupent et sparent en groupe, ou le changement de la taille
dobjet est grand. Autre raison, les algorithmes pour dtecter du mouvement ont
toujours derreur. Donc, on a besoin dajouter son histogramme pour rsoudre ce
problme. Soit Oi(t) lobjet i linstant t, Oj(t-1) lobjet j linstant t-1, Bi(t) la
taille de i linstant t (le rectangle enveloppant), Bj(t-1) la taille et Vj(t-1) la
vitesse de j linstant t-1 [9] .
Si B
i
(t) (B
j
(t-1) + V
j
(t-1)) < seuil Alors O
i
(t) = O
j
(t-1)
Si non Oi(t) Oj(t-1)
Dans le cas, il y a plus dun objet satisfait, on va comparer ses histogrammes
pour trouver la correspondance. Voici, cest lalgorithme dans le cas il y a
plusieurs objets [4].
14

3.4.2. Le filtre de Kalman
Cette mthode est divise par deux tapes principales [2, 6, 11, 12]. Premire
tape, on utilise la position courante et la vitesse courante pour prvoir la position
dans limage suivante. Deuxime tape, partir de la position relle (la position
qui est plus proche de la position prvue de dernire tape) et de la position
prvue, on fera une correction pour avoir une position relative parce que, en relle,
il ny a aucun algorithme de traitement dimage qui est exact. Et nous utilisons
cette position pour prvoir la position pour limage suivante. Avec cette mthode,
on peut profiter le temps et rsoudre le problme que lobjet change soudain la
direction de mouvement. Mais, quand il y a plusieurs objets mouvants. Comment
on peut choisir la position relle sil y a des collisions entre les objets. Quand il y a
le changement de la direction de lobjet aprs la collision, le systme va se
tromper. Dans ce cas l, il faut mieux que comparent ses histogrammes pour
choisir exactement lobjet.
15
Voici, cest lalgorithme de filtre de Kalman
Source: cours de vision par ordinateur, Alain Boucher
3.4.3. Lobjet le plus proche
Dans cette manire, nous utilisons les proprits : La taille de lobjet, Le centre
de lobjet et la vitesse pour suivi des objets mouvants. Cette manire a aussi deux
tapes : prdiction de la nouvelle position dobjet et la recherche dobjet le plus
proche.
Premire tape, cette faon rutilise la premire tape de mthode de filtre
Kalman. C'est--dire, linstant t, nous utilisons la position dobjet et sa
vitesse pour prvoir la position dobjet linstant t+1.
Deuxime tape, soit un objet avec le centre C
t
linstant t, nous cherchons
tous les objet, linstant t-1, au tour de C une distance d (on appelle un
seuil). Sil ny a quun objet, cest lobjet que nous avons besoin de trouver.
Au contraire, il y a plusieurs objets, nous allons trouver lobjet qui a la
distance entre C
t-1
+ V
t-1
(le centre de prdiction de C
t-1
) et C
t
tre plus
proche. Dans le cas, il y a plusieurs objets qui satisfont cette condition.
C'est--dire, ils ont mme distance, nous devons comparer son histogramme
pour distinguer ces objets.
16
- Un autre problme, la taille dun objet linstant t contient deux ou trois
objets linstant t-1. C'est--dire le centre de prdiction des objets
linstant t-1 dedans le rectangle qui enveloppe lobjet linstant t. ce
problme est lintersection (grouper) entre les objets que nous allons
traiter dans la partie 3.4.4 ci-dessous.
- Au contraire, si lobjet ne satisfait pas de tous les cas ci-dessus. Nous
avons un nouvel objet qui apparat linstant t.
A la fin, parce que les algorithmes ont souvent lerreur, nous allons
utiliser un seul (si la position dobjet nest pas la porte) pour attendre
pendant une dure si lobjet napparat plus, nous concluons que lobjet
disparat.
Voici, cest le schma de cet algorithme :

17

Pour Oj dans I(t-1)
CHECK
FINIR
Lobjet suivant de I(t-1)
Oui
Non
Oj na pas de correspondance
La position dobjet nest pas la
porte
Nombre de trame que lobjet
disparit >=seul
Ajouter Oj dans lensemble de
lobjet courant
Lobjet finit (conclusion)
Si
Non
Non
Non
Si
Oui

3.4.4. Dtection de lintersection
Il y a encore un problme pour toutes les mthodes de suivi du mouvement que
jai prsent ci-dessus, cest lintersection des objets et comment nous savons quil
y a lintersection des objets? Dans cette partie, je propose une solution pour
rsoudre ce problme.
Pour la dtection de lintersection, ici, jutilise le point de centre de lobjet et la
taille de lobjet. Soit O
i
est un objet de limage linstant t. Si Oi na pas de
correspondance avec O
k
de lensemble des objets de limage linstant t-1 et le
centre de prdiction de O
p
linstant t-1 et le centre de prdiction de O
q
linstant
t-1 (par exemple, nous avons deux objets) sont les pixels de O
i
. Dans ce cas la,
nous concluons que O
p
et O
q
se groupent. Nous pouvons suivre ces objets en
18
groupe ou diviser en deux objets O
p
et O
q
. O

O
p
a les proprits de prdiction
de O
p
et O
q
a les proprits de prdiction de O
q
.
Le premier cas, si nous dcidons suivre O
p
et O
q
en groupe, nous devons
dtection de la sparation de O
p
et de O
q
en comparant son histogramme
aprs ces objets sparent.
Le deuxime cas, parce que nous suivrons O
p
et O
q
par deux objets
diffrents, donc nous ne devons pas dtecter la sparation aprs ces
objets sparent.

Figure 6 : illustration de la dtection de lintersection
Lobjet courant

3.5. Conclusion du mouvement
La dernire tape, quand il y a un lobjet (ou plusieurs) qui disparat ou il
stoppe dans une dure de temps assez grande. Nous avons besoin de conclure de
cet objet, de enregistrer les informations dans le fichier et de le supprimer dans la
mmoire. Dans notre cas, ( MICA) parce que nous avons besoin de surveiller
lobjet qui entre (ou sort) et quelle chambre il est entr (ou sorti). Donc, grce la
19
camra fixe, la position de porte et lhauteur de porte sont aussi fixes sur limage.
Quand un objet apparat (ou disparat) cte de la position dune porte. Nous
pouvons conclure quil apparat (ou disparat) de cette porte. Si lobjet va la fin
de couloir (loin de la camra), par exemple, nous disons quil sort le centre de
MICA.
Il y a neuf positions que nous intresserons : ce sont les positions des sept
portes, la fin de couloir, au dbut de couloir (la position de camra). Pour chaque
porte, nous conserver sa position et son hauteur.
Puisque nous devons surveiller tous les objets au couloir de centre MICA.
Mais, il y a les objets qui ne sont pas lhomme. Nous avons donc besoin de
classifier ces objets en groupes diffrents. Ici, je divise les objets mouvants que
nous avons surveills en trois groupes :
Les objets ont la position de commencement fixe davant ou la position
de terminaison fixe davant. C'est--dire, la position des portes ou la
fin de couloir.
Le mouvement de battant de porte. Ces objets ont la mme position du
commencement et du terminal. En plus, lhauteur des ces objets est
approximative lhauteur que nous avons fix pour chaque porte.
Le reste, les objets qui ont la position de commencement ou la position
de terminaison ne pas tre la position des portes.

4. Rsultat exprimental
Pour lexprimentation, jai dj crit un programme de vido surveillance qui
travaille dans le cas de centre MICA. La donne dentre est un fichier de vido
qui est film au centre MICA. Le format de fichier de vido est AVI. Jai utilis la
bibliothque LTI, cest une bibliothque de Open Source sur Internet, pour
traitement dimage JPG. Pour prendre limage JPG partir du flux vido, jai
20
utilis la bibliothque de traitement de vido du centre MICA. Le programme est
mis en application en utilisant le langage C++ et il marche sur le systme
dopratoire Linux. Le rsultat de ce programme est acceptable avec trois scnes
qui sont tourns au jour avec le soleil.
4.1. Dtection du mouvement
Avec cette partie, jutilise lalgorithme soustraction de limage de fond.
Limage de fond que jai choisit est la premire image dans le flux de vido. Pour
mettre jours limage de fond, jutilise la faon que jai propose ci-dessus, dans
la partie 3.1.3.
Voici, ce sont les rsultat avec les scnes diffrentes :

a) limage de fond b) le rsultat (couleur - trame 16
me
)

c) le rsultat (binaire - trame 16
me
) d) le rsultat (couleur - trame 19
me
)
21
22

e) le rsultat (binaire - trame 19
me
)
Figure 6 : le rsultat de la dtection du mouvement, scne 1.

a) le rsultat (couleur - trame 45
me
) b) le rsultat (binaire - trame 45
me
)

c) le rsultat (couleur - trame 59
me
) d) le rsultat (binaire - trame 59
me
)
Figure 7 : le rsultat de la dtection du mouvement, scne 2.
Avec l rsultat de la dtection du mouvement ci-dessus, jai utilis lrosion et
la dilatation deux fois pour supprimer les petits objets. En plus, pour limage
couleur, jai supprim les objets qui sont dehors la rgion 2 et ont la petite taille.
Le numro de trame est lordre de limage que je prends du flux vido. La valeur
de seuil est gale 20 pour toute la matrice de seuil S.
4.2. Suivi du mouvement
Pour suivi du mouvement, jai utilis lalgorithme de lobjet plus proche. Mais,
il y a un peu diffrence ici. Je nai utilis pas le centre de lobjet. Le point que jai
utilis est C = ((Pmin.x + Pmax.x)/2, Pmax.y) parce quil y a le grand
changement de la taille de lobjet, exactement cest lhauteur de lobjet, quand
lobjet mouvant (lhomme) ouvert ou ferme la porte. Voici, cest limage qui
illustrera ce problme.

a) trame 15
me
b) trame 16
me
Le point C
Donc, si nous utilisons le centre de lobjet, la distance entre le centre de
prdiction de lobjet linstant t = 15 et le centre de lobjet linstant t = 16 est
grande.
Voici, cest le rsultat de suivi du mouvement de mon programme :
23
24

a) trame 40
me
b)

trame 44
me

c) trame 50
me
d)

trame 54
me

e) trame 57
me
f)

trame 59
me
Figure 8 : Suivi du mouvement, la scne avec un objet mouvant.
25

a) trame 55
me
b)

trame 58
me

c) trame 62
me
d)

trame 65
me

e) trame 73
me
f)

trame 77
me

g) trame 79
me
h)

trame 80
me
Figure 9 : Suivi du mouvement, la scne avec plusieurs objets mouvants
Voir le rsultat dans la figure 9, nous trouvons que la trame 73
me
na pas le
premier objet (la couleur rouge). C'est--dire, cet objet a disparu au trame davant
la trame 73
me
. A la trame 77
me
lobjet avec la couleur rouge apparat, cependant
cet objet nest pas lobjet qui a disparu dans la trame 73
me
. Jai rutilis
alatoirement la couleur rouge de lobjet qui a disparu au trame davant le trame
73
me
pour lobjet qui apparat la trame 77
me
parce que le nombre de couleur qui
est utilis de montrer des objets diffrents est limite.
En plus, la trame 79
me
le troisime objet (la couleur bleu) a group en
deuxime objet (la couleur vert). Ce problme est lintersection entre les objets
mouvants, cependant, mon programme na trait pas bien.

4.3. Conclusion du mouvement
Selon lanalyse ci-dessus, la conclusion du mouvement nest pas difficile.
Nous navons besoin de conclure que la position de commencement de lobjet et la
position de la fin de lobjet. En plus, nous pouvons classifier ces objets en trois
groupes. Mais, mon programme na pas encore la fonction de classification des
objets. Voici, cest le rsultat de mon programme sur cette partie.
26

Avec la premire scne et la deuxime scne, le rsultat est trs bon. Mais,
dans la troisime scne, le programme conclut exactement deux objets qui apparat
la position 2 et 9. Le reste nest pas exacte parce quil y a beaucoup de
lintersection dans cette scne. Le numro 0 ici, c'est--dire la position de lobjet
est indfinie.
Voici, cest le numro de porte.
27

8
Porte 3,
Porte 2
Porte 1
9

28
5. Conclusions & Perspectives
Dans ce rapport, jai dj prsent les composants principaux et les mthodes
pour un systme de vido surveillance. Chaque application a une architecture
diffrente, dans le cas de ce TIPE, je proposais une architecture avec 5
composants : Dtection du mouvement, Localisation, Extraction des proprits,
Suivi du mouvement et Conclusion du mouvement. Je prsentais les mthodes et
les techniques pour rsoudre le problme pour chaque composant.
La partie de pratique, jai construit un programme pour tester ces mthodes.
Evidemment, ce nest pas toutes les mthodes pour chaque tape. Le rsultat nest
pas mal avec les scnes que le professeur ma donn. Aprs ralisation de
programme, il y a encore le problme que nous devrons continuer tudier comme :
dans la mthode de soustraction de limage de fond, quelle est la faon que nous
pouvons construire une bonne image de fond? En plus, si dans la premire image
du flux vido, il y a lobjet mouvant, donc, pendant combien de temps nous
pouvons obtenir limage de fond en utilisant la manire de mis jours limage de
fond?
Un autre problme, la dtection de lintersection des objets est trs difficile
dans le cas de centre MICA parce que la camra est fixe au dbut de couloir, les
objets se dplacent de loin de la camra proche de la camra ou de proche de la
camra loin de la camra. Donc, lintervalle de temps de lintersection des objets
est long. Cest pourquoi, il ny a pas seulement la difficult de dtection de
lintersection des objets mais aussi la difficult de suivi du mouvement. Tandis
que lintersection des objets a lieu souvent au petit couloir de centre MICA.
Dans lavenir, je voudrais rechercher la mthode pour rsoudre (dtection et
suivi) lintersection des objets dans ce cas, peut-tre ce sera un ad-hoc . Je
voudrais aussi tester mon programme avec les scnes qui sont tournes dans les
espaces diffrents comme : le soir, il pleut etc.
29

Rfrences

[1] Jean-Baptiste. La thse : Suivi vido de mouvements pour l'interaction, Juin
2005.
[2] Alain Boucher. Le cours de traitement dimage et de vision par ordinateur,
2006.
[3] Chi-Ming Ling. Motion Object Detection and Tracking Based on Adaptive
Background Subtraction. June 2004.
[4] Yiithan Dedeolu. Moving Object detection, Tracking and Classification for
Smart Video Surveillance. August, 2004.
[5] Rita Cucchiara, Costantino Grana, Massimo Piccardi, and Andrea Prati. Detecting
Moving Objects, Ghosts, and Shadows in Video Streams, OCTOBER 2003.
[6] Computer Vision - A modern Approach (chapter 18).
[7] Nils T Siebel. Design and Implementation of People Tracking Algorithms for
Visual Surveillance Applications. March 2003.
[8] Qi Zang and Reinhard Klette. Object Classification and Tracking in Video
Surveillance.
[9] Burkay Birant rten. Moving Object Identification and Event Recognition in Video
Surveillance system. July 2005.
[10] R. Cucchiara, C. Grana, A. Prati, R. Vezzani. A COMPUTER VISION SYSTEM
FOR IN-HOUSE VIDEO SURVEILLANCE.
[11] Wei Niu, Long Jiao, Dan Han, and Yuan-Fang Wang. Real-Time Multi-person
Tracking in Video Surveillance.
[12] James L. Crowley. Vision Par Ordinateur, Le Filtre de Kalman. dcembre
2000.
[13] Rita Cucchiara, Costantino Grana, Massimo Piccardi, Andrea Prati and G. Neri,
The Sakbot System for Moving Object Detaction and Tracking, chapter 12
30
[14] Sung Wook Seol , Jee Hye Jang, Hyo Sung Kim, Chul Hun Lee, and Ki Gon
Nam. An Automatic Detection and Tracking System of Moving Objects Using
Double Difference based Motion Estimation. 2003.
[15] Akio Yoneyama, Chia H. Yeh and C. -C. Jay Kuo, Moving Cast Shadow
Elimination for Robust Vehicle Extraction based on 2D Joint Vehicle/Shadow
Models. Proceedings of the IEEE Conference on Advanced Video and Signal
Based Surveillance, 2003
31

Tipe-Cao Tien Dung PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Tipe-Cao Tien Dung PDF

Transféré par

Droits d'auteur :

Formats disponibles

Institut de la Francophonie pour lInformatique

Rapport final du Travail dIntrt

Vous aimerez peut-être aussi