Académique Documents
Professionnel Documents
Culture Documents
Sous la direction de :
Franois BREMOND, HDR
HANOI, 10 - 2008
TABLE DES MATIERES
REFERENCES ............................................................................................................... 41
1
LISTE DES FIGURES ET DE TABLEAU
Tableau 5.1 Statistique les donns dans deux cas : appliquer et sans appliquer
lalgorithme de rparation ............................................................................................ 36
2
REMERCIEMENTS
Avant de vous prsenter ce rapport, je tiens remercier tous ceux qui
mont aid pendant mon stage et mes tudes lIFI. Je voudrais en
particulier remercier :
- M. Franois Brmond, chercheur de lquipe Pulsar, INRIA Sophia
Antipolis, pour lencadrement, laide, lencouragement et la sympathie quil
ma donns. Grce ses conseils, jai pu terminer et complter mes travaux.
- Mme Monique Thonnat, chef de lquipe Pulsar, INRIA Sophia
Antipolis, qui ma donn beaucoup de conseils et de bonnes critiques
sur mon travail. Grce ses remarques, mon travail est plus complet.
- Etienne Corve, ingnieur de lquipe Pulsar, INRIA Sophia Antipolis,
qui ma aid chaleureusement. Sans son aide, le stage naurait pas pu
atteindre son terme temps. Je remercie aussi tous les autres membres de
lquipe Pulsar pour leurs encouragements, leurs aides, leur sympathie et
lenvironnement de travail trs chaleureux dans lequel jai travaill.
- LE Mlanie Nguyen My Linh, une amie vietnamienne, qui ma aid
pendant mon sjour de six mois en France.
Je voudrais aussi adresser mes sincres remerciements tous les
professeurs de lIFI pour leurs enseignements et les cours intressants
quils mont donn pendant ma scolarit lIFI. Je noublie pas de
remercier aussi tous les personnels de lIFI qui mont apport leur aide.
Depuis mes premiers jours dans cet institut, j'ai reu beaucoup d'aides, de
conseils et d'encouragements de mes amis, en particulier ceux de la promotion
12. Tout cela ma permis de murir chaque jour. Je les remercie et je ne
pourrais jamais oublier les souvenirs gais et tristes que jai pass avec eux
durant ces deux ans lIFI.
Je voudrais aussi remercier aussi les confrres de lUniversit Prive
Phu Xuan o je suis en train de travailler, qui mont donn les meilleures
conditions pour que je puisse bien passer ma scolarit lIFI.
Enfin, un grand merci mes parents, mon frre, ma fiance et les autres
membres de ma famille de mavoir normment encourag dans les
moments les plus difficiles de ma scolarit lIFI.
Chau Duc Phu
Hue (Vietnam), automne 2008
3
RESUME
4
ABSTRACT
5
CHAPITRE I
INTRODUCTION
1.1 Problmatique
Il existe des recherches qui focalisent sur ce domaine [1, 3, 16, 18].
Quelques approches sont proposes mais il y a des problmes ne sont pas
encore rsolus. Un algorithme peut seulement tre appliqu dans quelques
scnes fixes. La smantique de la scne est un lment important quon
6
peut exploiter pour mieux suivre les mouvements, cependant cet lment
nobtient pas encore beaucoup dintrts de recherches. Quelques
chercheurs font des efforts pour modliser la scne [11,15], toutefois les
scnes considres sont encore assez simples. Dans le processus du suivi,
lapparition des bruits nest pas vitable cause de la complexit de la
scne, la relativit de lalgorithme utilisalors il est aussi ncessaire de
filtrer ces trajectoires avant de commencer la modlisation. Sinon,
lutilisation des bruits pour la construction des scnes peut entraner les
rsultats imprcis.
7
trajectoire est complte et plus sa valeur de fiabilit est grande. En
calculant la somme des valeurs de fiabilit des trajectoires avant et aprs
lintgration de lalgorithme pour la rparation, on peut valuer leffet de
lalgorithme.
1.3 Contribution
8
du projet CARETAKER (www.ist-caretaker.org) qui surveillent les stations
de mtro.
9
CHAPITRE II
ETAT DE LART
Le premier est bas sur le calcul dun gradient temporel : une mesure
de vraisemblance du mouvement est fournie par le changement instantan
calcul entre deux trames conscutives [4, 9, 17]. Ces mthodes sont
naturellement adaptables aux changements denvironnements, mais sont
aussi dpendantes de la vitesse et de la taille des objets en mouvement. Ce
dfaut peut tre minimis en utilisant des combinaisons de filtres spatio-
temporelles mais au prix dune complexit croissante.
Le second est bas sur des techniques de diffrence au fond [7, 12,
14] qui utilise une image de rfrence (le fond), reprsentant les lments
stationnaires de la scne (voir la figure 2.1). Ici la mesure de vraisemblance
du mouvement est la diffrence entre la trame courante et le fond. Ces
mthodes sont moins dpendantes de la vitesse et de la taille des objets.
Cependant, ladaptation aux environnements dynamiques est une tche bien
10
plus ardue, pnalisant la dtection des mouvements de faible amplitude
(des objets petits, trs lents ou trs peu contrasts).
11
Kalman est capable de construire une reprsentation interne du systme et
grce cette reprsentation, on peut estimer l'tat futur du systme. Les
filtres sont modliss en utilisant une chane de Markov. Dans le filtrage de
Kalman, les quations dcrivent l'tat du systme temps successifs, grce
ces quations on peut prdire l'tat futur en utilisant l'tat actuel sans
dpendre des tats antrieurs dans les calculs.
New Measurement
Predict Correct
Initial Seed
12
d'optimisation pour les donnes d'association afin de filtrer et de mieux
grer les occlusions et les mouvements non-linaire. Lensemble des
caractristiques de la trajectoire courante est obtenu en optimisant la
somme des distances de Mahalanobis entre les prvisions et les mesures
correspondantes. Dans [16], une mthode pour suivre les objets en
mouvement est prsente, en utilisant des partical filters pour estimer
l'tat des objets, en se basant sur la probabilit d'association des filtres de
donnes. Les auteurs dans [19] proposent d'utiliser un modle pour grer
les caractristiques suivies. Chaque tat de caractristique de trajectoire est
assign une valeur de fiabilit. Cette valeur aide distinguer entre
locclusion et la disparition dun objet. Toutefois, la valeur de fiabilit est
calcule par des caractristiques simples (nombre de fois o un objet est
correctement suivi) et ne peut pas dtecter les bruits. Tous ces travaux
numrs ci-dessus ont obtenu des premiers rsultats mais dans les cas
prcdents, on ne considre pas encore des situations docclusions
complexes et longues.
13
modle construit. Par exemple, les auteurs dans [15] ont prsent une
mthode pour modliser les chemins de la scne base sur les trajectoires
dtectes. Un graphe est construit afin de reprsenter la structure de routes
modlises dans la scne. La construction des chemins est effectue
automatiquement par les techniques dapprentissage non supervis, bases
sur le clustering des trajectoires. Toutefois, cette mthode ne peut tre
applique que dans des scnes simples o il existe clairement des routes.
Les critres pour valuer les bruits se basent dans la plupart des cas sur la
dure des trajectoires. Fernyhough et al [11] utilisent le mme modle pour
apprendre automatiquement les chemins des objets grce laccumulation
des traces des objets suivis. Cette mthode est non supervise et dauto-
initialisation. Toutefois, cette mthode exige les trajectoires compltes, elle
ne gre pas les occlusions et les rsultats sont dpendants de la forme et de
la taille des objets, car ils sont dtects sur le plan 2D.
2.3 Conclusion
14
CHAPITRE III
PRESENTATION DU SYSTEME
DINTERPRETATION DE VIDEO
Le module Vision qui est le noyau du systme, comprend trois tches
(voir la figure 3.1). Tout d'abord, un dtecteur du mouvement (Motion
Detector) et un frame to frame tracker crent un graphe d'objets mobiles
pour chaque camra calibre. Deuximement, un mcanisme de
combinaison est ralis pour combiner les graphes calculs par chaque
camra en un graphe global. Troisimement, ce graphe global est utilis
pour le suivi des individus, des groupes de personnes et les foules dans la
scne (pendant centaines de trames).
15
3.1 Dtection du Mouvement et Suivi Trame par Trame
16
et les dimensions) des objets mobiles calcules dans le graphe combin
donnent une meilleure estimation des positions et des dimensions des
objets rels dans la scne.
Fig 3.2
Source [8]
17
3.3 Suivi long terme des individus, groupe de personnes et la foule
L'objectif ici est de suivre sur une longue priode de temps les
individus, les groupes de personnes ou de la foule afin de permettre aux
scnarios concerns ces trois diffrents types d'acteurs dtre reconnu. Par
exemple, lorsque l'on veut dtecter un groupe de personnes (au moins deux
personnes) qui est en train de bloquer une zone de sortie, cest mieux
logique de raisonner avec le Group Tracker, car il fournit plus
prcisment la location 3D du groupe de personnes dans la scne.
18
CHAPITRE IV
REPARATION DES TRAJECTOIRES
PAR CLUSTERING DE POINTS
Pour rsoudre les problmes poss par les travaux antrieurs, dans
notre approche, nous proposons exploiter la smantique de la scne grce
lapprentissage supervis. La phase de modlisation de la scne qui ne
doit pas exiger beaucoup de connaissances pralables de la scne et doit
tre ralise automatique. Nous cherchons une mthode qui peut modliser
plusieurs types de scnes. Pour cela, au lieu de construire et reprsenter
prcisment les routes ou les chemins dans la scne, nous proposons une
mthode plus gnrale. La scne ici est modlise par les triplets de zones.
Chaque triplet de zones peut reprsenter plusieurs routes diffrentes de la
scne. Le filtre des trajectoires est aussi considr pour liminer les bruits.
Cest pour cela que seules les trajectoires typiques sont utilises pour
apprendre la scne. Le rsultat de la phase de modlisation est donc
meilleur. Lorsque la modlisation de la scne est finie, on peut dtecter la
perte du suivi et rparer les trajectoires incompltes.
19
4.2 Caractristiques dune trajectoire
2. Caractristique exit zone est active quand lobjet sort de la scne par
une zone de sortie.
20
valuer le potentiel d'erreur lors de la dtection d'un objet. Plus ce nombre
est grand, plus la fiabilit de la trajectoire est petite.
8. Nombre de fois que lobjet mobile change de sa taille. Ce changement se
base sur un seuil de variation dimensionnel prdfinie. Le changement de
taille dun objet mobile qui est trop grande, pnalisera la valeur de fiabilit
de sa trajectoire.
FVi i
fi = i . (1)
o,
21
i : la valeur moyenne de caractristique i pour toutes les trajectoires
traites pendant la phase dapprentissage
5 9
CV = ( wi * f i ) + ( wi * (1 f i )) (2)
.
i =1 i=6
o,
CV (confidence value) : la valeur de fiabilit de trajectoire considre
wi (weight) : le poids (importance) de la caractristique i (voir la section 4.2
pour dtails)
fi : la valeur de caractristique i, aprs normalisation
22
utilisons lapprentissage supervis combin avec lalgorithme gntique
pour rsoudre ce problme.
23
lui-mme, alors que celui Cross-Over sexplique par un change des
valeurs entre les deux individus. A chaque contexte, ces trois termes
reprsentent des notions smantiques diffrentes.
o,
Plus le fitness de lindividu est petite, plus lindividu est bon. Afin
d'explorer les distributions diffrentes des individus, nous dfinissons deux
oprateurs Mutation et Cross-Over comme suit. La mutation se passe
avec une probabilit de 30%. Ds quun individu est slectionn pour la
mutation, une position dans lensemble de poids des caractristiques est
choisie au hasard. Toutes les valeurs de cet individu partir de cette
position jusqu' la fin seront modifies par de nouvelles valeurs alatoires
24
(voir la figure 4.1).
0.20 0.15 0.20 0.10 0.10 0.15 0.05 0.00 0.05 0.10 0.10 0.10 0.10 0.30 0.05 0.10 0.10 0.05
0.20 0.15 0.10 0.10 0.30 0.05 0.10 0.10 0.05 0.10 0.10 0.20 0.10 0.10 0.15 0.05 0.00 0.05
25
PGN
i
Pi = 9 .
(4)
P
i=1
GN i
o :
Comparer le meilleur
Mettre jour le individu de nouvelle Calculer fitness
Si le nouveau
meilleur individu est meilleur gnration avec le meilleur des individus
courrant. individu jusqu la dernire
gnration
26
4.4 Types de Zones Utilises dans la Scne
- entry zone (zone dentre) : zone o l'objet peut entrer dans la scne.
- exit zone (zone de sortie) : zone o l'objet peut quitter de la scne.
- IO zone (zone dentre/sortie): zone o l'objet peut entrer et galement
quitter de la scne.
- lost zone : zone qui n'est pas un exit zone ou un IO zone, o on perd
souvent le suivi de l'objet.
- found zone : zone, qui n'est pas une entry zone ou une IO zone, o
on retrouve souvent le suivi de l'objet.
- lost-found zone : zone a tous les deux caractristiques lost et found.
Dans les deux figures 4.4 et 4.5, on peut voir deux illustrations de la
description des diffrents types de zone.
27
<Zone ident="9" name = "ZoneIOLeftTop" plane_name =
"ground">
<Properties_list>
<Property name = "In_out_zone:Entry"/>
</Properties_list>
<Outline_list>
<Point x="-830.0" y="-350.0" z = "0"/>
<Point x="-300.0" y="-350.0" z = "0"/>
<Point x="-300.0" y="-100.0" z = "0"/>
<Point x="-830.0" y="-100.0" z = "0"/>
</Outline_list>
</Zone>
Fig 4.4 Description dune entry zone
28
lapprentissage. Pour dterminer ces zones, on lance le processus de suivi
et on rcupre les donnes. Les coordonnes o le systme perd ou retrouve
le suivi des personnes, sont marques. Les positions o on perd le suivi
sont groupes en lost zone. Par contre les positions o on retrouve le
suivi, sont groupes en found zone. Un processus de clustering bas sur
les positions 3D des personnes dans la scne est ralis. Dans notre
approche, nous choisissons lalgorithme Kmean pour le clustering.
Dans la figure 4.7, les bords des lost zones sont colors en jaune,
les bords rouges reprsentent les entry zones, exit zones et IO zones.
29
Fig 4.7 Reprsentation des clusters par les polygones.
Les polygones jaunes reprsentent les bords des lost zones qui
sont le rsultat de lapprentissage
30
avoir pass la lost Tzone. La Found Tzone doit seulement tre cherch
quand lobjet a quitt de son lost Tzone (voir la figure 4.8). Le temps
minimal est assign la diffrence entre linstant o lobjet entre dans la
found Tzone et celui o lobjet quitte de lost Tzone. Le temps
maximal est gal la diffrence entre linstant o lobjet quitte de la
found Tzone, et celui o lobjet entre dans la lost Tzone.
Found Zone 3
Lost Zone 1
Lost Zone 2
Entry Zone 1 1
Entry Zone 2
31
plusieurs trajectoires, le temps minimum et le temps maximum sont
calculs comme la valeur moyenne de temps minimum et de temps
maximum de ces trajectoires. La section suivante prsentera comment les
triplets seront utiliss pour rparer les trajectoires perdues durant le suivi.
32
et 2 qui ont commenc respectivement entry zone 1 et entry zone 2 et
qui ont t perdues le suivi lost zone 1 et lost zone 2. On suppose que
la priorit du deuxime triplet est plus importante que la premire. Alors le
systme va choisir la deuxime trajectoire qui va tre la trajectoire perdue
de la personne P.
Found Zone 3
Lost Zone 1
Lost Zone 2
Entry Zone 1 2
Entry Zone 2
33
CHAPITRE V
EXPERIMENTATION ET VALIDATION
34
Les trajectoires dont la valeur de fiabilit est infrieure un seuil
donn, sont les bruits. Le systme arrive filtrer 4550 cas sur 8394
trajectoires, quivalents 54.2%, qui sont les bruits. Aprs la rparation, ce
nombre est 4481. Les bruits sont dfinis comme les trajectoires des objets
mobiles qui ne sont pas des personnes (voir la section 4.3). Toutefois, la
phase de dexprimentation a montr que ce sont la dure et la longueur
dune trajectoire qui possdent les poids importants pour lexpression de la
valeur de fiabilit. En consquence, les trajectoires dont la longueur est
courte, mme des personnes qui sont galement classifies dans la classe
bruits. Cest pour cela que, non seulement les trajectoires incompltes
sont rpares, mais aussi les bruits ont une capacit dtre rpars et seront
classifis dans la classe trajectoires incompltes plus tard.
Dans le tableau 5.1 on voit une rsum des donnes dans les deux
cas : appliquer et sans appliquer lalgorithme de rparation des trajectoires.
Aprs avoir rpar 340 cas, le nombre des trajectoires diminue clairement
340. Dans la colonne droit (Appliquer la rparation), on peut constater
quil y a une augmentation de nombre des trajectoires compltes et une
diminution de nombre des trajectoires incompltes et de bruits. Aprs la
rparation, le nombre des trajectoires compltes augmente 37, le nombre
des bruits diminue 69. Le changement le plus important entre les deux cas
rside dans la classe Trajectoires incompltes. Dans cette classe, on voit
une diminution jusqu 308 trajectoires. Cela sexplique par plusieurs
trajectoires incompltes qui ont t rpares, toutefois les trajectoires de
rsultats restent eux-mmes dans leur classe. Laugmentation de la valeur
de fiabilit dans ces cas ne suffit pas pour quelles soient classifies dans la
classe trajectoires compltes.
35
Sans appliquer la
Appliquer la rparation
rparation
Pourcentage Pourcentage
Nombre Nombre
(%) (%)
Tableau 5.1 Statistique les donns dans deux cas : appliquer et sans appliquer
lalgorithme de rparation
36
a) b)
c)
Fig 5.1 Images captures avant et aprs la fusion de la trajectoire t = 711s
a) t = 709
b) t = 711, pas dappliquer lalgorithme de rparation. La trajectoire de
personne est coupe.
c) t = 711, appliquer lalgorithme de rparation. La trajectoire de personne est
complte.
On peut voir un autre exemple dans la figure 5.2. Dans cet exemple,
le systme peut suivre avec succs la trajectoire de la personne avec id = 2
(couleur rose).
37
a) b)
c)
38
CHAPITRE VI
CONCLUSION ET PERSPECTIVE
39
caractristiques pour mieux valuer la fiabilit dune trajectoire dans plus
de situations possibles.
Cet algorithme doit tre test avec d'autres vidos, et dans diffrents
scnarios. Bien que le travail ait certains points faibles, cette mthode
ouvre une nouvelle approche pour amliorer tous les algorithmes de suivi et
ces premiers rsultats font louverture dtudes intressantes et
prometteuses dans le futur. Par exemple, on peut tout d'abord augmenter le
nombre de zones dfinies dans le triplet quatre ou cinq, cest--dire le
chemin modlis serait plus long, la capacit de fusion serait donc plus
flexible et plus prcise. Deuximement, la premire zone du triplet nest
pas obligatoirement une entry zone ou IO zone, mais elle pourrait tre
n'importe quel type de zone. Le type de premire zone tel qua propos
dans cet algorithme a limit lespace de la recherche des trajectoires pour la
fusion et, par consquent, a limit la flexibilit de la rparation.
40
REFERENCES
[6] E. Brookner, Tracking and Kalman Filtering Made Easy, John Wiley &
Sons, 1998.
41
[9] Yiithan Dedeolu. Moving Object detection, Tracking and
Classification for Smart Video Surveillance, thesis to obtain the degree
of Master of Science, August, 2004.
[10] Cao Tien Dung, Vido Surveillance, Rapport final du Travail dIntrt
Personnel Encadr, 2007.
[17] Burkay Birant rten, thesis to obtain the degree of Master of Science,
Moving Object Identification and Event Recognition in Video
Surveillance system, July 2005.
42
[18] Raquel R. Pinho, Joo Manuel R. S. Tavares, Miguel V. Correia, An
Efficient and Robust Tracking System using Kalman Filter, VIPSI-
2006 VENICE, 2006.
[20] Din-Chang Tseng, Chun-Wei Lin, and Chi-Ming Ling, Motion object
detection and tracking based on adaptive background subtraction, in
Proc. of the 18th IPPR Conf. on Computer Vision, Graphics and Image
Processing, Taipei, Taiwan, Aug.21-23, 2005, CD.
43