Académique Documents
Professionnel Documents
Culture Documents
1
the recognition crew Bitar Hero
2 L’equipe 8
2.1 Benoit . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Pierre . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Ludovic . . . . . . . . . . . . . . . . . . . . . . . 9
3 Pré-traitement de l’image 10
3.1 Binarisation . . . . . . . . . . . . . . . . . . . . . 10
3.1.1 Niveau de gris . . . . . . . . . . . . . . . . 10
3.1.2 Calcule du seuil . . . . . . . . . . . . . . . 10
3.2 Noir&Blanc . . . . . . . . . . . . . . . . . . . . . 10
3.3 Filtres . . . . . . . . . . . . . . . . . . . . . . . . 11
4 Rotation 12
4.1 Detection d’angle . . . . . . . . . . . . . . . . . . 12
5 Segmentation 14
5.1 Detection de bloc . . . . . . . . . . . . . . . . . . 14
5.2 Detection de ligne . . . . . . . . . . . . . . . . . 14
5.3 Detection de caractère . . . . . . . . . . . . . . . . 14
6 Réseau de neurone 15
6.1 Fonctionnement : . . . . . . . . . . . . . . . . . . 15
6.2 Pourquoi l’utilisons nous ? . . . . . . . . . . . . . . 17
7 Site Web 19
2
the recognition crew Bitar Hero
8 Notre programme : 20
8.1 Installation : . . . . . . . . . . . . . . . . . . . . . 20
8.2 Commandes : . . . . . . . . . . . . . . . . . . . . 20
9 Retour d’experience 21
9.1 Benoit . . . . . . . . . . . . . . . . . . . . . . . . 21
10 Conclusion 22
3
the recognition crew Bitar Hero
1 Introduction
1.1 Un peu d’histoire
La première machine de ROC fut créée par Gustav Tauschek,
un ingénieur allemand, en 1929. Elle contenait un détecteur pho-
tosensible qui pointait une lumière sur un mot lorsqu’il correspon-
dait à un gabarit contenu dans sa mémoire.
4
the recognition crew Bitar Hero
Les autres systèmes vendus par IMR à la fin des années 1950
comprenaient un lecteur de bordereau de facturation à l’Ohio Bell
Telephone Company et un numériseur (scanner de documents) à
l’US Air Force pour la lecture et la transmission par telexessages
dactylographiés. IBM et d’autres utilisèrent plus tard les brevets
de Shepard.
5
the recognition crew Bitar Hero
1.2 Le principe
Un système ROC part de l’image numérique réalisée par un
scanner optique d’une page (document imprimé, feuillet dactylo-
graphié, etc.), ou une caméra numérique, et produit en sortie un
fichier texte en divers formats (texte simple, formats de traite-
ments de texte, XML...).
6
the recognition crew Bitar Hero
7
the recognition crew Bitar Hero
8
the recognition crew Bitar Hero
2 L’equipe
Le groupe :
Comme cela a été dis plus haut, nous sommes un groupe dif-
férent des autres... En effet le normalement, ni plus, ni moins de
quatre personnes de Krisboul n’a pas été respecté pour nous ! Pour
arranger le tout, nos bon vieux racks nous font faux bon cette an-
née, même si la partie physique du rack n’est pas en cause, la partie
logiciel nous a laissé perplexe... A chaque allumage/extinction de
nos bécane, nous craignons de flinguer le system d’exploitation...
Dommage...
2.1 Benoit
Salut moi c’est Benoit alias Yuki, j’ai 21 ans et je compte faire
carrière soit dans le domaine du jeu video soit dans le Chiffre. J’ai
une passion assez prononcé pour le jeu en général, et en parti-
culier quand il est intéresser. Cela peut allez du poker au course
en ligne bien que je joue très peu d’argent. J’ai pour habitude
de lire beaucoup sur les sujets qui m’intéresse, en particulier des
9
the recognition crew Bitar Hero
2.2 Pierre
Je me présente, Pierre Peretti ou le Corse fou pour certain,
pourtant je suis aussi Breton... Je suis passionné d’informatique,
de mécanique et de musique depuis ma tendre enfance. J’ai grandi
avec Adibou, Zelda et Mario Kart. Je suis fils unique, j’ai pas pu
taper de petit frère, mais c’est cool j’ai plus de cadeaux ! J’ai
décider d’entré a Epita lorsque j’étais en 4 ème, et je ne suis pas
déçus... Quoi que... Les dumps de cette n’ont pas été un très bon
millésimes... Je fais parti d’un groupe de musique en tant que
guitariste, je fais des solos qui déchire (ou pas) ! J’ai encore une
copine, heureusement qu’elle ne lit pas le "encore" sinon je suis
mort ! Je m’occupe principalement de la partie réseaux de neurone
et rotation de l’image.
2.3 Ludovic
Forcé par ses parents à travailler dans un camps chinois, j’ai
connu le milieu informatique par un jeune collaborateur. J’ai ré-
paré des ordinateurs jusqu’à l’âge de 10 ans. Ensuite mes parents
ont décidé de m’envoyer à l’étrangé afin de fructifier mes grandes
connaissances dans le milieu en m’envoyant en France à l’Epita.
Plus sérieusement je suis un gars normal de 20 ans qui aime l’in-
novation et les crêpes. Ce projet ma permis d’apprendre beaucoup
de mes erreurs (et il y en a beaucoup)
10
the recognition crew Bitar Hero
3 Pré-traitement de l’image
3.1 Binarisation
3.1.1 Niveau de gris
3.2 Noir&Blanc
La Binarisation permet de faire ressortir le texte qui générale-
ment en noir, dans une page généralement blanche. En binarisa-
tion on accentue la différence entre le fond et le texte La binari-
sation consiste à différencier les pixel que l’on vas mettre en noir
ou en blanc.
11
the recognition crew Bitar Hero
3.3 Filtres
Filtre passe-bas Pour éliminer une partie du bruit nous uti-
lisons un filtre passe bas qui vas appliqué la moyenne des pixel
voisin au pixel traité. Celui-ci a pour inconvénient de crée un lé-
ger flou et donc d’adoucir les bords des caractères.
12
the recognition crew Bitar Hero
4 Rotation
Lorsque nous voulons étudier une image, certaine d’entre elle ne
sont pas droite, et nécessite donc d’être redresser. Sinon il devient
quasiment impossible d’analyser les caractères et donc d’arriver a
notre but.
C’est bien beaux tout ça, on peut faire une rotation, mais on
ne connait pas l’angle...
13
the recognition crew Bitar Hero
14
the recognition crew Bitar Hero
5 Segmentation
Le but de la segmentation est de detecté l’ensemble des carracté
sur la page, pour ceci on decompose le travil en plusieur etapes.
Dans un premier temps on doit extraire les blocs de texte pre-
sents sur la page, pour cela un doit utilisé un algorithme XY-cut.
dans un second temps en detecte les ligne dans les bloc de texte
pour enfin isolé chaque charactere afin de les envoyer au reseau de
neuronne pour les identifier
15
the recognition crew Bitar Hero
6 Réseau de neurone
6.1 Fonctionnement :
Le réseaux neurone est construits sur le fonctionnement des
neurones qui constitues notre cerveau. Deux neurologues Warren
McCulloch et Walter Pitts publièrent dès la fin des années 1950
des travaux sur les réseaux de neurones.
16
the recognition crew Bitar Hero
17
the recognition crew Bitar Hero
18
the recognition crew Bitar Hero
19
the recognition crew Bitar Hero
7 Site Web
La visibilité du projet est importante, c’est pourquoi nous avons
décidé de créer un site internet pour le projet qui nous permettra
d’avoir de la visibilité sur internet, importante a l’heure actuelle
Par contre, l’un des problèmes de Wordpress, c’est que les ser-
20
the recognition crew Bitar Hero
8 Notre programme :
8.1 Installation :
Afin de compiler les sources du programme et produire un
fichier binaire exécutable, placez vous dans le répertoire ou les
sources on été décompressée. Utilisez la commande make, pour
compiler. Si vous désirez supprimer les fichier temporaire issu de
la compilation, utiliser la commande make clean.
8.2 Commandes :
-demo [arg]
21
the recognition crew Bitar Hero
9 Retour d’experience
9.1 Benoit
Ce que m’a apporter le projet :
Au début de l’année, je ne savais pas ce qu’était un ocr, je
n’en avais d’ailleurs jamais entendu parler, ou pas avec ce terme,
maintenant je sais exactement ce que c’est et comment cela fonc-
tionne. Je n’étais pas non plus au courant des possibilités apporté
par Ocaml. Cela m’a aussi montrer un aperçu (très réduit) de ce
qui va m’attendre en deuxième semestre et plus tard en ING1, a
savoir une charge de travail de plus en plus importante (pour ne
pas dire, qui va croître de manière exponentiel), et qui va falloir
que je m’organise pour y répondre de manière beaucoup plus cor-
recte. J’ai aussi su que je préfère la partie théorique à la partie
pratique, et que je vais devoir travailler très largement ce dernier
point.
22
the recognition crew Bitar Hero
10 Conclusion
Ce projet fut une bonne experience, nous avons surmonté de
nombreux probleme meme si il en reste beaucoup. Son orienta-
tion tres algorithmique etait tres interessante. Nous avons mal
géré notre temps ce qui a eu des consequences negatives sur le
rendu.Nous sommes somme deçu de ne pas avoir était jusqu’au
bout du projet. Cela reste une bonne experience quand meme du
fait de son sujet et de son language (OCaml) .
23