Vous êtes sur la page 1sur 15

RESUME 

Détection de l'écriture humaine est un domaine particulièrement délicat car il est difficile de distinguer les
caractères fondamentaux de l'écriture humaine des significations fondamentales d'un texte, des pseudo
significations…etc. Même si les ordinateurs peuvent effectuer des tâches qui étaient auparavant exécutées
par des humains, ils ont encore des limites quand il s’agit de reconnaître et d’interpréter le langage écrit.
L’objectif du présent document est de démontrer dans quelle mesure les techniques d’intelligence
artificielle peuvent être utilisées pour automatiser la détection des caractéristiques spécifiques présentes
dans les documents écrits afin d’effectuer leur classification selon des critères spécifiques. Pour appliquer
ces techniques à la tâche de classification des documents, il faut d’abord identifier un ensemble de
caractéristiques qui peuvent être appliquées pour identifier et classer les différents types de documents.
Une fois ces caractéristiques identifiées, elles peuvent être utilisées pour former un classificateur qui sera
alors en mesure de reconnaître les types de documents qui entrent dans son champ de vision. Un sous-
ensemble de caractéristiques a été choisi en fonction des résultats d’une étude antérieure portant sur
l’utilisation des caractéristiques linguistiques à des fins de classification des documents.

Mots clés : intelligence artificielle, écritures humaines, apprentissages profonds, apprentissage


automatique.

ABSTRACT: Detection of human writing is a particularly delicate area because it is difficult to distinguish
the fundamental characters of human writing from the fundamental meanings of a text. Even though
computers can perform tasks that were previously performed by humans, they still have limitations when it
comes to recognizing and interpreting written language. The goal of the present paper is to demonstrate the
extent to which artificial intelligence techniques can be used to automate the detection of specific features
present in written documents to perform their classification according to specific criteria. To apply these
techniques to the task of document classification, it is necessary to first identify a set of features that can be
applied to identify and classify the various types of documents. Once these features have been identified,
they can be used to train a classifier that will then be able to recognize the types of documents that come
within its field of view. A subset of features was selected based on the results of a previous study that
investigated the use of linguistic features for document classification purposes.

Keywords: artificial intelligence, human writing, deep learning, machine learning.


INTRODUCTION :
L'intelligence artificielle est au carrefour de nombreuses disciplines, dont l'informatique et les
mathématiques, mais aussi les sciences cognitives ou les neurosciences, nécessitant de nombreuses
expertises complémentaires. L'apprentissage automatique est au cœur de la recherche sur l'IA médicale,
en particulier toutes les techniques d'apprentissage supervisé qui appliquent et améliorent les
connaissances des experts. L'utilisation de l'intelligence artificielle en médecine soulève de nombreuses
questions, notamment le deep Learning, dont l'interprétabilité des modèles reste opaque (même pour
les ingénieurs) et doit être utilisée avec précaution. Elle est définie comme étant la science dont le but
est de faire faire par une machine des tâches que l'homme accomplit en utilisant son intelligence. La
terminologie - malheureuse ! - d'Intelligence Artificielle est apparue en 1956. On peut lui préférer celle
d'Informatique Heuristique. L'informatique est une science du traitement de l'information, l'IA
s'intéresse à tous les cas où ce traitement ne peut être réduit à une méthode simple, précise et
algorithmique. Un algorithme est une séquence d'opérations ordonnées et bien définies qui peuvent
être effectuées sur l'ordinateur actuel et qui peuvent aboutir à une solution dans un délai raisonnable
(minutes, heures ou plus, ... mais pas des siècles !). Cependant, il existe certains domaines où la
reconnaissance de l'écriture manuscrite a été utilisée avec un certain succès. Le Tri automatique des
emails, traitement automatique des fichiers de gestion, formulaires d'enquête, encaissement des
chèques bancaires, etc. La reconnaissance de l'écriture manuscrite est beaucoup plus compliquée que la
reconnaissance de l'écriture imprimée en raison de son extrême variabilité (variabilité de la forme,
espacement des mots à la lettre, variabilité des lignes, similarité d’écriture manuscrite des mots). La
science des données en général et l'apprentissage en profondeur ont révolutionné les algorithmes de
reconnaissance optique de caractères (OCR). Les performances de certaines tâches, comme la
reconnaissance de lettres ou de chiffres, se sont nettement améliorées, notamment grâce aux réseaux
de neurones. Grâce à une architecture très spécifique (convolution, récursivité, etc.), il est possible de
reconnaître des séquences de mots manuscrits. Le text mining, l'analyse des sentiments et la
classification des documents permettent ainsi de donner du sens aux informations extraites du
document.

I. CHAPITRE 1

L’INTELLIGENCE ARTIFICIELLE : DEFENITIONS,


CONCEPTS, HISTOIRE
1. DEFINITIONS :

L’intelligence artificielle entendue comme l’ensemble des technologies visant à réaliser par
l’informatique des tâches cognitives traditionnellement effectuées par l’humain. L’AI, comme tous les
concepts, est soumise à une multitude de définitions. On pouvait s’en tenir aux définitions faites par les
pionniers de la discipline dans les années 1950 et 1960. Mais depuis, le concept n’a jamais cessé d’être
questionné, analysé et déconstruit. Sans, bien sûr, arriver à une définition unique, consensuelle et
idéale. Le fait de comprendre ou de définir « artificiel » d’une part et « intelligence » d’autre part ne
définit pas entièrement « intelligence artificielle ». Définir l’intelligence était et reste un défi. C'est une
fonction fondamentale de l'esprit qui nous permet de comprendre les rapports entre les choses. Fred M.
Tonge soutient que « par « intelligence », nous entendons une propriété d’un système, un jugement
fondé sur l’observation du comportement du système et accepté par les « hommes les plus
raisonnables » comme intelligence. L’« intelligence artificielle » est alors la propriété observée dans les
systèmes non vivants. Le travail dirigé vers la production de tels comportements est donc le travail en
intelligence artificielle. Bien que la définition ci-dessus soit en effet vague, plus utile en suggestivité
qu’en précision, elle devrait suffire à nos fins. Il contient au moins une forte hypothèse – à priori,
l’intelligence n’est pas limitée aux systèmes « vivants ». Et il suggère que, si la question de savoir si
l’intelligence artificielle existe ou existera jamais (ou peut jamais) est vraiment digne d’un autre
argument ou préoccupation, alors un certain accord devrait être atteint concernant les règles
d’observation et d’accord entre les hommes les plus raisonnables. Ici, cependant, nous traiterons le
terme comme simplement une étiquette pratique. L’intelligence artificielle est parfois une science ou
une branche de la discipline informatique ; parfois une famille de technologies ; parfois la capacité des
machines à penser comme les humains. Mais si on conserve la définition de M. Minsky en 1960,
l’intelligence artificielle n’existe pas aujourd’hui, parce qu’aucune machine, aucun algorithme, aucun
ordinateur n’est encore capable de pensée critique. Les capacités des ordinateurs modernes consistent à
calculer massivement, rapidement, résoudre des équations, apprendre, « raisonner », mais tout cela ne
suffit pas à constituer une capacité de pensée critique. L’intelligence artificielle est un système fondé sur
des algorithmes (formules mathématiques) qui, en analysant et en identifiant des tendances dans les
données, peuvent identifier la solution la plus appropriée, c’est une combinaison de technologies qui
permettent aux machines intelligentes de soutenir les capacités humaines et l’intelligence en détectant,
en comprenant, en agissant et en apprenant, permettant ainsi aux gens de réaliser beaucoup plus que ce
qui peut être réalisé sans IA. L’intelligence artificielle désigne les dispositifs, les logiciels et les systèmes
qui sont capables d’apprendre et de prendre des décisions presque de la même manière que les
humains. L’intelligence artificielle permet aux machines, aux appareils, aux logiciels, aux systèmes et aux
services de fonctionner de façon sensée en fonction de la tâche et de la situation. Le terme «  machine »,
très souvent utilisé dans ces définitions, aura sans doute aussi contribué à induire en erreur. Pour les
mathématiciens et les informaticiens, la machine peut être un modèle abstrait (tout comme la machine
de Turing). Mais plus généralement, la machine est un « objet complexe fabriqué capable de
transformer une forme d’énergie en une autre et/ou d’utiliser cette transformation pour produire un
effet donné, pour agir directement sur l’objet de travail afin de le modifier selon un objectif fixé ». Mais
la machine est aussi synonyme de calculatrice, d’ordinateur. On parle encore de langage machine ou de
programme machine en informatique.

TYPOLOGIES

Les typologies sont utilisées pour classer, ordonner et créer des catégories, et fournir des grilles de
lecture qui permettent de saisir un concept dans ses multiples facettes. L’exercice est nécessairement
simplificateur et peut être marqué par la subjectivité. L’une des typologies les plus courantes, conçue
dans les années 1960, repose sur la distinction entre les AI faibles ou étroites, qui sont des AI dédiées à
une tâche ou une fonction spécifique. Ces machines n’apprennent pas par elles-mêmes, toutes les règles
doivent leur être données au préalable (exemple : toutes les règles d’un jeu). L’IA faible est celle qui peut
être produite dans l’état actuel des connaissances et peut donc faire l’objet de stratégies étatiques d’IA  :
« Le gouvernement fédéral a orienté sa stratégie vers l’utilisation de l’IA pour résoudre des problèmes
spécifiques, c.-à-d. vers l’approche « faible ». d'un autre côté l'IA forte ou générale, capable d’apprendre
par elle-même, puis de décider et d’agir comme une personne le ferait. De telles AI n’existe pas encore,
celles qui seraient capables de penser de façon générale et de prendre des décisions fondées sur
l’apprentissage et non sur la formation. Plusieurs tests définissent l’IA générale : le test de Turing ; le test
du café formulé par Steve Wozniak en 2007 ; le test des étudiants de l’Université Robot ; et le test
d’emploi (formulé par Nils John Nilsson en 2005). Certains auteurs ajoutent un troisième niveau,
proposant une IA faible, une intelligence artificielle générale et une super intelligence artificielle ou une
intelligence artificielle supérieure : « La super intelligence est une IA beaucoup plus intelligente que les
humains. Le super-renseignement n’existe pas actuellement, mais il a été proposé qu’il pourrait un jour
être construit, avec des conséquences massives et potentiellement catastrophiques. Les typologies
peuvent consister à décomposer les domaines d’application de l’IA ou de ses principaux domaines de
recherche et développement : « L’intelligence artificielle comprend les principaux sous-domaines
suivants : systèmes fondés sur les connaissances, traitement du langage naturel, vision artificielle ou par
ordinateur, détection/compréhension sonore et robotique.

II. HISTOIRIQUE DE L’IA :


L’IA a fait des progrès spectaculaires depuis quelques années. Des technologies relevant il y a peu de la
recherche, tels l’apprentissage machine ou le deep Learning, sont sorties des laboratoires pour réaliser
des tâches qui semblaient auparavant inaccessibles aux machines, comme reconnaître une image,
traduire de façon satisfaisante un texte simple ou gagner au jeu de Go. Ces technologies sont déjà
présentes dans nos smartphones et constituent l’ossature de nombre de logiciels d’appariement déjà
déployés, par exemple pour la publicité en ligne ou le profilage. Mais le domaine a connu plusieurs
évolutions depuis son apparence en 1950.

L'histoire de l'intelligence artificielle peut être divisée en quatre étapes :

 1.Naissance (1956-1966) ;
 2. Années sombres (1966-1969) ;
 3. Réforme (1969-1979) ;
 4. Institutionnalisation (1979-...).
1. LA naissance (1956-1966)
La naissance officielle de l'intelligence artificielle remonte à 1956 lors d'une conférence tenue au
Darmouth College (Hanover, New Hampshire, USA), au cours de laquelle John Mac Carthy et d'autres
collègues ont nommé la discipline, dont Marvin Minsky, Alan Newell, Herbert Simon et Claude
Shannon. C'est alors la première période dite des années lumière, portée par une grande euphorie et
de grands espoirs de 1956 à 1966. Les premiers algorithmes et programmes datent de cette période :
Logic Theoretician (Newell, Shaw et Simon, 1957) est un démonstrateur de théorèmes de logique
propositionnelle; le perceptron (Frank Rosenblatt, 1958) est une approche probabiliste du stockage
et de l'organisation des informations dans le cerveau ; un résolveur de problèmes généraux (Newell,
Shaw et Simon, 1959) est un programme qui applique une approche récursive, divisant un problème
en sous-problèmes, planifiant, analysant les moyens et les fins pour atteindre un objectif, se
souvenant des tâches précédemment accomplies. En dehors ; ELIZA (Weizenbaum, 1966) est un
programme qui met en œuvre une sorte de conversation naturelle entre l'homme et la machine. Les
phrases sont analysées selon des règles de décomposition. De nombreux projets ont été réalisés
pendant cette période et le nombre de programmes sur divers sujets (traduction automatique de
texte, reconnaissance de caractères, etc.) augmente rapidement.
2. Les années noires (1966-1969)
Dans cette période, il y a le même nombre de projets, mais les résultats sont moins marquants. C'est
alors la période de maturation, où les acquis de la première période peuvent être appliqués et
améliorés.
3. Le renouveau (1969-1979)
Cette période est caractérisée par le développement des systèmes experts. Le but principal de ces
systèmes est d'aider une personne à accomplir une tâche très spécifique. Ces programmes ou
logiciels capturent les connaissances des personnes sur une tâche particulière et peuvent activer
intelligemment certaines parties des informations du modèle grâce à un moteur d'inférence. La
première étape de la mise en œuvre de ces systèmes consiste à modéliser les connaissances
expertes sous la forme de règles de production, telles que "si condition alors action". Ces logiciels
sont composés de différents modules : une base de données, un moteur d'inférence et une interface
homme-machine. Parmi les réalisations les plus célèbres on peut citer : DENDRAL, qui effectue une
analyse automatique des spectres de masse pour déterminer la structure moléculaire du corps
chimique étudié. MYCIN, qui diagnostique les maladies infectieuses du sang et fournit une thérapie
appropriée (Shortliffe, 1976).
4. L’institutionnalisation (1979-…)

Depuis le développement des systèmes experts, l'intelligence artificielle s'est largement répandue dans
l'industrie, et il y a de plus en plus de recherches fondamentales et appliquées. On assiste alors à
l'institutionnalisation de l'intelligence artificielle dans l'industrie, ainsi que dans le milieu universitaire.
D'un point de vue industriel, des outils dérivés de l'intelligence artificielle sont en cours de
développement, tels que les systèmes pilotés par les données, les systèmes d'apprentissage,
l'exploration de données. Lorsque nous utilisons cette dernière approche, comme l'exploration de
données, cela permet aux entreprises de mieux utiliser et exploiter les données dont elles disposent.
D'un point de vue académique, de grands progrès ont été réalisés dans les domaines suivants :
l'apprentissage ou l'apprentissage automatique avec un algorithme spécifique, comme le deep learning ;
les réseaux de neurones; traitement du langage naturel ; reconnaissance vocale automatique;
générateurs d'images ; des arbres de décision, par exemple, avec un logiciel de jeu de Go : Alpha Go,
développé par une société britannique, devenue le premier joueur professionnel en 2015. Ce dernier
logiciel allie techniques d'apprentissage et graphisme. Concernant les langages de programmation,
l'intelligence artificielle a les langages de base suivants : Lisp (MacCarthy, 1960), un langage de
programmation récursif très efficace ; Prolog (Colmerauer, 1973), un langage de programmation logique
qui a ensuite évolué en Prolog avec des restrictions ; SmallTalk (Kay, 1972), un langage de
programmation orienté objet réflexif ; Java; vs. système; etc. Aujourd'hui, l'impact de l'intelligence
artificielle est partout et notamment dans le domaine de l'informatique. Grâce à la combinaison des
techniques existantes de l'informatique et de l'intelligence artificielle, on peut citer des avancées
décisives dans les domaines suivants de l'informatique : la programmation objet ou agent ; Méthodes de
conception de logiciels ; fournir des informations; approches causales; approches qualitatives;
exploration de données, exploration de texte ; statistiques non linéaires avec réseaux de neurones ;
programmation restrictive; nouvelles méthodes d'optimisation (évolution artificielle). De plus,
l'intelligence artificielle a de nombreuses applications dans de nombreux domaines différents. La
recherche médicale utilise des algorithmes de reconnaissance de formes qui peuvent détecter des
cancers invisibles à l'œil humain sur la base d'images de type IRM.

La sécurité nationale utilise des algorithmes de reconnaissance faciale qui peuvent détecter un
comportement anormal dans les foules. La domotique développe des robots mobiles capables de
détecter les obstacles et de se réorienter automatiquement. Le premier robot de ce type a été présenté
lors de la Conférence Internationale sur l'Intelligence Artificielle (IJCAI) à Chambéry en 1993. Les
applications commerciales de ce robot sont désormais nombreuses, car l'aspirateur et le cutter tournent
et fonctionnent indépendamment. Ces robots peuvent utiliser la caméra pour détecter les obstacles sur
leur chemin, analyser l'image correspondante et conclure qu'il s'agit d'un obstacle. Ils peuvent alors se
rendre seuls. De nombreux systèmes interactifs d'aide à la décision (SIAD) ont été développés pour les
domaines médical, policier et juridique. La modélisation se fait d'abord, par exemple, sous la forme
d'arbres de décision, où des probabilités sont associées à chaque branche de l'arbre. L'utilisateur peut
alors modifier certains paramètres (par exemple, modifier la probabilité d'occurrence) et voir ce que le
système propose comme solution au problème proposé. La résolution du problème a alors lieu dans
l'interaction entre l'homme et la machine, et l'utilisateur contrôle le processus de résolution du
problème. Si l'on prend l'exemple de la médecine et du diagnostic médical, le système est un guide pour
le médecin novice. Ainsi, le médecin peut modifier certains paramètres du logiciel, comme la probabilité
de propagation du virus, et voir ce que le logiciel peut proposer comme diagnostic. Les systèmes de
recommandation sont actuellement utilisés dans de nombreuses applications, telles que les réseaux
sociaux, la publicité ciblée, les sites de rencontres et l'analyse des performances organisationnelles. Les
systèmes de recommandation représentent l'évolution des systèmes d'aide à la décision. Il existe trois
types de recommandations. La recommandation collaborative mesure la proximité de deux utilisateurs
(ou agents) et une recommandation est faite en fonction de cette proximité : par exemple, un ami d'un
ami m'est recommandé dans un réseau social. Ensuite, la recommandation basée sur le contenu suit les
préférences passées de l'utilisateur. Ces paramètres constituent le profil de l'utilisateur. Sur la base de ce
profil, les destinations les plus proches sont recommandées à l'utilisateur. Si l'on prend l'exemple du
shopping en ligne et de l'achat d'un livre, plusieurs critères (prix, auteur, genre littéraire : science-fiction,
policier, etc., type de livre : broché, broché, etc.) forment un profil d'utilisateur et un livre. Le système
recherche alors dans sa base de données le livre le plus proche de l'utilisateur. La limitation de ce type
de recommandation est connue des nouveaux utilisateurs, pour lesquels le système ne connaît pas
encore leurs préférences. Pour résoudre ce problème, il existe donc une approche hybride :
collaborative et basée sur le contenu. Cependant, d'autres problèmes tels que la sérendipité existent
toujours. Les recommandations sont toujours faites sur la même base sans mises à jour. Ce problème a
été résolu.

CHAPITRE 2 :

L’INTERVENTION DE L’IA DANS LE DOMAINE DE LA


DETECTION DE L’ECRITURE HUMAINE
La reconnaissance de l’écriture manuscrite manuscrit ou imprimé reste un sujet la recherche et
l'expérimentation, même si le problème n'est pas entièrement résolu On sait atteindre des cadences
assez élevées dans certaines applications Soit le vocabulaire est limité, soit la police de caractères est
unique ou limitée. Cependant, il existe plusieurs domaines qui nécessitent la reconnaissance de
l'écriture manuscrite Applications avec un certain succès : classement automatique du courrier,
traitement Automatisez le traitement des documents administratifs, des questionnaires, et même
Registre des chèques bancaires. La reconnaissance de l'écriture manuscrite est Beaucoup plus
complexe que le texte imprimé en raison de son extrême variabilité : La variabilité des formes,
l'espacement entre les mots et les caractères, l'ondulation des lignes.

Section 1 : Systèmes de reconnaissance de l’écriture manuscrite.

Aujourd'hui, la reconnaissance de l’écriture est omniprésente. Utiliser le Web profond Reconnaître les
visages de millions de citoyens qui passent chaque jour devant les caméras de surveillance, permettant ainsi
une réduction substantielle Arriérés, alors même que le processus suscite la controverse sur l'utilisation de
l'IA régime autoritaire. Dans un contexte plus favorable, les années à venir verront Grâce à un algorithme
d'apprentissage en profondeur, la première voiture autonome est officiellement lancée Capable de
reconnaître les piétons, les panneaux de signalisation et de prévoir le trafic Trajectoires des objets sur la
route. Aucun système ne reconnaît actuellement l'écriture manuscrite aussi universellement que n'importe
quelle personne alphabétisée. Les systèmes existants se répartissent en deux grandes catégories de
méthodes de reconnaissance : la reconnaissance hors ligne ou « statique » et la reconnaissance en ligne ou
« dynamique ».
 C'est un problème de reconnaissance du texte manuscrit dans le cas hors ligne Documents
pré-écrits. Utilisation d'images de texte écrit scanners, les informations collectées se
présentent sous la forme d'images discrètes Se compose d'un ensemble de pixels. L'écriture
prend un aspect de signalisation spatiale Numérisation 2D.
 Dans le cas en ligne, il s'agit de reconnaître du texte tout en dessinant. Le texte est saisi avec
un stylet et une tablette numérique, des informations La collection consiste en une séquence
ordonnée de points (définie par coordonnées) sont échantillonnés à un taux fixe. Le texte
apparaît en couple signal horaire numérisé.

La détection hors ligne ne peut a priori pas être basée sur les informations de temps de graphique perdues,
mais elle peut tenir compte de l'épaisseur du graphique (lignes pleines et supérieures). La détection Web
peut contenir des informations de synchronisation (vitesse, accélération, levées de stylet, limites
d'extrémité, barres en T, points diacritiques) mais pas d'informations d'épaisseur de ligne s'il n'y a pas de
signal de pression de la pointe du stylet au support.

La reconnaissance en ligne et hors ligne :

Ce sont deux modes OCR différents, chacun avec ses propres outils d’acquisition et les algorithmes de
reconnaissance correspondants.

 En ligne :

Ce mode de reconnaissance s'opère en temps réel (pendant l'écriture). Les symboles sont
reconnus au fur et à mesure qu'ils sont écrits à la main. Ce mode est réservé généralement à
l'écriture manuscrite. C’est une approche où la reconnaissance est effectuée sur des données
à une dimension. L’écriture prend l’aspect d’un couple de signaux temporels numérisés. La
reconnaissance en ligne présente un avantage majeur c'est la possibilité de correction et de
modification de l'écriture de manière interactive vu la réponse en continu du système.
L'acquisition de l'écrit est généralement assurée par une tablette graphique munie d'un stylo
électronique.

 Hors ligne :

Démarre après l'acquisition. Elle convient aux documents imprimés et les manuscrits déjà
rédigés. Ce mode peut être considéré comme le cas le plus général de la reconnaissance de
l'écriture. Il se rapproche du mode de la reconnaissance visuelle. L'interprétation de
l'information est indépendante de la source de génération. Il s'agit de données bien
structurées dont la lecture nécessite la connaissance de la typographie et de la mise en page
du document. Ici la démarche n'est plus un simple prétraitement, mais une démarche experte
d'analyse de document il y'a localisation des régions, séparation des régions graphiques et
photographique, étiquetage sémantique des zones textuelles à partir de modèles,
détermination de l'ordre de lecture et de la structure du document.

Voici quelques exemples d'applications informatiques utilisant les systèmes de reconnaissance d'écriture :

1- Prenez des notes avec un stylet électronique directement sur l'écran d'un PDA ou d'une tablette et
vous pouvez les éditer avec un logiciel de traitement de texte.
2- Écrivez des messages ou des e-mails avec le stylet sur l'écran de votre smartphone.
3- Écrire des formules mathématiques sur l'écran de la tablette.
4- Traduire des documents papier : par exemple numériser un document manuscrit avec un scanner et
le transformer en document modifiable avec un logiciel de traitement de texte.
5- L’indexation des documents d'archives : il s'agit souvent de documents endommagés difficilement
accessibles au public, leur numérisation et l'identification de certaines parties du document (par
exemple le nom dans le fichier de la population) pour faciliter la recherche.
6- Trier automatiquement le courrier en scannant automatiquement les adresses postales sur les
enveloppes.
7- Formulaires remplis à la main : par exemple, enquête, bon de commande ou chèque. Ces différents
exemples correspondent à l'analyse d'un document contenant une écriture manuscrite plus ou
moins complexe. Selon les cas, l'identification consiste à identifier le document entier, les mots ou
seulement une partie de celui-ci.

Pour mieux expliquer le système de la détection de l’écriture humaines, ils existent des solutions et
approches qu’on va les présenter dans les sections suivantes.

Section 2 : LA RECONNAISSANCE D’ECRITURE ARABE MANUSCRITE

2.1. Présentations de la langue arabe :

L'arabe littéraire, l'arabe moderne unifié ou l'arabe classique est une variante de la langue arabe
utilisée comme langue officielle dans tous les pays arabes et comme langue commune entre les pays arabes.
Il est également utilisé dans la plupart des écrits et parlé dans des situations officielles ou formelles (discours
religieux, politiques, journaux télévisés). L'arabe verbal se distingue ainsi de l'arabe dialectique, qui est la
langue parlée au quotidien après la diffusion de l'islam. Cette gamme de langues comprend plusieurs
dialectes locaux, qui peuvent varier considérablement d'un pays à l'autre. Dans tous les pays arabes, on
parle un dialecte national composé de plusieurs dialectes locaux. Aucun de ces dialectes n'est
complètement identique à l'arabe classique ou littéraire. Il convient également de noter que le persan
(persan), qui est principalement utilisé en Iran et en Afghanistan, présente de nombreux points communs
avec l'écriture arabe.

2.2. Reconnaissance de l’écriture Arabe par le deep Learning :

Grâce aux progrès du deep Learning, le CNN (Convolution Neural Network) a été largement étudié.
Son avantage est qu'il n'est pas susceptible de se déformer. Le coût de calcul associé à l'extraction
d'informations à partir d'une image est immédiatement minime. CNN a des paramètres si avancés que l'OCR
et la fonction de reconnaissance sont grandement améliorés dans la scène naturelle. Les techniques
actuelles basées sur l'utilisation des CNN peuvent être classées en plusieurs sous-catégories, y compris les
techniques basées sur la segmentation, les techniques basées sur les recommandations régionales et les
techniques hybrides qui utilisent l'apprentissage multiple. Les sections suivantes incluent une discussion sur
la reconnaissance et la reconnaissance de texte d'apprentissage en profondeur (CNN).

2.3. Détection de texte arabe dans les vidéos


Contrairement aux légendes de scènes, les crédits vidéo ou les synopsis ne doivent pas nécessairement
se limiter à quelques mots. Il peut être constitué d'un ou plusieurs escaliers de longueur inégale. Par
conséquent, la préparation des étapes de textes intégrés dans les vidéos est un refuge obligatoire avant la
reconnaissance. La préparation consiste à identifier les zones de texte à partir du fond et leur délimitation
précise dans l'image vidéo avec, par exemple, des zones de séparation. La tâche est simple avec un arrière-
plan uniforme où un simple seuil peut résoudre le problème. Cependant, lorsque le contenu vidéo est plein
d'arrière-plan et d'environnement complexe (différentes couleurs, contraste, luminosité, etc.), la
reconnaissance de texte devient une exigence difficile. Cela renvoie, d'abord, à la complexité de la
distinction entre les zones textuelles et non textuelles et à la vigilance pour atteindre l'endroit exact. Il existe
plusieurs autres problèmes textuels, en particulier dans le texte arabe. Le texte arabe a des caractéristiques
textuelles différentes par rapport aux textes latins ou chinois : plus de traits dans l'autre sens, des polices et
des rapports de caractères différents, plus de signes diacritiques au-dessus et au-dessous des caractères,
etc.

2.4. Difficultés inhérentes à la reconnaissance de l’écriture arabe :

Alphabet :

Il y a 28 lettres dans l'alphabet arabe. La forme des lettres dépend de leur position dans le mot.
Certaines lettres peuvent avoir jusqu'à formes différentes. La présence d'un lien avec une lettre précédente
ou suivante ne modifie pas significativement la forme de la lettre. En arabe, les liens sont toujours sur la
ligne d'écriture, c'est-à-dire. Il n'y a pas de grande lettre de connexion comme 'o' ou 'v' dans l'alphabet latin,
mais il y a des connexions verticales.

Signes diacritiques :
Le terme « signe diacritique » peut prêter à confusion : dans certaines œuvres, seules les voyelles arabes
sont appelées diacritiques. Dans d'autres ouvrages, au contraire, tous les caractères secondaires, qu'il
s'agisse de voyelles, de points ou d'autres caractères, sont appelés signes diacritiques.

Nous utilisons ici une terminologie différente : un signe diacritique est un élément secondaire d'une lettre
qui la complète ou en change le sens.

Des points nécessaires pour différencier les lettres :


Dans l'alphabet arabe, 15 des 28 lettres ont un ou plusieurs points. Ces signes diacritiques sont soit au-
dessus, soit au-dessous de la forme à laquelle ils sont associés, mais jamais les deux.

Section 3 : La reconnaissance des écritures manuscrites dans le domaine de la


médecine et la détection du sexe par l’écritures humaines.

3.1. La reconnaissance des écritures humaines dans la médecine :

Les médecins ont souvent du temps à perdre, les ordonnances qu'ils rédigent à la va-vite lors de la
consultation sont destinées à un autre professionnel qui peut les comprendre assez facilement (prise de
sang, radiographie, etc.). Mais les pharmaciens eux-mêmes ont parfois même du mal à interpréter le
médicament. Recettes Lors de sa conférence annuelle "Google for India" qui s'est tenue le 19 décembre, la
société a annoncé que l'application Google Lens pourrait les aider.

L'idée serait que les gens utilisent leur smartphone pour scanner la recette. L'IA se chargera alors de traduire
l'écriture manuscrite de votre médecin et pourra ainsi identifier les médicaments écrits dans l'ordonnance,
comme l'explique Google : « Nous avons publié aujourd'hui un modèle d'intelligence artificielle et
d'apprentissage automatique à la pointe de la technologie qui peut reconnaître et même afficher les
médicaments dans les ordonnances manuscrites. Il agit comme une technologie d'assistance pour les
ordonnances manuscrites. la numérisation des dossiers médicaux, l'ajout de personnes au cercle, comme les
pharmacies, mais la décision n'est pas prise uniquement en fonction du résultat obtenu par le docteur cette
technologie. ».

Si les médecins utilisent de plus en plus des ordinateurs pour rédiger des ordonnances, tous ne le font pas,
et dans ce cas leur écriture est en effet impossible à lire pour le patient, ce qui peut poser des problèmes
notamment lors du contrôle des doses. Google a récemment dévoilé un modèle d'intelligence artificielle et
d'apprentissage automatique à la pointe de la technologie, capable d'identifier et même de mettre en
évidence des médicaments sur la base d'ordonnances manuscrites.

Sortie en 2017, l'application Google Lens intègre l'intelligence artificielle pour identifier un objet sur une
photo de smartphone. S'il peut traduire les menus, il ne peut toujours pas le faire pour les recettes. Le
directeur de recherche de Google Research India, Manish Gupta, déclare dans son blog : "Ironiquement, ce
qui rend les ordonnances difficiles à scanner est la même chose qui les rend difficiles à lire - elles sont non
structurées, abrégées et pleines d'indices que les pharmaciens peuvent interpréter.". C'est pourquoi Google
travaille avec des médecins et des pharmaciens pour relever ce défi, auquel d'autres entreprises ont
répondu en vain, et pour ajouter une nouvelle fonctionnalité à Google Lens. Prenez une photo d'une
ordonnance ou téléchargez-la, l'IA et le modèle ML l'analyseront pour identifier et mettre en évidence les
médicaments dans les ordonnances manuscrites.

3.2. ANALYSE AUTOMATIQUE DE L'ECRITURE MANUSCRITE POUR LA DETERMINATION


DU SEXE D'UN INDIVIDU :

De nombreux systèmes ont été proposés et développés pour l'analyse automatique de documents
manuscrits, ciblant principalement des applications telles que la reconnaissance de l'écriture manuscrite, la
vérification de mots, l'identification et l'authentification de l'auteur. Signatures manuscrites. Cependant, la
détermination automatique du sexe d'une personne sur la base de l'écriture manuscrite a été un domaine
relativement inexploré avec seulement quelques implications significatives. Certains travaux ont étudié la
détection de catégories démographiques individuelles telles que le sexe, l'écriture manuscrite et l'âge des
documents manuscrits. Comme indiqué précédemment, plusieurs études ont montré que le sexe (genre) de
l'écrivain peut être déterminé par l'écriture manuscrite avec plus ou moins de succès. Ceci est corroboré par
l'observation selon laquelle les personnes qui interagissent avec des documents manuscrits, comme les
enseignants, apprennent au fil du temps à faire la distinction entre l'écriture des filles et celle des garçons.
Des réviseurs humains formés peuvent également prédire le sexe de l'auteur d'un document manuscrit avec
suffisamment de précision pour surmonter le hasard. Les psychologues attribuent les différences d'écriture
entre les écrivains masculins et féminins à la coordination motrice ou aux différents types d'hormones qu'ils
produisent. Dans ce cas, les chercheurs ne sont pas d'accord sur la relation entre le sexe et l'écriture
manuscrite. Les psychologues disent généralement que l'écriture des femmes se caractérise par une écriture
soignée, bien organisée, ronde, petite et symétrique. En revanche, l'écriture rapide, irrégulière,
désordonnée, sinueuse et oblique appartient davantage à l'écrivain masculin.
Conclusion :

Ces dernières années, l'intelligence a presque toujours été associée à la capacité d'apprendre. Grâce à
l'apprentissage, un système intelligent capable d'accomplir une tâche peut améliorer ses performances
grâce à l'expérience. Grâce à l'apprentissage, il peut apprendre à effectuer de nouvelles tâches et acquérir
de nouvelles compétences. Dans le domaine de l'intelligence artificielle, l'apprentissage n'a pas toujours été
considéré comme nécessaire à l'intelligence. Dans le passé, la construction d'un système intelligent
impliquait d'écrire un programme "à la main" pour jouer aux échecs (recherche arborescente), reconnaître
des caractères imprimés (par rapport à des images prototypes) ou établir un diagnostic médical basé sur des
symptômes (en utilisant un raisonnement logique), et des règles écrites par des experts.

La R&D a beaucoup investi dans le traitement du langage naturel : compréhension de texte, systèmes de
questions-réponses, systèmes de dialogue d'agents virtuels et la traduction automatique. Une révolution de
l'apprentissage en profondeur a été annoncée dans ce domaine, mais elle n'est pas encore terminée.
Cependant, nous assistons à un développement rapide. Lors du dernier concours international de traduction
automatique, le gagnant a utilisé un réseau récurrent. La communication entre les humains et les appareils
électroniques s'est considérablement accrue alors que les chercheurs s'efforcent de développer des
programmes intelligents capables de reconnaître l'écriture manuscrite et les mots en peu de temps.

Malgré tous ce progrès, nous sommes encore très loin de produire une machine aussi intelligente que
l’humain, ni même aussi intelligente qu’un rat.
BIBLIOGRAPHIE

Daniel, V. (2020). Artificial Intelligence, Cybersecurity and Cyber Defense. Great Britain and the United
States: ISTE Ltd and John Wiley & Sons, Inc

Khaled, G. (2022). La détection et la reconnaissance de l’écriture arabe manuscrite en utilisant les RNC.

Université Mohamed Khaider de Biskra -louam_abdelhak_bilal.pdf - MÉMOIRE DE MASTER-thème : -Année


universitaire : 2018 – 2019.

P.M. Lallican, C. Viarp-Gaudin, S. Knerr : « From off-line to on-line handwriting recognition ».Proc. 7th
workshop on frontiers in handwriting recognition, pp. 303- 312, Amsterdam 2000.

A. Cornuéjols, L. Miclet, Y.Kodratoff, « Apprentissage Artificiel, Concepts et algorithmes » ISBN 2-212-11020-


0, 2002

Isaac, H. (2017). Texte mining et reconnaissance d’écriture appliqués à l’assurance

Sites web :

- https://www.clubic.com/pro/entreprises/google/actualite-451035-ordonnances-illisibles-google-
pense-a-une-ia-capable-de-comprendre-l-ecriture-de-votre-medecin.html

Vous aimerez peut-être aussi