Vous êtes sur la page 1sur 14

MINISTERE DE L’ENSEIGNEMENT SUPERIEUR

ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE «ABBÉS LAGHROUR» DE KHENCHELA
FACULTE DES SCIENCES ET DE LA TECHNOLOGIE 

Machine Learning
Détection Automatique de langues

Module : Techniques D’expression


Prof : Dr. Hemmam
Etudiant : Merouane Boudraa

11/26/21 STW 1
Sommaire
 Introduction:
Introduction sur le ML.
Introduction sur DAL.
 Domaine d’application
 Technique pour DAL
 Exemple D’application
 Conclusion
 Webographie

11/26/21 STW 2
11/26/21 STW 3
 Le Machine Learning est une discipline consacrée à l’analyse des
données. Le but de cette discipline est de créer de la connaissance de
manière automatique à partir de données brutes. Cette connaissance
(ou modèle) peut alors être exploitée pour prendre des décisions.

 Dans ce siècle où tout va si vite, où les nouvelles technologies prennent


une part de plus en plus importante dans notre vie, peut-on affirmer
que le virtuel et le naturel peuvent coexister en matière
d’apprentissage ? On parle beaucoup d’intelligence artificielle, mais
peut-on faire un lien entre cette science et les langues ?.

11/26/21 STW 4
 La Détection automatique de langue est une discipline
à la frontière de la linguistique, de l'informatique et de
l'intelligence artificielle.

 Elle concerne la conception de systèmes et techniques


informatiques permettant de détecter le langage
humain dans tous ses aspects

11/26/21 STW 5
Domaines d’applications :

 Le DAL est un domaine bien vaste qui comporte trois types


d’applications principales :

 Celles en relation avec la création ou la modification automatique de


textes (traduction, génération, correction, reformulation…)

 Celles en relation avec la détection du signal (reconnaissance,


synthèse et détection de la parole)

 Celles en relation avec l’extraction d’information (recherche,


reconnaissance, classification…).
 

11/26/21 STW 6
technique d’apprentissage automatique utilisée pour
la DAL :

 L’Apprentissage automatique C’est une méthode


mathématique, statistique
 Appliquée à la langue elle permet d’obtenir des
résultats rapidement, sans devoir modéliser les
phénomènes linguistiques .

 On peut obtenir des résultats plus ou moins


satisfaisants (selon la tâche) qui sont très difficiles à
améliorer.
 

11/26/21 STW 7
1. Phase d’apprentissage :

 On fournit à la machine un corpus


d’apprentissage : un grand corpus avec des
textes et des analyses correctes.

 L’algorithme calcule des fréquences dans le


corpus d’apprentissage.

11/26/21 STW 8
2. Phase de test :

 On teste le système sur un petit corpus de test.


Pour ce corpus on connaît l’analyse correcte,
mais la machine doit l’obtenir uniquement à
partir du texte.
 On compare la sortie du système avec
l’analyse correcte.
 Si le résultat n’est pas satisfaisant, on
recommence l’apprentissage avec un nouveau
corpus plus grand.

11/26/21 STW 9
Exemple

 Phrase à analyser :
 « Ahmed ouvre la porte. »
 4 mots : « Ahmed », « ouvre », « la », « porte »

 « Ahmed » : ??? (Ce mot n’était pas dans mon corpus d’apprentissage)
 « Ouvre » : dans le corpus d’apprentissage tous les occurrences de «
ouvre » était des verbes, donc VERBE
 « la » : dans le corpus d’apprentissage 90% des « la » était des articles
définis, donc ARTICLE DEFINI (c’est le plus probable)
 « porte » : dans le corpus d’apprentissage c’était un verbe ou un nom.
Mais dans 95% des cas où « porte » était précédé de « la », c’était un nom,
donc NOM.
 « Ahmed ouvre la porte. »
 ??? VERBE A. DEF NOM.

11/26/21 STW 10
Technique : problèmes

 La qualité du système dépend très fortement


de la taille du corpus d’apprentissage.
 Pour un analyseur morpho-syntaxique viable,
il faut un corpus d’apprentissage de plusieurs
centaines de milliers de mots analysés.
 analyse manuelle très couteuse
 analyse manuelle, donc erreurs humaines ou
incohérences entre les analyses produites par
différentes personnes.

11/26/21 STW 11
Exemple D’application de détection automatique de
langues :

 << Google Traduction (en anglais : Google Translate) est un service fourni


par Google qui permet de traduire un texte ou une page Web dans une autre
langue.
 Le service comprend également une traduction de pages Web, avec laquelle
une longue page Web, même contenant plusieurs milliers de mots, peut être
traduite. La navigation entre pages Web en traduction est assurée, avec des
limites.
 Google Translate, comme les autres outils de traduction automatique, a ses
limites. S'il peut aider le lecteur à comprendre le contenu général d'un texte en
langue étrangère, il ne permet pas de fournir des traductions précises. Par
exemple, il traduit souvent des mots hors contexte et ne permet pas
d'appliquer une grammaire fiable. C'est pour cette raison qu'il n'est pas utilisé
dans des plateformes qui demande une précision totale de traduction comme 
booking. Pour séduire des lecteurs, il faut une perfection dans le langage, ce
que google traduction n'assure pas. >>
 

11/26/21 STW 12
Conclusion

 Les langues fait définitivement partie de notre vie quotidienne, de notre


enseignement et de nos pratiques éducatives. C’est pour ca L’IA en lui
offrant une plusieurs applications concernent la DAL pour lui simplifier
la vie.

 En effet, comme le dit Nicolas Sekkaki, le PDG d’IBM France : « C'est une
chose de traduire une langue. Ce serait facile de traduire, mais on ne
réfléchit pas de la même façon en français et en anglais, en allemand et en
espagnol. Il y a la langue, mais aussi les systèmes cognitifs. C'est pour
cela que c'est plus long qu'une traduction ».

11/26/21 STW 13
Webographie :

 Wikipédia.
 https://blogs.msdn.microsoft.com.
 Traitement automatique des langues - Universalis
http://www.universalis.fr/encyclopedie/traitement-automatique-des-langues/
 Traitement automatique du langage naturel - Wikipédia
https://fr.wikipedia.org/wiki/Traitement_automatique_du_langage_naturel
 Watson, l’IA d’IBM apprend le français - Futura-Sciences
http://www.futura-sciences.com/tech/actualites/technologie-watson-intelligence-arti
ficielle-ibm-apprend-francais-59887/
  
 ntidote, https://www.antidote.info
 Acapela, http://www.acapela-group.com/
 Wordle, http://www.wordle.net
 Lingualia, http://www.lingualia.com/
 Positeo, http://www.positeo.com/check-duplicate-content/
 Google Tranduction : https://translate.google.fr
11/26/21 STW 14

Vous aimerez peut-être aussi