0% ont trouvé ce document utile (0 vote)
81 vues27 pages

Veille et Intelligence Compétitive 2023

Ce document présente diverses techniques de traitement et d'analyse de l'information textuelle, notamment le text mining. Il décrit des méthodes comme la classification, l'analyse de sentiments, l'extraction de relations, et introduit des outils comme Voyant Tools.

Transféré par

saad
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
81 vues27 pages

Veille et Intelligence Compétitive 2023

Ce document présente diverses techniques de traitement et d'analyse de l'information textuelle, notamment le text mining. Il décrit des méthodes comme la classification, l'analyse de sentiments, l'extraction de relations, et introduit des outils comme Voyant Tools.

Transféré par

saad
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Ecole des Sciences de l’Information

MISE EN PLACE DES SYSTÈMES DE


VEILLE ET D’INTELLIGENCE
COMPÉTITIVE

2022/2023

Anass MAMOUNY
anass.mamouny@gmail.com
Cours 3 – Techniques de traitement
et d’analyse de l’information

1. Types de Mining

2. Techniques de text mining

3. Applications de text mining

4. Outils de text mining

5. La représentation graphique de l’information


Types de Mining
L’activité de mining consiste au recueil d’informations sur
un ensemble de données structurées ou non.
Celle-ci peut se faire sur la base d’outils de statistiques ou
d’analyses linguistiques.

Il existe trois grands types de pratiques autour du mining :


• Data Mining
• Web Mining
• Text Mining
Types de Mining
• Le data mining :

• Le « data mining est le processus de découverte des


connaissances significatives à partir de grandes quantités
des données stockées en base de données, dépôts de
données ou autres moyens de stockage » (Han, 2001).

• le KDD comme un « processus non trivial d’identification


des modèles valides, nouveaux, potentiellement utiles et,
finalement intelligibles dans les données ».
Types de Mining
• Le data mining :
Types de Mining
Le text mining :

« L'extraction d'information à partir des formes ou patrons


non manifestes dans des grands corpus de textes.
Autrement dit, l'objectif est le traitement de grandes
quantités d'information qui sont disponibles sous une forme
textuelle et non structurée ». (Feldman et al., 1998 ).
Types de Mining
• Le text mining :
Types de Mining
• Le text mining :
Techniques de text mining

• Les techniques de traitement du langage naturel


constituent la base du Text Mining. Leur rôle est
d’apporter au texte un premier niveau de
compréhension à partir d’une analyse syntaxique et
grammaticale :
Techniques de text mining
• Les stop words incluent les mots vides (déterminants,
prépositions, conjonctions, verbes auxiliares).

• L’ étiquetage morpho-syntaxique (aussi appelé


étiquetage grammatical, POS tagging (Angl.part-of-
speech tagging)) est le processus qui consiste à
associer aux mots d'un texte les informations
grammaticales correspondantes comme la partie du
discours, le genre, le nombre, etc. à l'aide d'un outil
informatique.
Techniques de text mining
• La racinisation (ou stemming) et la lemmatisation
consistent à réduire une liste de mots à une liste plus
courte qui ne contient qu'une variante du même mot.

• La racine correspond à la partie du mot qui reste,


une fois qu'on a tué son préfixe et son suffixe.
Contrairement à un lemme, il ne s'agit pas forcément
d'un "vrai" mot.
Exemples: recherche, chercher, cherches, cherchions,
cherchait -> cherch
Techniques de text mining
• La lemmatisation cherche une forme canonique d'un
mot. Le lemme est un mot de base, comme: un
verbe à l'infinitif, un adjectif, etc. au singulier
masculin.
Exemples: belles, bel, beaux, beau -> beau

• Le résultat de ces outils de traitement du langage


naturel servira ensuite d’entrée pour des
fonctionnalités plus poussées comme l’analyse
sémantique et la découverte d’informations.
Applications de text mining
Classification
• La classification sert à regrouper des documents dans un
certain nombre de classes selon des critères de similarité.

• Il existe deux grandes familles de méthodes


• La classification supervisée
• La classification non supervisée (automatique)
Applications de text mining
Classification
• La classification supervisée (Catégorisation)
• L’objectif de la catégorisation de textes est de pouvoir
associer automatiquement des documents à des classes
(catégories, étiquettes, index) prédéfinies. Nous nous
plaçons dans le cadre de l’apprentissage supervisé.
• Catégorisation linéaire Rocchio
• Catégorisation par les K plus proches voisins
Applications de text mining
Classification
• La classification non-supervisée (Clustering)
• La classification automatique aussi appelée non-
supervisée sert par exemple à obtenir une vue
d'ensemble sur les sujets traités dans un corpus. Comme
pour la classification supervisée, il faut choisir le corpus,
définir une mesure de similarité entre documents et
identifier un algorithme de classification.
Applications de text mining
Analyse de sentiments
• À partir de modèles pré-entrainés, le Text Mining permet
d’évaluer si un commentaire est plutôt positif ou négatif.
Les méthodes les plus élémentaires, basées sur des
analyses statistiques comme l’attribution de poids aux
mots clés à valeur sentimentale, permettent de générer
des pourcentages de positivité.
Applications de text mining
Extraction de relations
• L’extraction de relations est une étape majeure issue du
traitement du langage naturel. En effet, elle permet de
détecter une relation sémantique entre un ou plusieurs
groupes de mots.
• Cet outil est notamment utilisé pour déceler des relations
précises dans un texte ou pour découvrir de nouvelles
données alimentant des bases de connaissances.
Applications de text mining
Les bases de connaissances
• L’utilisation de bases de connaissances permet de
répertorier soit le sens des mots, au niveau linguistique, à
la manière d’un dictionnaire, soit leurs fonctionnalités
métiers liées à un contexte professionnel. Ce sont les
liens entre ces sens qui vont permettre le raisonnement
sur les phrases et donc une compréhension plus
complète des notions formulées.
Applications de text mining
Les bases de connaissances
• Les connaissances sont stockées soit au moyen de
graphes, soit selon les technologies du web sémantique
comme les ontologies .
• L’utilisation de bases de connaissances permet de limiter
les reconnaissances lexicales de mots à base de
statistiques pour identifier des sens au sein d’un
document.
• Une des applications de ces technologies est la mise en
œuvre de moteurs de recherche sémantique capable de
comprendre une question et d’y répondre
rigoureusement.
Applications de text mining
L’analyse des réseaux sociaux
L’analyse des réseaux sociaux permet de comprendre le
comportement des acteurs et des communautés (place et
influence d’un acteur au sein du réseau),
• L’analyse de réseaux sociaux est une discipline montante
en intelligence économique car elle permet de dégager
une valeur ajoutée en synthétisant de manière rigoureuse
de l’information informelle.
• Contrairement à une cartographie que l’on effectuerait
manuellement et facilement, les outils de l’analyse des
réseaux sociaux (PAJEK, UCINET,NodeXL, …)
nécessitent un certain temps d’appréhension afin d’être
correctement utilisés.
Applications de text mining
L’analyse des réseaux sociaux
Etude de cas pratique
• Votre entreprise débute dans la vente de parfums très
haut de gamme et compte pour se faire connaître
effectuer une opération de promotion basée sur des
produits offerts à des personnes influentes, lesquelles
auront ensuite également la possibilité de parrainer leurs
amis en échange de réductions.
• L’image élitiste de votre produit ne vous permet pas de
distribuer largement vos échantillons. C’est pourquoi afin
d’optimiser l’impact de cette opération, vous devez
identifier les personnalités influentes au sein des réseaux
susceptibles de relayer efficacement la notoriété de votre
marque.
Applications de text mining
L’analyse des réseaux sociaux
• NodeXL
Applications de text mining
Le Machine Learning
• Enfin, le Text Mining repose aussi sur des algorithmes
non déterministes pour donner un sens au texte analysé.
Pour cela, il s’appuie sur les principes du machine
learning, qui consiste en l’entrainement de modèle via des
données prétraitées, dit base d’entrainement, afin de
faciliter les traitements futurs. De nombreux algorithmes
peuvent être appliqués pour réaliser cette tâche. Il peut
s’agir : d’algorithmes basés sur les statistiques
(réseauBayesian, ...), mais aussi sur des bases
géométriques (KNN, Bag of Feature, ...), arbre de
décision (Deep Forest, …), Support Vector Machine,
réseau de neurones
Outils de text mining
• AntConc
• DocuBurst
• IRaMuTeQ
• Lexos
• LightSide
• Orange Textable
• RapidMiner Studio
• T-Lab
• Tropes
• Voyant Tools ( http://voyant-tools.org/)
Outils de text mining
Voyant tools
• Sur « Voyant tools », il est possible d’ajouter :
• des URL de textes en ligne, y compris des URL multiples en
changeant de lignes
• un texte, par copier-coller
• un corpus de documents présents sur votre poste qui sera alors
chargé sur la plateforme
La représentation graphique de
l’information
• Cette méthode de simplification des masses de données
complexes permet surtout, sous ses différentes formes,
de répondre aux objectifs suivants :

• faire des découvertes,


• faciliter la décision,
• proposer des explications
• communiquer plus facilement des informations
La représentation graphique de
l’information
• Moteurs de recherche visuels
• L’utilisation de ces services est très simple et consistera
avant tout à savoir rebondir sur les mots clés pertinents
dans le cadre de votre recherche.
• Leur avantage principal est de rendre visibles des liens
entre des éléments n’en présentant pas a priori. Ils
proposent également des axes de recherches
complémentaires.
(http://www.touchgraph.com/TGGoogleBrowser.html)
• Mind mapping
• Très populaires, Xmind ou FreeMind permettent la
réalisation de cartes heuristiques, ce qui est utile pour
ordonner des idées ou réaliser des « treemaps »

Vous aimerez peut-être aussi