Vous êtes sur la page 1sur 31

WEB

Présenté Par :
MINING
• Maalem mohammed ilyes
• Djoudi Abdessalem

Enseigné Par :
• M Benhaddouche
Sommaire :
1 Introduction :
1.1 Rappel sur le DATA MINING
1.2 Definition du WEB MINING
1.3 Difference entre web et data mining

2 Types de Web Mining :


2.1 Web Content Mining
2.2 Web structure Mining
2.3 Web usage Mining

3 Objectif du Web Mining et quelques


applications :
4.1 Objectif
4.2 Applications Et Outils
4.3 Exemple d’application
4 Conclusion
5 Référence
Introduction
• Le Data Mining est défini comme un processus utilisé
pour extraire des données utilisables d'un ensemble plus
large de données (BIG DATA)
Introduction
• Le Data Mining est défini comme un processus utilisé
pour extraire des données utilisables d'un ensemble plus
large de données (BIG DATA)

• Qui dit Big Data ,dit Internet


• Qui dit Internet dit Web
Qu’est ce que Le
WEB MINING ?

 Le WEB :
 Le Web est une collection de fichiers interconnectés
sur un ou plusieurs serveurs Web.
 Ces fichiers peuvent être :
-Des textes, images, enregistrements, etc.
Qu’est ce que Le
WEB MINING ?

 Le WEB MINING :
 Le web mining désigne l'ensemble des techniques
visant à explorer, traiter et analyser ces fichiers .

 Ce Terme est utilisé pour la première fois en 1996 .


Qu’est ce que Le
WEB MINING ?
LE WM nous permet d'analyser les activités des
utilisateurs sur différentes pages Web et de les suivre afin
de comprendre leurs comportement et leurs habitudes de
navigation
Difference entre
Web et Data MINING

DATA MINING WEB MINING

extraction depuis n’importe quel extraction à partir de documents et de


système services Web, d'hyperliens

Outils: Outils :
des algorithmes d'apprentissage PageRank, Scrappy,,,
automatique.
Les ingénieurs et les scientifiques Idem + les analystes des données.
des données
Types de Web
Mining

En fonction du type de données à fouiller,


on distingue trois grandes classes:
WEB MINING 01 Web Content 02 Web Structure
Mining Mining

03 Web Usage Mining

Types de Web
Mining
Web Content Mining
01

• en français « l'exploration de contenu Web »


• C’ est l'application qui consiste à extraire des
informations utiles du contenu des documents
Web. Le contenu du Web se compose de plusieurs
types de données - texte, image, audio, vidéo, etc.
• Les documents texte sont liés à l'exploration de
texte, à l'apprentissage automatique et au
traitement du langage naturel.
Web Content Mining
Web Structure Mining
02
• en français « l'exploration de Structure Web»
• Cette approche identifie la relation entre les
pages web liées par des informations ou une
connexion directe. La structure du graphique
Web se compose de pages Web en tant que
nœuds et d'hyperliens en tant qu'arêtes reliant
des pages connexes .
• nous pouvons découvrir aussi des pages Web
importantes (Ranked), ce qui est une technologie
clé utilisée dans les moteurs de recherche.
Web Structure Mining
Web Usage Mining
03
• en français « l'exploration de l ’utilisation du
Web
• Cette approche consiste a comprendre et de
mieux répondre aux besoins des applications
Web.
• Elle permet de mesurer l’audience et la
performance d’un site web (Combien de temps
passé par page, combien de visites ,à quel
moment ,qui est cet utilisateur ).
Web Usage Mining

• Ces informations sont


particulièrement précieuses pour
les sites commerciaux afin
d'améliorer la satisfaction des
clients.
Web Usage Mining
Applications et Outils :
• ProWebScraper:
• il est conçu pour récupérer de grandes quantités de données. Il est
facilement évolutif et produit des données propres et exploitables. Peu
importe si le site Web est dynamique ou si sa structure est
compliquée
Applications et Outils :
• MAJESTIC:
• outil d'analyse commerciale extrêmement efficace qui fournit des
services aux stratégies d'optimisation des moteurs de recherche, aux
entreprises de marketing, aux développeurs de sites Web et aux analystes
des médias.
• Se base sur LE WEB STRUCTURE MINING
Applications et Outils :
• Google Analytics :
• Plus de 50% des personnes dans le monde l'utilisent pour l'analyse de
sites Web.
• considéré comme l'un des meilleurs outils d'analyse commerciale. Il
peut suivre et signaler le trafic du site Web.
Google Analytics :

• Google Analytics fonctionne via une "balise de page".

• JavaScript
Google Analytics :
• Imaginez que ceci soit ce bout de code JavaScript :

• Le propriétaire d'un site Web ajoute ce code à chaque page de son site qu'il souhaite suivre.
Google Analytics :
• Imaginez que ceci soit le code source d’une page Web :
Google Analytics :
• On ajoute Le script precedent :
Google Analytics :
Lorsqu'une personne visite le site Web , le code de suivi
s'exécute dans le navigateur du visiteur, collecte les données
du visiteur et les envoie à un serveur de collecte de données
de Google.
Objectif Du Web Mining :

découvrir les informations utiles sur le WEB

améliorer la puissance du moteur de recherche


Web

Prédire le comportement des utilisateurs

Satisfaire les besoins des


utilisateurs
Conclusion :
Pourquoi le Web Mining est-il si important pour vous ?
Conclusion :
Pourquoi le Web Mining est-il si important pour vous ?

• Nous vivons dans un monde défini par le commerce électronique, la gouvernance


électronique, le marché électronique, etc.
• le contact en direct et l'interaction humaine ont diminué.
• Il est tout simplement difficile de maintenir un contact direct avec le client et de
comprendre ce qu'il pense et ressent.
References :
[1]: https://www.geeksforgeeks.org/web-mining/

[2]: Dr. Heraguemi Kamel Eddine , UNIVERSITY OF MSILA :


https://elearning.univ-msila.dz/moodle/pluginfile.php/440269/mod_resource/content/0/Week1.pdf

[3] Jaideep Srivastava, University of Minnesota USA : http://www.ieee.org.ar/downloads/srivastava-tut-pres.pdf

[4] https://prowebscraper.com/blog/web-mining-tools/

[5] : Matt Lane , 8 octobre 2014 : https://mattlane.co.nz/2014/10/09/an-idiots-guide-to-google-analytics/

[6] : WEB MINING OVERVIEW Michael Kunc Doctoral Degree Programme (1), FIT BUT E-mail: kunc@fit.vutbr.cz
Supervisé par: Jaroslav Zendulka E-mail: zendulka@fit.vutbr.cz
THANK YOU

Vous aimerez peut-être aussi