Académique Documents
Professionnel Documents
Culture Documents
Donnée, Base de données, Analyse des données, Fouille des données, Entrepôt de
données, Magasin de données, Lac de données, Intégration des données, …
Data, Database, Data Analysis, Data Mining, Data Warehouse, Data Marts, Data Lake,
Data Integration, Data Science, Data Scientist, Data Analyst, Data Engineer, Data
Management, …
05/02/2023 Pr. ATMANI Baghdad - M1 IA&IoT 2023 2
Pourquoi la fouille de données
• Nous vivons dans un monde où de grandes quantités de données sont
collectées quotidiennement.
• L'analyse de ces données est un besoin important.
• Nous allons examiner comment la fouille de données peut répondre à ce
besoin en fournissant des outils pour découvrir des connaissances à partir
des données.
données
• Nous allons montrer comment la fouille de données peut être considérée
comme le résultat de l'évolution naturelle des technologies de
l'information.
l'information
• Vers l'ère de l'information !!! « Nous vivons à l'ère de l'information » est
un dicton populaire; cependant, nous vivons en réalité à l'ère des
données.
• La croissance explosive du volume de données disponibles est le résultat
de l'informatisation de notre société et du développement rapide d'outils
puissants de collecte et de stockage des données.
Types
Base de
des BDD ?
données ?
Systèmes Stockage
de gestion des BDD ?
des BDD ?
05/02/2023 Pr. ATMANI Baghdad - M1 IA&IoT 2023 4
Exemple … Flu Trends de Google
• Google reçoit des centaines de millions de requêtes chaque jour. Chaque requête peut être
vue comme une transaction où l'utilisateur décrit son besoin d'information. Quelles
connaissances nouvelles et utiles un moteur de recherche peut-il tirer d'une telle collection
de requêtes collectées auprès des utilisateurs au fil du temps ?
• C’est très intéressant que certains modèles trouvés dans les requêtes de recherche des
utilisateurs peuvent révéler des connaissances inestimables qui ne peuvent pas être
obtenues en lisant uniquement des éléments de données individuels.
• Flu Trends de Google a trouvé une relation étroite entre le nombre de personnes qui
recherchent des informations sur la grippe et le nombre de personnes qui présentent
réellement des symptômes de la grippe.
• Un modèle émerge lorsque toutes les requêtes de recherche liées à la grippe sont agrégées.
• À l'aide des données de recherche agrégées de Google, Flu Trends peut estimer l'activité
grippale jusqu'à deux semaines plus rapidement que les systèmes traditionnels.
• Cet exemple montre comment la fouille de données peut transformer une vaste collection
de données en connaissances qui peuvent aider à relever un défi mondial actuel.
Banque
• Exemple : Si l'on désire utiliser une évaluation exacte on définit une variable Note
Note1
1
qui associe à chaque étudiant sa note CC1. L'espace d'arrivée D est R et sa +
X1 : tabagisme qui peut prendre les valeurs oui ou non (l1 = 2);
X2 : Stress qui détermine comment le niveau de stress chez le patient hypertendu
et qui peut prendre trois valeurs (l2 = 3) : « Peu stressé », « Moyennement
stressé», « Extrêmement stressé »;
X3 : Exercice qui correspond à l’activité sportive et peut prendre deux modalités
(l3=3) : « Ne fait pas d’exercice », « Fait de temps en temps de l’exercice », « Fait de
l’exercice de manière régulière »;