Bienvenue sur Scribd !

Ignorer le carrousel

Essaie de Correction Inf371

Transféré par

stive kevin Watat yondep

0% ont trouvé ce document utile (0 vote)

5 vues2 pages

exercice data mining

Titre original

ESSAIE DE CORRECTION INF371

Copyright

Formats disponibles

PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

exercice data mining

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

5 vues2 pages

Essaie de Correction Inf371

Transféré par

stive kevin Watat yondep

exercice data mining

Droits d'auteur :

Formats disponibles

Téléchargez comme PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

ESSAIE DE CORRECTION INF371

Partie 1 : Data Mining

Question de Cours

1) Definitions
Données Etiquetées : Ce sont des données de la forme (X, Y) ou X est un parametre observé
sur un individu (variables indépendante) et Y est une classe ou une valeur numérique
représentant la variable dépendante.
Fouille de données : Ensemble des méthodes, techniques et outils utilisés pour extraire de la
connaissance dans un ensemble de données de taille importante
Motif fréquent : C’est un ensemble d’item dont le support est supérieur au seuil de
fréquence fixé
Règle d’association : C’est une implication de la forme A=a => B=b qui se traduit par : Lorsque
A prend la valeur a B prend généralement la valeur b
2) Etapes de la fouille de données :
- Compréhension du domaine,
- Compréhension des données,
- Prétraitement des données,
- Modélisation et Evaluation et
- Deployement
3) Validation :
- Validation croisée d’ordre k : Ici on divise le dataset en k partie disjointes et pour i allant de
1 a k on considère à chaque fois la partie i comme testset et le reste comme trainset.
L’évaluation du modèle finale s’obtient en faisant la moyenne des performances des k
modèles.
- Holdout : Ici on divise le dataset en 2 parties (testset et trainset) avec une proportion p pour
le train set (généralement 0.7, 0.75, 0.8)
4) Precision = C’est la probabilité sachant que la prédiction la prédiction d’une classe est k
d’observé effectivement cette classe.
Rappel = C’est la probabilité sachant qu’une classe k est observé de prédire cette clas

Exercice 2

1) Commande R

df <- read.table(‘’file.txt’’, na.string=”?”, sep=”,”, dec=’’.’’)

2) On peut remplacer les Valeurs manquantes par une valeur par défaut (moyenne, medianne
pour les valeurs numériques ou le mode pour les valeurs catégorielles ou une valeur définie
par l’expert du domaine). On peut aussi utiliser la régression/classification pour remplacer les
valeurs manquantes.
3) Normaliser les données c’est les mettre dans une echelle de [0 ;1] ou [-1 ; 1].

#Normalisation Z-score

df$X1.scale <- scale(df$X1)

df$X2.scale <- scale(df$X2)

#Normalisation min-max

df$X1.scale <- scale(df$X1, center=min(df$X1), scale=(max(df$X1)-min(df$X1)))

df$X2.scale <- scale(df$X2, center=min(df$X2), scale=(max(df$X2)-min(df$X2)))

4) Discrétiser les données :

df$X1.discr <- cut(df$X1.scale, breaks=5)

df$X2.discr <- cut(df$X2.scale, breaks=5)

#regles d’association

library(arules)

df_matrix<- as.matric(df[,c(“df$X1.discr”, “df$X1.discr”, “Classe”)])

df_trans=as(df_matrix, ‘’transactions")

regles<-appriori(df_trans, ,parameter = list(supp=0.5,conf=0.8))

regles=sort(regles , by="lift")

Vous aimerez peut-être aussi

SAD - Chap 2
Document83 pages
SAD - Chap 2
Gazdallah Amira
Pas encore d'évaluation
Chapitre 3
Document40 pages
Chapitre 3
Dia Mouhamadou Naby
Pas encore d'évaluation
Apprentissage Supervise
Document16 pages
Apprentissage Supervise
Baron Duval
Pas encore d'évaluation
Chapitre 5
Document7 pages
Chapitre 5
MohamedLashab
Pas encore d'évaluation
Progres2019 5
Document44 pages
Progres2019 5
SALMA CHLAIKHY
Pas encore d'évaluation
DM Ch4
Document29 pages
DM Ch4
mohamedamin.benslimen
Pas encore d'évaluation
Algo Classification
Document19 pages
Algo Classification
feryel
Pas encore d'évaluation
Tps Data Mining (Matlab)
Document14 pages
Tps Data Mining (Matlab)
Mohammed Amine Halbaba
100% (10)
Chap2 4 1
Document53 pages
Chap2 4 1
Saif Nairi
Pas encore d'évaluation
Classification Supervise e
Document20 pages
Classification Supervise e
Sofiene Guedri
Pas encore d'évaluation
Statistiques Descriptives À Une Ou Deux Dimensions
Document10 pages
Statistiques Descriptives À Une Ou Deux Dimensions
Jasmine Benhalima
Pas encore d'évaluation
Chapitre2 - Mukinga Kakonge Moise A Corriger
Document15 pages
Chapitre2 - Mukinga Kakonge Moise A Corriger
Ëmrÿs Mösës
Pas encore d'évaluation
CC Machine Learning
Document7 pages
CC Machine Learning
Naomie Jennifer
Pas encore d'évaluation
FR Tanagra Scikit Learn Decision Tree 2
Document24 pages
FR Tanagra Scikit Learn Decision Tree 2
benn yass
Pas encore d'évaluation
TP KNN
Document2 pages
TP KNN
fatma.abid
Pas encore d'évaluation
Chapitre 1
Document29 pages
Chapitre 1
Ela Rziga
Pas encore d'évaluation
Leçon6-Arbre de Decision
Document25 pages
Leçon6-Arbre de Decision
Othmane Rais
100% (1)
FDD Et Arbres de Décision: Christelle Scharff IFI Juin 2004
Document52 pages
FDD Et Arbres de Décision: Christelle Scharff IFI Juin 2004
elarrouchi
Pas encore d'évaluation
Arbre de Decision
Document17 pages
Arbre de Decision
Âßd ĕrăhmãńė
Pas encore d'évaluation
BENMANSOUR KAOUTHAR Ccsysid
Document9 pages
BENMANSOUR KAOUTHAR Ccsysid
kaouthar
Pas encore d'évaluation
Cours Segmentation
Document43 pages
Cours Segmentation
habitav2023
Pas encore d'évaluation
Encodage Et Normalisation Des Données
Document3 pages
Encodage Et Normalisation Des Données
Medilyass Elhamdaoui
Pas encore d'évaluation
Annals 1
Document13 pages
Annals 1
Lina Thabet
Pas encore d'évaluation
Support Cours
Document42 pages
Support Cours
Leila Amrane
Pas encore d'évaluation
Big Data Mining JJ
Document91 pages
Big Data Mining JJ
Nouradin Hassan Darar
Pas encore d'évaluation
MEthode Sous R
Document19 pages
MEthode Sous R
daoud ounaissi
Pas encore d'évaluation
Data Mining Description SP 2022
Document20 pages
Data Mining Description SP 2022
ads asd
100% (1)
ALG08 Algorithme kNN2
Document4 pages
ALG08 Algorithme kNN2
OrnetAndIce
Pas encore d'évaluation
TP4 ClassificationSupervisée Student
Document11 pages
TP4 ClassificationSupervisée Student
mohamed anouar hassine
Pas encore d'évaluation
01 Intro RegLin RegLogBin
Document47 pages
01 Intro RegLin RegLogBin
فركوس محمد العيد
Pas encore d'évaluation
Chapitre 2
Document16 pages
Chapitre 2
SARA STAMBOULI
Pas encore d'évaluation
K Plus Proches Voisins / K-Nearest Neighbors /KNN
Document8 pages
K Plus Proches Voisins / K-Nearest Neighbors /KNN
Abdallahi Sidi
Pas encore d'évaluation
TP RCP208 PMC Regression
Document9 pages
TP RCP208 PMC Regression
Daly Zeddini
Pas encore d'évaluation
RFIA Cours3 PDF
Document36 pages
RFIA Cours3 PDF
MINA
Pas encore d'évaluation
Resume Cours
Document28 pages
Resume Cours
br18
Pas encore d'évaluation
Feuille de Notes de Statistiques
Document2 pages
Feuille de Notes de Statistiques
naikhaalexis0904
Pas encore d'évaluation
Chapitre 1 Introduction Du Statistique
Document5 pages
Chapitre 1 Introduction Du Statistique
Phương Linh Nguyễn
Pas encore d'évaluation
Resumé
Document30 pages
Resumé
Lalla Sanae Jazouli
Pas encore d'évaluation
C3 Clustering
Document29 pages
C3 Clustering
Ameni Boughanmi
Pas encore d'évaluation
Chapitre 1
Document11 pages
Chapitre 1
Ahmed Nsir
Pas encore d'évaluation
Cours de Statistic 1 Et 2
Document6 pages
Cours de Statistic 1 Et 2
Bilal Saghir
Pas encore d'évaluation
FDD Cours PDF
Document94 pages
FDD Cours PDF
Ansoumane Daff
Pas encore d'évaluation
Kmeans
Document55 pages
Kmeans
Adam Ammour
Pas encore d'évaluation
Chapitre 1 Statistique Descriptive PDF
Document6 pages
Chapitre 1 Statistique Descriptive PDF
ÎlŸãş Mïmø
Pas encore d'évaluation
Partie 1: Statistiques Descriptives (Suite) : Ecole Mohammedia D'ingénieurs Année 2017-2018
Document13 pages
Partie 1: Statistiques Descriptives (Suite) : Ecole Mohammedia D'ingénieurs Année 2017-2018
Ahmed El Mokadem
Pas encore d'évaluation
CM5 DecisionTree
Document29 pages
CM5 DecisionTree
rosecoco1248
Pas encore d'évaluation
Chap3-Recherche Par Le Contenu
Document117 pages
Chap3-Recherche Par Le Contenu
Sahar MANAII
Pas encore d'évaluation
Cours AA 11 Octobre
Document39 pages
Cours AA 11 Octobre
OUSSEMA KACHTI
Pas encore d'évaluation
Cours02 baseDataScientist
Document60 pages
Cours02 baseDataScientist
Klech
Pas encore d'évaluation
Notions Sur Les: Support Vector Machines
Document23 pages
Notions Sur Les: Support Vector Machines
mourad
Pas encore d'évaluation
Analyse Et Collecte Des Donnees
Document60 pages
Analyse Et Collecte Des Donnees
Snoussi Ez
Pas encore d'évaluation
Project
Document15 pages
Project
Soufyane EL OUAHABI
Pas encore d'évaluation
Cours - Data Science Intro+ACP
Document63 pages
Cours - Data Science Intro+ACP
salma tn
100% (1)
K Plus Proches Voisions K-Nearest Neighbors KNN: Mme Hiba Lahmer 2020/2021
Document14 pages
K Plus Proches Voisions K-Nearest Neighbors KNN: Mme Hiba Lahmer 2020/2021
Houssayen Benouhiba
Pas encore d'évaluation
Chapitre3 Classification
Document33 pages
Chapitre3 Classification
Ra Nim
Pas encore d'évaluation
Analyse de Données - Chapitre5
Document33 pages
Analyse de Données - Chapitre5
Youssef
Pas encore d'évaluation
TPE DAS Groupe2
Document21 pages
TPE DAS Groupe2
DJELASSEM CYRILLE
Pas encore d'évaluation
Analyse de Données Cours
Document18 pages
Analyse de Données Cours
Slimani El Alaoui Mohamed
Pas encore d'évaluation
Trois essais de méthodologie quantitative
D'Everand
Trois essais de méthodologie quantitative
Louis Laurencelle
Pas encore d'évaluation
Classification contextuelle des images: Comprendre les données visuelles pour une classification efficace
D'Everand
Classification contextuelle des images: Comprendre les données visuelles pour une classification efficace
Fouad Sabry
Pas encore d'évaluation
2-Prog Maths MP 2ème Année PDF
Document27 pages
2-Prog Maths MP 2ème Année PDF
Zémzém Yoocef
Pas encore d'évaluation
Secg Lessons06-Regression Lineaire
Document58 pages
Secg Lessons06-Regression Lineaire
Anonymous Wk05C1IlV
Pas encore d'évaluation
Números Complejos
Document22 pages
Números Complejos
michael
Pas encore d'évaluation
12 - Espaces Vectoriels Normes Exercices Corriges Indispensables PDF
Document7 pages
12 - Espaces Vectoriels Normes Exercices Corriges Indispensables PDF
Adam Guissou
Pas encore d'évaluation
Cours Sur Les Cartes de Controle - SPC
Document5 pages
Cours Sur Les Cartes de Controle - SPC
Meryem Belhassane
Pas encore d'évaluation
Deliberation - SN - 2022 - 2023-4السنة الثالثة ادارة اعمال
Document12 pages
Deliberation - SN - 2022 - 2023-4السنة الثالثة ادارة اعمال
Dali Insta
Pas encore d'évaluation
Problemes Au BAC S2 de 1999 À 2022 PDF Fonction (Mathématiques) Tangente (Géométrie)
Document1 page
Problemes Au BAC S2 de 1999 À 2022 PDF Fonction (Mathématiques) Tangente (Géométrie)
t7jdzxf4tt
Pas encore d'évaluation
821 2020 03 26 Seance Suite
Document18 pages
821 2020 03 26 Seance Suite
Yousra Alaoui Sosse
Pas encore d'évaluation
Révision 2020 2021 Analyse Numérique
Document2 pages
Révision 2020 2021 Analyse Numérique
ceczczc
Pas encore d'évaluation
2014 Mines MP Maths2
Document6 pages
2014 Mines MP Maths2
MI DO
Pas encore d'évaluation
2.1 Itération de Type Point Fixe, Cas Général: Cos X
Document12 pages
2.1 Itération de Type Point Fixe, Cas Général: Cos X
loic.savornin
Pas encore d'évaluation
Analyse Des Données Mouna BEN ALI
Document15 pages
Analyse Des Données Mouna BEN ALI
Sidi
Pas encore d'évaluation
Cours AZIEZ RDM I.31 PDF
Document5 pages
Cours AZIEZ RDM I.31 PDF
Lalia Mimi
Pas encore d'évaluation
Chapitre 1 Polynomes Et Fractions Rationnelles (1) Ppint
Document60 pages
Chapitre 1 Polynomes Et Fractions Rationnelles (1) Ppint
mohamed
Pas encore d'évaluation
Méthodes de Monte Carlo Pour La Finance
Document72 pages
Méthodes de Monte Carlo Pour La Finance
Rajita Economiste
Pas encore d'évaluation
Cours 1 Analyse Numerique
Document29 pages
Cours 1 Analyse Numerique
Thouraya Haj Hssan
Pas encore d'évaluation
Fondamentaux de La Data Science
Document5 pages
Fondamentaux de La Data Science
bitou
Pas encore d'évaluation
Devoir Maison 4: Exercice 1: Autour Des Coefficients Binomiaux
Document14 pages
Devoir Maison 4: Exercice 1: Autour Des Coefficients Binomiaux
Osée Magloire
Pas encore d'évaluation
Afc
Document14 pages
Afc
Mandy
100% (1)
Fasicule TS1
Document77 pages
Fasicule TS1
Mohamed Konate
0% (1)
DM 0708 Correction
Document4 pages
DM 0708 Correction
max Man
Pas encore d'évaluation
Optimisation - Corrigé - Série N°1
Document7 pages
Optimisation - Corrigé - Série N°1
Katia Chalal
Pas encore d'évaluation
Limites Fonctions Exercices
Document5 pages
Limites Fonctions Exercices
Angeauden Dido
Pas encore d'évaluation
Adoption de La Norme Iso 9001 Par Les Entreprises Marocaine Du Secteur Textile Habillement
Document9 pages
Adoption de La Norme Iso 9001 Par Les Entreprises Marocaine Du Secteur Textile Habillement
Younes El Manz
Pas encore d'évaluation
Correction TD3
Document5 pages
Correction TD3
Aymen Gmar
Pas encore d'évaluation
Cosd de Rufisque Anne Scolaire 2012
Document2 pages
Cosd de Rufisque Anne Scolaire 2012
Samba Sall
100% (1)
Chapitre1 FCT Complexes - Final
Document15 pages
Chapitre1 FCT Complexes - Final
Silner Dz
Pas encore d'évaluation
CH Intimp
Document19 pages
CH Intimp
Hich Em
Pas encore d'évaluation
Fonction de Reference - Correction PDF
Document4 pages
Fonction de Reference - Correction PDF
abdlkarim
Pas encore d'évaluation