Les Étapes Fondamentales Du Preprocessing

Transféré par

Mounia Khibbi

0% ont trouvé ce document utile (0 vote)

23 vues12 pages

Copyright

Formats disponibles

PPTX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

23 vues12 pages

Les Étapes Fondamentales Du Preprocessing

Transféré par

Mounia Khibbi

Droits d'auteur :

Formats disponibles

Téléchargez comme PPTX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 12

Rechercher à l'intérieur du document

Les étapes fondamentales du

Preprocessing
Le prétraitement des données

 Également appelé "preprocessing" en anglais, est

une étape cruciale dans le processus d'analyse des
données. Il vise à préparer les données brutes pour
une utilisation ultérieure, en les nettoyant, en les
transformant et en les organisant de manière à ce
qu'elles soient adaptées à l'analyse ou à
l'entraînement de modèles.
Collecte des données
 Rassemblement des données brutes à partir de
différentes sources.

Dans notre exemple nous avons importé notre base de

données à partir du site web Kaggle (Hypothyroïdism
disease), cette base de données a été adaptée en
choisissant que les indicateurs pertinents qui représentent
les symptômes de cette maladie
Exploration des données (EDA -
Exploratory Data Analysis)
 Analyse exploratoire pour comprendre la nature
des données, identifier les valeurs manquantes,
les valeurs aberrantes (outliers) et la distribution
des données.
Nettoyage des données

 Gestion des valeurs manquantes en les supprimant, en les

remplaçant par des valeurs appropriées ou en utilisant des
techniques d'imputation. Détection et traitement des
valeurs aberrantes. Gestion des doublons.
Transformation des données

 Normalisation des données pour mettre toutes les

variables à la même échelle. Encodage des variables
catégorielles en variables numériques (par exemple, one-
hot encoding). Transformation des données pour créer de
nouvelles fonctionnalités pertinentes.
Réduction de dimension

 Utilisation de techniques comme l'analyse en composantes

principales (PCA) pour réduire le nombre de dimensions et
éliminer la redondance dans les données.
Séparation des données

 Division des données en ensembles d'entraînement, de

validation et de test.
Gestion des données déséquilibrées (si
nécessaire)
 Si les classes dans les données sont déséquilibrées, des
techniques comme le suréchantillonnage (oversampling)
ou le sous-échantillonnage (undersampling) peuvent être
utilisées.
Normalisation et standardisation

 Application de techniques telles que la normalisation

(mise à l'échelle des données entre 0 et 1) ou la
standardisation (centrage des données autour de zéro
avec un écart-type de 1) selon les besoins.
Création de jeux de données finaux

 Construction des ensembles de données finaux à utiliser

pour l'entraînement et l'évaluation des modèles.
Conclusion

 Ces étapes peuvent varier en fonction du type de

données, du domaine d'application et de l'objectif
spécifique de l'analyse ou du modèle que vous construisez.
Le prétraitement des données est une étape itérative, et
des ajustements peuvent être nécessaires en cours de
route en fonction des découvertes faites au fur et à
mesure de l'exploration des données.

Vous aimerez peut-être aussi

Didacticiel Papier - Sphinx Iq 2 PDF
Document442 pages
Didacticiel Papier - Sphinx Iq 2 PDF
AthenaDona
100% (1)
Analyse Des Données
Document36 pages
Analyse Des Données
wallyjohn
100% (3)
Aaa Seance 02 Preparation Des Données
Document15 pages
Aaa Seance 02 Preparation Des Données
Forche Herod
Pas encore d'évaluation
Analyse Des Données 2021
Document46 pages
Analyse Des Données 2021
Dorian Grey
Pas encore d'évaluation
Examan Analyse de Donnes
Document5 pages
Examan Analyse de Donnes
Zakaria belhassane
Pas encore d'évaluation
IoT Et Big Data
Document11 pages
IoT Et Big Data
monckingjack
Pas encore d'évaluation
Article
Document8 pages
Article
OUHNINI HAMZA
Pas encore d'évaluation
Featuredengineering Ebook - FINAL FR
Document16 pages
Featuredengineering Ebook - FINAL FR
ZAKARIA
Pas encore d'évaluation
IA1 - Analyse Exploratoire de Données
Document13 pages
IA1 - Analyse Exploratoire de Données
Mitsanta Raz Andriaheriniaina
Pas encore d'évaluation
Apprentissage Automatique
Document19 pages
Apprentissage Automatique
chems dine
Pas encore d'évaluation
Proposition Du Tpe 468. Brand (1) - 1
Document13 pages
Proposition Du Tpe 468. Brand (1) - 1
jndjiendeu
Pas encore d'évaluation
Présentation Spss
Document14 pages
Présentation Spss
Abdo Slimane
100% (1)
Untitled
Document4 pages
Untitled
Douanla Giresse
Pas encore d'évaluation
Support de Cours D'analyse Des Données - CH1 Complet
Document15 pages
Support de Cours D'analyse Des Données - CH1 Complet
sibi DIOMANDE
Pas encore d'évaluation
Data Mining
Document8 pages
Data Mining
Ami laaribi
Pas encore d'évaluation
Conseils Pratiques en Data Science Pour Les Ingénieurs Des Données
Document18 pages
Conseils Pratiques en Data Science Pour Les Ingénieurs Des Données
HAMZA LOUATI
Pas encore d'évaluation
Mini Projet ML
Document1 page
Mini Projet ML
TECHNO LOGY
Pas encore d'évaluation
Data Presenattion
Document21 pages
Data Presenattion
anouaarbenyahya
Pas encore d'évaluation
CC Proba 3 Sdia.
Document5 pages
CC Proba 3 Sdia.
Ondigui ebolo
Pas encore d'évaluation
Reponses Certificat
Document5 pages
Reponses Certificat
Raiaa Elmami
Pas encore d'évaluation
Rattrapage BI
Document12 pages
Rattrapage BI
zaki
Pas encore d'évaluation
NDIAYE Jean Pierre Adiouma Présentation BEAMER ISEP2
Document66 pages
NDIAYE Jean Pierre Adiouma Présentation BEAMER ISEP2
Jean Pierre Adiouma NDIAYE
Pas encore d'évaluation
Analyse de Donnees
Document11 pages
Analyse de Donnees
napnap5
Pas encore d'évaluation
Étapes Pour Le Projet
Document4 pages
Étapes Pour Le Projet
Ridouan Al Hannachi
Pas encore d'évaluation
Pourquoi Le Prétraitement Des Données
Document12 pages
Pourquoi Le Prétraitement Des Données
zahi27
Pas encore d'évaluation
Chap 4
Document46 pages
Chap 4
Saif Nairi
Pas encore d'évaluation
Les 3 Étapes Essentielles de L'apprentissage Automatique (Machine Learning) - Spiria
Document5 pages
Les 3 Étapes Essentielles de L'apprentissage Automatique (Machine Learning) - Spiria
Fatima Zahra
Pas encore d'évaluation
0 ADD Introduction
Document31 pages
0 ADD Introduction
Kheirou Dymag
Pas encore d'évaluation
Support Cours Analyse Des Données - UCAO
Document26 pages
Support Cours Analyse Des Données - UCAO
Marc Marin
100% (4)
Analyser Les Donnees
Document1 page
Analyser Les Donnees
Naoufal
Pas encore d'évaluation
Formation Analyse Des Donnc3a9esv2019 1 PDF
Document49 pages
Formation Analyse Des Donnc3a9esv2019 1 PDF
Houssem Hadded
Pas encore d'évaluation
Methodes Et Outils de Suivi Evaluation
Document52 pages
Methodes Et Outils de Suivi Evaluation
megog
100% (1)
Les Critères de Choix D'un Test Statistique
Document3 pages
Les Critères de Choix D'un Test Statistique
Nouza Mk
Pas encore d'évaluation
Analyse Des Données
Document183 pages
Analyse Des Données
NOUHA DACHRAOUI
Pas encore d'évaluation
Support Cours Analyse Des Données
Document33 pages
Support Cours Analyse Des Données
Robert Kodjo EZIAN
Pas encore d'évaluation
Cours 3 SID
Document30 pages
Cours 3 SID
Hajar Bensahl
Pas encore d'évaluation
I - Data Mining
Document10 pages
I - Data Mining
kitaki2020
Pas encore d'évaluation
Publications de Statistique Et Probabilites Data Mining
Document631 pages
Publications de Statistique Et Probabilites Data Mining
napnap5
Pas encore d'évaluation
Exposé Serie Temporelle
Document19 pages
Exposé Serie Temporelle
David
Pas encore d'évaluation
2 Outil 1 Les Donnees
Document29 pages
2 Outil 1 Les Donnees
Tim Stelens Seka
100% (1)
Chapitre 1 Fouille de Données
Document36 pages
Chapitre 1 Fouille de Données
Seifeddin Lamloum
Pas encore d'évaluation
Chapitre6 Intelligence Artificielle
Document32 pages
Chapitre6 Intelligence Artificielle
venanceharold
Pas encore d'évaluation
Biskra
Document96 pages
Biskra
Souhaila Djaffal
Pas encore d'évaluation
Introduction Data - Science
Document27 pages
Introduction Data - Science
Ra Nim
Pas encore d'évaluation
6 Sigm
Document40 pages
6 Sigm
ADIL BENTALEB
Pas encore d'évaluation
Introduction
Document14 pages
Introduction
ranoarisonnomena6
Pas encore d'évaluation
Rapport - Méthode - Exploratoire Fin
Document14 pages
Rapport - Méthode - Exploratoire Fin
JJHHH
Pas encore d'évaluation
Stat - Ad Siagh Ar
Document24 pages
Stat - Ad Siagh Ar
anfal Jij
Pas encore d'évaluation
2 - INITIATION AI - Data - Processing
Document22 pages
2 - INITIATION AI - Data - Processing
DIALLO
Pas encore d'évaluation
Big Data - Types de Données Dans Les Statistiques - Données Qualitatives Vs Quantitatives
Document13 pages
Big Data - Types de Données Dans Les Statistiques - Données Qualitatives Vs Quantitatives
Said Sousdi
Pas encore d'évaluation
Chap2 4 1
Document53 pages
Chap2 4 1
Saif Nairi
Pas encore d'évaluation
Modele D'audit
Document10 pages
Modele D'audit
SONON
Pas encore d'évaluation
0 - Diagnostic
Document19 pages
0 - Diagnostic
Mohammed ADNANI
Pas encore d'évaluation
Séance 01
Document20 pages
Séance 01
ayoubhaouas
Pas encore d'évaluation
Projet - DWH (Récupération Automatique)
Document83 pages
Projet - DWH (Récupération Automatique)
Abid
Pas encore d'évaluation
UP3 2 Fouille de Donnees Handout
Document65 pages
UP3 2 Fouille de Donnees Handout
novocaine67
Pas encore d'évaluation
TE AD Ch3 2020
Document32 pages
TE AD Ch3 2020
Mohammed Zouba
Pas encore d'évaluation
Data Mining
Document36 pages
Data Mining
Sorelle Kana
Pas encore d'évaluation
Chapitre 2 - Plan D'enquête
Document5 pages
Chapitre 2 - Plan D'enquête
armel TAMA ZE
100% (1)
Analyser les données qualitatives en gestion
D'Everand
Analyser les données qualitatives en gestion
Catherine Voynnet Fourboul
Pas encore d'évaluation
Analyse de régression: Maîtriser l'art de l'analyse de régression, prédire, analyser, décider
D'Everand
Analyse de régression: Maîtriser l'art de l'analyse de régression, prédire, analyser, décider
Fouad Sabry
Pas encore d'évaluation
CC 1 Analyse Natalia Borbón Torres
Document3 pages
CC 1 Analyse Natalia Borbón Torres
Natalia Borbon Torres
Pas encore d'évaluation
Poly Java
Document176 pages
Poly Java
LeonzoConstantini
Pas encore d'évaluation
Transferts en Poreux
Document644 pages
Transferts en Poreux
Yacine Ka
Pas encore d'évaluation
Corrige TD 8 1920 2
Document5 pages
Corrige TD 8 1920 2
friends diary
Pas encore d'évaluation
04 JSFT-echangeur-2012 GRESPI Fohanno PDF
Document21 pages
04 JSFT-echangeur-2012 GRESPI Fohanno PDF
zermi
Pas encore d'évaluation
Feuilletage
Document25 pages
Feuilletage
Lē Jøkēr
Pas encore d'évaluation
GISEMENT
Document4 pages
GISEMENT
Touré Abdoul
Pas encore d'évaluation
Exercices Chapitre 3 Fractions
Document3 pages
Exercices Chapitre 3 Fractions
Tony GRACA
Pas encore d'évaluation
Unite 71 Manuel Opératoire
Document110 pages
Unite 71 Manuel Opératoire
Abdessalem Bougoffa
50% (2)
Cahier de Charge Du Projet
Document4 pages
Cahier de Charge Du Projet
Mehdi Khaled
Pas encore d'évaluation
Howto L3 Intervlanrouting
Document7 pages
Howto L3 Intervlanrouting
Wilford Toussaint
Pas encore d'évaluation
W - 250 - 275 - 325 - 350 - 400 - 1 K..p..
Document28 pages
W - 250 - 275 - 325 - 350 - 400 - 1 K..p..
joviado
Pas encore d'évaluation
Api Rest
Document8 pages
Api Rest
fogo
Pas encore d'évaluation
Ajust Expo
Document4 pages
Ajust Expo
Mme_Sos
100% (1)
ANNONCES ASSISTANTS MATERNELS-Disponibilités Secteur Lyautey Du 12 Juin 2020
Document3 pages
ANNONCES ASSISTANTS MATERNELS-Disponibilités Secteur Lyautey Du 12 Juin 2020
younes amara
Pas encore d'évaluation
Mémoire de Master-YF-Post Soutenance-20200610
Document70 pages
Mémoire de Master-YF-Post Soutenance-20200610
Yacinthe FAYE
100% (1)
TD6 Physique
Document4 pages
TD6 Physique
Eric Deumo
Pas encore d'évaluation
Geometrie Pour Dao2 PDF
Document161 pages
Geometrie Pour Dao2 PDF
lekouf43
100% (1)
NF EN 1431 (Mai 2009)
Document19 pages
NF EN 1431 (Mai 2009)
Fatima Bouhaja
Pas encore d'évaluation
Incendie: I-Prévention Et Protection
Document4 pages
Incendie: I-Prévention Et Protection
raid baziz
Pas encore d'évaluation
Examen de Fin de Formation 2008 Tsri Pratique Variante 9
Document5 pages
Examen de Fin de Formation 2008 Tsri Pratique Variante 9
FatimaLE
Pas encore d'évaluation
Rapport Optimisation Sur Matlab
Document13 pages
Rapport Optimisation Sur Matlab
Lino YETONGNON
Pas encore d'évaluation
Chapitre 1 - Eléments de Physique Nucléaire
Document69 pages
Chapitre 1 - Eléments de Physique Nucléaire
Mohamed El Hadi Redjaimia
100% (1)
3 - Modeles de Markov Caches
Document34 pages
3 - Modeles de Markov Caches
WISSAL
Pas encore d'évaluation
Maths X PSI 1998 (Enoncé)
Document7 pages
Maths X PSI 1998 (Enoncé)
LM --
Pas encore d'évaluation
DJE4394
Document119 pages
DJE4394
dan
Pas encore d'évaluation
Chapitre
Document8 pages
Chapitre
Achour Ifrek
Pas encore d'évaluation
UE Cybersécurité-Initiation Metasploit v0.3
Document17 pages
UE Cybersécurité-Initiation Metasploit v0.3
didier
Pas encore d'évaluation
Algèbre 1 V. Def 2017-2018
Document141 pages
Algèbre 1 V. Def 2017-2018
Alexis Rosuel
100% (1)