Chapitre 2 1

Transféré par

Mariem Selmi

0% ont trouvé ce document utile (0 vote)

13 vues3 pages

Titre original

Chapitre-2-1

Copyright

Formats disponibles

DOCX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

13 vues3 pages

Chapitre 2 1

Transféré par

Mariem Selmi

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 3

Rechercher à l'intérieur du document

Chapitre 2

:
Introduction

Le prétraitement des données est une technique d'exploration de données qui est
utilisée pour transformer les données brutes dans un format utile et efficace. Les
données réelles sont souvent incomplètes, incohérentes et / ou dépourvues de certains
comportements, et sont susceptibles de contenir de nombreuses erreurs. Le
prétraitement des données est une méthode éprouvée pour résoudre ces problèmes et
préparer les données brutes à un traitement ultérieur. Cette étape est importante qu'elle
soit effectuée correctement afin de ne pas impacter négativement le produit final ou la
sortie des données.
Dans ce chapitre, on va tout d’abord vous présenter l’origine de notre base de données.
Nous allons par la suite vous détailler le pré-traitement effectué.

1 Acquisition et description de notre dataset

1.1 Acquisition de la dataset
La base de données qu’on va utiliser provient de la plateforme web Kaggle. Cet
ensemble de données provient à l'origine de l'Institut national du diabète et des maladies
digestives et rénales.

1.2 Description de dataset

Les individus sélectionnés sont des femmes d’au moins 21 ans d’origine indienne.
Les ensembles de données se composent de plusieurs variables prédictives médicales
(indépendantes) et d'une variable cible (dépendante), Outcome .

1.2.1 Sélection des attributs

 Grossesses: nombre de fois enceinte

 Glucose: concentration plasmatique de glucose a 2 heures dans un test oral de tolérance
au glucose
 Pression artérielle: tension artérielle diastolique (mm Hg)
 Épaisseur de la peau: épaisseur du pli cutané du triceps (mm)
 Insuline: insuline sérique 2 heures (mu U / ml)
 IMC: Indice de masse corporelle (poids en kg / (taille en m) ^ 2)
 DiabetesPedigreeFunction: Fonction généalogique du diabète
 Âge: Âge (années)
 outcome: prend la variable 1 si la patiente est diabétique e.t 0 sinon

2.Préparation des données et analyse des données

Nous avons choisi comme outil de préparation de nos données Orange.
2.1 Nettoyage et complétion des données
Le nettoyage des données consiste à supprimer les données bruitées ou non pertinentes.
Et la complétion à compléter les valeurs manquantes pour rendre la base tolérable par
les techniques de fouille de données qu’on va utiliser par la suite.

Figure La complétion et nettoyage de donnée

Figure dataset avant la complétion et nettoyage

Figure dataset après la complétion et nettoyage

Conclusion
Ce chapitre nous a permis de nettoyer et structurer notre base de données afin de la préparer à une
future analyse.

Dans le prochain chapitre nous allons découvrir et appliquer l’algorithme de prédiction

Vous aimerez peut-être aussi

En Finir Avec Les Crises D'Angoisse: Shirley Trickett
Document27 pages
En Finir Avec Les Crises D'Angoisse: Shirley Trickett
Intissar Riahi
Pas encore d'évaluation
Detox
Document11 pages
Detox
Maria Martinez
Pas encore d'évaluation
Anesthésie Réanimation
Document6 pages
Anesthésie Réanimation
Serigne Sohibou Gaye
Pas encore d'évaluation
Révisions Ultimes Martingale
Document197 pages
Révisions Ultimes Martingale
Alox 92
Pas encore d'évaluation
O 21920 Gene Tique 4
Document8 pages
O 21920 Gene Tique 4
Yohan Julien
Pas encore d'évaluation
Examen Corrigé Programmation Orientée Objet
Document3 pages
Examen Corrigé Programmation Orientée Objet
Mariem Selmi
100% (5)
Examen Corrigé Programmation Orientée Objet
Document3 pages
Examen Corrigé Programmation Orientée Objet
Mariem Selmi
Pas encore d'évaluation
Etude de Cas 2 - SCRUM
Document4 pages
Etude de Cas 2 - SCRUM
Mariem Selmi
100% (2)
4 - Anxiété Sociale
Document6 pages
4 - Anxiété Sociale
sairys
Pas encore d'évaluation
Rapport Projet Datamining
Document16 pages
Rapport Projet Datamining
Mariem Selmi
Pas encore d'évaluation
TD 3 Règles D'association PDF
Document1 page
TD 3 Règles D'association PDF
Mariem Selmi
0% (1)
Cours Java Script 2
Document86 pages
Cours Java Script 2
Mariem Selmi
Pas encore d'évaluation
TP1-analyse de Trames VF 2021
Document1 page
TP1-analyse de Trames VF 2021
Mariem Selmi
Pas encore d'évaluation
Contrôle Intermédiaire Corrigé 2011
Document5 pages
Contrôle Intermédiaire Corrigé 2011
Mariem Selmi
100% (1)
Chapitre 1
Document3 pages
Chapitre 1
Mariem Selmi
Pas encore d'évaluation
TD 1
Document1 page
TD 1
Mariem Selmi
Pas encore d'évaluation
Rapport
Document29 pages
Rapport
Mariem Selmi
Pas encore d'évaluation
Chap2-2mipsisa Sesame
Document48 pages
Chap2-2mipsisa Sesame
Mariem Selmi
Pas encore d'évaluation
Exercice 1
Document4 pages
Exercice 1
Mariem Selmi
Pas encore d'évaluation
TP-Rev Pack PDF
Document2 pages
TP-Rev Pack PDF
Mariem Selmi
100% (1)
Data Mining Chaima
Document15 pages
Data Mining Chaima
Mariem Selmi
Pas encore d'évaluation
Chapitre 2
Document4 pages
Chapitre 2
Mariem Selmi
Pas encore d'évaluation
Packages PDF
Document19 pages
Packages PDF
Mariem Selmi
Pas encore d'évaluation
Triggers PDF
Document18 pages
Triggers PDF
Mariem Selmi
100% (1)
Procédures Et Fonctions - Complète PDF
Document20 pages
Procédures Et Fonctions - Complète PDF
Mariem Selmi
Pas encore d'évaluation
TP5 - Trigger PDF
Document2 pages
TP5 - Trigger PDF
Mariem Selmi
Pas encore d'évaluation
Mini Projet-1
Document5 pages
Mini Projet-1
Mariem Selmi
100% (4)
ITEM 267p - DOULEUR ABDOMINALE
Document8 pages
ITEM 267p - DOULEUR ABDOMINALE
Sofia Rhellab
Pas encore d'évaluation
Cours 1
Document24 pages
Cours 1
rahmouneimad949
Pas encore d'évaluation
Q 377 Ains
Document3 pages
Q 377 Ains
Hayet Senina
Pas encore d'évaluation
Fichier Produit 3877
Document50 pages
Fichier Produit 3877
Djamel Adja
Pas encore d'évaluation
Évaluation Du Risque Vasculaire Global
Document4 pages
Évaluation Du Risque Vasculaire Global
Djallal Hassani
Pas encore d'évaluation
Prolapsus Traitement Non Chirurgicale
Document45 pages
Prolapsus Traitement Non Chirurgicale
saffkhal ott
Pas encore d'évaluation
Hydrolysats Proteiques
Document6 pages
Hydrolysats Proteiques
Tahani Gouaou
Pas encore d'évaluation
Cours 1 IMC PHYSIO 2017
Document18 pages
Cours 1 IMC PHYSIO 2017
sawssen
Pas encore d'évaluation
FRE AoS Skaven Warscroll Card Plague Priest Plague Furnace
Document2 pages
FRE AoS Skaven Warscroll Card Plague Priest Plague Furnace
Aenomel Simon
Pas encore d'évaluation
Diagnostic D - Une Monoarthrite
Document4 pages
Diagnostic D - Une Monoarthrite
Heaven Hope
Pas encore d'évaluation
J.O. #6347 Du SAMEDI 19 MAI 2007 DECRET N° 2006-1258 Du 15 Novembre 2006
Document13 pages
J.O. #6347 Du SAMEDI 19 MAI 2007 DECRET N° 2006-1258 Du 15 Novembre 2006
Alamine Dieye
Pas encore d'évaluation
These Tembo Tymas
Document118 pages
These Tembo Tymas
Père Prosper
Pas encore d'évaluation
03 Flyer Ictere Du Nouveau Ne
Document2 pages
03 Flyer Ictere Du Nouveau Ne
DORAH DJOUMEJEU
Pas encore d'évaluation
TXM1221D H17 NotesDeCours S2 v7v2
Document28 pages
TXM1221D H17 NotesDeCours S2 v7v2
Je Rel
Pas encore d'évaluation
Les Anti Infectieux
Document7 pages
Les Anti Infectieux
faiza ali
Pas encore d'évaluation
Stade Pregenitaux
Document2 pages
Stade Pregenitaux
blusnow
Pas encore d'évaluation
6 Preventionpromotion de La Santé
Document40 pages
6 Preventionpromotion de La Santé
OUSSAMA
Pas encore d'évaluation
L'Approche Stepwise de L'Oms Pour La Surveillance Des Facteurs de Risque Des MNT
Document25 pages
L'Approche Stepwise de L'Oms Pour La Surveillance Des Facteurs de Risque Des MNT
Marie Rose Sandouno
Pas encore d'évaluation
2-Va Culaire2004
Document50 pages
2-Va Culaire2004
ebylehp
Pas encore d'évaluation
b2 PDF
Document58 pages
b2 PDF
Mfe
Pas encore d'évaluation
Dérivations Urinaires Non Continentes Défénitives
Document7 pages
Dérivations Urinaires Non Continentes Défénitives
Marc Pagniez
Pas encore d'évaluation
COURS N°1 SANTE PUBLIQUE Nov 2021
Document5 pages
COURS N°1 SANTE PUBLIQUE Nov 2021
Yasser Sebti
Pas encore d'évaluation
Ethique en Sante Regecap
Document28 pages
Ethique en Sante Regecap
badili
Pas encore d'évaluation
Comptre Rendu Patient
Document1 page
Comptre Rendu Patient
Claire Dupuis
Pas encore d'évaluation