Académique Documents
Professionnel Documents
Culture Documents
tp6 Data-Mining
tp6 Data-Mining
TP 07
LES RÉSEAUX DE NEURONE ARTIFICIELS DANS R
Nom : Tikouk
Prénom : Jamal
Filière : ID-1
OBJECTIF DU TP
Ce TP a pour objectifs :
« http://freakonometrics.free.fr/german_credit.csv »
L’utilisation des RNA : L'objectif consiste à d'utiliser les kNN et les réseaux de
neurone artificiels pour cré er un modè le de pré diction sur un jeu de donné es
(credit-‐-german).
Exercice ❶ : kNN
Chargement des données :
Nous observons que parmi les clients, 700 ont réussi à rembourser leurs crédits avec succès, tandis que
300 ont échoué. Sur la base de ces résultats, nous utiliserons le statut de ces clients pour construire notre
prédiction pour les nouveaux clients.
Lors de l'analyse des données extraites du fichier "credit-german.txt", nous constatons l'absence de
données manquantes, dispersées ou en double. Cependant, en ce qui concerne les données
aberrantes, il est clair que la variable "Montant du crédit" est celle qui présente des problèmes
potentiels.
En examinant le diagramme en boîte et moustaches, nous avons identifié plusieurs valeurs atypiques.
Nous devons maintenant décider si nous devons les supprimer s'ils n'entraînent pas de perte
d'informations, ou bien consulter des experts du domaine des systèmes bancaires pour les corriger.
Il est essentiel de prendre les mesures appropriées pour traiter les valeurs aberrantes détectées, afin
de garantir l'intégrité et la fiabilité de notre analyse.
NOrmalisation des dOnnées et transfOrmation en échelle cOmmune :
Et On vérifie finalement cette normalisation via les deux instructions ci-dessOus ; Summary () affiche le
résumé statique du data frame creditGermanNOr
str () affiche la taille du data frame creditGermanNOr (ligne et cOlOnne), le type des variables et leur
valeurs qui sOnt bien normalisées.