Bienvenue sur Scribd !

Ignorer le carrousel

Atelier Data Science Use Case Fraude 0.2

Transféré par

Achraf Dahmani

0% ont trouvé ce document utile (0 vote)

11 vues2 pages

Copyright

Formats disponibles

DOCX, PDF, TXT ou lisez en ligne sur Scribd

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

11 vues2 pages

Atelier Data Science Use Case Fraude 0.2

Transféré par

Achraf Dahmani

Droits d'auteur :

Formats disponibles

Téléchargez comme DOCX, PDF, TXT ou lisez en ligne sur Scribd

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 2

Rechercher à l'intérieur du document

Atelier

: Construction d’un modèle de détection de la fraude

à l’indemnisation auto

Objectif de l’atelier :

L’objectif est de présenter les différentes étapes effectuées dans le cadre d’un projet de data science,
avec un échantillon restreint de données.
Vous disposez d’un jeu de données de 30 000 lignes et 15 variables. Parmi ces champs vous trouverez
la variable « fraude » indiquant si le sinistre a été détecté comme frauduleux ou non.
Dans ce cadre vous mènerez une analyse supervisée afin de prédire si les nouveaux sinistres sont
frauduleux ou non.
N’hésitez pas à ajouter des commentaires pour expliquer vos démarches et raisonnements.

1. DATA PREPARATION ET ANALYSE

1.1 COMPRÉHENSION DES DONNÉES :

 Analyser le périmètre des données : date de survenance des sinistres, date de souscription
des contrats, taux de fraude.
 Quelles sont les différentes valeurs des champs ?

1.2 CREATION DE VARIABLES

 Quelles informations sont pertinentes ?

 Quels indicateurs pourraient être calculés ?
 Analyser ces indicateurs et conclure : que doit-on faire d’un indicateur pertinent mais qui
comporte une ou plusieurs valeurs aberrantes ou manquantes ?
 Que pensez-vous de la variable DT_PERMIS ?

1.3 TRAITEMENT DES VALEURS MANQUANTES

 Analyser la qualité des données et remplacer les valeurs manquantes des variables si cela est
nécessaire.
 Quelles méthodes pouvez-vous utiliser pour traiter les valeurs manquantes ?
 Quelles variables peuvent être retirées de l’analyse ?

Remarque : Il est également habituel de traiter les valeurs aberrantes pour les variables explicatives.
Pour cet atelier nous disposons d’un jeu de données « relativement propre », et nous n’avons donc
pas réaliser cette étape.
(Vous pourrez tout de même constater la présence de certaines valeurs aberrantes comme un âge de
102 ans ou de 12ans…)

1.4 ANALYSE DES CORELATIONS

 Quels sont les objectifs d’une telle analyse?

1
 Que conclure de cette analyse ?

2. MODELISATION

2.1 CONSTRUCTION DU MODÈLE

 Séparer la base de données en un échantillon d’apprentissage et un échantillon de test.

Vous pouvez par exemple prendre 75% des données pour le train et 25% des données pour
tester le modèle.
Vous devez effectuer un échantillonnage stratifié afin de respecter la proportion de fraudeur
présente dans les deux échantillons.

 Construire des modèles de détection de la fraude en utilisant une analyse supervisée

Exemples d’algorithmes utilisés dans notre cas : Arbre de décision, Random Forest et AdaBoost.

 Evaluer les modèles testés : quel indicateur de comparaison choisir entre les différents
modèles ?

2.2 EVALUER LES RÉSULTATS

 Quelles sont les variables qui impactent le plus le phénomène de fraude ?

 Afficher la matrice de confusion

 Quelles sont les limites de la matrice de confusion : elle prend en compte la totalité des
individus scorés or il est souvent préférable de ne sélectionner que les X pourcents des
individus les mieux scorés.

 Représenter et commenter la courbe Lift du modèle choisi.

Vous aimerez peut-être aussi

Interrogation IA
Document10 pages
Interrogation IA
matthieus701
Pas encore d'évaluation
Featuredengineering Ebook - FINAL FR
Document16 pages
Featuredengineering Ebook - FINAL FR
ZAKARIA
Pas encore d'évaluation
Reponses Aux Questions
Document7 pages
Reponses Aux Questions
Drissa Fane
Pas encore d'évaluation
Ch6 Introduction À La Science de Données
Document15 pages
Ch6 Introduction À La Science de Données
Hmad SADAQ
Pas encore d'évaluation
Exam Six Sigma Green Belt 3
Document6 pages
Exam Six Sigma Green Belt 3
ScribdTranslations
Pas encore d'évaluation
Chapitre7 Intelligence Artificielle
Document29 pages
Chapitre7 Intelligence Artificielle
venanceharold
Pas encore d'évaluation
Logit Prob It 3
Document15 pages
Logit Prob It 3
mileene369
Pas encore d'évaluation
Cours ADD
Document105 pages
Cours ADD
rabab_elkhandari
100% (1)
Stat
Document6 pages
Stat
MééD ElboU
Pas encore d'évaluation
Contrôle Final - Machinelearning2021
Document6 pages
Contrôle Final - Machinelearning2021
Hanane KARDI
Pas encore d'évaluation
Prédiction Des Prix Immobiliers en Utilisant Les Modèles de Régression
Document15 pages
Prédiction Des Prix Immobiliers en Utilisant Les Modèles de Régression
hiba
Pas encore d'évaluation
Projet Scientifique
Document22 pages
Projet Scientifique
Jules Daniel Elibi
Pas encore d'évaluation
Exposé Serie Temporelle
Document19 pages
Exposé Serie Temporelle
David
Pas encore d'évaluation
Carte de Contrôle
Document97 pages
Carte de Contrôle
youneselbekkaoui
60% (5)
Atelier 3
Document12 pages
Atelier 3
lima
Pas encore d'évaluation
Universite Mohammed V Rabat Faculte Des Sciences Juridiques, Economiques Et Sociales Rabat Agdal
Document36 pages
Universite Mohammed V Rabat Faculte Des Sciences Juridiques, Economiques Et Sociales Rabat Agdal
Hamza Bennis
Pas encore d'évaluation
Analyse Des Donnees - Cours
Document61 pages
Analyse Des Donnees - Cours
Abdelwahab El Hadiri
100% (1)
CHAPITRE 2 Statistique
Document59 pages
CHAPITRE 2 Statistique
Abdallahi Sidi
Pas encore d'évaluation
Algorithme Machine Learng
Document16 pages
Algorithme Machine Learng
Yaya
Pas encore d'évaluation
CC Proba 3 Sdia.
Document5 pages
CC Proba 3 Sdia.
Ondigui ebolo
Pas encore d'évaluation
Exercice Données de Panel Synthèse
Document24 pages
Exercice Données de Panel Synthèse
smati
Pas encore d'évaluation
Techniques Quantitatives en Marketing
Document34 pages
Techniques Quantitatives en Marketing
Kadidia Cisse
50% (2)
Matrice de Confusion
Document2 pages
Matrice de Confusion
nohaila noha
Pas encore d'évaluation
Méthode Non Supervisé:: Définition DM
Document19 pages
Méthode Non Supervisé:: Définition DM
Houssayen Benouhiba
Pas encore d'évaluation
Projet Intelgence Artifficielle: Probleme de Calssification de Patients Diabetique
Document9 pages
Projet Intelgence Artifficielle: Probleme de Calssification de Patients Diabetique
G . A
Pas encore d'évaluation
Analyse de Donnees
Document11 pages
Analyse de Donnees
napnap5
Pas encore d'évaluation
TP4 ML
Document10 pages
TP4 ML
Walid Lahsiki
Pas encore d'évaluation
Lissage Exponentiel
Document6 pages
Lissage Exponentiel
Brahim Bouali
Pas encore d'évaluation
Méthodes de Simulations
Document82 pages
Méthodes de Simulations
bouhelal
Pas encore d'évaluation
Observations Relatives Aux Données Pour La Fonction ANOVA À Un Facteur Contrôlé - Minitab
Document4 pages
Observations Relatives Aux Données Pour La Fonction ANOVA À Un Facteur Contrôlé - Minitab
Yatie Mamadou DAYO
Pas encore d'évaluation
Sujet 46
Document14 pages
Sujet 46
Amìnè Cheìkh Mèd
Pas encore d'évaluation
CH 04
Document24 pages
CH 04
Rafique Akhtar
Pas encore d'évaluation
FR Tanagra Scoring
Document11 pages
FR Tanagra Scoring
Samir Benchakroun
Pas encore d'évaluation
Chapitre 2 - Méthodologie PDF
Document5 pages
Chapitre 2 - Méthodologie PDF
Codou Youm
Pas encore d'évaluation
Améliorer Les Performances D'un Modèle Prédictif: Perspectives Et Réalité
Document28 pages
Améliorer Les Performances D'un Modèle Prédictif: Perspectives Et Réalité
saidista2021
Pas encore d'évaluation
Projet Data Science
Document15 pages
Projet Data Science
Ettiboi Eric Kabran
Pas encore d'évaluation
Conception Des Processus Métier Basée Sur Les Règles
Document14 pages
Conception Des Processus Métier Basée Sur Les Règles
benn yass
Pas encore d'évaluation
DM1 Introduction
Document46 pages
DM1 Introduction
jack barl
Pas encore d'évaluation
Fiche Data Analysis
Document6 pages
Fiche Data Analysis
charpentier
Pas encore d'évaluation
Cours Simulation
Document71 pages
Cours Simulation
Mouadh Dimassi
Pas encore d'évaluation
Modèle de Panel
Document27 pages
Modèle de Panel
Walid Bouqayes
50% (2)
GRAIE Criteres INDICATEURS AUTOEVALUTIONdesMODELES AUTOSURVEILLANCE WEB18 v1
Document17 pages
GRAIE Criteres INDICATEURS AUTOEVALUTIONdesMODELES AUTOSURVEILLANCE WEB18 v1
Lionel Cédric Gohouede
Pas encore d'évaluation
Les Réseaux Neuronaux Artificiels Pour La Classification: Cas D'échecs Commerciaux
Document11 pages
Les Réseaux Neuronaux Artificiels Pour La Classification: Cas D'échecs Commerciaux
Moulay Mahdi Morsli
Pas encore d'évaluation
Comment Evaluer La Qualite D Un Resultat
Document11 pages
Comment Evaluer La Qualite D Un Resultat
kopnang
Pas encore d'évaluation
Mestiri Mining Fall2015
Document48 pages
Mestiri Mining Fall2015
Bassma Khila
Pas encore d'évaluation
SPSS Statistic Cours (Analyse Variée Et Bivariee)
Document35 pages
SPSS Statistic Cours (Analyse Variée Et Bivariee)
karoke music
Pas encore d'évaluation
2-Fr Sipina Cost Sensitive
Document18 pages
2-Fr Sipina Cost Sensitive
Soleil Sucré
Pas encore d'évaluation
Techniques de Test
Document43 pages
Techniques de Test
Chiheb NJ
Pas encore d'évaluation
Les Fiches Pratiques d'InnovaXion
Document69 pages
Les Fiches Pratiques d'InnovaXion
Fezzani23
Pas encore d'évaluation
Acp
Document19 pages
Acp
sancha22
100% (1)
Analyses Donnees Definition Echantillons Janv 2021
Document10 pages
Analyses Donnees Definition Echantillons Janv 2021
Mamadou Diouck Sow
Pas encore d'évaluation
Chapitre 5 VL
Document102 pages
Chapitre 5 VL
Thï Zïrī
Pas encore d'évaluation
Metric de Devaluation Performance
Document16 pages
Metric de Devaluation Performance
sow
Pas encore d'évaluation
Use Case Cancer
Document9 pages
Use Case Cancer
adkhey87
Pas encore d'évaluation
Analyse de Fonnées
Document45 pages
Analyse de Fonnées
mohammed
Pas encore d'évaluation
Rapport
Document101 pages
Rapport
Nesrine Kalboussi
Pas encore d'évaluation
Le diagramme d'Ishikawa: Les liens de cause à effet
D'Everand
Le diagramme d'Ishikawa: Les liens de cause à effet
Ariane de Saeger
Évaluation : 3.5 sur 5 étoiles
3.5/5 (3)
Exercices d'inférence statistique
D'Everand
Exercices d'inférence statistique
Simone Malacrida
Pas encore d'évaluation
Appliquer le modèle de Rasch: Défis et pistes de solution
D'Everand
Appliquer le modèle de Rasch: Défis et pistes de solution
Éric Dionne
Pas encore d'évaluation
Analyser les données qualitatives en gestion
D'Everand
Analyser les données qualitatives en gestion
Catherine Voynnet Fourboul
Pas encore d'évaluation
Poly Eva Partiel Francais
Document86 pages
Poly Eva Partiel Francais
Achraf Dahmani
Pas encore d'évaluation
Enoncé2016
Document50 pages
Enoncé2016
Achraf Dahmani
Pas encore d'évaluation
Poo4 tp1
Document9 pages
Poo4 tp1
Achraf Dahmani
Pas encore d'évaluation
Lauto Entrepreneur
Document28 pages
Lauto Entrepreneur
Meryem Echibi
Pas encore d'évaluation
Devis 00251-12042021
Document1 page
Devis 00251-12042021
Achraf Dahmani
Pas encore d'évaluation
Dans 1 An Il Ya Combien de Seconde - Recherche Google
Document1 page
Dans 1 An Il Ya Combien de Seconde - Recherche Google
fannyibrahim402
Pas encore d'évaluation
TCS - Unité 1 - Cahier D'élève - Elalami
Document70 pages
TCS - Unité 1 - Cahier D'élève - Elalami
MAKTABAT NOUR
Pas encore d'évaluation
Regime Gluten
Document15 pages
Regime Gluten
honore belloti
100% (1)
Rapport ANSALDO PDF
Document24 pages
Rapport ANSALDO PDF
Hamzaamara
Pas encore d'évaluation
Sermons de Bossuet
Document807 pages
Sermons de Bossuet
Capitalemo
Pas encore d'évaluation
La Spore Bactérienne Fin
Document24 pages
La Spore Bactérienne Fin
Meriem TV
100% (1)
Lloyd Tunisien Efd311215
Document41 pages
Lloyd Tunisien Efd311215
manelweslati4
Pas encore d'évaluation
Systemes Hyperstatiques en Flexion-W-Cours-Bresse
Document18 pages
Systemes Hyperstatiques en Flexion-W-Cours-Bresse
As Scof
Pas encore d'évaluation
Le Groupement Tactique Interarmes en Zone Urbanisee
Document3 pages
Le Groupement Tactique Interarmes en Zone Urbanisee
Uncle Joffe
Pas encore d'évaluation
Travaux Dirigés Régulation Ind. 21
Document54 pages
Travaux Dirigés Régulation Ind. 21
Amina Lazreg
Pas encore d'évaluation
Stèle D
Document7 pages
Stèle D
Angelika Erhardt
Pas encore d'évaluation
COURS Assainissement Chap 2 2011
Document22 pages
COURS Assainissement Chap 2 2011
sabbanrachid
100% (4)
Bons de Travail
Document12 pages
Bons de Travail
Moha Amazo
Pas encore d'évaluation
CURRICULUM VITAE - BOUTIRA Bouchra
Document3 pages
CURRICULUM VITAE - BOUTIRA Bouchra
bouchghabtra
Pas encore d'évaluation
Guide Normes Etudes Reconnaissance Caracterisation Sols
Document22 pages
Guide Normes Etudes Reconnaissance Caracterisation Sols
André Germain Mbogba
Pas encore d'évaluation
4e VI, 2 Jean Valjean
Document1 page
4e VI, 2 Jean Valjean
Maxime Hengert
100% (1)
(WEB) Activité - ARPP Influenceurs Virtuels P1
Document1 page
(WEB) Activité - ARPP Influenceurs Virtuels P1
le mr
Pas encore d'évaluation
Cours 1 BD Avancees
Document173 pages
Cours 1 BD Avancees
Baro Yeyahh Aysha
Pas encore d'évaluation
MSFRA130078
Document81 pages
MSFRA130078
Ines HM
Pas encore d'évaluation
Calcul Du Volume Du Réservoir
Document11 pages
Calcul Du Volume Du Réservoir
Amel Hyd
50% (2)
Restaurer La Dent Dépulpée
Document138 pages
Restaurer La Dent Dépulpée
benzimra
Pas encore d'évaluation
Technique Analyse Univariee
Document26 pages
Technique Analyse Univariee
kago1
Pas encore d'évaluation
Book TBP FR
Document6 pages
Book TBP FR
Depanama Francky
Pas encore d'évaluation
Cours D Audit Compress
Document29 pages
Cours D Audit Compress
Mehdi Ben
Pas encore d'évaluation
CYC5600A
Document3 pages
CYC5600A
Chafik Albadraoui
Pas encore d'évaluation
Centre de Cisaillement
Document12 pages
Centre de Cisaillement
Mohammed Mammar Kouadri
100% (1)
Td1statique PDF
Document5 pages
Td1statique PDF
foufoua
Pas encore d'évaluation
Élaboration Du Projet de La Stratégie Nationale de L
Document5 pages
Élaboration Du Projet de La Stratégie Nationale de L
Sara Bouchikhi
Pas encore d'évaluation
Devoir de Synthèse N°1 - Physique - Bac Tech (2009-2010) MR Beni Hassen
Document4 pages
Devoir de Synthèse N°1 - Physique - Bac Tech (2009-2010) MR Beni Hassen
Aicha Tennich
Pas encore d'évaluation
1219964637
Document4 pages
1219964637
Soleilla Gouaka
Pas encore d'évaluation