Académique Documents
Professionnel Documents
Culture Documents
crédit en utilisant
Modèles d'apprentissage automatique
Soutenu le 4 avril 2023 par :
Mr. Amine TAOUFIK
Encadré par :
Mme ELFAH Sofia
Plan de presentation
introduction
problematique
objectifs
Scenario background
Contexte Technique
La crise financière de 2008 a créé le besoin d'une prévision révisée des risques
Prédire si un demandeur de prêt fera défaut sur le prêt s'il est approuvé
Développeurs et intégrateurs
Parties informatiques
prenantes du
projet Équipe de conformité légale et
réglementaire
Group data science Affiner la source de Développer un modèle examiner les résultats présenter le modèle
données pour respecter révisé et affiner le modèle au affiner et ROI
les directives éthiques besoin expectations
Group infrastructure Développer un assurer la qualité et la sécurité des données mettre en œuvre le
environnement de dans et hors de la base de données modèle de production
découverte pour le approuver les
développement de exigences de mise en
modèles œuvre
Gamme de produits Évaluer le modèle approbation de la
pilote pour la réalisation des
faisabilité de l'analyse objectifs commerciaux
de rentabilisation
plan de projet pilote de modification
Concerne Solution propose Responsable
Data security Séparez les informations personnelles des informations financières équipe d'infrastructure
dans la base de données ; Anonymiser les données ; Utilisez le informatique
cryptage AES 256 bits et SSL pour tous les mouvements de
données
Data integrity Valider les ensembles de test et de formation correspondant aux équipe de science des
profils d'utilisateurs réels ; Réduisez/éliminez les erreurs de données
réplication de données et effectuez une validation croisée par
rapport à de bonnes sources connues
utilisation éthique des Veiller à ce que les variables des sources de données ne équipe de science des
données puissent pas être utilisées pour perpétuer des pratiques de données , équipe de
prêt discriminatoires ; assurer le respect de la loi Dodd- régularité
Frank
Performance de model Maintenir ou améliorer la précision du modèle ; améliorer équipe de science des
le temps de formation; améliorer le retour sur données
investissement
Méthodologie pilote
Le pilote produit un produit minimum viable
Précision de la prédiction
faux 30%
faux 20%
modification de la recherche pilote
solution d'analyse de données pour la mise en œuvre
Révision du modèle pilote
La réduction des caractéristiques des données nécessite une nouvelle approche
de modélisation
Les avantages de naïve bayes
Les données doivent également être révisées pour se conformer aux objectifs
éthiques Résistant au surajustement
Naive Bayes calcule les probabilités conditionnelles en utilisant Théorème de Calcul extrêmement rapide
Bayes et choisit le maximum a posteriori pour classer une observation Résultats faciles à interpréter
Peut travailler sur de très petits ensembles
de données
Révision du modèle pilote
Meilleur ajustement que la régression
logistique, compte tenu de la structure
des données et des objectifs du projet
Choisir le bon modèle peut fournir un meilleur résultat sur les plans financier, opérationnel et éthique
Un nettoyage des données et une transformation statistique appropriés sont essentiels pour une performance supérieure du
modèle
De petites augmentations d'efficacité peuvent fournir un retour sur investissement considérablement amélioré
Utilisations alternatives
Peut être utilisé sur n'importe quel ensemble de données où l'espace variable a été réduit en raison de contraintes éthiques
Les industries potentielles incluent l'assurance, la santé, la finance ou toute industrie qui a historiquement fait face à des
pratiques discriminatoires