Académique Documents
Professionnel Documents
Culture Documents
● On visualise les données avec View(). On constate qu’il y a de nombreuses valeurs manquantes NA.
● Les données sont celles de personnes réalisant des dons. L’objectif de ce tutoriel est de prédire la
probabilité du don d’une personne d’après son profil.
● DONOR_IND : Y / N indique si la personne a fait un don ou non (les autres colonnes constituent son
profil et seront donc déterminantes pour notre étude).
● Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Nettoyage des données
● Pour ne pas qu’elles nous bloquent, on remplace les valeurs manquantes (NA) avec la fonction suivante :
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Nettoyage des données
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Nettoyage des données
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Nettoyage des données
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Ensembles de test et d’apprentissage
On crée un ensemble de test et un d’apprentissage. Ils vont nous permettre d'entraîner le modèle et de le tester
(sur le reste des données qui n’auront pas servi à l’apprentissage).
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Fonction d’entrée
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Construction d’un classificateur
On crée ensuite notre classifieur à l’aide de la fonction dnn_classifier() où on passe nos features columns et on
indique qu’on a trois couches cachées avec respectivement 80, 40 et 30 nœuds.
Source : https://analyticsinsights.io/tutoriel-deep-learning-avec-tensorflow-dans-r/
Tutoriel : Construction du modèle
On utilise ici notre classifier, et en input : la fonction d’apprentissage appliquée sur nos données d'entraînement
On utilise la fonction train() qui prend en argument le classifier et en input notre fonction d’entrée appliquée à
nos données
Tutoriel : Prédiction de la valeur
Objectif : Prédire la valeur (on la prédit pour le dataset de test puis sur le complet)
=> On utilise ici : le model, le dataset de test et le dataset complet.
=> La fonction utilisée pour la prédiction est predit() qui prend en argument le classifier et en input notre
fonction d’entrée appliquée à nos données.
Tutoriel : Evaluation du modèle
● Une fois sur le notebook, il n’y a plus qu’à entrer le code dans l’onglet prévu à cet effet et appuyer sur la
flèche pour l’exécuter
● Sous le code, on peut voir le résultat de l’exécution (ici, on affiche la version de tensorflow).
Utilisation de Google Colab
● Pour une installation en local sur votre ordinateur : dans le terminal de votre ordinateur, exécutez la
commande suivante : pip install tensorflow
● Ici, on va charger le jeu de données MNIST qu’on peut trouver dans tensorflow
MNIST est une base de données de chiffres écrits à la main. C’est un jeu de données très utilisé en
apprentissage automatique.
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Chargement du jeu de données
On explore les données chargées et on affiche le 800 ème élément ainsi que son étiquette pour le visualiser.
Cela permet de prendre connaissance des données qu’on va traiter
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Les librairies utilisées
● Résultat après avoir exécuté le code : On voit que X_train contient 60k d'exemples. Chaque exemple est
une image 28 x 28. Y_train contient 60k étiquettes.
Tutoriel : Nettoyage des données
● Maintenant qu’on sait à quoi ressemblent nos données, on va les convertir d'entiers en nombres à virgule
flottante
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Création du modèle d’apprentissage automatique
● Pour chaque exemple, le modèle renvoie un vecteur de scores logits ou log-odds, un pour chaque classe (il
s’agit d’un vecteur de prédictions brutes non normalisées).
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Création du modèle d’apprentissage automatique
● On convertit ensuite ces logits en probabilités, pour chaque classe, à l’aide de la fonction tf.nn.softmax :
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Création du modèle d’apprentissage automatique
● Cette perte est égale à la probabilité logarithmique négative de la vraie classe : la perte est nulle si le
modèle est sûr de la bonne classe.
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Création du modèle d’apprentissage automatique
Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Tutoriel : Entraînement et évaluation du modèle
● On utilise la méthode Model.fit pour ajuster les paramètres de votre modèle et minimiser la perte
● Le classificateur d'images est maintenant formé à une précision d'environ 98 % sur cet ensemble de
données.
● Source : https://www.tensorflow.org/tutorials/quickstart/beginner?hl=fr
Références