Académique Documents
Professionnel Documents
Culture Documents
1. Jeu de données
Dans ce TP, nous utilisons le datasetOIHACDB (Off-
lineIsolatedHandwrittenArabicCharactersDataBase) des caractères manuscrits isolés Arabes
construisait par Boufenar en 2016. Le datsetcontient 5600 images de taille 128*128 pixels
chacune en format bmp (voir mosaïque ci-dessous).
2. Travail demandé
Chargement du dataset
Découper le dataset en deux ensembles : Training et Test
Utiliser le conteneur ‘Collection.Counter()’ pour compter le nombre d’exemples
dans chaque classe de l’ensemble d’entrainement.Afficher lesobservations dans
chaque classe à l’aide de barres (seaborn.countplot()).
Afficher 50 images dans l’ensemble d’entraînement en utilisant ‘imshow()’.
Remodeler les données des deux ensembles (test et train) pour qu’ils correspondent
auxattentes de ‘Keras’ (reshape()).
2018/2019 1/3
Créer le modèle (Sequential()).
Configurer le processus d’apprentissage en utilisant les trois fameux types
d’optimiseur (SGD, RMSProp, Adam).
Entrainer le modèle (.fit())
Evaluer le modèle (.evaluate()).
Afficher la matrice de confusion.
Afficher quelques images avec leurs étiquettes prédites et réelles.
Afficher le rapport de la classification (classification_report()).
2018/2019 2/3