Académique Documents
Professionnel Documents
Culture Documents
1. Lancez l’éditeur Python de votre choix (par exemple Spyder) et créez un nouveau script .py.
Celui-ci devra importer le package Orange, ouvrir le jeu de données wine.tab, et afficher les noms
de l’ensemble de ses attributs, le nom de la classe cible, et le nombre d’échantillons.
2. Créez maintenant une instance de la classe objet Orange.classification.TreeLearner pour
apprendre un classifieur basé sur un arbre de décision. Vous testerez la qualité de celui-ci avec
une validation croisée par la méthode des k-folds 3 (k = 2). Quels sont les scores AUC et CA
obtenus ?
3. Lancez à présent le logiciel Orange avec son interface graphique et créez un workflow permettant
de réaliser le même test à l’aide des modules File, Tree, et Test and Score. Les résultats obte-
nus sont-ils comparables ? Ajoutez une ligne print(learner.params) (avec learner l’instance
de classe TreeLearner) à votre script .py : qu’observez-vous ?
4. Modifiez maintenant votre script pour apprendre un classifieur de type forêt aléatoire (paramétré
par défaut) à partir du jeu de données. Vous sauverez celui-ci sous forme de fichier à l’aide de la
fonction suivante :
import pickle
Modifiez votre workflow dans la version graphique de Orange afin d’ajouter les modules
Model->Load Model et Evaluate->Predictions comme suit :
1. https://orange.biolab.si/
2. https://scikit-learn.org/
3. https://docs.biolab.si//3/data-mining-library/reference/evaluation.testing.html
Page 1/3
Intelligence Artificielle M2 Génie physiologique, biotechnologique & informatique
Chargez le classifieur sauvegardé depuis le script dans le module Load Model puis observez les
scores de prédiction. Que constatez-vous ?
5. Ajoutez maintenant ces lignes au script .py :
import numpy as np
y_actual = data . Y
y_predictions = np . array ( [ classifier ( data ) ] )
res = Orange . evaluation . testing . Results ( data , actual = y_actual , predicted =
y_predictions )
print ( " Accuracy : " , Orange . evaluation . scoring . CA ( res ) )
print ( " AUC : " , Orange . evaluation . scoring . AUC ( res ) )
(la variable classifier correspond au classifieur actuel et la variable data aux données du fi-
chier wine.tab)
Testez à nouveau votre script. Votre critère de performance sera le score CA. Adaptez le workflow
Orange pour obtenir les mêmes résultats. Conclusion(s) ?
4. https://pandas.pydata.org/
Page 2/3
Intelligence Artificielle M2 Génie physiologique, biotechnologique & informatique
import pandas as pd
1. Réalisez le test de performance demandé. Pour rappel, il consiste à comparer les performances
de classifieurs basés sur les modèles d’apprentissages suivants : machines à vecteurs de supports,
boosting adaptatif, réseaux de neurones artificiels, arbre de décision, et forêts d’arbres décision-
nels. La métrique d’évaluation utilisée sera la précision de classification (accuracy), calculée à
l’aide de la méthode des k-folds (k = 5). Votre test basé sur scikit-learn est-il conforme aux
résultats obtenus avec Orange ? Quel modèle obtient les meilleurs résultats ?
2. Changez les paramètres de votre classifieur SVM de sorte qu’il n’utilise pas d’astuce du noyau,
et relancez l’apprentissage. Quelle est l’incidence de ce changement ?
Page 3/3