Vous êtes sur la page 1sur 1
se ey ad ad yy Wveraité Fe : Fs ioe Pama : q we ole cla tay isskoooen 1, Expliquer suceinctement ce ent « sous Sates ue signifient « sous-apprentissage » et « sur-apprentissage » en termes do a me te sens des indicateurs : sensibilité et spécificité. 3 Eaplguer es Paton de risque empiique etd risque rél en précisant la diffrence, sthodes: issage supervisé se divisent en deux types : classificatic li Aitférence entre les deux en donnant un exemple (une méthode) pour chaque ype se Exoiquer la Exercice 2 (6 points) ‘* Supposons qu'une épicerie vous enga, timiser I 7 cl votsavez line dev vasa eben unas nnn mane Aces 1 J, (Pourinre ou; chats, nourriture pour chiens, viande hachée, pains @ hamburger, ketchup, B: Sa x: his 2. be - ee a yo a ieiewt ‘pour chien, viande hachée, pains a hamburger, croissant} = (friandists pour chien, nourriture pour chien, ketchup, mout B4 = {sushi, cérgales, ketchup, jus) oe ae 1, Trouvez tous les éléments avec un suy ; ec un support Max (support > 1). 2. En utilisant 'algorithme APriori et ce que vous avez trouvé ci-dessus, trouver Jes paires d'éléments fréquents avec support > 1 3. Quelle est la coafiance de Tessociation {nourriture pour chien} > {viande hachée} ? Quel est son imérét ? © Supposons maintenant que nous voulions trouver des acheteurs similaites en utilisant Ya similarité Jaccard, Trouver des paires dacheteurs avec une similarité Jaccard > 0,3. Exercice 3 (10 points) Pour évaluer un algorithme de classification binaire, nous avons choisi et testé l'algorithme de regression fogistique sur une base de test contenant 15 cas. L'algorithme de régression logistique, décide qu'une nouvelle instance est positive ou négative selon un seuil choisi par l'utilisateur, Dans notre cas, plus ce seul est grand plus le nombre de cas prédits avgmente. Le tableau ci-dessous monte le résultat de prédiction selon I'évolution ga seuil, Les étiqueites P et N désignent Positive et Négative respectivement, Seuil de O1] O27 03 2) 8] er | oa] al 1 régression-log Résultat de P NOON. © NP ONN wae P 1a lecture du tableau sera comme suit : au seuil 0.1 le systéme prédit les tis instances étiquetées per PPN. es 5 instances ‘Dans la prochaine expérience, le nouveau seuil est 0.2 et Je systéme de classification retoune PPN PP. Pour le seul 0.3, le résultat de prédiction est: PPN PP PN. A ta fin, on arrive au seuil 1 aver un résulet de prédiction qui contient la totalité des 15 instances de notre base de test. Questions J. Calculer la précision et le rappel du systdme de classification précédent aux seuils 0. 2. Seton les résultats de la question 1, quel est le meitleue seuil ? 3. Construite le tableau précision rappel 4, Tracer la courbe précision rappel ainsi que le courbe précision rappel interpolée (smooth). 5. calculer la précision moyenne (Average Precision AP). a 2et03.

Vous aimerez peut-être aussi