Académique Documents
Professionnel Documents
Culture Documents
[3]: t = 0.2
X_train, X_test, Y_train, Y_test = train_test_split(X,y,test_size=t)
print("Train set : ", X_train.shape)
print("Test set : ", X_test.shape)
[5]: KNeighborsClassifier(n_neighbors=1)
1
[7]: KNeighborsClassifier(n_neighbors=3)
[9]: KNeighborsClassifier(n_neighbors=4)
[12]: #Question 2 : Evaluation finale en conclusion pour k=4 nous obtenons le␣
↪meilleur score
print(compare_score)
Model Score
0 Model(k=1) 0.92
1 Model(k=3) 0.92
2 Model(k=4) 0.93
t = 0.4
X_train, X_test, Y_train, Y_test = train_test_split(X,y,test_size=t)
print("Train set : ", X_train.shape)
print("Test set : ", X_test.shape)
2
[16]: #paramètre du modèle 3
model3.fit(X_train, Y_train)
score2 = round(model3.score(X_test, Y_test), 2)
Model Score
0 Model(k=1) 0.91
1 Model(k=3) 0.92
2 Model(k=4) 0.92
[21]: #Question 4 - B :
cross_val_score(KNeighborsClassifier(), X_train, Y_train, cv = 5, scoring =␣
↪'accuracy')
val_score.append(score)
print(val_score)
3
0.9003410059676045, 0.9003410059676045, 0.9003410059676045, 0.9003410059676045,
0.9032821824381927, 0.8973998294970162, 0.8973998294970162, 0.8973998294970162,
0.8973998294970162, 0.9003410059676045, 0.9032821824381927, 0.9003410059676045,
0.9003410059676045]
[23]: Text(0, 0.5, 'Les valeurs des différentes moyennes des scores')
[34]: #Le modèle obtenu est le modèle k = 7 et k = 8 nous avons les mêmes valeurs
#car ils ont obtenu score = 0.9384057971014494
4
[26]: #Affichons la dimension de train_score
print(train_score.shape)
(49, 5)
(49, 5)
[28]: #Question F : visualisons les différents scores moyens en fonction du nombre de␣
↪voisin
plt.grid(True)
plt.plot(k, val_score.mean(axis=1), label='validation', marker='+')
plt.ylabel('score')
plt.xlabel('n_neighbors')
plt.grid(True)
5
plt.plot(k, train_score.mean(axis=1), color="r", label='validation', marker='+')
plt.ylabel('train')
plt.xlabel('n_neighbors')
[30]: #Nous remarquons que plus le nombre de voisins augmentent le score des données␣
↪entrainés diminue au fur et à mesure
6
[32]: Text(0.5, 0, 'n_neighbors')
[33]: #Nous remarquons que plus le nombre de voisins augmentent le score des données␣
↪de test diminue au fur et à mesure