Académique Documents
Professionnel Documents
Culture Documents
#On a divisé par 5 le nombre de features utilisées, pas mal mais voyons si les
performances restent similaires. À l'aide de l'argument threshold, on peut choisir
le seuil d'importance que l'on souhaite pour les features à sélectionner. On
calcule en même temps le gain de temps car c'est ce qui nous intéresse
principalement dans l'amélioration des performances.
import timeit
start_time = timeit.default_timer()
X_test2 = select.transform(X_test)
pred = rfc2.predict(X_test2)
elapsed = timeit.default_timer() - start_time
accuracy = accuracy_score(y_test, pred)