Académique Documents
Professionnel Documents
Culture Documents
Année 2022-2023
TP : Machine Learning
Bonne Chance !
3- Spécifier X les Features de la dataset et y l’Outcome avec la fonction
iloc
4- Gérer les variables catégoriques
5- Diviser le dataset entre le Training set et le Test set
6- Construire le modèle et faire l’entrainement sur X_train, y_train
7- Faire la predicition de y_pred
8- Faire la prediction sur np.array([[1,0,0, 130000, 140000, 300000]])
9- Donner les valeurs de l’intercept et le coef
10- Calculer le r2 score
11- Essayer de trouver un modele mais avec moins de variables en
utilisant RFE de sklearn.feature_selection
Régression Logistique
C’est le cas d'une entreprise qui détient un data set qui contient des
informations sur des clients qui ont acheté ou non des voitures après
avoir reçu une publicité sur les réseaux sociaux. Nous devons construire
un modèle qui nous aide à prédire les acheteurs potentiels pour leur
envoyer des publicités ciblées.
Bonne Chance !
12- Afficher la courbe ROC , que constatez vous à partier de ces
résultats
13- Effectuez la validation croisée en donnant à cv la valeur de 5
14- Utiliser la technique de Hyperparameter Tuning afin d’optimiser
les résultats et afficher les best params, et le best_score
15- Donner les mesures accuracy ..etc utilisés avant encore une fois
16- Utiliser le RandomizedSearchCV avec :
from scipy.stats import uniform
C = uniform(loc=0, scale=4) # une distribution entre 0 et 4
parameters_2 = {"C":C}
17- Donner cv_random.best_params et cv_random.best_score
18- Visualiser les résultats
19- Donner l’intecept et le coef.
Bonne Chance !