Académique Documents
Professionnel Documents
Culture Documents
Reprenez le TP2.
Nettoyage des données
1. Simulez des valeurs manquantes en remplaçant certains mpg avec NA.
2. Identifiez les lignes contenant des valeurs manquantes pour mpg.
3. Remplacez les valeurs manquantes de mpg par la moyenne des valeurs non manquantes.
4. Calculez le score Z pour la variable hp (puissance). (Z = (x- mu)/ segma)
5. Identifiez les voitures avec un score Z supérieur à 2 ou inférieur à -2 comme étant des
valeurs aberrantes.
6. Remplacez les valeurs aberrantes de hp par la médiane de hp.
1 Ameni Yengui