Vous êtes sur la page 1sur 1

Université Moulay Ismail

Ecole Supérieure de Technologie de Meknès

TP 3 : Les bases des


DataFrames
1 Bestsellers dataset

• Utilisez Pandas pour lire le jeu de données 'bestsellers' dans un DataFrame.


• Utilisez Pandas pour déterminer le nombre de lignes et de colonnes du DF.
• Inspectez les 5 premières lignes
• Inspecter les 19 premières lignes
• Inspecter les 5 dernières lignes
• Inspectez les 2 dernières lignes
• Quelles colonnes (le cas échéant) ont des valeurs manquantes ?
• Quel type de données Pandas est-il attribué à "User Rating" ?
• Combien de colonnes de nombres entiers y a-t-il dans le DataFrame ?

2 Tri des données

Chargez les données de « countries of the world.csv» et répondez aux questions suivantes :
• Afficher l’intégralité du DataFrame
• Définissez le nom des pays « country name » comme l’index du dataframe
• Trier le DataFrame dans le sens ascendant
• Trier le DataFrame dans le sens descendant et enregistrer le DataFrame avec cet
ordonnancement

3 Filtrage des données

Répondez aux questions suivantes en utilisant le dataset bestsellers.csv :


• Trouvez les livres de Non Fiction qui sont évalués 4.9 (rate)
• Trouvez les livres écrits par Pete Souza.
• Trouvez les livres dont le prix est inférieur à 10 dollars
• Trouvez les livres dont le prix est compris entre 50 et 60 dollars.
• Trouvez tous les livres écrits par Kristin Hannah, Andy Weir, ou Delia Owens.
• Trouvez le livre de fiction avec la note la plus basse des utilisateurs. (rate)
• Trouver le top 5 des livres de fiction de 2012 avec le plus d'avis.
• Créez un diagramme en bâtons montrant les 5 auteurs qui ont le plus de livres avec une
note inférieure à 4,5.

Filière IATE Dr. Asmae MAMANE

Vous aimerez peut-être aussi