Vous êtes sur la page 1sur 4

Atelier de travail – Pandas

Utilitaire utiliséʺTHONNYʺ

Activité 1
Soit la base de données ʺGestion_cereales.accdbʺ située dans ʺc:\Formation_pandasʺ :
Exportation de la base :
1- Exporter la table cereale sous le nom ʺcereale.xlsxʺ.
2- Exporter la table cereale sous le nom ʺcereale.csvʺ (choisir le séparateur ʺ;ʺ, le symbole décimal est ʺ. ʺ et le
codage ʺUTF-8ʺ.
3- Exporter la table cereale sous le nomʺ Cereale2.csvʺ (choisir le séparateur ʺ;ʺet le codage ʺ ANSI ʺ.
Chargement de la base dans pandas (importation d’un dataframe)
1- Charger dans une variable data le classeur ʺcereale.xlsxʺ et afficher son contenue.
data=ps.read_excel("cereale.xlsx")
2- Charger dans une variable notes la feuille Trimestre1 du classeur
ʺc:\Formation_pandas\Gestion_notes\note2019.xlsxʺ et afficher son contenue.
notes=ps.read_excel("c:/Formation_pandas/Gestion_notes/note2019.xlsx "," Trimestre1 ")
3- Charger dans une variable df le fichier ʺcereale.csvʺ et afficher son contenue.
df=ps.read_csv(ʺcereale.csvʺ,sep=ʺ;ʺ,encoding=ʺUTF-8ʺ)
#on peut ne pas utiliser encoding dans ce cas car le codage utilisé par défaut en pandas est utf-8
4- Charger dans une variable df2 le fichier ʺCereale2.csv ʺet afficher son contenue.
df=ps.read_csv(ʺcereale.csvʺ,sep=ʺ;ʺ,encoding=ʺANSIʺ)
#ici on doit utiliser l’argument encoding

Activité 2 on va utiliser le dataframe notes.


Description d’une base donnée et manipulation d’un Dataframe.
1- Donner le type de la variable notes :
print(type(notes))
2- Préciser les dimensions du dataframe notes :
print(notes.shape) # shape donne le couple(nb_ligne,nb_colonne)
3- Donner le nombre des colonnes du dataframe notes
print(notes.shape[1])
4- Donner la liste des colonnes du dataframe notes
print(notes.columns)
5- Donner le nombre des élèves du dataframe notes
print(notes.shape[0]) # print(notes['DC1'].count()) # print(len(notes))
6- Donner le nombre des cellules du dataframe notes
print(notes.size)
7- Donner les propriétés du dataframe notes (les types des colonnes, utilisation de la mémoire…)
print(notes.info())
8- Donner une description statistique des données du dataframe notes (min, max, count, std,25,50,75)
print(notes.describe())
9- Lister les premières lignes du dataframe notes
print(notes.head()) # le nombre de ligne par defaut est 5 mais on peut le modifier
10- Lister les dernières lignes du dataframe notes
print(notes.tail())
11- Lister les données de la plage des lignes entre 12 et 16
print(notes[12:17]) # affichage d'un plage de ligne à partir de debut:fin attention fin exclu
12- Donner la longueur du dataframe notes
print(len(notes))
13- Ajouter, à la fin du dataframe notes, une ligne contenant votre nom et prénom et vos notes de (DC1, DS1)
notes.loc[len(notes)]=['Foulen Ben Foulen',14.5,16.5]
print(notes)
14- Ajouter une colonne moyenne contenant pour chaque élève sa moyenne du trimestre 1
notes['moyenne']=(notes.DC1+2*notes.DS1)/3
print(notes)
15- supprimer la dernière ligne du dataframe notes.
notes=notes.drop(len(notes)-1)
print(notes)
# on peut utiliser notes.drop(len(notes)-1,inplace=True)
16- Supprimer la 3ème et 4ème ligne du dataframe notes
notes = notes.drop(range(3,5),0)
print( notes)
# dataframe.index[deb:fin] fin exclu ou bien notes=notes.drop([liste des indices]) ou en utilisant range(deb,fin)
17- Supprimer les lignes contenants des valeurs nulles
notes=notes.dropna()
18- Supprimer la colonne moyenne
notes=notes.drop("moyenne",1)
print(notes)
19- Supprimer toutes les notes de tous les élèves
notes=notes.drop(['DC1','DS1'],1)
print(notes)

Activité 3- Affichage et modification des données. on va utiliser le dataframe notes


20- Afficher tous les noms des élèves.
print(notes['Nom et Prénom'])
# On ne peut pas utiliser notes. Nom et Prénom dans ce cas car on a le nom du champ contient des espaces
21- Afficher toutes les notes du DC1
print(notes.DC1)
22- Afficher la première ligne du dataframe notes
print(notes.iloc[0])
print(notes.loc[0])
print(notes.iloc[:1])
#de préférence on utilise iloc pour l’affichage
23- Afficher les données des 3 derniers élèves de la liste
print(notes.iloc[-3:])
24- Afficher les noms et prénoms et les notes de synthèses pour les 3 premiers élèves de la liste.
print(notes.iloc[:3,[0,2]])
print(notes.loc[:2,['Nom et Prénom','DS1']])

25- Afficher toutes les noms et prénoms de tous les élèves sauf le dernier.
print(notes[:-1]['Nom et Prénom'])
26- Modifier la note du DC1 du premier élève pour qu’elle soit 12
notes.loc[0,'DC1']=12
print(notes)
# pour la modification on utilise toujours loc
27- Renommer la colonne moyenne par moy
notes = notes.rename(columns={"moyenne":"moy"})
print(notes.columns)
# ou on utilise inplace =True
28- Afficher tous les données des élèves qui ont des notes de DC1 >=10
print(notes[notes.DC1>10])
#print(notes.query("DC1>10"))
29- Afficher toutes les données des élèves qui n’ont pas de notes de DS1.
print(notes[notes.DS1.isnull()])
30- Afficher le nombre des élèves ayant une note >= 10 dans les deux devoirs.
print(notes.query("(DS1>10 )&(DC1>10)"))
31- Afficher la moyenne arithmétique des DC1
print(notes.DC1.mean())
32- Afficher la note de DC1 la plus élevée.
print(notes.DC1.max())
33- Afficher la note de DC1 la plus basse.
print(notes.DC1.min())
34- Afficher tous les noms et prénoms des élèves qui ont des notes de DC1 > à la moyennes des notes de DC1
print(notes[notes.DC1>notes.DC1.mean()]['Nom et Prénom'])
35- Afficher la somme des notes DC1
print(notes.DC1.sum())

Activité 4- Tri & graphique on va utiliser le dataframe data.


36- Trier le dataframe data selon les prix par ordre décroissant
data_trie=data.sort_values(by=["prix"],ascending=[False])
print(data_trie)
37- Faire un graphique à barres illustrant les prix de chaque type de céréales
data.plot.bar(x="nomc",y="prix",color="red")
plt.show()
#il faut impoerter d’abord matplotlib.pyplot
#import matplotlib.pyplot as plt
38- Faire le même graphique mais de type courbe (lignes)
data.plot.line(x="nomc",y="prix",color="skyblue")
plt.show()

Vous aimerez peut-être aussi