Académique Documents
Professionnel Documents
Culture Documents
3EG1,2,3
L’analyse de données avec pandas
Avec l’éditeur « Thonny »
I- Installation de la bibliothèque pandas :
Ecrire la commande : python -m pip install pandas
Ou
Dans le menu « Outils » choisir la commande « Gérer les paquets », écrire la bibliothèque à rechercher
et cliquer sur « Trouver les paquets sur PyPl » puis cliquer sur installer.
II- Importation de la bibliothèque pandas :
import pandas as alias
ou bien
import pandas
Importation des fichiers csv :
import pandas as ps
df=ps.read_csv(¢¢chemin¢¢,sep=¢¢;¢¢, encoding="ANSI")
Importation des fichiers Excel :
L’importation des fichiers Excel se fait avec la fonction read_excel () du module pandas. Mais avant
d’utiliser cette fonction, il faut installer la bibliothèque xlrd (qui permet la lecture d’un fichier Excel en
utilisant la commande : python -m pip install xlrd ou l’installer dans le menu Outils –gérer les paquets).
import pandas as ps
df=ps.read_excel("chemin", sep= ";")
Exemple concernant notre fichier Excel :
import pandas as ps
df=ps.read_excel ("salaires.xlsx","Feuil1",sep= ";")
Commandes Description
Read_excel Lecture du fichier Excel
Chemin\Nom_Fichier.xls Chemin : Le chemin physique du fichier sur le lecteur
ou bien Nom_Fichier : Le nom du fichier
Chemin\Nom_Fichier.xlsx L’extension : xls ou xlsx
sep = ′′séparateur′′ Elle permet d’indiquer le séparateur qui sépare les données.
Les séparateurs les plus utilisés sont :
′′\t′′ : Les données seront séparées par une tabulation
(séparateur par défaut en cas d’omission).
′′,′′ : Les données seront séparées par une virgule.
′′;′′ : Les données seront séparées par un point-virgule.
import pandas as ps
import numpy
df=ps.read_excel("salaires.xlsx","Feuil1")
df["Age"]=df.Ancienneté+40
df["Décision"]=numpy.where(df["Salaire"]>=600,"Parfait", "Faible")
print(df)
NB:
#%.xf c'est à dire afficher un nombre sur x chiffres après le point décimal.
print ("La valeur maximale des dépenses %.2f " %df.dépense.max ())
print ("La valeur minimale des dépenses %.2f " %df.dépense.min ())
print (df[df['Sexe']=='M'])
ou
print ("La liste des employé qui ont le sexe « M » : ", df[df['Sexe']=='M'])
Question6: Afficher le nombre des employés qui ont le sexe « M » :
df_se=df[df['Sexe']=='M']
print ("Le nombre des employés qui ont le sexe « M » :", len(df_se))
Question7: Afficher la liste des employés qui ont un salaire supérieur à 600 :
print(df[df.Salaire>600])
Si on veut que la colonne soit trié croissant on met : ascending = [True], sinon :ascending = [False]
print(df)
plt.hist(df["Salaire"],bins=18, color='red',label="Salaire")
plt.show()
Question11:Un graphique illustrant le pourcentage des salaires avec les prénoms des employés :
list0=df["Salaire"]
plt.show()