Vous êtes sur la page 1sur 4

[LOUATI SANA] Analyse de données

Analyser des données avec Pandas(Python)


TP n°1
Objectifs :
Charger un DataFrame à partir d’un fichier tabulé (.xlsx, .csv ..)
Manipulation d’un DataFrame
Manipulation des données d’un DataFrame

Soit le DataFrame suivant :

1) Lancer l'éditeur Thonny.


2) Enregistrer votre travail dans un fichier ayant pour nom « tp1 pandas » et pour
emplacement votre dossier personnel « C:\pandas\groupe*».
3) Taper la ligne suivante pour charger la bibliothèque pandas:
import pandas as ps
4) Taper la ligne suivante et déduire son rôle.
df = ps.read_excel ('C: /pandas /groupe*/classe.xlsx')
……………………………………………………………………………………….
……………………………………………………………………………………….
Forme Générale
Id_Dataframe = ps.read_excel('chemin d’accès / nom_classeur.xlsx')

Remarque :
 Pour charger un DataFrame à partir d’un fichier csv, on applique :
Id_Dataframe= ps.read_csv(nom_fichier.csv,separateur) avec séparateur peut être (‘,’,’ ;’,’˽‘,’\t’,…)
…………………………………………………………………………………………..
 Pour charger un DataFrame à partir d’un fichier txt, on applique :
Id_Dataframe= ps.read_table(nom_fichier.txt,separateur)
…………………………………………………………………………………………..
5) Ajouter la ligne suivante à la fin du programme et observer les résultats.
print (df)
6) Déduire le rôle de cette commande.
Commande Rôle

print (Id_Dataframe)

7) Modifier l’instruction précédente comme suit :


print(df.shape)

Page 1
[LOUATI SANA] Analyse de données

8) Observer les résultats et déduire le rôle de la commande df.shape


Id_DataFrame.shape : …………………………………………………………………..
…………………………………………………………………………………………..
9) Remplacer la commande df.shape par la commande df.size et observer les résultats.
10) En déduire le rôle de la commande df.size
Id_DataFrame.size :………………………………………………………………….
…………………………………………………………………………………………
11) Remplacer la commande df.size par la commande df.columns et observer les résultats.
12) En déduire le rôle de la commande df.columns
Id_DataFrame.columns :……………………………………………………………..
………………………………………………………………………………………….
13) Remplacer la commande df.columns par la commande df.info() et observer les résultats.
14) En déduire le rôle de la commande df.info()
Id_DataFrame.info() :……………………………………….……………………….
………………………………………………………………………………………….
………………………………………………………………………………………….
………………………………………………………………………………………….
15) Remplacer la commande df.info() par la commande df.describe() et observer les résultats
16) En déduire le rôle de la commande df.describe()
Id_DataFrame.describe() :………………………………………………………….
………………………………………………………………………………………….
17) Remplacer la commande df.info() par la commande df.head(3) et observer les résultats
18) En déduire le rôle de la commande df.head(n)
Id_DataFrame.head(n) :……………………………………………………………….
………………………………………………………………………………………….
19) Remplacer la commande df.head(3) par la commande df.tail(3) et observer les résultats.
20) En déduire le rôle de la commande df.tail(n)
Id_DataFrame.tail(n) :……………………………………………………………….
………………………………………………………………………………………….
21) Remplacer la commande df.tail(3) par df['Nom'] et observer les résultats.
22) Remplacer la commande df['Nom'] par df.Nom et observer les résultats.
23) En déduire le rôle de la commande suivante :
Commande Rôle
print (Id_DataFrame ['NomColonne'])
ou bien
print(Id_DataFrame.NomColonne)
24) Remplacer la commande print (df.Nom) par print(df.Nom[1:5]) , que remarquez-vous ?
Id_DataFrame.NomColonne[Position_Initiale : Position_Finale]
……………………………………………………………………………………..…
………………………………………………………………………..………………

Page 2
[LOUATI SANA] Analyse de données

25) Remplacer la commande print(df.Nom[1 :5]) par print(df[['Nom','Prenom']]), que


remarquez-vous ?
Id_DataFrame [['NomColonne1', 'NomColonne2',…, 'NomColonneN']]
……………………………………………………………………………………..…
……………………………………………………………………………………..…
26) Remplacer la commande print(df[['Nom','Prenom']]),par print(df.iloc[0]), que
remarquez-vous ?
Id_DataFrame.iloc[indice_ligne]
……………………………………………………………………………………..…
27) Remplacer la commande print(df.iloc[0]) par print(df.iloc[0,0]), que remarquez-vous ?
Id_DataFrame.iloc[indice_ligne, indice_colonne]
……………………………………………………………………………………..…
28) Modifier le code précédent comme suit et observer les résultats.
df.loc[0,'Nom'] = "Hedi"
print(df)
Id_DataFrame.loc[indice_ligne, ‘NomColonne’] = Valeur
………………………………………………………………………..………………
29) Modifier le code précédent comme suit et observer les résultats.
df.loc[0]=['Hiba','Amdouni',18,13,'femme']
print(df)
Id_DataFrame.loc[indice_ligne] = [Liste_valeur]
………………………………………………………………………..………………
30) Modifier le code précédent comme suit et observer les résultats.
df = df.drop ([1])
print(df)
Id_DataFrame = Id_DataFrame.drop([indice_ligne1,…, indice_ligneN])
………………………………………………………………………..………………
………………………………………………………………………..………………
31) Modifier le code précédent comme suit et observer les résultats.
df = df.drop(['Age'],axis = 1)
print(df)
Id_DataFrame = Id_DataFrame.drop(['NomColonne1',…, 'NomColonneN'], axis =1)
……………………………………………………………………………………..…
……………………………………………………………………………………..…
32) Modifier le code précédent comme suit et observer les résultats.
df ['Statut'] = ['majeur','mineur','majeur','mineur','majeur','majeur']
print(df)
Id_DataFrame['NouvelleColonne'] = [liste_valeur]
……………………………………………………………………………………..…
……………………………………………………………………………………..…

Page 3
[LOUATI SANA] Analyse de données

33) Modifier le code précédent comme suit et observer les résultats.


df.rename(columns = {'Moyenne':'Note'}, inplace = True)
print(df)
Id_DataFrame.rename(columns ={'Colonne1': 'NouveauNomColonne1',…,
' colonneN': 'NouveauNomColonneN'}, inplace=True})
………………………………………………………………………..………………
……………………………………………………………………………………..…
………………………………………………………………………..………………

Analyser des données avec Python – Module Pandas


TP n°2
Soit le DataFrame suivant:

1. Importer la bibliothèque pandas.


2. Charger un Dataframe python à partir du fichier Excel ecran.xlsx.
Le fichier se trouve dans C:\pandas\groupe*
3. Afficher le Dataframe.
4. Afficher les informations sur les données du DataFrame.
5. Afficher le nombre de lignes et de colonnes du DataFrame.
6. Afficher les noms des colonnes du Dataframe.
7. Afficher les 4 premières lignes du DataFrame.
8. Afficher les 3 dernières lignes du DataFrame.
9. Afficher tous les noms d’écrans.
10. Afficher tous les noms d’écrans et leurs prix.
11. Afficher les deux premiers écrans et leurs prix.
12. Afficher la deuxième ligne du Dataframe.
13. Afficher la dernière ligne du DataFrame.
14. Supprimer la 2ème ligne et la 3ème ligne du Dataframe.
15. Modifier le nom de la colonne ecran par Produit.

Page 4

Vous aimerez peut-être aussi