Vous êtes sur la page 1sur 3

Tp2 

:
1- Lancer IDLE Python, créer un nouveau fichier TP2.py puis coller le code ci-
dessous :

# Importation des modules :


import pandas as pd
import numpy as np
# Creation de l’objet dataframe :
raw_data = {'Nom': ['Cherif', 'Mansour', 'Tijeni', 'Jridi', 'Amri'],
'Prenom': ['Seif', 'Jasem', ".", 'Marwa', 'Isam'],
'Sexe':['G','G','.','F','G'],
'age': [12, 12, 16, 14, 13],
'Controle': [4, 14, 11, ".", "."],
'Synthese': ["15,25", "14,75", 17, 12, 10],
'Observation':['Bien','Bien','Bien','Passable','Passable']}
df = pd.DataFrame(raw_data, columns = ['Nom', 'Prenom', 'Sexe', 'age', 'Controle',
'Synthese', 'Observation'])
# Creation du fichier CSV :
df.to_csv('note.csv')
# Lecture du fichier CSV
df = pd.read_csv('note.csv', sep=",")
# Affichage du contenu du fichier note.csv
print(df)

2 - Maintenant, vous allez ouvrir le fichier note.csv qui se trouve dans le même emplacement
du fichier TP2.py et puis :

 Copier son contenu puis le coller dans un nouveau classeur Excel


 Convertir cette colonne en tableau à l’aide de la commande convertir du menu
données
 Supprimer la première colonne
 Enregistrer le classeur Excel avec le nom note et le format CSV avec séparateurs ;
dans le même emplacement du fichier note.csv pour écraser ce dernier
3 - Remplacer le contenu du fichier TP2.py par ce dernier :

# Importation des modules :

1
import pandas as pd
import numpy as np
# Lecture du fichier CSV
df = pd.read_csv('note.csv', sep=" ;")
# Affichage du contenu du fichier note.csv
print(df)

4- Affichage de quelques informations diverses :

# informations diverses
print("Le nombre de lignes et colonnes : ")
print(df.shape)
print("Le nombre de valeurs par colonne : ")
print(df.count())
print("Les informations generale du tableau : ")
print(df.info())
print("Afficher les entetes des colonnes par deux facons differentes : ")
print(list(df.columns))
print(list(df))

5 - Affichage des statistiques :

# resume basique
print("Affichage des statistiques descriptives univaries")
print(df.describe())
print("Affichage des statistiques descriptives avec deux chiffres decimales")
print(df.describe().round(2))

6 - Traitement des données quantitatives :


Remarque : Il est possible de sélectionner les variables soit via les crochets [], soit par un point .. Les
fonctions ci-dessous permettent de décrire une variable quantitative (ici "Sexe").

# Quantitative :
print("Informations quantitative sur la colonne Age : ")
print(df.age.describe())
print(df["age"].describe())
print("La moyenne des Ages")
print(df.age.mean())

2
print("echantillonnage sur les tranches d'ages : ")
print(df.age.quantile([.01, .3, .9, .99]))

7 - Traitement des données qualitatives :


Pour les variables qualitatives, il y a plusieurs façons de faire pour obtenir la table d'occurrences
(ou des effectifs), ainsi que la table des proportions des modalités.

# Qualitatives :
print("Informations qualitative sur la colonne Sexe : ")
print(df.Sexe.describe())
print("Liste des valeurs d'une colonne : ")
print(df.Sexe.unique())
print("Compter le nombre de chaque valeur : ")
print(df.Sexe.value_counts())
print("Afficher les valeurs sous forme de tableau : ")
print(pd.crosstab(df.Sexe, "freq"))
print("Afficher les valeurs en porcentage sous forme de tableau : ")
print(pd.crosstab(df.Sexe, "freq", normalize=True))

8 - Traitement de données qualitatives - qualitative


# Traitement de donnees qualitatives - qualitatives :
print("Affichage des observations par sexes :")
print(pd.crosstab(df.Sexe, df.Observation))
print("Affichage des observations par sexes avec les totaux :")
print(pd.crosstab(df.Sexe, df.Observation, margins=True))
print("Affichage des observations par sexes en pourcentages :")
print(pd.crosstab(df.Sexe, df.Observation, normalize = True))