Académique Documents
Professionnel Documents
Culture Documents
P a g e 1 | 10
Mise en situation
600
600
500
500
400
Chambre à Coucher
Zouhour
Opéra
Clara
Dina
Mélina
Dorsaf
P a g e 2 | 10
% ventes
Living
17% chambre à coucher
23%
bureaux
8%
chambre d'enfants
Cuisine 14%
12%
Salon
26%
Définition
L’analyse de données (Data Analysis),, est de plus en plus utilisée dans les entreprises
de tous les secteurs:
Grâce aux technologies du numérique, les entreprises ont désormais accès à des vastes
volumes de données. Comprendre et analyser ces informations est un précieux atout.
Pourquoi ?
Extraire des informations exploitables pour prendre de meilleures décisions au sein
d’une entreprise.
Il s’agit en réalité de se baser sur le passé et le présent afin de prendre les bonnes
décisions pour le futur.
Ceci peut se révéler très utile pour la croissance d’une entreprise, pour développer de
nouveaux produits ou pour trouver des solutions aux problèmes.
La bibliothèque Pandas
La bibliothèque Pandas est spécifiquement conçue pour la manipulation et l’analyse de
données en langage Python. Elle est à la fois performante, flexible et simple
d’utilisation.
P a g e 3 | 10
Le nom « Pandas » est en fait la contraction du terme « Panel Data » désignant les
ensembles de données incluant des observations sur de multiples périodes temporelles.
Cette bibliothèque a été créée comme un outil pour l’analyse en Python.
Le fonctionnement de Pandas repose sur les « DataFrames » : des tableaux de données
en deux dimensions.
P a g e 4 | 10
Soit le tableau suivant représentant des smartphones d’une société MyPhone:
import pandas as ps
df = ps.read_csv (”tel.csv”,sep=”;”)
print (df )
Commande Rôle
P a g e 5 | 10
IdDataFrame.shape ou bien print ( IdDataFrame.shape )
IdDataFrame.size ou bien print ( IdDataFrame.size )
IdDataFrame.info ( ) ou bien print ( IdDataFrame.info ( ) )
IdDataFrame.describe ( ) ou bien print ( IdDataFrame.describe ( ) )
Manipulation d’un IdDataFrame.columns ou bien print ( IdDataFrame.columns )
DataFrame
IdDataFrame.rename ( columns = { "NomColonne1" : "NouveauNomColonne1", "NomColonne2" : "NouveauNomColonne2", … } , inplace= True )
Resultat = IdDataFrame.drop ( columns = [ "NomColonne1",…,"NomColonneN" ] )
Resultat = IdDataFrame.drop ( [ Indice_Ligne ] )
Resultat = IdDataFrame.drop ( IdDataFrame.index [ N° LigneInitial : N° LigneFinal ] )
P a g e 6 | 10
IdDataFrame ou bien print ( IdDataFrame )
IdDataFrame [ "NomColonne" ] ou bien print ( IdDataFrame [ "NomColonne" ] )
IdDataFrame [ [ "NomColonne1" , "NomColonne2" , …] ] ou bien print ( IdDataFrame [ [ "NomColonne1" , "NomColonne2" , …] ] )
Affichage des IdDataFrame [ "NomColonne" ] [ N° LigneInitial : N° LigneFinal ] ou bien print (IdDataFrame [ "NomColonne" ] [ N° LigneInitial : N° LigneFinal ])
données IdDataFrame.head ( n ) ou bien print ( IdDataFrame.head ( n ) )
d’un DataFrame IdDataFrame.tail ( n ) ou bien print ( IdDataFrame.tail ( n ) )
IdDataFrame.iloc [ N° Ligne ] ou bien print ( IdDataFrame.iloc [ N° Ligne ] )
IdDataFrame.iloc [ N° LigneInitial : N° LigneFinal ] ou bien print ( IdDataFrame.iloc [ N° LigneInitial : N° LigneFinal ] )
IdDataFrame.iloc [ N° Ligne , N° Colonne ] ou bien print ( IdDataFrame.iloc [ N° Ligne , N° Colonne ] )
P a g e 7 | 10
IdDataFrame.loc [ N° ligne , "NomColonne" ] = Valeur (ou Formule)
Modification et ajout des données dans un Id_DataFrame.loc [ N° ligne ] = [ Liste_Valeur ]
DataFrame Id_DataFrame [ "NomColonne" ] = Valeur (ou Formule)
Resultat = Id_DataFrame.drop_duplicates ( )
Nettoyage d’un DataFrame Resultat = Id_DataFrame.dropna ( )
Resultat = Id_DtaFrame.dropna ( axis = 1 )
P a g e 8 | 10
IdDataFrame [ IdDataFrame [ "NomColonne" ] OperateurComparaison Valeur ]
Affichage des données d’un DataFrame
selon une ou plusieurs conditions IdDataFrame [( IdDataFrame ["NomColonne"] OperateurComp Valeur) OperateurLogique (
IdDataFrame ["NomColonne"] OperateurComp Valeur )]
Tri des éléments d’un DataFrame_Trié = IdDataFrame.sort_values ( by = [ "NomColonne1" ,"NomColonne2" , …] , ascending = [ True/False ,
DataFrame True/False , … ] )
P a g e 9 | 10
import matplotlib.pyplot as alias_matplotlib
Création d’un IdDataFrame.plot.bar (x = "NomColonneAbscisse" , y = "NomColonneOrdonnée" , title = "TitreGraphique" , color = "CouleurGraphique" )
graphique IdDataFrame.plot.line (x = "NomColonneAbscisse" , y = "NomColonneOrdonnée" , title = "TitreGraphique" , color = "CouleurGraphique" )
alias_matplotlib.show ( )
P a g e 10 | 10