Académique Documents
Professionnel Documents
Culture Documents
Visualisations pandas
Explorer et visualiser les données d'une dataframe
python
Explorer les données est une étape préliminair essentielle à toute analyse de données. Les
fonctionnalités plotting du module pandas permettent rapidement d'obtenir un maximum de
graphiques pour s'approprier un jeu de données.
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 1/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 2/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
Visualiser l'ensemble des scatter-plot possibles d'un jeu de données avec la fonction
scatter_matrix :
Voir comment sélectionner les colonnes à croiser dans les scatter_matrix() dans la
rubrique régressions linéaires
On part du principe que pandas est importé ainsi qu'une dataframe ouverte :
mydata
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 4/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
mydata.plot(kind="area") ; plt.show()
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 5/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
mydata.plot(kind='hist',alpha=0.5,bins=20) ; plt.show()
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 6/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
Un histogramme séparément
mydata.hist(bins=20,color="red") ; plt.show()
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 7/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
Faire un tel affichage est simple mais pause un problème d'échelle car chaque variable aura la
même échelle y que l'autre.
Remarque : on peut mettre plusieurs variables et proposer plusieurs catégories mais cela
sera vite limitée à cause des problèmes d'échelle.
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 8/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 9/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
mydata.plot(kind="bar")
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 10/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
Dans cet exemple, on donne une variable (numérique) de catégories pour définir la coloration.
Attention : cette variable ne peut être discrète, sinon, il faudra songer à en créer une
avec apply() (suivre le lien).
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 11/12
21/02/2023 20:05 Aide à l'utilisation de python - Analyses de données et Dataviz - Explorer et visualiser les données d'une dataframe
mydata.iloc[3:,1:7].plot.kde(subplots=True,figsize=(12,9)) ; plt.show()
Cela permet de comparer plusieurs variable : le problème est que si c'est variable n'ont pas la même
échelle/amplitude, on ne peut pas voir bien la courbe.
Aide à l'utilisation du langage python - site réalisé par Antoine Massé - ingénieur en biotechnologies -
enseignant PrAg à l'IUT de Bordeaux - Université de Bordeaux - Site de Périgueux - département
Génie Biologique
https://sites.google.com/view/aide-python/graphiques/explorer-et-visualiser-les-données-dune-dataframe?authuser=0#h.p_nFiTgxd-QzdT 12/12