Vous êtes sur la page 1sur 12

Présentation :

PLAN
I°) La visualisation de données
I.1°) L’ intérêt de la visualisation des données
II°) La librairie Matplotlib
III°)La librairie Seaborn
Introduction:
Python est un langage scientifique très mature. On y trouve des librairies
pour tout un tas d’utilisation différentes: notamment le Machine Learning
et l’analyse de data. La visualisation de données est une partie importante
pour explorer nos données et pour communiquer les résultats.
Au cours des dernières années, de nombreuses nouvelles librairies de
visualisation de données ont vu le jour sur Python pour combler son
retard avec le langage R. Matplotlib est devenu la principale librairie de
visualisation de données. Mais il existe également des librairies telles
que  seaborn, vispy, bokeh,pygal, folium et networkx qui s’appuient sur
matplotlib (certaines fonctionnalités de ces librairies ne sont pas toutes
supportées par matplotlib).
I°)La visualisation de données
La visualisation des données est une partie essentielle de la data science. Lors des premières
étapes d’un projet, vous effectuerez souvent une analyse exploratoire des données afin d’avoir
une compréhension plus profonde de vos données. Parfois, nous ne voyons aucun sens dans notre
data set tant que nous ne les avons pas sous une forme visuelle, telle que des histogrammes , des
courbes ,des diagrammes en bâton ou les diagrammes circulaire .

I.1°)Intérêt de la visualisation de données


 Présenter des rapports de qualité
 Comprendre l’ évolution de phénomènes complexes
 Prouver des arguments /corrélations
 Détecter des valeurs aberrantes/des saisonnalités
 Réagir efficacement en cas de dysfonctionnement
II°) la librairie Matplotlib
Matplotlib est l’une des bibliothèques python les plus utilisées
pour représenter des graphiques en 2D. Elle permet de produire
une grande variété de graphiques et ils sont de grande qualité.
Le module pyplot de matplotlib est l’un de ses principaux
modules. Il regroupe un grand nombre de fonctions qui servent à
créer des graphiques et les personnaliser (travailler sur les axes,
le type de graphique, sa forme et même rajouter du texte).
II.1°) Importation de Matplotlib
 import matplotlib.pyplot as plt

II.2°) Création graphique avec la fonction:


 plt.plot

II.3°) Création graphique avec la fonction:

 plt.scatter

II.4°) Création graphique avec la fonction:


 plt.bar

II.5°) Création graphique avec la fonction:


 plt.pie
III°) la librairie Seaborn
Seaborn est une librairie qui vient s'ajouter à Matplotlib,
remplace certains réglages par défaut et fonctions, et lui ajoute
de nouvelles fonctionnalités. Seaborn vient corriger trois
défauts de Matplotlib:
• Matplotlib, surtout dans les versions avant la 2.0, ne génère
pas des graphiques d'une grande qualité esthétique.

• Matplotlib ne possède pas de fonctions permettant de créer


facilement des analyses statistiques sophistiquées.
• Les fonctions de Matplotlib ne sont pas faites pour interagir
avec les Dataframes de Panda.
Seaborn fournit une interface qui permet de palier ces
problèmes. Il utilise toujours Matplotlib "sous le capot", mais
le fait en exposant des fonctions plus intuitives. Pour
commencer à l'utiliser, rien de plus simple.
III.1°) Importation de Seaborn

Importation de
librairie Seaborn
III.2°) Création graphique avec les fonction:

sns.distplot:
permet non seulement de visualiser l'histogramme d'un échantillon,
mais aussi d'estimer la distribution dont l'échantillon est issu:

sns.load_dataset:
Cette fonction fournit un accès rapide à un petit nombre d'exemples de
jeux de données utiles pour documenter Seaborn ou générer des
exemples reproductibles pour les rapports de bogues. sns.pairplot:
sns.pairplot
Pour voir les relations entre ces caractéristiques, on peut faire des
graphiques par paire

sns.axes_style:
pour définir le style des axes
sns.jointplot:
Pour voir la distribution jointe de deux caractéristiques :
Conclusion:
En définitive Matplotlib est principalement déployé pour le traçage de base.
 La visualisation à l'aide de Matplotlib se compose généralement de barres, de
secteurs, de lignes, de nuages ​de points, etc.
Seaborn, d'autre part, fournit une variété de modèles de visualisation. Il utilise
moins de syntaxe et possède des thèmes par défaut facilement intéressants. Il se
spécialise dans la visualisation de statistiques et est utilisé si l'on doit résumer des
données dans des visualisations et également montrer la distribution dans les
données.

Vous aimerez peut-être aussi