Académique Documents
Professionnel Documents
Culture Documents
PLAN
I°) La visualisation de données
I.1°) L’ intérêt de la visualisation des données
II°) La librairie Matplotlib
III°)La librairie Seaborn
Introduction:
Python est un langage scientifique très mature. On y trouve des librairies
pour tout un tas d’utilisation différentes: notamment le Machine Learning
et l’analyse de data. La visualisation de données est une partie importante
pour explorer nos données et pour communiquer les résultats.
Au cours des dernières années, de nombreuses nouvelles librairies de
visualisation de données ont vu le jour sur Python pour combler son
retard avec le langage R. Matplotlib est devenu la principale librairie de
visualisation de données. Mais il existe également des librairies telles
que seaborn, vispy, bokeh,pygal, folium et networkx qui s’appuient sur
matplotlib (certaines fonctionnalités de ces librairies ne sont pas toutes
supportées par matplotlib).
I°)La visualisation de données
La visualisation des données est une partie essentielle de la data science. Lors des premières
étapes d’un projet, vous effectuerez souvent une analyse exploratoire des données afin d’avoir
une compréhension plus profonde de vos données. Parfois, nous ne voyons aucun sens dans notre
data set tant que nous ne les avons pas sous une forme visuelle, telle que des histogrammes , des
courbes ,des diagrammes en bâton ou les diagrammes circulaire .
plt.scatter
Importation de
librairie Seaborn
III.2°) Création graphique avec les fonction:
sns.distplot:
permet non seulement de visualiser l'histogramme d'un échantillon,
mais aussi d'estimer la distribution dont l'échantillon est issu:
sns.load_dataset:
Cette fonction fournit un accès rapide à un petit nombre d'exemples de
jeux de données utiles pour documenter Seaborn ou générer des
exemples reproductibles pour les rapports de bogues. sns.pairplot:
sns.pairplot
Pour voir les relations entre ces caractéristiques, on peut faire des
graphiques par paire
sns.axes_style:
pour définir le style des axes
sns.jointplot:
Pour voir la distribution jointe de deux caractéristiques :
Conclusion:
En définitive Matplotlib est principalement déployé pour le traçage de base.
La visualisation à l'aide de Matplotlib se compose généralement de barres, de
secteurs, de lignes, de nuages de points, etc.
Seaborn, d'autre part, fournit une variété de modèles de visualisation. Il utilise
moins de syntaxe et possède des thèmes par défaut facilement intéressants. Il se
spécialise dans la visualisation de statistiques et est utilisé si l'on doit résumer des
données dans des visualisations et également montrer la distribution dans les
données.