Académique Documents
Professionnel Documents
Culture Documents
1 - introduction
Pandas est une bibliothèque Python open source sous licence BSD permettant de manipuler des
structures de données hautes performances et faciles à utiliser ainsi que des outils d'analyse de données
pour le langage de programmation Python. Python avec Pandas est utilisé dans un large éventail de
domaines, y compris les domaines académiques et commerciaux, financiers, économique, les
statistiques, l'analyse, etc... Dans ce cours, nous allons apprendre les différent principes
et fonctionnalités de Python Pandas et comment les utiliser en pratique.
2 - Installation de Pandas
Pandas n'est pas fournit avec le package standard de Python, cependant elle s'installe très facilement en
toute souplesse à l'aide de l'utilitaire pip:
Pandas Series est un tableau étiqueté unidimensionnel capable de contenir des données de tout
type (entier, chaîne, flottant, objets python, etc.). Les étiquettes d'axe sont appelées
collectivement index.
2.1 - Création d'une série vide
Un premier exemple de série pandas est la série vide:
Exemple
# -*- coding: utf-8 -*-
# importation de pandas en tant que pan
import pandas as pan
# Création de séries vides
ser = pan.Series()
print(ser)
Exemple
# importation de pandas as pan
import pandas as pan
# importation de numpy as np
import numpy as np
# tableau simple
data = np.array (['P', 'y', 't', 'h', 'o' , 'n'])
s = pan.Series(data)
print(s)
La sortie est:
0 P
1 y
2 t
3 h
4 o
5 n
dtype: object
2.3 - Création d'une série à partir d'un tableau avec index
Afin de créer une série à partir d'un tableau avec index, nous devons fournir à index le même nombre d'éléments
que dans le tableau.
Exemple
# importation de pandas as pan
import pandas as pan
# importation de numpy as np
import numpy as np
# tableau simple
data = np.array (['p', 'y', 't', 'h', 'o' , 'n'])
# fournir un index
s = pan.Series (data, index = [4, 7, 8, 9, 13 , 17])
print(s)
La sortie est :
4 p
7 y
8 t
9 h
13 o
17 n
dtype: object
Exemple
#import the pandas library as pan
import pandas as pan
import numpy as np
s = pan.Series(7, index=[1, 2, 3, 4, 5])
print(s)
# coding: utf-8
import pandas as pan
# exemple de dictionnaire
dict = {'Laptop' : 17,
'Ipad' : 15,
'Tablette' : 25}
Ce qui affiche:
Laptop 17
Ipad 15
Tablette 25
dtype: int64
Exemple
# coding: utf-8
import pandas as pan
s = pan.Series([0, 1, 2, 3],index = ['a','b','c','d'])
Ou encore :
b1
dtype: int64
Exemple: extraire les données depuis un index début jusqu'à un index fin
# coding: utf-8
import pandas as pan
s = pan.Series([0, 1, 2, 3, 4, 5],index = ['a','b','c','d','e','f'])
La sortie est:
c 2
d 3
dtype: int64
Ce qui affiche:
3
d 3
dtype: int64
Ou encore
Exemple
# coding: utf-8
import pandas as pan
s = pan.Series([0, 1, 2, 3, 4, 5],index = ['a','b','c','d','e','f'])
a 0
e 4
d 3
dtype: int64
5 - Python DataFrame Pandas
df = pandas.DataFrame(dictData)
Code final
import pandas as pan
ar = numpy.array([[1, 'Natalie', 22, 170], [2, 'Robert', 37, 190], [3, 'Bernard' , 29 , 181]])
Code final
import pandas as pan
import numpy as np
ar = np.array([[1, 'Natalie', 22, 170], [2, 'Robert', 37, 190], [3, 'Bernard' , 29 , 181]])
df = pan.DataFrame(ar, columns = ['ID', 'Nom', 'Age', 'Taille'])
print(df)
La sortie est: