Académique Documents
Professionnel Documents
Culture Documents
Titre
Numpy est une bibliothèque phyton très importante pour les travaux en machine
learning, deeplearnig,..
Avec Numpy, on dispose d'un objet très important qu'on appelle NDArray qui nous
permettra de créer et de manipuler des tableaux à une dimension, 02 dimensions, .., n
dimensions
https://www.evernote.com/u/0/client/web#?b=49ed2d9a-f67e-41dc-a469-0be65d1a0d63&n=b3a813c8-0d78-7009-705f-a31f9… 3/9
13/12/2020 Premier carnet de notes - Evernote
Exercice d'application
INDEXING ET LE SLICING
https://www.evernote.com/u/0/client/web#?b=49ed2d9a-f67e-41dc-a469-0be65d1a0d63&n=b3a813c8-0d78-7009-705f-a31f9… 4/9
13/12/2020 Premier carnet de notes - Evernote
i- INDEXING
Nous permet de cibler un élément précis dans le tableau
II. LE SLICING
permet de cibler une sous partie du tableau afin d'effectuer certaines opérations
https://www.evernote.com/u/0/client/web#?b=49ed2d9a-f67e-41dc-a469-0be65d1a0d63&n=b3a813c8-0d78-7009-705f-a31f9… 5/9
13/12/2020 Premier carnet de notes - Evernote
BOOLEAN INDEXING
Calcul de la matrice de correlation entre les differents lignes avec numpy: tres impo
la suite
QUESTIONS: comment appliquer ces differents calculs lorsque l'on a plus des nombres?
Toutes ces méthodes sont applicables uniquement lorsque l'on n'a des nombres. or dans la vra
nous rencontrerons souvent des jeux de données avec des valeurs manquantes; NaN.
https://www.evernote.com/u/0/client/web#?b=49ed2d9a-f67e-41dc-a469-0be65d1a0d63&n=b3a813c8-0d78-7009-705f-a31f9… 7/9
13/12/2020 Premier carnet de notes - Evernote
dans la transformation de donnée en data science, pour le traitement des valeurs manquantes,
soit décider ignorer ces valeurs manquantes dans les calculs ou bien la remplacer par (la moye
générale, le min/max, grace à une fonction de corrélation entre les différents variables,...)
ignorer le NaN dans les calculs : cas ou on calcul l’écart type sans tenir compte du NAN
np.nanstd(A)
np.isnan(A): retourne un masque des valeurs de A qui sont ou il ya des valeurs manquan
replacer les NAN: on peut remplacer les valeurs manquantes (par la moyenne generale p
exemple) graces au boolean indexing .
Pour aller plus loin dans l’algèbre linéaire, il existe d'autres fonctions tres importantes en data
science. pour cela il faut utiliser une bibliothèque très utilise de numpy; np.linalg
A.dot(B) : pour calculer le produit matricielle entre A et B
np.linalg.eig(A) : pour calculer les valeurs propres et les veteurs propres de A: cette
méthode est très utilise en data science lorsqu'on est face aux problèmes de réduction de
dimension
https://www.evernote.com/u/0/client/web#?b=49ed2d9a-f67e-41dc-a469-0be65d1a0d63&n=b3a813c8-0d78-7009-705f-a31f9… 8/9
13/12/2020 Premier carnet de notes - Evernote
https://www.evernote.com/u/0/client/web#?b=49ed2d9a-f67e-41dc-a469-0be65d1a0d63&n=b3a813c8-0d78-7009-705f-a31f9… 9/9