Vous êtes sur la page 1sur 71

Anaconda &

Jupyter Notebook
https://www.anaconda.com/download/
Anaconda

❑ Anaconda est une distribution open source de Python pour


 traitement de données à grande échelle
 analyses prédictives
 calcul scientifique

Anaconda est une distribution Python qui est principalement utilisée pour la science des données et l'analyse de
données. Elle est populaire car elle simplifie grandement la gestion des packages Python et des environnements
virtuels.
Anaconda inclut une vaste collection de packages Python pré-installés qui sont couramment utilisés dans les
domaines de la science des données, de l'apprentissage automatique, de la visualisation de données, etc.
Il est également livré avec un gestionnaire d'environnements virtuels appelé "conda" qui permet aux utilisateurs
de créer des environnements Python isolés pour travailler sur différents projets sans conflits de dépendances.
ANACONDA
❑ Anaconda inclu…

 Dernière version de Python


 Bibliothèques et packages utiles pour
le calcul scientifique (NumPy, Pandas,
Scikit-learn, …)
 Environnement de développement
Python (Jupyter Notebook, qtconsole,
Spyder, …)
 Outil de gestion de packages (conda,
pip, …)

❑ Vous n'avez donc pas à les installer un par un !


ANACONDA NAVIGATOR
✓ Anaconda Navigator est une interface graphique conviviale qui accompagne la distribution Anaconda et facilite la gestion
de vos environnements virtuels, de vos packages Python, ainsi que l'accès à divers outils pour la data Science and data
analysis.

✓ Une fois ouvert, Anaconda Navigator affiche une


interface graphique conviviale avec plusieurs
onglets et options. Vous verrez notamment des
sections pour les environnements, les
applications et les packages.
✓ Pour créer un nouvel environnement virtuel,
cliquez sur l'onglet "Environments" et appuyez
sur le bouton "Create" (Créer). Vous pouvez
spécifier le nom de l'environnement et les
packages à installer.
✓ Pour lancer un environnement virtuel existant,
cliquez sur l'onglet "Home" (Accueil) et
sélectionnez l'environnement que vous
souhaitez activer.
ANACONDA NAVIGATOR

✓ Pour installer de nouveaux packages Python,


allez dans l'onglet "Environments", sélectionnez
l'environnement cible, puis utilisez la liste
déroulante pour sélectionner "Not Installed"
(Non installé) et recherchez le package que vous
souhaitez installer.
✓ Vous pouvez également accéder à diverses
applications de la suite Anaconda, telles que
Jupyter Notebook, JupyterLab, Spyder, etc.,
depuis Anaconda Navigator et les lancer à partir
de l'onglet "Home" ou "Applications"
(Applications).

✓ Anaconda Navigator simplifie la gestion de vos


environnements virtuels, l'installation de
packages Python et l'accès à divers outils liés à la
science des données. C'est un excellent outil
pour ceux qui préfèrent une interface graphique
pour gérer leur environnement de
développement Python.
Installation

❑ Téléchargez la dernière version d'Anaconda et installez-la

 https://www.anaconda.com/download/

❑ ASTUCE : Il est utile de se rappeler où Anaconda est installé (c'est-


à-dire le répertoire)
 Dans certains cas, il faut accéder au répertoire (par exemple, pour les
paramètres de chemin)

Src: https://www.anaconda.com/download/
Installation

❑ Si l'installation est terminée, exécutez Python pour vérifier l'intégrité

 Dans cmd ou terminal, tapez "python" et appuyez sur Entrée Si cela ne


fonctionne pas correctement, vérifiez la variable d'environnement path
Comment créer les environnements virtuels

Les environnements virtuels sont des espaces de travail isolés où vous pouvez installer des bibliothèques, des packages et
des dépendances spécifiques à un projet particulier, sans affecter le système Python global de votre ordinateur. Ils sont
extrêmement utiles pour gérer les dépendances et éviter les conflits entre différentes versions de packages Python lorsque
vous travaillez sur plusieurs projets.

Voici comment créer et gérer des environnements virtuels en Python :

1- Virtualenv :

Virtualenv est l'une des bibliothèques les plus couramment utilisées pour créer des environnements virtuels en Python.
On peut l'installer via pip (le gestionnaire de packages Python) :

pip install virtualenv

Une fois installé, on peut créer un environnement virtuel en utilisant la commande suivante (remplacez env_grads
par le nom qu’on souhaite donner à notre environnement) :

virtualenv env_grads
Pour activer l'environnement virtuel, on doit exécuter la commande

Env_grads\Scripts\activate

Une fois l'environnement virtuel activé, On peut installer des packages spécifiques à ce projet (env_grads) à l'aide de pip

pip install -- pre metpy


2- Conda
On peut créer un environnement virtuel en utilisant la commande conda create. Par exemple, pour créer un
environnement nommé « env_grads", on peut exécuter :

conda create --name env_grads

On peut également spécifier une version particulière de Python avec l'option --python, par exemple :

conda create --name env_grads --python=3.8

Activation de l'environnement virtuel : Pour activer un environnement virtuel, on utilise la commande suivante :
conda activate env_grads
Remarque : Une fois l'environnement activé, toutes les commandes Python et les packages que nous allons installer seront
associés à cet environnement spécifique.
pip et conda
✓ pip et conda sont deux gestionnaires de packages couramment utilisés dans l'écosystème Python pour installer des
packages et des bibliothèques. Cependant, ils sont associés à différents environnements et systèmes de gestion des
dépendances.

✓ pip peut être utilisé dans Anaconda pour installer des packages Python supplémentaires dans des environnements
virtuels. Cependant, il est généralement recommandé de privilégier conda pour gérer les packages dans Anaconda,
car cela peut aider à éviter des problèmes de compatibilité et de conflits entre les packages.
Les environnements virtuels dans Anaconda

Les environnements virtuels dans Anaconda, également appelés environnements conda, sont des espaces isolés où vous
pouvez installer des packages Python et leurs dépendances spécifiques. Cette isolation vous permet de gérer facilement
différentes configurations de packages pour différents projets, ce qui est essentiel pour éviter les conflits de
dépendances entre les packages. Voici comment créer, gérer et utiliser des environnements virtuels dans Anaconda :

1. Créer un environnement virtuel :

Pour créer un nouvel environnement virtuel, utilisez la commande conda create avec le nom de l'environnement que
vous souhaitez créer et éventuellement une version spécifique de Python. Par exemple, pour créer un environnement
virtuel nommé "mon_env" avec Python 3.8, utilisez la commande suivante :

conda create --name mon_env python=3.8

2. Activer un environnement virtuel :

Pour activer un environnement virtuel, utilisez la commande conda activate suivie du nom de l'environnement. Par
exemple, pour activer l'environnement "mon_env", utilisez la commande
conda activate mon_env
Les environnements virtuels dans Anaconda

3- Installer des packages dans un environnement virtuel :

Lorsque vous avez activé un environnement virtuel, vous pouvez installer des packages spécifiques à cet environnement en
utilisant conda install ou pip install. Par exemple :

conda install numpy

Ou

pip install numpy

4- Désactiver un environnement virtuel :

Pour désactiver un environnement virtuel et retourner à l'environnement de base d'Anaconda, utilisez la commande
conda deactivate :

conda deactivate
Les environnements virtuels dans Anaconda
5. Liste des environnements virtuels :

Pour voir la liste des environnements virtuels créés sur votre système, utilisez la commande

conda env list ou conda info –envs

Vous verrez une liste de noms d'environnements et leur emplacement sur votre disque.

6. Supprimer un environnement virtuel :

Pour supprimer un environnement virtuel, utilisez la commande conda env remove suivi du nom de l'environnement à
supprimer. Par exemple :
conda env remove --name mon_env
pip
✓ Dans Anaconda, pip est un gestionnaire de package Python qui est utilisé pour installer et
gérer des bibliothèques et des packages Python supplémentaires qui ne sont pas inclus dans la
distribution Anaconda par défaut. Bien qu'Anaconda fournisse son propre gestionnaire de
package appelé conda, il est courant d'utiliser pip en conjonction avec conda pour étendre les
fonctionnalités de Python.

✓ pip est le gestionnaire de packages standard de Python. Il est principalement utilisé pour
installer des packages Python à partir du Python Package Index (PyPI) et d'autres sources
similaires.

✓ Il n'est pas limité à Python uniquement ; il peut également être utilisé pour installer des
packages non-Python si ces packages sont disponibles sous forme de packages Python (via des
"wheels" ou des distributions source).

✓ Pour installer un package avec pip, vous pouvez utiliser la commande :

pip install nom_du_package


Les commandes pip
Les commandes principales sont:

pip install: pour installer des packages.


pip uninstall: pour désinstaller des packages.
pip list: pour lister les packages installés.
pip search: pour chercher un package dans un index de packages.
pip show: pour indiquer des informations concernant un package.
pip freeze: pour lister les packages installés et permettre de stocker la liste dans un fichier requirements.txt
pip wheel: pour construire un package d’un projet et télécharger les dépendances de ce projet.
pip cache: pour manipuler le cache de pip.
pip config: pour configurer pip.
pip install

Un package peut être installé à partir de 4 sources:

✓ PyPI (ou un autre repository suivant la configuration): c’est le type d’installation le plus courant. Cette méthode
permet de récupérer et d’installer des packages tiers.
pip install <noms des packages>
Remarque : Si on a plusieurs packages il suffit de séparer les noms des packages avec un espace.

✓ A partir d’un gestionnaire de versions (comme Git): si le repository dans Git possède un fichier setup.py, il est possible
d’installer un package directement à partir du code source. Cette méthode est plutôt simple d’utilisation et convient
bien si le projet ne se trouve pas dans un repository Python comme PyPI.

✓ A partir d’un répertoire: si le projet comprend un fichier setup.py, il est possible de l’installer directement à partir d’un
répertoire. Cette méthode convient bien pour tester l’installation dans le cadre d’un projet en développement.

✓ A partir d’un fichier .zip ou .tar.gz.


pip install
L’installation des packages se fait en 4 étapes, par exemple:
pip install numpy

1- Collecting numpy
2- Downloading numpy-1.23.1-cp39-cp39-many_2_17_aarch64.many2014_aarch64.whl (13.9 MB)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
3- Installing collected packages: numpy
4- Successfully installed numpy-1.23.1

Les étapes de l’installation sont:

1- Prise en compte des paramètres.


2- Résolution des dépendances: les packages sont téléchargés ou récupérer à partir du cache.
3-Construction des packages wheels pour toutes les dépendances où c’est possible. Cette étape n’est pas effectuée
s’il n’y a pas de packages wheel ou s’ils sont dans le cache.
4-Execution du fichier setup.py des packages.
Installation des packages
Installer les packages à partir d’un fichier

On peut installer un package à partir d’un fichier tar.gz ou un fichier wheel (.whl): avec

pip install <emplacement du fichier>


✓ Par défaut le répertoire utilisé pour stocker les packages installés est :
C:\Program Files\Anaconda<version>\lib\site-packages ou bien
C:\Anaconda<version>\lib\site-packages

✓ Dans Le cas où on utilise un environnement virtuel, le chemin sera du type:


<chemin du l'env. virtuel>/lib/site-packages

Pour trouver le chemin du répertoire site-packages, il faut exécuter:


python
>>> import site
>>> site.getsitepackages()
['<chemin du l'env. virtuel>/lib/python3.9/site-packages']
Installer les packages à partir d’un repository GitHub
github.com/msoft/python_package_example
Si on installe à partir du repository en exécutant la commande suivante:
pip install git+<adresse .git du repo>
Exemple
pip install git+https://github.com/msoft/python_package_example.git

Quelques options courantes d’installation avec pip install:


✓ Installer à partir d’un fichier requirements.txt (contenant les dépendances voir pip freeze):
pip install -r <chemin du fichier requirements.txt>
Ou
pip install --requirement <chemin du fichier requirements.txt>
✓ Permettre d’installer une version en pré-release:
pip install --pre <nom du package>
✓ Pour ne pas installer de dépendances:
pip install --no-deps <nom du package>
✓ Pour simuler l’exécution:
pip install --dry-run <nom du package>
✓ Pour réinstaller des packages déjà installés:
pip install --force-reinstall <nom du package>
✓ Pour installer à partir d’un répertoire local sans utiliser des index comme PyPI:
pip install --no-index --find-links <chemin répertoire local>
conda
conda est un gestionnaire de packages et un environnement virtuel associé à la distribution Anaconda, qui est
couramment utilisée dans le domaine de la science des données et de l'analyse de données.
Il est capable d'installer des packages Python ainsi que des packages non-Python (tels que des bibliothèques C/C++).
Il permet également de créer et de gérer des environnements virtuels isolés où vous pouvez spécifier et gérer les
dépendances de vos projets.
Pour installer un package avec conda, vous pouvez utiliser la commande :

conda install nom_du_package

Remarques :
- Si on travaille dans un environnement conda, il est généralement recommandé d'utiliser conda install pour gérer les
dépendances Python et non-Python de vos projets, car cela garantira la cohérence avec l'environnement conda.
- Si on n'utilisez pas conda et que nous travaillons uniquement avec Python, pip est le gestionnaire de packages
standard pour l'installation de packages Python.
- On peut utiliser pip pour installer des packages spécifiques à Python, même si on travaille dans un environnement
conda, mais cela peut parfois entraîner des conflits de dépendances, il est donc recommandé de gérer les packages
Python via conda dans un environnement conda.
Conda

❑ Mise à jour de Conda

 Utilisez la commande ci-dessous pour mettre à jour Conda vers la dernière


version
conda update conda

Tapez "y" et appuyez sur Entrée pour continuer


Conda

❑ Packages dans Conda


 Pour afficher tous les packages installés avec Conda, utilisez la commande
ci-dessous
conda list
Conda

❑ Installation des packages

 Installer un nouveau paquet est facile

condainstall
conda install [package_name]
-c conda-forge[package_name]

 Pour installer le package “shapely,”

conda install -c conda-forge shapely


Conda

❑ Installation packages

 Cependant, certains packages ne sont pas installables via Conda


 Ensuite, utilisez la commande pip ou téléchargez et installez manuellement
pip install [package_name]

 To install shapely via pip commande,

pip install pygame


Conda

❑ Removing packages

 Les packages peuvent être supprimés par Conda

conda remove [package_name]

 To remove package shapely,


conda remove shapely
Conda

❑ Gestion de Python en tant que package

 Fait intéressant, Python n'est qu'un autre package inclus dans Conda
 Ainsi, Python peut être installé, supprimé et mis à jour comme d'autres
Packages
 Pour vérifier quelles versions de Python sont disponibles,
conda search -–full-name python
Conda

 Supposons que Python 3.6 est installé (via Conda) et que vous souhaitez
utiliser Python 2.7 (version héritée)
 Ensuite, vous pouvez créer un environnement Conda avec la commande
ci-dessous
conda create -–name [env_name] python=[version]

 Par exemple, pour définir le nom d'environnement "py27" et utiliser la


version 2.7,
conda create -–name py27 python=2.7
Conda
Conda

 Vérification des environnements ajoutés

conda info --envs


Conda

 Activation de l'environnement créé


 Windows

activate [env_name]

 MAC OSX

source activate [env_name]


Jupyter NOTEBOOK
CREATION D’UN ENVIRONNEMENT DE TRAVAIL POUR LA PROGRAMMATION SIG
SOUS ANACONDA
Spatial Phyton Library

Librairies phyton pour le spatial


Librairies pour le geoprocessing librairies webmapping et IDS
GDAL/OGR Geemap ipyleaflet ArcGIS API for JavaScript
Arcpy LiDAR Mapbox GL Leaflet.js
GeoPandas Matplotlib OpenLayers Cesium
RSGISLib imageio Geopy Turf.js
PyProj PyQGIS Geodjango
Rasterio SciKit-image Follium
Rasterstats SciKit-learn BasemapToolkit
Rasterframes Xarray Cartopy
Fiona MapClassify OWSLib
Shapely Rtree ISO-19139 Python Libraries

SNAP spectral PostGIS


3- INSTALLATION DES PACKAGE POUR LE SPATIAL
Data Science, Machine learning and Deep learning
Phyton Library

Librairies phyton pour la science des données,


Machine learning et Deep Learning
TensorFlow
NumPy
Pandas
SciPy
Theano
Matplotlib
Keras
SciKit-Learn
PyTorch
Scrapy
La première de la liste des bibliothèques Python pour la science des données est TensorFlow. TensorFlow est une
bibliothèque de calculs numériques hautes performances avec environ 35 000 commentaires et une communauté
dynamique d'environ 1 500 contributeurs. Elle est utilisée dans divers domaines scientifiques. TensorFlow est
essentiellement un cadre pour définir et exécuter des calculs qui impliquent des tenseurs, qui sont des objets de calcul
partiellement définis qui produisent finalement une valeur.
Applications
Caractéristiques
▪ Reconnaissance de la parole et des images
▪ Meilleures visualisations de graphes informatiques ▪ Applications textuelles
▪ Réduit les erreurs de 50 à 60 % dans l'apprentissage ▪ Analyse des séries chronologiques
automatique neuronal ▪ Détection vidéo
▪ Calcul parallèle pour exécuter des modèles ▪ Etc.
complexes
▪ Gestion transparente de la bibliothèque soutenue
par Google
▪ Mises à jour plus rapides et nouvelles versions
fréquentes pour vous fournir les dernières
fonctionnalités
NumPy (Numerical Python) est le package fondamental pour le calcul numérique en Python ; il contient un puissant
objet tableau à N dimensions. Il compte environ 18 000 commentaires sur GitHub et une communauté active de 700
contributeurs. Il s'agit d'un package de traitement de tableau à usage général qui fournit des objets
multidimensionnels hautes performances appelés tableaux et des outils pour travailler avec eux. NumPy résout
également le problème de lenteur en fournissant ces tableaux multidimensionnels ainsi que des fonctions et des
opérateurs qui fonctionnent efficacement sur ces tableaux.

Caractéristiques Applications

▪ Fournit des fonctions rapides et précompilées pour ▪ Largement utilisé dans l'analyse des données
les routines numériques ▪ Crée un puissant tableau à N dimensions
▪ Calcul orienté matrice pour une meilleure efficacité ▪ Forme la base d'autres bibliothèques, telles
▪ Prend en charge une approche orientée objet que SciPy et scikit-learn
▪ Calculs compacts et plus rapides avec vectorisation ▪ Elle peut completement remplacer MATLAB
lorsqu'il est utilisé avec SciPy et matplotlib
Pandas (analyse de données Python) est un incontournable du cycle de vie de la science des données. C'est la
bibliothèque Python la plus populaire et la plus utilisée pour la science des données, avec NumPy et matplotlib. Avec
environ 17 000 commentaires sur GitHub et une communauté active de 1 200 contributeurs, il est largement utilisé
pour l'analyse et le nettoyage des données. Pandas fournit des structures de données rapides et flexibles, telles que
des trames de données, qui sont conçues pour fonctionner très facilement et intuitivement avec des données
structurées.
Applications
▪ Traitement général des données et nettoyage des
Caractéristiques données
▪ Tâches ETL (extraction, transformation, chargement)
▪ Une syntaxe facile et des fonctionnalités riches qui pour la transformation et le stockage de données, car
vous donnent la liberté de traiter les données il offre un excellent support pour le chargement de
manquantes fichiers CSV dans son format de trame de données
▪ Permet de créer votre propre fonction et de ▪ Utilisé dans une variété de domaines académiques et
l'exécuter sur une série de données commerciaux, y compris les statistiques, la finance et
▪ Abstraction de haut niveau les neurosciences
▪ Contient des structures de données de haut niveau ▪ Fonctionnalités spécifiques aux séries chronologiques,
et des outils de manipulation telles que la génération de plage de dates, la fenêtre
mobile, la régression linéaire et le décalage de date.
SciPy (Scientific Python) est une autre bibliothèque Python gratuite et open-source pour la science des données qui est
largement utilisée pour les calculs de haut niveau. SciPy compte environ 19 000 commentaires sur GitHub et une
communauté active d'environ 600 contributeurs. Elle est largement utilisé pour les calculs scientifiques et techniques,
car il étend NumPy et fournit de nombreuses routines conviviales et efficaces pour les calculs scientifiques

Caractéristiques Applications

▪ Collection d'algorithmes et de fonctions construits ▪ Opérations sur les images multidimensionnelles


sur l'extension NumPy de Python ▪ Résolution d'équations différentielles et de la
▪ Commandes de haut niveau pour la manipulation et transformée de Fourier
la visualisation des données ▪ Algorithmes d'optimisation
▪ Traitement d'images multidimensionnel avec le ▪ Algèbre linéaire
sous-module ndimage de SciPy
▪ Inclut des fonctions intégrées pour résoudre des
équations différentielles
Theano est une bibliothèque machine learning Python qui peut agir comme un compilateur d'optimisation
pour évaluer et manipuler des expressions mathématiques et des calculs matriciels. Construit sur NumPy,
Theano présente une intégration étroite avec NumPy et possède une interface très similaire. Theano peut
travailler sur Graphics Processing Unit (GPU) et CPU.

Remarques :
▪ Travailler sur l'architecture GPU donne des résultats plus rapides. Theano peut effectuer des calculs gourmands en
données jusqu'à 140 fois plus rapidement sur GPU que sur un CPU. Theano peut automatiquement éviter les
erreurs et les bogues lorsqu'il s'agit de fonctions logarithmiques et exponentielles. Theano dispose d'outils
intégrés pour les tests unitaires et la validation, évitant ainsi les bogues et les problèmes.
▪ Il accepte efficacement les structures et les transforme en un code extrêmement efficace qui utilise NumPy et
quelques bibliothèques natives. Principalement, il est conçu pour traiter divers calculs exigés par d'énormes
algorithmes de réseau neuronal utilisés dans Deep Learning. Par conséquent, c'est l'une des bibliothèques
d'apprentissage automatique les plus populaires en Python, ainsi que l'apprentissage en profondeur.
Matplotlib a des visualisations très puissantes. C'est une bibliothèque de traçage pour Python avec environ 26 000
commentaires sur GitHub et une communauté très dynamique d'environ 700 contributeurs. En raison des graphiques et
des tracés qu'il produit, il est largement utilisé pour la visualisation de données. Il fournit également une API orientée
objet, qui peut être utilisée pour intégrer ces tracés dans des applications.
Applications
▪ Analyse de corrélation des variables
▪ Visualisez les intervalles de confiance à 95 % des modèles
Caractéristiques ▪ Détection des valeurs aberrantes à l'aide d'un nuage de
points, etc.
▪ Utilisable en remplacement de MATLAB, avec ▪ Visualisez la distribution des données pour obtenir des
l'avantage d'être gratuit et open source informations instantanées
▪ Créez des tracés de qualité de publication.
▪ Prend en charge des dizaines de backends et de
▪ Créez des figures interactives qui peuvent zoomer, faire un
types de sortie, ce qui signifie que vous pouvez panoramique, mettre à jour.
l'utiliser quel que soit le système d'exploitation que ▪ Personnalisez le style visuel et la mise en page.
vous utilisez ou le format de sortie que vous ▪ Exportez vers de nombreux formats de fichiers.
souhaitez utiliser ▪ Intégrer dans JupyterLab et les interfaces utilisateur
▪ Faible consommation de mémoire et meilleur graphiques.
comportement d'exécution. ▪ Utilisez un large éventail de packages tiers construits sur
Matplotlib.
Semblable à TensorFlow, Keras est une autre bibliothèque populaire qui est largement utilisée pour les modules
d'apprentissage en profondeur et de réseau de neurones. Keras prend en charge les backends TensorFlow, c'est donc
une bonne option si vous ne voulez pas plonger dans les détails de TensorFlow.
Keras est une API d'apprentissage en profondeur écrite en Python, exécutée sur la plate-forme d'apprentissage
automatique TensorFlow. Il a été développé dans le but de permettre une expérimentation rapide.

Caractéristiques Applications
▪ L'une des applications les plus importantes de Keras sont les
▪ Keras fournit de vastes ensembles de données pré- modèles d'apprentissage en profondeur qui sont disponibles
étiquetés qui peuvent être utilisés pour importer et avec leurs poids pré-entraînés.
charger directement. ▪ Vous pouvez utiliser ces modèles directement pour faire des
▪ Elle contient diverses couches et paramètres prédictions ou extraire ses fonctionnalités sans créer ni
implémentés qui peuvent être utilisés pour la entraîner votre propre nouveau modèle.
construction, la configuration, la formation et
l'évaluation des réseaux de neurones
L ’une des meilleures bibliothèques python pour la science des données. Scikit-learn, une bibliothèque d'apprentissage
automatique qui fournit presque tous les algorithmes d'apprentissage automatique dont vous pourriez avoir besoin.
Scikit-learn est conçu pour être interpolé dans NumPy, SciPy et matplotlib.

Applications

▪ Classification supervisée → SVM, random forest, ...


▪ Regression → Ridge regression, Lasso, ...
▪ Clustering → k-Means, spectral clustering, mean-shift, ...
▪ Dimensonality reduction → PCA, non-negative matrix factorization, ...
▪ Model selection → cross validation, parameter search, classification metrics
C’est librairie qui est un progiciel de calcul scientifique basé sur Python qui utilise la puissance des unités de traitement
graphique. PyTorch est l'une des plateformes de recherche d'apprentissage en profondeur les plus couramment préférées,
conçue pour offrir une flexibilité et une vitesse maximales

Caractéristiques Applications
▪ Un remplacement pour NumPy pour utiliser la puissance des
GPU.
▪ Calcul tensoriel (comme NumPy) avec une forte ▪ Une plate-forme de recherche d'apprentissage en profondeur
accélération GPU qui offre une flexibilité et une vitesse maximales.
▪ Réseaux de neurones profonds construits sur un
système d'autogradation sur bande
La prochaine bibliothèque python connue pour la science des données est Scrapy. Scrapy est l'un des frameworks
d'exploration Web open source les plus populaires, rapides et écrits en Python. Il est couramment utilisé pour
extraire les données dont vous avez besoin à partir de sites Web. D'une manière rapide, simple, mais extensible.

Applications

Scrapy aide à créer des programmes d'exploration (robots araignées) capables de récupérer des données
structurées sur le WebScrappy est également utilisé pour collecter des données à partir d'API et suit un principe
"Ne vous répétez pas" dans la conception de son interface, incitant les utilisateurs à écrire des codes universels qui
peuvent être réutilisés pour la construction et la mise à l'échelle.
Librairie phyton pour les images raster
Gdal
La bibliothèque d'abstraction de données géospatiales (GDAL) est la centrale de traitement raster. Elle offre des capacités
de lecture et d'écriture extrêmement flexibles pour les formats raster (la partie GDAL) et vectoriels (OGR), ce qui en fait
un outil essentiel dans tout flux de travail Extract, Transform, Load (ETL). La grande majorité des logiciels SIG (et l'industrie
géospatiale en général) dépendent de GDAL. GDAL est écrit en C++ qui est exécuté sur la ligne de commande, mais inclut
un ensemble de liaisons Python, maintenu par les membres de la communauté GDAL.

Rasterio
Rasterio est un module très utile pour le traitement raster que nous pouvons utiliser pour lire et écrire plusieurs formats
raster différents en Python. Rasterio est basé sur GDAL et Python enregistre automatiquement tous les pilotes GDAL
connus pour lire les formats pris en charge lors de l'importation du module. Les formats de fichiers les plus courants
incluent par exemple TIFF et GeoTIFF, ASCII Grid et Erdas Imagine .img -files
RSGISLib
La bibliothèque de télédétection et de systèmes d'information géographique (RSGISLib) fournit des algorithmes Python
pour plusieurs flux de travail de télédétection, y compris la segmentation d'images, les statistiques zonales, la détection
de changement et l'analyse de séries chronologiques.

Rasterstats
Bibliothèque de fonctions utilisées pour résumer les données raster dans les entités vectorielles surfaciques. Rasterstats
est également utilisé pour interroger les valeurs de cellule à partir d'entités ponctuelles.
Rasterframes
L'analyse de données géospatiales évolutives est en forte demande. Rasterframes offre la possibilité de traiter des
données raster dans un environnement distribué et évolutif horizontalement à l'aide de DataFrames dans Apache Spark.

Pyproj
Le pyproj est un package Python qui effectue des transformations cartographiques et des calculs géodésiques. Il
s'agit d'un wrapper Cython pour fournir des interfaces Python aux fonctions PROJ.4, ce qui signifie que vous pouvez
accéder à une bibliothèque existante de code C en Python. PROJ.4 est une bibliothèque de projection qui
transforme les données entre de nombreux systèmes de coordonnées et est également disponible via GDAL et OGR.
La raison pour laquelle PROJ.4 est toujours populaire et largement utilisé est double :
▪ Premièrement, parce qu'il prend en charge de nombreux systèmes de coordonnées différents
▪ Deuxièmement, en raison des itinéraires qu'il fournit pour le faire - Rasterio, utilise pyproj et donc la
fonctionnalité PROJ.4

Le package pyproj propose deux classes : la classe Proj et la classe Geod. La classe Proj effectue des calculs
cartographiques, tandis que la classe Geod effectue des calculs géodésiques
SNAP
Snap.py est une interface Python pour SNAP. SNAP est un système hautes performances à usage général pour l'analyse
et la manipulation de grands réseaux. SNAP est écrit en C++ et optimisé pour des performances maximales et une
représentation graphique compacte. Il évolue facilement vers des réseaux massifs avec des centaines de millions de
nœuds et des milliards de bords.

pyroSAR
Le package pyroSAR vise à fournir une solution complète pour l'organisation et le traitement évolutif des données
satellitaires SAR :
▪ Lecture des données de diverses missions satellites passées et présentes
▪ Traitement des métadonnées d'acquisition
▪ Accès convivial aux utilitaires de traitement dans les logiciels de télédétection SNAP et GAMMA
▪ Mise en forme des données prétraitées pour une analyse plus approfondie
▪ Exporter vers les solutions Data Cube
Librairie phyton pour les vecteurs
Shapely
Shapely est un package Python pour l'analyse de la théorie des ensembles et la manipulation d'entités planaires à
l'aide (via le module ctypes de Python) des fonctions de la bibliothèque GEOS bien connue et largement déployée.
GEOS, un portage de Java Topology Suite (JTS), est le moteur de géométrie de l'extension spatiale PostGIS pour le
SGBDR PostgreSQL. Les conceptions de JTS et GEOS sont largement guidées par la spécification d'accès aux
fonctionnalités simples de l'Open Geospatial Consortium 1 et Shapely adhère principalement au même ensemble de
classes et d'opérations standard. Shapely est ainsi profondément enraciné dans les conventions du monde des
systèmes d'information géographique (SIG), mais aspire à être tout aussi utile aux programmeurs travaillant sur des
problèmes non conventionnels.

Geojson
Cette bibliothèque implémente tous les objets GeoJSON décrits dans The GeoJSON Format Specification.
Toutes les clés d'objet peuvent également être utilisées comme attributs.
Les objets contenus dans GeometryCollection et FeatureCollection peuvent être indexés directement.

Remarque : GeoJSON prend en charge les types de géométrie suivants : Point, LineString, Polygon, MultiPoint, MultiLineString
et MultiPolygon. Les objets géométriques avec des propriétés supplémentaires sont des objets Feature. Les ensembles de
fonctionnalités sont contenus dans les objets FeatureCollection.
Geojson.io
GeoJson.io est un outil Web open source populaire pour convertir, éditer et créer des fichiers GeoJSON. L'outil a
été initialement développé par Tom MacWright en 2013 et est rapidement devenu un outil incontournable pour
les praticiens géospatiaux.

GeoPandas
▪ GeoPandas est un projet open source pour faciliter le travail avec des données géospatiales en python. GeoPandas
étend les types de données utilisés par les pandas pour permettre des opérations spatiales sur des types
géométriques. Les opérations géométriques sont effectuées par shapely. Geopandas dépend en outre de fiona
pour l'accès aux fichiers et de matplotlib pour le traçage.

▪ L'objectif de GeoPandas est de faciliter le travail avec des données géospatiales en python. Il combine les
capacités de pandas et shapely, fournissant des opérations géospatiales dans pandas et une interface de haut
niveau pour plusieurs géométries à shapely. GeoPandas permet d'effectuer facilement des opérations en python
qui nécessiteraient autrement une base de données spatiale telle que PostGIS.
Fiona
Fiona est conçu pour être simple et fiable. Il se concentre sur la lecture et l'écriture de données dans le style Python IO
standard et s'appuie sur des types et des protocoles Python familiers tels que des fichiers, des dictionnaires, des mappages
et des itérateurs au lieu de classes spécifiques à OGR. Fiona peut lire et écrire des données du monde réel à l'aide de
formats SIG multicouches et de systèmes de fichiers virtuels compressés et s'intègre facilement à d'autres packages SIG
Python tels que pyproj, Rtree et Shapely.
Librairie phyton pour la recherche des
données satellitaires

EOBrowser
Sentinelsat
Sentinelhub
Librairies phyton pour la météorologie
Metpy
Cartopy
Siphon
Xarray
MatPlotlib
pandas
Metpy
https://unidata.github.io/MetPy/latest/
D’autres Librairies phyton pour la
météorologie
Install pyowm (Python Open Weather Map API)
Pour obtenir des données météorologiques, nous utilisons le python pyowm (Python Open Weather Map) dans
notre code. Celui-ci a été publié sous licence MIT (MIT) et encapsule de nombreuses étapes normalement requises
pour appeler l'API. Vous pouvez également appeler les API directement, mais l'utilisation de cette bibliothèque
simplifie de nombreuses étapes requises. La bibliothèque est bien entretenue et bénéficie de mises à jour au moins
annuelles depuis sa création en 2013.

Pour commencer, nous devrons installer la bibliothèque à l'aide de pip (Package Installer for Python).
pip install pyowm

Vous aimerez peut-être aussi