Vous êtes sur la page 1sur 2

Liste exhaustive des repository de base de données

existantes
1. GitHub (https://github.com/) : GitHub est une plateforme de développement
collaboratif où vous pouvez trouver de nombreuses bases de données publiques
partagées par la communauté, notamment des ensembles de données pour
l'apprentissage automatique, la science des données, la recherche scientifique, etc.
2. UCL Data Repository (https://discovery.ucl.ac.uk/id/eprint/10045882/) : L'University
College London (UCL) propose un référentiel de données qui contient divers
ensembles de données dans des domaines tels que la santé, l'économie, la
géographie, etc.
3. Kaggle (https://www.kaggle.com/) : Kaggle est une plateforme bien connue pour les
compétitions de science des données. Elle propose également une vaste
bibliothèque d'ensembles de données publics pour l'apprentissage automatique et la
visualisation des données.
4. OpenML (https://www.openml.org/) : OpenML est une plateforme open-source qui
permet aux chercheurs de partager et de découvrir des ensembles de données, des
algorithmes et des évaluations dans le domaine de l'apprentissage automatique.
5. Data.gov (https://www.data.gov/) : Data.gov est le portail officiel du gouvernement
fédéral des États-Unis pour les données ouvertes. Il offre un large éventail de
données publiques provenant de différentes agences gouvernementales.
6. World Bank Open Data (https://data.worldbank.org/) : La Banque mondiale propose
une plateforme où vous pouvez accéder à des données économiques,
démographiques et sociales provenant de pays du monde entier.
7. Google Public Data Explorer (https://www.google.com/publicdata/directory) : Google
Public Data Explorer offre une grande variété de données provenant de différentes
sources, y compris des agences gouvernementales et des organisations
internationales.
8. Data.gov.uk (https://data.gov.uk/) : Data.gov.uk est le portail britannique des
données ouvertes, fournissant des ensembles de données provenant de diverses
sources au Royaume-Uni.
9. Data.gov.au (https://data.gov.au/) : Data.gov.au est le portail australien des données
ouvertes, offrant des ensembles de données sur différents sujets.
10. UCI Machine Learning Repository (https://archive.ics.uci.edu/ml/index.php): Ce
référentiel, géré par l'Université de Californie à Irvine, propose une collection
d'ensembles de données pour la recherche en apprentissage automatique. Il est
largement utilisé dans la communauté scientifique.
11. OpenAI Gym (https://gym.openai.com/): OpenAI Gym est une plateforme
d'apprentissage par renforcement (reinforcement learning) qui propose divers
environnements de jeu et de simulation pour entraîner des agents d'apprentissage
automatique.
12. TensorFlow Datasets (https://www.tensorflow.org/datasets): TensorFlow Datasets
est un référentiel spécifique à TensorFlow qui fournit des ensembles de données
pour des tâches d'apprentissage automatique courantes.
13. Scikit-learn Datasets (https://scikit-learn.org/stable/datasets/index.html): Scikit-learn,
une bibliothèque populaire d'apprentissage automatique en Python, propose
également certains ensembles de données prêts à l'emploi pour l'entraînement de
modèles.
14. Microsoft Research Open Data (https://msropendata.com/): Microsoft Research
propose une plateforme de données ouvertes contenant des ensembles de données
de recherche provenant de divers domaines.
15. Data.gov (https://www.data.gov/): Le portail officiel du gouvernement fédéral des
États-Unis pour les données ouvertes propose également des ensembles de
données utiles pour la recherche en apprentissage automatique.

Vous aimerez peut-être aussi