Vous êtes sur la page 1sur 3

Université M’Hamed Bougara de Boumerdes

FACULTY OF TECHNOLOGY

Département d’Ingénierie Des Systèmes Électriques

intelligence artificielle
Tp1 Compréhension et préparation des données

Nom :
-Hamzaoui Toufik
-Megdoud Ihab

Master 2 Réseaux et télécommunications Groupe B


1-L’utilité des bibliothèques étudiées dans le domaine de l’IA:

Tensorflow: est une bibliothèque open-source développée par Google, principalement utilisée pour le
machine learning et le deep learning. Elle permet de construire, former et déployer des modèles
d'apprentissage automatique. TensorFlow utilise un graphique de flux de données pour représenter les
calculs, avec des tenseurs.

Keras: est une interface open-source de haut niveau pour la construction, la formation et le déploiement
de modèles d'apprentissage automatique. Il fonctionne au-dessus de bibliothèques de calcul numérique
telles que TensorFlow et Theano. Keras simplifie le processus en offrant une API conviviale, permettant
aux développeurs de créer des modèles de manière plus intuitive.

Pytorch:est une bibliothèque open-source d'apprentissage automatique développée par Facebook. Elle
offre un environnement flexible pour la création de modèles d'apprentissage en profondeur. PyTorch se
distingue par sa dynamique de calcul, Il est largement utilisé dans la recherche et la mise en œuvre
pratique de projets d'apprentissage automatique et de réseaux de neurones.

Sklearn: est une bibliothèque open-source de machine learning pour le langage de programmation
Python. Elle propose des outils simples et efficaces pour l'analyse de données et la modélisation
prédictive, couvrant divers algorithmes d'apprentissage supervisé et non supervisé. Scikit-learn(sklearn)
est largement utilisé pour la création de modèles, l'évaluation de la performance et le prétraitement des
données dans le domaine de l'apprentissage automatique.

2-la stratégie que vous utilise pour diviser la base de données en deux sous ensembles
d'apprentissage et de test:

 Une approche courante consiste à utiliser une fonction de division, comme celle de scikit-learn,
pour séparer aléatoirement les données en deux ensembles distincts, attribuant généralement
environ 80% des données à l'ensemble d'apprentissage et réservant le reste pour l'ensemble de
test. Cela assure une distribution aléatoire, favorisant une représentation équilibrée dans
chaque ensemble pour une meilleure généralisation du modèle.

1. Importation des bibliothèques : Utilisez des bibliothèques comme scikit-learn en Python, en important
les modules nécessaires.

2. Chargement des données : Chargez vos données à partir de la source, qu'il s'agisse de fichiers CSV, de
bases de données ou d'autres formats.

3. Prétraitement des données : Si nécessaire, effectuez des opérations de nettoyage comme la gestion
des valeurs manquantes, la normalisation des données.

4. Mélange aléatoire : Mélangez l'ordre des exemples dans le jeu de données. Cela évite que les
données ne soient organisées d'une manière spécifique, ce qui pourrait biaiser l'apprentissage.
5. Division : Utilisez une fonction de division.

6. Enregistrement des ensembles :Sauvegardez les ensembles d'apprentissage et de test dans des
variables distinctes pour une utilisation ultérieure.

Vous aimerez peut-être aussi