Vous êtes sur la page 1sur 2

 SIDI NADIR

 BEN ALLEL ABDELMADJID ISLEM


Groupe: A sous-groupe: A2

Compte-rendu TP(1): Compréhension et préparation des données.

OBJECTIF DU TP:
L’étudiant sera capable de transférer les connaissances acquises afin de démarrer un projet en
Intelligence Artificielle. Aussi, d’identifier les données et ressources nécessaires, de les traiter
correctement, de choisir le modèle adéquat.

1. L’utilité des bibliothèques étudiées dans le domaine de l’IA :


Les bibliothèques dans le domaine de l'intelligence artificielle (IA) jouent un rôle essentiel en
fournissant des outils et des ressources permettant aux chercheurs, développeurs et praticiens de
mettre en œuvre des modèles d'IA de manière efficace. Voici quelques-unes des bibliothèques
utilisées dans le domaine de l'IA et leurs utilités respectives.

 TensorFlow:
Utilité : TensorFlow est une bibliothèque open-source développée par Google, largement utilisée
pour la création et le déploiement de modèles d'apprentissage machine et d'apprentissage
profond.

 PyTorch:
Utilité: PyTorch est une bibliothèque d'apprentissage profonde qui gagne en popularité. Elle est
appréciée pour sa facilité d'utilisation et sa flexibilité.

 Keras:
Utilité: Keras est une interface haut niveau construite au-dessus de bibliothèques telles que
TensorFlow et Theano. Elle simplifie la création de réseaux de neurones en fournissant une API
conviviale tout en offrant une grande flexibilité pour la conception de modèles complexes.

 Scikit-Learn:
Utilité: Scikit-Learn est une bibliothèque d'apprentissage automatique en Python qui offre des
outils simples et efficaces pour l'analyse de données et la modélisation prédictive. Elle propose
une large gamme d'algorithmes d'apprentissage supervisé et non supervisé, ainsi que des outils
pour l'évaluation des modèles.

2. Décrire la stratégie que vous utiliser pour diviser la base de données en


deux sous ensembles d’apprentissage et de test :

Randomisation : mélangez aléatoirement l'ensemble de données. Cela garantit que les deux
ensembles (apprentissage et test) sont représentatifs de la distribution globale des données.

Proportion de division :Déterminez la proportion de données que vous souhaitez allouer à


l'ensemble de test par rapport à l'ensemble d'apprentissage. Une répartition courante est de 80%

1
pour l'ensemble d'apprentissage et 20% pour l'ensemble de test, mais cela peut varier en fonction
de la taille de votre ensemble de données et des caractéristiques spécifiques du problème.

Division: Divisez les données en deux ensembles en utilisant la proportion définie. Vous pouvez
prendre les premières 80% des données comme ensemble d'apprentissage et les 20% restants
comme ensemble de test. Assurez-vous que la division est aléatoire pour éviter tout biais
potentiel.

Stratification (si nécessaire) : Si votre ensemble de données présente des classes


déséquilibrées, vous pourriez envisager d'utiliser la stratification pour vous assurer que la
répartition des classes est maintenue dans les ensembles d'apprentissage et de test. Cela garantit
une représentation adéquate de chaque classe dans les deux ensembles.

Validation (si applicable) : Dans certains cas, vous pouvez également diviser l'ensemble
d'apprentissage en un ensemble d'apprentissage et un ensemble de validation si vous avez
besoin d'ajuster les hyperparamètres du modèle.

Conclusion :

On a vu dans ce TP les compréhensions et préparation des données en utilisant le langage de


programmation PYTHON et de familiariser avec les bibliothéques utilisées en IA comme
TensorFlow, keras, pytorch,sklearn....etc. Nous avons vu aussi la stratégie que nous avions utilisé
pour diviser la base de données en deux sous ensemble d’apprentissage et de le tester.

Vous aimerez peut-être aussi