Projet IA Cheikh - Ibra

République du Sénégal
Un Peuple-Un But-Une Foi
Ministère de l’Enseignement Supérieur de la Recherche et de L’Innovation
Université Iba Der Thiam de THIES

UFR sciences et Technologie
Filière Informatique option Réseaux et Télécommunications
Niveau : Master I
Projet : Intelligence Artificielle
Apprentissage automatique
Présenté par : Professeur :

Mame Cheikh SYLLA Dr F. KALY
Ibra KOUNDOUL
Année académique 2020/ 2021

Plan
Introduction
I. Présentation des outils de travail

II. TP 1 : Les k plus proches voisins Classification
a. Objectif
b. Analyse des données
c. Séparation des données en bases d’apprentissage et de test
d. Apprentissage et test
e. Jouer avec le paramètre k
III. TP 2 : La régression linéaire

a. Objectif
Conclusion
Introduction
L’apprentissage automatique ou machine learning en anglais est un champ d’étude de
l’intelligence artificielle qui se fonde sur des approches mathématiques et statistiques
pour donner aux ordinateurs la capacité d’apprendre à partir de données, c’est-à -dire
d’améliorer leurs performances à résoudre des taches sans être explicitement
programmés pour chacune. Plus largement, il concerne la conception, l’analyse,
l’optimisation, le développement et l’implémentation de telles méthodes.
I. Présentation des outils de travail

Pour la réalisation de ce projet, nous allons utiliser différente logicielle dont Jupiter
intégrer sur anaconda IDE comme environnement de développement, python comme
langage de programmation qui nous permettra de faire l’analyse des données et leur
traitement.
a. Python
Python est le langage le plus populaire dans le monde de l’intelligence artificielle.
C’est un langage orienté objet et se veut relativement facile d’accès. Il est très
utilisé au sein de la communauté scientifique et particulièrement dans le domaine
de l’intelligence artificielle. Les principaux Framework de machine Learning et
Deep Learning sont effectivement disponibles en Python.
Python3
b. Anaconda
Anaconda est une distribution libre et open source des langages de programmation
Python et R appliqué au développement d'applications dédiées à la science des
données et à l'apprentissage automatique, qui vise à simplifier la gestion des paquets
et de déploiement.
c. Jupyter
Jupyter est une application web utilisée pour programmer différente langages de
programmation, dont Python, Julia, Ruby et tant d’autres. C'est un projet
communautaire dont l'objectif est de développer des logiciels libres, des formats
ouverts et des services pour l'informatique interactive. C’est une évolution du
projet IPython et permet de réaliser des calepins ou notebooks, c'est-à -dire des
programmes contenant à la fois du texte en markdown et du code. Ces calepins
sont utilisés en science des données pour explorer et analyser des données.
II. TP 1 : Les k plus proches voisins Classification

a. Objectif
L’objectif de ce TP consiste à prédire si l'objet repéré par le sonar est un rocher
ou une mine. Il n'y aura donc que deux options possibles nous permettant de
classer notre prédiction dans l'une ou l'autre catégorie. Il s'agira donc bien d'un
problème de classification. Nous allons utiliser l’algorithme des k-plus proches
voisins afin de réaliser notre classification.
 Renommons les variables avec utilisant la commande names

Après le renommage des différentes variables de notre datagramme nous avons
l’observation suivante.
 Afficher les premières lignes de la base de données
Avec la commande Head () on peut afficher les toutes premières ligne de notre
data frame.
 Combien de classes ?
Nous avons deux classes dont la classe R comme ROCHER et M qui représente les objets
de type MINE
Avec la commande value_counts( ) nous constatons qu’il y’a 111 objet de type Minier(M)
et 97 objets de Types Rocher(R)
 Combien de caractéristiques descriptives ? De quels types ?
Nous avons 61 caractéristiques descriptives
Les 60 premier sont de variables qui vont de F1 A F60 et leur type est Float64
La dernière s’appelle OBJET et sont type est objet

 Calculer les statistiques de base des variables 2 à 7
 Combien d’exemples ?
 Combien d’exemples de chaque classe ?
 Comment sont organisés les exemples ?

d. Apprentissage et test
Création du model avec la fonction from sklearn.model_selection import
train_test_split qui fonction a l’avantage de randomiser l’ensemble avant de faire
le split, ce qui est très important avec la base des Sonars.
Après la création du model nous allons mesurer sa précision du modèle en
utilisant la fonction score.

Score obtenue en apprentissage 0.915662……
Score obtenue en test ? 0.833333…………….
Affichage des labels et des predictions
Affichage de la matrice de confusion
e. Jouer avec le paramètre k
Observations
Lorsqu’on change la valeur du paramètre k a 3 nous avons les scores suivants
Au vu de voir le comportement du score lorsqu’on joue sur le paramètre k, nous
avons pensé a utilisé une boucle for pour k allant de 1 à 50 calculer le score
correspondant et afficher ca sous forme de courbe
On peut dire alors que plus la valeur de k (KNeighborsClassifier) est grand plus
on perd la précision alors le score devient de plus en plus faible

Courbe de k en fonction des scores.
III. TP 2 : La régression linéaire

a. Objectif
L’objectif de ce travail consiste à déterminer si lors d'un combat, un Pokémon
a de grandes chances de gagner. Comme nous disposons de données
d'apprentissage, nous sommes donc dans un cas de Machine Learning dit
"supervisé". C'est-à -dire que la machine va apprendre en fonction de ce qu'on
lui fournit en entrée. Dans ce fait, nous devons prédire le pourcentage de
victoire, c'est donc une valeur et c'est naturellement que nous utiliserons
l’algorithme de régression que nous avons découverts dans le cours.
Conclusion

Projet IA Cheikh - Ibra

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Projet IA Cheikh - Ibra

Transféré par

Droits d'auteur :

Formats disponibles

République du Sénégal

Un Peuple-Un But-Une Foi

Ministère de l’Enseignement Supérieur de la Recherche et de L’Innovation

Université Iba Der Thiam de THIES

Présenté par : Professeur :

Année académique 2020/ 2021

I. Présentation des outils de travail

b. Analyse des données

c. Séparation des données en bases d’apprentissage et de test

e. Jouer avec le paramètre k

III. TP 2 : La régression linéaire

b. Analyse des données

c. Séparation des données en bases d’apprentissage et de test

l’intelligence artificielle qui se fonde sur des approches mathématiques et statistiques

d’améliorer leurs performances à résoudre des taches sans être explicitement

programmés pour chacune. Plus largement, il concerne la conception, l’analyse,

l’optimisation, le développement et l’implémentation de telles méthodes.

I. Présentation des outils de travail

II. TP 1 : Les k plus proches voisins Classification

problème de classification. Nous allons utiliser l’algorithme des k-plus proches

voisins afin de réaliser notre classification.

b. Analyse des données

 Renommons les variables avec utilisant la commande names

 Afficher les premières lignes de la base de données

et 97 objets de Types Rocher(R)

 Combien de caractéristiques descriptives ? De quels types ?

Nous avons 61 caractéristiques descriptives

La dernière s’appelle OBJET et sont type est objet

 Combien d’exemples de chaque classe ?

 Comment sont organisés les exemples ?

Création du model avec la fonction from sklearn.model_selection import

train_test_split qui fonction a l’avantage de randomiser l’ensemble avant de faire

le split, ce qui est très important avec la base des Sonars.

Après la création du model nous allons mesurer sa précision du modèle en

utilisant la fonction score.

Score obtenue en test ? 0.833333…………….

Affichage des labels et des predictions

Affichage de la matrice de confusion

e. Jouer avec le paramètre k

correspondant et afficher ca sous forme de courbe

on perd la précision alors le score devient de plus en plus faible

III. TP 2 : La régression linéaire

L’objectif de ce travail consiste à déterminer si lors d'un combat, un Pokémon

a de grandes chances de gagner. Comme nous disposons de données

d'apprentissage, nous sommes donc dans un cas de Machine Learning dit

"supervisé". C'est-à -dire que la machine va apprendre en fonction de ce qu'on

lui fournit en entrée. Dans ce fait, nous devons prédire le pourcentage de

l’algorithme de régression que nous avons découverts dans le cours.

b. Analyse des données

c. Séparation des données en bases d’apprentissage et de test

Vous aimerez peut-être aussi