Vous êtes sur la page 1sur 18

[1]

REPUBLIQUE DEMOCRATIQUE DU CONGO


ENSEIGNEMENT SUPERIEUR ET UNIVERSITAIRE
UNIVERSITE DE L’ASSOMPTION AU CONGO
« U.A.C »
Site : www.uaconline.org
E-mail : uacuniversite2018@gmail.com

B.P. : 104 BUTEMBO/Nord-Kivu

FACULTÉ DES SCIENCES ÉCONOMIQUES ET DE GESTION


DÉPARTEMENT D’INFORMATIQUE DE GESTION

TRAVAIL PRATIQUE DU COURS DE PROGRAMMATION


AVANCEE

Par : KASEREKA Justin

Enseignant : Nsenge Mpia Héritier, aa.

ANNEE ACADEMIQUE : 2020-2021


[2]

0. INTRODUCTION

Le machine learning est un domaine captivant. Issu de nombreuses disciplines comme


les statistiques, l’optimisation, l’algorithmique ou le traitement du signal, c’est un champ
d’études en mutation constante qui s’est maintenant imposé dans notre société. Déjà utilisé
depuis des décennies dans la reconnaissance automatique de caractères ou les filtres anti-spam,
il sert maintenant à protéger contre la fraude bancaire, recommander des livres, films, ou autres
produits adaptés à nos goûts, identifier les visages dans le viseur de notre appareil photo, ou
traduire automatiquement des textes d’une langue vers une autre. 1

Cependant, dans le cadre du cours de programmation avancée, il nous a été demandée


de faire une étude des différents types d’algorithmes d’apprentissage supervisé et de faire une
analyse exploratoire de données en créant un modèle de type classification avec soit l’arbre de
décision soit avec le réseau de neurones multicouches.

En effet, nous avons jugés mieux d’analyser nos données avec le type classification pour
nous permettre d’optimiser la performance de nos données.

1. ANALYSE DES DIFFRENTS ALGORITHMES D’APPRENTISSAGE


SUPERVISE

En partant des différentes définition, l’apprentissage supervisé est le type de problèmes


de machine learning le plus facile à appréhender : son but est d’apprendre à faire des prédictions,
à partir d’une liste d’exemples étiquetés, c’est-à-dire accompagnés de la valeur à prédire. Les
étiquettes servent de « professeur » et supervisent l’apprentissage de l’algorithme.2

Parmi les différents algorithmes qui existent nous nous sommes intéressées par les
algorithmes ci-après :

➢ Le réseau de neurones artificiels


➢ Le clustering par décalage moyen

1
Chloé-Agathe Azencott, Introduction aux Machine learning, Dunod, Paris, 2017, P.1
2
Idem P.4
[3]

CHAPITRE I. RESEAUX DE NEURONES ARTIFICIELS


INTRODUCTION
Dans ce chapitre nous allons parler d’une manière brève comment fonctionne les réseaux
de neurones artificiels et les principes de base d’une classe particulière de réseaux de neurones.
I.1. Le réseau de neurones
Les réseaux de neurones artificiels ne sont au fond rien d’autre que des modèles paramétriques,
potentiellement complexes : contrairement à la régression linéaire, ils permettent de construire
facilement des modèles très flexibles.
I.2. Le perceptron
Le perceptron est formé d’une couche d’entrée de p neurones, ou unités, correspondant
chacune à une variable d’entrée. Ces neurones transmettent la valeur de leur entrée à la couche
suivante. A ces p neurones on rajoute généralement une unité de biais, qui transmette toujours
la valeur 1. La première et unique couche du perceptron après la couche d’entrée contient un
seul neurone au quel sont connectées toutes les unités de la couche d’entrée. Ce neurone calcule
une combinaison linéaire o(~x) = w0 + Pp j=1 wjxj des signaux X1, X2, . . ., Xp qu’il reçoit en
entrée, auquel il applique une fonction d’activation a, dont il transmet en sortie le résultat. Cette
sortie met en œuvre la fonction de décision du perceptron. Ainsi, si l’on appelle wj le poids de
connexion entre l’unité d’entrée j et le neurone de sortie.
I.3. L’architecture de perceptron

Figure 1: le perceptron
[4]

CHAPITRE II. LE CLUSTERING PAR DECALAGE MOYEN


0.II. INTRODUCTION
Dans ce chapitre nous allons définir le clustering et comment cet algorithme fonctionne.
II.1. Analyse de clustering
Signalons que le clustering regroupement des objets en clusters. Un cluster : une collection d’objets
similaires au sein d’un même cluster.
Le clustering par décalage moyen est un algorithme basé sur une fenêtre glissante qui
tente de trouver des zones denses de points de données. C’est un algorithme basé sur un
centroïde, ce qui signifie que l’objectif est de localiser les points centraux de chaque groupe et
classe, ce qui fonctionne en mettant à jour les candidats pour que les points centraux soient la
moyenne des points dans la fenêtre glissante. Ces fenêtres candidates sont ensuite filtrées dans
une étape de post-traitement pour éliminer les quasi-doublons, formant ainsi le dernier ensemble
de points centraux et leurs groupes correspondants. Consultez le graphique ci-dessous pour une
illustration.3

3
http://www.m2p-bioinfo.ups-tlse.fr/site/images/8/89/Data_Mining_-_Clustering.pdf consulter le 27/05/2021
à 16h46
[5]

CHAPITRE III. ANALYSE EXPLORATOIRE DES DONNEES

Notre analyse a porté sur l’ensemble de données de prévision des accidents vasculaires
cérébraux. Selon l'Organisation mondiale de la santé (OMS), l'AVC est la deuxième cause de
décès dans le monde, responsable d'environ 11% du nombre total de décès. Cet ensemble de
données est utilisé pour prédire si un patient est susceptible d'avoir un accident vasculaire
cérébral en fonction des paramètres d'entrée tels que le sexe, l'âge, diverses maladies et le
tabagisme. Chaque ligne des données fournit des informations pertinentes sur le patient.
III.1. Importation de données
Ce bout des codes nous permet d’importer et de visualiser notre DataSet dans jupyter.
[6]
[7]
[8]
[9]

Ici nous faisons la technique de pré élagage pour nous permettre


[10]
[11]
[12]
[13]
[14]

Ici nous importons notre model déjà prédit


[15]

Cette figure nous montre l’interface de notre application


[16]

Voici les resultats


[17]

CONCLUSION
Nous voici au terme de notre travail pratique dont ce ci à porter sur la comparaison des
différents algorithmes et l’analyse de données. En effet, nous avons étudier la prédiction de
prévision des accidents vasculaires cérébraux. Nous avons testé et entrainer notre model dont
les résultats sont ci-haut.
[18]

BIBLIOGRAPHIE
1. Chloé-Agathe A, Introduction aux Machine learning, Dunod, Paris, 2017.
2. http://www.m2p-bioinfo.ups-tlse.fr/site/images/8/89/Data_Mining_-_Clustering.pdf

Vous aimerez peut-être aussi