Vous êtes sur la page 1sur 2

1

EXAMEN Deuxième SESSION 2021 – 2022


COURS DE GESTION D’INFOCENTRE
L2 INFORMATIQUE DE GESTION / MENTION MATHS, STAT & INFO / FAC. DES
SCIENCES ET TECHNOLOGIES/ UNIKIN

Nom : ……………………………………………………….…………….…..……….
Post-nom : ………………………………………………..……….…………..….….……..
Prénom : ……………………………………………………….………………..….…….
Nota :
 L’examen est à documents ouverts (notes manuscrites (pas de photocopies), les livres
imprimés, et les notes de cours imprimées), et dure 2h30 heures ;
 L’ordinateur et le téléphone ne sont pas autorisés, juste la calculatrice classique.
Pas de calculatrice incorporée dans l’ordinateur ou dans le téléphone.

QUESTION I : QUESTIONS théoriques -- 1 (4 POINTS)


(1.1) Définir le terme « Big Data » en mettant en évidence les 5V dans ladite définition.
(1.2) Qu'est-ce qui différencie la classification et le classement ?
(1.3) Définir (mathématiquement) une distance ou une métrique. Expliquez pourquoi cela est
important dans l’apprentissage non supervisé.
(1.4) En tant que Data Scientist, pourquoi préférons-nous le langage de programmation
Python (ou R) aux autres langages de programmation ?

QUESTION II : QUESTIONS théoriques -- 2 (4 POINTS)


Cocher par X, pour chaque méthode ou algorithme, à quel(s) problème(s) il correspond :
Méthodes ou algorithmes Apprentissage Classement Régression
non supervisé (apprentissage (apprentissage
supervisé) supervisé)
Régression logistique
Perceptron multicouche
Analyse en composantes principales
Méthode de 𝑘-means
Réseaux de Bayes
OPTICS
Classification Ascendante Hiérarchique
Machines à vecteurs de support
Nota : Chaque ligne compte pour 0,5 points. Une ligne peut contenir une ou plusieurs cases à
cocher. Si une bonne case est cochée parmi plusieurs, elle vaut une fraction des points sur 0,5.
Si une mauvaise case est cochée, toute la ligne est annulée. Cette approche vise à décourager
le fait de cocher toutes les cases, car ça assurerait à 100% que la réponse soit cochée.
2

QUESTION III: ENTREPOT DES Données MACHINE LEARNING (12


POINTS)
Une banque, Gradi & Gloria Banking S.A., souhaite prédire quels clients sont crédibles pour
l'octroi d'un crédit. Voici les questions auxquelles ils veulent répondre : Combien de nouveaux
clients ont rejoint la banque au cours du dernier trimestre ? Combien de clients ont rejoint en
tout ? Quel est le profil des clients crédibles, des clients non crédibles et des clients en attente
de décision ? Ces profils diffèrent-ils ? Quels sont les principaux facteurs qui déterminent la
crédibilité d'un client ? La banque perd-elle des clients à forte solvabilité ? Si oui, comment
peut-elle les fidéliser ?
Voici les informations dont on met à la disposition de l’analyste :
 Informations sur les clients : prénom, nom, sexe, adresse, date d'ouverture de compte,
catégorie de revenu.
 Informations sur l'historique de crédit : montant du prêt demandé, durée du prêt, nombre de
remboursements tardifs, historique de paiement.
 Informations sur la situation financière : revenu mensuel, dépenses mensuelles, épargne
mensuelle, dettes existantes.
 Informations sur l'emploi : type d'emploi, revenu annuel, stabilité de l'emploi.
 Informations sur les actifs : propriété, véhicule, autres biens.
Pour répondre à ces questions, voici les étapes proposées [Répondre donc à ces questions]:
(3.1) Construire un modèle multidimensionnel en flocon relatif à ce problème.
(3.2) Sélectionner soigneusement 5 variables pertinentes parmi celles mentionnées et créer un
jeu de données avec 6 individus.
(3.3) Quel est le nombre optimal de clusters pour ce dataset (en utilisant la méthode de
coude)?
(3.4) Utiliser l'algorithme k-means pour regrouper les individus en différents clusters.
(3.5) Utiliser l'algorithme des 𝑘 = 3 plus proches voisins pour classer l'individu ayant les
coordonnées (42, 30.3, 0, 5, 6.2) selon les variables choisies.
(3.6) Utiliser Python ou R pour écrire le code permettant de prédire la classe de l'individu de
la question précédente en utilisant les réseaux de neurones.

Bon travail !
Prof. Pierre Kafunda Katalay, PhD.
Asst. Gradi L. Kamingu, M.Sc.

Prénom, NOM, POST-NOM:

……………………………………………………………………………………………

Vous aimerez peut-être aussi