Vous êtes sur la page 1sur 5

Université de Sousse Epreuve : Big Data et Data Mining

Filière : Master Pro DRC-M1


Responsable du cours : Ben Slimane Karima
Année universitaire : 2021/2022
Durée : 2 heures
Institut des Hautes Etudes Commerciales de Nombre de pages : 4 pages
Sousse Session : Mai 2022

Questions

1. Mots clés : problèmes de stockage et de traitement, upsizing, paralléliser le stockage et


le traitement, Mapreduce, technologies.
2. Afin de mettre en place une infrastructure de Big Data, une entreprise doit
impérativement choisir une architecture « lac de données » pour stocker et traiter
l’ensemble de ses données. Donner votre avis sur cette idée en argumentant.

Exercice 1

3. Pour un opérateur de télécommunications Beta , l’expert en charge d’élaborer un


modèle pour prédire le taux de désabonnement, vous communique certaines
informations en relation avec le modèle KNN.
En se basant sur le graphique 1 et/ou graphique 2 déterminer le nombre de voisin
approprié à retenir par l’expert dans son analyse tout en justifiant votre réponse.
Uniquement accuracy → K=11
4. En vous basant sur l’accuracy, la précision et le rappel déterminer le modèle le plus
performant pour prédire le taux de désabonnement. Rappelons que 𝐴𝑐𝑐𝑢𝑟𝑎𝑐𝑦 =
𝑇𝑁+𝑇𝑃 𝑇𝑁+𝑇𝑃 𝑇𝑃 𝑇𝑃
= ; 𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑇𝑃+𝐹𝑁 et que 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛 = 𝑇𝑃+𝐹𝑃.
𝑇𝑁+𝑇𝑃+𝐹𝑃+𝐹𝑁 𝑇𝑜𝑡𝑎𝑙

Accuracy Précisionl Rappel

KNN 0,8253 0,7145 0,5732

AD 0,8563 0,7927 0,5961

SVM 0,8943 0,8074 0,7922

1
Exercice 2

Un magasin de grande distribution cherche à mettre en place plusieurs règles d’association


qui lui permettrons de mettre en place des offres de promotions à leurs clients. Afin de bien
comprendre les étapes de l’élaboration des règles d’association, le responsable marketing
met à votre disposition une base de données possédant cinq transactions :

Id client liste des items


C100 M, O, N, K, E, Y
C200 D, O, N, K, E,
C300 M, A, K, E
C400 M, U, C, K, Y

C500 C, O, K, I, E

En supposant que le support minimum est de 60% et que la confiance minimale est de 80%,
déterminer les règles d’association à deux items à retenir en appliquant l’algorithme Apriori.

nb Supp nb Supp

A 1 0,2 EK 4 0,8

C 2 0,4 EM 2 0,4

D 1 0,2 EO 3 0,6

E 4 0,8 KM 2 0,4

I 1 0,2 KO 3 0,6

K 5 1 MO 1 0,2

M 3 0,6

N 2 0,4 nb Supp

O 3 0,6 EKO 3 0,6

U 1 0,2

2
Y 2 0,4

25

3
4
Graphique 1 Graphique 2
1 40
0.8 30
Accuracy

RMSE
0.6
20
0.4
0.2 10

0 0
-3 2 7 12 17 0 5 10 15 20
Nombre de Voisins (K)
Nombre de voisins (K)

Tableau 1 Négative 2110 120


Classe réelle
Positive 311 459
Classe Prédite
KNN Négative Positive
Négative 2018 183 Tableau 3
Classe réelle
Positive 341 458
Classe Prédite
SVM Négative Positive
Tableau 2 Négative 2050 151
Classe réelle
Positive 166 633
Classe Prédite
AD Négative Positive

Vous aimerez peut-être aussi