Académique Documents
Professionnel Documents
Culture Documents
Fouille de Donnes
juin 2011
Examen
Dure deux heures, tous documents autoriss, communications interdites
Questions de cours
Question 1.1 : Soit le cycle KDD reprsent sur la gure 1. Illustrez chacune des transitions qui y gure (sous forme d'une che) par un exemple.
Exercice 1 :
Question 1.2 :
t1 t2 t3 t4 t5 t6 t7
Question 1.3 :
Qu'est-ce qu'un intrus ou outlier dans le vocabulaire du clustering ? Comment chacun des algorithmes de clustering vus en cours se comporte-t-il par rapport ces intrus ?
Entrept de donnes
Exercice 2 :
Une entreprise de location de vhicules vous demande de lui concevoir un entrept de donnes, dans le but d'optimiser son fonctionnement et/ou son processus de prise de dcision. Ses souhaits sont relativement vagues, on vous demande donc de l'aider dnir le contenu, les buts et l'architecture de cet entrept de donnes. La compagnie est l'chelle europenne : elle se compose de plusieurs socits nationales. Chaque socit nationale comprend un grand nombre de succursales couvrant chacun des pays. Les clients peuvent rserver un vhicule au guichet, par tlphone, par internet. Les clients peuvent rendre le vhicule dans n'importe laquelle des agences de la marque. Lorsqu'un client rend un vhicule, on connat le nombre de kilomtres qu'il a parcouru, et les ventuels incidents qui ont eu lieu pendant la location (panne, accident. . .). Il existe plusieurs catgories de vhicules. Il existe plusieurs tarifs de location ( la journe, au kilomtre, la semaine . . .) La compagnie a souvent recours des promotions sur ses tarifs. La socit est associe avec des compagnies ariennes et des socits de chemin de fer pour proposer des ores groupes (vol plus location, par exemple). Question 2.1 : Identiez quatre processus d'entreprise que vous pensez pouvoir modliser l'aide des donnes votre disposition. Choisissez un de ces quatre domaines pour approfondir votre analyse et proposition : A quels types de questions votre entrept permettra-t-il de rpondre ?
Question 2.2 :
Examen
Question 2.3 :
Quel sera le fait de base, et sa granularit ? De quel type sera ce fait de base ? Dnir chacune des tables de dimensions. Estimez la taille de cet entrept en fonction de la dimension et de l'activit de
Question 2.4 :
Question 2.5 :
Question 2.6 :
l'entreprise.
Question 2.7 :
Expliquez comment cet entrept sera aliment : source des informations, slection et nettoyage des donnes, protocole d'alimentation de la base.