Académique Documents
Professionnel Documents
Culture Documents
Département d’informatique
IFT 599 / IFT 799 – Science des données
Plan d’activité pédagogique
Automne 2020
Enseignant
Shengrui Wang
Courriel : shengrui.wang@usherbrooke.ca
Local : D4-1018-1
Téléphone : +1 819 821-8000 x62022
Disponibilités : Périodes de consultation : mardi 14 h-15 h ; jeudi 15 h-16 h
Responsable(s) : Direction du département
Horaire
Exposé magistral : Mardi 15h30 à 16h20 salle D2-1060
Jeudi 13h00 à 14h50 salle D2-1060
1 https://www.usherbrooke.ca/admission/fiches-cours/ift599
25 mars 2022 1
Plan d’activité pédagogique IFT 599 / IFT 799 – Science des données Automne 2020
1 Présentation
Cette section présente les cibles de formation spécifiques et le contenu détaillé de l’activité pédagogique. Cette section,
non modifiable sans l’approbation du comité de programme du Département d’informatique, constitue la version
officielle.
25 mars 2022 2
Plan d’activité pédagogique IFT 599 / IFT 799 – Science des données Automne 2020
Nbr.
Thème Contenu Objectifs Travaux Lectures
d’heures
Concepts de base : Processus d’extraction des connaissances
dans les bases de données ; Prétraitement des données ;
Mesures de similarités ; Techniques de réduction de la [5]
1 dimension (ACP : Analyse de composantes principales) ; 8 1 et 5 4
Techniques de sélection d’attributs ; Concepts de base pour la [6] chapitres 1 et 2
détection des anomalies ; Visualisation ; Introduction de Weka
(progiciel d’analyse des données).
Analyse d’association et analyse des séquences : Introduction
aux données transactionnelles ; Principe de l’algorithme
[5]
Apriori et, si le temps permet, l’algorithme FP-growth ;
2 8 3 4
Recherche et extraction des règles d’associations ; Extraction et
[6] chapitres 5 et 6
utilisation des patrons significatifs pour l’analyse des
séquences.
Inférence statistique : Procédures statistiques fondamentales ;
Estimation des paramètres d’un modèle ; Tests des hypothèses
3 4 1 et 2 [5]
liées aux caractéristiques structurelles d’un modèle ; Intervalle
de confiance pour les paramètres de modèle.
Clustering (méthodes de base) : Clustering par partition et
[5]
hiérarchique ; Clustering basé sur la densité ; Clustering des
4 6 4 et 5
données catégoriques et transactionnelles ; Validation des
[6] chapitre 7
résultats de clustering.
[5]
[7]
Systèmes de recommandation : Principes et éléments de bases ;
Principe des algorithmes basés sur le contenu ; Approches [5]
6 basées sur le filtrage collaboratif ; Méthodes basées sur la 6 5 et 8 4
ressemblance directe ; Méthodes basées sur la sémantique [3]
latente.
[5]
Web mining : Principes et éléments de bases ; Algorithmes de
7 classement des pages Web (HITS et 2 7 [2]
PageRank) ; Extraction des communautés dans le Web.
[4]
1. Le cours doit comprendre au moins quatre travaux pratiques couvrant tous les sujets marqués «4» dans le tableau.
2. Les lectures indiquées ne sont là qu’à titre indicatif. L’enseignant est libre de choisir un autre document de référence.
25 mars 2022 3
Plan d’activité pédagogique IFT 599 / IFT 799 – Science des données Automne 2020
2 Organisation
Cette section propre à l’approche pédagogique de chaque enseignante ou enseignant présente la méthode pédagogique, le calendrier,
le barème et la procédure d’évaluation ainsi que l’échéancier des travaux. Cette section doit être cohérente avec le contenu de la
section précédente.
2.2 Calendrier
2.3 Évaluation
Travaux pratiques (4) 30 %
Examen intra 30 %
Examen final 40 %
2.3.2 Plagiat
Le plagiat consiste à utiliser des résultats obtenus par d’autres personnes afin de les faire passer pour sien et dans le dessein de
tromper l’enseignante ou l’enseignant. Vous trouverez en annexe un document d’information relatif à l’intégrité intellectuelle qui
fait état de l’article 9.4.1 du Règlement des études3 . Lors de la correction de tout travail individuel ou de groupe une attention
2 https://www.usherbrooke.ca/sciences/fileadmin/sites/sciences/Etudiants_actuels/Informations_academiques_et_reglements/2017-10-
27_Reglement_facultaire_-_evaluation_des_apprentissages.pdf
3 https://www.usherbrooke.ca/registraire/droits-et-responsabilites/reglement-des-etudes/
25 mars 2022 4
Plan d’activité pédagogique IFT 599 / IFT 799 – Science des données Automne 2020
spéciale sera portée au plagiat. Si une preuve de plagiat est attestée, elle sera traitée en conformité, entre autres, avec l’article 9.4.1
du Règlement des études de l’Université de Sherbrooke. L’étudiante ou l’étudiant peut s’exposer à de graves sanctions qui peuvent
être soit l’attribution de la note E ou de la note zéro (0) pour un travail, un examen ou une activité évaluée, soit de reprendre
un travail, un examen ou une activité pédagogique. Tout travail suspecté de plagiat sera transmis au Secrétaire de la Faculté des
sciences. Ceci n’indique pas que vous n’ayez pas le droit de coopérer entre deux équipes, tant que la rédaction finale des documents
et la création du programme restent le fait de votre équipe. En cas de doute de plagiat, l’enseignante ou l’enseignant peut demander
à l’équipe d’expliquer les notions ou le fonctionnement du code qu’elle ou qu’il considère comme étant plagié. En cas d’incertitude,
ne pas hésiter à demander conseil et assistance à l’enseignante ou l’enseignant afin d’éviter toute situation délicate par la suite.
Un délai de plus de 24 heures est possible pour que je réponde aux questions posées par courriel. Il est fortement conseillé de
profiter des périodes de consultations pour poser des questions. La consultation peut se faire à distance, par exemple en utilisant
Teams.
4 Références
[1] B OUGUESSA , M OHAMED AND WANG , S HENGRUI : Mining Projected Clusters in High-Dimensional Spaces. IEEE Transac-
tions on Knowledge and Data Engineering, 21(4):507–522, apr 2009.
[2] B RIN , S ERGEY AND PAGE , L AWRENCE : The Anatomy of a Large-scale Hypertextual Web Search Engine. Computer
networks and ISDN Systems, 30(1-7):107–117, apr 1998.
[3] D ESROSIERS , C HRISTIANAND K ARYPIS , G EORGE : A Comprehensive Survey of Neighborhood-based Recommendation
Methods, pages 107–144. Springer US, Boston, MA, 2011.
[4] K LEINBERG , J ON M. : Authoritative Sources in a Hyperlinked Environment. Journal of the ACM, 46(5):604–632, sep 1999.
[5] S HENGRUI WANG : Acétates du cours et des documents supplémentaires . Répertoire public du DI, 2019.
[6] TAN , PANG -N ING AND S TEINBACH , M ICHAEL AND K UMAR , V IPIN : Introduction to Data Mining, (Second Edition).
Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA, 2018. Ce livre contient plus que 65% de la matière du cours
(thèmes : 1, 2, 3 et 4). Voir le site web du livrehttp://www-users.cs.umn.edu/~kumar/dmbook/index.php.
[7] W U , S HU AND WANG , S HENGRUI : Information-theoretic outlier detection for large-scale categorical data. IEEE transactions
on knowledge and data engineering, 25(3):589–602, 2013.
4 https://www.usherbrooke.ca/sciences/fileadmin/sites/sciences/documents/Intranet/Informations_academiques/Sciences_Reglement_complementaire_2017-
05-09.pdf
5 https://www.usherbrooke.ca/registraire/droits-et-responsabilites/reglement-des-etudes/
25 mars 2022 5
Plan d’activité pédagogique IFT 599 / IFT 799 – Science des données Automne 2020
25 mars 2022 6