Vous êtes sur la page 1sur 3

Universit Catholique de Louvain - DESCRIPTIF DE COURS 2016-2017 - LSTAT2110

LSTAT2110
Analyse des donnes
2016-2017

5.0 crdits 22.5 h + 7.5 h 1q

Enseignants: Segers Johan ;

Langue
Franais
d'enseignement:

Lieu du cours Louvain-la-Neuve

Thmes abords : - Rappels d'algbre et de gomtrie utiles l'analyse des donnes.. - Principes de base des mthodes factorielles. - Analyse en
composantes principales et ses variations. - Analys edes corrlations canoniques. - Analyse factorielle discriminante. - Analyse
factorielle des correspondances. - Introduction aux mthodes de classification. - L'analyse des donnes, en pratique.

Acquis A. Eu gard au rfrentiel AA du programme de master en statistique, orientation gnrale, cette activit contribue au
dveloppement et l'acquisition des AA suivants, de manire prioritaire : 1.1, 1.3, 2.2, 3.3
d'apprentissage Eu gard au rfrentiel AA du programme de master en statistique, orientation biostatistique, cette activit contribue au
dveloppement et l'acquisition des AA suivants, de manire prioritaire : 1.1, 1.3, 2.2, 3.3
B. Objectifs gnraux: Prsenter les techniques modernes de l'analyse de grands ensemble de donnes et dvelopper les outils
de base du " data mining ". Objectifs spcifiques: A l'issue de ce cours, les tudiants doivent tre capables de : - Traiter et dcrire
l'information contenue dans des grands ensemble de donnes ; - Comprendre les mcanismes qui justifient l'emploi de telle ou
telle mthode ; - Interprter correctement les graphiques et rsultats fournis par les logiciels ; - Rsoudre des problmes avec
donnes relles.
La contribution de cette UE au dveloppement et la matrise des comptences et acquis du (des) programme(s) est accessible
la fin de cette fiche, dans la partie Programmes/formations proposant cette unit denseignement (UE) .

Contenu : Contenu
- Rappels d'algbre et de gomtrie.
- Principes de base des mthodes factorielles.
- Analyse en composantes principales et ses variations.
- Analyse de corrlations canoniques.
- Analyse factorielle discriminante.
- Analyse factorielle des correspondances.
- Introduction aux mthodes de classification.
- L'analyse des donnes, en pratique.

Mthodes
Le cours comprend des exposs magistraux et un travail sur ordinateur faire individuellement.

UCL - LSTAT2110 - page 1/3


Universit Catholique de Louvain - DESCRIPTIF DE COURS 2016-2017 - LSTAT2110

Autres infos : Pr-requis:


L'tudiant doit tre capable de
- manipuler et lire les expressions algbriques (calcul matriciel) ;
- comprendre et dominer les lments de base de l'analyse statistique.

Evaluation
L'valuation se fait :
1) par un travail sur donnes relles selon les modalits qui seront prcises ci-dessous. Il s'agit de mettre en oeuvre certaines des
mthodes vues au cours dans un domaine d'application choisi par l'tudiant. Pour permettre aux tudiants de raliser ce travail
dans les meilleures conditions, le cours magistral sera concentr sur10 semaines. Les tudiant travaillent, en principe, par paire.
L'assistant du cours encadrera les tudiants pour ce travail (mise au courant du logiciel). Ce travail devrait prendre environ 12
heures de travail PAR tudiant (soit 24 h. pour la paire).
2) Par un examen crit livre ferm: il s'agira ici de voir si l'tudiant matrise les concepts abords au cours, s'il comprend les
mthodes utilises (questions d'ordre gnral mais aussi commentaires sur des expressions matricielles importantes) et s'il peut
interprter correctement des rsultats obtenus par les logiciels (du type de ceux prsents dans le syllabus).

Modalits du projet:

Pour ceux qui le dsirent, deux (ou trois) sances d'initiation SPADN seront organises par l'assistant du cours selon un horaire
prciser.
L'assistant encadrera galement les tudiants pour le projet. Attention : il s'agit uniquement des aides pour l'utilisation du logiciel
ou donner quelques conseils ponctuels d'ordre gnral. Ce projet reste VOTRE projet.

Ce projet est un travail sur donnes relles. Il s'agit de mettre en oeuvre certaines des mthodes vues au cours dans un domaine
d'application choisi par l'tudiant. Il faut que ce projet contienne au moins une ACP et une AFC (simple ou multiple). Si possible, le
mme ensemble de donnes sera analys par ces deux types de mthodes (l'AFCM est possible sur la plupart des ensembles de
donnes). Souvent, une analyse de classification apporte un regard complmentaire utile sur les donnes analyses (confirmation
ou non de goupes d'individus similaires, d'outliers,
). Le cas chant, il est toujours utile de dcrire les caractristiques des diffrents " clusters " obtenus.

Le projet fera l'objet d'un bref rapport prsentant de faon claire et concise:

1 l'objet de l'analyse
2 la description des donnes (units utilises, etc...)
3 l'analyse proprement dite
4 les commentaires sur les rsultats obtenus.

Ce rapport ne devrait pas dpasser 7 10 pages (des rsultats peuvent tre mis en annexe). Le projet sera jug selon les critres
suivants:

1 Adquation des mthodes utilises aux donnes et problme tudis.


2 Originalit et intrt du problme.
3 Richesse des analyses proposes (au del du minimum requis).
4 Justesse des commentaires sur les rsultats.
5 Qualit de la prsentation du rapport.

Support
Syllabus de L.SIMAR (2004) : " Multivariate Data Analysis", 256 pages, Institu de Statistqiue, UCL.

Ce manuel est disponible la DUC.

Encadrement
Titulaire : Lopold Simar, tl : 010/47 43 08, simar@stat.ucl.ac.be

Ouvrages de rfrence
Lebart, L., Morineau, A. et J.P. Fenelon (1982) : Traitement des donnes statistiques. Dunod, Paris.
Saporta, G. (1990) : Probabilits, analyse des donnes et statistiques. Ed. Tecnip, Paris.
Romeder, J.M. (1973) : Mthodes et programmes d'analyse discriminante. Dunod, Paris

Facult ou entit en LSBA

charge:

UCL - LSTAT2110 - page 2/3


Universit Catholique de Louvain - DESCRIPTIF DE COURS 2016-2017 - LSTAT2110

Programmes / formations proposant cette unit d'enseignement (UE)

Intitul du programme Sigle Crdits Prrequis Acquis d'apprentissage

Master [120] en sciences


conomiques, orientation ECON2M 5 -

gnrale

Master [120] en statistiques,


STAT2M 5 -
orientation gnrale

Master [120] : ingnieur civil


GBIO2M 5 -
biomdical

Master [120] en sciences


MATH2M 5 -
mathmatiques

Master [120] en statistiques,


BSTA2M 5 -
orientation biostatistique

Master [120] : ingnieur civil en


MAP2M 5 -
mathmatiques appliques

Certificat d'universit :
STAT2FC 5 -
Statistique (15/30 crdits)

UCL - LSTAT2110 - page 3/3