Vous êtes sur la page 1sur 4

Syllabus STNUM

Les statistiques, un outil indispensable pour les ingénieurs


Les méthodes statistiques, ou de manière plus moderne la data science, sont largement
répandues dans presque tous les secteurs de l’activité de l’ingénieur (le contrôle de qualité, la
fiabilité, l’analyse des résultats de mesure, la prévision et la planification…). Les élève, quel
que soit leur département ou spécialisation, devront être en mesure d’appréhender le potentiel
des données et les méthodes associés.
Le cours STNUM (STatistiques NUMériques et analyse de données) vise précisément à doter
les élèves des outils de base en statistique leur permettant d'analyser et/ou de modéliser les
données auxquelles ils seront confrontés dans le cadre de leur vie professionnelle.

Département Exemples d’application


GCC Modélisation du comportement thermique du bâtiment.
Analyse de risque des ouvrages.
GI Optimisation des circuits logistiques.
GMM Modélisation du comportement de matériaux complexes (céramique).
Calculs de simulation moléculaire.
VET Traitement des données de transport et d’hydrométrie.

Objectifs pédagogiques
A la fin du module, chaque élève sera en mesure de :
• Décrire un jeu de données uni ou multi-dimensionnel à l'aide de techniques de
statistique descriptive.
• Savoir mener et interpréter des tests statistiques.
• Comprendre et mettre en œuvre un modèle de régression (régression linéaire) ou de
classification supervisée (régression logistique).
Les méthodes seront mises en œuvre sur des jeux de données réels, à l'aide des logiciels
Python ou R, dans le cadre de travaux pratiques et d'un projet sur un jeu de données réel.

Une pédagogie hybride


Afin de prendre en compte les provenances différenciées des élèves, et dans l’idée d’accroitre
l’autonomie de tous, le cours de STNUM a adopté un format hybride :
• Des documents de cours (vidéos, supports écrits et exemples sous Python et R) à
consulter en autonomie.
• Des QCM d’auto-évaluations permettant de mesurer sa compréhension des principaux
concepts de cours.
• Des TP, par binôme, pour une première mise en pratique.
• Un projet sur données réelles, par groupe de 5 élèves, pour mener un cas d’étude
complet.
Langue de travail
Le français est la langue de travail (supports et interactions en cours).
L’anglais est accepté pour les rendus (TP et projet).

Séquençage du cours
• Rappels : Statistiques descriptives, univariées et bivariées.
• Rappels : Analyse factorielle (ACP et ACM).
• Rappels : Clustering.
• Rappels : Probabilités.

• Séquence 1 : Statistique inférentielle - estimation ponctuelle & intervalle de confiance.


• Séquence 2 : Statistique inférentielle - tests statistiques.
• Séquence 3 : Régression linéaire - simple.
• Séquence 4 : Régression linéaire - multiple.
• Séquence 5 : Régression linéaire – en pratique.
• Séquence 6 : Régression logistique.
• Séquence 7 : Analyse de la variance.
• Séquence 8 : Régression régularisée.

Acquisition des concepts


Afin d’appréhender les notions de cours, il faudra de manière autonome :
• Visionner les vidéos en ligne.
• Lire le polycopié.
• Lire les exemples.
• Réaliser les QCM.
Les ressources sont accessibles sur : https://educnet.enpc.fr/course/info.php?id=1391
Les cours de statistiques descriptives, d’analyse exploratoire (analyse factorielle & clustering)
et de probabilités sont supposés acquis, des ressources supplémentaires sont néanmoins à
disposition, et une séance complémentaire, facultative, sera également proposée.

Travaux pratiques
Les trois travaux pratiques (TP), réalisés par binôme (invariant) au sein de la même petite
classe (PC), porteront sur :
1. La statistique inférentielle.
2. La régression linéaire.
3. La régression logistique et la régression régularisée.
Les TP seront envoyés au responsable de PC, au format pdf (avec les noms des élèves).

Projet
Chaque groupe de projet, constitué de 5 élèves au sein de la même PC, devra :
• Choisir un jeu de données (potentiellement en lien avec la spécialité) et déterminer une
problématique.
• Mettre en œuvre les techniques vues dans le cours sur ce jeu de données : description,
analyse exploratoire et prévision.
• Rédiger un rapport technique présentant la démarche et les résultats obtenus.
• Réaliser une présentation « exécutive » dans une soutenance courte (10 minutes).
Le rapport technique et la présentation seront envoyés au responsable de PC, au format pdf
(avec les noms des élèves).

Charge de travail
La charge de travail estimée pour le cours est détaillée dans le tableau suivant :

Contenu Vidéos Supports écrits Codes QCM TP


Séquence 1 45 mn 60 mn 30 mn 15 mn
200 mn
Séquence 2 45 mn 60 mn 30 mn 15 mn
Séquence 3 45 mn 60 mn 30 mn 15 mn
Séquence 4 45 mn 60 mn 30 mn 15 mn 200 mn
Séquence 5 45 mn 60 mn 30 mn 15 mn
Séquence 6 45 mn 60 mn 30 mn 15 mn
Séquence 7 45 mn 60 mn 30 mn 15 mn 200 mn
Séquence 8 45 mn 60 mn 30 mn 15 mn
Total 360 mn 480 mn 240 mn 120 mn 600 mn

La charge de travail estimée pour le projet est de 25h (pour chacun des 5 élèves du groupe).

Interactions élèves – responsables de petite classe


Les responsables de petites classes (PC) sont :

PC Responsables Mail
1 Oussama BELMEJDOUB oussama.belmejdoub@enpc.fr
2 Marine DUMON marine.dumon@enpc.fr
3 Romain JORGE DO MARCO romain.jorge-do-marco@enpc.fr
4 Mathieu TRUC mathieu.truc@enpc.fr
5 Vincent LEFIEUX (responsable) vincent.lefieux@enpc.fr
6 Valentin CADORET valentin.cadoret@enpc.fr
7 Faten BEN SAID faten.ben-said@enpc.fr

Après une présentation collective du cours effectuée par le responsable du module, il y aura
6 séances de 2h en présentiel, consacrées aux questions de cours, aux TP et au projet.
Attention, la présence est obligatoire. Chaque absence non justifiée pénalisera la moyenne
générale de 0.5 point. Il est toujours possible d’échanger à distance (via mail et/ou visio) avec
le responsable de PC.

Évaluation
Poids Objectif
QCM 10% Vérifier la compréhension des concepts.
TP 40% Mettre en application les concepts dans des problèmes simplifiés.
Projet Oral : 10% Mettre en application les concepts vus dans le cours dans un cas
Écrit : 40% d’étude réaliste.
Attention, pour valider le module, tous les QCM et TP devront être réalisés, et le projet rendu.
Chaque QCM non effectué à temps pénalisera la moyenne générale de 0.5 point.
Les responsables de PC communiqueront par mail les remarques et la note attribuée, aux
dates indiquées dans le calendrier :

Calendrier du module
Semaine Séances Rendus QCM et TP Rendus projet Retours travaux
25/09 29/09 13h-15h (amphi)
01/10
02/10 Groupes 5-6 : 13h-15h
Rappels
08/10 Groupes 1-4 & 7 : autonomie
09/10 Groupes 5-6 : autonomie
15/10 Groupes 1-4 & 7 : 13h-15h
16/10 Semaine en autonomie 22/10 QCM 1
22/10
23/10 27/10 13h-15h (TP 1) 29/10 QCM 2 29/10 Choix
29/10
30/10
05/11
06/11 Semaine en autonomie 12/11 TP 1
12/11 12/11 QCM 3 et 4
13/11 17/11 13h-15h (TP 2) 19/11 QCM 5 19/11 TP 1
19/11
20/11
26/11
27/11 Semaine en autonomie 03/12 QCM 6
03/12
04/12
10/12
11/12 15/12 13h-15h (projets) 11/12 TP 2
17/12 17/12 QCM 7
18/12 Semaine en autonomie 24/12 QCM 8 23/12 TP 2
24/12
25/12
31/12
01/01
07/01
08/01 12/01 13h-15h (projets)
14/01
15/01 Semaine en autonomie
21/01
22/01 26/01 12h-15h 26/01 Soutenance
28/01 28/01 Rapport

Les salles de cours sont accessibles sur : https://emploidutemps.enpc.fr/

Vous aimerez peut-être aussi