Vous êtes sur la page 1sur 4

Direction Distribution Centre

Offre de PFE 2022-02/DCD01


Descriptif du PFE

Dans le cadre de l’optimisation de ses stratégies du développement de son réseau


de distribution gaz tout en rentabilisant ses ressources, le Département Etude et
Planification au sein de la Direction Distribution Centre de la STEG entame des études
de planification basées sur l'Intelligence Artificielle à savoir le « Machine Learning »
et le « Deep Learning » :

Sujet: Développement d’un Model de Prevision à long terme (3ans +) du débit


horaire en gaz d’un poste de livraison qui ne dispose pas d’un enregistrement horaire
Objectif du en se basant sur des techniques de classification temporelles et de régression.
stage
CDC: Le sujet proposé est une continuité d’un PFE antécédent élaboré en 2021 et
dont l’article a été accepté par le 5th International Conference on Advanced Systems
and Emergent Technologies (IC_ASET’2022); l’ancien PFE était basé sur des données
de débit horaire journalier s’étalant sur plus que 5 ans, mais la particularité du sujet
actuel et de prévoir à long terme le débit horaire pour un poste ne disposant pas
d’historique. En effet, il s'agit de remonter à ce débit horaire à partir de:

 l’historique des relèves d'index des abonnés gaz (mensuel, trimestriel, etc).
 des données non confidentielles des abonnées gaz.
 des données horaires des autres postes
 répartition géo-spatiale des abonnées
 Etc

Afin de réussir cette taches, l’étudiant sera amené à utilisé des modèles de
classification temporelle. Ces modèles nécessiteront du feature engineering
techniques telque :

 la segmentation des données spatiales et temporelles.


 clustering des abonnées
 génération d’index de développement économiques des zones d’étude
 lagging de l’historique des données météos
 etc.

Notamment, ce sujet peut engendrer des sous-sujets/mini-projets : tels que les


techniques de profilage consommateurs, prédiction du churn rate, prédiction des
coefficients de foisonnement, Identification de consommation anormales, etc.

Il s’agit d’utiliser des données des clients (tertiaire / résidentiel/Industriel, type


d’activité, consommation en gaz, production d’installations renouvelables tel que le
PV ou de cogénération), des données météo, données urbaines, grille tarifaire du gaz,
des indicateurs économiques régionaux et nationales, etc.

Les données collectées sont :


 Des nombres représentants des critères fixes au cours du temps
 Des séries chronologiques
 Des variables catégorielles.
Le workflow du projet doit essentiellement passer par :

1. Problem Framing and Data Understanding (defining strategy, and metrics, Data
collecting if needed, Retrofitting,EDA, etc.)
2. Data Cleaning (Outliers detection, imputation, smoothing techniques…)
3. Data Selection (could include feature engineering, etc)
4. Data Preparation (scaling, encoding, etc…)
5. Models Presentation & Evaluation (supervised, unsupervised, Semi-supervised
algorithms or a combination)
6. Models Configuration (hyperparameters,)
7. Model Selection
8. Model Tuning
9. Model Deployment

Toutefois, le workflow est itératif (en sous domaine) et évolutif selon la


compréhension du sujet, mais reste structuré tout autour de la méthode CRISP.

NB: L'étudiant est amené à argumenter toutes les étapes du projet pour finalement
établir un modèle stable et généralisable., pour finir, en illustrant le gain apporté par ce
modèle par rapport aux méthodes conventionnelles. 

Lieu du stage A distance

Durée prévue La durée prévue est de 4 à 6 mois de Février ou Mars 2021.

a- Un étudiant Mastère 2 ou ingénieur en 3ème année talentueux en ML et DL


Profil requis b- Motivation et capacité d’apprentissage
requise
c- Français & Anglais maîtrisés
d- Sens de l’initiative et d’organisation
M. Mohamed SLIMANE
Encadrant(s)
Ingénieur Principal – Chef de Division
Département études et Planification
LinkedIn : https://www.linkedin.com/in/mohamedslimane/
Contact(s)
E-mail : mslimene@steg.com.tn

La sélection des candidats se fera sur la base de leurs Motivation, Compétence et


Communication durant un entretien.
Divers
Chaque étudiant intéressé doit envoyer un CV, ses relevés de note en école d’ingénieurs
La STEG se réserve le droit de modifier ou annuler le stage.
Sousse, le 29/12/2021
Direction Distribution Centre
Offre de PFE 2022-02/DCD02
Descriptif du PFE

Dans le cadre de l’optimisation de ses stratégies du développement de son réseau


de distribution gaz tout en rentabilisant ses ressources, le Département Etude et
Planification au sein de la Direction Distribution Centre de la STEG entame des études
de planification basées sur l'Intelligence Artificielle à savoir le « Machine Learning »
et le « Deep Learning » :

Sujet: Développement d’une architecture MLOps pour le deployement des modèles


de Prévision à long terme (3ans +) du débit horaire en gaz des postes de livraison
Objectif du disposants d’un enregistrement horaire.
stage
CDC: Le sujet proposé est une continuité d’un PFE antécédent élaboré en 2021
intitulé ‘’Gas Peak Demand Forecasting for Sousse Region’’ et dont l’article a été
accepté par le 5th International Conference on Advanced Systems and Emergent
Technologies (IC_ASET’2022).
En effet, il s’agit de développer une architecture évolutive/scalable qui assurera la
reproduction et la maintenabilité du workflow jusqu’au déploiement du model élu
selon les metrics prédéfinis.

Ce procès de MLOps consiste en la remonter de la phase pilot study jusqu’au


production level en garantissant les étapes suivantes :

 Development
 Testing
 Deployment
 et monitoring.

Afin de réussir cette taches, l’étudiant sera amené a utilisé des framework et ou
plateformes reconnus en MLOps telque ‘’mlflow’’ ou ‘’AWS MLOps Framework’’, etc.

Il s’agit d’utiliser des données des clients (tertiaire / résidentiel/Industriel, type


d’activité, consommation en gaz, production d’installations renouvelables tel que le
PV ou de cogénération), des données météo, données urbaines, grille tarifaire du gaz,
des indicateurs économiques régionaux et nationales, etc.

Les données collectées sont :


 Des nombres représentants des critères fixes au cours du temps
 Des séries chronologiques
 Des variables catégorielles.

Le workflow du projet doit essentiellement passer par :

1. Problem Framing and Data Understanding (defining strategy, and metrics, Data
collecting if needed, Retrofitting,EDA, etc.)
2. Data Cleaning (Outliers detection, imputation, smoothing techniques…)
3. Data Selection (could include feature engineering, etc)
4. Data Preparation (scaling, encoding, etc…)
5. Models Presentation & Evaluation (supervised, unsupervised, Semi-supervised
algorithms or a combination)
6. Models Configuration (hyperparameters,)
7. Model Selection
8. Model Tuning
9. Model Deployment

Toutefois, le workflow est itératif (en sous domaine) et évolutif selon la


compréhension du sujet, mais reste structuré tout autour de la méthode CRISP.

NB: L'étudiant est amené à argumenter toutes les étapes du projet pour finalement
établir un modèle stable et généralisable., pour finir, en illustrant le gain apporté par ce
modèle par rapport aux méthodes conventionnelles. 

Lieu du stage A distance

Durée prévue La durée prévue est de 4 à 6 mois de Février ou Mars 2021.

a- Un étudiant Mastère 2 ingénieur en 3ème année talentueux en ML et DL


Profil requis b- Motivation et capacité d’apprentissage
requise
c- Français & Anglais maîtrisés
d- Sens de l’initiative et d’organisation
M. Mohamed SLIMANE
Encadrant(s)
Ingénieur Principal – Chef de Division
Département études et Planification
LinkedIn: https://www.linkedin.com/in/mohamedslimane/
Contact(s)
E-mail : mslimene@steg.com.tn

La sélection des candidats se fera sur la base de leurs Motivation, Compétence et


Communication durant un entretien.
Divers
Chaque étudiant intéressé doit envoyer un CV, ses relevés de note en école d’ingénieurs
La STEG se réserve le droit de modifier ou annuler le stage.
Sousse, le 29/12/2021

Vous aimerez peut-être aussi