Académique Documents
Professionnel Documents
Culture Documents
Composition du Jury :
Année universitaire
2022-2023
I Introduction
II Contexte du projet
IV Réalisation
V Conclusion
2
III
I Introduction
3
Introduction
44
II Contexte du projet
5
Entreprise d’accueil
Application INSAF assure la gestion des volets administratifs et financiers des personnels de l’état public
6
Problématique
Augmentation des
L’apparition de nouveaux emplois Une pression sur la trésorerie de
rémunérations
l’entreprise
mensuelles
Mise en valeur des Encouragement du départ
Augmentation du nombre de volontaires et négliger les
primes existantes et salariés employés par l’état
mise en place de facteurs d’indemnités et les
nouveaux primes recrutements
1. Gestion des employés des différentes établissements publics 1. Interface non ergonomique et pas facile à utiliser,
2. Accès aux différents informations comme les primes, fiches de paie, 2. Fonctionnalités limitées et pas gratuites
salaires de base 3. Ni visualization , Ni prediction de la masse salariale
6
Contexte du Projet Etude préalable Etude des besoins Réalisation Conclusion 8
Solution proposée
Phase 4 Modélisation
Phase 5 Évaluation
Phase 6 Déploiement
12
Besoins Fonctionnels
Evolutivité
Sécurité
17
Organisation du travail
1 3 5
2 4 6
Visualisation des
Faciliter l’échange des
données sous forme
différents informations
de graphiques
dans les différentes
établissements publics
Visualisation
de la masse
salariale
D’après le BOXPLOT de la variable cible on remarque l’absence des points individuels au-
dessus de l’extrémité supérieure du diagramme en boite ce qui indique l’absence des valeurs
aberrantes.
D’après l’observation de notre courbe on observe pour tous les mois la valeur du montant_ind
6
est compris entre 175 et 200 pour tous les mois et pour le mois d’Octobre et Novembre ce
sont les mois qui se caractérisent par une élévation du taux de montant d’indemnité donc il
n’existe pas une anomalie de donnée et la variabilité est normale.
On peut expliquer les résultats du mois de Mars par des rémunérations annuelles, pour le mois du Juin aussi par des
paiements d’indemnité de performance ou de fin d’année pour certains agents 6
Pour le mois de Décembre, cette élévation anormale est due à la mise en place de nouveaux primes de fin d’année
Base contient 799914 lignes et 34 colonnes ayant des colonnes contenant beaucoup
de valeurs manquantes, de type objets datetime , String
Calcul de la colonne
masse salariale
Le but de principale de cette application est de prédire la masse salariale, nous commençons par le calcul
6
de la masse salariale qui est la somme des montants indemnités pour chaque mois et on ajoute ces valeurs
à notre jeu de données.
l’enrichissement des données dont on dispose et qui a un impact sur la qualité de la base dont on
dispose comme le total des montants d’indemnités regroupé par année et type de paiement ainsi on
ajoute total_recrutements c’est la somme de nombre de recrutements par année qui est déjà calculé
6
Codetab: même valeur pour toute ligne qui correspond au ministère de culture
Numligne : n’ayant aucune relation avec notre objectif de prédiction
Etape 2
Division des
colonnes dates
Etape 1
Conversion des
Etape 3
colonnes de type Label Encoder
objects
Pour ce faire, nous avons procédé à la préparation d’une fonction dédié à la conversion de type OBJECT
en STRING
6
Label Encoder
• remplir les catégories par des nombres allant de 1 à n-1 ou n est le nombre de catégories distinctes de la
variable. 6
• Dans notre jeu de donnée, nous avons utilisé l’imputation par modèle et on a utilisé la stratégie d’imputation
par la moyenne. 6
• La figure ci-dessus nous a identifié la corrélation entre les variables. On peut conclure
6
que les variables echellon et indice sont fortement corrélés et c’est normal
• ces deux variables nous donnent une idée sur le niveau de classification de l’employé
coté expérience, performance et compétence dans le secteur public
Decision tree
XGBOOST ADABOOST Random Forest Regressor
Regressor
13
Contexte du Projet Etude préalable Etude des besoins Réalisation Conclusion 40
Construire les modèles de prédiction
Decision Tree regresor
13
Contexte du Projet Etude préalable Etude des besoins Réalisation Conclusion 41
Construire les modèles de prédiction
Random Forrest Regressor
1. Nombre estimateurs
2. Nombre minimum d’échantillons requis
3. Nombre de caractéristiques
13
Contexte du Projet Etude préalable Etude des besoins Réalisation Conclusion 42
Construire les modèles de prédiction
ADABOOST
13 du Projet
Contexte Etude préalable Etude des besoins Réalisation Conclusion 43
Construire les modèles de prédiction
XGBOOST
13
Contexte du Projet Etude préalable Etude des besoins Réalisation Conclusion 44
Critères d’évaluation
Performance Vitesse
Nous constatons que les meilleures valeurs des métriques de performance sont données par l’algorithme
DECISION TREE REGRESSOR car il possède une valeur importante de R2 et les faibles valeurs de MAE et RMSE
et MAPE
RANDOM FORREST REGRESSOR possède la valeur importante de R2 ,MAE et RMSE mais un pourcentage
d’erreur très important
XGBOOST un pourcentage d’erreur favorable mais un MAE et RMSE élevé par rapport aux autres algorithmes
3 HttpRequest
http
4
Response 6
5 Detection
Request
Detection 4 5
6 3
Response
1
Nous constatons que DECISION TREE REGRESSOR possède un taux réduit en temps de formation et de
prédiction donc on peut conclure que ce dernier est le modèle favorable en performance et vitesse
d’estimation et d’entrainement
58
Conclusion et perspective
Conclusion
Mise en place d’un système de visualisation de
l’évolution et de la prédiction de la masse
salariale » nous a permis d’élargir nos
connaissances en apprentissage automatique et
développement web
Perspective
un module conçu pour les employés
qui les aident à consulter leurs
fiches de paie, modifier leurs
informations personnelles
concernant les diplômes,
expériences professionnelles...