Vous êtes sur la page 1sur 24

Ministère de l’Enseignement Supérieur et de la Recherche Scientifique

Université de Carthage
Institut des Hautes Études Commerciales de Carthage

Mesure de conformité des CVs par une


classification non supervisée
Organisme d’accueil :

Réalisé par :
TAHRI Khouloud

Présidente de Jury: Dr. TOUNSI Jihene Rapporteur : Dr. MESFAR Slim

Encadrante Académique : Dr. GHORBEL Molka Encadrant Professionnel: CHAKOUR Thamer

Année universitaire : 20222/2023


PLAN

01 02 03 04
Contexte Conclusion et
Méthodologie Réalisation
générae perspectives

1
CONTEXTE
01 GENERAL
Contexte générale

1.1 ENTREPRISE D’ACCUEIL

Premier opérateur privé Acteur essentiel du crée en


1371 employés
de télécommunications secteur des 2002
(2022)
en Tunisie. nouvelles (Tunisiana)
technologie.

3
Contexte générale

1.2 PROBLEMATIQUE

4
Contexte générale

1.3 SOLUTION PROPOSEE

Extraction des données Segmentation des


à partir des CVs CVs.

Matching
5
METHODOLOGIE
02
Méthodologie

CRISP-DM : The Cross-Industry Standard Process For Data Mining

la plus adaptée à la conduite des projets


Data Mining, Big Data et Data Science

Adopte une démarche cyclique et itérative

Ne propose pas un chemin linéaire unique


entre le démarrage du projet et le
déploiement

7
REALISATION
03
Réalisation

3.1 SYSTEME DE MATCHING NLP Pipeline


Normalisation
Nettoyage
Extraction du
texte du texte Lemmatization

Stemming

Tokenization
PyPDF
Vectorization

Calcul
similarité
Prise de Ranking
décision

9
Réalisation

3.2 SYSTEME DE SEGMENTATION (1/5)

Compréhension Collecte des Préparation des


du problème données données
Segmenter les
CV Parsing
différents Cvs selon
leurs compétences

Modélisation Evaluation Déploiement


Inertia
K-Means , ACP Tableau de bord
Coefficient de silhouette

10
Réalisation

3.2 SYSTEME DE SEGMENTATION (2/5)


Collecte des Préparation
données des données
NLP, NER
CV Parsing Extraction des informations à
partir des CVs en utilisant les
bibliothèques Spacy et NLTK.

nulle Valeurs aberrantes

(nom , prenom, education,


compétences, langues…)
DataSet des
données CVs dupliqués Imputation
extraites

Préparation des données


11
Réalisation

3.2 SYSTEME DE SEGMENTATION (3/5)

Données
Brutes

Données nettoyées
et transformées

12
Réalisation

3.2 SYSTEME DE SEGMENTATION (4/5) Modélisation Evaluation


K-means , ACP

Regrouper et interpréter les données


basé seulement sur les données en
entrés . (Non étiquetté) 13
Réalisation

3.2 SYSTEME DE SEGMENTATION (5/5) Modélisation Evaluation


K-means , ACP

Avant ACP Après ACP Nombre composants ACP = 2

14
Réalisation

3.3 INTERFACES

Interface de Matching externe Interface de Matching interne


15
Réalisation

3.3 INTERFACES

16
Réalisation

3.3 INTERFACES

17
Réalisation

3.3 INTERFACES

18
Réalisation

3.3 BIBLIOTHEQUES ET TECHNOLOGIES

19
CONCLUSION ET
04 PERSPECTIVES
Conclusion et perspectives

4.1 Conclusion

Renforcer nos Voir de près l’aspect Maîtrise des nouvelles


Gestion de temps
connaissances et le déroulement de technologie et
dans le domaine la vie professionnelle nouveaux langages
de GRH.

21
Conclusion et perspectives

4.2 PERSPECTIVES
un système de
recommandations des
postes adéquate pour
Scraping des CVs et chaque candidats.
des postes à partir des
différentes platform.
1 3

2 perspectives 4

Un chatbot avancés Autres fonctionnalitées


permettant de communiquer pour postuler.
avec le candidat.

22
MERCI POUR VOTRE
ATTENTION

Vous aimerez peut-être aussi