Académique Documents
Professionnel Documents
Culture Documents
Vous êtes libre de réaliser un ou plusieurs exercices suivants. Vous devez utiliser python, et
vous ferez attention à écrire du code propre et commenté.
Vous pouvez écrire des scripts .py (il est même conseillé de le faire), mais vous devez
utiliser un jupyter notebook pour importer les fonctions et expliquer comment ils
fonctionnent.
Exercice 1
On a un fichier txt qui contient :
id,001
v1,some_value
id,002
v2,some_value
v2,some_value
id,003
v2,some_value
id,004
v4,some_value
Utiliser python pour parser les données dans un data frame suivant.
Le code sera déployé pour un grand volume de données. Donc il doit être rapide.
Exercice 2
Le tableau suivant contient les infos
id date_debut date_fin
1 2017-11-20 2017-12-17
1 2018-03-20 2018-03-27
2 2017-11-20 2017-11-21
Remarque : en gros, on connaît les périodes d’absence d’une personne, on crée un tableau qui
compte le nombre de jours d’absence par mois.
Exercice 3
Cet exercice a pour but d’évaluer vos compétences en NLP. Vous serez évalués selon les
critères suivants :
● Statistiques descriptives
● Text-mining
● Machine Learning
● Restitution des résultats et explications
● Clarté et qualité du code
Le fichier contient un message par ligne. Chaque ligne est composée de 2 colonnes:
Le but de l’analyse consiste à construire un modèle pour prédire la variable cible class, en
fonction du texte descriptif.