Vous êtes sur la page 1sur 3

Introduction

Vous êtes libre de réaliser un ou plusieurs exercices suivants. Vous devez utiliser python, et
vous ferez attention à écrire du code propre et commenté.

Vous pouvez écrire des scripts .py (il est même conseillé de le faire), mais vous devez
utiliser un jupyter notebook pour importer les fonctions et expliquer comment ils
fonctionnent.

Exercice 1
On a un fichier txt qui contient :

id,001
v1,some_value
id,002
v2,some_value
v2,some_value
id,003
v2,some_value
id,004
v4,some_value

Utiliser python pour parser les données dans un data frame suivant.

Le code sera déployé pour un grand volume de données. Donc il doit être rapide.

Exercice 2
Le tableau suivant contient les infos

id date_debut date_fin
1 2017-11-20 2017-12-17
1 2018-03-20 2018-03-27
2 2017-11-20 2017-11-21

La première ligne signifie : la personne ayant pour id 1 est absent du 2017-11-20 au


2017-12-17.

On doit obtenir le résultat suivant :

id mois date_debut_mois date_fin_mois NB_arret


1 2017-11-01 2017-11-20 2017-11-30 11
1 2017-12-01 2017-12-01 2017-12-17 17
1 2018-01-01 0
1 2018-02-01 0
1 2018-03-01 2018-03-20 2018-03-27 8
2 2017-11-01 2017-11-20 2017-11-21 2
2 2017-12-01 0
2 2018-01-01 0
2 2018-02-01 0
2 2018-03-01 0

Remarque : en gros, on connaît les périodes d’absence d’une personne, on crée un tableau qui
compte le nombre de jours d’absence par mois.

Exercice 3
Cet exercice a pour but d’évaluer vos compétences en NLP. Vous serez évalués selon les
critères suivants :

● Statistiques descriptives
● Text-mining
● Machine Learning
● Restitution des résultats et explications
● Clarté et qualité du code

Le lien pour télécharger les données est:


https://dataks.bitbucket.io/text_classif/act_couv.csv

Le fichier contient un message par ligne. Chaque ligne est composée de 2 colonnes:

● description: texte descriptif


● class: variable cible binaire à prédire

Le but de l’analyse consiste à construire un modèle pour prédire la variable cible class, en
fonction du texte descriptif.

Merci d’envoyer vos codes zippés à kezhan.shi@s2hgroup.com

Vous aimerez peut-être aussi