Vous êtes sur la page 1sur 2

Le Mans Université, Master 2 actuariat (Data Science)

Bases de données pour le Big Data


Examen de TP (durée : 2h)

Consignes :
 Téléchargez le chier  exam.js  sur Umtice. Il vous servira à saisir vos réponses.
Il faudra le soumettre à la n sur Umtice. Pensez à bien mettre les numéros de
question en commentaire.
 Tous les documents ainsi que l'accès à Internet sont autorisés. Seuls sont interdits
les moyens de communications avec une personne susceptible de vous aider en
temps réel (mail, téléphone, etc.).
 Le barème est donné à titre indicatif. Il faut obtenir 20 points pour avoir la note
maximale.

Exercice 1 (Importation)
Pour les exercices 2, 3 et 4, importez le chier  organisations.json  dans une col-
lection nommée  organisations  dans une base de données intitulée  CCTP .
Il s'agit de l'ensemble des données du répertoire des représentants d'intérêts géré par
la Haute Autorité pour la transparence de la vie publique.

Exercice 2 (Edition des données)


Écrivez le code permettant d'eectuer les modications suivantes sur les données de
la collection  organisations  :
1. Corriger la dénomination de  URGO GROUP  en  URGO WORLD GROUP .
2. Modiez les villes nommées  ST DENIS  pour toutes les nommer  SAINT
DENIS .
3. Supprimer toutes les entreprises dont le champ  isActivitesPubliees  est faux.
4. Ajoutez une entreprise avec les informations suivantes :
 typeIdentiantNational : AUTRE
 denomination : GAME
 nomUsage : GAME
 adresse : "LE MANS UNIVERSITE"
 dirigeants : M. Issa Lahmar (président) et M. Lucas Renard (vice-président).

B. Cablé 1
Exercice 3 (Interrogation des données)
Écrivez le code permettant, en une seule requête, d'obtenir les informations sui-
vantes :
1. Combien y a-t-il d'organisations ?
2. Quels sont les types d'identiants nationaux possibles ?
3. Combien y a-t-il d'organisations de type d'identiant SIREN ?
4. Trouver toutes les organisations aliées à la fois à l'organisation d'identiant
326943016 et à celle d'identiant 784668618.
5. Trouver toutes les organisations aliées à au moins une des deux organisations
d'identiants 326943016 et 784668618.
6. Pour chaque couple (ville, type d'identiant), combien y a-t-il d'organisations ?
Trier par nombre décroissant d'organisations et n'acher que les 10 premiers.
7. Pour chaque organisation à laquelle on peut s'alier, acher le nombre d'organi-
sation aliées. Trier par nombre décroissant d'organisations.
8. Quels sont les collaborateurs de Julien LAVAUD (toutes organisations confon-
dues) ? Triez la liste de ces collaborateurs avec le nombre d'organisations qu'ils
ont en commun avec Julien LAVAUD, triée par ordre décroissant, puis par ordre
alphabétique de collaborateur (sur le nom puis le prénom).
9. Trouver les gens qui sont collaborateurs sans jamais être dirigeants.

Exercice 4 (MapReduce) La requête suivante doit être écrite en MapReduce (sinon


elle ne sera pas corrigée) et en une seule requête.
Pour les organisations comptant strictement plus de collaborateurs que de dirigeants,
calculer le nombre moyen de dirigeants et le nombre moyen de collaborateurs.

Exercice 5 (Indexation Géospatiale) Importez le chier que l'on a utilisé en TP


 cities.json  dans une collection nommée  cities  dans la même base de données que
précédemment.
 Rechercher les villes situées entre 5 et 20 km de Lyon (en France).
 Pour les mêmes villes que la question précédente, donner le nombre moyen d'ha-
bitants par ville.
 compter le nombre d'habitants total dans le pentagone formé par les villes Lille,
Strasbourg, Marseille, Toulouse et Brest.

B. Cablé 2

Vous aimerez peut-être aussi