Durée : 2h30 Questions de cours 1-Quand est ce qu’on peut parler d’un contexte Big data ? 2-Définir le théorème de cap. 3-Définir un Cluster Cassandra 4-Définir L’architecture du socle Hadoop avec les jobs de chacun des composants. Exercice 1: Cette première phase de notre application consiste à créer la base comme si elle était relationnelle, et à effectuer des requêtes simples. Chaque Faculté est définie par un identifiant unique, le nom de l’établissement, le quartier où il se trouve, la rue et le numéro du bâtiment et un ensemble de type de formations dans lequel il se spécialise et un numéro de téléphone. A la fin de chaque année de formation, une fiche d’inspection est retournée contenant la date d’inspection de la faculté en question, le code de violation de la formation suivit de sa description s’il y en a, le score de cet établissement et son grade dans le marché 1. Créez la base de données Rectorat Fez pour lequel le facteur de réplication est mis à 3.Puis Créez vos Column Family qui vous permettront une bonne modélisation de la base de données. 2. Donnez la Liste des noms de toutes les facultés. 3. Nom et quartier de la faculté N° 05 4. Dates et grades des inspections de cette faculté. 5. Noms des facultés qui ont une formation appelée ‘MQL’ 6. Noms des Facultés situées dans ‘Sidi Brahim’ ; 7. Grades et scores donnés pour une inspection pour la faculté n° 05 avec un score d’au moins 10. 8. Grades des inspections dont le score est supérieur à 5 ave le nombre de lignes retournées par la requête. 9. Les trois premiers Grades des inspections dont l’identifiant est compris est supérieur à 100. 10. Pour la requête ci-dessous faites en sorte qu’elle soit exécutable sans ALLOW FILTERING SELECT Name FROM Faculté WHERE quartier=’Sidi Brahim’ ; 11. Faites l’export de toutes les données dans un fichier txt. Exercice 2: Pour toutes ces facultés on a besoin d’un système de scoring pour les classer selon les normes internationales. Universités scientifiques Université littéraires
FSDM 17 FLDM 15
ENSA 12 ELDM 14
EST 10 ISTA 17
FST 03 ILDM 09
Universités de droit Université d’art
FSJE 09 FAM 11
ESJE 14 IAM 15
ISJE 13 EAM 02
USJE 15 UAM 14
1-Stocker chaque université selon sa spécialité tout en effectuant un classement qui
permettra de savoir qui sont les meilleurs dans chaque région 2-faites en sorte de donner un système de classement intelligent qui permettra de classer toutes les facultés. 3-donnez le top 3 entre Universités scientifiques et Université d’art 4- donnez le top 3 entre Universités de droit et Université littéraires 5-Donnez le top 3 de toute la ville de Fez avec les notes de chaque université. Exercice 3 : En prenant l’exemple du document ci-dessous : { "nom_Formation":"Master qualité du logiciel", "Chef_formation":{ "nom":" Chenfour ", "prenom":" Noureddine " }, "annee_ouve":2008, "Tag": ["MQL","meilleur Master","Java" ], "Professeurs": [ {"nom": "Chenfour", "prenom": "Noureddine"}, {"nom": "Habib", "prenom": "Nfaoui"} ] , "faculte": "FSDM", "adress_fac": {
"location":{ "type" : "Point" ,
"Coordinates" [ -73.856077, 40.848447 ]}, "street": "Dhar El Mahraz", "zipcode": "30040" } } 1-Créez une nouvelle base de données MongoDb nommée Formations et insérez-y votre document 2-Quelles sont les formations ouvertes par le Professeur Chenfour l’année 2008 dans la faculté FSDM présentes dans notre collection ? 3-Ajouter dans le tableau des professeur le professeur Abdelmoumni Ouadie . 4-Vérifier si le Tag « MQL » peut servir de critère de recherche. 5-Donnez l’ensemble des facultés qui se trouvent à un kilomètre de la FSDM. Exercice 4: 1-Donnez L’architecture Map/Reduce d’un programme qui permet le comptage du nombre d’occurrence existant dans un fichier passé en paramètre (en spécifiant et expliquant toutes les étapes). 2-Donnez le code Java permettant d’effectuer cette opération le tout en stockant dans des fichiers HDFS.