Credit 5bi Big Data

EXAMEN
Semestre : 1 2
Session : crédit
Module : Big Data

Enseignantes : Ines Slimene
Classes : 5 ARCTIC, 5ERP-BI
Documents autorisés : OUI NON Nombre de pages : 4
Date : 15/06/2016 Heure : 12h30 Durée : 1h30
ETUDIANT(e)
Classe : ……………
N° Carte :
Salle : ………………
…………………………………………………………...
Nom et Prénom : ……………………………………………… ..

Nom et Signature Nom et Signature Observations
Code Note du Surveillant du Correcteur
/20
Module :………………………………………………………………………………
Exercice 1: (7 pts)
1. Définir les deux composants principaux de l’écosystème HADOOP.
Hdfs w mapreduce
2. Quels sont les avantages et les inconvénients d’un SGBDNR (Systèmes de Gestion de Base
de Données Non Relationnels).
Avantage : traite des données volumineux.
Inconvénients : ne pas assurer la consictence et la disponibilité des données

simultannément.
3. Définir et donner des exemples de langage de requête HADOOP.
…………………………………………………………………………………………………………………………………………………
………………………………………………………..............................................................................................
Page 1/4
NE RIEN ECRIRE
4.
a. Citer les différents types possibles d’un SGBDNR
Orienté documents/ orientés graph / orienté key value /orienté colonne
b. Quels sont les types respectifs des SGBDNR suivants : HBASE et MongoDB
Hbase orienté colonnes

mongoDB : orienté documents
Exercice 2 : QCM (13 pts)

NB : Une seule réponse est correcte
1. Parmi ces caractéristiques une seule correspond au big data. Laquelle ?
Vérifiabilité
Volume
Volatilité
Valeur
2. Quelle description identifie la vraie valeur du Big Data ?
Permettre aux utilisateurs d’indexer et d’accéder à un large volume de données.
Ya pas la notion d’indexation au big data
Utiliser les nouvelles technologies pour stocker le grand volume de données
générées par les réseaux sociaux
Permettre aux utilisateurs de gérer les bases de données volumineuses
Permettre de traiter un grand nombre de fichiers de petite taille.
3. La commande qui permet d’afficher les fichiers existants sous le chemin
/user/biadmin est :
hadoop fs -ls khater 7achti bel les fichiers
hadoop fs –lsr
Page 2/4
hadoop fs -lsr /
hadoop fs -ls /biadmin
4. La taille par défaut d’un bloc sous HDFS est :
16 MB
32 MB
64 MB
128 MB
5. Parmi ces caractéristiques, une seule ne correspond pas à HADOOP. Laquelle ?
Open source
Temps réel
Basé sur le langage java
Approche de calcul distribué
6. Quel est le rôle du namenode sous HDFS?
Coordination des jobs mapreduce
Gestion des stocks dans les nœuds
Gestion d’accès aux fichiers par les utilisateurs (car il contient l’emplacement de
chaque bloc) .
Report périodique du statut des datanodes
7. Quel est la phrase correcte concernant HDFS ?
Accès aléatoire aux données en lecture et en écriture.
Les données peuvent être créées, modifiées ou supprimées
L’accès aux données se fait via mapreduce
Les données sont découpées en fichiers de petite taille
8. Quel est le nombre de réplicas pour HDFS ?
2
3
4
5
9. Quel est le rôle du JobTracker dans mapReduce ?
Exécute les taches map et reduce
Garde le traitement proche des données (dans le même nœud)
Reporte le statut des datanode
Gere le stockage
10. Quel est la description adéquate de HBASE ?

C’est un langage de gestion des données structurées basé sur ansi-SQL
C’est un schéma de base de données pour les données non structurées
C’est une implémentation open source de BigTable (système de gestion de bd
taba3 ibm)
C’est un système de fichier distribué qui réplique les données dans un cluster
11. Les avantages du langage NOSQL sont :

Page 3/4
Permet à un SGBDR d’assurer l’intégrité des données stockées sous HDFS.
Permet de gérer, d’une manière efficace, les données qui sont volumineuse pour
un SGBDR.
Permet d’ajouter une couche de gestion des Big Data aux SGBDR
Permet à HADOOP de définir un schéma pour les données non structurées
12. Quel est l’outil qui permet d’analyser un grand volume de données stockées sous
HDFS avec des requêtes SQL ?
Pig
Hbase
Hive
Hue
13. Qu’est ce qui rend l’accès par des requêtes SQL à Hadoop difficile ?
Les données Hadoop sont structurées
Les données sont situées dans un système de fichier distribué
Les données sont de différents formats
Hadoop requière un schéma prédéfini
Page 4/4

Credit 5bi Big Data

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Credit 5bi Big Data

Transféré par

Droits d'auteur :

Formats disponibles

EXAMEN

Module : Big Data

1. Définir les deux composants principaux de l’écosystème HADOOP.

Avantage : traite des données volumineux.

Inconvénients : ne pas assurer la consictence et la disponibilité des données

3. Définir et donner des exemples de langage de requête HADOOP.

a. Citer les différents types possibles d’un SGBDNR

Orienté documents/ orientés graph / orienté key value /orienté colonne

Hbase orienté colonnes

Exercice 2 : QCM (13 pts)

10. Quel est la description adéquate de HBASE ?

11. Les avantages du langage NOSQL sont :

Vous aimerez peut-être aussi