QCM Corrigé

QCM Big Data
1. Qu'est-ce que Docker ?
a. Un système de gestion de base de données
b. Une plateforme de conteneurisation
c. Un framework pour le machine learning
2. Quel avantage Docker offre-t-il par rapport à la virtualisation traditionnelle ?
a. Consommation de moins de ressources
b. Exécution plus rapide des applications
c. Les deux
3. Comment peut-on créer une image Docker ?
a. À partir de zéro
b. En utilisant un fichier Dockerfile
c. Les deux
4. Quelle commande Docker est utilisée pour exécuter un conteneur ?
a. docker run
b. docker start
c. docker create
5. Quel est le composant principal d'Hadoop pour le stockage distribué des données ?
a. HDFS
b. MapReduce
c. YARN
6. Quel langage de programmation est couramment utilisé pour écrire des programmes MapReduce
dans Hadoop ?
a. Python
b. Java
1
c. C++
7. À quoi sert le framework MapReduce dans Hadoop ?
a. Stockage des données
b. Traitement parallèle des données
c. Requêtes SQL
8. MongoDB est un type de base de données :
a. Relationnelle
b. NoSQL
c. Orientée graphe
9. Comment s'appelle le format de stockage des données dans MongoDB ?
a. JSON
b. XML
c. CSV
10. Quelle est la principale différence entre une base de données relationnelle et MongoDB ?
a. Schéma fixe vs schéma flexible
b. Utilisation de SQL vs utilisation de JSON
c. Stockage en mémoire vs stockage sur disque
11. Quel est le rôle principal d'HBase dans l'écosystème Hadoop ?
a. Stockage en colonnes
b. Traitement par lots
c. Stockage en lignes
12. Quelle composante d'HBase sert de point d'accès principal pour interagir avec les données
stockées ?
a. HMaster
b. HRegionServer
2
c. HBase Shell
13. Spark est principalement utilisé pour :
b. Traitement des données en mémoire
c. Indexation des données
14. Quel langage de programmation est souvent utilisé avec Apache Spark ?
a. Java
b. Python
c. Les deux
15. Quelle est la principale différence entre MapReduce (Hadoop) et Spark ?
a. Traitement en mémoire vs traitement sur disque
b. Langage de programmation
c. Modèle de traitement des données
16. Quelle composante d'Hadoop est généralement utilisée pour le traitement des données en
mémoire et le calcul distribué ?
a. Kubernetes
b. Docker
c. Apache Spark
17. Quel composant d'Hadoop est responsable de la gestion des ressources et de l'ordonnancement
des tâches ?
a. HDFS
b. YARN
c. MapReduce
18. Quelle base de données NoSQL est souvent utilisée pour le traitement en temps réel dans
l'écosystème Hadoop ?
a. MongoDB
3
b. HBase
c. Cassandra
19. Quel avantage HBase offre-t-il par rapport à HDFS dans le stockage des données ?
a. Stockage en colonnes
b. Répartition des données
c. Compression des données
20. Comment peut-on déployer une application Spark sur un cluster ?
a. En utilisant spark-submit
b. En exécutant un script Bash
c. En utilisant la commande docker deploy
21. Quelle est la fonction principale de YARN dans Hadoop ?
a. Gestion des ressources
b. Stockage des données
c. Traitement parallèle des données
22. Quelle est la différence entre un conteneur Docker et une machine virtuelle ?
a. Les conteneurs partagent le noyau du système d'exploitation
b. Les machines virtuelles sont plus légères
c. Les machines virtuelles ont une meilleure isolation
23. Quel langage de requête est généralement utilisé pour interagir avec HBase ?
a. SQL
b. HQL
c. HBase Shell
24. Quelle est la principale fonction de Spark RDD (Resilient Distributed Dataset) ?
b. Traitement en mémoire
4
c. Requêtes SQL
25. Comment peut-on augmenter les performances de lecture dans MongoDB ?
a. Utiliser des index
b. Diviser la base de données en plusieurs fragments
c. Désactiver le sharding
26. Quelle est la différence entre un nœud de données (DataNode) et un nœud de nom (NameNode)
dans HDFS ?
a. DataNode stocke les données, et NameNode gère les métadonnées
b. NameNode stocke les données, et DataNode gère les métadonnées
c. Ils effectuent des fonctions similaires
27. Quelle est la principale caractéristique d'une base de données NoSQL ?
a. Schéma fixe
b. Évolutivité horizontale
c. Support complet des transactions
28. Comment peut-on exécuter une tâche MapReduce sur un cluster Hadoop ?
a. À l'aide de la commande hadoop jar
b. À l'aide de la commande spark-submit
c. À l'aide de la commande docker run
29. Quelle est la fonction principale de MapReduce dans le traitement des données dans Hadoop ?
b. Gestion des ressources
c. Traitement parallèle des données
30. Quel est l'avantage principal de l'utilisation de conteneurs Docker dans un environnement de
développement ?
a. Isolation des ressources
b. Portabilité des applications
5
c. Optimisation des performances
31. Quel composant d'Hadoop est responsable de la gestion des défaillances et de la reprise après
incident ?
a. HDFS
b. YARN
c. ZooKeeper
32. Quelle est la fonction principale de ZooKeeper dans un environnement Hadoop ?
a. Gestion des ressources
b. Coordination et synchronisation
c. Stockage des données
33. Comment peut-on effectuer une jointure de données dans Apache Spark ?
a. À l'aide de la fonction map()
b. À l'aide de la fonction reduce()
c. À l'aide de la fonction join()
34. Quel est le principal avantage de l'utilisation de Hadoop pour le traitement de grands ensembles
de données par rapport à des solutions traditionnelles ?
a. Meilleure sécurité
b. Évolutivité horizontale
c. Interface graphique conviviale
35. Quelle est la différence entre un conteneur Docker et une image Docker ?
a. Un conteneur est exécutable, une image est un fichier statique
b. Une image est exécutable, un conteneur est un fichier statique
c. Les deux sont interchangeables
36. Quelle commande Docker est utilisée pour arrêter tous les conteneurs en cours d'exécution sur
une machine ?
a. docker stop $(docker ps -q)
6
b. docker kill $(docker ps -q)
c. docker pause $(docker ps -q)
37. Quel est le langage de requête utilisé pour interagir avec MongoDB ?
a. SQL
b. MongoDB Query Language
c. NoSQL Query Language
38. Quelle est la différence entre un Dataframe et un RDD dans Apache Spark ?
a. Un RDD est immuable, un Dataframe est mutable
b. Un Dataframe est structuré, un RDD est non structuré
c. Ils sont équivalents, chacun ayant des avantages spécifiques
39. Comment peut-on créer un index sur un champ spécifique dans MongoDB ?
a. db.collection.ensureIndex()
b. db.collection.createIndex()
c. db.collection.addIndex()

QCM Corrigé

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

QCM Corrigé

Transféré par

Droits d'auteur :

Formats disponibles

QCM Big Data

1. Qu'est-ce que Docker ?

a. Un système de gestion de base de données

b. Une plateforme de conteneurisation

c. Un framework pour le machine learning

2. Quel avantage Docker offre-t-il par rapport à la virtualisation traditionnelle ?

a. Consommation de moins de ressources

b. Exécution plus rapide des applications

3. Comment peut-on créer une image Docker ?

b. En utilisant un fichier Dockerfile

4. Quelle commande Docker est utilisée pour exécuter un conteneur ?

7. À quoi sert le framework MapReduce dans Hadoop ?

a. Stockage des données

b. Traitement parallèle des données

8. MongoDB est un type de base de données :

9. Comment s'appelle le format de stockage des données dans MongoDB ?

a. Schéma fixe vs schéma flexible

b. Utilisation de SQL vs utilisation de JSON

c. Stockage en mémoire vs stockage sur disque

11. Quel est le rôle principal d'HBase dans l'écosystème Hadoop ?

b. Traitement par lots

13. Spark est principalement utilisé pour :

a. Stockage des données

b. Traitement des données en mémoire

c. Indexation des données

15. Quelle est la principale différence entre MapReduce (Hadoop) et Spark ?

a. Traitement en mémoire vs traitement sur disque

c. Modèle de traitement des données

b. Répartition des données

c. Compression des données

20. Comment peut-on déployer une application Spark sur un cluster ?

b. En exécutant un script Bash

c. En utilisant la commande docker deploy

21. Quelle est la fonction principale de YARN dans Hadoop ?

a. Gestion des ressources

b. Stockage des données

c. Traitement parallèle des données

a. Les conteneurs partagent le noyau du système d'exploitation

b. Les machines virtuelles sont plus légères

c. Les machines virtuelles ont une meilleure isolation

a. Stockage des données

25. Comment peut-on augmenter les performances de lecture dans MongoDB ?

a. Utiliser des index

b. Diviser la base de données en plusieurs fragments

a. DataNode stocke les données, et NameNode gère les métadonnées

b. NameNode stocke les données, et DataNode gère les métadonnées

c. Ils effectuent des fonctions similaires

27. Quelle est la principale caractéristique d'une base de données NoSQL ?

c. Support complet des transactions

a. À l'aide de la commande hadoop jar

b. À l'aide de la commande spark-submit

c. À l'aide de la commande docker run

a. Stockage des données

b. Gestion des ressources

c. Traitement parallèle des données

a. Isolation des ressources

b. Portabilité des applications

32. Quelle est la fonction principale de ZooKeeper dans un environnement Hadoop ?

a. Gestion des ressources

c. Stockage des données

a. À l'aide de la fonction map()

b. À l'aide de la fonction reduce()

c. À l'aide de la fonction join()

c. Interface graphique conviviale