Vous êtes sur la page 1sur 7

QCM Big Data

1. Qu'est-ce que Docker ?

a. Un système de gestion de base de données

b. Une plateforme de conteneurisation

c. Un framework pour le machine learning

2. Quel avantage Docker offre-t-il par rapport à la virtualisation traditionnelle ?

a. Consommation de moins de ressources

b. Exécution plus rapide des applications

c. Les deux

3. Comment peut-on créer une image Docker ?

a. À partir de zéro

b. En utilisant un fichier Dockerfile

c. Les deux

4. Quelle commande Docker est utilisée pour exécuter un conteneur ?

a. docker run

b. docker start

c. docker create

5. Quel est le composant principal d'Hadoop pour le stockage distribué des données ?

a. HDFS

b. MapReduce

c. YARN

6. Quel langage de programmation est couramment utilisé pour écrire des programmes MapReduce
dans Hadoop ?

a. Python

b. Java

1
c. C++

7. À quoi sert le framework MapReduce dans Hadoop ?

a. Stockage des données

b. Traitement parallèle des données

c. Requêtes SQL

8. MongoDB est un type de base de données :

a. Relationnelle

b. NoSQL

c. Orientée graphe

9. Comment s'appelle le format de stockage des données dans MongoDB ?

a. JSON

b. XML

c. CSV

10. Quelle est la principale différence entre une base de données relationnelle et MongoDB ?

a. Schéma fixe vs schéma flexible

b. Utilisation de SQL vs utilisation de JSON

c. Stockage en mémoire vs stockage sur disque

11. Quel est le rôle principal d'HBase dans l'écosystème Hadoop ?

a. Stockage en colonnes

b. Traitement par lots

c. Stockage en lignes

12. Quelle composante d'HBase sert de point d'accès principal pour interagir avec les données
stockées ?

a. HMaster

b. HRegionServer

2
c. HBase Shell

13. Spark est principalement utilisé pour :

a. Stockage des données

b. Traitement des données en mémoire

c. Indexation des données

14. Quel langage de programmation est souvent utilisé avec Apache Spark ?

a. Java

b. Python

c. Les deux

15. Quelle est la principale différence entre MapReduce (Hadoop) et Spark ?

a. Traitement en mémoire vs traitement sur disque

b. Langage de programmation

c. Modèle de traitement des données

16. Quelle composante d'Hadoop est généralement utilisée pour le traitement des données en
mémoire et le calcul distribué ?

a. Kubernetes

b. Docker

c. Apache Spark

17. Quel composant d'Hadoop est responsable de la gestion des ressources et de l'ordonnancement
des tâches ?

a. HDFS

b. YARN

c. MapReduce

18. Quelle base de données NoSQL est souvent utilisée pour le traitement en temps réel dans
l'écosystème Hadoop ?

a. MongoDB

3
b. HBase

c. Cassandra

19. Quel avantage HBase offre-t-il par rapport à HDFS dans le stockage des données ?

a. Stockage en colonnes

b. Répartition des données

c. Compression des données

20. Comment peut-on déployer une application Spark sur un cluster ?

a. En utilisant spark-submit

b. En exécutant un script Bash

c. En utilisant la commande docker deploy

21. Quelle est la fonction principale de YARN dans Hadoop ?

a. Gestion des ressources

b. Stockage des données

c. Traitement parallèle des données

22. Quelle est la différence entre un conteneur Docker et une machine virtuelle ?

a. Les conteneurs partagent le noyau du système d'exploitation

b. Les machines virtuelles sont plus légères

c. Les machines virtuelles ont une meilleure isolation

23. Quel langage de requête est généralement utilisé pour interagir avec HBase ?

a. SQL

b. HQL

c. HBase Shell

24. Quelle est la principale fonction de Spark RDD (Resilient Distributed Dataset) ?

a. Stockage des données

b. Traitement en mémoire

4
c. Requêtes SQL

25. Comment peut-on augmenter les performances de lecture dans MongoDB ?

a. Utiliser des index

b. Diviser la base de données en plusieurs fragments

c. Désactiver le sharding

26. Quelle est la différence entre un nœud de données (DataNode) et un nœud de nom (NameNode)
dans HDFS ?

a. DataNode stocke les données, et NameNode gère les métadonnées

b. NameNode stocke les données, et DataNode gère les métadonnées

c. Ils effectuent des fonctions similaires

27. Quelle est la principale caractéristique d'une base de données NoSQL ?

a. Schéma fixe

b. Évolutivité horizontale

c. Support complet des transactions

28. Comment peut-on exécuter une tâche MapReduce sur un cluster Hadoop ?

a. À l'aide de la commande hadoop jar

b. À l'aide de la commande spark-submit

c. À l'aide de la commande docker run

29. Quelle est la fonction principale de MapReduce dans le traitement des données dans Hadoop ?

a. Stockage des données

b. Gestion des ressources

c. Traitement parallèle des données

30. Quel est l'avantage principal de l'utilisation de conteneurs Docker dans un environnement de
développement ?

a. Isolation des ressources

b. Portabilité des applications

5
c. Optimisation des performances

31. Quel composant d'Hadoop est responsable de la gestion des défaillances et de la reprise après
incident ?

a. HDFS

b. YARN

c. ZooKeeper

32. Quelle est la fonction principale de ZooKeeper dans un environnement Hadoop ?

a. Gestion des ressources

b. Coordination et synchronisation

c. Stockage des données

33. Comment peut-on effectuer une jointure de données dans Apache Spark ?

a. À l'aide de la fonction map()

b. À l'aide de la fonction reduce()

c. À l'aide de la fonction join()

34. Quel est le principal avantage de l'utilisation de Hadoop pour le traitement de grands ensembles
de données par rapport à des solutions traditionnelles ?

a. Meilleure sécurité

b. Évolutivité horizontale

c. Interface graphique conviviale

35. Quelle est la différence entre un conteneur Docker et une image Docker ?

a. Un conteneur est exécutable, une image est un fichier statique

b. Une image est exécutable, un conteneur est un fichier statique

c. Les deux sont interchangeables

36. Quelle commande Docker est utilisée pour arrêter tous les conteneurs en cours d'exécution sur
une machine ?

a. docker stop $(docker ps -q)

6
b. docker kill $(docker ps -q)

c. docker pause $(docker ps -q)

37. Quel est le langage de requête utilisé pour interagir avec MongoDB ?

a. SQL

b. MongoDB Query Language

c. NoSQL Query Language

38. Quelle est la différence entre un Dataframe et un RDD dans Apache Spark ?

a. Un RDD est immuable, un Dataframe est mutable

b. Un Dataframe est structuré, un RDD est non structuré

c. Ils sont équivalents, chacun ayant des avantages spécifiques

39. Comment peut-on créer un index sur un champ spécifique dans MongoDB ?

a. db.collection.ensureIndex()

b. db.collection.createIndex()

c. db.collection.addIndex()

Vous aimerez peut-être aussi