Vous êtes sur la page 1sur 13
Fiche de QCM cours INF 356 : Ingénierie des données Dr TCHANTCHOU 8. Yannick-Ulrich 1. Le Yotta est la plus grande mesure des données (a) Vrai Vp (b) Faux 2. La plus grande mesure des données est : (a) Le Giga, () Le Zetia” (c) Le Tera, (@) Le Kilo (©) Le Petra (f) Le Mega, 3. Quels sont les V qui caractérisent les Big Data? (a) Volume \” (b) Variéte ~~ (©) Vacuité @ Veracits-/, e (©) Vélocité (8) Variation 4, Facebook est Ja seule soiirce de données qui permet de produire du Big - data: : ; (a) Vrai (b) Faux 5. La finalité de l'utilisation du Big Data peut étre (a) La gestion prédictive (b) Le stockage des données (c) Détection de nouveaux motifs (d) La géstion réactive on iemps-réal ~~ (€) La collecte des données 6. Qu’est ce que le terme "Big data” signifie? (a) Ensembles de données volumineux qui peuvent étre gérés et manipu- ler avec des logiciels et techniques classiques. #-(o) Ensemble des données ayant une grande ee ee oe, (0) Bnsembles de données voluminew% complexes &# of “iwvec des logi- Bnseiron qi ne peuvent pas cre gérés et maniP tiels ot techniques classiques. 7. Bn quoi le Big Data estil utile? “Gas {e) Il permet aux entieprises de comprendre ‘le comportemn embles clients et les aide & tier des conclusions & partir de &F ‘de données collectées. (e) M parm do faire des prévisions. Vf (6) Tlpormet de vivre en sécurité. (€) Tl permet de se cacher. 2 8. Quolle est la différence entre Variété et Volume? 2 5 “ (a) La variété signific gérer la coniplexité de plusieurs types de données et Z de schémas stricturés ou non structurés tandis que le volume signifie aérer dé volumes de données croissants de tous types. (b) La variété signifie gérer plusieurs types de données individuellement _.~ ‘tandis que le volume signifie gérei de volumes de données croissants * de Vordre du Giga ou du Tera. 9. Facebook s'attaque au Big Data avec.......basé sur Hadéop (@) Projet Prism\,— (b) Prisme (©) Projet "Données” ‘ ~ (d) Projet "Offre” : 10. Sous quelle licence Hadoop est-il distribuié? ~~ (a) Licence Apache 2.0.7 ~ (b) Mozilla (©) Shareware (@) Middleware = nL. Pale langage de programmation Hadoop estil écrit? a) C : ieee : . (b) Or : ns : (©) Java : (a) JSP ; 12, Au-dessus des systmes de fichiers se trouve l : racker, auquel les applications cli * qui consist ‘Tracker, i een uw de applications clientes souriettent des travaux iene (a) MapReduce (b) Google - (©) Programmation fonctionnelle (a) Facebook 13. soo. possbde le plus grand! custer Hadoop du monde. (a) Apple (b) Datemsti (6) Facebook \~ (@) Aucune des réponses 14. Un su: nooud agit en tant qu’esclave et est responsable de, exécution Pune tache qui lui est assignée par le Job‘Tracker. (a) MapReduce (b) Mapper, (©) TaskTracker a (@) Jobracker 4 15. Indiquea laffitmation correcte ‘ (@) La tache Map ‘dans MapReduce est réalisée & Inide de Ia fonction = Mapper()- = 1 (b) La tache de réduction dans MapReduce est steht a aide de la fonction Map().- *, pore dace le temp “2{@) Tous les éléments rientionnés sont correctes. ‘e (d) MapReduce éssaie de placer les données et les calculs le plus prA"s 16, s..nypartio de MapReduce est chargée de traiter un ou plusieurs morceaux données et de produire les résultats de sortie. (a) Maptask WA - (b) Mapper. Ss Pe 5 (e) Exécution des tiches ahora (@) Toutes les réponises est chargée de consolider les résultats produits p par ‘chacune des fonc- tions/taches Map(). (a) Map (b) Reduce (c) Reducer (d) Reduced . : 18. Pointe la mauvaise déclaration (2) Une tache MapReduce divise généralement l'ensemble des données dentrée en morceaux indépendants qui sont traités par les taches ‘Map de manitre totalement paralléle. ~ (b) Le cadre MapReduce fonctionne exclusivement sur des paires. 17. 4 interfaces Mapper ot alemont Ie (c) Les applications imprémenten oe mop ob de reduce Tedeer pour fournir Tes métho o vest correcte. emble S (@) Avcume des séponses Me OOP sigur denise aver ens : met. en correspondance Jes paires © z ig paires clé/valeur, intermédiaites (a) Mapper (b) Rédueteur (c) Mapper et Reducer (@) Aucune des réponses mentionnées 20. Indiquez I’affirmation correcte |. (a) Les applications peuvent utiliser 1 de l’avancement des travaux. $ “sae (b) Le cadre Hadoop MapReduce igénére une téche map pour Chg InputSplit généré par Je InputFormat de la tache. i = - (6) Les sorties interméidiaies tiie sont toujours stockées dans un format simple (key-len, key, Valué-len, valu). ee i e (d) Toutes les réponses mentionnées : : 19. 1c rapporteur pour rendre compte _.°. 21. Pointez du doigt la mauvaise déclaration edge “ . (a) Le réducer a 3 phases primaires. \, (b) L’augnientation du nombre de réduces accroit les frais généraux du — cadre, mais améliore l’équilibrage des charges et réduit le cot des défaillances. 2S (c) Il est légal de fixer le nombre detaches réduce & 7éro si aucune : réduction n’est souhaitée. (@) Le cadre regroupe les entrées du réducers par clé (puisque différents es ‘mappeurs peuvent avoir produit la méme clé) dans une étape de tri. 22. Lesquelles des phases suivantes se produisent simultanément ? (a) Réduire et Sort’. - . (b) Shuffle et Sort \/ : ee (©) Shuffle et Map (a) Toutes les réponses mentionnées 23, MapReduce a été congu par (a) Apple (b) Google (©) Facebook (4) Samsung 24, Quest cé qu'une base de données? (a) c'est un logiciel (b) c'est une collection informations structurées eX (c) c'est un module & valider 25. Quels sont les avantages: lids A. Putilisation des : de données (a) Potillsation d'un langoge do requéto déclaraif Ve (b) une plus grande indépendance par rapport att systémme d? (c) une description unique et globale des données manipulées Lo 26. Qu’est ce que la sécurité offerte par un SGBD (a) Videntification des ulilisateurs par un mot de passe et Trassociation de droits aux utilisateurs\ “~~ i (b) des mécanismes de résistance aux pannes limitant Vimpact de celles- : a (©) des mécanismes matériels interdisant les pannes. 27. Qu’est ce qu'une contrainte d’intéprité (@) crest ce qui permet de spécifier qu'un utilisateur est intégre ~ (b) c'est une propriété qui doit étre respetée par Jes données pour que Ja base de données soit. cohérente. = 28. Qu’ést ce qu’une transaction pour un SGBD?. F B (a) cest échange eritre une banque et un Glicnt (par exemple une tran- saction boursiére) i - = e _ (b):e'est Punité dexécuition d'un SGBD.V-—~ (c) c'est un programme ‘qui fait des Jectures-et/ou écritures sur une base a ‘de données en respectant certaines proprigtés \- ___ 29., Que’ veut dire I'seronyme ACID ‘associé, aux transactions. S a ss (a) Actif, Combatif, Intrépide, Déterminé ~~ =: (b) Atomicity, Consistency, Isolation, Durability V. - (¢) Anatole Conrad et Isidore Dubay, les inventeurs de la notion de tran= ous 28 saetion. : 30. Quiest-ce qu'un schéma felationinel? =: (a) Unschéma qui zeprésente logiquement les tables @’une base de ania /: (b) Une repréientation d’un ensemble de relations ayant des liens entre elles. . () Un schémma qui représente I¢ flux de données entre les acteurs. (a) Un schéma qui explique les interactions entres les utilisateurs. ‘ 431. MySQL est un systéme de gestion de base de données... 7 (2) Orienté objet s 7 (b) Hiérarchique (c) Relationnel ysttmes de gestion de bases exploitation —— an Newienspond Je dont MSA (a) Objets (b) Tables (©) Réseaux (a) Systemes de fichiers 433, Le NoSQL c'est une’ base de dounées au + (a) Permet la tolérance aux pannes {(b) Permet la gestion des transactions concurrenticlles des données et des requétes (c) Permet le distribution ; (a) Permet de distribuer des calculs lourds 34. Lequel de ces couples est faux + (a) MongoDB ~ orienté document (b) Neodj — otienté graphe: ° = (c) -Redis — srienté clé/valeur 5 (a) Cassandra — orienté colonnes | 35.-Laquelle de ces propriévs de, type BASE. n'st_ pas associée, aux Pases 7 NoSQL : : 3 5 . : — - (@) Eventually consistent 7. ne (b) Soft-state ss : 3 BIS 2 : @(c) Scalability ~ hae : és - (a) Basically Available“ 4 ea = = 86. Laquelle de ces propriétés no fait pas partie’ du théoréme de-CAP (a) Partition Tolerance . - att - + (b) Consistency 2” ‘#(c) Atomicity ~~ i 5 (@) Availability 37. Fara les techniques suivantes, lesquelles sont utilisées pour faire du Shar- ling : 0 (a) DHT (b) Clustered Index (©) Map/Reduce (@ HDFS : 38. La. propriété Consistency signifie que : : = @(a) Une donnée n’a qu'un seul état visible quel que soit le nombre de réplicas. 1 les données d'une base di 1¢(b) Tous Jes noeuds du aystome voient exactement Jes mémes données au ‘méme moment. (©) aucrne réponse n'est correcte. 39. La technique de sharding + (a) permet aux bases de données NoSQL d’améliorer un s tant sa capacité de stocknge : (0) permet aux bases de données NoSQL d’ajouter d’autre machine sans que Putilisatour sache qu’on Va fait. © (c) est I'extensibilité horizontale 40, Les SGBD "NoSQL” sont des syst®mes qui satisfont les propriétés + (a) Consistance et Disponibilité (b) Disponibilité et résistant au partitionnement (c) Cohérence et réesistant ait partitionnement ‘e(€) aucune de ces réponses AL. Les caractéristique’ d’ine base NoSQL sont les suivantes : z (a) Bxistance d’un schéma pour les données : 3 ‘¢ (b) Données de structures’ complexes .. : (c) Diffculté de réplication’des dontiées sur plusieurs noeuds. -@(d) Privilégie ta disponibilité & la cohérence i. t8 £7 e(@) Transactions sir et cohérent. . os s 42. Le modéie relatioiinel a, éé eréé par EF. Codd. : ‘a(a) Vrai pea : (b) Faux Fe bs fs 43. Les bases NoSQL ne peuvent pas assurer la: cohérence et la haute dispo- r. nibilité ensemble *.~ F taj ~ "s se : V (a) Vea oe ite oto aE a Bore BALE Gee i 7 44. Le théoreme CAP est également appelé théoreme de Brewer stipule que : @(a) nous ne pouvons obtenir que deux garanties sur trois au ‘maximum pour une base de données : cohérence, disponibilité et tolérance de partition. y jerveur en ajou- (b) nous ne pouvons obtenir qu'une i i : garantie sur trois pouir une base de données : cohérence, disponibilité et tolérance de partition. (©) nous ne ouvons oben que deux garanties sur trois au minimum pour une base de données : cohérence, disponibilité et tolé Dots one e, disponibilité et tolérance de 45, Choisir Ia ou Jes mauvaise(s) réponses : La Coherence signifie que : #(a) chaque client doit avoir une vue cohérente ou identique des données ‘exécution d’une #(b) Les données doivent rester cohérentes méme aprés 1 opération. (6) une fois les données écrites, toute requéte de lecture doit contenir ces données * (@) aucune mauvaise réponse. = 46. Choisir la’ou les mauvaise(s) réponses : f : La Disponibilité signifie que : = ~ 4(@) les données doivent étre disponibles pour tous les clients pour les opérations de lecture et d’écriture. £(b) Ja base de donriées doit. toujours étre disponible et réactive. (c) Il peut y avoir un léger temps d’arrét. - % (d) ‘aucune mauvaise réponse. = 47: Choisir la ou les mauvaise(s) réponses : La Tolérance de partition signifie que : ® (a) le systéme doit bien fonctionner sur les réseaux distribués. ‘e(b) le systéme peut continuer son service loisqie cértaines de ses grappes (clusters) deviennent indisponibles. (c) le systéme’ fonctionne bien méme si les données. ne sont pas par- < _ tionnées. (@) aucune mauvaise réponse. 48. Choisir pari les éléments suivants celle ou ceux qui peuvent étre considéré(s) comme avantages de NoSQL : ‘*(a) Capable de gérer un volume important de données structurées, semi- structurées et non structurées. = ‘#(b) Programmation orientée objet facile & utiliser ot flexible, - (c) Réplication difficile. i. #(d) Il offré des performances rapides et une évolutivité horizontale. 9 (e) Ipeut servir de source de'données principale pour les applications en ligne. ‘9(f) Excelle dans les opérations de bases de données Aistribuées et multi data center. 49. Différence clé entre SQL et NosQL (a) Les bases de données SQL sont évolutives horizontalement, tandis que les bases de données NoSQL sont évolutives verticalement. 9 (b) Les bases de données SQL ont un schéma prédéfini alors que les bases de données NoSQL ont un schéma dynamique pour les données non structurées. ~ . (©) Les bases de données NoSQt, conviennent parfaitement & environ- noment exigeant de nombreuses requétes, tandis que les bases SQL ne conviennent pas aux requétes complexes. € (d) Les bases de données SQL ne conviennent pas an slockage de données higrarchique. Cependant, In base dle données NoSQL convient mieux au stockage de données hiérarchique. 50. SQL protige activement Pintégrité de votre base de dont Ja conformité ACID tant dis que NoSQL gagne en popularité en yous permettant de stocker différents types de données ensemble et vous pouvez facilement évoluer en répartissant plusieurs serveurs. (a) Vrai (b) Faux 51. Quels sont les principaux composants du Big Data? {a) HDFS (b) MapReduce (©) YARN (a) ‘Tout ce qui précdde So 52. Sur laquelle des plates-formes suivantes Hadoop s'exécute-t-il? ate (a) Debian 5, ~~ (b) Detype Unix ™ : E ‘e(c) Multiplateforme 53, Les données d’une taille de «....octets sont appelées données volumineuses (a) Méga (by Giga = (©) Téa - (a) Peta 3 : 54." Une ‘Transaction de données de la. banque est un type de. (a) Données structurées V7" oo a (b) Données non structurées (c) Les deux # (d) aucune de ces réponses 55. Les données volumineux sont ‘de plusieurs formes _ (a) Non strticturées, structurées et semi-structurées (b) Non structurées, structurées (0) Structurées, somi-structurées (d) Non structurées, semi-structurées. 56. Identifiez les technologies Big Data incorrectes. (a) Apache kafka m 1 fournissant (b) Apache Halo? 7 (0) Apndle Pytor (a) Apache Spark. ' Dan quelle lange Tecloo? cestil 6oril? (a) C4 (b) Java (6) Python (a) Rust ‘est une collection de données qui est Grott de fagon exponenticlle avec Je temps- (a) Grande base de données: (b) Grand SGBD (c) Grand ensemble d (a) Big data’ 59. Identifier les différentes fonctionnalités de Big Data Analytics. (a) Open source (b) Récupération des données ‘s * (c) Bvolutivité (a) Tout les réponses sont justes décrit la raison exacte pour 60, Parmi les options suivantes, choisissez celle qui Ioguelle Vanalyse de données volumnineuses est difficile & optimiser. (a) La technologie pour extraire les données (0) Le Big data n'est pas difficile & optimiser (0) A la fois les donriées et les. moyens réntables d’extrairé des données pour en tirer un ee cnn 7” eee . (d) Aucunes'de ces réporises ‘ 61. Tous les éléments suivants décrivent avec précision Hadoop, sauf : (a) Open source . : (b) Basé sur Java (@) ‘Temps réel E (4) Approche inforniatique distribuée 62, Lesquels des élés i y d Lesquls des léments suivants sont les avantages du traitement du Big _ (a) Améliorer le service client, a Meilleure efficacité opérationnelle (c) Les entreprises peuvent utili utiliser i st ns Ia prise de décision, bon serevattatts exténieura lore de tilisée en volume, 01% qui je données 10 (d) Tout ce qui préctde. 4 63. L’analyse de données volumineuses fait ce ‘qui suit, soul? (a) Diffuse les données (b) Analyse des données SM (c) Organise les données (a) Collecter les: données 64, Laquelle des affirmations: suivantes est vale (a) Les: mégadonnées peuvent tre traitées tionnelles. (b) Les mégadonnées fon! taille est d’au moins un pé {c) Vranalyse de données volumnineuses implique Pi reporting et d’exploration des données. (a) Les mégadonnées ont une faible vitesse, ce qui signifi qu'elles sont générées lentement. 65. Lequel des éléments suivants peut généralement tre utilisé pour nettoyer ct préparcr le Big Data”. (a) Pandas (b) U-SQL (c) Data warehouse ~ © @) Data lake 66. Li classe Mapper est : z 2 (a) Type statique ~. (b) Genre pénériqvis//. ee z (c) Type abstrait Serer a (@ Final 8 a fs ont 67. Parmi les éléments éuivants, lequel controle Te Job dans Hadoop? (a) Task class " (b), Mapper class 2 oe : (©) Job class’ et : (@) Reducer class ‘ 68, Les morceatix de taille de... ; (@) Splits U— (b) Tasks ‘ . (c), Map (a) Records 69. Identifier le noeud esclave parmi les suivants: concernant le Big, Data? i Paide de techniques tradic 1 référence & des ensembles de données dont Ja note A was de techniques de fixe du travail MapReduce sont connus sous le nom i (2) Job riode — (b) Data node (©) Task node fame node ° wal ‘des données sur les données. (a) HDFS (b) MapReduee (c) YARN 7 tous les réponses prévédentes sont ee Th. A quoi sert le nettoyage des données? (.) Pour supprimer les données bruyantes : (0) Transformations pour, corriger les mauvaises données (¢) Corriger les irieohérences dans les données (a) Tout ce qui préctde. 4 Quelle est la quantité minimale de donaées qu'un dis dans HDFS? % (a) Taille ex-octets, (b) Taille de blo« we . (c) Heap x(a) Aucune de ces réponses n'est 175, De grandes... de données sont consi (a) volumes : (b) Véracité (0) Varigté ~ : (d) Aucun des éléments mientionnés ci-dessus. La véracité garantit que les données sont.. .que peut lire ou écrire 72. sorrecte. *, 2 idérées cornme des mégadonnées. 74. 7 (a) Précis \/ S < (b) Incohérence (c) Une variante (d) Aucun des éléments mentionnés ci-dessus La validité fait référence a la précision et & exactitude des données pour %. utilisation prévue. (a) Vrai (b) Faux 76. Chaque jour, le monde produit des quintill ¥ guintillions 4 é ae it illions d’octets de données. (b) Faux 12 77. Le © volume, Ia vélocité ot Ia vari6¥é somber pout le BIE Data, (@) Intrinstque (b) Extrinstque He eo éponses précédentes sont justes, AS i des éléments mentionnés ci-dessts. ae ae a a des données totales du monde a let ernidres années est 7 (a) 80% (b) 85% (c) 90% (a) 95% ‘ 79. Comment Hadoop a-t-il été nomimé? (a) Le numéro de cirque préféré du créateur Doug Cutting ~ (b) Le groupe de rock du lycée Cuttings ‘ (¢) L’éléphanit en peluche du fils de Cutting » (a) Unison deVordinateur portable de Cutting réalisé pendant le développement | de Hadoop. ossbde le plus wand cluster ade au inonde. _ (a) Google =~ ‘ : *(b) ‘Linkedin RS SPR oe (©) Pacbook meget tarts _(d) IBM ee 5 81, Facebook s'attague au Big Data avec. (a) 1e*Prism project” (b) "Prism? ~ 3 genet (c) le "project Big” “ sts (d) le "Project data” ’ été créé juste au basé sur Hadoop. 13

Vous aimerez peut-être aussi