Vous êtes sur la page 1sur 1

Introduction au Big Data

Dr Abir KHALDI

Chapitre 2 : Hadoop
Activité

• Soit le fichier babynames.txt contenant les noms des bébés , leurs sexes (F,M) ainsi que leurs
dates de naissances pour l’année 2020.

• Le fichier est de taille 850 MO .

• Le cluster Hadoop est composé de 5 Nœuds esclaves et un nœud maitre et le nombre de


replica configuré par défaut est 3.

Travail demandé :
• Proposer l’architecture HDFS pour sauvegarder le fichier babynames.txt.

NB : Préciser les composants de l'architecture HDFS et expliquer la répartition du fichier sur


les différents nœuds du cluster Hadoop.

Vous aimerez peut-être aussi