Vous êtes sur la page 1sur 11

Elaboré par :meftahi Najet

PLAN

01 INTRODUCTION
03
UTULISATION

CARACTERESTIQUES
02 04 EXEMPLE

05 CONCLUSION
1
INTRODUCTION

Explication brève et concise du Big Data

Le Big Data fait référence à l'ensemble des données


massives et complexes qui sont générées à une
vitesse élevée et qui dépassent la capacité des
méthodes traditionnelles de gestion et d'analyse des
données. Il se caractérise par les fameux "3V" : le
volume, la variété et la vélocité

le Big Data désigne l'ensemble des données


volumineuses, variées et générées à grande vitesse,
nécessitant des méthodes spécifiques pour les gérer,
les analyser et en tirer des informations pertinentes.

2
Les Caractéristiques

3
POURQUOI UTILISE
LE BIG DATA ?

Difficulté de traiter la
masse de données
produites chaque jour.
Les informations sont
produite en temps réel .
Problème
d’optimisation
de base de données.

4
HADOOP?
o 2004 : conçu par Doug Cutting.
o Framework Open Source . Stockage moins couteux de très
o Ecrit en java . gros.
o Aide à créer des application Volumes données (Po).
distribuées. Les réseaux Sociaux
o Résiste aux pannes. Les Sites e-commerce .
o 2009 : fondation logicielle Résiste aux pannes.
Apache . Analyse de Fichier non
structurés(log).

5
HDFS?

o Hadoop Distributed File


System.
o Système de stockage.
o Possibilité de stocker des
pétaoctets de données .
o Traitement parallèle et
distribué.
o Tolérance aux erreurs avec la
réplication des données.

6
MANIPULATION DU FICHIER

• Hadoop permet de stocker et de traiter de grands volumes de données en utilisant une


architecture distribuée. HDFS est la couche de stockage distribué de Hadoop, qui permet de
stocker de grandes quantités de données sur un cluster de machines.
• En utilisant Hadoop et HDFS, nous avons traiter le fichier netflix_titles.csv. c'est un
ensemble de données, qui contient des informations sur les titres disponibles sur Netflix, y
compris les films, les émissions de télévision et les documentaires . on utilise Hadoop pour
analyser ces données afin d'extraire des informations intéressantes et des tendances.
• Pour manipuler le fichier netflix_titles.csv à l'aide de Hadoop et HDFS nous avons utilisé
certain commande pour le fichier Netflix comme expliqué la vidéo suivante :

7
8
CONCLUSION

En résume Hadoop et HDFS sont des technologies Big Data clés qui ont révolutionné la façon dont les entreprises
stockent, gèrent et analysent les données. En utilisant Hadoop et HDFS, les entreprises peuvent stocker et traiter
des quantités massives de données à grande échelle, ce qui leur permet d'extraire des informations précieuses sur
les tendances du marché, les préférences des consommateurs, la performance des produits,
Grâce à ces technologies, les entreprises peuvent prendre des décisions éclairées et rester compétitives dans un
environnement commercial en constante évolution.

9
Merci pour votre attention

Vous aimerez peut-être aussi