Académique Documents
Professionnel Documents
Culture Documents
Overview
Classe:3 SIC,EAN
Enseignant. Mahrez Hosni
ECOLE NATIONALE DES SCIENCES ET TECHNOLOGIES AVANCÉES
DE BORJ CÉDRIA
pour des besoins divers, les données de la base de données, en toute sécurité.
Big data: Introduction
comme suit» :
Big data: Introduction
Vélocité :
toutes les heures à partir des transactions de ses clients. YouTube est
autres dimensions des données Big Data (on parle aussi des « 5 V du
Big Data»)
Véracité :
davantage
Valeur :
démarche Big Data n’a de sens que pour atteindre des objectifs
1. Descriptive Analytics
Celui-ci résume les données passées sous une forme que les
gens peuvent facilement lire. Cela aide à créer des
rapports, comme les revenus, les bénéfices, les ventes
d’une entreprise, etc. En outre, cela aide à la compilation
des mesures des médias sociaux.
Different Types of Big Data Analytics
2. Diagnostic Analytics
3. Predictive Analytics
4. Prescriptive Analytics
HEAVY.AI
Plateforme d'analyse visuelle interactive capable de traiter
d'énormes ensembles de données multi-sources en quelques
millisecondes.
Apache Kafka:
Pig
Open source technology for parallel programming of MapReduce
jobs on Hadoop clusters.
Spark
Open source and parallel processing framework for running large-
scale data analytics applications across clustered systems.
YARN
Cluster management technology in second-generation Hadoop.
Zookeeper – Coordination des applications distribuées
Zookeeper
Introduction
Pour bien comprendre tout ce qui précède, il faut d'abord connaître les
produits de base des big data : il s'agit généralement de Hadoop,
MapReduce et Spark (trois produits développés dans le cadre des
Apache Software Projects).
Hadoop
Hadoop est considérer parmi les meilleures systemes de stockage de type Data
Lake ( data lake propose un endroi ou on peut stocket notre données sans avoir le
type ou le structure )
Sqoop – Importation de données dans les bases relationnelles