Mini Cahier Charge

Transféré par

faysal maiga

0% ont trouvé ce document utile (0 vote)

107 vues4 pages

RAS

Copyright

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Signaler ce document

RAS

Droits d'auteur :

Signaler comme contenu inapproprié

0% ont trouvé ce document utile (0 vote)

107 vues4 pages

Mini Cahier Charge

Transféré par

faysal maiga

RAS

Droits d'auteur :

Signaler comme contenu inapproprié

Passer à la page

Vous êtes sur la page 1sur 4

Rechercher à l'intérieur du document

Conception et développement d’un moteur de recherche et

d’indexation des documents basés sur les techniques de Big

Data.
OBJECTIF GLOBAL DU PROJET ET ARCHITECTURE :

Le choix des outils :

Nous voulons réaliser un moteur de recherche permettant a n importe qui rechercher

n importe quel document sur le web .La recherche et la réponse doit être en temps
réel et il va falloir tenir compte du volume de données a traiter d’où l intégration des
techniques Big Data.
1 – Apache Kafka :
C est un outil permettant la gestion des flux de données en temps réel.
Le temps réel consiste a traiter les données au même moment quelles
nous parviennent en minimisant la latence(tenir compte de l’échelle de
temps).
Kafka dispose de deux éléments le rendant intéressant à manipuler a
savoir :
---- Une file d’attente :
permettant d’ajouter des messages avec une latence faible ;
conserve l’ordre d’arrivés des messages;
stocker de manière fiable les données qui doivent être
redondées et distribuées ,
----Un system de traitement de flux de données :
permettant de traiter les données de manière distribués pour
pouvoir passer a l’échelle avec le volume de données;
permettant d’avoir au system de stockage pour stocker les
résultat des traitement
détecter les erreurs de traitements.
2 –ElasticSearch :
C est un outil permettant de mettre en place un system complexe.
Il permet de stocker les informations dans un premier temps et aller les
récupérer dans un second temps. Donc va nous faciliter la tache dans la
réalisation du moteur de recherche.
ElasticSearch stocke les informations de manière non -structurées et offre la possibilités de le
déployer sur plusieurs machines afin d’optimiser le résultat et fonctionne avec Java.
Il jouera le rôle d’une Base de données orienté recherche.
3-Hadoop HDFS :
Le choix du System de gestion de fichier de HADOOP est sans regret car il propose pas mal
de fonctionnalités.
Premièrement dans notre futur system il portera aide a ElasticSearch qui sera incapable de
traiter les données a niveau donné(ZETA-OCTETS de données).
Hadoop permet de réaliser des calculs distribuez sur des données massives(Big Data).
Il permet ainsi de répondre aux questions telles que :
comment stocker ces données ?
les filtrer?
les analyser?
Ce modelé distribués permet un plus grande tolérance aux pannes : lorsqu' un nœud du
cluster subit une panne, il suffit d’affecter la tache a un autre nœud du cluster.
Le Framework Hadoop est composé :
- d’une architecture permettant l orchestration de MapReduce
- d’ un Système de Gestion de fichier (HDFS) qui est :
distribués
répliqués
optimisés
L’architecture de stockage est une architecture Maitre-Esclaves.
Le Nœud Maitre : contient et stocke tous les noms et blocs des fichiers ainsi que leur
localisation dans le cluster.
Les autres nœuds sont pour le stockage physique des données en tant que tels.
Ils ont pour rôle la gestion des opérations locales (création , suppression et
réplications des blocs ) sur des instructions du maitre.
Le jobTracker : est un processus maitre qui va charger de l ensemble de ressources du système
Le taskTracker : est une unité de calcul du cluster. Il assure en lançant une JVM , l’exécution
Et le suivi des taches MapReduce s’exécutant sur son nœud.
Il dispose ainsi d’un composant YARN permettant de gérer le cluster .
Il est Open Source par rapport aux autres et assez documenté.
Ceci explique notre choix sur Hadoop HDFS.

Vous aimerez peut-être aussi

Bien débuter avec SQL: Exercices dans l'interface PhpMyAdmin et MySQL
D'Everand
Bien débuter avec SQL: Exercices dans l'interface PhpMyAdmin et MySQL
Rémy Lentzner
Pas encore d'évaluation
Resume Big Data
Document9 pages
Resume Big Data
Khaoula RAZZAKI
Pas encore d'évaluation
Cours Intro Hadoop v27022014 Erraki Haddad
Document62 pages
Cours Intro Hadoop v27022014 Erraki Haddad
Zohra CHANNOUF
Pas encore d'évaluation
Lec1,2,3 ch1,2
Document14 pages
Lec1,2,3 ch1,2
Mariam Kilany
Pas encore d'évaluation
Leçon EcoSystemHadoop PDF
Document15 pages
Leçon EcoSystemHadoop PDF
Hadil Mlika
Pas encore d'évaluation
Hadoop 1
Document61 pages
Hadoop 1
Mouhamed Bouazzi
Pas encore d'évaluation
Hadoop (Rihab Chaouch Et Alaa El Ghoul
Document17 pages
Hadoop (Rihab Chaouch Et Alaa El Ghoul
Chaouch Mohamed Abd Salem
Pas encore d'évaluation
CH 1
Document53 pages
CH 1
ya.latreche
Pas encore d'évaluation
résBigData 2
Document11 pages
résBigData 2
Elleuch Mariem
Pas encore d'évaluation
Hadoop Ecosystem
Document37 pages
Hadoop Ecosystem
hajar.filali4
Pas encore d'évaluation
Résumé Big Data
Document6 pages
Résumé Big Data
El Moumne Nihal
Pas encore d'évaluation
Big Data: Marie NDIAYE
Document28 pages
Big Data: Marie NDIAYE
Serigne Ndour
Pas encore d'évaluation
Chapitre2 BigData
Document35 pages
Chapitre2 BigData
ouma ima
Pas encore d'évaluation
Examen Big DATA
Document4 pages
Examen Big DATA
zaki worker
Pas encore d'évaluation
Hadoop
Document89 pages
Hadoop
CHAIMA SAKKA
Pas encore d'évaluation
Lab 3
Document15 pages
Lab 3
Maryâm Bôuch
Pas encore d'évaluation
Présentation D'HADOOP
Document38 pages
Présentation D'HADOOP
Ferdinand Owona
Pas encore d'évaluation
Controle
Document24 pages
Controle
christian raharinirina
Pas encore d'évaluation
Big Data Version1
Document14 pages
Big Data Version1
Amd Yousra
Pas encore d'évaluation
Prensentation DATALAKE
Document17 pages
Prensentation DATALAKE
PascalBalissat
Pas encore d'évaluation
Chapitre 2 Final FR
Document94 pages
Chapitre 2 Final FR
Äya Ķh
Pas encore d'évaluation
Chapitre 2 - Introduction Rtos
Document9 pages
Chapitre 2 - Introduction Rtos
elmcadbuick
Pas encore d'évaluation
Cours 02 Intro Hadoop
Document30 pages
Cours 02 Intro Hadoop
Michael Sniper Wu
Pas encore d'évaluation
Chapitre2 Fondements Big Data Hdfs
Document23 pages
Chapitre2 Fondements Big Data Hdfs
Hmad SADAQ
Pas encore d'évaluation
Summup
Document4 pages
Summup
aliexpressm585
Pas encore d'évaluation
Exploitation Des Data Centers Et Cloud Computing
Document26 pages
Exploitation Des Data Centers Et Cloud Computing
christian raharinirina
Pas encore d'évaluation
Semaine 3
Document63 pages
Semaine 3
benben08
Pas encore d'évaluation
Big Data
Document3 pages
Big Data
Lamiae Elgueloui
Pas encore d'évaluation
Hadoop Hdfs and Yarn Mapreduce
Document63 pages
Hadoop Hdfs and Yarn Mapreduce
Oumayma Tajir
Pas encore d'évaluation
Cours 2 Architecture - Big Data Hadoop - HDFS
Document54 pages
Cours 2 Architecture - Big Data Hadoop - HDFS
alaska8fouad
Pas encore d'évaluation
Base Donnes MySQL
Document12 pages
Base Donnes MySQL
Loubna Nejjari
Pas encore d'évaluation
Lab 4
Document20 pages
Lab 4
Maryâm Bôuch
Pas encore d'évaluation
Chapitre 1 Introduction Aux Bases de Donnees
Document3 pages
Chapitre 1 Introduction Aux Bases de Donnees
Fredi Alexandre
Pas encore d'évaluation
CER 4 Environnements Héterogènes
Document12 pages
CER 4 Environnements Héterogènes
Nwantou Tchouameni
Pas encore d'évaluation
Chap1-Big Data Pour Entreprise Et Ecosystème Hadoop - Oct 2023
Document37 pages
Chap1-Big Data Pour Entreprise Et Ecosystème Hadoop - Oct 2023
Khalid Harrati
Pas encore d'évaluation
Cour 9
Document7 pages
Cour 9
Ran Ia
Pas encore d'évaluation
Intro Data Lake
Document33 pages
Intro Data Lake
Mabrouka Chouchane Ep Jaidi
Pas encore d'évaluation
Partie Hadoop Et Ecosystème
Document93 pages
Partie Hadoop Et Ecosystème
Safa '
Pas encore d'évaluation
Chap 0
Document6 pages
Chap 0
Hadjer Dermane
Pas encore d'évaluation
Stockage Objet 8 Points Pour Bien Comprendre
Document5 pages
Stockage Objet 8 Points Pour Bien Comprendre
ndeyematy.611
Pas encore d'évaluation
Haddop VF
Document126 pages
Haddop VF
Nour
Pas encore d'évaluation
S3M01
Document15 pages
S3M01
ahmed guenouz
Pas encore d'évaluation
Chapter 2 HDFS and ZooKeeper - v2
Document70 pages
Chapter 2 HDFS and ZooKeeper - v2
Sweety Princess
Pas encore d'évaluation
Comment Choisir Son SGBD
Document7 pages
Comment Choisir Son SGBD
yvesmayer
Pas encore d'évaluation
Leçon2 - Hadoop, MapReduce Et Le Big
Document52 pages
Leçon2 - Hadoop, MapReduce Et Le Big
Mido pro
Pas encore d'évaluation
Chapitre II - Hadoop
Document37 pages
Chapitre II - Hadoop
Mariem SELMI
Pas encore d'évaluation
Intro BIG DATA
Document34 pages
Intro BIG DATA
Fernovy Gesner
Pas encore d'évaluation
Juno SlidesCarnival
Document43 pages
Juno SlidesCarnival
Maria Boulefaa
Pas encore d'évaluation
Apache Spark
Document16 pages
Apache Spark
MOHAMED ELRHAOUAT
Pas encore d'évaluation
SGBD Oracle
Document63 pages
SGBD Oracle
ange ettien
Pas encore d'évaluation
Struts
Document5 pages
Struts
Hassan Mabchor
Pas encore d'évaluation
NoSQLziad (1) - 1
Document34 pages
NoSQLziad (1) - 1
Dimokrati Houssam
Pas encore d'évaluation
Cours 1.0. Généralités Sur Les Systèmes Dexploitation
Document36 pages
Cours 1.0. Généralités Sur Les Systèmes Dexploitation
Kevin Milenda
Pas encore d'évaluation
Chap 0
Document6 pages
Chap 0
ELaidouni Amara
Pas encore d'évaluation
Composants
Document28 pages
Composants
KHAWLA JABARI
Pas encore d'évaluation
Spark Ji
Document37 pages
Spark Ji
Faten Clubistia
Pas encore d'évaluation
BD RTS
Document13 pages
BD RTS
Joe
Pas encore d'évaluation
CHAPITRE I Caractéristique D'une Base de Donnée
Document11 pages
CHAPITRE I Caractéristique D'une Base de Donnée
Jordan Mefoumane
Pas encore d'évaluation
Chap 1
Document4 pages
Chap 1
Yasmine Hm
Pas encore d'évaluation
TP Alvin
Document6 pages
TP Alvin
expoukv
Pas encore d'évaluation
Memoir Fin D Etude e Commerce
Document42 pages
Memoir Fin D Etude e Commerce
فيديوهات متنوعة والاغاني
Pas encore d'évaluation
TP GestionInstance
Document2 pages
TP GestionInstance
Oussama Fathallah
Pas encore d'évaluation
Ch3 Langage C PIC
Document8 pages
Ch3 Langage C PIC
Møūrād Bēldī
Pas encore d'évaluation
Exercices Et Autres Consignes 10
Document101 pages
Exercices Et Autres Consignes 10
Tarik Qazzabari
100% (1)
Architecture Du Web
Document77 pages
Architecture Du Web
Titou Imene Lola
Pas encore d'évaluation
Téléchargez Vos Chaînes - Smarttv - Club
Document1 page
Téléchargez Vos Chaînes - Smarttv - Club
LESLY VICTOR
Pas encore d'évaluation
Manuel Utilisation Zimbra Webmail 24052012
Document57 pages
Manuel Utilisation Zimbra Webmail 24052012
Fares Braiek
Pas encore d'évaluation
Chap 8 - Dépannage
Document2 pages
Chap 8 - Dépannage
Amal Aitbella
Pas encore d'évaluation
FIP PL-SQL
Document37 pages
FIP PL-SQL
Khadija Asehnoune
Pas encore d'évaluation
Act3 1
Document14 pages
Act3 1
Mzoughi Haythem
Pas encore d'évaluation
Comment Supprimer Les Fichiers Temporaires Dans Windows
Document2 pages
Comment Supprimer Les Fichiers Temporaires Dans Windows
Mireille4772
Pas encore d'évaluation
Javance Cours Android
Document97 pages
Javance Cours Android
أم أروى
Pas encore d'évaluation
(TUTO) (Hacking) Sécurité Informatique - Connaissances Requises Et Initiation Au Hacking PDF
Document18 pages
(TUTO) (Hacking) Sécurité Informatique - Connaissances Requises Et Initiation Au Hacking PDF
Cédric Leven
100% (2)
ENCH RETAiL eBOOk-NOGRP
Document84 pages
ENCH RETAiL eBOOk-NOGRP
Faten ben yahia
Pas encore d'évaluation
Ref Metier Comp Cap Electricien
Document42 pages
Ref Metier Comp Cap Electricien
Mamadou Diouf (Koorndella)
Pas encore d'évaluation
Qlik Sense Administration Cours & Exercices 022018
Document80 pages
Qlik Sense Administration Cours & Exercices 022018
Tarek Cherif
Pas encore d'évaluation
98 M W9 IRIV7 B KB0 Smuj NNF RQL3 KJ KQ 1 UF4 SK2 KL P4
Document103 pages
98 M W9 IRIV7 B KB0 Smuj NNF RQL3 KJ KQ 1 UF4 SK2 KL P4
Alâa Hriz
Pas encore d'évaluation
1.apprentissage Technique Des Fonctionnalités Les Plus Utilisées Pour La Réalisation Du Mapping Vidéo
Document6 pages
1.apprentissage Technique Des Fonctionnalités Les Plus Utilisées Pour La Réalisation Du Mapping Vidéo
Paula Rojas Amador
Pas encore d'évaluation
TLC Livre
Document104 pages
TLC Livre
sasori Samo
Pas encore d'évaluation
La Configuration Parfaite de La Passerelle Zentyal
Document22 pages
La Configuration Parfaite de La Passerelle Zentyal
jehu7
100% (4)
Livret de Competences
Document12 pages
Livret de Competences
NEGRETISSA
Pas encore d'évaluation
N Acc5
Document16 pages
N Acc5
Anou Ar
Pas encore d'évaluation
Rapport Projet C
Document15 pages
Rapport Projet C
Safia Garrouj
100% (1)
Chapitre-1 UML
Document43 pages
Chapitre-1 UML
Tekrour Zak
Pas encore d'évaluation
Serveur DNS: Définition
Document8 pages
Serveur DNS: Définition
tommylarca
Pas encore d'évaluation
Leçon 1 - Fondements de Powerpoint
Document23 pages
Leçon 1 - Fondements de Powerpoint
Offiana HORO
Pas encore d'évaluation
Application Mobile Et Web de Traçabilité de Réservation D'équipements Et de Consommables
Document66 pages
Application Mobile Et Web de Traçabilité de Réservation D'équipements Et de Consommables
Chaima awedni
Pas encore d'évaluation
Rex Xibo Client
Document2 pages
Rex Xibo Client
api-342959600
Pas encore d'évaluation
Les Antivirus
Document2 pages
Les Antivirus
Théodore Kabore
Pas encore d'évaluation
CL413G Formation db2 For Luw Performance Tuning and Monitoring Workshop PDF
Document1 page
CL413G Formation db2 For Luw Performance Tuning and Monitoring Workshop PDF
CertyouFormation
Pas encore d'évaluation