Vous êtes sur la page 1sur 4

Cas de Hbase:

Historique : Novembre 2006: Google sort son papier sur Bigtable Fvrier 2007 : Version prototype de Hbase /Contribution Hadoop Octobre 2007 : Premire version de Hbase Janvier 2008 : Hadoop devient un top-level la fondation Apache et Hbase un sous-projet Mai 2010 : Hbase devient un top-level project la fondation Apache Pourquoi Hbase ? Les jeux de donnes sont de plus en plus importants : Traoctets au Petaoctets ou plus Les bases de donnes traditionnelles ne suffisent tout simplement plus ! Hbase Distribue : Oriente colonne Multidimensionnelle Haute Disponibilit Haute Performance Systme de stockage Hbase nest pas Une base de donnes SQL traditionnelle Pas de jointures, pas de moteur dinterrogation, pas de types, pas de SQL Un remplaant direct de votre SGBDR A vous dapprcier un SGBDR sans schma Donnes d normalises Tables larges et peu peuples Comment fonctionne Hbase ?

Deux types de nuds Master et RegionServer Master (un la fois) Gre les oprations du cluster Affectation, rpartition de la charge, fractionnement Haute disponibilit avec Zookeeper RegionServer Hberge les tables, excute les lectures, critures Les clients dialoguent directement avec eux pour les lectures /critures Hbase Tables Un cluster Hbase est constitu dun nombre quelconque de tables dfinies par lutilisateur Schma de la table ne dfinit que ses familles de colonnes Chaque colonne se compose dun certain nombre de version Colonnes nexistent que lorsquelles sont insres, pour les Null elles sont libres Tout sauf les noms de table/famille sont byte [] Lignes dune table sont stockes de manire squentielle Les colonnes dune famille sont tries et stockes de manire squentielle

Architecture de Hbase

Les informations des rgions et leurs emplacements sont ranges dans des tables spciales appeles catalog tables ROOT est la table contenant les emplacements des mtas tables META.table contient les schmas et les emplacements des rgions utilisateur Lemplacement de ROOT est stock par zookeeper Cest lemplacement de dmarrage Zookeeper est exploit pour la surveillance et la coordination Elit le nud maitre Nud phmre pour dtecter des dfaillances de nud RegionServer

Caractristiques Partitionnement automatique des donnes Lorsque les donnes saccumulent, Hbase les fractionne automatiquement Distribution transparente de la donne La rpartition de la charge est faite par le systme lui-mme

Les tables sont tries par lignes, les lignes selon les colonnes Dfinit un accs plus rapide Insertion et suppression de nuds chaud Le dplacement des emplacements ne bouge pas les donnes Supporte la cration et la modification des tables chaud Tant au niveau des tables quau niveau des paramtres de configuration Lien troit avec Hadoop MapReduce

Vous aimerez peut-être aussi