图解HBase--大数据平台技能栈
副问题[/!--empirenews.page--]
HBase简介 HBase是一个漫衍式的、面向列的开源数据库存储体系,是对Google论文BigTable的实现,具有高靠得住性、高机能和可伸缩性,它可以处理赏罚漫衍在数千台通用处事器上的PB级的海量数据。BigTable的底层是通过GFS(Google文件体系)来存储数据,而HBase对应的则是通过HDFS(Hadoop漫衍式文件体系)来存储数据的。 HBase差异于一样平常的相关型数据库,它是一个得当于非布局化数据存储的数据库。HBase不限定存储的数据的种类,应承动态的、机动的数据模子。HBase可以在一个处事器集群上运行,而且可以或许按照营业举办横向扩展。 HBase特点 ![]() 海量存储:HBase得当存储PB级此外海量数据,在PB级此外数据以及回收便宜PC存储的环境下,能在几十到百毫秒内返回数据。这与HBase的影象扩展性痛痒相干。正是由于HBase的精采扩展性,才为海量数据的存储提供了便利。 列式存储:列式存储,HBase是按照列族来存储数据的。列族下面可以有很是多的列,列族在建设表的时辰就必需指定,而不消指定列。 极易扩展:HBase的扩展性首要表此刻两个方面,一个是基于上层处理赏罚手段(RegionServer)的扩展,一个是基于存储手段(HDFS)的扩展。 高并发:今朝大部门行使HBase的架构,都是回收便宜PC,因此单个IO的耽误着实并不小,一样平常在几十到上百ms之间。这里说的高并发,首要是在并发的环境下,HBase的单个IO耽误降落并不多。 稀少:稀少首要是针对HBase列的机动性,在列族中,可以指定恣意多的列,在列数据为空的环境下,是不会占用存储空间。 HBase与相关型数据库比拟 ![]() HBase数据模子
![]() 物理视图 在物理存储上,数据是以Key-Vaule对情势存储,每个Key-Value只存储一个Cell内里的数据,差异的列族存储在差异的文件中,每个逻辑单位格(Cell)会对应一行数据,有Timestamp标志版本,每次插入、删除城市天生一行数据(append-only,写服从高)。 ![]() ![]() HBase系统架构 HBase的处事器系统布局遵循简朴的主从处事器架构,一样平常一个HBase集群由一个Master处事(高可用的话,至少两个)和1个或多个RegionServer处事构成。Master处事认真维护表布局信息,现实的数据是生涯在RegionServer上,最终RegionServer生涯的表数据会直接存储在HDFS上。HBase的系统架构图如下图所示: ![]() Master HBase的打点节点,在一个集群中Master一样平常是主备的,主备的选择是由Zookeeper实现的。 HBase Master首要职责:
RegionServer RegionServer首要认真处事和打点Region。在漫衍式集群中,提议RegionServer和DataNode凭证1:1比例陈设,这样RegionServer中的数据文件可以存储一个副本于本机的DataNode节点中,从而在读取数据时可以操作HDFS的"短路径读取(Short Circuit)"来绕过收集哀求,低落读延时。 RegionServer内部打点一个或多个Region。Region很多Store构成。每个Store对用Table中的一个列族存储,即一个Store打点一个Region上的一个列族。每个Store包括一个MemStore和0到多个StoreFile。 RegionServer的首要职责:
Zookeeper HBase通过Zookeeper来做Master的高可用、RegionServer的监控、元数据的进口以及集群设置的维护等事变。详细事变如下:
HDFS (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |