图解HBase--大数据平台技能栈
发布时间:2019-07-31 21:16:45 所属栏目:教程 来源:架构师公社
导读:HBase简介 HBase是一个漫衍式的、面向列的开源数据库存储体系,是对Google论文BigTable的实现,具有高靠得住性、高机能和可伸缩性,它可以处理赏罚漫衍在数千台通用处事器上的PB级的海量数据。BigTable的底层是通过GFS(Google文件体系)来存储数据,而HBase对应的
当MemStore到达hbase.hregion.memstore.flush.size巨细的时辰会将数据刷写到磁盘,天生StoreFile。跟着营业的成长,数据量会越来越大,会发生许多的小文件,对付HBase的数据读取,假如要扫描大量的小文件,会导致机能很差,因此必要将这些小文件归并成一个大一点的文件。 所谓的小归并,就是把多个小的StoreFile组合在一路,形成一个较大的StoreFile,凡是是累积到3个SotreFile后执行。通过hbase.hstore.compationThreadhold参数设置,小归并的步调如下:
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |