10分钟零基本就可搞懂的Hadoop架构道理,阿里架构师详解
MemStore是Sorted Memory Buffer,用户写入的数据起首会放入MemStore,当MemStore满了往后会Flush成一个StoreFile(底层实现是HFile), 当StoreFile文件数目增添到必然阈值,会触发Compact归并操纵,将多个 StoreFiles 归并成一个 StoreFile,归并进程中会举办版本归并和数据删除。 因此可以看出HBase着实只有增进数据,全部的更新和删除操纵都是在后续的 compact 进程中举办的,这使得用户的写操纵只要进入内存中就可以当即返回,担保了 HBase I/O 的高机能。 当StoreFiles Compact后,会慢慢形成越来越大的StoreFile,当单个 StoreFile 巨细高出必然阈值后,会触发Split操纵,同时把当前 Region Split成2个Region,父 Region会下线,新Split出的2个孩子Region会被HMaster分派到响应的HRegionServer 上,使得原先1个Region的压力得以分流到2个Region上。 三、Hadoop的应用实例1.回首Hadoop的整体架构 ![]() 2.Hadoop的应用——流量查询体系 (1)流量查询体系总体框架 ![]() (2)流量查询体系总体流程 ![]() (3)流量查询体系数据预处理赏罚成果框架 ![]() (4)流量查询体系数据预处理赏罚流程 ![]() (5)流量查询NoSQL数据库成果框架 ![]() (6)流量查询处事成果框架 ![]() (7)及时流计较数据处理赏罚流程图 ![]()
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |