兄弟,这种思路讲解HDFS你肯定没见过,快速入门Hadoop必备
究竟上,DataNode会通过心跳和NameNode保持通讯,假如DataNode超时未发送心跳,NameNode就会以为这个DataNode已经失效,当即查找这个DataNode上存储的block有哪些,以及这些block还存储在哪些处事器上,随后关照这些处事器再复制一份block到其他处事器上,担保HDFS存储的block备份数切实用户配置的数量,纵然再有处事器宕机,也不会丢失数据。 HDFS应用 Hadoop漫衍式文件体系可以象一样平常的文件体系那样举办会见:行使呼吁行可能编程说话API举办文件读写操纵。我们以HDFS写文件为例看HDFS处理赏罚进程,如下图。 ![]() HDFS写文件操纵
HDFS固然提供了API,可是在实践中,我们很少本身编程直接去读取HDFS中的数据,缘故起因正如开篇提到,在大数据场景下,移动计较比移动数据更划算。于其写措施去读取漫衍在这么多DataNode上的数据,不如将措施分发到DataNode上去会见其上的block数据。可是怎样对措施举办分发?分发出去的措施又怎样会见HDFS上的数据?计较的功效如那里理赏罚,假如功效必要归并,该怎样归并? Hadoop提供了对存储在HDFS上的大局限数据举办并行计较的框架,就是我们之前讲的MapReduce。
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |