大数据资料之常见的Hadoop十大应用误解进修

发布时间：2019-07-11 03:27:35 所属栏目：移动互联来源：95后码农

导读：大数据之常见的Hadoop十大应用误解常见的Hadoop十大应用误解。 Hadoop是一个由Apache基金会所开拓的漫衍式体系基本架构。用户可以在不相识漫衍式底层细节的环境下，开拓漫衍式措施。充实操作集群的威力举办高速运算和存储。以下是常见的Hadoop十大应用误解

(正解) 认识storage的人，第一次看到Hadoop时，每每只会留意到它的漫衍式文件体系HDFS，然后开始拿它来与现有的storage的成果特征做较量，而忽略掉Hadoop自己并行运算的那一块。这很公道，事实MapReduce的观念，在应用上是较量抽象且难以捉摸的，相反的，HDFS就是一个很清晰且具象的观念。Hadoop虽然可以拿来做data archive的运用，但假如你自己的数据没有被常常或无意拿出来行使的需求(也就是我们所说的cold data)的话，Hadoop自己的HDFS作为data archive并不会有出格的上风，反而传统storage的一些延长的成果特征，Hadoop自己并不具备。固然HDFS自己是一个不错的object store，具备有作为scale-out NAS的底层的特征,，但也就仅限于此了， Hadoop自己并没有出格为它外加storage自己该具有的成果，事实Hadoop当初计划时，对数据的储存与运用的思索，与storage的应用场景是完全纷歧样的。Hadoop自己要办理的，反而是现有当数据被放进storage后，必要再被拿出来处理赏罚或运算时所碰着的坚苦性。也因此，它出格得当那些web click-stream、CDR (call detail record)、GPS data, system log、 and other time-series data等数据，由于这些数据都具有必要常常被拿出来说明处理赏罚的特征。在现实应用中，Hadoop与传统storage着实是相辅相成的，辟如说，我们也许会在Hadoop上放已往3到6个月的数据，由于这些数据的再被操作性较高，而6个月之后的数据就也许会把它archive在传统的storage内，由于它被再操作的水平低许多了。

7. (误解) Hadoop是一个搜刮引擎(Search Engine)

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

2/3

首页

尾页

联想拯救者Y90发售两周	这可能是全世界第二好
此次苹果AR设备真的来	iPhone 14系列泄露正