怎样将数据移入和移出Hadoop?
发布时间:2018-10-13 15:09:48 所属栏目:教程 来源:赵钰莹
导读:【新产物上线啦】51CTO播客,随时随地,碎片化进修 企业在项目中完全行使Hadoop之前,数据移动是必需办理的工作之一。怎样将数千台主机日记数据放入Hadoop?从相关型可能No/NewSQL体系以及Hadoop中获取数据的最有用要领是什么?怎样将Hadoop中天生的Lucene索
默认环境下,DistCp行使20个mapper运行,每个mapper副本对应的文件由选择的复制计策确定。Hadoop开拓职员思量了mapper数目的默认配置,选择正确的值是想要行使几多收集带宽以及但愿在复制时代占用几多使命的函数,可以通过指定-m后跟的值来变动mapper的数目。 带宽 最后一个思量身分是复制时代行使的收集带宽。大型副本也许会使集群之间的收集饱和。企业中收集运营职员保持运行精采的一种要领是行使-bandwidth参数来指定每个map使命在复制时代耗损的带宽量上限。此参数的值以兆字节/秒(MBps)为单元。 其他 到今朝为止,我们已经看到了DistCp中一些更风趣的选项。要查察完备的选项列表,可以运行distcp呼吁,可能查察Hadoop文档。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |