Hadoop生态组件Yarn之恒久运行处事支持篇!
技能沙龙 | 邀您于8月25日与国美/AWS/转转三位专家配合切磋小措施电商拭魅战
众所周知,Yarn是大数据焦点调治组件,其行使包围率很是高。在“Hadoop是否已失宠”的选题调研中,不少专家都对Yarn这一焦点组件的生命力表达了本身的观点。 阿里云技能专家封神以为,Yarn在离线与在线数据殽杂方面示意欠佳,但这也是其配景使然,支持Yarn的几家公司首要做离线体系,对在线体系陈设题目存眷不足。虽然,今朝市场已经存在具备必然竞争相关的产物,好比Mesos,但这两大调治体系的计划方针并不完全沟通,而且Yarn也在朝着Mesos的规模进军。 百分点团体技能副总裁兼首席架构师刘译璟以为,Yarn与Hadoop平台的绑定过于亲近,而现实上,我们有许多资源调治打点要领可供选择,好比Kubernetes等,对各类应用的支持某种水平上比Yarn更完美,无论是外部范例应用,大数据应用照旧呆板进修应用均可处理赏罚。 固然在大数据应用层面不尽美满,但Yarn在支持恒久运行处事方面具有很大上风,这是Yarn社区耗时一年一向在全力做的工作,本文首要先容该处事的特点和详细行使要领。 Apache Hadoop 3.1成果——Yarn处事框架! 所谓恒久运行处事支持,首要针对恒久占用较多资源的应用,我们将该成果称之为Yarn处事框架。2017年11月,这一成果被整合到器材箱,总共经验了108个提交,代码变动了33539行。该成果首要包罗以下内容: 1、在Yarn上运行的焦点框架(ApplicationMaster),作为容器和谐器材,认真打点全部处事的生命周期。 2、RESTful API处事,供用户行使简朴的JSON类型在Yarn上陈设和打点处事。 3、由Yarn处事注册表支持的Yarn DNS处事器,可通过其尺度DNS在Yarn上查找处事。 4、高级容器配置打算,譬喻每个应用措施的容器巨细调解和节点标签。 5、集装箱进级和整体处事。 6、Yarn处事框架与一些其他成果:
Yarn上打点处事的大部门伟大性都是对用户潜匿的。用户仅处理赏罚JSON类型,并通过CLI或REST API陈设和打点在Yarn上运行的处事。以下是在Yarn上陈设httpd容器的JSON类型示例。用户只需通过REST API或行使CLI宣布此JSON类型,体系将自动处理赏罚别的内容——启动和监督容器或举办应用措施运行所需的全部操纵,如容器自动重启(假如失败)。譬喻: 1、启动处事,请行使提供的JSON运行以下呼吁 ![]() 2、获取应用措施状态
3、将容器数目配置为3:
4、遏制处事:
5、重启已经遏制的处事:
下图展示了Yarn集群在支持恒久运行处事时涉及的首要组件: ![]() 由图可见,典范的事变流程是:
按照JSON类型和YARN设置中提供的信息,为每个Docker容器提供用户友爱的主机名。然后,客户端可以行使尺度DNS通过容器主机名查找容器IP。 Yarn已被证明可以很好地支持MapReduce和Spark等批量处理赏罚事变负载,此成果还可以将现有的基于容器的处事引入Yarn。用户可以行使单个集群来运行批处理赏罚功课和支持长时刻运行处事,这还可以实现批处理赏罚功课和处事之间的资源共享,处事凡是在白日运行,而批处理赏罚功课凡是在夜间运行,这样的资源共享极大地进步了整体集群的操作率;支持kerberos安详性,可以与尺度的kerberized Hadoop集群很好地共同;除了docker容器化应用措施外,它还支持尺度的tar打包应用措施。 在Hadoop生态体系中存在高出十年,Yarn已经生长为一个较成熟的项目,并在许多企业内部大局限应用。另外,Yarn Container Orchestration Framework操作了Hadoop生态中全部的不变成果,这让Yarn成为Hadoop行使者的主要选择。正如开篇两位技能专家所言,Yarn并不是最完美的资源调治器材,但它与Hadoop生态绑定甚紧并与个中的组件美满整合,这就是Yarn最大的上风之一。 【编辑保举】
点赞 0 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |