加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Hadoop生态组件Yarn之恒久运行处事支持篇!

发布时间:2018-08-16 12:09:39 所属栏目:教程 来源:赵钰莹
导读:技能沙龙 | 邀您于8月25日与国美/AWS/转转三位专家配合切磋小措施电商拭魅战 众所周知,Yarn是大数据焦点调治组件,其行使包围率很是高。在Hadoop是否已失宠的选题调研中,不少专家都对Yarn这一焦点组件的生命力表达了本身的观点。 阿里云技能专家封神以为,Y
技能沙龙 | 邀您于8月25日与国美/AWS/转转三位专家配合切磋小措施电商拭魅战

众所周知,Yarn是大数据焦点调治组件,其行使包围率很是高。在“Hadoop是否已失宠”的选题调研中,不少专家都对Yarn这一焦点组件的生命力表达了本身的观点。

阿里云技能专家封神以为,Yarn在离线与在线数据殽杂方面示意欠佳,但这也是其配景使然,支持Yarn的几家公司首要做离线体系,对在线体系陈设题目存眷不足。虽然,今朝市场已经存在具备必然竞争相关的产物,好比Mesos,但这两大调治体系的计划方针并不完全沟通,而且Yarn也在朝着Mesos的规模进军。


Hadoop生态组件Yarn之恒久运行处事支持篇!

百分点团体技能副总裁兼首席架构师刘译璟以为,Yarn与Hadoop平台的绑定过于亲近,而现实上,我们有许多资源调治打点要领可供选择,好比Kubernetes等,对各类应用的支持某种水平上比Yarn更完美,无论是外部范例应用,大数据应用照旧呆板进修应用均可处理赏罚。

固然在大数据应用层面不尽美满,但Yarn在支持恒久运行处事方面具有很大上风,这是Yarn社区耗时一年一向在全力做的工作,本文首要先容该处事的特点和详细行使要领。

Apache Hadoop 3.1成果——Yarn处事框架!

所谓恒久运行处事支持,首要针对恒久占用较多资源的应用,我们将该成果称之为Yarn处事框架。2017年11月,这一成果被整合到器材箱,总共经验了108个提交,代码变动了33539行。该成果首要包罗以下内容:

1、在Yarn上运行的焦点框架(ApplicationMaster),作为容器和谐器材,认真打点全部处事的生命周期。

2、RESTful API处事,供用户行使简朴的JSON类型在Yarn上陈设和打点处事。

3、由Yarn处事注册表支持的Yarn DNS处事器,可通过其尺度DNS在Yarn上查找处事。

4、高级容器配置打算,譬喻每个应用措施的容器巨细调解和节点标签。

5、集装箱进级和整体处事。

6、Yarn处事框架与一些其他成果:

  • 对Docker的支持;
  • 基于HBase的当地Yarn时刻线处事,用于记录生命周期变乱和指标,并为用户提供富厚的说明API以获取、查询应用措施具体信息;
  • Yarn UI2中的Services UI。

Yarn上打点处事的大部门伟大性都是对用户潜匿的。用户仅处理赏罚JSON类型,并通过CLI或REST API陈设和打点在Yarn上运行的处事。以下是在Yarn上陈设httpd容器的JSON类型示例。用户只需通过REST API或行使CLI宣布此JSON类型,体系将自动处理赏罚别的内容——启动和监督容器或举办应用措施运行所需的全部操纵,如容器自动重启(假如失败)。譬喻:

1、启动处事,请行使提供的JSON运行以下呼吁

Hadoop生态组件Yarn之恒久运行处事支持篇!

2、获取应用措施状态

  1. yarn app -status my-httpd 

3、将容器数目配置为3:

  1. yarn app -flex my-httpd -component httpd 3 

4、遏制处事:

  1. yarn app -stop my-httpd 

5、重启已经遏制的处事:

  1. yarn app -start my-httpd 

下图展示了Yarn集群在支持恒久运行处事时涉及的首要组件:

Hadoop生态组件Yarn之恒久运行处事支持篇!

由图可见,典范的事变流程是:

  • User向Yarn Service REST API宣布描写处事类型的JSON哀求,譬喻容器内存巨细、CPU焦点数、Docker镜像ID等。同样,用户也可以行使Yarn CLI提交处事并建设哀求;
  • RM在接管哀求后,启动ApplicationMaster(即容器编排框架);
  • 营业流程框架从RM哀求资源(必然要遵守用户的资源需求),然后分派容器,在NodeManager上启动容器;
  • NodeManager依次启动容器历程(用户代码地址的位置)或行使Docker容器运行时启动Docker容器;
  • 营业流程框架监督容器的康健状况和筹备环境,并对容器的妨碍或错误采纳动作。它将处事的生命周期变乱和指标写入Yarn时刻线处事(由HBase支持),将附加处事元信息(譬喻容器IP和主机)写入由ZooKeeper支持的Yarn处事注册表中;
  • Registry DNS处事器侦听ZooKeeper中的znode建设或删除,并建设各类DNS记录,譬喻A record和Service Record,以提供DNS查询;

按照JSON类型和YARN设置中提供的信息,为每个Docker容器提供用户友爱的主机名。然后,客户端可以行使尺度DNS通过容器主机名查找容器IP。

Yarn已被证明可以很好地支持MapReduce和Spark等批量处理赏罚事变负载,此成果还可以将现有的基于容器的处事引入Yarn。用户可以行使单个集群来运行批处理赏罚功课和支持长时刻运行处事,这还可以实现批处理赏罚功课和处事之间的资源共享,处事凡是在白日运行,而批处理赏罚功课凡是在夜间运行,这样的资源共享极大地进步了整体集群的操作率;支持kerberos安详性,可以与尺度的kerberized Hadoop集群很好地共同;除了docker容器化应用措施外,它还支持尺度的tar打包应用措施。

在Hadoop生态体系中存在高出十年,Yarn已经生长为一个较成熟的项目,并在许多企业内部大局限应用。另外,Yarn Container Orchestration Framework操作了Hadoop生态中全部的不变成果,这让Yarn成为Hadoop行使者的主要选择。正如开篇两位技能专家所言,Yarn并不是最完美的资源调治器材,但它与Hadoop生态绑定甚紧并与个中的组件美满整合,这就是Yarn最大的上风之一。

【编辑保举】

  1. Hadoop进修系列一:情形搭建
  2. 大数据入门之Hadoop基本进修
  3. Hadoop老矣,为什么腾讯还要花精神在其开源宣布上?
  4. 京东万台局限Hadoop集群 | 漫衍式资源打点与功课调治
  5. 干货:怎样将Hadoop存储容量晋升4倍?
【责任编辑:未丽燕 TEL:(010)68476606】
点赞 0

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读