当前位置: 首页 > news >正文

贵州app开发公司东莞网站建设优化技术

贵州app开发公司,东莞网站建设优化技术,网页空间申请,免费网络短剧网站1.简介 Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度。支持多个数据处理框架&…

1.简介 

  • Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统和调度平台,可为上层应用提供统一的资源管理和调度。
  • 支持多个数据处理框架(MapReduce Spark Storm等)。具有资源利用率高、运行成本底、数据共享等特点

资源调度管理的作用

MapReduce是基于yarn运行的,没有yarn一般就无法运行MapReduce程序

资源调度的作用:对于资源的利用,有规划,有管理的调度资源使用,是效率最高的方式

对程序进行资源调度的重要性:服务器会运行多个程序,每个程序对资源的使用都不同,

程序没有节省的概念,有多少就会用多少,所以为了提高资源利用率,调度是必须的

2.分布式资源调度-YARN 

YARN主要有ResourceManager和NodeManager等组件组成,他们的职责分别是:

ResourceManager: 接收用户的计算请求任务,监控NodeManager,资源分配和调度
NodeManager: 负责执行主节点分配的任务(给MR的计算程序提供资源) , 管理单个节点上的资源,处理来自ResourceManager的命令

 3.YARN提交mr流程

客户端提交计算任务-先去rm那找资源-rm指定nm去创建am-am告知rm自己状态,监测-am通知所有nm去工作,并分配对应的mr任务-map的分工作完成后,先向am报告,am表示可以了,map才可以将任务给reduce-当整个工作完成后,am向rm注销自己,资源释放.

1.客户端提交一个MR程序给ResourceManager(校验请求是否合法...)

2.如果请求合法,ResourceManager随机选择一个NodeManager用于生成appmaster(应用程序控制者,每个应用程序都单独有一个appmaster)
3.appmaster会主动向ResourceManager的应用管理器(application manager)注册自己,告知自己的状态信息,并且保持心跳
4.appmaster会根据任务情况计算自己所需要的container资源(cpu,内存...),主动向ResourceManager的资源调度器(resource scheduler)申请并获取这些container资源

5.appmaster获取到container资源后,把对应指令和container分发给其他NodeManager,让NodeManager启动task任务(maptask任务,reducetask任务)
6.NodeManager要和appmaster保持心跳,把自己任务计算进度和状态信息等同步给appmaster,(注意当maptask任务完成后会通知appmaster,appmaster接到消息后会通知reducetask去maptask那儿拉取数据)直到最后任务完成

7.appmaster会主动向ResourceManager注销自己(告知ResourceManager可以把自己的资源进行回收了,回收后自己就销毁了)

4.YARN的三大调度器

先进先出调度器:FiFO Scheduler(常用于测试)

FIFO Scheduler: 把应用按提交的顺序排成一个队列,在进行资源分配的时候,先给队列中最头上的应用进行分配资源,待最头上的应用需求满足后再给下一个分配,以此类推。
好处:  能够保证每一个任务都能拿到充足的资源, 对于大任务的运行非常有好处
弊端:  如果先有大任务后有小任务,会导致后续小任务无资源可用, 长期处于等待状态
应用:  测试环境

公平调度器:Fair Scheduler

Fair Scheduler :不需要保留集群的资源,因为它会动态在所有正在运行的作业之间平衡资源 , 当一个大job提交时,只有这一个job在运行,此时它获得了所有集群资源;当后面有小任务提交后,Fair调度器会分配一半资源给这个小任务,让这两个任务公平的共享集群资源。

好处:  保证每个任务都有资源可用, 不会有大量的任务等待在资源分配上
弊端: 如果大任务非常的多, 就会导致每个任务获取资源都非常的有限, 也会导致执行时间会拉长,对多个大任务不友好
应用: CDH商业版本的hadoop

容量调度器:Capacity Scheduler(版本默认使用)

Capacity Scheduler: 为每个组织分配专门的队列和一定的集群资源,这样整个集群就可以通过设置多个队列的方式给多个组织提供服务了。在每个队列内部,资源的调度是采用的是先进先出(FIFO)策略。
好处: 可以保证多个任务都可以使用一定的资源, 提升资源的利用率
弊端: 如果遇到非常的大的任务, 此任务不管运行在那个队列中, 都无法使用到集群中所有的资源,  导致大任务执行效率比较低,当任务比较繁忙的时候, 依然会出现等待状态
应用: apache开源版本的hadoop

http://www.ds6.com.cn/news/39462.html

相关文章:

  • 枣阳建网站无锡百度竞价公司
  • 网站在美国做的服务器网络营销和传统营销的区别和联系
  • wordpress 苏醒主题评论优化
  • 腾讯企点下载安装杭州专业seo服务公司
  • 购物网站线下推广办法今日头条新闻最新疫情
  • 网站开发 会员模块软件商店安装
  • 做抽奖网站合法吗网站关键词优化技巧
  • 深圳市住房和城乡建设局网站首页东莞做网站哪家公司好
  • 企业网站制作运营全网营销推广案例
  • wordpress 电商版本哪个杭州seo好
  • 网站织梦后台一片白软文写作案例
  • 招聘网站评估怎么做此网站服务器不在国内维护
  • 旅游网站需求分析惠州seo关键词推广
  • 南宁企业网站建站模板最新今日头条
  • 网站建设公torrentkitty磁力猫引擎
  • 购物商城网站的制作竞价代运营
  • 苏州网络技术有限公司网站优化排名网站
  • 做词频分析的网站做竞价推广这个工作怎么样
  • 开展农业信息网站建设工作总结上海外贸seo公司
  • 网站建设百度文库seo教程网
  • 搜索网站大全排名泉州网站关键词排名
  • 做网站用个人还是企业比较好韩国今日特大新闻
  • 东莞专业做网站的公司有哪些策划书模板
  • 可以申请做cpa广告的网站网络零售的优势有哪些
  • html5网站开发实例公司怎么在百度上推广
  • 合肥网站制作报深圳做网站公司
  • wordpress v3.3.1空间上传phpseo公司 杭州
  • 公司做了网站怎么做推广广告制作
  • 微信网站主题网络推广营销网站建设专家
  • 仿网站的ppt怎么做网络营销的渠道