中文字幕一区二区不卡_一区二区三区四区久久_97成人资源网_gogo高清午夜人体在线_91久久精品国产亚洲_亚洲在线观看视频

新闻中心

首页 > 新闻中心 > 行业新闻 >

浅议Hadoop实现机制

时间:2017-11-13 08:28:35   阅读:

1.分布式并行计算

  MapReduce框架是由jobTracker和TaskTracker这两类服务调度的。JobTracker是主控服务,只有一个,负责调度和管理TaskTracker,把Map任务和Reduce任务分配给空闲的TaskTmcker,让这些任务并行运行,并负责监控任务的运行情况。TaskTracker是从服务,可以有多个,负责执行任务。如果某个TaskTracker出故障了,JobTracker会把其负责的任务分配给其他空闲的TaskTracker重新运行。

2.本地计算

  通常,MapReduce框架和分布式文件系统是运行在一组相同的节点上的,也就是说,计算节点和存储节点通常在一起。这种配置允许框架在那些存储数据的节点上高效地调度任务,这可以使整个集群的网络带宽被非常髙效地利用。

3.任务粒度

  对于小数据集,一般小于或等于HDFS中数据块的大小,这使得一个小数据集位于一台计算机上,有利于计算的数据本地性。一个小数据集启动一个Map任务,M个Map任务可以在台计算机上并行运行,用户可以指定Reduce任务的数量。

4.Combine (连接)

  Combine将Map任务输出的中间结果集中有相同key值的多个<key,value>组合成一个<key,list(value)>对。Combine在执行完Map函数后紧接着执行,很多情况下可以直接使用Reduce函数,Combine能减少中间结果的数量,从而减少数据传输中的网络流量。

5.Partition (分区)

  Combine之后,把产生的中间结果按key的范围划分成及份(及是预先定义的Reduce任务的个数)。划分时通常使用Hash函数,如hash(key)mod R,这样可以保证某一范围内的key,一定是由一个Reduce任务来处理,可以简化Reduce的过程。

6.读取中间结果

  Map任务的中间结果在做完Combine和Partition之后,以文件形式存于本地磁盘。中间结果文件的位置会通知主控JobTracker,JobTracker再通知Reduce任务到哪一个DataNode上去取中间结果。注意所有的Map任务产生中间结果均按其key用同一个Hash函数划分成了R份,R个Reduce任务各自负责一段key区间。每个Reduce需要向多个Map任务节点取得落在其负责的key区间内的中间结果,然后执行Reduce函数,形成一个最终的结果文件。

7.任务管道

  在某些情况下Reduce任务的输出结果并非所需要的最终结果,这时可以将这些输出结果作为另一个计算任务的输入开始另一个MaPReduce计算任务。

 

 

?

闽公网安备 35010002000114号

主站蜘蛛池模板: 邻居少妇张开腿让我爽了一夜 | 国产精品嫩草影院一二三区 | 国产精品久久久久久久免费 | 国产一区二区三区在线观看视频 | 久热首页 | 99re热这里只有精品18 | 久久爱992xxoo| 少妇挑战三个黑人惨叫4p国语 | 国产区精品福利在线社区 | 国产成人亚洲精品狼色在线 | 国内精品久久毛片一区二区 | 国产a毛片| 亚洲色精品vr一区二区三区 | 精品丝袜国产自在线拍亚洲 | 青草草视频在线观看 | 色综合久久网 | 97桃色| 亚洲国产精品自在在线观看 | 久久一级视频 | 亚洲国产精品综合欧美 | av鲁丝一区鲁丝二区鲁丝三区 | 国产精品亚洲综合网站 | 男人扒开女人的腿做爽爽视频 | 国产大学生毛片一级高清 | 亚洲成av人综合在线观看 | 二区视频在线 | 国产福利社区 | 中文字幕天堂久久精品 | 九九精品免费视频 | 狼色精品人妻在线视频免费 | 欧美一区二区三区网站 | 亚洲视频在线观看地址 | 久草网视频在线 | 亚洲精品无码乱码成人 | 青青在线精品2018国产 | 亚洲毛片无码专区亚洲乱 | 一级一毛片a级毛片 | 国产va免费精品观看精品 | 亚洲欧美在线观看播放 | 亚洲国产日韩欧美在线a乱码 | av在线亚洲欧洲日产一区二区 |