Hadoop深入浅出实战经典–第02讲

本文来源:通通学--知识学习与分享平台

成都创新互联是一家专业提供孝南企业网站建设,专注与网站设计、成都网站设计HTML5、小程序制作等业务。10年已为孝南众多企业、政府机构等服务。创新互联专业网络公司优惠进行中。

转载链接:http://www.tongtongxue.com/archives/220.html

Hadoop的核心

HDFS: Hadoop Distributed File System 分布式文件系统

MapReduce:并行计算框架

Yarn:集群资源管理和调度框架

Hadoop是什么?

适合大数据的分布式存储、计算、资源管理平台

作者:Doug Cutting

受Google三篇论文的启发

Hadoop生态系统

Hadoop深入浅出实战经典–第02讲

HDFS

Hadoop深入浅出实战经典–第02讲

主从结构
主节点,只有一个: namenode
从节点,有很多个: datanodes

namenode负责:
接收用户操作请求
维护文件系统的目录结构
管理文件与block之间关系,block与datanode之间关系

datanode负责:
存储文件
文件被分成block存储在磁盘上
为保证数据安全,文件会有多个副本

Yarn

Hadoop深入浅出实战经典–第02讲

Yarn下的MapReduce

主从结构
主节点,只有一个: ResourceManager
控制节点,每个Job都有一个MRAppMaster
从节点,有很多个: YarnChild

ResourceManager负责:
接收客户提交的计算任务
把Job分给MRAppMaster执行
监控MRAppMaster的执行情况

MRAppMaster负责:
负责一个Job执行的任务调度
把Job分给YarnChild执行
监控YarnChild的执行情况


标题名称:Hadoop深入浅出实战经典–第02讲
网站地址:http://bzwzjz.com/article/jdscsp.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都网站建设公司 企业网站建设 重庆企业网站建设 成都网站制作 成都网站建设 网站制作 定制网站设计 手机网站制作 成都企业网站建设公司 攀枝花网站设计 网站制作公司 企业网站制作 高端品牌网站建设 网站建设方案 企业网站建设 外贸营销网站建设 成都网站建设 成都网站建设 企业手机网站建设 网站建设开发 成都定制网站建设 四川成都网站建设