怎么在Docker搭建Hadoop集群

这篇文章主要介绍“怎么在Docker搭建Hadoop集群”,在日常操作中,相信很多人在怎么在Docker搭建Hadoop集群问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么在Docker搭建Hadoop集群”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

创新互联专业为企业提供石棉网站建设、石棉做网站、石棉网站设计、石棉网站制作等企业网站建设、网页设计与制作、石棉企业网站模板建站服务,十年石棉做网站经验,不只是建网站,更提供有价值的思路和整体网络服务。

一. 项目介绍

将Hadoop打包到Docker镜像中,就可以快速地在单个机器上搭建Hadoop集群,这样可以方便新手测试和学习。

如下图所示,Hadoop的master和slave分别运行在不同的Docker容器中,其中hadoop-master容器中运行NameNode和ResourceManager,hadoop-slave容器中运行DataNode和NodeManager。NameNode和DataNode是Hadoop分布式文件系统HDFS的组件,负责储存输入以及输出数据,而ResourceManager和NodeManager是Hadoop集群资源管理系统YARN的组件,负责CPU和内存资源的调度。

怎么在Docker搭建Hadoop集群

之前的版本使用serf/DNSmasq为Hadoop集群提供DNS服务,由于Docker网络功能更新,现在并不需要了。更新的版本中,使用以下命令为Hadoop集群创建单独的网络:

sudo docker network create --driver=bridge hadoop

然后在运行Hadoop容器时,使用”–net=hadoop”选项,这时所有容器将运行在hadoop网络中,它们可以通过容器名称进行通信。

项目更新要点:

  • 去除serf/dnsmasq

  • 合并Master和Slave镜像

  • 使用kiwenlau/compile-hadoop项目编译的Hadoo进行安装

  • 优化Hadoop配置

二. 3节点Hadoop集群搭建步骤

1. 下载Docker镜像
sudo docker pull kiwenlau/hadoop:1.0
2. 下载GitHub仓库
git clone https://github.com/kiwenlau/hadoop-cluster-docker
3. 创建Hadoop网络
sudo docker network create --driver=bridge hadoop
4. 运行Docker容器
cd hadoop-cluster-docker./start-container.sh

运行结果

start hadoop-master container...start hadoop-slave1 container...start hadoop-slave2 container...root@hadoop-master:~#
  • 启动了3个容器,1个master, 2个slave

  • 运行后就进入了hadoop-master容器的/root目录

5. 启动hadoop
./start-hadoop.sh
6. 运行wordcount
./run-wordcount.sh

运行结果

input file1.txt:Hello Hadoopinput file2.txt:Hello Dockerwordcount output:Docker	1Hadoop	1Hello	2

Hadoop网页管理地址:

  • NameNode: http://192.168.59.1:50070/

  • ResourceManager: http://192.168.59.1:8088/

192.168.59.1为运行容器的主机的IP。

三. N节点Hadoop集群搭建步骤

1. 准备
  • 参考第二部分1~3:下载Docker镜像,下载GitHub仓库,以及创建Hadoop网络

2. 重新构建Docker镜像
./resize-cluster.sh 5
  • 可以指定任意N(N>1)

3. 启动Docker容器
./start-container.sh 5
  • 与第2步中的N保持一致。

4. 运行Hadoop
  • 参考第二部分5~6:启动Hadoop,并运行wordcount。

到此,关于“怎么在Docker搭建Hadoop集群”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!


当前标题:怎么在Docker搭建Hadoop集群
文章地址:http://bzwzjz.com/article/jpjcip.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 网站建设 网站设计制作 重庆网站制作 成都网站建设 营销型网站建设 教育网站设计方案 阿坝网站设计 重庆企业网站建设 成都网站制作 企业网站设计 自适应网站设计 梓潼网站设计 达州网站设计 网站设计制作报价 响应式网站设计 网站建设开发 重庆手机网站建设 成都网站建设公司 手机网站制作 网站建设方案 宜宾网站设计 成都网站设计