这篇文章主要为大家展示了“Hadoop单机模式如何部署”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Hadoop单机模式如何部署”这篇文章吧。
为呼和浩特等地区用户提供了全套网页设计制作服务,及呼和浩特网站建设行业解决方案。主营业务为网站制作、成都网站建设、呼和浩特网站设计,以传统方式定制建设网站,并提供域名空间备案等一条龙服务,秉承以专业、用心的态度为用户提供真诚的服务。我们深信只要达到每一位用户的要求,就会得到认可,从而选择与我们长期合作。这样,我们也可以走得更远!一、Hadoop部署模式
单机模式:默认情况下运行为一个单独机器上的独立Java进程,主要用于调试环境
伪分布模式:在单个机器上模拟成分布式多节点环境,每一个Hadoop守护进程都作为一个独立的Java进程运行
完全分布式模式:真实的生产环境,搭建在完全分布式的集群环境
二、添加用户和组
$ sudo adduser hadoop ##创建用户hadoop $ sudo usermod -G sudo hadoop ##将hadoop用户添加进sudo用户组
三、安装相关软件
$ sudo apt-get update $ sudo apt-get -y install openssh-server rsync openjdk-7-jdk $ sudo service ssh restart $ java -version
四、配置SSH免密登录
$ su -l hadoop ##切换至hadoop用户 $ ssh-keygen -t rsa -P "" ##配置SSH免密登录 $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys ##将公钥追加到authorized_keys中 $ ssh localhost ##验证
五、Hadoop配置
①下载安装Hadoop
$ su -l hadoop $ wget http://apache.fayea.com/hadoop/common/hadoop-2.7.1/hadoop-2.7.1.tar.gz $ tar -zxvf hadoop-2.7.1.tar.gz $ sudo mv hadoop-2.7.1 /usr/local/hadoop
②配置Hadoop
a.添加环境变量
$ vi /home/hadoop/.bashrc #HADOOP START export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64 export HADOOP_INSTALL=/usr/local/hadoop/ export PATH=$PATH:$HADOOP_INSTALL/bin export PATH=$PATH:$HADOOP_INSTALL/sbin export HADOOP_MAPRED_HOME=$HADOOP_INSTALL export HADOOP_COMMON_HOME=$HADOOP_INSTALL export HADOOP_HDFS_HOME=$HADOOP_INSTALL export YARN_HOME=$HADOOP_INSTALL export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib" #HADOOP END $ . /home/hadoop/.bashrc ##重载使其生效
六、测试
①创建输入数据
$ su -l hadoop $ cd /usr/local/hadoop $ sudo mkdir input $ sudo cp /etc/passwd input/
②执行Hadoop WordCount应用(词频统计)
$ bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.1-sources.jar org.apache.hadoop.examples.WordCount input output
③查看生成的单词统计数据
$ hadoop dfs -ls output -rw-r--r-- 1 hadoop hadoop 0 2015-12-18 13:18 output/_SUCCESS -rw-r--r-- 1 hadoop hadoop 2128 2015-12-18 13:18 output/part-r-00000 $ hadoop dfs -cat output/*
以上是“Hadoop单机模式如何部署”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注创新互联行业资讯频道!
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。