这篇文章将为大家详细讲解有关Hadoop生态系统组件有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
创新互联公司2013年成立,是专业互联网技术服务公司,拥有项目成都网站建设、成都做网站网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元卓资做网站,已为上家服务,为卓资各地企业和个人服务,联系电话:028-86922220
Hadoop生态系统的组件包括:
HDFS:分布式文件系统
YARN:资源管理和调度
MapReduce:并行计算框架
HBase:可扩展的分布式NoSql数据库
Hive:适合做ETL的大数据仓库,支持SQL查询语言,基于MapReduce
Impala:新型查询系统,提供交互式的SQL查询
ZooKeeper:分布式应用程序协调服务
Spark:分布式内存计算引擎,支持ETL、机器学习、Streaming和图计算
Flume:分布式日志收集、聚合系统
Pig:大规模数据分析平台
PrestoDB:大数据的分布式 SQL 查询引擎
Phoenix:是Hbase的 SQL 驱动
Drill :加快Hadoop数据查询的工具
Hue 是运营和开发Hadoop应用的图形化用户界面,功能及其强大
以服务体系划分:
计算云:虚拟主机/弹性计算/负载均衡QLB
存储云:GlusterFS/Swift/FastDFS/生产存储/云盘
服务云-数据库:MySQL/Couchbase/redis/MongoDB
服务云-分布式中间件:RPC/MQ/ZooKeeper
服务云-Hadoop:HDFS/MR/Hive/HBase
服务云-实时计算:Spark/Storm/实时日志收集分析
关于“Hadoop生态系统组件有哪些”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。