如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

成都创新互联公司坚持“要么做到,要么别承诺”的工作理念,服务领域包括:成都网站设计、网站建设、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的扬中网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!

为探索性分析与即席分析而设计

    YDB全称延云YDB:是一个基于Hadoop分布式架构下的实时的、多维的、交互式的查询、统计、分析引擎,具有万亿数据规模下的秒级性能表现,并具备企业级的稳定可靠表现。

    YDB是一个细粒度的索引:精确粒度的索引。数据即时导入,索引即时生成,通过索引高效定位到相关数据。YDB与Spark深度集成,Spark直接对YDB检索结果集分析计算,同样场景让Spark性能加快百倍。

1. 稽查布控场景性能

如何进行基于spark之上的卓越性能分析

2. 卓越的检索与分析性能

与 Spark txt 性能对比(提升倍数)

如何进行基于spark之上的卓越性能分析

与 Parquet 格式对比(单位为秒)

如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析

如何进行基于spark之上的卓越性能分析

与 ORACLE 性能对比

如何进行基于spark之上的卓越性能分析

3. 卓越的排序性能

按照时间逆序排序可以说是很多日志系统的硬指标。在延云 YDB 系统中,我们改变了传统的暴力排序方式,通过索引技术,可以超快对数据进行单列排序,不需要全表暴力扫描,这个技术我们称之为 BlockSort,目前支持 tlong、 tdouble、 tint、 tfloat 四种数据类型。

由于 BlockSort 是借助搜索的索引来实现的,所以采用 BlockSort 的排序,不需要暴力扫描,性能有大幅度的提升。

BlockSort 的排序,并非是预计算的方式,可以进行全表进行排序,也可以基于任意的过滤筛选条件进行过滤排序。

详细测试地址: http://blog.csdn.net/qq_33160722/article/details/54447022

300亿条数据的排序演示视频 http://blog.csdn.net/qq_33160722/article/details/54834896

测试结果(时间单位为秒)

如何进行基于spark之上的卓越性能分析

看完上述内容,你们掌握如何进行基于spark之上的卓越性能分析的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注创新互联行业资讯频道,感谢各位的阅读!


本文标题:如何进行基于spark之上的卓越性能分析
标题来源:http://bzwzjz.com/article/pjcdgc.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 广安网站设计 营销型网站建设 定制级高端网站建设 成都网站设计 成都模版网站建设 成都网站建设公司 温江网站设计 重庆网站建设 成都网站设计公司 成都网站设计 成都品牌网站设计 网站设计公司 成都网站设计 营销型网站建设 成都网站制作公司 成都网站制作 企业网站建设 网站设计制作 上市集团网站建设 网站建设费用 成都网站设计 定制网站制作