Hbase之表设计原则

1、列簇的设计

创新互联公司"三网合一"的企业建站思路。企业可建设拥有电脑版、微信版、手机版的企业网站。实现跨屏营销,产品发布一步更新,电脑网络+移动网络一网打尽,满足企业的营销需求!创新互联公司具备承接各种类型的成都网站制作、成都网站设计、外贸营销网站建设项目的能力。经过10余年的努力的开拓,为不同行业的企事业单位提供了优质的服务,并获得了客户的一致好评。

  • 列簇尽量少,最好不超过3个。因为每个列簇是存在一个独立的HFile里的,flush和compaction操作都是针对一个Region进行的,当一个列簇的数据很多需要flush的时候,其它列簇即使数据很少也需要flush,这样就产生的大量不必要的io操作。

  • 在多列簇的情况下,注意各列簇数据的数量级要一致。如果两个列簇的数量级相差太大,会使数量级少的列簇的数据扫描效率低下。

  • 将经常查询和不经常查询的数据放到不同的列簇。

  • 因为列簇和列的名字会存在HBase的每个Cell中,所以他们的名字应该尽可能的短。比如,用f:q代替mycolumnfamily:mycolumnqualifier

2、rowkey的设计

  • 避免使用递增的数字或时间做为rowkey。

  • 如果rowkey是整型,用二进制的方式比用string来存储更节约空间

  • 合理的控制rowkey的长度,尽可能短,因为rowkey的数据也会存在每个Cell中。

  • 如果需要将表预分裂为多个region是,最好自定义分裂的规则。


新闻标题:Hbase之表设计原则
标题来源:http://bzwzjz.com/article/ipsdjg.html

其他资讯

Copyright © 2007-2020 广东宝晨空调科技有限公司 All Rights Reserved 粤ICP备2022107769号
友情链接: 成都响应式网站建设 成都网站建设 重庆外贸网站建设 成都h5网站建设 营销型网站建设 手机网站制作 成都网站设计公司 网站设计 成都企业网站制作 成都网站制作 成都做网站建设公司 成都网站建设 成都网站制作 成都企业网站设计 成都网站建设 成都网站设计制作公司 定制级高端网站建设 高端定制网站设计 成都网站设计 手机网站制作设计 广安网站设计 企业手机网站建设