阿里云
云栖社区2017年度颁奖盛典
发表主题 回复主题
  • 626阅读
  • 0回复

[大牛问答]请问hbase设计表经验总结要注意哪些事项?

级别: 论坛编辑
发帖
341
云币
396
问:请问hbase设计表经验总结要注意哪些事项? oY|,GvCnK  
!$Tw^$n  
答: 0}FOV`n  
主要的基本规则有: 6"t;gSt 4  
   1)Regions的大小定在10~50GB; ''^Y>k  
   2)  Cells的大小不要超过10MB,如果要存储中型数据(超过50MB),可以选择将数据存储在HDFS上,然后在HBase中存储引用指针就好; `S.ZS}~!F  
   3)  通常情况下,1个表的列族控制在1~3个,不能模仿关系型数据库的模式; ;)I'WQ]Q  
   4)  每个表的regions数量控制在50~100个。请记住region是一段连续的列族; aKlUX  
   5)  尽量使列族的名称简短,因为每个值都会存储列族名; drd/jH&  
   6)  如果存储基于时间的数据或日志数据,row key是基于设备ID或服务ID加时间,这样的模式可能会导致新加的数据都写到新的region,而旧的region则不会被写,形成写热点; e9Pk"HHl  
   7)  如果只有1个列族,而且还写得比较频繁,那就要注意写的负载均衡 npyAJp  
EVUq--)~  
#E+gXan  
by__轶俗
x
发表主题 回复主题
« 返回列表上一主题下一主题

限100 字节
如果您在写长篇帖子又不马上发表,建议存为草稿
 
验证问题: 27 - 1 = ?
上一个 下一个