HBase设计
2016-09-28 11:32:54 0 举报
AI智能生成
HBase是一个分布式的、面向列的开源数据库,它是Apache软件基金会的Hadoop项目的一部分。设计上,HBase运行于Hadoop的HDFS之上,利用Hadoop的MapReduce来处理数据,提供了随机访问大规模数据集的实时读/写能力。HBase的设计目标是支持万亿行级别的数据存储,同时能够保证数百万次/秒的数据读写操作。HBase的设计特点包括:强一致性、高可用性、可扩展性和灵活性等。HBase的数据模型是基于列族的,每个列族由一组列组成,这些列共享相同的配置和元数据。HBase的表结构可以通过HBase shell或API进行动态修改,以满足不同的业务需求。
作者其他创作
大纲/内容
HBase系统架构:HBase组件体系&HBase基本工作流程
HBase部署&基本操作:HBase部署&运维命令&物理文件组织形式&客户端API命令
HBase设计
业务数据存储选型分析
为什么不用MySQL,Redis,HDFS
MySQL:数据量不大、各种聚合运算、要求事务性
QPS很高但TTL短,造成硬盘资源严重浪费
数据量很大但要求经常离线批量读取
RowKey如何设计?
列族应该设计多少个?
列应该如何设计?
HBase Scheme设计
各种表属性
预分区设计
0 条评论
下一页