0%

Hbase存储结构

Hbase存储结构

Hbase和关系型数据库的区别

1
2
关系型数据库按行存储(.csv文件)
HBase的存储结构基于HDFS

Region

1
2
3
4
5
6
1、每个Region对应一个HRegion实例,这些实例被HRegionServer管理
一个表的所有Region会分布在不同的region服务器上被管理,但一个Region
内的数据只会被一个服务器所管理。
2、物理上数据存储在HDFS上,由Region服务器提供数据服务。
每个Region由一个或多个Store组成,每个Store保存一个列族的所有数据。
3、Store是Hbase存储的核心,每个Store由一个MemStore和零至多个StoreFile组成,StoreFile以HFile的格式存储在HDFS上。`

store

1
2
3
4
5
1、store按列族划分
2、StoreFile:按列划分
3、HFile:实际存入hdfs的文件,同一列的数据会被存在同一节点
4、HLog用于灾难备份,使用了预写式日志(WAL)
5、每个Region服务器对应一个Hlog,所以来自不同表的region日志是混在一起的,这样做的目的是写入日志时只需要追加单个文件即可。