CGFT大數(shù)據(jù)中,HBase數(shù)據(jù)模型是需要重點(diǎn)掌握的。下文是對它的詳細(xì)介紹,一起隨融躍小編卡看吧!
HBase是一個(gè)稀疏、多維度、排序的映射表,這張表的索引是行鍵、列族、列限定符和時(shí)間戳。每個(gè)值是一個(gè)未經(jīng)結(jié)束的字符串,沒有數(shù)據(jù)類型。
用戶在表中存儲(chǔ)數(shù)據(jù),每一行都有一個(gè)可排序行鍵和任意多的列。表在水平方向由一個(gè)或多個(gè)列族組成,一個(gè)列族中可以包含任意多個(gè)列,同一個(gè)列族里面的數(shù)據(jù)存儲(chǔ)在一起。
列族支持動(dòng)態(tài)擴(kuò)展,可以很輕松地添加一個(gè)列族或列,無需預(yù)先定義列的數(shù)量以及類型,所有列均以字符串形式存儲(chǔ),用戶需要自行進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換。
由于同一張表里面的每一行數(shù)據(jù)都可以有截然不同的列,因此,對于整個(gè)映射表的每行數(shù)據(jù)而言,有些列的值就是空的,所以好HBase是稀疏的。
HBase中執(zhí)行更新操作時(shí),并不會(huì)刪除數(shù)據(jù)舊的版本,而是生成一個(gè)新的版本,舊有的版本仍然保留,HBase可以對允許保留的版本的數(shù)量進(jìn)行設(shè)置。客戶端可以選擇獲取距離某個(gè)時(shí)間zui近的版本,或者一次獲取所有版本。
如果在查詢的時(shí)候不提供時(shí)間戳,那么會(huì)返回距離現(xiàn)在zui近的那一個(gè)版本的數(shù)據(jù),因?yàn)樵诖鎯?chǔ)的時(shí)候,數(shù)據(jù)會(huì)按照時(shí)間戳排序。
HBase提供了兩種數(shù)據(jù)版本回收方式,一是保存數(shù)據(jù)的zui后n個(gè)版本,而是保存zui近一段時(shí)間內(nèi)的版本。

學(xué)習(xí)交流群(掃碼免費(fèi)加群)
-
1、新手入門
-
2、學(xué)習(xí)資料
-
3、免費(fèi)課程
-
4、考試動(dòng)態(tài)
-
5、備考干貨
-
6、答疑沖刺