在CGFT大數(shù)據(jù)中,冗余數(shù)據(jù)的保存是很重要的知識點。對于熟練的掌握程度,對于考試起著至關重要的作用。
作為一個分布式文件系統(tǒng),為了保 證系統(tǒng)的容錯性和可用性,HDFS采用了多副本方式對數(shù)據(jù)進行冗余存儲。
通常一個數(shù)據(jù)塊的多個副本會被分不到不同的數(shù)據(jù)接單上,如下圖所示,數(shù)據(jù)塊1被分別存放到數(shù)據(jù)節(jié)點A和C上,數(shù)據(jù)塊2被存放在數(shù)據(jù)節(jié)點A和B上。
這種多副本方式具有以下幾個優(yōu)點:
1、加快數(shù)據(jù)傳輸速度
當多個客戶端需要同時訪問同一個文件時,可以讓多個客戶端分別從不同的數(shù)據(jù)塊副本中讀取數(shù)據(jù),這就大大加快了數(shù)據(jù)傳輸速度。
2、容易檢查數(shù)據(jù)錯誤
HDFS的數(shù)據(jù)節(jié)點之間通過網(wǎng)絡傳輸數(shù)據(jù),采用多個副本可以很容易餓判斷數(shù)據(jù)傳輸是否出錯。
3、保 證數(shù)據(jù)的可靠性
即使某個數(shù)據(jù)節(jié)點出現(xiàn)故障失效,也不會造成數(shù)據(jù)丟失。

聲明:本文章為學習相關信息展示文章,非課程及服務廣告文章,產(chǎn)品及服務詳情可咨詢網(wǎng)站客服微信。
文章轉載須注明來源,文章素材來源于網(wǎng)絡,若侵權請與我們聯(lián)系,我們將及時處理。