W3Cschool
恭喜您成為首批注冊用戶
獲得88經驗值獎勵
HDFS 的可靠性主要有以下幾點:
可以在 hdfs-site.xml 中設置復制因子指定副本數量
所有數據塊都可副本
DataNode 啟動時,遍歷本地文件系統(tǒng),產生一份 HDFS 數據塊和本地文件的對應關系列表 (blockreport) 匯報給 Namenode
HDFS 的"機架感知",通過節(jié)點之間發(fā)送一個數據包,來感應它們是否在同一個機架
一般在本機架放一個副本,在其他機架再存放一個副本,這樣可以防止機架失效時丟失數據,也可以提高帶寬利用率
NameNode 周期性從 DataNode 接受心跳信息和塊報告
NameNode 根據塊報告驗證元數據
沒有按時發(fā)送心跳的 DataNode 會被標記為宕機,不會再給他任何 I/O 請求
如果 DataNode 失效造成副本數量下降,并且低于預先設定的值,NameNode 會檢測出這些數據庫,并在合適的時機重新復制
引發(fā)重新復制的原因還包括數據副本本身損壞,磁盤錯誤,復制因子被增大等
NameNode 啟動時會先經過一個 "安全模式" 階段
安全模式階段不會產生數據寫
在此階段 NameNode 收集各個 DataNode 的報告, 當數據塊達到最小副本數以上時,會被認為是"安全"的
在一定比例(可設置) 的數據塊被確定為"安全" 后 ,在過若干時間,安全模式結束
當檢測到副本數不足的數據塊時,該塊會被復制,直到達到最小副本數
在文件創(chuàng)立時,每個數據塊都產生效驗和
效驗和會作為單獨一個隱藏文件保存在命名空間下
客戶端獲取數據時可以檢查效驗和是否相同,從而發(fā)現數據塊是否損壞
如果正在讀取的數據塊損壞,則可以繼續(xù)讀取其他副本
刪除文件時,其實是放入回收站 /trash
回收站里的文件是可以快速恢復的
可以設置一個時間值,當回收站里文件的存放時間超過了這個值,就被徹底刪除,并且釋放占用的數據塊
映像文件和事物日志是 NameNode 的核心數據.可以配置為擁有多個副本
副本會降低 NameNode 的處理速度,但增加安全性
NameNode 依然是單點,如果發(fā)生故障要手工切換
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯系方式:
更多建議: