注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)庫理論Hadoop HDFS深度剖析與實踐

Hadoop HDFS深度剖析與實踐

Hadoop HDFS深度剖析與實踐

定 價:¥99.00

作 者: 祝江華 編著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787111724797 出版時間: 2023-05-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書以Hadoop HDFS為載體,介紹了構(gòu)建一款分布式系統(tǒng)(尤其是存儲方向)所需的核心技術(shù),所有內(nèi)容均基于當前較新的3.3.x/3.4.x版本,分別從理論和實踐兩個維度逐一闡述。本書主要包括兩篇:核心原理篇介紹了HDFS的誕生歷史、元數(shù)據(jù)及Block管理、節(jié)點間通信機制、讀寫數(shù)據(jù)流程和高可用實現(xiàn)原理等;拓展與實踐篇從實際出發(fā),充分考慮了用戶在應(yīng)用過程中會遇到的痛點,詳細介紹了集群拓展方法、數(shù)據(jù)分層存儲、集群維護與多租戶實施等實踐經(jīng)驗。本書各章節(jié)都配有必要的流程圖和原理分析圖,便于讀者閱讀理解,并精選了非常有用的實際案例及拓展知識。閱讀本書后,相信會給讀者帶來“1 1>2”的效果。本書非常適合大數(shù)據(jù)從業(yè)者、云計算領(lǐng)域研發(fā)及運維人員、高校研究生和熱衷于分布式的技術(shù)極客閱讀學習。

作者簡介

  祝江華,大數(shù)據(jù)技術(shù)專家。多年來一直供職于頭部互聯(lián)網(wǎng)公司,積累了較為豐富的大數(shù)據(jù)行業(yè)一線研發(fā)和集群維護經(jīng)驗;熱愛開源,長期活躍在Apache開源社區(qū),對包括Hadoop生態(tài)在內(nèi)的多款組件有過深入研究;分布式技術(shù)極客,擅長分布式存儲方向,同時對大數(shù)據(jù)計算、數(shù)據(jù)湖等也有豐富實戰(zhàn)經(jīng)驗。

圖書目錄

第1篇 核心原理篇
第1章 HDFS歷史延展/
1.1 分布式與文件系統(tǒng)/
1.1.1 分布式文件系統(tǒng)部署架構(gòu)/
1.1.2 系統(tǒng)性能的影響因素/
1.2 HDFS設(shè)計及實現(xiàn)思想/
1.2.1 HDFS發(fā)展歷史/
1.2.2 HDFS特性/
1.2.3 HDFS服務(wù)視圖/
1.2.4 HDFS架構(gòu)/
1.3 小結(jié)/
第2章 元數(shù)據(jù)架構(gòu)/
2.1 內(nèi)存Tree設(shè)計/
2.1.1 Namenode介紹/
2.1.2 Namenode啟動/
2.1.3 meta視圖/
2.1.4 FsDirectory和INodeMap/
2.1.5 文件維護/
2.2 FsImage和Edit Log/
2.2.1 FsImage分析/
2.2.2 Edit Log分析/
2.3 meta更新/
2.3.1 內(nèi)存結(jié)構(gòu)Update/
2.3.2 拓展:鎖優(yōu)化/
2.4 小結(jié)/
第3章 數(shù)據(jù)管理/
3.1 Namespace/
3.1.1 Namespace概況/
3.1.2 Namenode與Namespace/
3.1.3 DataNode與Namespace/
3.2 Slave節(jié)點/
3.2.1 Heartbeat機制/
3.2.2 FsDataset和DataStorage/
3.2.3 DataNode檢查器/
3.2.4 存儲類型/
3.2.5 拓展:NVDIMM/
3.3 Topology(Rack) Awareness/
3.3.1 Topology Awareness在分布式存儲中的意義/
3.3.2 Topology Awareness在HDFS中實現(xiàn)/
3.3.3 Topology改進/
3.4 小結(jié)/
第4章 Block與副本/
4.1 理解Block/
4.1.1 Block構(gòu)成解析/
4.1.2 副本存儲解析/
4.2 Block狀態(tài)管理/
4.2.1 UnderConstruction/
4.2.2 Committed/
4.2.3 Complete/
4.2.4 UnderRecovery/
4.2.5 Block狀態(tài)小結(jié)/
4.3 副本狀態(tài)管理/
4.3.1 RBW/
4.3.2 finalized/
4.3.3 RWR/
4.3.4 RUR/
4.3.5 Temporary/
4.3.6 副本狀態(tài)小結(jié)/
4.4 Block管理/
4.4.1 無效Block/
4.4.2 損壞Block/
4.4.3 缺失與冗余Block/
4.4.4 Block Recovery/
4.5 副本策略/
4.5.1 位置策略/
4.5.2 選盤(Volume)策略/
4.5.3 選盤策略改進/
4.6 小結(jié)/
第5章 通信與訪問/
5.1 HDFS RPC/
5.1.1 Protocol Buffers介紹/
5.1.2 RPC架構(gòu)/
5.1.3 非冪等訪問/
5.2 文件寫入/
5.2.1 數(shù)據(jù)包(packet)與Pipeline/
5.2.2 數(shù)據(jù)寫入/
5.2.3 Lease管理與pipeline Recovery/
5.3 數(shù)據(jù)訪問/
5.3.1 文件讀剖析/
5.3.2 short-circuit/
5.3.3 讀寫策略改進/
5.4 小結(jié)/
第6章 HA和QJM/
6.1 HA發(fā)展路徑/
6.2 Quorum Journal Manager/
6.2.1 分布式一致性原理/
6.2.2 Edit共享存儲系統(tǒng)/
6.2.3 QJM架構(gòu)設(shè)計/
6.2.4 Edit Recovery/
6.3 HA原理/
6.3.1 ZKFC解析/
6.3.2 HA隔離機制/
6.3.3 Multi-Standby特性/
6.3.4 HA優(yōu)化及改進/
6.4 小結(jié)/
第7章 緩存/
7.1 分布式系統(tǒng)緩存設(shè)計/
7.1.1 本地緩存/
7.1.2 分布式緩存/
7.2 集中式緩存管理/
7.2.1 原理介紹/
7.2.2 緩存調(diào)度/
7.2.3 DataNode緩存原理/
7.2.4 Cache&Uncache場景/
7.3 緩存實踐場景及改進/
7.3.1 實踐場景介紹/
7.3.2 集中式緩存V2/
7.4 小結(jié)/
第2篇 拓展與實踐篇
第8章 集群拓展/
8.1 水平拓展/
8.1.1 水平拓展策略及實踐/
8.1.2 Router-Based Federation/
8.2 垂直伸縮/
8.2.1 垂直伸縮策略及實踐/
8.2.2 HDFS Quotas/
8.3 多Namespace業(yè)務(wù)規(guī)劃/
8.4 小結(jié)/
第9章 數(shù)據(jù)分層/
9.1 存儲分層的意義/
9.2 HDFS存儲分層/
9.2.1 冷熱集群分層管理/
9.2.2 異構(gòu)分層存儲/
9.2.3 動態(tài)感知數(shù)據(jù)類型/
9.3 糾刪碼(Erasure Coding)/
9.3.1 EC使用介紹/
9.3.2 常見EC算法介紹/
9.3.3 EC讀寫解析/
9.4 數(shù)據(jù)遷移/
9.4.1 DistCp遷移/
9.4.2 FastCopy遷移/
9.5 小結(jié)/
第10章 監(jiān)控、多租戶和數(shù)據(jù)湖/
10.1 大數(shù)據(jù)監(jiān)控/
10.1.1 基礎(chǔ)設(shè)施監(jiān)控采集/
10.1.2 故障自愈/
10.2 多租戶與認證/
10.2.1 多租戶存儲規(guī)劃/
10.2.2 基于Kerberos的認證/
10.2.3 基于Delegation Token的認證/
10.3 HDFS與Data Lakes/
10.4 小結(jié)/

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號