注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件Hadoop 3實(shí)戰(zhàn)指南

Hadoop 3實(shí)戰(zhàn)指南

Hadoop 3實(shí)戰(zhàn)指南

定 價(jià):¥69.80

作 者: 孫志偉 著
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787115561572 出版時(shí)間: 2021-05-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 176 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)主要分析Hadoop 3.2.0的新特性和新功能,共5章。首先簡(jiǎn)單介紹Hadoop,讓剛接觸Hadoop的讀者對(duì)它有個(gè)基本了解; 接著介紹目前使用比較多的分布式文件系統(tǒng)HDFS,內(nèi)容涉及NameNode 的原理、HA、HDFS Federation和HDFS 3.0中新增的特性;然后從應(yīng)用管理和資源調(diào)度這兩個(gè)方面介紹一個(gè)通用的資源管理平臺(tái)YARN;再后討論如何在YARN平臺(tái)中運(yùn)行應(yīng)用,比如如何將應(yīng)用遷移到Y(jié)ARN平臺(tái),以及非Hadoop的應(yīng)用是如何兼容YARN模式的。最后,書(shū)中給出了一些工作實(shí)戰(zhàn)指南,包括如何搭建一個(gè)生產(chǎn)可用的Hadoop 3.0集群;如何將現(xiàn)有Hadoop 2.0集群升級(jí)到Hadoop 3.0,及其在升級(jí)過(guò)程中遇到的問(wèn)題;如何針對(duì)Hadoop進(jìn)行二次開(kāi)發(fā),并參與社區(qū),向社區(qū)貢獻(xiàn)代碼;一個(gè)大數(shù)據(jù)平臺(tái)應(yīng)具備哪些必備組件等。

作者簡(jiǎn)介

  孫志偉金山云數(shù)據(jù)平臺(tái)架構(gòu)師,專(zhuān)注于Hadoop生態(tài)和數(shù)據(jù)平臺(tái)建設(shè),曾就職于網(wǎng)易、轉(zhuǎn)轉(zhuǎn)等互聯(lián)網(wǎng)公司。對(duì)大數(shù)據(jù)處理、分布式計(jì)算與數(shù)據(jù)采集有著濃厚的興趣。一直從事Hadoop 研發(fā)與運(yùn)維工作,努力鉆研技術(shù)并堅(jiān)持分享。有著豐富的一線(xiàn)研發(fā)與運(yùn)維經(jīng)驗(yàn),是多個(gè)社區(qū)的Contributor,積極活躍于開(kāi)源社區(qū)。碩士,畢業(yè)于華北電力大學(xué)。

圖書(shū)目錄

目  錄
第 1章 Hadoop 1
1.1 簡(jiǎn)介 1
1.1.1 Hadoop 1.0 1
1.1.2 Hadoop 2.0 3
1.2 Hadoop 3.0 4
1.3 閱讀Hadoop源碼 6
1.3.1 單元測(cè)試 8
1.3.2 斷點(diǎn)調(diào)試代碼 11
1.4 小結(jié) 13
第 2章 HDFS 14
2.1 HDFS簡(jiǎn)介 14
2.2 解析NameNode中的元數(shù)據(jù)及其內(nèi)存結(jié)構(gòu) 15
2.2.1 解析NameNode中的元數(shù)據(jù) 16
2.2.2 解析NameNode的內(nèi)存結(jié)構(gòu) 19
2.3 解析NameNode的HA功能 23
2.3.1 基于QJM的HA 23
2.3.2 故障轉(zhuǎn)移 26
2.3.3 多NameNode模式 28
2.4 HDFS的Federation 29
2.4.1 基于viewfs的Federation 30
2.4.2 基于Router的Federation 31
2.5 糾刪碼 32
2.5.1 糾刪碼的原理 33
2.5.2 HDFS EC 35
2.5.3 HDFS EC的實(shí)現(xiàn) 38
2.5.4 對(duì)比HDFS EC策略與三副本策略 49
2.6 下一代對(duì)象存儲(chǔ)系統(tǒng)Ozone 50
2.6.1 Ozone初體驗(yàn) 50
2.6.2 Ozone架構(gòu) 53
2.7 小結(jié) 55
第3章 YARN 56
3.1 YARN簡(jiǎn)介 56
3.2 解析ResourceManager的HA功能 60
3.2.1 故障轉(zhuǎn)移 61
3.2.2 數(shù)據(jù)恢復(fù) 63
3.3 YARN Federation 65
3.3.1 架構(gòu) 65
3.3.2 Router 66
3.3.3 State Store和Policy Store 69
3.3.4 AMRMProxy 69
3.3.5 跨子集群運(yùn)行 74
3.4 中央調(diào)度器 75
3.4.1 Capacity調(diào)度器 76
3.4.2 Fair調(diào)度器 78
3.4.3 調(diào)度擴(kuò)展 90
3.5 分布式調(diào)度器 96
3.5.1 分布式調(diào)度器的架構(gòu) 97
3.5.2 opportunistic container 98
3.6 YARN Shared Cache 99
3.6.1 資源本地化 100
3.6.2 Shared Cache的架構(gòu) 101
3.6.3 Shared Cache實(shí)例 102
3.7 小結(jié) 104
第4章 Application on YARN 105
4.1 MapReduce的簡(jiǎn)介 105
4.2 MapReduce的源碼分析 106
4.2.1 InputSplit 107
4.2.2 環(huán)形緩沖區(qū) 109
4.2.3 溢寫(xiě)和歸并 112
4.2.4 Shuffle 113
4.3 MapReduce on YARN 119
4.3.1 YARN的事件機(jī)制和狀態(tài)機(jī)機(jī)制 119
4.3.2 MR ApplicationMaster 123
4.4 Application on YARN 124
4.5 小結(jié) 129
第5章 實(shí)戰(zhàn)指南 130
5.1 Hadoop 3.x的部署 130
5.1.1 Hadoop 3.x HA的部署 130
5.1.2 Hadoop 3.x Federation的部署 145
5.2 Hadoop升級(jí) 149
5.2.1 Hadoop 2.0升級(jí)為Hadoop 3.0 151
5.2.2 Hadoop 3.0降級(jí)為Hadoop 2.0 155
5.2.3 升級(jí)/降級(jí)中遇到的問(wèn)題 155
5.3 二次開(kāi)發(fā) 160
5.3.1 與其他自研系統(tǒng)融合 160
5.3.2 自身功能擴(kuò)展之自動(dòng)識(shí)別修復(fù)后的數(shù)據(jù)盤(pán) 163
5.3.3 合并社區(qū)Patch 166
5.3.4 提交Pull Request 167
5.4 周邊系統(tǒng)平臺(tái) 169
5.4.1 任務(wù)調(diào)度平臺(tái) 169
5.4.2 監(jiān)控平臺(tái) 170
5.4.3 集群診斷分析平臺(tái) 174
5.5 小結(jié) 176

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)