注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)工業(yè)技術(shù)自動化技術(shù)、計算技術(shù)Hadoop專家:管理、調(diào)優(yōu)與Spark|YARN|HDFS安全

Hadoop專家:管理、調(diào)優(yōu)與Spark|YARN|HDFS安全

Hadoop專家:管理、調(diào)優(yōu)與Spark|YARN|HDFS安全

定 價:¥168.00

作 者: (美)山姆·阿拉帕蒂
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121356698 出版時間: 2019-03-01 包裝: 平裝
開本: 16開 頁數(shù): 760 字數(shù):  

內(nèi)容簡介

  本書翻譯自Sam R. Alapati 的Expert Hadoop Administration。Sam R. Alapati 是Sabre 公司的首席Hadoop 管理員,具有多年的Hadoop 運維管理經(jīng)驗。他希望通過本書,為Hadoop 集群開發(fā)與管理人員提供一些有益指導。從事Hadoop 的管理工作,首先要了解Hadoop 的架構(gòu),只進行單純的操作并不能被稱為合格的管理員。基于此,本書在介紹Hadoop 及其生態(tài)組件時,都會首先介紹其架構(gòu),以期讀者能夠在更高的層次認識管理工作。本書首先介紹了Hadoop 的整體架構(gòu)及其部署與使用;然后著重介紹了兩個重要的計算引擎MapReduce 與Spark ;接著介紹了Hadoop 的數(shù)據(jù)存儲與安全、數(shù)據(jù)均衡等特性;最后則介紹了如何進行參數(shù)調(diào)優(yōu)與故障排除。整個流程下來,讀者能夠建立起完整的關(guān)于Hadoop 管理的體系架構(gòu)。

作者簡介

  Sam R. Alapati,從事Hadoop相關(guān)工作6年。目前在Sabre任Principal Hadoop Administrator,負責大規(guī)模Hadoop集群的日常管理工作,主要對多個關(guān)鍵數(shù)據(jù)科學、數(shù)據(jù)分析Hadoop作業(yè)工作流進行管理。Sam R. Alapati還是一位Oracle DBA專家,在過去14年間出版了18部廣受好評的Oracle技術(shù)著作。貝殼大數(shù)據(jù)架構(gòu)團隊,負責公司大數(shù)據(jù)存儲平臺、計算平臺、實時數(shù)據(jù)流平臺的架構(gòu)、性能調(diào)優(yōu)、研發(fā)等,提供高效的大數(shù)據(jù)olap引擎,以及大數(shù)據(jù)工具鏈組件研發(fā),為公司提供穩(wěn)定、高效、開放的大數(shù)據(jù)基礎組件與基礎平臺。

圖書目錄

第Ⅰ部分 Hadoop架構(gòu)與Hadoop集群介紹
第1章 Hadoop與Hadoop環(huán)境介紹............................................................................... 3
Hadoop簡介.........................................................................................................................4
Hadoop 的特性............................................................................................................5
Hadoop 與大數(shù)據(jù)........................................................................................................5
Hadoop 的典型應用場景............................................................................................6
傳統(tǒng)數(shù)據(jù)庫系統(tǒng)..........................................................................................................7
數(shù)據(jù)湖..........................................................................................................................9
大數(shù)據(jù)、數(shù)據(jù)科學和Hadoop ..................................................................................10
Hadoop集群與集群計算................................................................................................... 11
集群計算.................................................................................................................... 11
Hadoop 集群..............................................................................................................12
Hadoop組件和Hadoop生態(tài)..............................................................................................14
Hadoop管理員需要做些什么...........................................................................................16
Hadoop 管理—新的范式......................................................................................17
關(guān)于Hadoop 管理你需要知道的.............................................................................18
Hadoop 管理員的工具集..........................................................................................19
Hadoop 1和Hadoop 2的關(guān)鍵區(qū)別....................................................................................19
架構(gòu)區(qū)別....................................................................................................................20
高可用性....................................................................................................................20
多計算引擎................................................................................................................21
xiv 目錄
分離處理和調(diào)度........................................................................................................21
Hadoop 1 和Hadoop 2 中的資源分配.....................................................................22
分布式數(shù)據(jù)處理:MapReduce和Spark、Hive、Pig ......................................................22
MapReduce ................................................................................................................22
Apache Spark .............................................................................................................23
Apache Hive ...............................................................................................................24
Apache Pig .................................................................................................................24
數(shù)據(jù)整合:Apache Sqoop、Apache Flume和Apache Kafka ..........................................25
Hadoop管理中的關(guān)鍵領(lǐng)域...............................................................................................26
集群存儲管理............................................................................................................26
集群資源分配............................................................................................................26
作業(yè)調(diào)度....................................................................................................................27
Hadoop 數(shù)據(jù)安全......................................................................................................27
總結(jié)....................................................................................................................................28
第2章 Hadoop架構(gòu)介紹............................................................................................. 31
Hadoop與分布式計算..................................

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號