注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術工業(yè)技術自動化技術、計算技術Hadoop專家:管理、調優(yōu)與Spark|YARN|HDFS安全

Hadoop專家:管理、調優(yōu)與Spark|YARN|HDFS安全

Hadoop專家:管理、調優(yōu)與Spark|YARN|HDFS安全

定 價:¥168.00

作 者: (美)山姆·阿拉帕蒂
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787121356698 出版時間: 2019-03-01 包裝: 平裝
開本: 16開 頁數: 760 字數:  

內容簡介

  本書翻譯自Sam R. Alapati 的Expert Hadoop Administration。Sam R. Alapati 是Sabre 公司的首席Hadoop 管理員,具有多年的Hadoop 運維管理經驗。他希望通過本書,為Hadoop 集群開發(fā)與管理人員提供一些有益指導。從事Hadoop 的管理工作,首先要了解Hadoop 的架構,只進行單純的操作并不能被稱為合格的管理員?;诖耍緯诮榻BHadoop 及其生態(tài)組件時,都會首先介紹其架構,以期讀者能夠在更高的層次認識管理工作。本書首先介紹了Hadoop 的整體架構及其部署與使用;然后著重介紹了兩個重要的計算引擎MapReduce 與Spark ;接著介紹了Hadoop 的數據存儲與安全、數據均衡等特性;最后則介紹了如何進行參數調優(yōu)與故障排除。整個流程下來,讀者能夠建立起完整的關于Hadoop 管理的體系架構。

作者簡介

  Sam R. Alapati,從事Hadoop相關工作6年。目前在Sabre任Principal Hadoop Administrator,負責大規(guī)模Hadoop集群的日常管理工作,主要對多個關鍵數據科學、數據分析Hadoop作業(yè)工作流進行管理。Sam R. Alapati還是一位Oracle DBA專家,在過去14年間出版了18部廣受好評的Oracle技術著作。貝殼大數據架構團隊,負責公司大數據存儲平臺、計算平臺、實時數據流平臺的架構、性能調優(yōu)、研發(fā)等,提供高效的大數據olap引擎,以及大數據工具鏈組件研發(fā),為公司提供穩(wěn)定、高效、開放的大數據基礎組件與基礎平臺。

圖書目錄

第Ⅰ部分 Hadoop架構與Hadoop集群介紹
第1章 Hadoop與Hadoop環(huán)境介紹............................................................................... 3
Hadoop簡介.........................................................................................................................4
Hadoop 的特性............................................................................................................5
Hadoop 與大數據........................................................................................................5
Hadoop 的典型應用場景............................................................................................6
傳統(tǒng)數據庫系統(tǒng)..........................................................................................................7
數據湖..........................................................................................................................9
大數據、數據科學和Hadoop ..................................................................................10
Hadoop集群與集群計算................................................................................................... 11
集群計算.................................................................................................................... 11
Hadoop 集群..............................................................................................................12
Hadoop組件和Hadoop生態(tài)..............................................................................................14
Hadoop管理員需要做些什么...........................................................................................16
Hadoop 管理—新的范式......................................................................................17
關于Hadoop 管理你需要知道的.............................................................................18
Hadoop 管理員的工具集..........................................................................................19
Hadoop 1和Hadoop 2的關鍵區(qū)別....................................................................................19
架構區(qū)別....................................................................................................................20
高可用性....................................................................................................................20
多計算引擎................................................................................................................21
xiv 目錄
分離處理和調度........................................................................................................21
Hadoop 1 和Hadoop 2 中的資源分配.....................................................................22
分布式數據處理:MapReduce和Spark、Hive、Pig ......................................................22
MapReduce ................................................................................................................22
Apache Spark .............................................................................................................23
Apache Hive ...............................................................................................................24
Apache Pig .................................................................................................................24
數據整合:Apache Sqoop、Apache Flume和Apache Kafka ..........................................25
Hadoop管理中的關鍵領域...............................................................................................26
集群存儲管理............................................................................................................26
集群資源分配............................................................................................................26
作業(yè)調度....................................................................................................................27
Hadoop 數據安全......................................................................................................27
總結....................................................................................................................................28
第2章 Hadoop架構介紹............................................................................................. 31
Hadoop與分布式計算..................................

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號