注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫Hadoop高級編程:構(gòu)建與實現(xiàn)大數(shù)據(jù)解決方案[Professional Hadoop Solutions]

Hadoop高級編程:構(gòu)建與實現(xiàn)大數(shù)據(jù)解決方案[Professional Hadoop Solutions]

Hadoop高級編程:構(gòu)建與實現(xiàn)大數(shù)據(jù)解決方案[Professional Hadoop Solutions]

定 價:¥59.80

作 者: (美)Boris Lublinsky,(美)Kevin T. Smith,(美)Alexey Yakubovich 著; 穆玉偉,靳曉輝 譯
出版社: 清華大學(xué)出版社
叢編項:
標(biāo) 簽: 計算機(jī)與互聯(lián)網(wǎng) 數(shù)據(jù)庫

ISBN: 9787302369066 出版時間: 2014-07-01 包裝: 平裝
開本: 16開 頁數(shù): 448 字?jǐn)?shù):  

內(nèi)容簡介

  如果你已經(jīng)準(zhǔn)備好要充分實施大規(guī)??蓴U(kuò)展性數(shù)據(jù)分析工作,那么需要知道如何利用Hadoop技術(shù)?!禜adoop高級編程:構(gòu)建與實現(xiàn)大數(shù)據(jù)解決方案》可以幫助你做到這一點!本書關(guān)注用于構(gòu)建先進(jìn)的、基于Hadoop的企業(yè)級應(yīng)用的架構(gòu)和方案,并為實現(xiàn)現(xiàn)實的解決方案提供深入的、代碼級的講解。本書還會帶你領(lǐng)略數(shù)據(jù)設(shè)計以及數(shù)據(jù)設(shè)計如何影響實現(xiàn)。本書解釋了MapReduce的工作原理,并展示了如何在MapReduce中重新定制特定的業(yè)務(wù)問題。在整本書中,你將會發(fā)現(xiàn)深入的Java代碼示例,這些代碼示例可以直接使用,它們均源自于已經(jīng)成功地構(gòu)建和部署的應(yīng)用程序。

作者簡介

  Boris Lublinsky,是諾基亞的首席架構(gòu)師,出版了70多篇作品,包括Applied SOA: Service-Oriented Architecture and Design Strategies ?!evin T. Smith,是Novetta Solutions公司AMS部門的技術(shù)解決方案總監(jiān),他為客戶構(gòu)建高度安全的、面向數(shù)據(jù)的解決方案?!lexey Yakubovich,是Hortonworks的一名系統(tǒng)架構(gòu)師,而且是對象管理組織(OMG)關(guān)于SOA治理和模型驅(qū)動架構(gòu)的特別興趣小組(SIG)的一名成員。

圖書目錄

第1章 大數(shù)據(jù)和Hadoop生態(tài)系統(tǒng)
1.1 當(dāng)大數(shù)據(jù)遇見Hadoop
1.1.1 Hadoop:直面大數(shù)據(jù)的挑戰(zhàn)
1.1.2 商業(yè)世界中的數(shù)據(jù)科學(xué)
1.2 Hadoop生態(tài)系統(tǒng)
1.3 Hadoop核心組件
1.4 Hadoop發(fā)行版
1.5 使用Hadoop開發(fā)企業(yè)級應(yīng)用
1.6 小結(jié)
第2章 Hadoop數(shù)據(jù)存儲
2.1 HDFS
2.1.1 HDFS架構(gòu)
2.1.2 使用HDFS文件
2.1.3 Hadoop特定的文件類型
2.1.4 HDFS聯(lián)盟和高可用性
2.2 HBase
2.2.1 HBase架構(gòu)
2.2.2 HBase結(jié)構(gòu)設(shè)計
2.2.3 HBase編程
2.2.4 HBase新特性
2.3 將HDFS和HBase的組合用于高效數(shù)據(jù)存儲
2.4 使用Apache Avro
2.5 利用HCatalog管理元數(shù)據(jù)
2.6 為應(yīng)用程序選擇合適的Hadoop數(shù)據(jù)組織形式
2.7 小結(jié)
第3章 使用MapReduce處理數(shù)據(jù)
3.1 了解MapReduce
3.1.1 MapReduce執(zhí)行管道
3.1.2 MapReduce中的運(yùn)行時協(xié)調(diào)和任務(wù)管理
3.2 第一個MapReduce應(yīng)用程序
3.3 設(shè)計MapReduce實現(xiàn)
3.3.1 將MapReduce用作并行處理框架
3.3.2 使用MapReduce進(jìn)行簡單的數(shù)據(jù)處理
3.3.3 使用MapReduce構(gòu)建連接
3.3.4 構(gòu)建迭代式MapReduce應(yīng)用程序
3.3.5 是否使用MapReduce
3.3.6 常見的MapReduce設(shè)計陷阱
3.4 小結(jié)
第4章 自定義MapReduce執(zhí)行
4.1 使用InputFormat控制MapReduce執(zhí)行
4.1.1 為計算密集型應(yīng)用程序?qū)崿F(xiàn)InputFormat
4.1.2 實現(xiàn)InputFormat以控制Map的數(shù)量
4.1.3 實現(xiàn)用于多個HBase表的InputFormat
4.2 使用自定義RecordReader以自己的方式讀取數(shù)據(jù)
4.2.1 實現(xiàn)基于隊列的RecordReader
4.2.2 為XML數(shù)據(jù)實現(xiàn)RecordReader
4.3 使用自定義輸出格式組織輸出數(shù)據(jù)
4.4 使用自定義記錄寫入器以自己的方式寫入數(shù)據(jù)
4.5 使用組合器優(yōu)化MapReduce執(zhí)行
4.6 使用分區(qū)器控制Reducer執(zhí)行
4.7 在Hadoop中使用非Java代碼
4.7.1 Pipes
4.7.2 Hadoop Streaming
4.7.3 使用JNI
4.8 小結(jié)
第5章 構(gòu)建可靠的MapReduce應(yīng)用程序
5.1 單元測試MapReduce應(yīng)用程序
5.1.1 測試Mapper
5.1.2 測試Reducer
5.1.3 集成測試
5.2 使用Eclipse進(jìn)行本地應(yīng)用程序測試
5.3 將日志用于Hadoop測試
5.4 使用作業(yè)計數(shù)器報告指標(biāo)
5.5 MapReduce中的防御性編程
5.6 小結(jié)
第6章 使用Oozie自動化數(shù)據(jù)處理
6.1 認(rèn)識Oozie
6.2 Oozie Workflow
6.2.1 在Oozie Workflow中執(zhí)行異步操作
6.2.2 Oozie的恢復(fù)能力
6.2.3 Oozie Workflow作業(yè)的生命周期
6.3 Oozie Coordinator
6.4 Oozie Bundle
6.5 用表達(dá)式語言對Oozie進(jìn)行參數(shù)化
6.5.1 Workflow函數(shù)
6.5.2 Coordinator函數(shù)
6.5.3 Bundle函數(shù)
6.5.4 其他EL函數(shù)
6.6 Oozie作業(yè)執(zhí)行模型
6.7 訪問Oozie
6.8 Oozie SLA
6.9 小結(jié)
第7章 使用Oozie
7.1 使用探測包驗證位置相關(guān)信息的正確性
7.2 設(shè)計基于探測包的地點正確性驗證
7.3 設(shè)計Oozie Workflow
7.4 實現(xiàn)Oozie Workflow應(yīng)用程序
7.4.1 實現(xiàn)數(shù)據(jù)準(zhǔn)備Workflow
7.4.2 實現(xiàn)考勤指數(shù)和聚類探測包串Workflow
7.5 實現(xiàn) Workflow行為
7.5.1 發(fā)布來自java動作的執(zhí)行上下文
7.5.2 在Oozie Workflow中使用MapReduce作業(yè)
7.6 實現(xiàn)Oozie Coordinator應(yīng)用程序
7.7 實現(xiàn)Oozie Bundle應(yīng)用程序
7.8 部署、測試和執(zhí)行Oozie應(yīng)用程序
7.8.1 部署Oozie應(yīng)用程序
7.8.2 使用Oozie CLI執(zhí)行Oozie應(yīng)用程序
7.8.3 向Oozie作業(yè)傳遞參數(shù)
7.9 使用Oozie控制臺獲取Oozie應(yīng)用程序信息
7.9.1 了解Oozie控制臺界面
7.9.2 獲取 Coordinator作業(yè)信息
7.10 小結(jié)
第8章 高級Oozie特性
8.1 構(gòu)建自定義Oozie Workflow動作
8.1.1 實現(xiàn)自定義Oozie Workflow動作
8.1.2 部署Oozie自定義Workflow動作
8.2 向Oozie Workflow添加動態(tài)執(zhí)行
8.2.1 總體實現(xiàn)方法
8.2.2 一個機(jī)器學(xué)習(xí)模型、參數(shù)和算法
8.2.3 為迭代過程定義Workflow
8.2.4 動態(tài)Workflow生成
8.3 使用Oozie Java API
8.4 在Oozie應(yīng)用中使用uber jar包
8.5 數(shù)據(jù)吸收傳送器
8.6 小結(jié)
第9章 實時Hadoop
9.1 現(xiàn)實世界中的實時應(yīng)用
9.2 使用HBase來實現(xiàn)實時應(yīng)用
9.2.1 將HBase用作圖片管理系統(tǒng)
9.2.2 將HBase用作Lucene后端
9.3 使用專門的實時Hadoop查詢系統(tǒng)
9.3.1 Apache Drill
9.3.2 Impala
9.3.3 實時查詢和MapReduce的對比
9.4 使用基于Hadoop的事件處理系統(tǒng)
9.4.1 HFlame
9.4.2 Storm
9.4.3 事件處理和MapReduce的對比
9.5 小結(jié)
第10章 Hadoop安全
10.1 簡要的歷史:理解Hadoop安全的挑戰(zhàn)
10.2 認(rèn)證
10.2.1 Kerberos認(rèn)證
10.2.2 委派安全憑據(jù)
10.3 授權(quán)
10.3.1 HDFS文件訪問權(quán)限
10.3.2 服務(wù)級授權(quán)
10.3.3 作業(yè)授權(quán)
10.4 Oozie認(rèn)證和授權(quán)
10.5 網(wǎng)絡(luò)加密
10.6 使用Rhino項目增強(qiáng)安全性
10.6.1 HDFS磁盤級加密
10.6.2 基于令牌的認(rèn)證和統(tǒng)一的授權(quán)框架
10.6.3 HBase單元格級安全
10.7 將所有內(nèi)容整合起來--保證Hadoop安全的最佳實踐
10.7.1 認(rèn)證
10.7.2 授權(quán)
10.7.3 網(wǎng)絡(luò)加密
10.7.4 敬請關(guān)注Hadoop的增強(qiáng)功能
10.8 小結(jié)
第11章 在AWS上運(yùn)行Hadoop應(yīng)用
11.1 初識AWS
11.2 在AWS上運(yùn)行Hadoop的可選項
11.2.1 使用EC2實例的自定義安裝
11.2.2 彈性MapReduce
11.2.3 做出選擇前的額外考慮
11.3 理解EMR-Hadoop的關(guān)系
11.3.1 EMR架構(gòu)
11.3.2 使用S3存儲
11.3.3 最大化EMR的使用
11.3.4 利用CloudWatch和其他AWS組件
11.3.5 訪問和使用EMR
11.4 使用AWS S3
11.4.1 理解桶的使用
11.4.2 使用控制臺瀏覽內(nèi)容
11.4.3 在S3中編程訪問文件
11.4.4 使用MapReduce上傳多個文件到S3
11.5 自動化EMR作業(yè)流創(chuàng)建和作業(yè)執(zhí)行
11.6 管理EMR中的作業(yè)執(zhí)行
11.6.1 在EMR集群上使用Oozie
11.6.2 AWS 簡單工作流
11.6.3 AWS數(shù)據(jù)管道
11.7 小結(jié)
第12章 為Hadoop實現(xiàn)構(gòu)建企業(yè)級安全解決方案
12.1 企業(yè)級應(yīng)用的安全顧慮
12.1.1 認(rèn)證
12.1.2 授權(quán)
12.1.3 保密性
12.1.4 完整性
12.1.5 審計
12.2 Hadoop安全沒有為企業(yè)級應(yīng)用原生地提供哪些機(jī)制
12.2.1 面向數(shù)據(jù)的訪問控制
12.2.2 差分隱私
12.2.3 加密靜止的數(shù)據(jù)
12.2.4 企業(yè)級安全集成
12.3 保證使用Hadoop的企業(yè)級應(yīng)用安全的方法
12.3.1 使用Accumulo進(jìn)行訪問控制保護(hù)
12.3.2 加密靜止數(shù)據(jù)
12.3.3 網(wǎng)絡(luò)隔離和分隔方案
12.4 小結(jié)
第13章 Hadoop的未來
13.1 使用DSL簡化MapReduce編程
13.1.1 什么是DSL
13.1.2 Hadoop的DSL
13.2 更快、更可擴(kuò)展的數(shù)據(jù)處理
13.2.1 Apache YARN
13.2.2 Tez
13.3 安全性的改進(jìn)
13.4 正在出現(xiàn)的趨勢
13.5 小結(jié)
附錄 有用的閱讀

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號