注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件Hadoop大數(shù)據(jù)挖掘從入門到進階實戰(zhàn)(視頻教學版)

Hadoop大數(shù)據(jù)挖掘從入門到進階實戰(zhàn)(視頻教學版)

Hadoop大數(shù)據(jù)挖掘從入門到進階實戰(zhàn)(視頻教學版)

定 價:¥99.00

作 者: 鄧杰 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111600107 出版時間: 2018-06-01 包裝: 平裝
開本: 16開 頁數(shù): 402 字數(shù):  

內(nèi)容簡介

  本書采用“理論+實戰(zhàn)”的形式編寫,全面介紹了Hadoop大數(shù)據(jù)挖掘的相關知識。本書共分為13章,涵蓋的主要內(nèi)容有:集群及開發(fā)環(huán)境搭建;快速構建一個Hadoop項目并線上運行;Hadoop套件實戰(zhàn);Hive編程——使用SQL提交MapReduce任務到Hadoop集群;游戲玩家的用戶行為分析——特征提??;Hadoop平臺管理與維護;Hadoop異常處理解決方案;初識Hadoop核心源碼;Hadoop通信機制和內(nèi)部協(xié)議;Hadoop分布式文件系統(tǒng)剖析;ELK實戰(zhàn)案例——游戲應用實時日志分析平臺;Kafka實戰(zhàn)案例——實時處理游戲用戶數(shù)據(jù);Hadoop拓展——Kafka剖析。本書不但適合剛入門的初學者系統(tǒng)學習Hadoop的各種基礎語法和開發(fā)技巧,而且也適合有多年開發(fā)經(jīng)驗的開發(fā)者進階提高。另外,本書也適合社會培訓機構和相關院校作為教材或者教學參考書。

作者簡介

暫缺《Hadoop大數(shù)據(jù)挖掘從入門到進階實戰(zhàn)(視頻教學版)》作者簡介

圖書目錄

目錄
前言
第1章 集群及開發(fā)環(huán)境搭建1
1.1 環(huán)境準備1
1.1.1 基礎軟件下載1
1.1.2 準備Linux操作系統(tǒng)2
1.2 安裝Hadoop4
1.2.1 基礎環(huán)境配置4
1.2.2 Zookeeper部署7
1.2.3 Hadoop部署9
1.2.4 效果驗證21
1.2.5 集群架構詳解24
1.3 Hadoop版Hello World25
1.3.1 Hadoop Shell介紹25
1.3.2 WordCount初體驗27
1.4 開發(fā)環(huán)境28
1.4.1 搭建本地開發(fā)環(huán)境28
1.4.2 運行及調試預覽31
1.5 小結34
第2章 實戰(zhàn):快速構建一個Hadoop項目并線上運行35
2.1 構建一個簡單的項目工程35
2.1.1 構建Java Project結構工程35
2.1.2 構建Maven結構工程36
2.2 操作分布式文件系統(tǒng)(HDFS)39
2.2.1 基本的應用接口操作39
2.2.2 在高可用平臺上的使用方法42
2.3 利用IDE提交MapReduce作業(yè)43
2.3.1 在單點上的操作43
2.3.2 在高可用平臺上的操作46
2.4 編譯應用程序并打包51
2.4.1 編譯Java Project工程并打包51
2.4.2 編譯Maven工程并打包55
2.5 部署與調度58
2.5.1 部署應用58
2.5.2 調度任務59
2.6 小結60
第3章 Hadoop套件實戰(zhàn)61
3.1 Sqoop——數(shù)據(jù)傳輸工具61
3.1.1 背景概述61
3.1.2 安裝及基本使用62
3.1.3 實戰(zhàn):在關系型數(shù)據(jù)庫與分布式文件系統(tǒng)之間傳輸數(shù)據(jù)64
3.2 Flume——日志收集工具66
3.2.1 背景概述67
3.2.2 安裝與基本使用67
3.2.3 實戰(zhàn):收集系統(tǒng)日志并上傳到分布式文件系統(tǒng)(HDFS)上72
3.3 HBase——分布式數(shù)據(jù)庫74
3.3.1 背景概述74
3.3.2 存儲架構介紹75
3.3.3 安裝與基本使用75
3.3.4 實戰(zhàn):對HBase業(yè)務表進行增、刪、改、查操作79
3.4 Zeppelin——數(shù)據(jù)集分析工具85
3.4.1 背景概述85
3.4.2 安裝與基本使用85
3.4.3 實戰(zhàn):使用解釋器操作不同的數(shù)據(jù)處理引擎88
3.5 Drill——低延時SQL查詢引擎92
3.5.1 背景概述93
3.5.2 安裝與基本使用93
3.5.3 實戰(zhàn):對分布式文件系統(tǒng)(HDFS)使用SQL進行查詢95
3.5.4 實戰(zhàn):使用SQL查詢HBase數(shù)據(jù)庫99
3.5.5 實戰(zhàn):對數(shù)據(jù)倉庫(Hive)使用類實時統(tǒng)計、查詢操作101
3.6 Spark——實時流數(shù)據(jù)計算104
3.6.1 背景概述104
3.6.2 安裝部署及使用105
3.6.3 實戰(zhàn):對接Kafka消息數(shù)據(jù),消費、計算及落地108
3.7 小結114
第4章 Hive編程——使用SQL提交MapReduce任務到Hadoop集群115
4.1 環(huán)境準備與Hive初識115
4.1.1 背景介紹115
4.1.2 基礎環(huán)境準備116
4.1.3 Hive結構初識116
4.1.4 Hive與關系型數(shù)據(jù)庫(RDBMS)118
4.2 安裝與配置Hive118
4.2.1 Hive集群基礎架構119
4.2.2 利用HAProxy實現(xiàn)Hive Server負載均衡120
4.2.3 安裝分布式Hive集群123
4.3 可編程方式126
4.3.1 數(shù)據(jù)類型126
4.3.2 存儲格式128
4.3.3 基礎命令129
4.3.4 Java編程語言操作數(shù)據(jù)倉庫(Hive)131
4.3.5 實踐Hive Streaming134
4.4 運維和監(jiān)控138
4.4.1 基礎命令138
4.4.2 監(jiān)控工具Hive Cube140
4.5 小結143
第5章 游戲玩家的用戶行為分析——特征提取144
5.1 項目應用概述144
5.1.1 場景介紹144
5.1.2 平臺架構與數(shù)據(jù)采集145
5.1.3 準備系統(tǒng)環(huán)境和軟件147
5.2 分析與設計148
5.2.1 整體分析148
5.2.2 指標與數(shù)據(jù)源分析149
5.2.3 整體設計151
5.3 技術選型153
5.3.1 套件選取簡述154
5.3.2 套件使用簡述154
5.4 編碼實踐157
5.4.1 實現(xiàn)代碼157
5.4.2 統(tǒng)計結果處理163
5.4.3 應用調度169
5.5 小結174
第6章 Hadoop平臺管理與維護175
6.1 Hadoop分布式文件系統(tǒng)(HDFS)175
6.1.1 HDFS特性175
6.1.2 基礎命令詳解176
6.1.3 解讀NameNode Standby179
6.2 Hadoop平臺監(jiān)控182
6.2.1 Hadoop日志183
6.2.2 常用分布式監(jiān)控工具187
6.3 平臺維護196
6.3.1 安全模式196
6.3.2 節(jié)點管理198
6.3.3 HDFS快照200
6.4 小結203
第7章 Hadoop異常處理解決方案204
7.1 定位異常204
7.1.1 跟蹤日志204
7.1.2 分析異常信息208
7.1.3 閱讀開發(fā)業(yè)務代碼209
7.2 解決問題的方式210
7.2.1 搜索關鍵字211
7.2.2 查看Hadoop JIRA212
7.2.3 閱讀相關源碼213
7.3 實戰(zhàn)案例分析216
7.3.1 案例分析1:啟動HBase失敗216
7.3.2 案例分析2:HBase表查詢失敗219
7.3.3 案例分析3:Spark的臨時數(shù)據(jù)不自動清理222
7.4 小結223
第8章 初識Hadoop核心源碼224
8.1 基礎準備與源碼編譯224
8.1.1 準備環(huán)境224
8.1.2 加載源碼228
8.1.3 編譯源碼230
8.2 初識Hadoop 2233
8.2.1 Hadoop的起源233
8.2.2 Hadoop 2源碼結構圖234
8.2.3 Hadoop模塊包235
8.3 MapReduce框架剖析236
8.3.1 第一代MapReduce框架236
8.3.2 第二代MapReduce框架238
8.3.3 兩代MapReduce框架的區(qū)別239
8.3.4 第二代MapReduce框架的重構思路240
8.4 序列化241
8.4.1 序列化的由來242
8.4.2 Hadoop序列化243
8.4.3 Writable實現(xiàn)類245
8.5 小結247
第9章 Hadoop通信機制和內(nèi)部協(xié)議248
9.1 Hadoop RPC概述248
9.1.1 通信模型248
9.1.2 Hadoop RPC特點250
9.2 Hadoop R

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號