注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件基于Apache Kylin構(gòu)建大數(shù)據(jù)分析平臺

基于Apache Kylin構(gòu)建大數(shù)據(jù)分析平臺

基于Apache Kylin構(gòu)建大數(shù)據(jù)分析平臺

定 價:¥69.00

作 者: 蔣守壯 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302454526 出版時間: 2016-11-01 包裝: 平裝
開本: 16開 頁數(shù): 260 字數(shù):  

內(nèi)容簡介

  Apache Kylin是一個開源的分布式分析引擎,提供Hadoop之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規(guī)模數(shù)據(jù),最初由eBay公司開發(fā)并貢獻至開源社區(qū)。它能在亞秒內(nèi)查詢巨大的Hive表。本書分為21章,詳細講解Apache Kylin概念、安裝、配置、部署,讓讀者對Apache Kylin構(gòu)建大數(shù)據(jù)分析平臺有一個感性認識。同時,本書從應用角度,結(jié)合Dome和實例介紹了用于多維分析的Cube算法的創(chuàng)建、配置與優(yōu)化。最后還介紹了Kyligence公司發(fā)布KAP大數(shù)據(jù)分析平臺,對讀者有極大的參考價值。本書適合大數(shù)據(jù)技術初學者、大數(shù)據(jù)分析人員、大數(shù)據(jù)架構(gòu)師等,也適合用于高等院校和培訓學校相關專業(yè)師生教學參考。

作者簡介

  蔣守壯,現(xiàn)就職于萬達網(wǎng)絡科技集團有限公司,資深大數(shù)據(jù)工程師,大數(shù)據(jù)實踐者。曾任平安科技資深大數(shù)據(jù)分析師和架構(gòu)師,CSDN社區(qū)專家,知識庫特邀編輯。目前專注于Docker、Kubernetes、Mesos、Hadoop、Spark和Kylin等技術領域。

圖書目錄

第一部分 Apache Kylin基礎部分
第1章 Apache Kylin前世今生 3
1.1 Apache Kylin的背景 3
1.2 Apache Kylin的應用場景 3
1.3 Apache Kylin的發(fā)展歷程 4
第2章 Apache Kylin前奏 7
2.1 事實表和維表 7
2.2 星型模型和雪花型模型 7
2.2.1 星型模型 7
2.2.2 雪花型模型 8
2.2.3 星型模型示例 8
2.3 OLAP 9
2.3.1 OLAP分類 9
2.3.2 OLAP的基本操作 10
2.4 數(shù)據(jù)立方體(Data Cube) 11
第3章 Apache Kylin 工作原理和體系架構(gòu) 12
3.1 Kylin工作原理 12
3.2 Kylin體系架構(gòu) 13
3.3 Kylin中的核心部分:Cube構(gòu)建 15
3.4 Kylin的SQL查詢 16
3.5 Kylin的特性和生態(tài)圈 16
第4章 搭建CDH大數(shù)據(jù)平臺 18
4.1 系統(tǒng)環(huán)境和安裝包 19
4.1.1 系統(tǒng)環(huán)境 19
4.1.2 安裝包的下載 20
4.2 準備工作:系統(tǒng)環(huán)境搭建 21
4.2.1 網(wǎng)絡配置(CDH集群所有節(jié)點) 21
4.2.2 打通SSH,設置ssh無密碼登錄(所有節(jié)點) 21
4.3 正式安裝CDH:準備工作 29
4.4 正式安裝CDH5:安裝配置 30
4.4.1 CDH5的安裝配置 30
4.4.2 對Hive、HBase執(zhí)行簡單操作 39
第5章 使用Kylin構(gòu)建企業(yè)大數(shù)據(jù)分析平臺的4種部署方式 41
5.1 Kylin部署的架構(gòu) 41
5.2 Kylin的四種典型部署方式 42
第6章 單獨為Kylin部署HBase集群 44
第7章 部署Kylin集群環(huán)境 58
7.1 部署Kylin的先決條件 58
7.2 部署Kylin集群環(huán)境 61
7.3 為Kylin集群搭建負載均衡器 70
7.3.1 搭建Nginx環(huán)境 70
7.3.2 配置Nginx實現(xiàn)Kylin的負載均衡 73
第二部分 Apache Kylin 進階部分
第8章 Demo案例實戰(zhàn) 77
8.1 Sample Cube案例描述 77
8.2 Sample Cube案例實戰(zhàn) 78
8.2.1 準備數(shù)據(jù) 78
8.2.2 構(gòu)建Cube 81
第9章 多維分析的Cube創(chuàng)建實戰(zhàn) 89
9.1 Cube模型 89
9.2 創(chuàng)建Cube的流程 90
9.2.1 步驟一:Hive中事實表,以及多張維表的處理 90
9.2.2 步驟二:Kylin中建立項目(Project) 95
9.2.3 步驟三:Kylin中建立數(shù)據(jù)源(Data Source) 95
9.2.4 步驟四:Kylin中建立數(shù)據(jù)模型(Model) 98
9.2.5 步驟五:Kylin中建立Cube 104
9.2.6 步驟六:Build Cube 114
9.2.7 步驟七:查詢Cube 118
第10章 Build Cube的來龍去脈 120
10.1 流程分析 120
10.2 小結(jié) 134
第三部分 Apache Kylin 高級部分
第11章 Cube優(yōu)化 137
第12章 備份Kylin的Metadata 142
12.1 Kylin的元數(shù)據(jù) 142
12.2 備份元數(shù)據(jù) 143
12.3 恢復元數(shù)據(jù) 146
第13章 使用Hive視圖 147
13.1 使用Hive視圖 147
13.2 使用視圖實戰(zhàn) 149
第14章 Kylin的垃圾清理 153
14.1 清理元數(shù)據(jù) 153
14.2 清理存儲器數(shù)據(jù) 154
第15章 JDBC訪問方式 157
第16章 通過RESTful訪問Kylin 161
第17章 Kylin版本之間升級 179
17.1 從1.5.2升級到最新版本1.5.3 179
17.2 從1.5.1升級到1.5.2版本 180
17.3 從Kylin 1.5.2.1升級到Kylin 1.5.3實戰(zhàn) 181
17.4 補充內(nèi)容 187
第18章 大數(shù)據(jù)可視化實踐 189
18.1 可視化工具簡述 189
18.2 安裝Kylin ODBC驅(qū)動 190
18.3 通過Excel訪問Kylin 192
18.4 通過Power BI訪問Kylin 194
18.4.1 安裝配置Power BI 194
18.4.2 實戰(zhàn)操作 198
18.5 通過Tableau訪問Kylin 199
18.6 Kylin + Mondrian + Saiku 205
18.7 實戰(zhàn)演練:通過Saiku訪問Kylin 211
18.7.1 第一個Schema例子:myproject_pvuv_cube的演示 211
18.7.2 第二個Schema例子:kylin_sales_cube的演示 219
18.7.3 Saiku使用的一些問題 223
18.8 通過Apache Zepplin訪問Kylin 229
18.9 通過Kylin的“Insight”查詢 232
第19章 使用Streaming Table 構(gòu)建準實時Cube 236
第20章 快速數(shù)據(jù)立方算法 251
20.1 快速數(shù)據(jù)立方算法概述 251
20.2 快速數(shù)據(jù)立方算法優(yōu)點和缺點 253
20.3 獲取Fast Cubing算法的優(yōu)勢 254
第四部分 Apache Kylin的擴展部分
第21章 大數(shù)據(jù)智能分析平臺KAP 257
21.1 大數(shù)據(jù)智能分析平臺KAP概述 257
21.2 KAP的安裝部署 259

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號