定 價(jià):¥329.00
作 者: | 王家林,段智華 |
出版社: | 清華大學(xué)出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787302544531 | 出版時(shí)間: | 2020-05-01 | 包裝: | |
開本: | 16開 | 頁(yè)數(shù): | 1303 | 字?jǐn)?shù): |
第1篇 內(nèi)核解密篇
第1章 電光石火間體驗(yàn)Spark 2.4 開發(fā)實(shí)戰(zhàn)
1.1 通過(guò)RDD實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)入門及源碼閱讀
1.1.1 Spark核心概念圖解
1.1.2 通過(guò)RDD實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)案例
1.2 通過(guò)DataFrame和DataSet實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)
1.2.1 通過(guò)DataFrame實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)案例
1.2.2 通過(guò)DataSet實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)案例
1.3 Spark2.4 源碼閱讀環(huán)境搭建及源碼閱讀體驗(yàn)
第2章 Spark 2.4 技術(shù)及原理
2.1 Spark 2.4 綜述
2.1.1 連續(xù)應(yīng)用程序
2.1.2 新的API
2.2 Spark 2.4 Core
2.2.1 第二代Tungsten引擎
2.2.2 SparkSession
2.2.3 累加器API
2.3 Spark 2.4 SQL
2.3.1 Spark SQL
2.3.2 DataFrame和Dataset API
2.3.3 Timed Window
2.4 Spark 2.4 Streaming
2.4.1 Structured Streaming
2.4.2 增量輸出模式
2.5 Spark 2.4 MLlib
2.5.1 基于DataFrame的Machine Learning API
2.5.2 R的分布式算法
2.6 Spark 2.4 GraphX
第3章 Spark的靈魂:RDD和DataSet
3.1 為什么說(shuō)RDD和DataSet是Spark的靈魂
3.1.1 RDD的定義及五大特性剖析
3.1.2 DataSet的定義及內(nèi)部機(jī)制剖析
3.2 RDD彈性特性7個(gè)方面解析
3.3 RDD依賴關(guān)系
3.3.1 窄依賴解析
3.3.2 寬依賴解析
3.4 解析Spark中的DAG邏輯視圖
3.4.1 DAG生成的機(jī)制
3.4.2 DAG邏輯視圖解析
3.5 RDD內(nèi)部的計(jì)算機(jī)制
3.5.1 Task解析
3.5.2 計(jì)算過(guò)程深度解析
3.6 SparkRDD容錯(cuò)原理及其四大核心要點(diǎn)解析
3.6.1 Spark RDD容錯(cuò)原理
3.6.2 RDD容錯(cuò)的四大核心要點(diǎn)
3.7 SparkRDD中Runtime流程解析
3.7.1 Runtime架構(gòu)圖
3.7.2 生命周期
3.8 通過(guò)WordCount實(shí)戰(zhàn)解析Spark RDD內(nèi)部機(jī)制
3.8.1 Spark WordCount動(dòng)手實(shí)踐
3.8.2 解析RDD生成的內(nèi)部機(jī)制
3.9 基于DataSet的代碼如何轉(zhuǎn)化為RDD
第4章 Spark Driver啟動(dòng)內(nèi)幕剖析
4.1 Spark Driver Program剖析
4.1.1 Spark Driver Program
4.1.2 SparkContext深度剖析
4.1.3 SparkContext源碼解析
4.2 DAGScheduler解析
4.2.1 DAG的定義
4.2.2 DAG的實(shí)例化
4.2.3 DAGScheduler劃分Stage的原理
4.2.4 DAGScheduler劃分Stage的具體算法
4.2.5 Stage內(nèi)部Task獲取最佳位置的算法
4.3 TaskScheduler解析
4.3.1 TaskScheduler原理剖析
4.3.2 TaskScheduler源碼解析
4.4 SchedulerBackend解析
4.4.1 SchedulerBackend原理剖析
4.4.2 SchedulerBackend源碼解析
4.4.3 Spark程序的注冊(cè)機(jī)制
……
第2篇 商業(yè)案例篇
第3篇 性能調(diào)優(yōu)篇
第4篇 Spark+AI解密篇