注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)設(shè)計(jì)/管理Spark大數(shù)據(jù)商業(yè)實(shí)戰(zhàn)三部曲:內(nèi)核解密|商業(yè)案例|性能調(diào)優(yōu)(第2版)

Spark大數(shù)據(jù)商業(yè)實(shí)戰(zhàn)三部曲:內(nèi)核解密|商業(yè)案例|性能調(diào)優(yōu)(第2版)

Spark大數(shù)據(jù)商業(yè)實(shí)戰(zhàn)三部曲:內(nèi)核解密|商業(yè)案例|性能調(diào)優(yōu)(第2版)

定 價(jià):¥329.00

作 者: 王家林,段智華
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302544531 出版時(shí)間: 2020-05-01 包裝:
開本: 16開 頁(yè)數(shù): 1303 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《Spark大數(shù)據(jù)商業(yè)實(shí)戰(zhàn)三部曲:內(nèi)核解密 商業(yè)案例 性能調(diào)優(yōu)(第2版)》基于 Spark 2.4.X版本,以 Spark商業(yè)案例實(shí)戰(zhàn)和 Spark在生產(chǎn)環(huán)境下幾乎所有類型的性能調(diào)優(yōu)為核心,以 Spark內(nèi)核解密為基石,對(duì)企業(yè)生產(chǎn)環(huán)境下的 Spark商業(yè)案例與性能調(diào)優(yōu)抽絲剝繭地進(jìn)行剖析。全書共分 4篇,內(nèi)核解密篇基于 Spark源碼,從一個(gè)實(shí)戰(zhàn)案例入手,循序漸進(jìn)地全面解析 Spark 2.4.X版本的新特性及 Spark內(nèi)核源碼;商業(yè)案例篇選取 Spark開發(fā)中具代表性的經(jīng)典學(xué)習(xí)案例,在案例中綜合介紹 Spark的大數(shù)據(jù)技術(shù);性能調(diào)優(yōu)篇覆蓋 Spark在生產(chǎn)環(huán)境下的所有調(diào)優(yōu)技術(shù);Spark+AI解密篇講解深度學(xué)習(xí)實(shí)踐、 Spark+PyTorch案例實(shí)戰(zhàn)、Spark+TensorFlow實(shí)戰(zhàn)以及 Spark上的深度學(xué)習(xí)內(nèi)核解密。該書適合所有 Spark學(xué)習(xí)者和從業(yè)人員使用。對(duì)于有分布式計(jì)算框架應(yīng)用經(jīng)驗(yàn)的人員,該書也可作為 Spark高手修煉的參考用書。該書還適合作為高等院校的大數(shù)據(jù)課程教材。

作者簡(jiǎn)介

  王家林,Apache Spark執(zhí)牛耳者現(xiàn)工作于硅谷的AI實(shí)驗(yàn)室,專注于NLP框架超過(guò)20本Spark、Al、Android書籍作者Toastmasters International Division Director GRE博士入學(xué)考試連續(xù)兩次滿分獲得者段智華,就職于中國(guó)電信股份有限公司上海分公司,系統(tǒng)架構(gòu)師,CSDN博客專家,專注于Spark大數(shù)據(jù)技術(shù)研發(fā)及推廣,跟隨Spark核心源碼技術(shù)的發(fā)展,深入研究Spark 2.1.1版本及Spark 2.2.0版本的源碼優(yōu)化,對(duì)Spark大數(shù)據(jù)處理、機(jī)器學(xué)習(xí)等技術(shù)有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)和濃厚興趣。

圖書目錄

第1篇 內(nèi)核解密篇
第1章 電光石火間體驗(yàn)Spark 2.4 開發(fā)實(shí)戰(zhàn)
1.1 通過(guò)RDD實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)入門及源碼閱讀
1.1.1 Spark核心概念圖解
1.1.2 通過(guò)RDD實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)案例
1.2 通過(guò)DataFrame和DataSet實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)
1.2.1 通過(guò)DataFrame實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)案例
1.2.2 通過(guò)DataSet實(shí)戰(zhàn)電影點(diǎn)評(píng)系統(tǒng)案例
1.3 Spark2.4 源碼閱讀環(huán)境搭建及源碼閱讀體驗(yàn)
第2章 Spark 2.4 技術(shù)及原理
2.1 Spark 2.4 綜述
2.1.1 連續(xù)應(yīng)用程序
2.1.2 新的API
2.2 Spark 2.4 Core
2.2.1 第二代Tungsten引擎
2.2.2 SparkSession
2.2.3 累加器API
2.3 Spark 2.4 SQL
2.3.1 Spark SQL
2.3.2 DataFrame和Dataset API
2.3.3 Timed Window
2.4 Spark 2.4 Streaming
2.4.1 Structured Streaming
2.4.2 增量輸出模式
2.5 Spark 2.4 MLlib
2.5.1 基于DataFrame的Machine Learning API
2.5.2 R的分布式算法
2.6 Spark 2.4 GraphX
第3章 Spark的靈魂:RDD和DataSet
3.1 為什么說(shuō)RDD和DataSet是Spark的靈魂
3.1.1 RDD的定義及五大特性剖析
3.1.2 DataSet的定義及內(nèi)部機(jī)制剖析
3.2 RDD彈性特性7個(gè)方面解析
3.3 RDD依賴關(guān)系
3.3.1 窄依賴解析
3.3.2 寬依賴解析
3.4 解析Spark中的DAG邏輯視圖
3.4.1 DAG生成的機(jī)制
3.4.2 DAG邏輯視圖解析
3.5 RDD內(nèi)部的計(jì)算機(jī)制
3.5.1 Task解析
3.5.2 計(jì)算過(guò)程深度解析
3.6 SparkRDD容錯(cuò)原理及其四大核心要點(diǎn)解析
3.6.1 Spark RDD容錯(cuò)原理
3.6.2 RDD容錯(cuò)的四大核心要點(diǎn)
3.7 SparkRDD中Runtime流程解析
3.7.1 Runtime架構(gòu)圖
3.7.2 生命周期
3.8 通過(guò)WordCount實(shí)戰(zhàn)解析Spark RDD內(nèi)部機(jī)制
3.8.1 Spark WordCount動(dòng)手實(shí)踐
3.8.2 解析RDD生成的內(nèi)部機(jī)制
3.9 基于DataSet的代碼如何轉(zhuǎn)化為RDD
第4章 Spark Driver啟動(dòng)內(nèi)幕剖析
4.1 Spark Driver Program剖析
4.1.1 Spark Driver Program
4.1.2 SparkContext深度剖析
4.1.3 SparkContext源碼解析
4.2 DAGScheduler解析
4.2.1 DAG的定義
4.2.2 DAG的實(shí)例化
4.2.3 DAGScheduler劃分Stage的原理
4.2.4 DAGScheduler劃分Stage的具體算法
4.2.5 Stage內(nèi)部Task獲取最佳位置的算法
4.3 TaskScheduler解析
4.3.1 TaskScheduler原理剖析
4.3.2 TaskScheduler源碼解析
4.4 SchedulerBackend解析
4.4.1 SchedulerBackend原理剖析
4.4.2 SchedulerBackend源碼解析
4.4.3 Spark程序的注冊(cè)機(jī)制
……
第2篇 商業(yè)案例篇
第3篇 性能調(diào)優(yōu)篇
第4篇 Spark+AI解密篇

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)