注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)教育/教材/教輔教材研究生/本科/??平滩?/a>Spark大數(shù)據(jù)分析技術(shù)(Python版 微課版)

Spark大數(shù)據(jù)分析技術(shù)(Python版 微課版)

Spark大數(shù)據(jù)分析技術(shù)(Python版 微課版)

定 價(jià):¥59.00

作 者: 曹潔
出版社: 清華大學(xué)出版社
叢編項(xiàng): 面向新工科專業(yè)建設(shè)計(jì)算機(jī)系列教材
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302625520 出版時(shí)間: 2023-03-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《Spark大數(shù)據(jù)分析技術(shù)(Python版·微課版)/面向新工科專業(yè)建設(shè)計(jì)算機(jī)系列教材》特色:循序漸進(jìn)講解Spark大數(shù)據(jù)全流程處理相關(guān)技術(shù),配備大量的實(shí)例。《Spark大數(shù)據(jù)分析技術(shù)(Python版·微課版)/面向新工科專業(yè)建設(shè)計(jì)算機(jī)系列教材》內(nèi)容豐富,涵蓋了Spark大數(shù)據(jù)處理框架、SparkRDD編程、SparkSQL結(jié)構(gòu)化數(shù)據(jù)處理、HBase分布式數(shù)據(jù)庫(kù)、SparkStreaming流計(jì)算、SparkMLlib機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化等內(nèi)容。《Spark大數(shù)據(jù)分析技術(shù)(Python版·微課版)/面向新工科專業(yè)建設(shè)計(jì)算機(jī)系列教材》注重Spark各生態(tài)組件原理剖析與算法的Python代碼實(shí)現(xiàn)相結(jié)合,做到理論與實(shí)踐并重?!禨park大數(shù)據(jù)分析技術(shù)(Python版·微課版)/面向新工科專業(yè)建設(shè)計(jì)算機(jī)系列教材》系統(tǒng)介紹Spark大數(shù)據(jù)處理框架。全書(shū)共8章,內(nèi)容包括大數(shù)據(jù)技術(shù)概述、Spark大數(shù)據(jù)處理框架、Spark RDD編程、Spark SQL結(jié)構(gòu)化數(shù)據(jù)處理、HBase分布式數(shù)據(jù)庫(kù)、Spark Streaming流計(jì)算、Spark MLlib機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化。《Spark大數(shù)據(jù)分析技術(shù)(Python版·微課版)/面向新工科專業(yè)建設(shè)計(jì)算機(jī)系列教材》可作為高等院校計(jì)算機(jī)科學(xué)與技術(shù)、信息管理與信息系統(tǒng)、軟件工程、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、人工智能等專業(yè)的大數(shù)據(jù)課程教材,也可供從事大數(shù)據(jù)開(kāi)發(fā)和研究工作的工程師和科技工作者參考。

作者簡(jiǎn)介

  曹潔,博士,畢業(yè)于同濟(jì)大學(xué)計(jì)算機(jī)軟件與理論專業(yè);研究方向?yàn)榇髷?shù)據(jù)技術(shù)、并行分布式處理等。在《軟件學(xué)報(bào)》《電子學(xué)報(bào)》《計(jì)算機(jī)研究與發(fā)展》《通信學(xué)報(bào)》等核心期刊上發(fā)表學(xué)術(shù)論文十余篇;主講Python語(yǔ)言程序設(shè)計(jì)、大數(shù)據(jù)技術(shù)、大數(shù)據(jù)分析等課程;主編出版7《Python語(yǔ)言程序設(shè)計(jì)》《Python數(shù)據(jù)挖掘技術(shù)及應(yīng)用》《Hadoop+Spark大數(shù)據(jù)技術(shù)》等多本省部級(jí)規(guī)劃教材。

圖書(shū)目錄

第1章 大數(shù)據(jù)技術(shù)概述
1.1 大數(shù)據(jù)的基本概念
1.1.1 大數(shù)據(jù)的定義
1.1.2 大數(shù)據(jù)的特征
1.1.3 大數(shù)據(jù)思維
1.2 代表性大數(shù)據(jù)技術(shù)
1.2.1 Hadoop
1.2.2 Spark
1.2.3 Flink
1.3 大數(shù)據(jù)編程語(yǔ)言
1.4 在線資源
1.5 拓展閱讀——三次信息化浪潮的啟示
1.6 習(xí)題
第2章 Spark大數(shù)據(jù)處理框架
2.1 Spark概述
2.1.1 Spark的產(chǎn)生背景
2.1.2 Spark的優(yōu)點(diǎn)
2.1.3 Spark的應(yīng)用場(chǎng)景
2.1.4 Spark的生態(tài)系統(tǒng)
2.2 Spark運(yùn)行機(jī)制
2.2.1 Spark基本概念
2.2.2 Spark運(yùn)行架構(gòu)
2.3 在VirtualBox上安裝Linux集群
2.3.1 Master節(jié)點(diǎn)的安裝
2.3.2 虛擬機(jī)克隆安裝Slavel節(jié)點(diǎn)
2.4 Hadoop安裝前的準(zhǔn)備工作
2.4.1 創(chuàng)建hadoop用戶和更新APT
2.4.2 安裝SSH、配置SSH無(wú)密碼登錄
2.4.3 安裝Java環(huán)境
2.4.4 Linux系統(tǒng)下Scala版本的Eclipse的安裝與配置
2.4.5 Eclipse環(huán)境下Java程序開(kāi)發(fā)實(shí)例
2.5 Hadoop的安裝與配置
2.5.1 下載Hadoop安裝文件
2.5.2 Hadoop單機(jī)模式配置
2.5.3 Hadoop偽分布式模式配置
2.5.4 Hadoop分布式模式配置
2.6 Spark的安裝與配置
2.6.1 下載Spark安裝文件
2.6.2 單機(jī)模式配置
2.6.3 偽分布式模式配置
2.7 使用PySpark編寫(xiě)Python代碼
2.8 安裝pip工具和常用的數(shù)據(jù)分析庫(kù)
2.9 安裝Anaconda和配置Jupyter Notebook
2.9.1 安裝Anaconda
2.9.2 配置Jupyter Notebook
2.9.3 運(yùn)行Jupyter Notebook
2.9.4 配置Jupyter Notebook實(shí)現(xiàn)和PySpark交互
2.9.5 為Anaconda安裝擴(kuò)展庫(kù)
2.10 拓展閱讀——Spark誕生的啟示
2.11 習(xí)題
……
第3章 Spark RDD編程
第4章 Spark SQL結(jié)構(gòu)化數(shù)據(jù)處理
第5章 HBase分布式數(shù)據(jù)庫(kù)
第6章 Spark Streaming流計(jì)算
第7章 Spark MLlib機(jī)器學(xué)習(xí)
第8章 數(shù)據(jù)可視化
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)