注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書工具書科技工具書Hadoop與Spark入門

Hadoop與Spark入門

Hadoop與Spark入門

定 價:¥59.00

作 者: 覃雄派,陳躍國
出版社: 清華大學(xué)出版社
叢編項: 數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)面向新工科專業(yè)建設(shè)計算機(jī)系列教材
標(biāo) 簽: 暫缺

ISBN: 9787302613633 出版時間: 2022-11-01 包裝: 平裝
開本: 16開 頁數(shù): 233 字?jǐn)?shù):  

內(nèi)容簡介

  本書為一本大數(shù)據(jù)技術(shù)的入門書籍,介紹Hadoop大數(shù)據(jù)平臺和Spark大數(shù)據(jù)平臺及相關(guān)工具的原理,以及如何進(jìn)行部署和簡單開發(fā)。全書包含13章: 、2章介紹如何為深入學(xué)習(xí)Hadoop和Spark做環(huán)境準(zhǔn)備,包括VMware虛擬機(jī)的創(chuàng)建和CentOS操作系統(tǒng)安裝。第3~6章介紹Hadoop大數(shù)據(jù)平臺的基本原理,包括HDFS、MapReduce計算模型、HBase數(shù)據(jù)庫,以及Hive數(shù)據(jù)倉庫的原理、部署方法和開發(fā)技術(shù)。第7~11章介紹Spark大數(shù)據(jù)平臺的基本原理,包括彈性分布式數(shù)據(jù)集、轉(zhuǎn)換與動作操作、寬依賴與窄依賴、有向無環(huán)圖表達(dá)的作業(yè)及其處理過程等,并且介紹了Spark Core、Spark SQL、Spark MLlib、Spark GraphX的部署和開發(fā)技術(shù)。 兩章介紹了Flume( 2章)和Kafka( 3章)兩個工具,F(xiàn)lume用于大量日志的收集和處理,Kafka用于對大量快速到達(dá)的數(shù)據(jù)進(jìn)行及時、可靠、暫時的存儲。本書適合高等院校高年級本科生以及碩士研究生使用,也可以供非計算機(jī)專業(yè)學(xué)生及相關(guān)領(lǐng)域技術(shù)人員參考。

作者簡介

  覃雄派,博士,中國人民大學(xué)信息學(xué)院講師、碩士生導(dǎo)師,目前主要從事高性能數(shù)據(jù)庫、大數(shù)據(jù)分析、信息檢索等方面的研究工作,主持1項 自然科學(xué)基金面上項目,參與多項 “863”計劃、“973”計劃及 自然科學(xué)基金項目,在 外期刊和會議上發(fā)表論文20余篇。

圖書目錄

第1章 VMware 與虛擬機(jī)
1.1 VMware簡介
1.2 VMware的安裝
1.3 VMware的網(wǎng)絡(luò)配置
1.3.1 VMnet0網(wǎng)卡配置
1.3.2 VMnet1網(wǎng)卡配置
1.3.3 VMnet8網(wǎng)卡配置
1.4 Windows環(huán)境下對VMnet8的DNS進(jìn)行配置
1.5 利用管理員權(quán)限編輯網(wǎng)卡
1.6 總結(jié)
1.7 思考題
參考文獻(xiàn)
第2章 CentOS操作系統(tǒng)安裝
2.1 新建VMware虛擬機(jī)
2.2 安裝CentOS
2.3 配置Yum
2.4 為CentOS安裝圖形用戶界面
2.5 CentOS的網(wǎng)絡(luò)配置
2.5.1 虛擬機(jī)的網(wǎng)絡(luò)配置
2.5.2 在CentOS操作系統(tǒng)里對網(wǎng)卡進(jìn)行設(shè)置
2.6 Samba配置
2.7 配置SSHD
2.8 重新啟動虛擬機(jī)需要執(zhí)行的命令
2.9 思考題
第3章 Hadoop入門
3.1 Hadoop簡介
3.2 HDFS
3.2.1 寫文件
3.2.2 讀文件
3.2.3 Secondary NameNode介紹
3.3 MapReduce 工作原理
3.3.1 MapReduce 執(zhí)行引擎
3.3.2 MapReduce 計算模型
3.3.3Hadoop 1.0 的應(yīng)用
3.4 Hadoop 生態(tài)系統(tǒng)
3.5 Hadoop 2
3.5.1Hadoop 1.0 的優(yōu)勢和局限
3.5.2 從Hadoop 1.0 到Hadoop 2.0
3.5.3 YARN原理
3.5.4 YARN的優(yōu)勢
3.6 思考題
第4章 Hadoop安裝與HDFS、MapReduce實驗
4.1 安裝JDK
4.2 新建虛擬機(jī)集群
4.2.1 網(wǎng)絡(luò)配置小結(jié)
4.2.2 配置各個虛擬機(jī)別名
4.2.3 配置各個虛擬機(jī)的/etc/hosts文件
4.3 無密碼SSH登錄
4.4 Hadoop 安裝、配置和啟動
4.4.1 core-site.xml配置文件

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號