注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)基礎(chǔ)編程、實(shí)驗(yàn)和案例教程

大數(shù)據(jù)基礎(chǔ)編程、實(shí)驗(yàn)和案例教程

大數(shù)據(jù)基礎(chǔ)編程、實(shí)驗(yàn)和案例教程

定 價(jià):¥59.00

作 者: 林子雨 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302472094 出版時(shí)間: 2017-07-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 368 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書以大數(shù)據(jù)分析全流程為主線,介紹了數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)與管理、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化等環(huán)節(jié)典型軟件的安裝、使用和基礎(chǔ)編程方法。本書內(nèi)容涵蓋操作系統(tǒng)(Linux和Windows)、開(kāi)發(fā)工具(Eclipse)以及大數(shù)據(jù)相關(guān)技術(shù)、軟件(Sqoop、Kafka、Flume、Hadoop、HDFS、MapReduce、HBase、Hive、Spark、MySQL、MongoDB、Redis、R、Easel.ly、D3、魔鏡、ECharts、Tableau)等。同時(shí),本書還提供了豐富的課程實(shí)驗(yàn)和綜合案例,以及大量免費(fèi)的在線教學(xué)資源,可以較好地滿足高等院校大數(shù)據(jù)教學(xué)實(shí)際需求。本書是《大數(shù)據(jù)技術(shù)原理與應(yīng)用——概念、存儲(chǔ)、處理、分析與應(yīng)用》的“姊妹篇”,可以作為高等院校計(jì)算機(jī)、信息管理等相關(guān)專業(yè)的大數(shù)據(jù)課程輔助教材,用于指導(dǎo)大數(shù)據(jù)編程實(shí)踐;也可供相關(guān)技術(shù)人員參考。

作者簡(jiǎn)介

  林子雨(1978-),男,博士,廈門大學(xué)計(jì)算機(jī)科學(xué)系助理教授,廈門大學(xué)云計(jì)算與大數(shù)據(jù)研究中心創(chuàng)始成員,廈門大學(xué)數(shù)據(jù)庫(kù)實(shí)驗(yàn)室負(fù)責(zé)人,中國(guó)計(jì)算機(jī)學(xué)會(huì)數(shù)據(jù)庫(kù)專委會(huì)委員,中國(guó)計(jì)算機(jī)學(xué)會(huì)信息系統(tǒng)專委會(huì)委員。于2001年獲得福州大學(xué)水利水電專業(yè)學(xué)士學(xué)位,2005年獲得廈門大學(xué)計(jì)算機(jī)專業(yè)碩士學(xué)位,2009年獲得北京大學(xué)計(jì)算機(jī)專業(yè)博士學(xué)位。中國(guó)高校*“數(shù)字教師”提出者和建設(shè)者(http://www.cs.xmu.edu.cn/linziyu),2009年至今,“數(shù)字教師”大平臺(tái)累計(jì)向網(wǎng)絡(luò)免費(fèi)發(fā)布超過(guò)100萬(wàn)字高價(jià)值的教學(xué)和科研資料,累計(jì)網(wǎng)絡(luò)訪問(wèn)量超過(guò)100萬(wàn)次。主要研究方向?yàn)閿?shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘、大數(shù)據(jù)和云計(jì)算,發(fā)表期刊和會(huì)議學(xué)術(shù)論文多篇,并作為課題組負(fù)責(zé)人承擔(dān)了國(guó)家自然科學(xué)基金和福建省自然科學(xué)基金項(xiàng)目。曾作為志愿者翻譯了Google Spanner、BigTable和《Architecture of a Database System》等大量英文學(xué)術(shù)資料,與廣大網(wǎng)友分享,深受歡迎。2013年在廈門大學(xué)開(kāi)設(shè)大數(shù)據(jù)課程,并因在教學(xué)領(lǐng)域的突出貢獻(xiàn)和學(xué)生的認(rèn)可,成為2013年度廈門大學(xué)教學(xué)類獎(jiǎng)教金獲得者。

圖書目錄

第1章大數(shù)據(jù)技術(shù)概述/1
1.1大數(shù)據(jù)時(shí)代/1
1.2大數(shù)據(jù)關(guān)鍵技術(shù)/2
1.3大數(shù)據(jù)軟件/3
1.3.1Hadoop/4
1.3.2Spark/5
1.3.3NoSQL數(shù)據(jù)庫(kù)/5
1.3.4數(shù)據(jù)可視化/6
1.4內(nèi)容安排/7
1.5在線資源/8
1.5.1在線資源一覽表/9
1.5.2下載專區(qū)/9
1.5.3在線視頻/10
1.5.4拓展閱讀/11
1.5.5大數(shù)據(jù)課程公共服務(wù)平臺(tái)/11
1.6本章小結(jié)/12第2章Linux系統(tǒng)的安裝和使用/13
2.1Linux系統(tǒng)簡(jiǎn)介/13
2.2Linux系統(tǒng)安裝/13
2.2.1下載安裝文件/14
2.2.2Linux系統(tǒng)的安裝方式/14
2.2.3安裝Linux虛擬機(jī)/15
2.2.4生成Linux虛擬機(jī)鏡像文件/36
2.3Linux系統(tǒng)及相關(guān)軟件的基本使用方法/38
2.3.1Shell/38
2.3.2root用戶/38
2.3.3創(chuàng)建普通用戶/38〖2〗〖4〗大數(shù)據(jù)基礎(chǔ)編程、實(shí)驗(yàn)和案例教程目錄〖3〗2.3.4sudo命令/39
2.3.5常用的Linux系統(tǒng)命令/40
2.3.6文件解壓縮/40
2.3.7常用的目錄/41
2.3.8目錄的權(quán)限/41
2.3.9更新APT/41
2.3.10切換中英文輸入法/43
2.3.11vim編輯器的使用方法/43
2.3.12在Windows系統(tǒng)中使用SSH方式登錄Linux系統(tǒng)/44
2.3.13在Linux中安裝Eclipse/48
2.3.14其他使用技巧/49
2.4關(guān)于本書內(nèi)容的一些約定/49
2.5本章小結(jié)/50第3章Hadoop的安裝和使用/51
3.1Hadoop簡(jiǎn)介/51
3.2安裝Hadoop前的準(zhǔn)備工作/52
3.2.1創(chuàng)建hadoop用戶/52
3.2.2更新APT/52
3.2.3安裝SSH/52
3.2.4安裝Java環(huán)境/53
3.3安裝Hadoop/55
3.3.1下載安裝文件/55
3.3.2單機(jī)模式配置/56
3.3.3偽分布式模式配置/57
3.3.4分布式模式配置/66
3.3.5使用Docker搭建Hadoop分布式集群/75
3.4本章小結(jié)/87第4章HDFS操作方法和基礎(chǔ)編程/88
4.1HDFS操作常用Shell命令/88
4.1.1查看命令使用方法/88
4.1.2HDFS目錄操作/90
4.2利用HDFS的Web管理界面/92
4.3HDFS編程實(shí)踐/92
4.3.1在Eclipse中創(chuàng)建項(xiàng)目/93
4.3.2為項(xiàng)目添加需要用到的JAR包/94
4.3.3編寫Java應(yīng)用程序/96
4.3.4編譯運(yùn)行程序/98
4.3.5應(yīng)用程序的部署/100
4.4本章小結(jié)/102第5章HBase的安裝和基礎(chǔ)編程/103
5.1安裝HBase/103
5.1.1下載安裝文件/103
5.1.2配置環(huán)境變量/104
5.1.3添加用戶權(quán)限/104
5.1.4查看HBase版本信息/104
5.2HBase的配置/105
5.2.1單機(jī)模式配置/105
5.2.2偽分布式配置/107
5.3HBase常用Shell命令/109
5.3.1在HBase中創(chuàng)建表/109
5.3.2添加數(shù)據(jù)/110
5.3.3查看數(shù)據(jù)/110
5.3.4刪除數(shù)據(jù)/111
5.3.5刪除表/112
5.3.6查詢歷史數(shù)據(jù)/112
5.3.7退出HBase數(shù)據(jù)庫(kù)/112
5.4HBase編程實(shí)踐/113
5.4.1在Eclipse中創(chuàng)建項(xiàng)目/113
5.4.2為項(xiàng)目添加需要用到的JAR包/116
5.4.3編寫Java應(yīng)用程序/117
5.4.4編譯運(yùn)行程序/123
5.4.5應(yīng)用程序的部署/124
5.5本章小結(jié)/124第6章典型NoSQL數(shù)據(jù)庫(kù)的安裝和使用/125
6.1Redis安裝和使用/125
6.1.1Redis簡(jiǎn)介/125
6.1.2安裝Redis/125
6.1.3Redis實(shí)例演示/127
6.2MongoDB的安裝和使用/128
6.2.1MongDB簡(jiǎn)介/129
6.2.2安裝MongoDB/129
6.2.3使用Shell命令操作MongoDB/130
6.2.4Java API編程實(shí)例/136
6.3本章小結(jié)/139第7章MapReduce基礎(chǔ)編程/140
7.1詞頻統(tǒng)計(jì)任務(wù)要求/140
7.2MapReduce程序編寫方法/141
7.2.1編寫Map處理邏輯/141
7.2.2編寫Reduce處理邏輯/141
7.2.3編寫main方法/142
7.2.4完整的詞頻統(tǒng)計(jì)程序/143
7.3編譯打包程序/144
7.3.1使用命令行編譯打包詞頻統(tǒng)計(jì)程序/145
7.3.2使用Eclipse編譯運(yùn)行詞頻統(tǒng)計(jì)程序/145
7.4運(yùn)行程序/154
7.5本章小結(jié)/156第8章數(shù)據(jù)倉(cāng)庫(kù)Hive的安裝和使用/157
8.1Hive的安裝/157
8.1.1下載安裝文件/157
8.1.2配置環(huán)境變量/158
8.1.3修改配置文件/158
8.1.4安裝并配置MySQL/159
8.2Hive的數(shù)據(jù)類型/161
8.3Hive基本操作/162
8.3.1創(chuàng)建數(shù)據(jù)庫(kù)、表、視圖/162
8.3.2刪除數(shù)據(jù)庫(kù)、表、視圖/163
8.3.3修改數(shù)據(jù)庫(kù)、表、視圖/164
8.3.4查看數(shù)據(jù)庫(kù)、表、視圖/165
8.3.5描述數(shù)據(jù)庫(kù)、表、視圖/165
8.3.6向表中裝載數(shù)據(jù)/166
8.3.7查詢表中數(shù)據(jù)/166
8.3.8向表中插入數(shù)據(jù)或從表中導(dǎo)出數(shù)據(jù)/166
8.4Hive應(yīng)用實(shí)例: WordCount/167
8.5Hive編程的優(yōu)勢(shì)/167
8.6本章小結(jié)/168第9章Spark的安裝和基礎(chǔ)編程/169
9.1基礎(chǔ)環(huán)境/169
9.2安裝Spark/169
9.2.1下載安裝文件/169
9.2.2配置相關(guān)文件/170
9.3使用 Spark Shell編寫代碼/171
9.3.1啟動(dòng)Spark Shell/171
9.3.2讀取文件/172
9.3.3編寫詞頻統(tǒng)計(jì)程序/174
9.4編寫Spark獨(dú)立應(yīng)用程序/174
9.4.1用Scala語(yǔ)言編寫Spark獨(dú)立應(yīng)用程序/175
9.4.2用Java語(yǔ)言編寫Spark獨(dú)立應(yīng)用程序/178
9.5本章小結(jié)/182第10章典型的可視化工具的使用方法/183
10.1Easel.ly信息圖制作方法/183
10.1.1信息圖/183
10.1.2信息圖制作基本步驟/183
10.2D3可視化庫(kù)的使用方法/186
10.2.1D3可視化庫(kù)的安裝/187
10.2.2基本操作/187
10.3可視化工具Tableau使用方法/194
10.3.1安裝Tableau/195
10.3.2界面功能介紹/195
10.3.3Tableau簡(jiǎn)單操作/197
10.4使用“魔鏡”制作圖表/202
10.4.1“魔鏡”簡(jiǎn)介/202
10.4.2簡(jiǎn)單制作實(shí)例/202
10.5使用ECharts圖表制作/206
10.5.1ECharts簡(jiǎn)介/206
10.5.2ECharts圖表制作方法/206
10.5.3兩個(gè)實(shí)例/210
10.6本章小結(jié)/217第11章數(shù)據(jù)采集工具的安裝和使用/218
11.1Flume/218
11.1.1安裝Flume/218
11.1.2兩個(gè)實(shí)例/220
11.2Kafka/225
11.2.1Kafka相關(guān)概念/225
11.2.2安裝Kafka/225
11.2.3一個(gè)實(shí)例/225
11.3Sqoop/227
11.3.1下載安裝文件/227
11.3.2修改配置文件/228
11.3.3配置環(huán)境變量/228
11.3.4添加MySQL驅(qū)動(dòng)程序/228
11.3.5測(cè)試與MySQL的連接/229
11.4實(shí)例: 編寫Spark程序使用Kafka數(shù)據(jù)源/230
11.4.1Kafka準(zhǔn)備工作/230
11.4.2Spark準(zhǔn)備工作/232
11.4.3編寫Spark程序使用Kafka數(shù)據(jù)源/234
11.5本章小結(jié)/239第12章大數(shù)據(jù)課程綜合實(shí)驗(yàn)案例/241
12.1案例簡(jiǎn)介/241
12.1.1案例目的/241
12.1.2適用對(duì)象/241
12.1.3時(shí)間安排/241
12.1.4預(yù)備知識(shí)/241
12.1.5硬件要求/242
12.1.6軟件工具/242
12.1.7數(shù)據(jù)集/242
12.1.8案例任務(wù)/242
12.2實(shí)驗(yàn)環(huán)境搭建/243
12.3實(shí)驗(yàn)步驟概述/244
12.4本地?cái)?shù)據(jù)集上傳到數(shù)據(jù)倉(cāng)庫(kù)Hive/245
12.4.1實(shí)驗(yàn)數(shù)據(jù)集的下載/245
12.4.2數(shù)據(jù)集的預(yù)處理/246
12.4.3導(dǎo)入數(shù)據(jù)庫(kù)/249
12.5Hive數(shù)據(jù)分析/253
12.5.1簡(jiǎn)單查詢分析/253
12.5.2查詢條數(shù)統(tǒng)計(jì)分析/255
12.5.3關(guān)鍵字條件查詢分析/256
12.5.4根據(jù)用戶行為分析/258
12.5.5用戶實(shí)時(shí)查詢分析/259
12.6Hive、MySQL、HBase數(shù)據(jù)互導(dǎo)/260
12.6.1Hive預(yù)操作/260
12.6.2使用Sqoop將數(shù)據(jù)從Hive導(dǎo)入MySQL/261
12.6.3使用Sqoop將數(shù)據(jù)從MySQL導(dǎo)入HBase/265
12.6.4使用HBase Java API把數(shù)據(jù)從本地導(dǎo)入到HBase中/269
12.7利用R進(jìn)行數(shù)據(jù)可視化分析/275
12.7.1安裝R/275
12.7.2安裝依賴庫(kù)/277
12.7.3可視化分析/278
12.8本章小結(jié)/283第13章實(shí)驗(yàn)/284
13.1實(shí)驗(yàn)一: 熟悉常用的Linux操作和Hadoop操作/284
13.1.1實(shí)驗(yàn)?zāi)康?284
13.1.2實(shí)驗(yàn)平臺(tái)/284
13.1.3實(shí)驗(yàn)步驟/284
13.1.4實(shí)驗(yàn)報(bào)告/286
13.2實(shí)驗(yàn)二: 熟悉常用的HDFS操作/286
13.2.1實(shí)驗(yàn)?zāi)康?286
13.2.2實(shí)驗(yàn)平臺(tái)/286
13.2.3實(shí)驗(yàn)步驟/287
13.2.4實(shí)驗(yàn)報(bào)告/287
13.3實(shí)驗(yàn)三: 熟悉常用的HBase操作/288
13.3.1實(shí)驗(yàn)?zāi)康?288
13.3.2實(shí)驗(yàn)平臺(tái)/288
13.3.3實(shí)驗(yàn)步驟/288
13.3.4實(shí)驗(yàn)報(bào)告/290
13.4實(shí)驗(yàn)四: NoSQL和關(guān)系數(shù)據(jù)庫(kù)的操作比較/290
13.4.1實(shí)驗(yàn)?zāi)康?290
13.4.2實(shí)驗(yàn)平臺(tái)/290
13.4.3實(shí)驗(yàn)步驟/290
13.4.4實(shí)驗(yàn)報(bào)告/293
13.5實(shí)驗(yàn)五: MapReduce初級(jí)編程實(shí)踐/294
13.5.1實(shí)驗(yàn)?zāi)康?294
13.5.2實(shí)驗(yàn)平臺(tái)/294
13.5.3實(shí)驗(yàn)步驟/294
13.5.4實(shí)驗(yàn)報(bào)告/297附錄A大數(shù)據(jù)課程實(shí)驗(yàn)答案/298
A.1實(shí)驗(yàn)一: 熟悉常用的Linux操作和Hadoop操作/298
A.1.1實(shí)驗(yàn)?zāi)康?298
A.1.2實(shí)驗(yàn)平臺(tái)/298
A.1.3實(shí)驗(yàn)步驟/298
A.2實(shí)驗(yàn)二: 熟悉常用的HDFS操作/303
A.2.1實(shí)驗(yàn)?zāi)康?303
A.2.2實(shí)驗(yàn)平臺(tái)/303
A.2.3實(shí)驗(yàn)步驟/303
A.3實(shí)驗(yàn)三: 熟悉常用的HBase操作/323
A.3.1實(shí)驗(yàn)?zāi)康?323
A.3.2實(shí)驗(yàn)平臺(tái)/323
A.3.3實(shí)驗(yàn)步驟/323
A.4實(shí)驗(yàn)四: NoSQL和關(guān)系數(shù)據(jù)庫(kù)的操作比較/331
A.4.1實(shí)驗(yàn)?zāi)康?331
A.4.2實(shí)驗(yàn)平臺(tái)/331
A.4.3實(shí)驗(yàn)步驟/332
A.5實(shí)驗(yàn)五: MapReduce初級(jí)編程實(shí)踐/349
A.5.1實(shí)驗(yàn)?zāi)康?349
A.5.2實(shí)驗(yàn)平臺(tái)/349
A.5.3實(shí)驗(yàn)步驟/350附錄BLinux系統(tǒng)中的MySQL安裝及常用操作/360
B.1安裝MySQL/360
B.2MySQL常用操作/363參考文獻(xiàn)/367

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)