大數據實訓案例：電影推薦系統(tǒng)（Scala版）

定　價：￥45.00

作　者：	林子雨著
出版社：	人民郵電出版社
叢編項：
標　簽：	暫缺

購買這本書可以去

ISBN：	9787115503060	出版時間：	2019-05-01	包裝：	平裝
開本：	16開	頁數：	180	字數：

內容簡介

　　本書詳細介紹了一個大數據應用案例——電影推薦系統(tǒng)（Scala版），案例涉及數據預處理、數據存儲與管理、數據分析和數據可視化等流程，涵蓋Linux、MySQL、Hadoop、Spark、IntelliJ IDEA、Spring等系統(tǒng)和軟件的安裝與使用方法。案例采用的編程語言是Scala和Java。

作者簡介

　　林子雨（1978－），男，博士，廈門大學計算機科學系助理教授，廈門大學云計算與大數據研究中心創(chuàng)始成員，廈門大學數據庫實驗室負責人，中國計算機學會數據庫專委會委員，中國計算機學會信息系統(tǒng)專委會委員。于2001年獲得福州大學水利水電專業(yè)學士學位，2005年獲得廈門大學計算機專業(yè)碩士學位，2009年獲得北京大學計算機專業(yè)博士學位。中國高校**“數字教師”提出者和建設者（http：//www.cs.xmu.edu.cn/linziyu），2009年至今，“數字教師”大平臺累計向網絡免費發(fā)布超過500萬字高價值的教學和科研資料，累計網絡訪問量超過500萬次。主要研究方向為數據庫、數據倉庫、數據挖掘和大數據，發(fā)表期刊和會議學術論文多篇，并作為課題負責人主持了1項國家自然科學基金、1項福建省自然科學基金項目和1項福建省教改課題。曾作為志愿者翻譯了Google Spanner、BigTable和《Architecture of a Database System》等大量英文學術資料，與廣大網友分享，深受歡迎。2013年開始在廈門大學開設大數據課程，并因在教學領域的突出貢獻和學生的認可，成為2013年度和2017年度廈門大學教學類獎教金獲得者。獲得2017年福建省精品在線開放課程、2018年廈門大學高等教育教學成果特等獎、2018年福建省高等教育教學成果二等獎。主講課程：《大數據處理技術》。個人主頁：http：//www.cs.xmu.edu.cn/linziyu。 E-mail： ziyulin@xmu.edu.cn。數據庫實驗室網站：http：//dblab.xmu.edu.cn。建設了高校大數據課程公共服務平臺（http：//dblab.xmu.edu.cn/post/bigdata-teaching- platform/），成為全國高校大數據教學****。平臺為教師教學和學生學習大數據課程提供包括教學大綱、講義PPT、學習指南、備課指南、實驗指南、上機習題、授課視頻、技術資料等全方位、一站式免費服務，平臺年訪問量超過100萬次，同時提供面向高校的大數據實驗平臺建設方案和大數據課程師資培訓服務。

圖書目錄

第1章案例概述 1
1．1　案例目的　1
1．2　適用對象　1
1．3　時間安排　2
1．4　預備知識　2
1．5　硬件要求　2
1．6　軟件工具　3
1．7　數據集　3
1．8　案例任務　3
1．9　實驗步驟　4
1．10　在線資源　6
1．10．1　在線資源一覽表　6
1．10．2　下載專區(qū)　7
1．10．3　先修課程　8
1．10．4　大數據課程公共服務平臺　8
1．11　本章小結　9
第2章　大數據實驗環(huán)境搭建　10
2．1　Linux系統(tǒng)及相關軟件使用方法　10
2．1．1　Shell　11
2．1．2　root用戶　11
2．1．3　創(chuàng)建普通用戶　11
2．1．4　sudo命令　12
2．1．5　常用的Linux系統(tǒng)命令　12
2．1．6　文件解壓縮　13
2．1．7　常用的目錄　13
2．1．8　目錄的權限　14
2．1．9　更新APT　14
2．1．10　切換中英文輸入法　15
2．1．11　vim編輯器的安裝和使用方法　16
2．2　JDK的安裝　16
2．3　Scala的安裝　17
2．4　Hadoop的安裝和基本使用方法　18
2．4．1　安裝Hadoop前的準備工作　18
2．4．2　安裝Hadoop　20
2．4．3　HDFS操作常用Shell命令　23
2．5　Spark的安裝和基本使用方法　25
2．5．1　下載安裝文件　25
2．5．2　配置相關文件　26
2．5．3　Spark和Hadoop的交互　26
2．5．4　在spark-shell中運行代碼　27
2．6　MySQL數據庫的安裝和基本
使用方法　29
2．6．1　安裝MySQL　29
2．6．2　MySQL常用操作　32
2．7　本章小結　34
第3章　IntelliJ IDEA開發(fā)工具的安裝和使用方法　35
3．1　下載和安裝IDEA　35
3．2　下載Scala插件安裝包　35
3．3　啟動IDEA　36
3．4　為IDEA安裝Scala插件　39
3．5　配置項目的JDK　42
3．6　使用IDEA開發(fā)WordCount程序　44
3．6．1　創(chuàng)建一個新項目WordCount　45
3．6．2　為WordCount項目添加Scala框架支持　47
3．6．3　設置項目目錄　50
3．6．4　新建Scala代碼文件　52
3．6．5　配置pom．xml文件　53
3．6．6　更新Maven的依賴文件　55
3．6．7　運行WordCount程序　56
3．6．8　打包WordCount程序生成
JAR包　57
3．6．9　把JAR包提交到Spark中運行　61
3．7　本章小結　61
第4章　ETL工具Kettle的安裝和
使用方法　62
4．1　安裝Kettle　62
4．1．1　下載安裝包　62
4．1．2　解壓文件到安裝目錄　62
4．1．3　復制MySQL數據庫驅動程序
JAR包　63
4．1．4　啟動Kettle中的Spoon　63
4．1．5　設置中文界面　65
4．2　使用Kettle把數據加載到HDFS中　65
4．2．1　配置Kettle　66
4．2．2　新建作業(yè)　66
4．2．3　添加START組件　67
4．2．4　添加“Hadoop Copy Files”控件　68
4．2．5　設置“Hadoop Copy Files”
控件的屬性　68
4．2．6　執(zhí)行作業(yè)并查看運行結果　69
4．2．7　到HDFS中查看數據　70
4．3　本章小結　70
第5章　使用Spark SQL讀寫
MySQL數據庫的方法　71
5．1　Spark SQL概述　71
5．2　創(chuàng)建MySQL數據庫　72
5．3　在spark-shell交互式環(huán)境中
讀寫MySQL數據庫　72
5．3．1　讀取MySQL數據庫中的數據　73
5．3．2　向MySQL數據庫寫入數據　74
5．4　編寫獨立應用程序讀寫MySQL
數據庫　75
5．4．1　新建項目　75
5．4．2　設置依賴包　76
5．4．3　設置代碼目錄　78
5．4．4　新建Scala代碼文件　79
5．4．5　配置pom．xml文件　80
5．4．6　編譯運行程序　82
5．4．7　生成應用程序JAR包　83
5．4．8　把JAR包提交到Spark中運行　85
5．5　本章小結　86
第6章　使用Spark MLlib實現協(xié)同
過濾算法　87
6．1　推薦系統(tǒng)概述　87
6．1．1　什么是推薦系統(tǒng)　87
6．1．2　長尾理論　88
6．1．3　推薦方法　88
6．1．4　推薦系統(tǒng)模型　89
6．1．5　推薦系統(tǒng)的應用　89
6．2　協(xié)同過濾算法　90
6．2．1　基于用戶的協(xié)同過濾　90
6．2．2　基于物品的協(xié)同過濾　91
6．2．3　UserCF算法和ItemCF算法的
對比　92
6．2．4　基于模型的協(xié)同過濾　92
6．3　Spark MLlib中的協(xié)同過濾算法　92
6．3．1　ALS算法的基本原理　93
6．3．2　在spark-shell中運行ALS算法　95
6．3．3　編寫獨立應用程序運行ALS
算法　99
6．4　本章小結　103
第7章　Node．js的安裝和使用
方法　104
7．1　Node．js的安裝　104
7．2　創(chuàng)建Node．js應用　105
7．2．1　引入Node．js模塊　105
7．2．2　創(chuàng)建服務器　105
7．2．3　接收請求與響應請求　106
7．3　使用Express框架和Jade模板引擎　106
7．3．1　創(chuàng)建項目目錄　106
7．3．2　安裝Express開發(fā)框架　107
7．3．3　安裝Jade模板引擎　107
7．3．4　創(chuàng)建服務器　107
7．3．5　創(chuàng)建模板文件　107
7．3．6　測試網頁　108
7．4　實例1：設計網頁實現用戶注冊登錄
功能　108
7．4．1　創(chuàng)建MySQL數據庫　108
7．4．2　創(chuàng)建項目目錄　109
7．4．3　安裝Express開發(fā)框架　109
7．4．4　安裝MySQL驅動模塊　109
7．4．5　創(chuàng)建服務器　109
7．4．6　創(chuàng)建網頁　111
7．4．7　測試網頁　112
7．5　實例2：采用Jade模板引擎實現
用戶注冊登錄功能　113
7．5．1　創(chuàng)建項目目錄　113
7．5．2　安裝Express開發(fā)框架　113
7．5．3　安裝Jade模板引擎　114
7．5．4　安裝MySQL驅動模塊　114
7．5．5　安裝body-parser模塊　114
7．5．6　創(chuàng)建服務器　114
7．5．7　創(chuàng)建網頁模板文件　116
7．5．8　測試網頁　116
7．6　實例3：通過網頁調用詞頻統(tǒng)計應用
程序　118
7．6．1　創(chuàng)建項目目錄　119
7．6．2　安裝Express開發(fā)框架　119
7．6．3　創(chuàng)建服務器　119
7．6．4　安裝Jade模板引擎　119
7．6．5　為應用入口index．js增加路由等
功能　121
7．6．6　在網頁中調用程序并展現結果　123
7．7　本章小結　124
第8章　電影推薦系統(tǒng)（基礎版）的
實現過程　125
8．1　數據分析整體過程　125
8．2　把數據集加載到HDFS中　126
8．2．1　數據集基本情況　126
8．2．2　數據集下載　127
8．2．3　使用Kettle工具清洗數據并加載到HDFS中　127
8．3　編寫Spark程序實現電影推薦　134
8．3．1　新建項目　134
8．3．2　設置依賴包　136
8．3．3　設置代碼目錄　137
8．3．4　新建Scala代碼文件　137
8．3．5　配置pom．xml文件　141
8．3．6　編譯運行程序　142
8．3．7　生成應用程序JAR包　145
8．3．8　把JAR包提交到Spark中運行　147
8．4　使用Node．js在網頁中展現結果　148
8．4．1　創(chuàng)建項目目錄　148
8．4．2　安裝相關模塊　148
8．4．3　創(chuàng)建服務器　148
8．4．4　添加模板文件　149
8．4．5　在網頁中調用程序并展現結果　150
8．5　本章小結　151
第9章　電影推薦系統(tǒng)（升級版）的
設計與實現　152
9．1　系統(tǒng)概述　152
9．2　系統(tǒng)總體設計　153
9．3　數據庫的設計與實現　153
9．3．1　數據庫設計　153
9．3．2　數據庫實現　154
9．4　Spark程序的設計與實現　155
9．4．1　新建項目　156
9．4．2　新建Scala代碼文件　156
9．4．3　配置pom．xml文件　161
9．4．4　運行程序　163
9．4．5　生成應用程序JAR包　165
9．5　系統(tǒng)網站的設計與實現　166
9．5．1　系統(tǒng)網站的設計　166
9．5．2　系統(tǒng)網站的實現　168
9．6　本章小結　179
參考文獻　180