注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計程序設(shè)計綜合Mahout算法解析與案例實戰(zhàn)

Mahout算法解析與案例實戰(zhàn)

Mahout算法解析與案例實戰(zhàn)

定 價:¥59.00

作 者: 樊哲 著
出版社: 機(jī)械工業(yè)出版社
叢編項:
標(biāo) 簽: 計算機(jī)/網(wǎng)絡(luò) 人工智能

ISBN: 9787111467977 出版時間: 2014-07-01 包裝: 平裝
開本: 16開 頁數(shù): 280 字?jǐn)?shù):  

內(nèi)容簡介

  本書是一本經(jīng)典的Mahout著作,原理與實戰(zhàn)并重。不僅全面分析了Mahout算法庫中不同模塊中的各個算法的原理及其Mahout實現(xiàn)流程,而且每個算法都輔之以實戰(zhàn)案例。此外,還包括4個系統(tǒng)級案例,實戰(zhàn)性非常強。全書共11章分為三個部分:第一部分為基礎(chǔ)篇(第1~2章),首先介紹了Mahout的應(yīng)用背景、Mahout算法庫收錄的算法、Mahout的應(yīng)用實例,以及開發(fā)環(huán)境的搭建;第二部分為算法篇(第3~7章),分析了Mahout算法庫中不同模塊的各個算法的原理以及Mahout實現(xiàn)流程,同時在每章書末含有每個算法的實戰(zhàn),讓讀者可以自己運行程序,感受程序運行的各個流程;第三部分為實戰(zhàn)篇(第8~11章),通過對4個不同系統(tǒng)案例的分析講解,讓讀者了解一個完整的云平臺系統(tǒng)的各個流程,從需求到系統(tǒng)框架到系統(tǒng)功能再到功能開發(fā)。

作者簡介

  樊哲,資深軟件開發(fā)工程師,精通Java相關(guān)技術(shù),專注數(shù)據(jù)挖掘領(lǐng)域,對Hadoop和Mahout等大數(shù)據(jù)技術(shù)有較深入的研究和豐富的實踐,目前正從事Mahout算法開發(fā)方面的工作?;钴S于CSDN和Hadoop技術(shù)論壇等社區(qū),榮獲“CSDN2013博客之星”頭銜。

圖書目錄

前 言
第一部分 基礎(chǔ)篇
第1章 Mahout簡介 2
1.1 Mahout應(yīng)用背景 2
1.2 Mahout算法庫 3
1.2.1 聚類算法 4
1.2.2 分類算法 5
1.2.3 協(xié)同過濾算法 6
1.2.4 頻繁項集挖掘算法 7
1.3 Mahout應(yīng)用 7
1.4 本章小結(jié) 8
第2章 Mahout安裝配置 9
2.1 Mahout安裝前的準(zhǔn)備 9
2.1.1 安裝JDK 10
2.1.2 安裝Hadoop 12
2.2 兩種安裝方式 20
2.2.1 使用Maven安裝 20
2.2.2 下載發(fā)布版安裝 22
2.3 測試安裝 22
2.4 本章小結(jié) 24
第二部分 算法篇
第3章 聚類算法 26
3.1 Canopy算法 26
3.1.1 Canopy算法簡介 26
3.1.2 Mahout中Canopy算法實現(xiàn)原理 28
3.1.3 Mahout的Canopy算法實戰(zhàn) 29
3.1.4 Canopy算法小結(jié) 37
3.2 K-Means算法 37
3.2.1 K-Means算法簡介 37
3.2.2 Mahout中K-Means算法實現(xiàn)原理 38
3.2.3 Mahout的K-Means算法實戰(zhàn) 39
3.2.4 K-Means算法小結(jié) 46
3.3 Mean Shift算法 46
3.3.1 Mean Shift算法簡介 46
3.3.2 Mahout中Mean Shift算法實現(xiàn)原理 46
3.3.3 Mahout的Mean Shift算法實戰(zhàn) 48
3.3.4 Mean Shift算法小結(jié) 51
3.4 本章小結(jié) 51
第4章 分類算法 52
4.1  Bayesian算法 53
4.1.1 Bayesian算法簡介 53
4.1.2 Mahout 中Bayesian算法實現(xiàn)原理 55
4.1.3 Mahout的Bayesian算法實戰(zhàn) 59
4.1.4 拓展 70
4.1.5 Bayesian算法小結(jié) 70
4.2 Random Forests算法 70
4.2.1 Random Forests算法簡介 70
4.2.2 Mahout中Random Forests算法實現(xiàn)原理 72
4.2.3 Mahout的Random Forests算法實戰(zhàn) 77
4.2.4 拓展 81
4.2.5 Random Forests算法小結(jié) 82
4.3 本章小結(jié) 83
第5章 協(xié)同過濾算法 84
5.1 Distributed Item-Based Collaborative Filtering算法 85
5.1.1 Distributed Item-Based Collaborative Filtering算法簡介 85
5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法實現(xiàn)原理 86
5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法實戰(zhàn) 90
5.1.4 拓展 93
5.1.5 Distributed ItemBased Collabo-rative Filtering算法小結(jié) 94
5.2 Collaborative Filtering with ALSWR算法 94
5.2.1 Collaborative Filtering with ALSWR算法簡介 94
5.2.2 Mahout中Collaborative Filtering with ALS-WR算法實現(xiàn)原理 98
5.2.3 Mahout的Collaborative Filtering with ALS-WR算法實戰(zhàn) 99
5.2.4 拓展 107
5.2.5 Collaborative Filtering with ALSWR算法小結(jié) 107
5.3 本章小結(jié) 107
第6章 模式挖掘算法 108
6.1 FP樹關(guān)聯(lián)規(guī)則算法 109
6.1.1 FP樹關(guān)聯(lián)規(guī)則算法簡介 109
6.1.2 Mahout中Parallel Frequent Pattern Mining算法實現(xiàn)原理 113
6.1.3 Mahout的Parallel Frequent Pattern Mining算法實戰(zhàn) 120
6.1.4 拓展 125
6.2 本章小結(jié) 126
第7章 Mahout中的其他算法 127
7.1 Dimension Reduction算法 128
7.1.1 Dimension Reduction算法簡介 128
7.1.2 Mahout中Dimension Reduction算法實現(xiàn)原理 129
7.1.3 Mahout的Dimension Reduction算法實戰(zhàn) 133
7.1.4 拓展 139
7.2 本章小結(jié) 142
第三部分 實戰(zhàn)篇
第8章 Friend Find系統(tǒng) 144
8.1 系統(tǒng)功能 145
8.1.1 系統(tǒng)管理員 145
8.1.2 普通用戶 146
8.1.3 總體功能 146
8.2 數(shù)據(jù)庫設(shè)計 147
8.2.1 原始用戶數(shù)據(jù)表 148
8.2.2 注冊用戶數(shù)據(jù)表 149
8.2.3 系統(tǒng)管理員表 149
8.2.4 聚類中心表 149
8.3 系統(tǒng)技術(shù)框架 150
8.4 系統(tǒng)流程 152
8.4.1 登錄 152
8.4.2 注冊 153
8.4.3 上傳數(shù)據(jù) 154
8.4.4 調(diào)用K-Means算法 155
8.4.5 查看用戶分組 157
8.4.6 查看分組情況 158
8.4.7 查看分組成員 159
8.5 系統(tǒng)實現(xiàn) 159
8.5.1 登錄 159
8.5.2 注冊 161
8.5.3 上傳數(shù)據(jù) 162
8.5.4 調(diào)用K-Means算法 163
8.5.5 查看用戶分組 167
8.5.6 查看分組情況 167
8.5.7 查看分組成員 168
8.6 本章小結(jié) 170
第9章 Wine Identification系統(tǒng) 171
9.1 系統(tǒng)功能 172
9.1.1 用戶管理模塊 173
9.1.2 隨機(jī)森林模型建立模塊 173
9.1.3 隨機(jī)森林模型預(yù)測模塊 173
9.2 系統(tǒng)框架 173
9.3 數(shù)據(jù)庫設(shè)計 180
9.3.1 用戶表 180
9.3.2 系統(tǒng)常量表 181
9.4 系統(tǒng)流程 181
9.4.1 登錄 182
9.4.2 注銷 182
9.4.3 權(quán)限修改 182
9.4.4 密碼修改 183
9.4.5 用戶列表 183
9.4.6 數(shù)據(jù)上傳 184
9.4.7 隨機(jī)森林模型建立 185
9.4.8 隨機(jī)森林模型評估 186
9.4.9 隨機(jī)森林模型預(yù)測 187
9.5 系統(tǒng)實現(xiàn) 188
9.5.1 登錄 188
9.5.2 注銷 188
9.5.3 權(quán)限修改 189
9.5.4 密碼修改 190
9.5.5 用戶列表 191
9.5.6 數(shù)據(jù)上傳 193
9.5.7 隨機(jī)森林模型建立 194
9.5.8 隨機(jī)森林模型評估 194
9.5.9 隨機(jī)森林模型預(yù)測 195
9.6 本章小結(jié) 196
第10章 Dating Recommender系統(tǒng) 197
10.1 系統(tǒng)功能 198
10.1.1 系統(tǒng)管理員功能 198
10.1.2 普通用戶功能 199
10.1.3 功能總述 199
10.2 系統(tǒng)框架 200
10.3 數(shù)據(jù)庫設(shè)計 203
10.3.1 系統(tǒng)管理員表 203
10.3.2 原始用戶推薦信息表 204
10.3.3 基礎(chǔ)數(shù)據(jù)top10表 204
10.4 系統(tǒng)流程 204
10.4.1 登錄 205
10.4.2 上傳數(shù)據(jù) 205
10.4.3 推薦分析 206
10.4.4 單用戶推薦 210
10.4.5 新用戶推薦 211
10.5 算法設(shè)計 214
10.5.1 協(xié)同過濾算法接口設(shè)計 214
10.5.2 top10算法設(shè)計 215
10.5.3 新用戶推薦算法設(shè)計 221
10.6 系統(tǒng)實現(xiàn) 228
10.6.1 登錄 228
10.6.2 上傳數(shù)據(jù) 229
10.6.3 推薦分析 230
10.6.4 單用戶推薦 232
10.6.5 新用戶推薦 234
10.7 本章小結(jié) 235
第11章 博客推薦系統(tǒng) 237
11.1 系統(tǒng)功能 238
11.1.1 用戶管理 238
11.1.2 建立知識庫 239
11.1.3 博客管理 239
11.2 系統(tǒng)框架 240
11.3 數(shù)據(jù)庫設(shè)計 246
11.3.1 用戶信息表 246
11.3.2 知識庫信息表 247
11.3.3 系統(tǒng)常量表 248
11.4 系統(tǒng)流程 248
11.4.1 登錄 248
11.4.2 注冊 248
11.4.3 密碼修改 249
11.4.4 訂閱博客查看 249
11.4.5 博客訂閱與退訂 249
11.4.6 博客推薦 250
11.4.7 上傳數(shù)據(jù) 252
11.4.8 調(diào)用FP樹關(guān)聯(lián)規(guī)則算法 253
11.5 算法設(shè)計 260
11.6 系統(tǒng)實現(xiàn) 262
11.6.1 登錄 262
11.6.2 注冊 263
11.6.3 密碼修改 264
11.6.4 訂閱博客查看 265
11.6.5 運行FP云算法 266
11.6.6 博客訂閱與退訂 267
11.6.7 博客推薦 268
11.7 本章小結(jié) 270

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號