注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信從零開始構(gòu)建企業(yè)級推薦系統(tǒng)

從零開始構(gòu)建企業(yè)級推薦系統(tǒng)

從零開始構(gòu)建企業(yè)級推薦系統(tǒng)

定 價:¥89.00

作 者: 張相於 著
出版社: 電子工業(yè)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787121391514 出版時間: 2020-07-01 包裝: 平裝
開本: 16開 頁數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡介

  本書是一本面向?qū)嵺`的企業(yè)級推薦系統(tǒng)開發(fā)指南,內(nèi)容包括產(chǎn)品設(shè)計、相關(guān)性算法、排序模型、工程架構(gòu)、效果評測、系統(tǒng)監(jiān)控等推薦系統(tǒng)核心部分的設(shè)計與開發(fā),可以幫助開發(fā)者逐步構(gòu)建一個完整的推薦系統(tǒng),并提供了持續(xù)優(yōu)化的系統(tǒng)性思路。本書注重從系統(tǒng)性和通用性的角度看待推薦系統(tǒng)的核心問題,希望能夠幫助讀者做到知其然,也知其所以然,更能夠舉一反三,真正掌握推薦系統(tǒng)的核心本質(zhì)。此外,本書對于推薦系統(tǒng)開發(fā)中常見的問題和陷阱,以及系統(tǒng)構(gòu)建過程,也做了重點介紹,力求讓讀者不僅知道做什么,而且知道怎么做。本書的目標(biāo)讀者是推薦系統(tǒng)研發(fā)工程師、產(chǎn)品經(jīng)理以及對推薦系統(tǒng)感興趣的學(xué)生和從業(yè)者。

作者簡介

  張相於,本科和研究生畢業(yè)于中國人民大學(xué),現(xiàn)任阿里巴巴高級算法專家。多年來一直從事推薦系統(tǒng)及相關(guān)領(lǐng)域的系統(tǒng)研發(fā),具有豐富的實踐經(jīng)驗,并樂于分享經(jīng)驗與教訓(xùn),在ResysChina上發(fā)表過多篇推薦系統(tǒng)相關(guān)文章,也在全球架構(gòu)師峰會等技術(shù)大會上做過多次演講。

圖書目錄

第1章 推薦系統(tǒng)的時代背景 1
1.1 為什么需要推薦系統(tǒng) 1
1.1.1 提高流量利用效率 1
1.1.2 挖掘和匹配長尾需求 6
1.1.3 提升用戶體驗 7
1.1.4 技術(shù)積累 8
1.2 推薦的產(chǎn)品問題 10
1.2.1 推薦什么東西 10
1.2.2 為誰推薦 13
1.2.3 推薦場景 14
1.2.4 推薦解釋 16
1.3 總結(jié) 18
第2章 推薦系統(tǒng)的核心技術(shù)概述 19
2.1 核心邏輯拆解 19
2.2 整體流程概述 20
2.3 召回算法 21
2.4 基于行為的召回算法 24
2.5 用戶畫像和物品畫像 24
2.6 結(jié)果排序 26
2.7 評價指標(biāo) 26
2.8 系統(tǒng)監(jiān)控 27
2.9 架構(gòu)設(shè)計 28
2.10 發(fā)展歷程 28
2.11 總結(jié) 30
第3章 基礎(chǔ)推薦算法 31
3.1 推薦邏輯流程架構(gòu) 31
3.2 召回算法的基本邏輯 34
3.3 常用的基礎(chǔ)召回算法 36
3.3.1 用戶與物品的相關(guān)性 36
3.3.2 物品與物品的相關(guān)性 42
3.3.3 用戶與用戶的相關(guān)性 46
3.3.4 用戶與標(biāo)簽的相關(guān)性 47
3.3.5 標(biāo)簽與物品的相關(guān)性 48
3.3.6 相關(guān)性召回的鏈?zhǔn)浇M合 50
3.4 冷啟動場景下的推薦 51
3.5 總結(jié) 53
第4章 算法融合與數(shù)據(jù)血統(tǒng) 54
4.1 線性加權(quán)融合 55
4.2 優(yōu)先級融合 57
4.3 基于機器學(xué)習(xí)的排序融合 59
4.4 融合策略的選擇 61
4.5 融合時機的選擇 63
4.6 數(shù)據(jù)血統(tǒng) 64
4.6.1 融合策略正確性驗證 65
4.6.2 系統(tǒng)效果監(jiān)控 65
4.6.3 策略效果分析 67
4.7 總結(jié) 68
第5章 機器學(xué)習(xí)技術(shù)的應(yīng)用 69
5.1 機器學(xué)習(xí)技術(shù)概述 69
5.2 推薦系統(tǒng)中的應(yīng)用場景 70
5.3 機器學(xué)習(xí)技術(shù)的實施方法 72
5.3.1 老系統(tǒng)與數(shù)據(jù)準(zhǔn)備 72
5.3.2 問題分析與目標(biāo)定義 74
5.3.3 樣本處理 76
5.3.4 特征處理 80
5.3.5 模型選擇與訓(xùn)練 98
5.3.6 模型效果評估 101
5.3.7 預(yù)測階段效果監(jiān)控 104
5.3.8 模型訓(xùn)練系統(tǒng)架構(gòu)設(shè)計 105
5.3.9 模型預(yù)測系統(tǒng)架構(gòu)設(shè)計 108
5.4 常用模型介紹 109
5.4.1 邏輯回歸模型 109
5.4.2 GBDT模型 111
5.4.3 LR+GDBT模型 112
5.4.4 因子分解機模型 113
5.4.5 Wide & Deep模型 115
5.4.6 其他深度學(xué)習(xí)模型 116
5.5 機器學(xué)習(xí)實踐常見問題 117
5.5.1 反模式1:只見模型,不見系統(tǒng) 117
5.5.2 反模式2:忽視模型過程和細(xì)節(jié) 117
5.5.3 反模式3:不注重樣本精細(xì)化處理 118
5.5.4 反模式4:過于依賴算法 119
5.5.5 反模式5:核心數(shù)據(jù)缺乏控制 120
5.5.6 反模式6:團隊不夠“全?!?121
5.5.7 反模式7:系統(tǒng)邊界模糊導(dǎo)致出現(xiàn)“巨型系統(tǒng)” 121
5.5.8 反模式8:不重視基礎(chǔ)數(shù)據(jù)架構(gòu)建設(shè) 122
5.6 總結(jié) 123
第6章 用戶畫像系統(tǒng) 124
6.1 用戶畫像的概念和作用 124
6.2 用戶畫像的價值準(zhǔn)則 126
6.3 用戶畫像的構(gòu)成要素 128
6.3.1 物品側(cè)畫像 129
6.3.2 用戶側(cè)畫像 133
6.3.3 用戶畫像擴展 139
6.3.4 用戶畫像和排序特征的關(guān)系 142
6.4 用戶畫像系統(tǒng)的架構(gòu)演進(jìn) 143
6.4.1 用戶畫像系統(tǒng)的組成部分 143
6.4.2 野蠻生長期 144
6.4.3 統(tǒng)一用戶畫像系統(tǒng)架構(gòu) 145
6.5 總結(jié) 147
第7章 系統(tǒng)效果評測與監(jiān)控 148
7.1 評測與監(jiān)控的概念和意義 148
7.2 推薦系統(tǒng)的評測指標(biāo)系統(tǒng) 150
7.3 常用指標(biāo) 151
7.4 離線效果評測方法 158
7.5 在線效果評測方法 163
7.5.1 AB實驗 163
7.5.2 交叉實驗 173
7.6 系統(tǒng)監(jiān)控 178
7.7 總結(jié) 181
第8章 推薦效果優(yōu)化 182
8.1 準(zhǔn)確率優(yōu)化的一般性思路 183
8.2 覆蓋率優(yōu)化的一般性思路 185
8.3 行為類相關(guān)性算法優(yōu)化 188
8.3.1 熱度懲罰 188
8.3.2 時效性優(yōu)化 190
8.3.3 隨機游走 194
8.3.4 嵌入表示 196
8.4 內(nèi)容類相關(guān)性算法優(yōu)化 200
8.4.1 非結(jié)構(gòu)化算法 201
8.4.2 結(jié)構(gòu)化算法 201
8.5 影響效果的非算法因素 205
8.5.1 用戶因素 205
8.5.2 產(chǎn)品設(shè)計因素 206
8.5.3 數(shù)據(jù)因素 208
8.5.4 算法策略因素 208
8.5.5 工程架構(gòu)因素 209
8.6 總結(jié) 210
第9章 自然語言處理技術(shù)的應(yīng)用 211
9.1 詞袋模型 212
9.2 權(quán)重計算和向量空間模型 214
9.3 隱語義模型 216
9.4 概率隱語義模型 218
9.5 生成式概率模型 220
9.6 LDA模型的應(yīng)用 222
9.6.1 相似度計算 222
9.6.2 排序特征 222
9.6.3 物品打標(biāo)簽&用戶打標(biāo)簽 223
9.6.4 主題&詞的重要性度量 223
9.6.5 更多應(yīng)用 224
9.7 神經(jīng)概率語言模型 224
9.8 行業(yè)應(yīng)用現(xiàn)狀 226
9.9 總結(jié)和展望 227
第10章 探索與利用問題 228
10.1 多臂老虎機問題 228
10.2 推薦系統(tǒng)中的EE問題 230
10.3 解決方案 231
10.3.1 ?-Greedy算法 231
10.3.2 UCB 234
10.3.3 湯普森采樣 236
10.3.4 LinUCB 237
10.4 探索與利用原理在機器學(xué)習(xí)系統(tǒng)中的應(yīng)用 239
10.5 EE問題的本質(zhì)和影響 240
10.6 總結(jié) 241
第11章 推薦系統(tǒng)架構(gòu)設(shè)計 242
11.1 架構(gòu)設(shè)計概述 242
11.2 系統(tǒng)邊界和外部依賴 244
11.3 離線層、在線層和近線層架構(gòu) 246
11.4 離線層架構(gòu) 247
11.5 近線層架構(gòu) 249
11.6 在線層架構(gòu) 252
11.7 架構(gòu)層級對比 255
11.8 系統(tǒng)和架構(gòu)演進(jìn)原則 256
11.8.1 從簡單到復(fù)雜 256
11.8.2 從離線到在線 258
11.8.3 從統(tǒng)一到拆分 258
11.9 基于領(lǐng)域特定語言的架構(gòu)設(shè)計 259
11.10 總結(jié) 262
第12章 推薦系統(tǒng)工程師成長路線 263
12.1 基礎(chǔ)開發(fā)能力 264
12.1.1 單元測試 264
12.1.2 邏輯抽象復(fù)用 264
12.2 概率和統(tǒng)計基礎(chǔ) 265
12.3 機器學(xué)習(xí)理論 266
12.3.1 基礎(chǔ)理論 267
12.3.2 監(jiān)督學(xué)習(xí) 268
12.3.3 無監(jiān)督學(xué)習(xí) 269
12.4 開發(fā)語言和開發(fā)工具 270
12.4.1 開發(fā)語言 270
12.4.2 開發(fā)工具 270
12.5 算法優(yōu)化流程 271
12.6 推薦業(yè)務(wù)技能 273
12.7 總結(jié) 274
第13章 推薦系統(tǒng)的挑戰(zhàn) 275
13.1 數(shù)據(jù)稀疏性 275
13.2 推薦結(jié)果解釋 277
13.3 相關(guān)性和因果性 281
13.4 信息繭房 283
13.5 轉(zhuǎn)化率預(yù)估偏差問題 286
13.6 召回模型的局限性問題 288
13.7 用戶行為捕捉粒度問題 290
13.8 總結(jié) 291

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號