注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)算法與數(shù)據(jù)中臺(tái):基于Google、Facebook與微博實(shí)踐

算法與數(shù)據(jù)中臺(tái):基于Google、Facebook與微博實(shí)踐

算法與數(shù)據(jù)中臺(tái):基于Google、Facebook與微博實(shí)踐

定 價(jià):¥89.00

作 者: 詹盈 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787121392887 出版時(shí)間: 2020-08-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 328 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《算法與數(shù)據(jù)中臺(tái):基于Google、Facebook與微博實(shí)踐》作者依據(jù)在Google、Facebook、新浪微博及滴滴出行等中美一流互聯(lián)網(wǎng)公司的實(shí)際工作經(jīng)歷,對(duì)算法技術(shù)、數(shù)據(jù)技術(shù),以及圍繞它們進(jìn)行的技術(shù)中臺(tái)建設(shè)實(shí)踐進(jìn)行了全面的探討,并在此基礎(chǔ)上對(duì)信息流推薦、計(jì)算廣告及智能出行等核心互聯(lián)網(wǎng)業(yè)務(wù)進(jìn)行了案例剖析。 本書(shū)具有廣闊的技術(shù)視野,內(nèi)容頗具深度,既適合互聯(lián)網(wǎng)行業(yè)的技術(shù)從業(yè)者閱讀,也適合計(jì)算機(jī)相關(guān)專(zhuān)業(yè)的高年級(jí)本科生、研究生閱讀。通過(guò)閱讀本書(shū),讀者能加深對(duì)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、大數(shù)據(jù)、分布式系統(tǒng)及技術(shù)中臺(tái)等相關(guān)領(lǐng)域的認(rèn)知與理解,并從中獲得一定的啟發(fā)和可借鑒的經(jīng)驗(yàn)。

作者簡(jiǎn)介

  詹盈,本科畢業(yè)于南京大學(xué),后赴美攻讀計(jì)算機(jī)博士學(xué)位。先后就職于 Google、Facebook 以及新浪微博,歷任主任架構(gòu)師、算法總監(jiān)等職位。長(zhǎng)期致力于機(jī)器學(xué)習(xí)算法、算法工程平臺(tái)和大規(guī)模個(gè)性化系統(tǒng)等方向的技術(shù)研究以及團(tuán)隊(duì)管理工作,對(duì)推薦系統(tǒng)、計(jì)算廣告、大數(shù)據(jù)和云計(jì)算等相關(guān)業(yè)務(wù)領(lǐng)域有著長(zhǎng)期深入的工作經(jīng)驗(yàn)和成功實(shí)踐。鄭旭飛,先后就職于 360 搜索、滴滴出行以及新浪微博,歷任算法專(zhuān)家和資深工程師等職位,對(duì)搜索、推薦、廣告等個(gè)性化系統(tǒng)以及機(jī)器學(xué)習(xí)平臺(tái)有著豐富的實(shí)踐經(jīng)驗(yàn)。劉暢宇,美國(guó)哥倫比亞大學(xué)計(jì)算機(jī)碩士學(xué)位,先后就職于彭博社和新浪微博并擔(dān)任資深架構(gòu)師等職位,對(duì)金融交易系統(tǒng)、計(jì)算廣告平臺(tái)以及大規(guī)模分布式系統(tǒng)有著深刻理解和成功經(jīng)驗(yàn)。 郝忠秀,新浪微博廣告基礎(chǔ)架構(gòu)負(fù)責(zé)人,對(duì)大規(guī)模分布式系統(tǒng)、海量數(shù)據(jù)存儲(chǔ)系統(tǒng)、大數(shù)據(jù)平臺(tái)以及計(jì)算廣告等相關(guān)領(lǐng)域有著長(zhǎng)期工作經(jīng)驗(yàn)和諸多成功實(shí)踐。

圖書(shū)目錄

第1章 算法與數(shù)據(jù)中臺(tái)概述 1
1.1 中臺(tái)的背景和意義 1
1.2 算法與數(shù)據(jù)中臺(tái)的功能價(jià)值 3
1.3 算法與數(shù)據(jù)中臺(tái)的技術(shù)體系 4
1.4 算法與數(shù)據(jù)中臺(tái)的實(shí)踐場(chǎng)景 6
1.5 算法與數(shù)據(jù)中臺(tái)的應(yīng)用前景 7
1.6 本章總結(jié) 8
第2章 中臺(tái)技術(shù)之基礎(chǔ)設(shè)施 10
2.1 研發(fā)效率系統(tǒng) 10
2.1.1 代碼組織和構(gòu)建 11
2.1.2 代碼審查和任務(wù)管理 13
2.1.3 持續(xù)集成 15
2.1.4 通用壓測(cè)平臺(tái) 17
2.2 服務(wù)通信系統(tǒng) 19
2.2.1 跨進(jìn)程通信框架 20
2.2.2 服務(wù)注冊(cè)與發(fā)現(xiàn) 21
2.2.3 服務(wù)治理 24
2.3 監(jiān)控報(bào)警系統(tǒng) 25
2.3.1 通用系統(tǒng)架構(gòu) 25
2.3.2 指標(biāo)計(jì)算模型 26
2.3.3 開(kāi)源解決方案 27
2.4 鏈路跟蹤系統(tǒng) 29
2.4.1 應(yīng)用場(chǎng)景與設(shè)計(jì)目標(biāo) 30
2.4.2 系統(tǒng)架構(gòu) 30
2.5 本章總結(jié) 32
第3章 中臺(tái)技術(shù)之在線算法系統(tǒng) 33
3.1 物料檢索系統(tǒng) 34
3.1.1 倒排檢索 35
3.1.2 倒排索引實(shí)例 37
3.1.3 相似檢索 38
3.1.4 相似檢索實(shí)例 40
3.1.5 模型粗排 40
3.2 模型預(yù)估服務(wù) 41
3.2.1 整體架構(gòu) 42
3.2.2 多框架支持 43
3.2.3 模型上線 44
3.2.4 在線預(yù)估 45
3.2.5 異構(gòu)設(shè)備 46
3.2.6 性能優(yōu)化 47
3.2.7 效果監(jiān)控 49
3.3 策略機(jī)制引擎 50
3.3.1 整體架構(gòu) 50
3.3.2 計(jì)算流解釋器 51
3.3.3 Lua 解釋器 52
3.4 集群管理平臺(tái) 53
3.4.1 多租戶架構(gòu) 53
3.4.2 集群動(dòng)態(tài)管理 54
3.4.3 集群性能監(jiān)控 57
3.4.4 配置動(dòng)態(tài)分發(fā) 59
3.5 效果評(píng)估系統(tǒng) 60
3.5.1 背景介紹 61
3.5.2 設(shè)計(jì)模式 61
3.5.3 系統(tǒng)架構(gòu) 62
3.5.4 指標(biāo)計(jì)算 64
3.6 本章總結(jié) 65
第4章 中臺(tái)技術(shù)之機(jī)器學(xué)習(xí)平臺(tái) 66
4.1 機(jī)器學(xué)習(xí)平臺(tái)簡(jiǎn)介 66
4.1.1 機(jī)器學(xué)習(xí)的研發(fā)流程 67
4.1.2 機(jī)器學(xué)習(xí)的研發(fā)挑戰(zhàn) 69
4.1.3 機(jī)器學(xué)習(xí)的研發(fā)技術(shù) 69
4.2 傳統(tǒng)機(jī)器學(xué)習(xí)算法 73
4.2.1 線性算法 73
4.2.2 因子分解機(jī)算法 77
4.2.3 決策樹(shù)算法 81
4.3 深度學(xué)習(xí)算法 84
4.3.1 發(fā)展簡(jiǎn)史 85
4.3.2 神經(jīng)元模型 86
4.3.3 神經(jīng)網(wǎng)絡(luò)模型 87
4.3.4 神經(jīng)網(wǎng)絡(luò)的算法原理 88
4.4 模型框架基本原理 94
4.4.1 分布式計(jì)算架構(gòu) 94
4.4.2 并行計(jì)算的同步機(jī)制 99
4.4.3 梯度更新算法 102
4.5 層結(jié)構(gòu)的模型框架 108
4.5.1 Caffe 109
4.5.2 DistBelief 110
4.5.3 WBLEngine 112
4.5.4 小結(jié) 116
4.6 數(shù)據(jù)流結(jié)構(gòu)的模型框架 116
4.6.1 TensorFlow 116
4.6.2 PyTorch 122
4.6.3 小結(jié) 126
4.7 復(fù)合結(jié)構(gòu)的模型框架 126
4.7.1 場(chǎng)景特點(diǎn) 126
4.7.2 設(shè)計(jì)思路 127
4.7.3 架構(gòu)與實(shí)現(xiàn) 128
4.7.4 性能優(yōu)化 131
4.7.5 小結(jié) 132
4.8 機(jī)器學(xué)習(xí)平臺(tái)簡(jiǎn)介 132
4.8.1 單業(yè)務(wù)線開(kāi)發(fā)階段 132
4.8.2 平臺(tái)化建設(shè)階段 133
4.8.3 業(yè)界知名產(chǎn)品 134
4.9 新浪微博 WBL 機(jī)器學(xué)習(xí)平臺(tái) 135
4.9.1 用戶操作界面 136
4.9.2 管理中心 138
4.9.3 數(shù)據(jù)中心 140
4.9.4 調(diào)度中心 141
4.9.5 智能中心 144
4.9.6 模型中心 145
4.10 本章總結(jié) 147
第5章 中臺(tái)技術(shù)之分布式數(shù)據(jù)庫(kù) 148
5.1 分布式數(shù)據(jù)庫(kù)概述 148
5.1.1 SQL 數(shù)據(jù)庫(kù) 148
5.1.2 NoSQL 數(shù)據(jù)庫(kù) 149
5.1.3 NewSQL 數(shù)據(jù)庫(kù) 150
5.2 分布式數(shù)據(jù)庫(kù)技術(shù) 150
5.2.1 ACID 理論 151
5.2.2 CAP 理論 151
5.2.3 BASE 理論 153
5.2.4 數(shù)據(jù)分片策略 154
5.2.5 數(shù)據(jù)復(fù)制策略 157
5.2.6 Gossip 協(xié)議 158
5.2.7 分布式一致性協(xié)議 160
5.2.8 分布式事務(wù)協(xié)議 167
5.3 分布式數(shù)據(jù)庫(kù)產(chǎn)品 170
5.3.1 Redis 170
5.3.2 Google BigTable 170
5.3.3 Google Spanner 173
5.4 LaserDB 分布式數(shù)據(jù)庫(kù) 177
5.4.1 系統(tǒng)架構(gòu) 178
5.4.2 數(shù)據(jù)模型 179
5.4.3 分片策略 180
5.4.4 批量加載 181
5.4.5 同步機(jī)制 182
5.4.6 高可用架構(gòu) 184
5.4.7 高性能方案 185
5.5 LaserDB 應(yīng)用案例分析 188
5.5.1 數(shù)據(jù)緩存 188
5.5.2 特征服務(wù) 189
5.5.3 向量存儲(chǔ) 190
5.5.4 樣本拼接 190
5.6 本章總結(jié) 191
第6章 中臺(tái)技術(shù)之大數(shù)據(jù)平臺(tái) 192
6.1 大數(shù)據(jù)平臺(tái)概述 192
6.1.1 大數(shù)據(jù)的特點(diǎn) 192
6.1.2 大數(shù)據(jù)平臺(tái)的技術(shù)棧 193
6.2 分布式協(xié)調(diào)系統(tǒng) 194
6.2.1 Google Chubby 195
6.2.2 Apache ZooKeeper 196
6.2.3 Consul 197
6.3 集群管理系統(tǒng) 199
6.3.1 Google Borg 200
6.3.2 Kubernetes 202
6.3.3 Apache YARN 203
6.4 分布式文件系統(tǒng) 205
6.4.1 Google GFS 205
6.4.2 Apache HDFS 207
6.4.3 Dropbox MagicPocket 209
6.5 消息管道系統(tǒng) 210
6.5.1 Google PubSub 211
6.5.2 Apache Kafka 213
6.6 分布式計(jì)算系統(tǒng) 214
6.6.1 MapReduce 214
6.6.2 Apache Spark 216
6.6.3 Apache Flink 218
6.6.4 Apache Beam 220
6.7 數(shù)據(jù)倉(cāng)庫(kù)與分布式查詢系統(tǒng) 221
6.7.1 Google BigQuery 222
6.7.2 Apache Hive 223
6.7.3 Facebook Presto 224
6.7.4 Facebook Scuba 226
6.8 本章總結(jié) 227
第7章 中臺(tái)實(shí)踐之推薦系統(tǒng) 228
7.1 推薦系統(tǒng)的背景簡(jiǎn)介 228
7.1.1 場(chǎng)景概況 229
7.1.2 整體架構(gòu) 230
7.1.3 推薦思路 233
7.2 推薦系統(tǒng)的算法模型 235
7.2.1 GBDT-LR 融合模型 235
7.2.2 Wide & Deep 模型 237
7.2.3 DeepFM 模型 238
7.2.4 雙塔模型 238
7.2.5 多任務(wù)模型 239
7.2.6 算法的發(fā)展趨勢(shì) 241
7.3 推薦系統(tǒng)的效果度量 244
7.3.1 體驗(yàn)指標(biāo) 244
7.3.2 算法指標(biāo) 245
7.4 Facebook 信息流推薦簡(jiǎn)介 250
7.4.1 數(shù)據(jù)分發(fā)系統(tǒng) 251
7.4.2 特征服務(wù) 252
7.4.3 索引系統(tǒng) 254
7.4.4 預(yù)估與排序服務(wù) 255
7.4.5 實(shí)時(shí)樣本拼接服務(wù) 256
7.4.6 模型訓(xùn)練平臺(tái) 257
7.5 本章總結(jié) 258
第8章 中臺(tái)實(shí)踐之?dāng)?shù)字廣告 259
8.1 數(shù)字廣告的背景簡(jiǎn)介 259
8.1.1 核心概念 260
8.1.2 合約廣告 261
8.1.3 競(jìng)價(jià)廣告 262
8.1.4 程序化交易廣告 263
8.2 數(shù)字廣告系統(tǒng)架構(gòu) 264
8.2.1 業(yè)務(wù)平臺(tái) 265
8.2.2 算法與數(shù)據(jù)中臺(tái) 265
8.3 數(shù)字廣告系統(tǒng)中的數(shù)據(jù)管理 266
8.3.1 站內(nèi)數(shù)據(jù) 267
8.3.2 站外數(shù)據(jù) 267
8.4 數(shù)字廣告系統(tǒng)中的受眾定向 268
8.4.1 內(nèi)容定向 268
8.4.2 用戶標(biāo)簽定向 269
8.4.3 定制化標(biāo)簽定向 269
8.4.4 社交關(guān)系定向 270
8.4.5 智能定向 270
8.5 數(shù)字廣告系統(tǒng)中的策略機(jī)制 270
8.5.1 流量預(yù)測(cè) 271
8.5.2 在線分配 271
8.5.3 頻次控制 272
8.5.4 平滑投放 272
8.5.5 探索策略 273
8.5.6 智能出價(jià) 274
8.5.7 廣告競(jìng)價(jià) 276
8.5.8 反作弊機(jī)制 277
8.6 本章總結(jié) 277
第9章 中臺(tái)實(shí)踐之網(wǎng)約車(chē)平臺(tái) 278
9.1 業(yè)務(wù)簡(jiǎn)介 279
9.1.1 業(yè)務(wù)背景 279
9.1.2 運(yùn)作流程 281
9.1.3 用戶體驗(yàn) 281
9.2 技術(shù)架構(gòu) 282
9.2.1 分層系統(tǒng)架構(gòu) 282
9.2.2 業(yè)務(wù)中臺(tái) 283
9.2.3 算法與數(shù)據(jù)中臺(tái) 285
9.3 打車(chē)定價(jià)場(chǎng)景 286
9.3.1 場(chǎng)景描述 286
9.3.2 價(jià)格動(dòng)態(tài)下浮策略 287
9.3.3 價(jià)格動(dòng)態(tài)上浮策略 289
9.3.4 小結(jié) 290
9.4 打車(chē)排隊(duì)場(chǎng)景 290
9.4.1 場(chǎng)景描述 290
9.4.2 排隊(duì)時(shí)間預(yù)估策略 291
9.4.3 小結(jié) 292
9.5 打車(chē)安全場(chǎng)景 292
9.5.1 場(chǎng)景描述 292
9.5.2 安全策略 293
9.5.3 小結(jié) 294
9.6 本章總結(jié) 294
參考文獻(xiàn) 295

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)