注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用

構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用

構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用

定 價(jià):¥88.00

作 者: [美]伊曼紐爾·阿米森(Emmanuel Ameisen)
出版社: 中國(guó)電力出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787519876357 出版時(shí)間: 2023-04-01 包裝: 平裝-膠訂
開(kāi)本: 128開(kāi) 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)的主要內(nèi)容有:定義產(chǎn)品目標(biāo),將其轉(zhuǎn)化為機(jī)器學(xué)習(xí)問(wèn)題??焖俅罱l端到端流水線,創(chuàng)建初始數(shù)據(jù)集。訓(xùn)練和評(píng)估機(jī)器學(xué)習(xí)模型,解決性能瓶頸。將模型部署到生產(chǎn)環(huán)境,持續(xù)監(jiān)控使用情況。

作者簡(jiǎn)介

  Emmanuel Ameisen現(xiàn)任Stripe公司機(jī)器學(xué)習(xí)工程師。他曾為L(zhǎng)ocal Motion和Zipcar公司開(kāi)發(fā)、部署預(yù)測(cè)分析和機(jī)器學(xué)習(xí)解決方案。他此前還曾負(fù)責(zé)Insight Data Science公司人工智能團(tuán)隊(duì),指導(dǎo)過(guò)150多個(gè)機(jī)器學(xué)習(xí)項(xiàng)目。他先后就讀于法國(guó)三所學(xué)府,分獲人工智能、計(jì)算機(jī)工程和管理三個(gè)理學(xué)碩士學(xué)位。

圖書(shū)目錄

目錄
前言 .1
部分 讓機(jī)器學(xué)習(xí)要找對(duì)方法
第1 章 從產(chǎn)品目標(biāo)到機(jī)器學(xué)習(xí)框架 15
1.1 評(píng)估什么可行 16
1.1.1 模型 18
1.1.2 數(shù)據(jù) 26
1.2 探索機(jī)器學(xué)習(xí)編輯器開(kāi)發(fā)方案 . 29
1.2.1 嘗試全用機(jī)器學(xué)習(xí)完成:端到端框架 . 29
1.2.2 簡(jiǎn)方法:成為算法 31
1.2.3 中間地帶:從自己經(jīng)驗(yàn)學(xué)習(xí) . 32
1.3 Monica Rogati:如何選擇機(jī)器學(xué)習(xí)項(xiàng)目并安排其優(yōu)先級(jí) 34
1.4 小結(jié) 37
第2 章 制定方案 38
2.1 度量成功 38
2.1.1 業(yè)務(wù)指標(biāo). 40
2.1.2 模型性能. 40
2.1.3 新鮮度和分布偏移 . 44
2.1.4 速度 46
2.2 評(píng)估范圍和挑戰(zhàn) 47
2.2.1 利用領(lǐng)域知識(shí) 47
2.2.2 站在巨人肩上 49
2.3 機(jī)器學(xué)習(xí)編輯器方案 . 53
2.3.1 編輯器初步方案 . 53
2.3.2 永遠(yuǎn)從簡(jiǎn)單模型入手 54
2.4 不斷進(jìn)步:從簡(jiǎn)單方法入手 55
2.4.1 從簡(jiǎn)易流水線入手 . 55
2.4.2 機(jī)器學(xué)習(xí)編輯器流水線 57
2.5 小結(jié) 59
第二部分 建成可用流水線
第3 章 搭建你的首條端到端流水線 63
3.1 簡(jiǎn)框架 63
3.2 機(jī)器學(xué)習(xí)編輯器原型 . 65
3.2.1 解析和清洗數(shù)據(jù) . 65
3.2.2 文本分詞. 67
3.2.3 生成特征. 67
3.3 測(cè)試工作流 . 69
3.3.1 用戶體驗(yàn). 70
3.3.2 建模結(jié)果. 70
3.4 機(jī)器學(xué)習(xí)編輯器原型評(píng)估 72
3.4.1 模型 73
3.4.2 用戶體驗(yàn). 74
3.5 小結(jié) 75
第4 章 獲取初始數(shù)據(jù)集 76
4.1 數(shù)據(jù)集迭代 . 76
4.2 探索你的首個(gè)數(shù)據(jù)集 . 78
4.2.1 高效始于簡(jiǎn)單 78
4.2.2 洞察力和產(chǎn)品的關(guān)系 79
4.2.3 數(shù)據(jù)質(zhì)量規(guī)則 80
4.3 標(biāo)注數(shù)據(jù),尋找趨勢(shì) . 87
4.3.1 總結(jié)性統(tǒng)計(jì)信息 . 87
4.3.2 高效探索和標(biāo)注 . 90
4.3.3 成為算法 106
4.3.4 數(shù)據(jù)趨勢(shì) 108
4.4 用數(shù)據(jù)指導(dǎo)特征和模型 . 109
4.4.1 創(chuàng)建特征,捕獲模式 . 109
4.4.2 機(jī)器學(xué)習(xí)編輯器特征 . 113
4.5 Robert Munro:你如何尋找、標(biāo)注和使用數(shù)據(jù)? 114
4.6 小結(jié) . 116
第三部分 模型迭代
第5 章 訓(xùn)練和評(píng)估模型 . 119
5.1 簡(jiǎn)合適模型 . 119
5.1.1 簡(jiǎn)易模型 120
5.1.2 從模式到模型 122
5.1.3 切分?jǐn)?shù)據(jù)集 . 124
5.1.4 機(jī)器學(xué)習(xí)編輯器數(shù)據(jù)切分 130
5.1.5 判斷模型表現(xiàn) 132
5.2 評(píng)估模型:超越準(zhǔn)確率 . 135
5.2.1 對(duì)比數(shù)據(jù)和預(yù)測(cè)結(jié)果 . 135
5.2.2 混淆矩陣 136
5.2.3 ROC 曲線 137
5.2.4 校準(zhǔn)曲線 139
5.2.5 用降維技術(shù)分析出錯(cuò)樣例 141
5.2.6 Top-K 方法 . 142
5.2.7 其他模型 147
5.3 評(píng)估特征重要性 148
5.3.1 直接來(lái)自分類(lèi)器 148
5.3.2 黑盒解釋器 . 149
5.4 小結(jié) . 152
第6 章 調(diào)試機(jī)器學(xué)習(xí)模型 . 153
6.1 軟件實(shí)踐 . 153
6.2 調(diào)試連接:可視化和測(cè)試 . 156
6.2.1 從一個(gè)樣例開(kāi)始 156
6.2.2 測(cè)機(jī)器學(xué)習(xí)代碼 164
6.3 調(diào)試模型訓(xùn)練過(guò)程:讓模型學(xué)習(xí) . 169
6.3.1 任務(wù)難度 170
6.3.2 化問(wèn)題 . 172
6.4 調(diào)試泛化能力:讓模型有用 174
6.4.1 數(shù)據(jù)泄露 175
6.4.2 過(guò)擬合 175
6.4.3 思考手頭任務(wù) 179
6.5 小結(jié) . 180
第7 章 用分類(lèi)器生成寫(xiě)作建議 181
7.1 從模型抽取建議 182
7.1.1 我們不用模型能實(shí)現(xiàn)什么? 182
7.1.2 抽取全局特征重要性 . 184
7.1.3 利用模型打的分值 185
7.1.4 抽取局部特征重要性 . 186
7.2 模型對(duì)比 188
7.2.1 模型v 1:建議就像統(tǒng)計(jì)報(bào)告 189
7.2.2 模型v 2:模型更強(qiáng)大但建議更模糊. 189
7.2.3 模型v3:建議可理解 191
7.3 生成編輯建議 . 192
7.4 小結(jié) . 197
第四部分 部署和監(jiān)控
第8 章 部署模型的注意事項(xiàng) . 201
8.1 數(shù)據(jù)使用注意事項(xiàng) 202
8.1.1 數(shù)據(jù)所有權(quán) . 202
8.1.2 數(shù)據(jù)偏差 203
8.1.3 系統(tǒng)偏差 205
8.2 建模注意事項(xiàng) . 205
8.2.1 反饋循環(huán) 206
8.2.2 模型更包容 . 207
8.2.3 思考預(yù)測(cè)背景 208
8.2.4 機(jī)器學(xué)習(xí)模型的對(duì)手 . 209
8.2.5 思考模型濫用和挪用風(fēng)險(xiǎn) 210
8.3 Chris Harland:交付實(shí)驗(yàn) . 211
8.4 小結(jié) . 214
第9 章 選擇部署方案 215
9.1 服務(wù)端部署 215
9.1.1 流式應(yīng)用或API 216
9.1.2 批量預(yù)測(cè) 219
9.2 客戶端部署 221
9.2.1 部署到設(shè)備 . 222
9.2.2 用瀏覽器端交付 224
9.3 聯(lián)邦學(xué)習(xí):一種混合方法 . 225
9.4 小結(jié) . 226
第10 章 搭建模型防護(hù)罩 228
10.1 故障應(yīng)對(duì)舉措 228
10.1.1 檢查輸入和輸出 229
10.1.2 模型后盾 234
10.2 模型性能提高舉措 . 238
10.2.1 擴(kuò)展模型,服務(wù)多用戶 . 238
10.2.2 模型和數(shù)據(jù)生命周期管理. 241
10.2.3 數(shù)據(jù)處理和有向無(wú)環(huán)圖 . 244
10.3 尋求用戶反饋 245
10.4 Chris Moody:賦予數(shù)據(jù)科學(xué)家部署模型的力量 248
10.5 小結(jié) 250
第11 章 監(jiān)控和更新模型 251
11.1 監(jiān)控可拯救系統(tǒng) 251
11.1.1 監(jiān)控告知刷新率 . 252
11.1.2 監(jiān)控模型,檢測(cè)濫用行為 . 253
11.2 選擇監(jiān)控內(nèi)容 254
11.2.1 性能指標(biāo) 254
11.2.2 業(yè)務(wù)指標(biāo) 256
11.3 機(jī)器學(xué)習(xí)系統(tǒng)的持續(xù)集成和交付 257
11.3.1 A/B 測(cè)試和實(shí)驗(yàn) . 259
11.3.2 其他方法 262
11.4 小結(jié) 263

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)