注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)人工智能機器學(xué)習(xí)基礎(chǔ) 面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究

機器學(xué)習(xí)基礎(chǔ) 面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究

機器學(xué)習(xí)基礎(chǔ) 面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究

定 價:¥99.00

作 者: 約翰D.凱萊赫,布萊恩·馬克·納 著,顧卓爾譯;張志華 等審校
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787111652335 出版時間: 2020-05-01 包裝: 平裝
開本: 16開 頁數(shù): 368 字?jǐn)?shù):  

內(nèi)容簡介

  本書重點講述用于預(yù)測性數(shù)據(jù)分析的*重要的機器學(xué)習(xí)方法,包括理論概念和實際應(yīng)用。

作者簡介

暫缺《機器學(xué)習(xí)基礎(chǔ) 面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究》作者簡介

圖書目錄

譯者序
前言
符號記法
第1章 面向預(yù)測數(shù)據(jù)分析的機器學(xué)習(xí) 1
1.1 什么是預(yù)測數(shù)據(jù)分析 1
1.2 什么是機器學(xué)習(xí) 2
1.3 機器學(xué)習(xí)的工作原理 4
1.4 機器學(xué)習(xí)會產(chǎn)生什么問題 7
1.5 預(yù)測數(shù)據(jù)分析項目的生命周期:CRISP-DM 9
1.6 預(yù)測數(shù)據(jù)分析工具 10
1.7 本書概覽 11
1.8 習(xí)題 12
第2章 數(shù)據(jù)到見解再到?jīng)Q策 13
2.1 將商業(yè)問題轉(zhuǎn)化為分析解決方案 13
2.2 可行性評估 14
2.3 設(shè)計分析基礎(chǔ)表 16
2.4 特征的設(shè)計與實現(xiàn) 19
2.4.1 不同的數(shù)據(jù)類型 20
2.4.2 不同的特征類型 20
2.4.3 處理時間 21
2.4.4 法律問題 23
2.4.5 特征的實現(xiàn) 25
2.4.6 案例研究:汽車保險詐騙 25
2.5 總結(jié) 28
2.6 延伸閱讀 28
2.7 習(xí)題 29
第3章 數(shù)據(jù)探索 31
3.1 數(shù)據(jù)質(zhì)量報告 31
3.2 了解數(shù)據(jù) 35
3.2.1 正態(tài)分布 37
3.2.2 案例研究:汽車保險詐騙 38
3.3 找出數(shù)據(jù)質(zhì)量問題 39
3.3.1 缺失值 39
3.3.2 異常基數(shù) 40
3.3.3 離群點 40
3.3.4 案例研究:汽車保險詐騙 41
3.4 處理數(shù)據(jù)質(zhì)量問題 42
3.4.1 處理缺失值 43
3.4.2 處理離群點 43
3.4.3 案例研究:汽車保險詐騙 44
3.5 高階數(shù)據(jù)探索 45
3.5.1 可視化特征之間的關(guān)系 45
3.5.2 度量協(xié)方差和相關(guān)性 52
3.6 數(shù)據(jù)準(zhǔn)備 56
3.6.1 歸一化 56
3.6.2 分箱 57
3.6.3 采樣 60
3.7 總結(jié) 61
3.8 延伸閱讀 62
3.9 習(xí)題 62
第4章 基于信息的學(xué)習(xí) 73
4.1 大思路 73
4.2 基礎(chǔ)知識 75
4.2.1 決策樹 75
4.2.2 香農(nóng)熵模型 77
4.2.3 信息增益 80
4.3 標(biāo)準(zhǔn)方法:ID3算法 83
4.4 延伸與拓展 89
4.4.1 其他特征選取與純度度量方法 89
4.4.2 處理連續(xù)描述性特征 92
4.4.3 預(yù)測連續(xù)目標(biāo) 95
4.4.4 剪枝 98
4.4.5 模型組合 100
4.5 總結(jié) 103
4.6 延伸閱讀 104
4.7 習(xí)題 104
第5章 基于相似性的學(xué)習(xí) 109
5.1 大思路 109
5.2 基本概念 110
5.2.1 特征空間 110
5.2.2 用距離度量測量相似性 111
5.3 標(biāo)準(zhǔn)方法:最近鄰算法 113
5.4 延伸與拓展 116
5.4.1 處理嘈雜數(shù)據(jù) 116
5.4.2 高效內(nèi)存搜索 118
5.4.3 數(shù)據(jù)歸一化 124
5.4.4 預(yù)測連續(xù)目標(biāo) 127
5.4.5 其他相似性測量 129
5.4.6 特征選取 136
5.5 總結(jié) 141
5.6 延伸閱讀 143
5.7 后記 144
5.8 習(xí)題 144
第6章 基于概率的學(xué)習(xí) 149
6.1 大思路 149
6.2 基礎(chǔ)知識 151
6.2.1 貝葉斯定理 152
6.2.2 貝葉斯預(yù)測 154
6.2.3 條件獨立與因子化 157
6.3 標(biāo)準(zhǔn)方法:樸素貝葉斯模型 160
6.4 延伸與拓展 163
6.4.1 平滑 163
6.4.2 連續(xù)特征:概率密度函數(shù) 166
6.4.3 連續(xù)特征:分箱 174
6.4.4 貝葉斯網(wǎng)絡(luò) 177
6.5 總結(jié) 187
6.6 延伸閱讀 188
6.7 習(xí)題 188
第7章 基于誤差的學(xué)習(xí) 192
7.1 大思路 192
7.2 基礎(chǔ)知識 192
7.2.1 簡單線性回歸 193
7.2.2 測量誤差 194
7.2.3 誤差曲面 196
7.3 標(biāo)準(zhǔn)方法:使用梯度下降法的多變量線性回歸 197
7.3.1 多變量線性回歸 198
7.3.2 梯度下降法 198
7.3.3 選擇學(xué)習(xí)率和初始權(quán)值 203
7.3.4 實用范例 204
7.4 延伸與拓展 206
7.4.1 解釋多變量線性回歸模型 206
7.4.2 用權(quán)值衰減設(shè)定學(xué)習(xí)率 208
7.4.3 處理類別描述性特征 209
7.4.4 處理類別目標(biāo)特征:對數(shù)幾率回歸 210
7.4.5 建模非線性關(guān)系 219
7.4.6 多項對數(shù)幾率回歸 223
7.4.7 支持向量機 226
7.5 總結(jié) 229
7.6 延伸閱讀 231
7.7 習(xí)題 231
第8章 評估 237
8.1 大思路 237
8.2 基礎(chǔ)知識 238
8.3 標(biāo)準(zhǔn)方法:留出測試集上的誤分類率 238
8.4 延伸與拓展 241
8.4.1 設(shè)計評估實驗 241
8.4.2 性能度量:類別目標(biāo) 246
8.4.3 性能度量:預(yù)測得分 252
8.4.4 性能度量:多項目標(biāo) 264
8.4.5 性能度量:連續(xù)目標(biāo) 265
8.4.6 評估部署后的模型 268
8.5 總結(jié) 273
8.6 延伸閱讀 273
8.7 習(xí)題 274
第9章 案例研究:客戶流失 278
9.1 商業(yè)理解 278
9.2 數(shù)據(jù)理解 280
9.3 數(shù)據(jù)準(zhǔn)備 283
9.4 建模 286
9.5 評估 289
9.6 部署 290
第10章 案例研究:星系分類 292
10.1 商業(yè)理解 292
10.2 數(shù)據(jù)理解 294
10.3 數(shù)據(jù)準(zhǔn)備 299
10.4 建模 303
10.4.1 基準(zhǔn)模型 303
10.4.2 特征選取 305
10.4.3 5級別模型 306
10.5 評估 307
10.6 部署 308
第11章 面向預(yù)測數(shù)據(jù)分析的機器學(xué)習(xí)藝術(shù) 309
11.1 預(yù)測模型的不同視角 310
11.2 選擇機器學(xué)習(xí)方法 313
11.2.1 將機器學(xué)習(xí)方法和項目匹配 315
11.2.2 將機器學(xué)習(xí)方法和數(shù)據(jù)匹配 315
11.3 總結(jié) 316
附錄A 機器學(xué)習(xí)的描述性統(tǒng)計量與數(shù)據(jù)可視化 317
附錄B 機器學(xué)習(xí)的概率論導(dǎo)論 326
附錄C 機器學(xué)習(xí)中的求導(dǎo)方法 332
參考文獻(xiàn) 336
索引 343

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號