注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡人工智能機器學習常用算法速查手冊

機器學習常用算法速查手冊

機器學習常用算法速查手冊

定 價:¥88.00

作 者: 馬特哈里森,杜春曉 著
出版社: 中國電力出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787519849481 出版時間: 2020-12-01 包裝: 平裝
開本: 16開 頁數(shù): 316 字數(shù):  

內(nèi)容簡介

  本書涵蓋以下主題: 用泰坦尼克號數(shù)據(jù)集講解分類。清洗數(shù)據(jù)和處理缺失數(shù)據(jù)。探索數(shù)據(jù)分析。數(shù)據(jù)預處理的常用方法。選擇對模型有用的特征。模型選擇。 度量標準和分類評估。 多種回歸分析技術(shù)。 評估回歸結(jié)果的度量標準。 聚類算法。 降維技術(shù)。 scikit-learn流水線。

作者簡介

  Matt Harrison經(jīng)營著一家叫作MetaSnake的公司,為客戶提供Python和數(shù)據(jù)科學培訓和咨詢服務。他自2000年起一直使用 Python,期間涉足多個領(lǐng)域:數(shù)據(jù)科學、BI、存儲、自動化測試、開源軟件技術(shù)棧管理、金融和搜索。

圖書目錄

目錄
前言 1
第1 章 機器學習入門 7
本書使用的庫 7
用pip 安裝庫 10
用conda 安裝庫12
第2 章 機器學習流程概覽 15
第3 章 數(shù)據(jù)分類工作流:泰坦尼克號數(shù)據(jù)集 17
項目布局建議 17
導入 18
提出問題 19
數(shù)據(jù)術(shù)語 19
獲取數(shù)據(jù) 21
清洗數(shù)據(jù) 22
創(chuàng)建特征 29
數(shù)據(jù)采樣 31
數(shù)據(jù)插值 31
規(guī)范數(shù)據(jù) 32
重構(gòu) 33
基準模型 35
不同算法族 35
模型堆疊 37
建模 38
評估模型 38
優(yōu)化模型 40
混淆矩陣 41
ROC 曲線 42
學習曲線 44
部署模型 45
第4 章 數(shù)據(jù)缺失 47
檢查數(shù)據(jù)缺失情況 48
刪除缺數(shù)據(jù)的行或列 52
插值 53
添加標識列 54
第5 章 清洗數(shù)據(jù) 55
處理列名 55
替換缺失值 56
第6 章 探索數(shù)據(jù) 59
數(shù)據(jù)大小 59
匯總統(tǒng)計 60
直方圖 61
散點圖 62
Joint Plot 圖 63
Pair Grid 圖 66
箱形圖和小提琴圖 68
比較兩個序數(shù)型特征 69
相關(guān)性 71
RadViz 圖 76
平行坐標圖 78
第7 章 預處理數(shù)據(jù) 81
標準化 81
調(diào)整取值范圍 83
虛擬變量 84
標簽編碼 85
頻數(shù)編碼 86
從字符串抽取類別型數(shù)據(jù) 87
類別型數(shù)據(jù)的其他編碼方法 89
日期特征的處理方法 91
添加col_na 特征 92
特征工程 93
第8 章 特征選擇 95
共線列 95
套索回歸 99
遞歸特征消除 100
互信息 102
主成分分析 103
特征重要性 103
第9 章 類別不平衡 105
采用不同度量標準 105
樹模型和集成方法 105
懲罰模型 106
對小眾類別上采樣 106
生成小眾數(shù)據(jù) 107
對大眾類別下采樣 107
先上采樣,再下采樣 109
第10 章 分類 111
對數(shù)概率回歸 112
樸素貝葉斯 117
支持向量機 120
k 近鄰 123
決策樹 126
隨機森林 133
XGBoost 138
LightGBM150
TPOT 155
第11 章 模型選擇 161
驗證曲線 161
學習曲線 163
第12 章 度量標準和分類評估 165
混淆矩陣 165
度量標準 168
準確率 170
召回率 171
精準率 171
f1 值 172
分類報告 172
ROC 曲線 173
精準率- 召回率曲線 175
累積增益圖 176
lift 曲線 178
類別平衡 180
類別預測錯誤 181
判別閾值 182
第13 章 解釋模型 185
回歸系數(shù) 185
特征重要性 186
LIME 包186
解釋樹模型 188
部分依賴圖 189
替代模型 193
Shapley 值 194
第14 章 回歸 199
基準模型 201
線性回歸 202
支持向量機 206
k 近鄰 208
決策樹 210
隨機森林 217
XGBoost 回歸 220
LightGBM 回歸 228
第15 章 度量標準和回歸模型的評估 233
度量標準 233
殘差圖 236
異方差性 237
殘差正態(tài)性 237
預測誤差圖 239
第16 章 解釋回歸模型 241
Shapley 值 241
第17 章 降維技術(shù) 247
PCA 方法 247
UMAP 方法 267
t-SNE 方法 273
PHATE 方法 277
第18 章 聚類 283
k-means 算法 283
層次聚類 290
理解簇 293
第19 章 流水線 299
分類流水線 299
回歸流水線 302
PCA 流水線 303
作者介紹 305
封面介紹 305

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號