注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡人工智能機器學習:Python實踐

機器學習:Python實踐

機器學習:Python實踐

定 價:¥59.00

作 者: 魏貞原 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787121331107 出版時間: 2018-01-01 包裝: 平裝
開本: 16 頁數(shù): 228 字數(shù):  

內容簡介

  《機器學習——Python實踐》系統(tǒng)地講解了機器學習的基本知識,以及在實際項目中使用機器學習的基本步驟和方法;詳細地介紹了在進行數(shù)據(jù)處理、分析時怎樣選擇合適的算法,以及建立模型并優(yōu)化等方法,通過不同的例子展示了機器學習在具體項目中的應用和實踐經(jīng)驗,是一本非常好的機器學習入門和實踐的書籍。 不同于很多講解機器學習的書籍,本書以實踐為導向,使用 scikit-learn 作為編程框架,強調簡單、快速地建立模型,解決實際項目問題。讀者通過對《機器學習——Python實踐》的學習,可以迅速上手實踐機器學習,并利用機器學習解決實際問題。《機器學習——Python實踐》非常適合于項目經(jīng)理、有意從事機器學習開發(fā)的程序員,以及高校相關專業(yè)在的讀學生閱讀。

作者簡介

  魏貞原,IBM 高級項目經(jīng)理,主要負責銀行客戶的復雜系統(tǒng)開發(fā)。同時是 IBM CIC量子計算 COE 團隊的 Python 領域專家(Subject Matter Expert),負責量子計算應用的探索工作,對機器學習和深度學習有深入的研究,精通于運用機器學習來解決數(shù)據(jù)科學的問題。并運營“知之Python”公眾號,定期分享 Python 在機器學習和深度學習中的實踐知識。

圖書目錄

第一部分 初始
1 初識機器學習 2
1.1 學習機器學習的誤區(qū) 2
1.2 什么是機器學習 3
1.3 Python 中的機器學習 3
1.4 學習機器學習的原則 5
1.5 學習機器學習的技巧 5
1.6 這本書不涵蓋以下內容 6
1.7 代碼說明 6
1.8 總結 6
2 Python 機器學習的生態(tài)圈 7
2.1 Python 7
2.2 SciPy 9
2.3 scikit-learn 9
2.4 環(huán)境安裝 10
2.5 總結 12
3 第一個機器學習項目 13
3.1 機器學習中的 Hello World 項目 13
3.2 導入數(shù)據(jù) 14
3.3 概述數(shù)據(jù) 15
3.4 數(shù)據(jù)可視化 18
3.5 評估算法 20
3.6 實施預測 23
3.7 總結 24
4 Python 和 SciPy 速成 25
4.1 Python 速成 25
4.2 NumPy 速成 34
4.3 Matplotlib 速成 36
4.4 Pandas 速成 39
4.5 總結 41
第二部分 數(shù)據(jù)理解
5 數(shù)據(jù)導入 44
5.1 CSV 文件 44
5.2 Pima Indians 數(shù)據(jù)集 45
5.3 采用標準 Python 類庫導入數(shù)據(jù) 46
5.4 采用 NumPy 導入數(shù)據(jù) 46
5.5 采用 Pandas 導入數(shù)據(jù) 47
5.6 總結 47
6 數(shù)據(jù)理解 48
6.1 簡單地查看數(shù)據(jù) 48
6.2 數(shù)據(jù)的維度 49
6.3 數(shù)據(jù)屬性和類型 50
6.4 描述性統(tǒng)計 50
6.5 數(shù)據(jù)分組分布(適用于分類算法) 51
6.6 數(shù)據(jù)屬性的相關性 52
6.7 數(shù)據(jù)的分布分析 53
6.8 總結 54
7 數(shù)據(jù)可視化 55
7.1 單一圖表 55
7.2 多重圖表 58
7.3 總結 61
第三部分 數(shù)據(jù)準備
8 數(shù)據(jù)預處理 64
8.1 為什么需要數(shù)據(jù)預處理 64
8.2 格式化數(shù)據(jù) 65
8.3 調整數(shù)據(jù)尺度 65
8.4 正態(tài)化數(shù)據(jù) 67
8.5 標準化數(shù)據(jù) 68
8.6 二值數(shù)據(jù) 69
8.7 總結 70
9 數(shù)據(jù)特征選定 71
9.1 特征選定 72
9.2 單變量特征選定 72
9.3 遞歸特征消除 73
9.4 主要成分分析 75
9.5 特征重要性 76
9.6 總結 76
第四部分 選擇模型
10 評估算法 78
10.1 評估算法的方法 78
10.2 分離訓練數(shù)據(jù)集和評估數(shù)據(jù)集 79
10.3 K 折交叉驗證分離 80
10.4 棄一交叉驗證分離 81
10.5 重復隨機分離評估數(shù)據(jù)集與訓練數(shù)據(jù)集 82
10.6 總結 83
11 算法評估矩陣 85
11.1 算法評估矩陣 85
11.2 分類算法矩陣 86
11.3 回歸算法矩陣 93
11.4 總結 96
12 審查分類算法 97
12.1 算法審查 97
12.2 算法概述 98
12.3 線性算法 98
12.4 非線性算法 101
12.5 總結 105
13 審查回歸算法 106
13.1 算法概述 106
13.2 線性算法 107
13.3 非線性算法 111
13.4 總結 113
14 算法比較 115
14.1 選擇最佳的機器學習算法 115
14.2 機器學習算法的比較 116
14.3 總結 118
15 自動流程 119
15.1 機器學習的自動流程 119
15.2 數(shù)據(jù)準備和生成模型的 Pipeline 120
15.3 特征選擇和生成模型的 Pipeline 121
15.4 總結 122
第五部分 優(yōu)化模型
16 集成算法 124
16.1 集成的方法 124
16.2 裝袋算法 125
16.3 提升算法 129
16.4 投票算法 131
16.5 總結 132
17 算法調參 133
17.1 機器學習算法調參 133
17.2 網(wǎng)格搜索優(yōu)化參數(shù) 134
17.3 隨機搜索優(yōu)化參數(shù) 135
17.4 總結 136
第六部分 結果部署
18 持久化加載模型 138
18.1 通過 pickle 序列化和反序列化機器學習的模型 138
18.2 通過 joblib 序列化和反序列化機器學習的模型 140
18.3 生成模型的技巧 141
18.4 總結 141
第七部分 項目實踐
19 預測模型項目模板 144
19.1 在項目中實踐機器學習 145
19.2 機器學習項目的 Python 模板 145
19.3 各步驟的詳細說明 146
19.4 使用模板的小技巧 148
19.5 總結 149
20 回歸項目實例 150
20.1 定義問題 150
20.2 導入數(shù)據(jù) 151
20.3 理解數(shù)據(jù) 152
20.4 數(shù)據(jù)可視化 155
20.5 分離評估數(shù)據(jù)集 159
20.6 評估算法 160
20.7 調參改善算法 164
20.8 集成算法 165
20.9 集成算法調參 167
20.10 確定最終模型 168
20.11 總結 169
21 二分類實例 170
21.1 問題定義 170
21.2 導入數(shù)據(jù) 171
21.3 分析數(shù)據(jù) 172
21.4 分離評估數(shù)據(jù)集 180
21.5 評估算法 180
21.6 算法調參 184
21.7 集成算法 187
21.8 確定最終模型 190
21.9 總結 190
22 文本分類實例 192
22.1 問題定義 192
22.2 導入數(shù)據(jù) 193
22.3 文本特征提取 195
22.4 評估算法 196
22.5 算法調參 198
22.6 集成算法 200
22.7 集成算法調參 201
22.8 確定最終模型 202
22.9 總結 203

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號