定 價:¥59.00
作 者: | (美)丹尼爾·懷特納克 |
出版社: | 機械工業(yè)出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787111609797 | 出版時間: | 2018-11-01 | 包裝: | 平裝 |
開本: | 16 | 頁數(shù): | 字數(shù): |
譯者序
前言
第1章 數(shù)據的收集和組織1
1.1 數(shù)據處理-Gopher方式2
1.2 Go語言收集和組織數(shù)據的最佳實踐4
1.3 CSV文件5
1.3.1 從文件中讀取CSV數(shù)據5
1.3.2 處理非預期的域6
1.3.3 處理非預期的類型7
1.3.4 用數(shù)據幀操作CSV數(shù)據9
1.4 JSON11
1.4.1 JSON的解析11
1.4.2 JSON的輸出14
1.5 SQL-like數(shù)據庫14
1.5.1 連接到一個SQL數(shù)據庫15
1.5.2 查詢數(shù)據庫15
1.5.3 修改數(shù)據庫17
1.6 緩存17
1.6.1 在內存中緩存數(shù)據17
1.6.2 在本地磁盤中緩存數(shù)據18
1.7 數(shù)據版本控制19
1.7.1 Pachyderm術語20
1.7.2 部署/安裝Pachyderm20
1.7.3 創(chuàng)建用于數(shù)據版本控制的數(shù)據倉庫21
1.7.4 把數(shù)據存儲到數(shù)據倉庫中21
1.7.5 從版本化的數(shù)據倉庫中獲取數(shù)據22
1.8 參考書目22
1.9 小結23
第2章 矩陣、概率論和統(tǒng)計學24
2.1 矩陣和向量24
2.1.1 向量24
2.1.2 向量操作25
2.1.3 矩陣26
2.1.4 矩陣操作27
2.2 統(tǒng)計學29
2.2.1 分布29
2.2.2 統(tǒng)計方法30
2.2.3 分布可視化34
2.3 概率論39
2.3.1 隨機變量40
2.3.2 概率測量40
2.3.3 獨立和條件概率40
2.3.4 假設檢驗41
2.4 參考書目43
2.5 小結44
第3章 評估和驗證45
3.1 評估45
3.1.1 連續(xù)指標46
3.1.2 分類指標49
3.2 驗證55
3.2.1 訓練和測試集56
3.2.2 保留集59
3.2.3 交叉驗證60
3.3 參考書目61
3.4 小結62
第4章 回歸63
4.1 理解回歸模型的術語63
4.2 線性回歸64
4.2.1 線性回歸概述64
4.2.2 線性回歸假設和陷阱66
4.2.3 線性回歸示例66
4.3 多元線性回歸78
4.4 非線性和其他類型的回歸81
4.5 參考書目85
4.6 小結86
第5章 分類87
5.1 理解分類模型的術語87
5.2 邏輯回歸88
5.2.1 邏輯回歸概述88
5.2.2 邏輯回歸的假設和陷阱91
5.2.3 邏輯回歸示例92
5.3 k-最近鄰103
5.3.1 kNN概述103
5.3.2 kNN假設和陷阱104
5.3.3 kNN示例105
5.4 決策樹和隨機森林106
5.4.1 決策樹和隨機森林概述107
5.4.2 決策樹和隨機森林的假設及陷阱107
5.4.3 決策樹示例108
5.4.4 隨機森林的例子109
5.5 樸素貝葉斯109
5.5.1 樸素貝葉斯概念及其重要假設110
5.5.2 樸素貝葉斯例子110
5.6 參考書目111
5.7 小結112
第6章 集群113
6.1 理解集群模型術語113
6.2 距離或相似度的度量114
6.3 集群技術的評估115
6.3.1 內部集群評估115
6.3.2 外部集群評估120
6.4 k-均值集群120
6.4.1 k-均值集群綜述120
6.4.2 k-均值的假設和陷阱122
6.4.3 k-均值集群的例子123
6.5 其他集群技術129
6.6 參考書目130
6.7 小結130
第7章 時間序列和異常檢測131
7.1 在Go中表示時序數(shù)據131
7.2 理解時間序列的術語134
7.3 與時間序列有關的統(tǒng)計135
7.3.1 自相關135
7.3.2 偏自相關139
7.4 預測的自回歸模型141
7.4.1 自回歸模型概述141
7.4.2 自回歸模型假設和陷阱142
7.4.3 自回歸模型示例142
7.5 自回歸移動平均和其他時間序列模型151
7.6 異常檢測151
7.7 參考書目153
7.8 小結154
第8章 神經網絡和深度學習155
8.1 理解神經網絡術語155
8.2 構建一個簡單的神經網絡157
8.2.1 網絡中的節(jié)點157
8.2.2 網絡架構158
8.2.3 為什么期望這種架構有作用159
8.2.4 訓練神經網絡160
8.3 使用簡單的神經網絡165
8.3.1 在實際數(shù)據上訓練神經網絡166
8.3.2 評估神經網絡168
8.4 引入深度學習169
8.4.1 什么是深度學習模型170
8.4.2 基于Go語言的深度學習171
8.5 參考書目177
8.6 小結178
第9章 部署、分布分析和模型179
9.1 在遠程機器上可靠地運行模型179
9.1.1 Docker和Docker術語簡介180
9.1.2 Docker化機器學習的應用181
9.2 構建可拓展和可重現(xiàn)的機器學習流水線191
9.2.1 搭建Pachyderm和Kubernetes集群192
9.2.2 構建一個Pachyderm機器學習流水線193
9.2.3 更新流水線并檢查出處202
9.2.4 縮放流水線階段204
9.3 參考書目206
9.4 小結206
附錄 與機器學習相關的算法/技術207