注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)人工智能機器學(xué)習(xí)與數(shù)據(jù)科學(xué):基于R的統(tǒng)計學(xué)習(xí)方法

機器學(xué)習(xí)與數(shù)據(jù)科學(xué):基于R的統(tǒng)計學(xué)習(xí)方法

機器學(xué)習(xí)與數(shù)據(jù)科學(xué):基于R的統(tǒng)計學(xué)習(xí)方法

定 價:¥59.00

作 者: [美] Daniel,D.,Gutierrez,古鐵雷斯 著;施翊 譯
出版社: 人民郵電出版社
叢編項:
標(biāo) 簽: 計算機?網(wǎng)絡(luò) 人工智能

ISBN: 9787115452405 出版時間: 2017-05-01 包裝: 平裝
開本: 小16開 頁數(shù): 242 字?jǐn)?shù):  

內(nèi)容簡介

  當(dāng)前,機器學(xué)習(xí)和數(shù)據(jù)科學(xué)都是很重要和熱門的相關(guān)學(xué)科,需要深入地研究學(xué)習(xí)才能精通。本書試圖指導(dǎo)讀者掌握如何完成涉及機器學(xué)習(xí)的數(shù)據(jù)科學(xué)項目。本書將為數(shù)據(jù)科學(xué)家提供一些在統(tǒng)計學(xué)習(xí)領(lǐng)域會用到的工具和技巧,涉及數(shù)據(jù)連接、數(shù)據(jù)處理、探索性數(shù)據(jù)分析、監(jiān)督機器學(xué)習(xí)、非監(jiān)督機器學(xué)習(xí)和模型評估。本書選用的是R統(tǒng)計環(huán)境,書中所有代碼示例都是用R語言編寫的,涉及眾多流行的R包和數(shù)據(jù)集。本書適合數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師、軟件開發(fā)者以及需要了解數(shù)據(jù)科學(xué)和機器學(xué)習(xí)方法的科研人員閱讀參考。

作者簡介

  Daniel D. Gutierrez是一位在職的數(shù)據(jù)科學(xué)家,就職于加州Santa Monica的咨詢公司AMULET Analytics。為了緊跟行業(yè)的潮流,Daniel也是insideBIGDATA.com的執(zhí)行編輯。同時,他也是一位教師,為大學(xué)和大型公司開設(shè)了數(shù)據(jù)科學(xué)、機器學(xué)習(xí)和R方面的課程。Deniel本科畢業(yè)于UCLA,專業(yè)是數(shù)學(xué)和計算機科學(xué)。

圖書目錄

第1章 機器學(xué)習(xí)綜述\t1
1.1 機器學(xué)習(xí)的分類 2
1.2 機器學(xué)習(xí)的實際案例 3
1.2.1 預(yù)測回頭客挑戰(zhàn)賽 4
1.2.2 Netflix公司 5
1.2.3 算法交易挑戰(zhàn)賽 6
1.2.4 Heritage健康獎 7
1.3 機器學(xué)習(xí)的過程 10
1.4 機器學(xué)習(xí)背后的數(shù)學(xué) 15
1.5 成為一名數(shù)據(jù)科學(xué)家 16
1.6 統(tǒng)計計算的R工程 18
1.7 RStudio 19
1.8 使用R包 20
1.9 數(shù)據(jù)集 22
1.10 在生產(chǎn)中使用R 23
1.11 小結(jié) 24
第2章 連接數(shù)據(jù) 25
2.1 管理你的工作目錄 27
2.2 數(shù)據(jù)文件的種類 28
2.3 數(shù)據(jù)的來源 28
2.4 從網(wǎng)絡(luò)中下載數(shù)據(jù)集 29
2.5 讀取CSV文件 31
2.6 讀取Excel文件 33
2.7 使用文件連接 34
2.8 讀取JSON文件 35
2.9 從網(wǎng)站中抓取數(shù)據(jù) 36
2.10 SQL數(shù)據(jù)庫 38
2.11 R中的SQL等價表述 42
2.12 讀取Twitter數(shù)據(jù) 46
2.13 從谷歌分析中讀取數(shù)據(jù) 48
2.14 寫數(shù)據(jù) 51
2.15 小結(jié) 53
第3章 數(shù)據(jù)處理 54
3.1 特征工程 57
3.2 數(shù)據(jù)管道 59
3.3 數(shù)據(jù)采樣 60
3.4 修正變量名 60
3.5 創(chuàng)建新變量 62
3.6 數(shù)值離散化 63
3.7 日期處理 65
3.8 將類變量二值化 67
3.9 合并數(shù)據(jù)集 68
3.10 排列數(shù)據(jù)集 70
3.11 重塑數(shù)據(jù)集 71
3.12 使用dplyr進(jìn)行數(shù)據(jù)操作 72
3.13 處理缺失數(shù)據(jù) 75
3.14 特征縮放 77
3.15 降維 78
3.16 小結(jié) 81
第4章 探索性數(shù)據(jù)分析 83
4.1 數(shù)據(jù)統(tǒng)計 84
4.2 探索性可視化 87
4.3 直方圖 88
4.4 箱形圖 89
4.5 條形圖 92
4.6 密度圖 93
4.7 散點圖 95
4.8 QQ圖 101
4.9 熱圖 102
4.10 缺失值的圖表 103
4.11 解釋性圖表 104
4.12 小結(jié) 106
第5章 回歸 107
5.1 一元線性回歸 108
5.2 多元線性回歸 120
5.3 多項式回歸 127
5.4 小結(jié) 134
第6章 分類 136
6.1 一個簡單的例子 137
6.2 邏輯回歸 139
6.3 分類樹 143
6.4 樸素貝葉斯 147
6.5 K-最近鄰 151
6.6 支持向量機 155
6.7 神經(jīng)網(wǎng)絡(luò) 159
6.8 集成 165
6.9 隨機森林 168
6.10 梯度提升機 171
6.11 小結(jié) 174
第7章 評估模型性能 176
7.1 過擬合 177
7.2 偏差和方差 183
7.3 干擾因子 187
7.4 數(shù)據(jù)泄漏 188
7.5 測定回歸性能 190
7.6 測定分類性能 194
7.7 交叉驗證 197
7.8 其他機器學(xué)習(xí)診斷法 204
7.8.1 獲取更多的訓(xùn)練觀測數(shù)據(jù) 205
7.8.2 特征降維 205
7.8.3 添加新特征 205
7.8.4 添加多項式特征 206
7.8.5 對正則化參數(shù)進(jìn)行微調(diào) 206
7.9 小結(jié) 206
第8章 非監(jiān)督學(xué)習(xí) 208
8.1 聚類 209
8.2 模擬聚類 211
8.3 分級聚類 212
8.4 K-均值聚類 219
8.5 主成分分析 224
8.6 小結(jié) 233
術(shù)語表 234

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號