注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)數(shù)據(jù)挖掘與R語言(原書第2版)

數(shù)據(jù)挖掘與R語言(原書第2版)

數(shù)據(jù)挖掘與R語言(原書第2版)

定 價(jià):¥99.00

作 者: [葡] 路易斯·托爾戈 著,李洪成 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111596660 出版時間: 2018-05-01 包裝: 平裝
開本: 16開 頁數(shù): 343 字?jǐn)?shù):  

內(nèi)容簡介

  本書面向初學(xué)者,通過實(shí)踐案例講解如何用R進(jìn)行數(shù)據(jù)挖掘。全書包括兩部分,第 一部分介紹R和數(shù)據(jù)挖掘的基礎(chǔ)知識,第二部分為案例研究,通過預(yù)測海藻數(shù)量、預(yù)測股票市場收益、偵測欺詐交易以及微陣列樣本分類四個案例培養(yǎng)構(gòu)建解決方案的能力,掌握工具的使用技巧。本書適合作為高校學(xué)生或業(yè)界新手了解R和數(shù)據(jù)挖掘的入門讀本,其中的代碼和數(shù)據(jù)均可免費(fèi)下載。

作者簡介

  路易斯·托爾戈(Luis Torgo) 加拿大達(dá)爾豪斯大學(xué)計(jì)算機(jī)科學(xué)系教授,葡萄牙波爾圖大學(xué)計(jì)算機(jī)科學(xué)系副教授,紐約大學(xué)斯特恩商學(xué)院特邀教授,人工智能和數(shù)據(jù)分析實(shí)驗(yàn)室(LIAAD,隸屬于INESC Tec)研究員。他擁有近30年的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘研究經(jīng)驗(yàn),在基于樹的回歸方法和基于效用的預(yù)測方法方面貢獻(xiàn)卓著。:譯者簡介: 李洪成 統(tǒng)計(jì)學(xué)博士,現(xiàn)為上海金融學(xué)院副教授,R語言和SPSS統(tǒng)計(jì)分析軟件專家,研究方向?yàn)榻鹑诮y(tǒng)計(jì)和數(shù)據(jù)挖掘。他的代表著作有《SPSS數(shù)據(jù)分析教程》《時間序列預(yù)測實(shí)踐教程》等,譯著有《R并行編程實(shí)戰(zhàn)》《機(jī)器學(xué)習(xí)與R語言》等。

圖書目錄

推薦序
中文版序
譯者序
前言
致謝
第1章 簡介 1
1.1 如何閱讀本書 2
1.2 重現(xiàn)性 2
第一部分 R與數(shù)據(jù)挖掘簡介
第2章 R簡介 6
2.1 R起步 6
2.2 與R控制臺的簡單交互 8
2.3 R對象和變量 9
2.4 R函數(shù) 11
2.5 向量 14
2.6 向量化 15
2.7 因子 16
2.8 生成序列 18
2.9 數(shù)據(jù)子集 20
2.10 矩陣和數(shù)組 22
2.11 列表 25
2.12 數(shù)據(jù)框 28
2.13 數(shù)據(jù)框的擴(kuò)展 31
2.14 對象、類和方法 34
2.15 管理R會話 35
第3章 數(shù)據(jù)挖掘簡介 37
3.1 數(shù)據(jù)挖掘鳥瞰圖 37
3.2 數(shù)據(jù)收集和業(yè)務(wù)理解 38
3.2.1 數(shù)據(jù)和數(shù)據(jù)集 39
3.2.2 導(dǎo)入數(shù)據(jù)到R 40
3.3 數(shù)據(jù)預(yù)處理 45
3.3.1 數(shù)據(jù)清洗 45
3.3.2 變換變量 53
3.3.3 生成變量 55
3.3.4 降維 66
3.4 建模 74
3.4.1 探索性數(shù)據(jù)分析 75
3.4.2 使用關(guān)聯(lián)規(guī)則的依賴建模 94
3.4.3 聚類 101
3.4.4 異常檢測 112
3.4.5 預(yù)測分析 120
3.5 評估 147
3.5.1 Holdout和隨機(jī)子抽樣 148
3.5.2 交叉驗(yàn)證 150
3.5.3 Bootstrap估計(jì) 153
3.5.4 推薦程序 154
3.6 報(bào)告和部署 155
3.6.1 通過動態(tài)文檔進(jìn)行報(bào)告 155
3.6.2 通過Web應(yīng)用程序進(jìn)行部署 158
第二部分 數(shù)據(jù)挖掘案例研究
第4章 預(yù)測海藻數(shù)量 164
4.1 問題描述與目標(biāo) 164
4.2 數(shù)據(jù)說明 164
4.3 加載數(shù)據(jù)到R 165
4.4 數(shù)據(jù)可視化和總結(jié) 167
4.5 數(shù)據(jù)缺失 173
4.5.1 將缺失部分剔除 173
4.5.2 嘗試找到缺失值最有可能的賦值 175
4.5.3 通過變量的相關(guān)關(guān)系填補(bǔ)缺失值 176
4.5.4 通過探索類似個案填補(bǔ)缺失值 179
4.6 獲取預(yù)測模型 180
4.6.1 多元線性回歸 181
4.6.2 回歸樹 185
4.7 模型評價(jià)和選擇 189
4.8 預(yù)測7種海藻的頻率 200
4.9 小結(jié) 202
第5章 預(yù)測股票市場收益 203
5.1 問題描述與目標(biāo) 203
5.2 可用的數(shù)據(jù) 204
5.2.1 從CSV文件讀取數(shù)據(jù) 205
5.2.2 從網(wǎng)站上獲取數(shù)據(jù) 205
5.3 定義預(yù)測任務(wù) 206
5.3.1 預(yù)測什么 206
5.3.2 預(yù)測變量是什么 208
5.3.3 預(yù)測任務(wù) 212
5.3.4 模型評價(jià)準(zhǔn)則 213
5.4 預(yù)測模型 215
5.4.1 如何應(yīng)用訓(xùn)練集數(shù)據(jù)來建模 215
5.4.2 建模工具 216
5.5 從預(yù)測到實(shí)踐 222
5.5.1 如何應(yīng)用預(yù)測模型 222
5.5.2 與交易相關(guān)的評價(jià)準(zhǔn)則 223
5.5.3 模型集成:仿真交易 224
5.6 模型評價(jià)和選擇 230
5.6.1 蒙特卡羅估計(jì) 230
5.6.2 實(shí)驗(yàn)比較 231
5.6.3 結(jié)果分析 235
5.7 交易系統(tǒng) 243
5.7.1 評估最終測試數(shù)據(jù) 243
5.7.2 在線交易系統(tǒng) 247
5.8 小結(jié) 248
第6章 偵測欺詐交易 249
6.1 問題描述與目標(biāo) 249
6.2 可用的數(shù)據(jù) 249
6.2.1 加載數(shù)據(jù)到R 250
6.2.2 探索數(shù)據(jù)集 250
6.2.3 數(shù)據(jù)問題 256
6.3 定義數(shù)據(jù)挖掘任務(wù) 263
6.3.1 問題的不同解決方法 263
6.3.2 評價(jià)準(zhǔn)則 265
6.3.3 實(shí)驗(yàn)方法 270
6.4 計(jì)算離群值的排序 271
6.4.1 無監(jiān)督方法 271
6.4.2 有監(jiān)督方法 280
6.4.3 半監(jiān)督方法 290
6.5 小結(jié) 295
第7章 微陣列樣本分類 296
7.1 問題描述與目標(biāo) 296
7.1.1 微陣列實(shí)驗(yàn)背景簡介 296
7.1.2 數(shù)據(jù)集ALL 297
7.2 可用的數(shù)據(jù) 297
7.3 基因(特征)選擇 302
7.3.1 基于分布特征的簡單過濾方法 302
7.3.2 ANOVA過濾 304
7.3.3 使用隨機(jī)森林進(jìn)行過濾 306
7.3.4 使用特征聚類的組合進(jìn)行過濾 308
7.4 遺傳學(xué)異常的預(yù)測 309
7.4.1 定義預(yù)測任務(wù) 309
7.4.2 模型評價(jià)標(biāo)準(zhǔn) 309
7.4.3 實(shí)驗(yàn)過程 310
7.4.4 建模技術(shù) 311
7.4.5 模型比較 313
7.5 小結(jié) 320
參考文獻(xiàn) 321
主題索引 332
數(shù)據(jù)挖掘術(shù)語索引 337
R函數(shù)索引 339

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號