注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)程序設(shè)計(jì)綜合R語(yǔ)言與數(shù)據(jù)挖掘最佳實(shí)踐和經(jīng)典案例

R語(yǔ)言與數(shù)據(jù)挖掘最佳實(shí)踐和經(jīng)典案例

R語(yǔ)言與數(shù)據(jù)挖掘最佳實(shí)踐和經(jīng)典案例

定 價(jià):¥49.00

作 者: (澳)Yanchang Zhao 著; 陳建,黃琰 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 計(jì)算機(jī)科學(xué)叢書(shū)
標(biāo) 簽: 編程語(yǔ)言與程序設(shè)計(jì) 計(jì)算機(jī)與互聯(lián)網(wǎng)

購(gòu)買這本書(shū)可以去


ISBN: 9787111475415 出版時(shí)間: 2014-09-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 234 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)為研究人員、高校學(xué)生、數(shù)據(jù)分析人員介紹了使用R語(yǔ)言進(jìn)行數(shù)據(jù)挖掘應(yīng)用的實(shí)用方法和技術(shù)。讀者會(huì)從本書(shū)中發(fā)現(xiàn)使用R語(yǔ)言完成數(shù)據(jù)挖掘任務(wù)(如分類和預(yù)測(cè)、聚類、孤立點(diǎn)檢測(cè)、關(guān)聯(lián)規(guī)則、序列分析、文本挖掘、社會(huì)網(wǎng)絡(luò)分析、情感分析等)的非常有價(jià)值的指導(dǎo)。數(shù)據(jù)挖掘技術(shù)在廣泛領(lǐng)域都發(fā)展迅速。本書(shū)重點(diǎn)關(guān)注數(shù)據(jù)挖掘過(guò)程的建模階段,以及數(shù)據(jù)探查和模型評(píng)估問(wèn)題。本書(shū)講述簡(jiǎn)潔實(shí)用,配有現(xiàn)實(shí)應(yīng)用案例和代碼示例以及數(shù)據(jù),在線資源及時(shí)豐富,是一本數(shù)據(jù)分析的實(shí)戰(zhàn)技術(shù)圖書(shū)。

作者簡(jiǎn)介

暫缺《R語(yǔ)言與數(shù)據(jù)挖掘最佳實(shí)踐和經(jīng)典案例》作者簡(jiǎn)介

圖書(shū)目錄

R and Data Mining:Examples and Case Studies
出版者的話
譯者序
縮寫詞表
第1章 簡(jiǎn)介1
1.1 數(shù)據(jù)挖掘1
1.2 R1
1.3 數(shù)據(jù)集2
1.3.1 iris數(shù)據(jù)集2
1.3.2 bodyfat數(shù)據(jù)集3
第2章 數(shù)據(jù)的導(dǎo)入與導(dǎo)出4
2.1 R數(shù)據(jù)的保存與加載4
2.2 .CSV文件的導(dǎo)入與導(dǎo)出4
2.3 從SAS中導(dǎo)入數(shù)據(jù)5
2.4 通過(guò)ODBC導(dǎo)入與導(dǎo)出數(shù)據(jù)6
2.4.1 從數(shù)據(jù)庫(kù)中讀取數(shù)據(jù)7
2.4.2 從Excel文件中導(dǎo)入與導(dǎo)出數(shù)據(jù)7
第3章 數(shù)據(jù)探索8
3.1 查看數(shù)據(jù)8
3.2 探索單個(gè)變量10
3.3 探索多個(gè)變量12
3.4 更多探索15
3.5 將圖表保存到文件中19
第4章 決策樹(shù)與隨機(jī)森林21
4.1 使用party包構(gòu)建決策樹(shù)21
4.2 使用rpart包構(gòu)建決策樹(shù)24
4.3 隨機(jī)森林29
第5章 回歸分析33
5.1 線性回歸33
5.2 邏輯回歸38
5.3 廣義線性回歸38
5.4 非線性回歸40
第6章 聚類41
6.1 k-means聚類41
6.2 k-medoids聚類43
6.3 層次聚類45
6.4 基于密度的聚類46
第7章 離群點(diǎn)檢測(cè)50
7.1 單變量的離群點(diǎn)檢測(cè)50
7.2 局部離群點(diǎn)因子檢測(cè)53
7.3 用聚類方法進(jìn)行離群點(diǎn)檢測(cè)56
7.4 時(shí)間序列數(shù)據(jù)的離群點(diǎn)檢測(cè)58
7.5 討論59
第8章 時(shí)間序列分析與挖掘60
8.1 R中的時(shí)間序列數(shù)據(jù)60
8.2 時(shí)間序列分解60
8.3 時(shí)間序列預(yù)測(cè)62
8.4 時(shí)間序列聚類63
8.4.1 動(dòng)態(tài)時(shí)間規(guī)整63
8.4.2 合成控制圖的時(shí)間序列數(shù)據(jù)64
8.4.3 基于歐氏距離的層次聚類65
8.4.4 基于DTW距離的層次聚類66
8.5 時(shí)間序列分類67
8.5.1 基于原始數(shù)據(jù)的分類67
8.5.2 基于特征提取的分類68
8.5.3 k-NN分類69
8.6 討論70
8.7 延伸閱讀70
第9章 關(guān)聯(lián)規(guī)則71
9.1 關(guān)聯(lián)規(guī)則的基本概念71
9.2 Titanic數(shù)據(jù)集71
9.3 關(guān)聯(lián)規(guī)則挖掘73
9.4 消除冗余78
9.5 解釋規(guī)則79
9.6 關(guān)聯(lián)規(guī)則的可視化80
9.7 討論與延伸閱讀82
第10章 文本挖掘84
10.1 Twitter的文本檢索84
10.2 轉(zhuǎn)換文本85
10.3 提取詞干86
10.4 建立詞項(xiàng)-文檔矩陣88
10.5 頻繁詞項(xiàng)與關(guān)聯(lián)90
10.6 詞云91
10.7 詞項(xiàng)聚類92
10.8 推文聚類94
10.8.1 基于k-means算法的推文聚類94
10.8.2 基于k-medoids算法的推文聚類96
10.9 程序包、延伸閱讀與討論98
第11章 社交網(wǎng)絡(luò)分析99
11.1詞項(xiàng)網(wǎng)絡(luò)99
11.2推文網(wǎng)絡(luò)102
11.3雙模式網(wǎng)絡(luò)107
11.4討論與延伸閱讀110
第12章 案例Ⅰ:房?jī)r(jià)指數(shù)的分析與預(yù)測(cè)111
12.1HPI數(shù)據(jù)導(dǎo)入111
12.2HPI數(shù)據(jù)探索112
12.3HPI趨勢(shì)與季節(jié)性成分118
12.4HPI預(yù)測(cè)120
12.5房地產(chǎn)估價(jià)122
12.6討論122
第13章 案例Ⅱ:客戶回復(fù)預(yù)測(cè)與效益最大化123
13.1簡(jiǎn)介123
13.2KDD Cup 1998的數(shù)據(jù)123
13.3數(shù)據(jù)探索131
13.4訓(xùn)練決策樹(shù)137
13.5模型評(píng)估140
13.6選擇最優(yōu)決策樹(shù)143
13.7評(píng)分145
13.8討論與總結(jié)148
第14章 案例Ⅲ:內(nèi)存受限的大數(shù)據(jù)預(yù)測(cè)模型150
14.1簡(jiǎn)介150
14.2研究方法150
14.3數(shù)據(jù)與變量151
14.4隨機(jī)森林152
14.5內(nèi)存問(wèn)題153
14.6樣本數(shù)據(jù)的訓(xùn)練模型154
14.7使用已選變量建立模型156
14.8評(píng)分162
14.9輸出規(guī)則168
14.9.1以文本格式輸出規(guī)則168
14.9.2輸出SAS規(guī)則的得分172
14.10總結(jié)與討論177
第15章 在線資源178
15.1R參考文檔178
15.2R178
15.3數(shù)據(jù)挖掘179
15.4R的數(shù)據(jù)挖掘180
15.5R的分類與預(yù)測(cè)181
15.6R的時(shí)間序列分析181
15.7R的關(guān)聯(lián)規(guī)則挖掘181
15.8R的空間數(shù)據(jù)分析181
15.9R的文本挖掘182
15.10R的社交網(wǎng)絡(luò)分析182
15.11R的數(shù)據(jù)清洗與轉(zhuǎn)換182
15.12R的大數(shù)據(jù)與并行計(jì)算182
R語(yǔ)言數(shù)據(jù)挖掘參考文檔184
參考資料197
通用索引201
包索引203
函數(shù)索引204

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)