注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)

數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)

數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)

定 價:¥59.90

作 者: 喻梅,于健,王建榮,李雪威 編
出版社: 清華大學(xué)出版社
叢編項: 計算機(jī)科學(xué)與技術(shù)學(xué)科研究生系列教材
標(biāo) 簽: 暫缺

購買這本書可以去


ISBN: 9787302558682 出版時間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 344 字?jǐn)?shù):  

內(nèi)容簡介

  本書主要介紹數(shù)據(jù)挖掘和數(shù)據(jù)分析的基本概念和方法,包括數(shù)據(jù)的基本屬性和概念、數(shù)據(jù)預(yù)處理技術(shù)、數(shù)據(jù)立方體和OLAP技術(shù)、頻繁模式挖掘、回歸分析、分類、聚類、離群點分析。每一部分先介紹基本概念、理論基礎(chǔ)、應(yīng)用實例、思考習(xí)題。書中涉及的模型和算法均給予了相應(yīng)的實例,便于讀者更好的理解和使用模型。

作者簡介

  喻梅天津大學(xué)智能與計算學(xué)部教授,碩士生導(dǎo)師。主要從事計算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)挖掘及數(shù)據(jù)庫方向的研究及教學(xué)。研究重點為社交網(wǎng)絡(luò)中實體社團(tuán)的發(fā)現(xiàn)及識別、影響因素及發(fā)展規(guī)律;基于親密度及影響力的微博社交興趣圈挖掘算法等。在國際會議及期刊上發(fā)表了多篇相關(guān)學(xué)術(shù)論文。擔(dān)任多個國際會議技術(shù)委員會委員,參與會議組織工作及專業(yè)技術(shù)服務(wù)。參與多部計算機(jī)教材的編寫。

圖書目錄

第1章概述1
1.1數(shù)據(jù)分析與數(shù)據(jù)挖掘1
1.1.1數(shù)據(jù)分析1
1.1.2數(shù)據(jù)挖掘1
1.1.3數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別和聯(lián)系3
1.2分析與挖掘的數(shù)據(jù)類型3
1.3數(shù)據(jù)分析與數(shù)據(jù)挖掘的方法7
1.4數(shù)據(jù)分析與數(shù)據(jù)挖掘使用的技術(shù)8
1.5應(yīng)用場景及存在的問題12
1.5.1數(shù)據(jù)分析與數(shù)據(jù)挖掘的應(yīng)用12
1.5.2存在的主要問題13
1.6本書結(jié)構(gòu)概述14
1.7習(xí)題14
第2章數(shù)據(jù)16
2.1數(shù)據(jù)對象與屬性類別16
2.1.1屬性的定義16
2.1.2屬性的分類16
2.2數(shù)據(jù)的基本統(tǒng)計描述17
2.2.1中心趨勢度量18
2.2.2數(shù)據(jù)分散度量20
2.2.3數(shù)據(jù)的圖形顯示22
2.3數(shù)據(jù)的相似性和相異性度量26
2.3.1數(shù)據(jù)矩陣與相異性矩陣26
2.3.2標(biāo)稱屬性的鄰近性度量27
2.3.3二元屬性的鄰近性度量28
2.3.4數(shù)值屬性的相異性29
2.3.5序數(shù)屬性的鄰近性度量31
2.3.6混合類型屬性的相異性31
2.3.7余弦相似性33目錄數(shù)據(jù)分析與數(shù)據(jù)挖掘(第2版)2.4習(xí)題34
第3章數(shù)據(jù)預(yù)處理36
3.1數(shù)據(jù)預(yù)處理及任務(wù)36
3.1.1數(shù)據(jù)預(yù)處理的必要性36
3.1.2數(shù)據(jù)預(yù)處理的主要任務(wù)39
3.2數(shù)據(jù)清理40
3.2.1缺失值、噪聲和不一致數(shù)據(jù)的處理40
3.2.2數(shù)據(jù)清理方式43
3.3數(shù)據(jù)集成44
3.4數(shù)據(jù)歸約49
3.4.1直方圖49
3.4.2數(shù)據(jù)立方體聚集50
3.4.3屬性子集選擇52
3.4.4抽樣53
3.5數(shù)據(jù)變換與數(shù)據(jù)離散化54
3.5.1數(shù)據(jù)變換策略及分類54
3.5.2數(shù)據(jù)泛化54
3.5.3數(shù)據(jù)規(guī)范化55
3.5.4數(shù)據(jù)離散化56
3.6習(xí)題58
第4章數(shù)據(jù)倉庫與聯(lián)機(jī)分析處理59
4.1數(shù)據(jù)倉庫基本概念59
4.1.1數(shù)據(jù)倉庫的定義59
4.1.2數(shù)據(jù)倉庫的性質(zhì)59
4.1.3數(shù)據(jù)倉庫體系結(jié)構(gòu)60
4.1.4數(shù)據(jù)倉庫設(shè)計模型61
4.2數(shù)據(jù)倉庫設(shè)計62
4.2.1數(shù)據(jù)倉庫的概念模型設(shè)計62
4.2.2數(shù)據(jù)倉庫的邏輯模型設(shè)計65
4.2.3數(shù)據(jù)倉庫的物理模型設(shè)計67
4.3數(shù)據(jù)倉庫實現(xiàn)68
4.4聯(lián)機(jī)分析處理81
4.4.1OLAP簡介81
4.4.2OLAP與OLTP的關(guān)系82
4.4.3典型的OLAP操作83
4.5元數(shù)據(jù)模型87
4.5.1元數(shù)據(jù)的類型88
4.5.2元數(shù)據(jù)的作用88
4.5.3元數(shù)據(jù)的使用89
4.6習(xí)題90
第5章回歸分析91
5.1回歸分析概述91
5.1.1變量間的兩類關(guān)系91
5.1.2回歸分析的步驟92
5.2一元線性回歸93
5.2.1原理分析93
5.2.2回歸方程求解及模型檢驗93
5.2.3一元線性回歸實例96
5.2.4案例分析: 使用Weka實現(xiàn)一元線性回歸99
5.3多元線性回歸105
5.3.1原理分析105
5.3.2回歸方程求解及模型檢驗106
5.3.3多元線性回歸實例108
5.3.4案例分析: 使用Weka實現(xiàn)多元線性回歸110
5.4多項式回歸113
5.4.1原理分析113
5.4.2多項式回歸實例114
5.4.3案例分析: 使用Excel實現(xiàn)多項式回歸117
5.5習(xí)題123
第6章頻繁模式挖掘125
6.1概述125
6.1.1案例分析126
6.1.2相關(guān)概念126
6.1.3先驗性質(zhì)128
6.2Apriori算法129
6.2.1Apriori算法分析129
6.2.2案例分析: 使用Weka實現(xiàn)Apriori算法133
6.3FPgrowth算法139
6.3.1FPgrowth算法分析139
6.3.2案例分析: 使用Weka實現(xiàn)FPgrowth算法148
6.4壓縮頻繁項集151
6.4.1挖掘閉模式151
6.4.2挖掘極大模式152
6.5關(guān)聯(lián)模式評估152
6.5.1支持度置信度框架153
6.5.2相關(guān)性分析153
6.5.3模式評估度量155
6.6習(xí)題156
第7章分類157
7.1分類概述157
7.1.1分類的基本概念157
7.1.2分類的相關(guān)知識158
7.2決策樹162
7.2.1決策樹的基本概念162
7.2.2決策樹分類器的算法過程163
7.2.3ID3算法165
7.2.4C4.5算法172
7.2.5Weka中使用C4.5算法進(jìn)行分類預(yù)測實例177
7.2.6決策樹的剪枝184
7.3樸素貝葉斯分類185
7.3.1樸素貝葉斯學(xué)習(xí)基本原理185
7.3.2樸素貝葉斯分類過程186
7.3.3使用Weka的樸素貝葉斯分類器進(jìn)行分類實例187
7.4惰性學(xué)習(xí)法191
7.4.1k近鄰算法描述191
7.4.2k近鄰算法性能193
7.4.3使用Weka進(jìn)行k近鄰分類實例194
7.5邏輯回歸196
7.5.1邏輯回歸的基本概念196
7.5.2二項邏輯回歸過程197
7.5.3用Weka進(jìn)行邏輯回歸分類實例199
7.6支持向量機(jī)202
7.6.1線性可分支持向量機(jī)算法203
7.6.2線性可分支持向量機(jī)學(xué)習(xí)算法——最大間隔法207
7.6.3使用Weka進(jìn)行支持向量機(jī)分類實例208
7.7神經(jīng)網(wǎng)絡(luò)210
7.7.1神經(jīng)網(wǎng)絡(luò)的基本概念210
7.7.2BP神經(jīng)網(wǎng)絡(luò)算法過程212
7.7.3BP神經(jīng)網(wǎng)絡(luò)分類算法實例214
7.7.4使用Weka進(jìn)行神經(jīng)網(wǎng)絡(luò)分類實例216
7.8組合方法223
7.8.1組合方法概述223
7.8.2裝袋223
7.8.3提升230
7.8.4隨機(jī)森林算法234
7.9分類模型的評估248
7.9.1分類模型的評價指標(biāo)248
7.9.2交叉驗證253
7.9.3自助法254
7.10習(xí)題255
第8章聚類257
8.1聚類概述257
8.1.1聚類的基本概念257
8.1.2聚類算法的分類258
8.2基于劃分的聚類260
8.2.1k均值算法260
8.2.2k中心點算法264
8.2.3使用Weka進(jìn)行基于劃分的聚類實例268
8.3基于層次的聚類273
8.3.1基于層次的聚類的基本概念273
8.3.2簇間距離度量274
8.3.3分裂層次聚類274
8.3.4凝聚層次聚類276
8.3.5BIRCH算法278
8.3.6使用Weka進(jìn)行基于層次的聚類實例282
8.4基于密度的聚類285
8.4.1基于密度的聚類的基本概念285
8.4.2DBSCAN算法286
8.4.3使用Weka進(jìn)行基于密度的聚類實例290
8.5基于網(wǎng)格的聚類293
8.5.1STING算法294
8.5.2CLIQUE算法296
8.6聚類質(zhì)量的評估299
8.7習(xí)題300
第9章離群點檢測301
9.1離群點的定義與類型301
9.1.1什么是離群點301
9.1.2離群點的類型302
9.2離群點的檢測303
9.2.1檢測方法的分類303
9.2.2統(tǒng)計學(xué)方法304
9.2.3近鄰性方法307
9.2.4基于聚類的方法309
9.2.5基于分類的方法313
9.3習(xí)題314
附錄AWeka的安裝及使用規(guī)范315
A.1Weka簡介與安裝315
A.1.1Weka簡介315
A.1.2JRE的安裝315
A.1.3Weka的安裝318
A.2Weka的使用方法323
A.3Weka的數(shù)據(jù)格式326
參考文獻(xiàn)330

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號