注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)挖掘?qū)д?/a>

數(shù)據(jù)挖掘?qū)д?/h1>

定 價(jià):¥28.00

作 者: 戴紅、常子冠、于寧 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 工學(xué) 教材 研究生/本科/??平滩?/td>

ISBN: 9787302381044 出版時(shí)間: 2014-11-01 包裝: 平裝
開本: 16 頁數(shù): 207 字?jǐn)?shù):  

內(nèi)容簡介

  本書為數(shù)據(jù)挖掘入門級教材,共分8章,主要內(nèi)容分為三個(gè)專題:技術(shù)、數(shù)據(jù)和評估。技術(shù)專題包括決策樹技術(shù)、K-means算法、關(guān)聯(lián)分析技術(shù)、神經(jīng)網(wǎng)絡(luò)技術(shù)、回歸分析技術(shù)、貝葉斯分析、凝聚聚類、概念分層聚類、混合模型聚類技術(shù)的EM算法、時(shí)間序列分析和基于Web的數(shù)據(jù)挖掘等常用的機(jī)器學(xué)習(xí)方法和統(tǒng)計(jì)技術(shù)。數(shù)據(jù)專題包括數(shù)據(jù)庫中的知識發(fā)現(xiàn)處理模型和數(shù)據(jù)倉庫及OLAP技術(shù)。評估專題包括利用檢驗(yàn)集分類正確率和混淆矩陣,并結(jié)合檢驗(yàn)集置信區(qū)間評估有指導(dǎo)學(xué)習(xí)模型,使用無指導(dǎo)聚類技術(shù)評估有指導(dǎo)模型,利用Lift和假設(shè)檢驗(yàn)比較兩個(gè)有指導(dǎo)學(xué)習(xí)模型,使用MS Excel 2010和經(jīng)典的假設(shè)檢驗(yàn)?zāi)P驮u估屬性,使用簇質(zhì)量度量方法和有指導(dǎo)學(xué)習(xí)技術(shù)評估無指導(dǎo)聚類模型。本書秉承教材風(fēng)格,強(qiáng)調(diào)廣度講解。注重成熟模型和開源工具的使用,以提高學(xué)習(xí)者的應(yīng)用能力為目標(biāo);注重結(jié)合實(shí)例和實(shí)驗(yàn),加強(qiáng)基本概念和原理的理解和運(yùn)用;注重實(shí)例的趣味性和生活性,提高學(xué)習(xí)者學(xué)習(xí)的積極性。使用章后練習(xí)、計(jì)算和實(shí)驗(yàn)作業(yè)鞏固和檢驗(yàn)所學(xué)內(nèi)容;使用詞匯表附錄,解釋和規(guī)范數(shù)據(jù)挖掘?qū)W科專業(yè)術(shù)語;使用適合教學(xué)的簡單易用開源的Weka和通用的MS Excel軟件工具實(shí)施數(shù)據(jù)挖掘驗(yàn)證和體驗(yàn)數(shù)據(jù)挖掘的精妙。本書可作為普通高等院校計(jì)算機(jī)科學(xué)、信息科學(xué)、數(shù)學(xué)和統(tǒng)計(jì)學(xué)專業(yè)的入門教材,也可作為如經(jīng)濟(jì)學(xué)、管理學(xué)、檔案學(xué)等對數(shù)據(jù)管理、數(shù)據(jù)分析與數(shù)據(jù)挖掘有教學(xué)需求的其他相關(guān)專業(yè)的基礎(chǔ)教材。同時(shí),對數(shù)據(jù)挖掘技術(shù)和方法感興趣,致力于相關(guān)方面的研究和應(yīng)用的其他讀者,也可以從本書中獲取基本的指導(dǎo)和體驗(yàn)。本書配有教學(xué)幻燈片、大部分章后習(xí)題和實(shí)驗(yàn)的參考答案以及課程大綱。

作者簡介

暫缺《數(shù)據(jù)挖掘?qū)д摗纷髡吆喗?/div>

圖書目錄

第1章 認(rèn)識數(shù)據(jù)挖掘 1
1.1 數(shù)據(jù)挖掘的定義 1
1.2 機(jī)器學(xué)習(xí) 2
1.2.1 概念學(xué)習(xí) 2
1.2.2 歸納學(xué)習(xí) 3
1.2.3 有指導(dǎo)的學(xué)習(xí) 4
1.2.4 無指導(dǎo)的聚類 7
1.3 數(shù)據(jù)查詢 8
1.4 專家系統(tǒng) 8
1.5 數(shù)據(jù)挖掘的過程 9
1.5.1 準(zhǔn)備數(shù)據(jù) 10
1.5.2 挖掘數(shù)據(jù) 10
1.5.3 解釋和評估數(shù)據(jù) 10
1.5.4 模型應(yīng)用 11
1.6 數(shù)據(jù)挖掘的作用 11
1.6.1 分類 11
1.6.2 估計(jì) 12
1.6.3 預(yù)測 12
1.6.4 無指導(dǎo)聚類 12
1.6.5 關(guān)聯(lián)關(guān)系分析 13
1.7 數(shù)據(jù)挖掘技術(shù) 13
1.7.1 神經(jīng)網(wǎng)絡(luò) 14
1.7.2 回歸分析 14
1.7.3 關(guān)聯(lián)分析 15
1.7.4 聚類技術(shù) 16
1.8 數(shù)據(jù)挖掘的應(yīng)用 16
1.8.1 應(yīng)用領(lǐng)域 16
1.8.2 成功案例 18
1.9 Weka數(shù)據(jù)挖掘軟件 19
1.9.1 Weka簡介 19
1.9.2 使用Weka建立決策樹模型 22
1.9.3 使用Weka進(jìn)行聚類 25
1.9.4 使用Weka進(jìn)行關(guān)聯(lián)分析 26
本章小結(jié) 27
習(xí)題 28
第2章 基本數(shù)據(jù)挖掘技術(shù) 30
2.1 決策樹 30
2.1.1 決策樹算法的一般過程 31
2.1.2 決策樹算法的關(guān)鍵技術(shù) 32
2.1.3 決策樹規(guī)則 40
2.1.4 其他決策樹算法 41
2.1.5 決策樹小結(jié) 41
2.2 關(guān)聯(lián)規(guī)則 42
2.2.1 關(guān)聯(lián)規(guī)則概述 42
2.2.2 關(guān)聯(lián)分析 43
2.2.3 關(guān)聯(lián)規(guī)則小結(jié) 46
2.3 聚類分析技術(shù) 47
2.3.1 K-means算法 48
2.3.2 K-means算法小結(jié) 51
2.4 數(shù)據(jù)挖掘技術(shù)的選擇 51
本章小結(jié) 52
習(xí)題 53
第3章 數(shù)據(jù)庫中的知識發(fā)現(xiàn) 55
3.1 知識發(fā)現(xiàn)的基本過程 55
3.1.1 KDD過程模型 55
3.1.2 知識發(fā)現(xiàn)軟件 57
3.1.3 KDD過程的參與者 58
3.2 KDD過程模型的應(yīng)用 58
3.2.1 步驟1:商業(yè)理解 58
3.2.2 步驟2:數(shù)據(jù)理解 59
3.2.3 步驟3:數(shù)據(jù)準(zhǔn)備 60
3.2.4 步驟4:建模 65
3.2.5 評估 66
3.2.6 部署和采取行動(dòng) 66
3.3 實(shí)驗(yàn):KDD案例 66
本章小結(jié) 72
習(xí)題 73
第4章 數(shù)據(jù)倉庫 74
4.1 數(shù)據(jù)庫與數(shù)據(jù)倉庫 74
4.1.1 數(shù)據(jù)(庫)模型 75
4.1.2 規(guī)范化與反向規(guī)范化 77
4.2 設(shè)計(jì)數(shù)據(jù)倉庫 79
4.2.1 數(shù)據(jù)抽取、清洗、變換和加載 79
4.2.2 數(shù)據(jù)倉庫模型 82
4.2.3 數(shù)據(jù)集市 85
4.2.4 決策支持系統(tǒng) 86
4.3 聯(lián)機(jī)分析處理 87
4.3.1 概述 87
4.3.2 實(shí)驗(yàn):使用OLAP輔助駕駛員行為分析 90
4.4 使用Excel數(shù)據(jù)透視表和數(shù)據(jù)透視圖分析數(shù)據(jù) 93
4.4.1 創(chuàng)建簡單數(shù)據(jù)透視表和透視圖 93
4.4.2 創(chuàng)建多維透視表和透視圖 97
本章小結(jié) 100
習(xí)題 100
第5章 評估技術(shù) 102
5.1 數(shù)據(jù)挖掘評估概述 102
5.1.1 評估內(nèi)容 102
5.1.2 評估工具 103
5.2 評估有指導(dǎo)學(xué)習(xí)模型 108
5.2.1 評估分類類型輸出模型 108
5.2.2 評估數(shù)值型輸出模型 109
5.2.3 計(jì)算檢驗(yàn)集置信區(qū)間 111
5.2.4 無指導(dǎo)聚類技術(shù)的評估作用 112
5.3 比較有指導(dǎo)學(xué)習(xí)模型 112
5.3.1 使用Lift比較模型 112
5.3.2 通過假設(shè)檢驗(yàn)比較模型 114
5.4 屬性評估 115
5.4.1 數(shù)值型屬性的冗余檢查 115
5.4.2 數(shù)值屬性顯著性的假設(shè)檢驗(yàn) 117
5.5 評估無指導(dǎo)聚類模型 118
本章小結(jié) 118
習(xí)題 119
第6章 神經(jīng)網(wǎng)絡(luò)技術(shù) 120
6.1 神經(jīng)網(wǎng)絡(luò)概述 120
6.1.1 神經(jīng)網(wǎng)絡(luò)模型 120
6.1.2 神經(jīng)網(wǎng)絡(luò)的輸入和輸出數(shù)據(jù)格式 121
6.1.3 激勵(lì)函數(shù) 123
6.2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練 124
6.2.1 反向傳播學(xué)習(xí) 124
6.2.2 自組織映射的無指導(dǎo)聚類 127
6.2.3 實(shí)驗(yàn):應(yīng)用BP算法建立前饋神經(jīng)網(wǎng)絡(luò) 130
6.3 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢和缺點(diǎn) 138
本章小結(jié) 138
習(xí)題 139
第7章 統(tǒng)計(jì)技術(shù) 141
7.1 回歸分析 141
7.1.1 線性回歸分析 142
7.1.2 非線性回歸 149
7.1.3 樹回歸 151
7.2 貝葉斯分析 152
7.3 聚類技術(shù) 156
7.3.1 分層聚類 156
7.3.2 基于模型的聚類 163
7.4 數(shù)據(jù)挖掘中的統(tǒng)計(jì)技術(shù)與機(jī)器學(xué)習(xí)技術(shù) 165
本章小結(jié) 165
習(xí)題 167
第8章 時(shí)間序列和基于Web的數(shù)據(jù)挖掘 169
8.1 時(shí)間序列分析 169
8.1.1 概述 169
8.1.2 線性回歸分析解決時(shí)間序列問題 173
8.1.3 神經(jīng)網(wǎng)絡(luò)技術(shù)解決時(shí)間序列問題 175
8.2 基于Web的數(shù)據(jù)挖掘 176
8.2.1 概述 176
8.2.2 Web文本挖掘 178
8.2.3 Web使用挖掘 179
8.3 多模型分類技術(shù) 185
8.3.1 裝袋技術(shù) 185
8.3.2 推進(jìn)技術(shù) 185
本章小結(jié) 186
習(xí)題 187
附錄A 詞匯表 188
附錄B 數(shù)據(jù)挖掘數(shù)據(jù)集 201
參考文獻(xiàn)
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號