注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程

定 價:¥54.90

作 者: 黃德才
出版社: 清華大學(xué)出版社
叢編項:
標(biāo) 簽: 工學(xué) 教材 研究生/本科/??平滩?/td>

ISBN: 9787302434122 出版時間: 2016-07-01 包裝: 平裝
開本: 16開 頁數(shù): 105 字?jǐn)?shù):  

內(nèi)容簡介

  本書較詳細(xì)地介紹了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的原理、方法及應(yīng)用技術(shù)。全書共有14章,分為4篇。第1章為緒論篇,介紹數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的基本概念及其相互關(guān)系; 第2~6章為數(shù)據(jù)倉庫原理及應(yīng)用篇,主要介紹數(shù)據(jù)倉庫的概念模型、邏輯模型和物理模型,以及數(shù)據(jù)倉庫的規(guī)劃、設(shè)計、實施和OLAP應(yīng)用等; 第7~10章為傳統(tǒng)數(shù)據(jù)挖掘原理及算法篇,介紹數(shù)據(jù)的屬性類型與相似性度量、關(guān)聯(lián)規(guī)則挖掘、分類規(guī)則挖掘、聚類分析和離群點挖掘算法等; 第11~14章為數(shù)據(jù)挖掘創(chuàng)新篇,主要內(nèi)容取自編者近年指導(dǎo)研究生發(fā)表的學(xué)術(shù)論文,并根據(jù)教學(xué)需要進(jìn)行適當(dāng)補充修改而成,包括混合屬性數(shù)據(jù)、數(shù)據(jù)流和不確定數(shù)據(jù)的聚類分析,以及量子遺傳聚類算法等。本書可作為普通高等院校計算機(jī)專業(yè)與IT相關(guān)專業(yè)高年級本科生和研究生的教材,也可作為經(jīng)濟(jì)管理類專業(yè)同名課程的教材和參考書,還可作為電子商務(wù)、金融保險等行業(yè)數(shù)據(jù)管理與數(shù)據(jù)分析人員的培訓(xùn)教材或自學(xué)參考書。

作者簡介

暫缺《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程》作者簡介

圖書目錄

目錄

第1章緒論

1.1數(shù)據(jù)倉庫概述

1.1.1從傳統(tǒng)數(shù)據(jù)庫到數(shù)據(jù)倉庫

1.1.2數(shù)據(jù)倉庫的4個特征

1.1.3數(shù)據(jù)倉庫系統(tǒng)

1.1.4數(shù)據(jù)倉庫系統(tǒng)體系結(jié)構(gòu)

1.1.5數(shù)據(jù)倉庫數(shù)據(jù)的粒度與組織

1.2數(shù)據(jù)挖掘概述

1.2.1數(shù)據(jù)挖掘產(chǎn)生的背景

1.2.2數(shù)據(jù)挖掘與知識發(fā)現(xiàn)

1.2.3數(shù)據(jù)挖掘的數(shù)據(jù)來源

1.2.4數(shù)據(jù)挖掘的任務(wù)

1.2.5數(shù)據(jù)挖掘的步驟

1.2.6數(shù)據(jù)挖掘的應(yīng)用

1.3數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

1.3.1數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的區(qū)別

1.3.2數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系

1.4教程章節(jié)組織與學(xué)時建議

習(xí)題1

第2章數(shù)據(jù)倉庫原理

2.1多數(shù)據(jù)源問題

2.2數(shù)據(jù)預(yù)處理

2.2.1數(shù)據(jù)清洗

2.2.2數(shù)據(jù)變換

2.2.3數(shù)據(jù)歸約

2.3ER模型

2.4數(shù)據(jù)倉庫的概念模型

2.4.1多維數(shù)據(jù)模型

2.4.2維度與粒度

2.5數(shù)據(jù)倉庫的邏輯模型

2.5.1多維數(shù)據(jù)庫系統(tǒng)

2.5.2星形模型

2.5.3雪花模型

2.6數(shù)據(jù)倉庫的物理模型

2.6.1位圖索引模型

2.6.2廣義索引模型

2.6.3連接索引模型

2.6.4RAID存儲結(jié)構(gòu)

習(xí)題2

第3章數(shù)據(jù)倉庫的設(shè)計開發(fā)應(yīng)用

3.1數(shù)據(jù)倉庫設(shè)計的特點

3.2數(shù)據(jù)倉庫系統(tǒng)開發(fā)過程

3.3數(shù)據(jù)倉庫系統(tǒng)的規(guī)劃

3.4數(shù)據(jù)倉庫的設(shè)計

3.4.1需求分析

3.4.2概念設(shè)計

3.4.3邏輯設(shè)計

3.4.4物理設(shè)計

3.5數(shù)據(jù)倉庫的實施

3.5.1數(shù)據(jù)倉庫的創(chuàng)建

3.5.2數(shù)據(jù)的抽取、轉(zhuǎn)換和加載

3.6數(shù)據(jù)倉庫系統(tǒng)的開發(fā)

3.6.1開發(fā)任務(wù)

3.6.2開發(fā)方法

3.6.3系統(tǒng)測試

3.7數(shù)據(jù)倉庫系統(tǒng)的應(yīng)用

3.7.1用戶培訓(xùn)

3.7.2決策支持

3.7.3維護(hù)評估

習(xí)題3

第4章警務(wù)數(shù)據(jù)倉庫的實現(xiàn)

4.1SQL Server 2008 R2

4.1.1SQL Server的服務(wù)功能

4.1.2SQL Server Management Studio

4.1.3Microsoft Visual Studio

4.2創(chuàng)建集成服務(wù)項目與SSIS包

4.3配置“旅館_ETL”數(shù)據(jù)流任務(wù)

4.3.1創(chuàng)建“旅館_ETL”對象

4.3.2配置“旅館_ETL”參數(shù)

4.4配置“人員_ETL”數(shù)據(jù)流任務(wù)

4.4.1創(chuàng)建“人員_ETL”對象

4.4.2配置“人員_ETL”參數(shù)

4.5配置“時間_ETL”數(shù)據(jù)流任務(wù)

4.5.1創(chuàng)建“時間_ETL”對象

4.5.2配置“時間_ETL”參數(shù)

4.6配置“入住_ETL”數(shù)據(jù)流任務(wù)

4.6.1創(chuàng)建“入住_ETL”對象

4.6.2配置“入住_ETL”參數(shù)

4.7部署前面配置的SSIS包

4.7.1將包另存到SSIS服務(wù)器

4.7.2創(chuàng)建作業(yè)代理

習(xí)題4

第5章聯(lián)機(jī)分析處理技術(shù)

5.1OLAP概述

5.1.1OLAP的定義

5.1.2OLAP的12條準(zhǔn)則

5.1.3OLAP的簡要準(zhǔn)則

5.1.4OLAP系統(tǒng)的基本結(jié)構(gòu)

5.2OLAP的多維分析操作

5.2.1切片

5.2.2切塊

5.2.3旋轉(zhuǎn)

5.2.4鉆取

5.3OLAP系統(tǒng)的分類

5.3.1多維OLAP

5.3.2關(guān)系OLAP

5.3.3MOLAP與ROLAP的比較

5.3.4混合OLAP

5.4OLAP、DW與DM的關(guān)系

5.4.1OLAP、DW與DM的聯(lián)系

5.4.2OLAP、DW與DM的區(qū)別

5.4.3OLAP與DW的關(guān)系

5.4.4OLAP與DM的關(guān)系

5.5DOLAM決策支持系統(tǒng)方案

習(xí)題5

第6章警務(wù)數(shù)據(jù)倉庫的OLAP應(yīng)用

6.1創(chuàng)建分析服務(wù)項目

6.1.1進(jìn)入商業(yè)智能開發(fā)平臺

6.1.2創(chuàng)建分析服務(wù)項目

6.2配置項目的數(shù)據(jù)源

6.3構(gòu)建數(shù)據(jù)源視圖

6.4創(chuàng)建多維數(shù)據(jù)集

6.5配置維的層次結(jié)構(gòu)

6.5.1配置日期維的層次

6.5.2配置地址維的層次

6.5.3配置人員維的層次

6.5.4配置旅館維的層次

6.6添加人口來源地址維

6.7分析服務(wù)項目的部署

6.8瀏覽多維數(shù)據(jù)集

習(xí)題6

第7章數(shù)據(jù)的屬性與相似性

7.1數(shù)據(jù)集的結(jié)構(gòu)

7.1.1二維表

7.1.2數(shù)據(jù)矩陣

7.2屬性的類型

7.2.1連續(xù)屬性

7.2.2離散屬性

7.2.3分類屬性

7.2.4二元屬性

7.2.5序數(shù)屬性

7.2.6數(shù)值屬性

7.3相似度與相異度

7.3.1數(shù)值屬性的距離

7.3.2分類屬性的相似度

7.3.3余弦相似度

7.3.4混合屬性的相異度

習(xí)題7

第8章關(guān)聯(lián)規(guī)則挖掘

8.1關(guān)聯(lián)規(guī)則的概念

8.1.1基本概念

8.1.2項集的性質(zhì)

8.2關(guān)聯(lián)規(guī)則的Apriori算法

8.2.1發(fā)現(xiàn)頻繁項集

8.2.2產(chǎn)生關(guān)聯(lián)規(guī)則

8.3FP增長算法

8.3.1算法的背景

8.3.2構(gòu)造FP樹

8.3.3生成頻繁項集

8.4關(guān)聯(lián)規(guī)則的評價

8.4.1支持度和置信度的不足

8.4.2相關(guān)性分析

8.5序列模式發(fā)現(xiàn)算法

8.5.1序列模式的概念

8.5.2類Apriori算法

8.6關(guān)聯(lián)規(guī)則其他算法

8.6.1頻繁項集算法優(yōu)化

8.6.2CLOSE算法

8.6.3時態(tài)關(guān)聯(lián)規(guī)則

8.6.4含負(fù)項的關(guān)聯(lián)規(guī)則

習(xí)題8

第9章分類規(guī)則挖掘

9.1分類問題概述

9.2k最近鄰分類法

9.3決策樹分類方法

9.3.1決策樹生成框架

9.3.2ID3分類方法

9.3.3決策樹的剪枝

9.3.4C4.5算法

9.4貝葉斯分類方法

9.4.1貝葉斯定理

9.4.2樸素貝葉斯分類器

9.4.3樸素貝葉斯分類方法的改進(jìn)

9.5其他分類方法

習(xí)題9

第10章聚類分析方法

10.1聚類分析原理

10.1.1聚類分析概述

10.1.2聚類的數(shù)學(xué)定義

10.1.3簇的常見類型

10.1.4聚類框架及性能要求

10.1.5簇的距離

10.2劃分聚類算法

10.2.1劃分聚類框架

10.2.2劃分聚類的質(zhì)量

10.2.3kmeans算法

10.2.4空簇與離群點

10.2.5k中心點算法

10.3層次聚類方法

10.3.1層次聚類策略

10.3.2AGNES算法

10.3.3DIANA算法

10.4密度聚類方法

10.4.1基本概念

10.4.2算法描述

10.4.3計算實例

10.4.4算法的性能分析

10.5聚類的質(zhì)量評價

10.5.1簇的數(shù)目估計

10.5.2外部質(zhì)量評價

10.5.3內(nèi)部質(zhì)量評價

10.6離群點挖掘

10.6.1相關(guān)問題概述

10.6.2基于距離的方法

10.6.3基于相對密度的方法

10.7其他聚類方法

習(xí)題10

第11章混合屬性數(shù)據(jù)的聚類分析

11.1混合屬性數(shù)據(jù)集聚類

11.1.1混合屬性數(shù)據(jù)普遍存在

11.1.2kprototypes算法

11.1.3kprototypes算法的不足

11.2改進(jìn)的kprototypes算法

11.2.1加權(quán)頻率最大原型

11.2.2離散屬性的頻率相異度

11.2.3改進(jìn)的kprototypes算法

11.3強(qiáng)連通聚類融合算法

11.3.1聚類融合方法

11.3.2強(qiáng)連通聚類融合

11.3.3聚類融合優(yōu)化算法

習(xí)題11

第12章數(shù)據(jù)流挖掘與聚類分析

12.1數(shù)據(jù)流挖掘的概念

12.1.1數(shù)據(jù)流的定義

12.1.2數(shù)據(jù)流挖掘的任務(wù)

12.2數(shù)據(jù)流處理技術(shù)

12.2.1概要數(shù)據(jù)結(jié)構(gòu)

12.2.2時間傾斜技術(shù)

12.2.3數(shù)據(jù)流聚類的要求

12.2.4數(shù)據(jù)流聚類的一般步驟

12.3兩層數(shù)據(jù)流聚類框架

12.4三層數(shù)據(jù)流聚類框架

12.5最優(yōu)2k近鄰聚類算法

12.5.1算法設(shè)計動因

12.5.2定義2k最近鄰集

12.5.3在線2k最近鄰集生成

12.5.4最優(yōu)2k近鄰集算法

12.5.5最優(yōu)2k近鄰聚類算法

12.5.6實例計算結(jié)果

習(xí)題12

第13章不確定數(shù)據(jù)的聚類分析

13.1不確定數(shù)據(jù)挖掘概述

13.1.1不確定數(shù)據(jù)的產(chǎn)生

13.1.2不確定數(shù)據(jù)的種類

13.1.3不確定數(shù)據(jù)的聚類

13.2基于相對密度的不確定數(shù)據(jù)聚類算法

13.2.1基于相對密度的聚類思想

13.2.2不確定相異度與k最近鄰集

13.2.3不確定k最近鄰密度

13.2.4RDBCAU算法描述

13.2.5計算實例

13.3不確定分類屬性數(shù)據(jù)聚類算法

13.3.1傳統(tǒng)分類屬性相似度

13.3.2分類屬性加權(quán)相似度

13.3.3分類屬性雙重加權(quán)相似度

13.3.4不確定分類屬性雙重加權(quán)相似度

13.3.5基于連通分支的不確定分類屬性聚類算法

習(xí)題13

第14章量子計算與量子遺傳聚類算法

14.1量子計算與數(shù)據(jù)挖掘

14.1.1量子計算的誕生

14.1.2量子計算研究

14.1.3量子數(shù)據(jù)挖掘算法

14.2量子計算原理

14.2.1量子態(tài)與量子比特

14.2.2量子門與基本運算

14.2.3量子糾纏特性

14.3經(jīng)典量子算法

14.3.1量子傅里葉變換

14.3.2Shor因子分解算法

14.3.3Grover算法

14.4基于3D角度編碼的量子遺傳算法

14.4.1量子遺傳算法

14.4.2量子3D角度編碼

14.4.3解空間的映射

14.4.4量子染色體更新

14.4.5量子位的變異

14.4.6QGAB3DC算法

14.5量子遺傳聚類算法

14.5.1屬性值q分位數(shù)與極差

14.5.2基于極差的廣義加權(quán)距離

14.5.3量子遺傳聚類算法

習(xí)題14

參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號