第1篇 理論篇
第1章 緒論
1.1 數據挖掘的基礎概念
1.1.1 數據
1.1.2 知識
1.1.3 信息
1.1.4 數據挖掘的定義
1.2 數據挖掘與數據庫的關系
1.2.1 數據庫簡介
1.2.2 數據挖掘與數據庫
1.3 數據挖掘的過程
1.4 數據挖掘的體系結構
1.5 數據挖掘在商務智能中的位置
1.6 數據挖掘常見技術
1.7 數據挖掘標準的發(fā)展
1.7.1 預測模型標記語言PMML
1.7.2 公共倉庫元模型CWM
1.7.3 跨行業(yè)數據挖掘標準流程CRISP-DM
1.8 習題
第2章 數據倉庫與OLAP分析
2.1 數據倉庫
2.1.1 數據倉庫與數據挖掘的關系
2.1.2 數據倉庫的數據模型
2.1.3 元數據
2.2 ETL過程
2.2.1 數據抽取
2.2.2 數據轉換
2.2.3 數據加載
2.3 聯(lián)機分析處理OLAP
2.3.1 OLAP概念
2.3.2 OLAP的操作
2.3.3 OLAP多維數據分析
2.4 習題
第3章 關聯(lián)分析
3.1 關聯(lián)概述
3.2 關聯(lián)規(guī)則的定義
3.3 關聯(lián)分析的過程
3.4 關聯(lián)分析的基本算法
3.5 關聯(lián)規(guī)則的分類
3.6 關聯(lián)分析的發(fā)展
3.7 習題
第4章 分類分析
4.1 分類概述
4.2 基于決策樹的分類
4.2.1 決策樹的概念
4.2.2 決策樹的基本算法
4.2.3 決策樹修剪
4.2.4 決策樹的改進
4.3 分類分析的其他技術
4.3.1 支持向量機
4.3.2 貝葉斯網絡
4.4 習題
第5章 聚類分析
5.1 聚類概述
5.2 相似性度量
5.2.1 明氏(Minkowski)距離
5.2.2 蘭氏(Canberra)距離。
5.2.3 馬氏(Mahalanobis)距離
5.3 層次聚類法
5.3.1 最短距離法
5.3.2 最長距離法
5.3.3 二元變量度量
5.4 K-均值聚類算法
5.5 習題
第6章 數據挖掘的仿生技術
6.1 人工神經網絡
6.1.1 人腦神經元與神經元模型
6.1.2 人工神經網絡模型
6.1.3 BP網絡的基本原理
6.2 遺傳算法
6.3 蟻群算法
6.4 習題
第7章 數據挖掘的集合論技術
7.1 粗糙集理論
7.1.1 信息系統(tǒng)
7.1.2 粗糙集
7.1.3 屬性約簡
7.2 模糊集理論
7.2. 13次數學危機與模糊數學的誕生
7.2.2 模糊集合論的基礎知識
7.2.3 λ截集和支集
7.2.4 怎樣度量模糊性
7.2.5 模糊數學應用
7.3 習題
第2篇 實踐篇
第8章 數據挖掘工具
8.1 SPSS工具
8.2 WEKA工具
8.2.1 WEKA的背景
8.2.2 WEKA的功能
8.2.3 WEKA的使用
8.3 IBM Data Miner工具
8.4 MS SQL Server 2008數據分析引擎
8.5 ETL工具Data Stage
8.5.1 Datastage過程理論
8.5.2 Datastage的并行機制
8.6 習題
第9章 關聯(lián)分析在客戶關系管理的應用
9.1 客戶關系管理基本理論
9.1.1 客戶關系管理定義
9.1.2 CRM中的客戶類型
9.1.3 CRM系統(tǒng)體系理論
9.1.4 數據挖掘在客戶關系管理中的應用
9.2 實例研究背景——Foodmart簡介及DB分析
9.3 購物數據的預處理
9.4 數據集成與轉換
9.5 建立Foodmart公司購物籃分析模型
9.6 WEKA軟件挖掘過程
9.7 結果分析
9.8 習題
第10章 分類分析和聚類分析在客戶關系管理的綜合應用
10.1 Foodmart DB客戶數據分析
10.2 決策樹分類算法數據準備
10.2.1 數據的預處理
10.2.2 數據集成與轉換
10.3 零售業(yè)客戶決策樹分類模型的建立
10.3.1 聚類分析
10.3.2 決策樹分析
10.3.3 挖掘模型及流程
10.4 結果分析
10.5 習題
第11章 機場場區(qū)商務智能系統(tǒng)解決方案
11.1 OMG-DMS需求分析
11.2 方案設計思路
11.2.1 OMC商務智能的理念
11.2.2 OMC數據挖掘系統(tǒng)
11.3 OMC數據挖掘系統(tǒng)的部署
11.4 應用數據挖掘的OMC-DMS決策支持示例
11.5 OMC-DMS的職位需求
11.6 習題
參考文獻
后記