注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡數據庫數據庫挖掘/數據倉庫高維聚類知識發(fā)現關鍵技術研究及應用

高維聚類知識發(fā)現關鍵技術研究及應用

高維聚類知識發(fā)現關鍵技術研究及應用

定 價:¥26.00

作 者: 陳建斌 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 數據倉庫與數據挖掘

購買這本書可以去


ISBN: 9787121082481 出版時間: 2009-03-01 包裝: 平裝
開本: 大32開 頁數: 217 字數:  

內容簡介

  知識發(fā)現是從數據集中抽取和精化新的模式的過程,基于數據庫的知識發(fā)現(Knowledge Discovery in Database,KDD))是知識發(fā)現研究的主體和熱點,而聚類知識發(fā)現又是知識發(fā)現的重要方面。如何有效處理巨量、高維的數據,是當前聚類分析的關鍵技術。本書圍繞高維數據的聚類問題展開研究,在討論高維數據相似I生尤其是高維二元數據相似性定義的基礎上,提出了基于粗圖模型的硬聚類和軟聚類算法、高維二元數據的映射聚類算法、基于螞蟻行為的聚類算法等,并進一步提出基于映射聚類的離群點檢測方法;還特別討論了高維聚類結果的表示方法問題,提出了應用粗糙集高效表達聚類結果的方法;最后探討了聚類知識發(fā)現數據建模的基本步驟,給出了聚類知識發(fā)現的典型應用案例。本書學術性、知識性并重,可供從事數據倉庫與數據挖掘教學、研究的師生、學者閱讀,也可以為從事數據挖掘、知識發(fā)現系統(tǒng)等軟件工程技術人員提供參考。

作者簡介

  陳建斌,男,山西長治人。2005年獲計算機應用專業(yè)博士學位。國家職業(yè)技能鑒定專家委員會企業(yè)信息管理專家組組長,中國機械工業(yè)企業(yè)管理協(xié)會專家委員會委員,北京聯合大學商務學院副教授、電子商務研究所所長,高級企業(yè)信息管理師。主要研究方向為企業(yè)信息化管理與運作、電子商務與電子政務和商務智能。 作者多年來秉承系統(tǒng)工程思想,開展企業(yè)信息化管理的研究與實踐,主編了《企業(yè)信息管理師培訓教程》、《ERP工程師培訓教程》、《電子商務與電子政務》、《電子商務與現代物流》和《信息經濟學》等多部著作,參與國家自然科學基金項目多項,主持省部級科研項目多項,在國內核心期刊及國際學術會議上發(fā)表論文三十余篇。作為高級顧問和專家組組長,主講和輔導中央企業(yè)信息管理師職業(yè)資格培訓數十期;參與多項企業(yè)信息化戰(zhàn)略規(guī)劃,數據倉庫規(guī)劃與建設和企業(yè)診斷等項目。

圖書目錄

第1章 知識發(fā)現與KDD
1.1 知識與知識發(fā)現
1.1.1 知識
1.1.2 知識發(fā)現和KDD
1.1.3 知識發(fā)現的過程
1.2 數據庫知識發(fā)現——KDD
1.2.1 KDD的產生與發(fā)展
1.2.2 KDD的一般機理和理論基礎
1.2.3 KDD系統(tǒng)的基本框架
1.2.4 KDD的主要任務
第2章 聚類知識發(fā)現及其關鍵技術
2.1 聚類問題的主要方法
2.2 聚類問題的關鍵技術
2.2.1 數據倉庫技術
2.2.2 高維聚類技術
2.3 高維聚類關鍵技術研究
2.3.1 高維聚類的主要算法
2.3.2 高維聚類算法的關鍵技術
第3章 高維數據相似性的定義
3.1 數據相似關系
3.1.1 基于距離的相似性定義
3.1.2 基于密度的相似性定義
3.1.3 基于連接的相似性定義
3.2 高維數據相似關系的定義
3.3 二元數據相似性的定義
3.3.1 屬性分布特征向量
3.3.2 對象間屬性分布相似性
3.4 小結
第4章 基于粗圖模型的聚類算法
4.1 圖論基礎概念
4.2 基于圖論的聚類算法
4.2.1 聚集型圖論聚類
4.2.2 多層粗圖法
4.2.3 基于二部圖的方法
4.3 圖劃分的關鍵技術
4.3.1 圖的多層二分劃(Multilevel Graph Bisection)
4.3.2 增強譜分割算法
4.3.3 圖的非平衡劃分技術
4.4 多層粗圖聚類算法的改進
4.4.1 聚類算法
4.4.2 圖分割的精化算法
4.4.3 聚類質量評價
4.4.4 實驗結果
4.4.5 算法評價
4.5 基于粗圖模型的軟聚類方法
4.5.1 引言
4.5.2 軟聚類算法
4.5.3 基于圖劃分法的軟聚類GPSC算法
4.5.4 實驗分析
4.5.5 軟聚類方法的評價
4.6 小結
第5章 高維二元數據的映射聚類算法
5.1 引言
5.2 二元數據
5.3 映射聚類模型
5.3.1 伯努利分布(Bernoulli distribution)
5.3.2 有限混合伯努利分布
5.3.3 似然函數
5.3.4 EM算法
5.3.5 伯努利混合模型的EM算法
5.3.6 基于混合模型的映射聚類思想
5.4 映射聚類算法
5.5 實驗結果
5.6 小結
第6章 基于螞蟻行為的聚類方法
6.1 螞蟻算法綜述
6.2 Deneubourg基本模型及LF聚類算法
6.2.1 數據對象表示方法及相似性量度
6.2.2 Deneubourg基本模型
6.2.3 LF聚類算法
6.3 基于密度的啟發(fā)性群體智能聚類算法——HDBCSI
6.3.1 記憶體
6.3.2 基于密度的先行策略
6.3.3 基于密度的啟發(fā)性群體智能聚類算法HDBCSI算法描述
6.3.4 算法測試與比較分析
6.3.5 螞蟻算法評價
6.4 小結
第7章 高維數據空間的離群點檢測方法
7.1 概述
7.2 高維空間中的離群點發(fā)現
7.3 子空間離群點發(fā)現算法綜述
7.4 映射離群點發(fā)現的思考
7.5 映射離群點發(fā)現算法的設計
7.5.1 映射聚類算法
7.5.2 基于熵的屬性選擇
7.5.3 離散屬性中離群點的確定
7.5.4 簇外屬性檢測
7.6 算法描述及分析
7.7 小結
第8章 高維數據聚類結果的表示
8.1 聚類結果表示方式概述
8.1.1 數據可視化
8.1.2 表達式法
8.2 基于粗糙集理論的知識表示
8.2.1 粗糙集基礎理論
8.2.2 屬性空間上的rough集理論
8.3 基于粗糙集理論的聚類結果表達
8.3.1 一般聚類知識的表達
8.3.2 高維二元映射聚類結果的粗糙集表示
8.4 小結
第9章 聚類知識發(fā)現數據建模及應用
9.1 數據模型的建立
9.1.1 數據倉庫的體系結構與建模方法
9.1.2 多維數據模型對分析型應用的支持
9.1.3 數據建模方案
9.2 應用數據準備
9.2.1 數據準備的內容
9.2.2 數據凈化的方法
9.2.3 數據的精簡
9.3 聚類知識發(fā)現的應用——電信市場客戶分群
9.3.1 客戶聚類分析流程
9.3.2 戰(zhàn)術分群與目標市場營銷
9.4 小結
參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號