1 緒論
1.1 什么是知識發(fā)現
1.2 知識發(fā)現的過程
1.3 新型數據流應用
1.4 數據流定義及特點
1.5 數據流知識發(fā)現
1.5.1 數據流頻繁模式挖掘
1.5.2 數據流分類研究
1.5.3 數據流聚類
1.5.4 數據流離群點檢測
1.5.5 數據流時序數據分析
1.6 海量數據管理與并行及分布式計算
1.7 小結
2 海量數據管理的關鍵技術
2.1 海量數據硬件平臺模型
2.1.1 并行計算機體系結構
2.1.2 集群并行計算系統(tǒng)
2.1.3 虛擬化及云
2.2 海量數據系統(tǒng)模型
2.2.1 Hadoop框架
2.2.2 Google Filc System-GFS
2.2.3 Memcached
2.2.4 SimpleDB
2.3 海量數據計算的基本算法
2.3.1 Map/Reduce
2.3.2 BigTable
2.3.3 NFS
2.3.4 AFS
2.4 傳統(tǒng)海量數據管理技術
2.4.1 并行數據劃分
2.4.2 并行事務調度
N.4.3 并行事務并發(fā)控制算法
2.5 數據流管理系統(tǒng)
2.5.1 STREAM
2.5.2 Aurora
2.5.3 Medusa
2.5.4 Borealis
2.5.5 其他
2.6 基于CPU和GPU的并行計算
2.6.1 并行計算機和模型
2.6.2 MPI+OpenMP混合模型
2.6.3 基于GPU的并行計算模型
2.6.4 基于CUDA的并行計算模型
2.6.5 并行數據流分析
2.7 小結
3 數據流關聯規(guī)則發(fā)現
3.1 關聯規(guī)則挖掘概述
3.2 關聯規(guī)則挖掘典型算法分析
3.2.1 基于規(guī)則中涉及的數據維數的挖掘算法
3.2.2 基于規(guī)則中涉及的抽象層次的挖掘算法
3.2.3 按變量類別不同而確定的挖掘算法
3.3 數據流上頻集挖掘核心問題
3.3.1 概要數據處理方法
3.3.2 滑動窗口處理模型
3.3.3 挖掘算法分類
3.3.4 挖掘任務分類
3.4 基于前綴樹的頻繁閉項集挖掘PFIT算法
3.4.1 問題描述
3.4.2 前綴樹結構描述
3.4.3 構建前綴樹
3.4.4 挖掘前綴樹
3.4.5 實驗
3.5 高效益項集挖掘算法FHUI-Growth
3.5.1 關聯規(guī)則效益度的定義及性質
3.5.2 一種快速挖掘高效益項集的算法
3.5.3 實驗
3.6 基于概念格的關聯規(guī)則挖掘算法
3.7 小結
4 數據流分類知識發(fā)現
4.1 數據分類模型與方法
4.1.1 數據流單分類器算法
4.1.2 數據流集成分類器算法
4.2 基于隱馬爾可夫模型的流數據分類算法
4.2.1 基于隱馬爾可夫模型的流數據分類算法
4.2.2 馬爾可夫鏈
4.2.3 隱馬爾可夫模型
4.3 基于隱馬爾可夫模型的流數據分類算法
4.3.1 訓練樣本優(yōu)化
4.3.2 HMM_SDC算法
4.3.3 實驗
4.3.4 結論
4.4 小結
5 數據流聚類挖掘
5.1 引言
5.2 聚類分析
5.2.1 相關概念
5.2.2 聚類分析中的數據類型
5.2.3 主要聚類分析方法分類
5.2.4 常見聚類分析方法的分析
5.3 數據流聚類算法(methods and algorithms)
5.3.1 STREAM算法
5.3.2 CluStream算法框架
5.3.3 HPStream算法框架
5.3.4 E-Stream算法
5.3.5 DenStrearn算法
5.3.6 D-Stream算法
5.3.7 CFR算法
5.4 數據流濾波問題研究
5.4.1 受系統(tǒng)參數影響的狀態(tài)空間模型
5.4.2 最小距離設計方法
5.4.3 SSUKF-JSIMM算法思想
5.4.4 SSUKF-JSIMM算法步驟
5.4.5 仿真實驗
5.5 研究主題
5.5.1 一般性主題
5.5.2 面向具體應用領域的問題
5.6 小結
6 時序和序列數據流挖掘
6.1 時間序列及其應用
6.2 時間序列預測的常用方法
6.3 時間序列的相似性搜索
6.3.1 基于ARMA模型的時間序列相似性搜索
6.3.2 基于離散傅里葉變換的時間序列相似性查找
6.3.3 基于規(guī)范變換的查找方法
6.4 序列模式挖掘簡介
6.5 序列模式挖掘算法
6.5.1 Apriori算法
6.5.2 基于劃分的模式生長算法
6.5.3 基于序列比較的算法
6.6 支持約束的序列模式挖掘
6.6.1 約束的分類
6.6.2 支持約束的序列模式挖掘算法
6.7 周期模式挖掘
6.8 增量式序列模式挖掘
6.9 序列模式挖掘算法的比較分析
6.9.1 算法的定性比較
6.9.2 算法的時間和空間執(zhí)行效率比較
6.9.3 算法適用范圍分析
6.10 序列挖掘在生物信息領域的應用
6.10.1 蛋白質功能的計算方法簡介
6.10.2 一種改進的蛋白質功能預測方法PP_WNP[36]
6.10.3 實驗結果分析
6.10.4 結論
6.11 小結