知識發(fā)現是從數據集中抽取和精化新的模式的過程,基于數據庫的知識發(fā)現(Knowledge Discovery in Database,KDD))是知識發(fā)現研究的主體和熱點,而聚類知識發(fā)現又是知識發(fā)現的重要方面。如何有效處理巨量、高維的數據,是當前聚類分析的關鍵技術。本書圍繞高維數據的聚類問題展開研究,在討論高維數據相似I生尤其是高維二元數據相似性定義的基礎上,提出了基于粗圖模型的硬聚類和軟聚類算法、高維二元數據的映射聚類算法、基于螞蟻行為的聚類算法等,并進一步提出基于映射聚類的離群點檢測方法;還特別討論了高維聚類結果的表示方法問題,提出了應用粗糙集高效表達聚類結果的方法;最后探討了聚類知識發(fā)現數據建模的基本步驟,給出了聚類知識發(fā)現的典型應用案例。本書學術性、知識性并重,可供從事數據倉庫與數據挖掘教學、研究的師生、學者閱讀,也可以為從事數據挖掘、知識發(fā)現系統(tǒng)等軟件工程技術人員提供參考。