數據挖掘是當前最活躍的領域之一?!洞髷祿夹g叢書:數據挖掘技術與工程實踐》作者根據自己20年數據挖掘方面的經驗,總結了數據挖掘的理論知識和實踐經驗,提供了大量一線資料。本書首先介紹數據挖掘的概念和誤區(qū),然后介紹數據探索的方法,包括數據查探、數據描繪、數據變換、數據優(yōu)化等,重點介紹了相關算法,包括:相關因子算法、聚類算法、分類算法、回歸與測試算法等。不僅列舉了詳細示例,還介紹了算法在工程實踐中的具體應用,特別是總結了自己獨特的一些新算法,例如秩相關因子選擇算法、矢量相關因子選擇算法、密度分布聚類算法、概率特征模型算法等。還剖析了幾個熱門領域的實際應用,涉及醫(yī)藥學、信息安全、新聞分析、商品推薦、證券預測等領域的應用。最后歸納總結了數據挖掘應用系統(tǒng)的開發(fā)方案,并介紹一個數據挖掘工具的應用。本書可供數據挖掘、數據倉庫、數據庫等領域的技術人員參考,也可供想建立智能計算系統(tǒng)的企業(yè)信息系統(tǒng)管理人員參考。