注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)分析:數(shù)據(jù)挖掘必備算法示例詳解

大數(shù)據(jù)分析:數(shù)據(jù)挖掘必備算法示例詳解

大數(shù)據(jù)分析:數(shù)據(jù)挖掘必備算法示例詳解

定 價:¥39.90

作 者: 張重生 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111555469 出版時間: 2016-12-01 包裝: 平裝
開本: 16k 頁數(shù): 字數(shù):  

內(nèi)容簡介

  本書詳細介紹了大數(shù)據(jù)分析,尤其是數(shù)據(jù)分類相關(guān)算法的原理及實現(xiàn)細節(jié),并給出了每個算法的編程實例。全書共計21章,內(nèi)容包括十大數(shù)據(jù)分類算法、十大從二元分類到多類分類的算法、九大屬性選擇算法、五大數(shù)據(jù)選擇算法,若干集成學(xué)習(xí)方法和不均衡數(shù)據(jù)分類算法,以及大數(shù)據(jù)分析的平臺與技術(shù)。 本書可作為高等學(xué)校計算機科學(xué)與技術(shù)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、統(tǒng)計學(xué)、軟件工程、地理信息系統(tǒng)等專業(yè)的研究生和高年級本科生的教材,也可作為科研人員、工程師和大數(shù)據(jù)愛好者的參考書。

作者簡介

  張重生,男,博士,教授,碩士生導(dǎo)師,河南大學(xué)大數(shù)據(jù)團隊帶頭人。研究領(lǐng)域為大數(shù)據(jù)分析、深度學(xué)習(xí)、數(shù)據(jù)挖掘、數(shù)據(jù)庫、實時數(shù)據(jù)分析。博士畢業(yè)于 INRIA,F(xiàn)rance(法國國家信息與自動化研究所)。2010年08月至2011年3月,在美國加州大學(xué)洛杉磯分校(UCLA)計算機系,師從Carlo Zaniolo教授進行流數(shù)據(jù)挖掘方面的研究。 十多年來,一直從事數(shù)據(jù)庫、數(shù)據(jù)挖掘、大數(shù)據(jù)分析相關(guān)的研究,發(fā)表SCI/EI論文20篇,含Information Sciences、Neurocomputing、IEEE ICDM、PAKDD、SSDBM等國際期刊和會議論文。作為項目負責(zé)人主持 4項科研項目,出版學(xué)術(shù)專著3部,獲得3項國家發(fā)明專利,指導(dǎo)碩士研究生12名。

圖書目錄

第1章數(shù)據(jù)分析緒論
1.1理解數(shù)據(jù)中字段的類型是數(shù)據(jù)分析的重要前提
1.2進行數(shù)據(jù)分析時數(shù)據(jù)的表示形式
1.3數(shù)據(jù)分類——數(shù)據(jù)類別的自動識別
1.4數(shù)據(jù)分類問題與回歸問題的區(qū)別與聯(lián)系
1.5數(shù)據(jù)分析算法簡介
1.6交叉驗證
1.7一個最簡單的分類器-K近鄰分類器
1.8后續(xù)章節(jié)組織
第2章SVM算法
2.1算法原理
2.2工具包簡介
2.3實例詳解
第3章決策樹算法
3.1信息熵值
3.2決策樹的構(gòu)建目標
3.3 ID3決策樹算法
3.4 C45決策樹算法
3.5 CART決策樹算法
3.6 ID3、C45、CART算法的終止條件
3.7C45算法的參數(shù)介紹
3.8實例詳解
第4章隨機森林算法
4.1算法原理
4.2工具包介紹
4.3實例詳解
第5章梯度提升決策樹算法
5.1算法原理
5.2工具包介紹
5.3實例詳解
第6章AdaBoost算法
6.1算法原理
6.2工具包介紹
6.3實例詳解
第7章樸素貝葉斯分類器
7.1樸素貝葉斯分類的問題定義
7.2樸素貝葉斯算法原理
7.3一種常見的樸素貝葉斯模型的錯誤計算方法
7.4樸素貝葉斯算法對連續(xù)型屬性的處理
第8章極限學(xué)習(xí)機器算法
8.1算法原理
8.2算法參數(shù)介紹
8.3實例詳解
第9章邏輯回歸算法
9.1 Logistic Regression算法流程
9.2 Logistic Regression算法原理推導(dǎo)
第10章稀疏表示分類算法
10.1算法原理
10.2 SRC工具包及算法參數(shù)介紹
10.3 SRC算法實例詳解
第11章不同數(shù)據(jù)分類算法性能的大規(guī)模實驗對比分析
11.1為什么要比較不同數(shù)據(jù)分類算法的性能?
11.2不同數(shù)據(jù)分類算法性能比較的相關(guān)工作
11.3最新數(shù)據(jù)分類算法性能的大規(guī)模實驗對比分析結(jié)果
11.4結(jié)論
第12章從二分類到多分類——OVA
12.1 OVA 聚合規(guī)則的核心思想
12.2 MAX聚合規(guī)則
12.3 DOO聚合規(guī)則
12.4調(diào)用示例
第13章從二分類到多分類——OVO
13.1 OVO 聚合規(guī)則的核心思想
13.2 WV聚合規(guī)則
13.3 VOTE聚合規(guī)則
13.4 PC聚合規(guī)則
13.5 PE聚合規(guī)則
13.6 LVPC聚合規(guī)則
13.7調(diào)用示例
第14章從二分類到多分類——ECOC
14.1 ECOC的核心思想
14.2 ECOC 編碼
14.3 ECOC 譯碼
14.4 ECOC多類分類調(diào)用示例
第15章三種從二分類到多分類聚合策略的實驗對比分析
15.1 OVA策略的實驗結(jié)果
15.2 OVO策略的實驗結(jié)果
15.3 ECOC策略的實驗結(jié)果
第16章多個分類算法的集成方法研究
16.1差異性(Diversity)的原理與技術(shù)
16.2集成學(xué)習(xí)方法
16.3本章小結(jié)
第17章屬性選擇算法
17.1 fspackage和LibSVM的使用
17.2信息增益算法
17.3卡方分布算法
17.4基于Fisher Score的屬性選擇算法
17.5基于基厄系數(shù)的屬性選擇算法
17.6基于T檢驗的屬性選擇算法
第18章高級屬性選擇算法
18.1線性前向選擇算法
18.2順序前向選擇算法
18.3基于稀疏多項式邏輯回歸的屬性選擇算法
18.4 Our——多個屬性選擇算法的集成策略
18.5屬性選擇算法的大規(guī)模實驗對比分析
第19章數(shù)據(jù)選擇算法
19.1衡量不均衡數(shù)據(jù)分類質(zhì)量的常用方法
19.2 RUS算法
19.3 CNN算法
19.4 SMOTE算法
19.5 ADASYN算法
19.6 OSS算法
19.7本章小結(jié)
第20章不均衡數(shù)據(jù)分類算法及大規(guī)模實驗分析
20.1 C4.5 CS算法
20.2使用Random Forests和GBDT進行不均衡數(shù)據(jù)分類
20.3BalanceCascade不均衡數(shù)據(jù)分類算法
20.4其他不均衡數(shù)據(jù)分類算法及不均衡分類器的集成算法
20.5結(jié)合屬性選擇和數(shù)據(jù)選擇的不均衡數(shù)據(jù)分類實驗
第21章大數(shù)據(jù)分析
21.1 Spark平臺簡介
21.2基于Ambari的Spark及Spark集群的安裝與配置
21.3 Ambari集群擴展
21.4基于Spark平臺的分布式編程示例
21.5 MLlib——Spark平臺上的機器學(xué)習(xí)庫


本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號