注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘算法實(shí)踐與案例詳解

數(shù)據(jù)挖掘算法實(shí)踐與案例詳解

數(shù)據(jù)挖掘算法實(shí)踐與案例詳解

定 價(jià):¥59.00

作 者: 丁兆云 沈大勇 徐偉 周鋆
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787111760696 出版時(shí)間: 2025-02-01 包裝: 平裝-膠訂
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  數(shù)據(jù)挖掘算法為大數(shù)據(jù)與人工智能的核心,掌握數(shù)據(jù)挖掘各算法的編程實(shí)現(xiàn),有助于提升大數(shù)據(jù)的實(shí)踐運(yùn)用能力。本書詳細(xì)闡述了數(shù)據(jù)挖掘常用算法與編程實(shí)現(xiàn),同時(shí),本書以多個(gè)經(jīng)典的數(shù)據(jù)挖掘賽題為案例,詳細(xì)論述了數(shù)據(jù)預(yù)處理、特征選擇、可視化、算法選擇等全流程數(shù)據(jù)挖掘過程的編程實(shí)現(xiàn),有助于提升讀者面對(duì)實(shí)際數(shù)據(jù)問題時(shí)靈活運(yùn)用各類算法能力。

作者簡(jiǎn)介

  丁兆云,國(guó)防科技大學(xué)博士畢業(yè)后留校任教至今,長(zhǎng)期教授數(shù)據(jù)挖掘課程,負(fù)責(zé)國(guó)防科技大學(xué)系統(tǒng)工程學(xué)院“數(shù)據(jù)挖掘”專業(yè)方向考博命題工作,主持湖南省教改課題1項(xiàng)、國(guó)防科技大學(xué)教改課題1項(xiàng)、發(fā)表教學(xué)論文3篇,獲得國(guó)防科技大學(xué)研究生教學(xué)優(yōu)秀獎(jiǎng)。

圖書目錄

目  錄
前言
第1章 緒論  1
1.1 數(shù)據(jù)挖掘技術(shù)的由來  1
1.2 數(shù)據(jù)挖掘的分類  2
1.2.1 關(guān)聯(lián)規(guī)則挖掘  2
1.2.2 監(jiān)督式機(jī)器學(xué)習(xí)  3
1.2.3 非監(jiān)督式機(jī)器學(xué)習(xí)  4
1.3 Python的安裝步驟  5
1.3.1 Python環(huán)境的配置  5
1.3.2 PyCharm的安裝  7
1.4 常見的數(shù)據(jù)集  10
1.4.1 鳶尾花數(shù)據(jù)集  10
1.4.2 員工離職預(yù)測(cè)數(shù)據(jù)集  11
1.4.3 泰坦尼克號(hào)災(zāi)難預(yù)測(cè)數(shù)據(jù)集  12
1.4.4 PM2.5空氣質(zhì)量預(yù)測(cè)數(shù)據(jù)集  13
1.5 本章小結(jié)  13
第2章 分類  14
2.1 分類的概念  14
2.2 分類中的訓(xùn)練集與測(cè)試集  14
2.3 分類的過程及驗(yàn)證方法  15
2.3.1 準(zhǔn)確率  15
2.3.2 k折交叉驗(yàn)證  16
2.4 貝葉斯分類的編程實(shí)踐  17
2.4.1 鳶尾花數(shù)據(jù)集的貝葉斯分類  17
2.4.2 基于貝葉斯分類的員工離職
預(yù)測(cè)  17
2.5 本章小結(jié)  19
第3章 數(shù)據(jù)的特征選擇  20
3.1 直方圖  20
3.1.1 直方圖可視化  20
3.1.2 直方圖特征選擇  23
3.2 直方圖與柱狀圖的差異  24
3.3 特征選擇實(shí)踐  26
3.4 本章小結(jié)  29
第4章 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)清洗  30
4.1 案例概述  30
4.2 缺失值處理  31
4.2.1 缺失值處理概述  31
4.2.2 缺失值處理實(shí)例  32
4.3 噪聲數(shù)據(jù)處理  32
4.3.1 正態(tài)分布噪聲數(shù)據(jù)檢測(cè)  32
4.3.2 用箱線圖檢測(cè)噪聲數(shù)據(jù)  34
4.4 數(shù)據(jù)預(yù)處理案例實(shí)踐  35
4.4.1 問題  35
4.4.2 解決方法  35
4.4.3 實(shí)踐結(jié)論  37
4.5 本章小結(jié)  38
第5章 數(shù)據(jù)預(yù)處理之轉(zhuǎn)換  39
5.1 數(shù)據(jù)的數(shù)值化處理  39
5.1.1 順序編碼  39
5.1.2 二進(jìn)制編碼  40
5.2 數(shù)據(jù)規(guī)范化  42
5.2.1 最小–最大規(guī)范化  42
5.2.2 z分?jǐn)?shù)規(guī)范化  43
5.2.3 小數(shù)定標(biāo)規(guī)范化  43
5.3 本章小結(jié)  43
第6章 數(shù)據(jù)預(yù)處理之?dāng)?shù)據(jù)降維  44
6.1 散點(diǎn)圖可視化分析  44
6.2 主成分分析  46
6.3 本章小結(jié)  49
第7章 不平衡數(shù)據(jù)分類  50
7.1 不平衡數(shù)據(jù)分類問題的特征  50
7.1.1 數(shù)據(jù)稀缺問題  50
7.1.2 噪聲問題  51
7.1.3 決策面偏移問題  51
7.1.4 評(píng)價(jià)標(biāo)準(zhǔn)問題  51
7.2 重采樣方法  51
7.2.1 上采樣  52
7.2.2 對(duì)上采樣方法的改進(jìn)  53
7.2.3 下采樣  58
7.2.4 對(duì)下采樣方法的改進(jìn)  60
7.2.5 不平衡問題的其他處理方式  65
7.3 不平衡數(shù)據(jù)分類實(shí)踐  65
7.4 本章小結(jié)  66
第8章 回歸分析  67
8.1 線性回歸  67
8.1.1 一元線性回歸  67
8.1.2 多元線性回歸  69
8.2 回歸分析檢測(cè)  71
8.2.1 正態(tài)分布可能性檢測(cè)  71
8.2.2 線性分布可能性檢測(cè)  72
8.2.3 log轉(zhuǎn)換后的分布  73
8.3 回歸預(yù)測(cè)案例實(shí)踐  74
8.3.1 案例背景  74
8.3.2 代碼實(shí)現(xiàn)  74
8.4 本章小結(jié)  82
第9章 聚類分析  83
9.1 k均值聚類  83
9.1.1 算法的步驟  83
9.1.2 代碼實(shí)現(xiàn)  83
9.2 層次聚類  84
9.2.1 算法的步驟  84
9.2.2 代碼實(shí)現(xiàn)  85
9.3 密度聚類  85
9.3.1 算法的步驟  85
9.3.2 代碼實(shí)現(xiàn)  86
9.4 本章小結(jié)  88
第10章 關(guān)聯(lián)分析  90
10.1 Apriori算法  90
10.2 關(guān)聯(lián)分析案例實(shí)踐  92
10.2.1 案例背景  92
10.2.2 案例的數(shù)據(jù)集  93
10.2.3 代碼實(shí)現(xiàn)  93
10.2.4 運(yùn)行結(jié)果  93
10.3 提升Apriori算法性能的方法  95
10.4 本章小結(jié)  95
第11章 KNN分類  96
11.1 KNN算法的步驟  96
11.2 KNeighborsClassifier函數(shù)  97
11.3 KNN的代碼實(shí)現(xiàn)  98
11.4 結(jié)果分析  98
11.5 KNN案例實(shí)踐  99
11.5.1 案例分析  99
11.5.2 案例實(shí)現(xiàn)  100
11.5.3 運(yùn)行結(jié)果  103
11.6 本章小結(jié)  104
第12章 支持向量機(jī)  105
12.1 支持向量機(jī)的可視化分析  105
12.2 SVM的代碼實(shí)現(xiàn)  108
12.2.1 鳶尾花數(shù)據(jù)分類  108
12.2.2 新聞文本數(shù)據(jù)分類  110
12.3 本章小結(jié)  111
第13章 神經(jīng)網(wǎng)絡(luò)分類  112
13.1 多層人工神經(jīng)網(wǎng)絡(luò)  112
13.2 多層人工神經(jīng)網(wǎng)絡(luò)的代碼實(shí)現(xiàn)  113
13.3 神經(jīng)網(wǎng)絡(luò)分類案例實(shí)踐  114
13.3.1 案例背景  114
13.3.2 數(shù)據(jù)說明  114
13.3.3 代碼實(shí)現(xiàn)  115
13.4 本章小結(jié)  120
第14章 集成學(xué)習(xí)  121
14.1 Bagging方法  121
14.2 隨機(jī)森林  123<>

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)