注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡數(shù)據(jù)庫小白學數(shù)據(jù)挖掘與機器學習:SPSS Modeler案例篇

小白學數(shù)據(jù)挖掘與機器學習:SPSS Modeler案例篇

小白學數(shù)據(jù)挖掘與機器學習:SPSS Modeler案例篇

定 價:¥79.00

作 者: 張浩彬 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787121338434 出版時間: 2018-06-01 包裝: 平裝
開本: 16 頁數(shù): 240 字數(shù):  

內容簡介

  《小白學數(shù)據(jù)挖掘與機器學習——SPSS Modeler案例篇》用生活中常見的例子、有趣的插圖和通俗的語言,把看上去晦澀難懂的數(shù)據(jù)挖掘與機器學習知識以通俗易懂的方式分享給讀者,讓讀者從入門學習階段就發(fā)現(xiàn),原來數(shù)據(jù)挖掘與機器學習不但有用,還很有趣。 《小白學數(shù)據(jù)挖掘與機器學習——SPSS Modeler案例篇》以IBM SPSS Modeler 作為案例實踐工具,首先介紹了數(shù)據(jù)挖掘的基本概念及數(shù)據(jù)挖掘方法,然后介紹了IBM SPSS Modeler 工具的基本使用、數(shù)據(jù)探索、統(tǒng)計檢驗、回歸分析、分類算法、聚類算法、關聯(lián)規(guī)則、神經(jīng)網(wǎng)絡以及集成學習。每一章都會以漫畫形式介紹一些日常小例子并作為切入點,用通俗的語言介紹具體的算法理論,同時在每章最后都附上應用案例,讓讀者更輕松地閱讀《小白學數(shù)據(jù)挖掘與機器學習——SPSS Modeler案例篇》并掌握對應的算法和實踐操作。 《小白學數(shù)據(jù)挖掘與機器學習——SPSS Modeler案例篇》內容循序漸進,完整覆蓋了數(shù)據(jù)挖掘與機器學習的主要知識點,適合數(shù)據(jù)挖掘與機器學習入門讀者閱讀。

作者簡介

  張浩彬,數(shù)據(jù)分析/數(shù)據(jù)挖掘專家,目前任職于國際商業(yè)機器(中國)有限公司認知計算部門,曾張浩彬,人稱浩彬老撕,曾任IBM大中華區(qū)商業(yè)智能事業(yè)部SPSS分析工程師,認知解決方案事業(yè)部數(shù)據(jù)分析專家,現(xiàn)任廣東柯內特環(huán)境科技有限公司首席數(shù)據(jù)科學家,致力機器學習及SPSS技術分享,專注于人工智能技術與應用。

圖書目錄

第 1 章 數(shù)據(jù)挖掘那些事兒 \\ 1
1.1 當我們在談數(shù)據(jù)挖掘時,其實在討論什么 \\ 2
1.2 從 CRISP-DM 開啟數(shù)據(jù)挖掘實踐 \\ 7

第 2 章 數(shù)據(jù)挖掘之利器:SPSS Modeler \\ 17
2.1 SPSS Modeler 簡介 \\ 18
2.2 SPSS Modeler 的下載與安裝 \\ 21
2.3 SPSS Modeler 的主界面及基本操作 \\ 23
2.3.1 SPSS Modeler 主界面介紹 \\ 23
2.3.2 鼠標基本操作 \\ 31
2.4 將 SPSS Modeler 連接到服務器端 \\ 31

第 3 章 巧婦難為無米之炊:數(shù)據(jù),數(shù)據(jù)! \\ 34
3.1 數(shù)據(jù)的身份 \\ 35
3.1.1 變量的測量級別 \\ 35
3.1.2 變量的角色 \\ 36
3.2 數(shù)據(jù)的讀取 \\ 37
3.2.1 讀取 Excel 文件數(shù)據(jù) \\ 37
3.2.2 讀取變量文件數(shù)據(jù) \\ 38
3.2.3 讀取 SPSS Statistics(.sav)文件數(shù)據(jù) \\ 40
3.2.4 讀取數(shù)據(jù)庫數(shù)據(jù) \\ 42
3.3 數(shù)據(jù)的基本設定 \\ 45
3.3.1 變量角色的設定 \\ 45
3.3.2 字段的篩選及命名 \\ 46
3.4 數(shù)據(jù)的集成 \\ 47
3.4.1 數(shù)據(jù)的變量集成:合并節(jié)點 \\ 47
3.4.2 數(shù)據(jù)的記錄集成:追加節(jié)點 \\ 50

第 4 章 一點都不簡單的描述性統(tǒng)計分析 \\ 53
4.1 分類變量的基本分析: “矩陣”節(jié)點 \\ 54
4.2 連續(xù)變量的基本分析:數(shù)據(jù)審核節(jié)點 \\ 57
4.2.1 連續(xù)變量基本分析指標介紹 \\ 57
4.2.2 “數(shù)據(jù)審核”節(jié)點 \\ 63

第 5 章 何為足夠大的差異:常用的統(tǒng)計檢驗 \\ 67
5.1 假設檢驗 \\ 68
5.1.1 假設檢驗的基本原理 \\ 68
5.1.2 假設檢驗的一般步驟 \\ 69
5.2 連續(xù)變量與分類變量之間的關系: t 檢驗 \\ 70
5.2.1 兩組獨立樣本均值比較 \\ 71
5.2.2 兩組配對樣本均值比較 \\ 72
5.2.3 使用 t 檢驗的前提條件 \\ 73
5.2.4 案例:使用均值比較分析電信客戶的流失情況 \\ 73
5.3 兩個連續(xù)變量之間的關系:相關分析 \\ 75
5.3.1 相關分析理論 \\ 76
5.3.2 案例:使用相關分析研究居民消費水平與國內生產(chǎn)總值的相關關系 \\ 77
5.4 兩個分類變量之間的關系:卡方檢驗 \\ 80
5.4.1 卡方檢驗的原理 \\ 80
5.4.2 卡方檢驗的前提條件 \\ 82
5.4.3 案例:使用卡方檢驗研究兩個分類字段之間的關系 \\ 82

第 6 章 從身高和體重的關系談起:回歸分析 \\ 84
6.1 一元線性回歸分析 \\ 85
6.1.1 分析因變量與自變量的關系,構建回歸模型 \\ 85
6.1.2 估計模型系數(shù),求解回歸模型 \\ 87
6.1.3 對模型系數(shù)進行檢驗,確認模型有效性 \\ 88
6.1.4 擬合優(yōu)度檢驗,判斷模型解釋能力 \\ 89
6.1.5 借助回歸模型進行預測 \\ 90
6.2 多元線性回歸分析 \\ 90
6.2.1 估計模型系數(shù),求解回歸模型 \\ 91
6.2.2 對模型參數(shù)進行檢驗,確認模型有效性 \\ 92
6.2.3 擬合優(yōu)度檢驗,判斷模型解釋能力 \\ 94
6.2.4 模型的變量選擇 \\ 95
6.3 使用線性回歸分析的注意事項 \\ 97
6.4 案例:使用回歸分析研究影響房屋價格的重要因素 \\ 98

第 7 章 回歸豈止這么簡單:回歸模型的進一步擴展 \\ 102
7.1 曲線回歸 \\ 103
7.2 Logistic 回歸 \\ 110
7.2.1 Logistic 回歸理論 \\ 110
7.2.2 案例:使用 Logistic 回歸模型分析個人收入水平影響因素 \\ 112

第 8 章 模型評估那些事兒:過擬合與欠擬合 \\ 117
8.1 過擬合與欠擬合 \\ 118
8.2 留出法與交叉驗證 \\ 122
8.2.1 留出法與分層抽樣 \\ 122
8.2.2 交叉驗證 \\ 124

第 9 章 從看電影的思考到?jīng)Q策樹的生成 \\ 126
9.1 決策樹概述 \\ 127
9.2 決策樹生成 \\ 129
9.2.1 從 ID3 算法到 C5.0 算法 \\ 131
9.2.2 CART 算法 \\ 134
9.3 決策樹的剪枝 \\ 136
9.3.1 預剪枝策略 \\ 137
9.3.2 后剪枝策略 \\ 137
9.3.3 代價敏感學習 \\ 138
9.4 案例:用決策樹分析客戶違約情況 \\ 140
9.5 關于信息熵的擴展 \\ 147

第 10 章 人工神經(jīng)網(wǎng)絡:從人腦神經(jīng)元開始 \\ 151
10.1 從人腦神經(jīng)元到人工神經(jīng)網(wǎng)絡 \\ 152
10.2 感知機 \\ 154
10.3 人工神經(jīng)網(wǎng)絡 \\ 159
10.3.1 隱藏層的作用 \\ 159
10.3.2 人工神經(jīng)網(wǎng)絡算法 \\ 160
10.4 案例:利用人工神經(jīng)網(wǎng)絡分析某電信運營商的客戶流失情況 \\ 164

第 11 章 物以類聚,人以群分:聚類分析 \\ 172
11.1 聚類思想的概述 \\ 173
11.2 聚類方法的關鍵:距離 \\ 175
11.3 K-Means 算法 \\ 176
11.3.1 K-Means 算法原理 \\ 176
11.3.2 輪廓系數(shù)(Silhouette coefficient) \\ 177
11.4 案例:利用 K-Means 算法對不同型號汽車的屬性進行聚類分群研究 \\ 179

第 12 章 啤酒+尿布=關聯(lián)分析? \\ 186
12.1 一個關于關聯(lián)分析的傳說 \\ 187
12.2 關聯(lián)分析的基本概念 \\ 188
12.3 關聯(lián)規(guī)則的有效性指標 \\ 190
12.4 Apriori 算法 \\ 192
12.4.1 生成頻繁項集 \\ 193
12.4.2 生成關聯(lián)規(guī)則 \\ 195
12.5 案例:利用 Apriori 算法對顧客的個人信息及購買記錄進行關聯(lián)分析 \\ 195

第 13 章 三個臭皮匠,賽過諸葛亮:集成學習算法 \\ 199
13.1 集成學習算法概述 \\ 200
13.2 3 種不同的集成學習算法 \\ 201
13.2.1 Bagging 算法 \\ 201
13.2.2 Boosting 算法 \\ 203
13.2.3 隨機森林 \\ 204
13.3 集成學習算法實踐 \\ 205
13.3.1 Bagging 算法和 Boosting 算法 \\ 205
13.3.2 隨機森林 \\ 211
13.3.3 集成學習算法結果比較 \\ 214

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號