定 價(jià):¥59.00
作 者: | 黃翼 |
出版社: | 清華大學(xué)出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787302626046 | 出版時(shí)間: | 2023-05-01 | 包裝: | 平裝 |
開本: | 16開 | 頁數(shù): | 字?jǐn)?shù): |
第一部分 大數(shù)據(jù)基礎(chǔ)
第一章 大數(shù)據(jù)導(dǎo)論 3
一、什么是大數(shù)據(jù) 3
二、為何要做數(shù)據(jù)挖掘 5
三、數(shù)據(jù)分析的應(yīng)用 7
練習(xí)題 10
第二章 大數(shù)據(jù)技術(shù) 11
一、大數(shù)據(jù)的技術(shù)框架 11
二、與大數(shù)據(jù)處理相關(guān)的技術(shù) 12
三、數(shù)據(jù)挖掘的一般流程 14
練習(xí)題 16
第二部分 Python編程基礎(chǔ)
第三章 Python環(huán)境搭建 19
一、Python的版本與安裝 19
二、PyCharm的安裝與使用 23
三、Anaconda的安裝與使用 27
練習(xí)題 30
第四章 Python編程基礎(chǔ) 31
一、Python變量設(shè)定和賦值數(shù)據(jù)類型 31
二、Python的運(yùn)算符 38
三、控制流 42
四、常用函數(shù) 49
五、Python基礎(chǔ)語法 50
練習(xí)題 54
第五章 Python數(shù)據(jù)挖掘 55
一、NumPy模塊 55
二、Pandas模塊 68
練習(xí)題 106
第六章 Python數(shù)據(jù)可視化 107
一、數(shù)據(jù)可視化 107
二、Pandas繪圖 111
三、Matplotlib其他繪圖 120
練習(xí)題 123
第三部分 數(shù)據(jù)挖掘基礎(chǔ)
第七章 數(shù)據(jù)預(yù)處理 127
一、數(shù)據(jù)存在的問題 127
二、數(shù)據(jù)預(yù)處理的手段 129
練習(xí)題 138
第八章 多元線性回歸 139
一、介紹 139
二、解釋模型與預(yù)測模型 139
三、回歸方程的估計(jì)與預(yù)測 140
四、線性回歸中的變量選擇 141
練習(xí)題 143
第九章 K-NN算法 145
一、K-NN分類器(分類結(jié)果) 145
二、K-NN表示數(shù)值結(jié)果 147
三、K-NN算法的優(yōu)勢和劣勢 147
練習(xí)題 147
第十章 樸素貝葉斯分類器 149
一、介紹 149
二、使用完全(精確)貝葉斯分類器預(yù)測 150
三、樸素貝葉斯分類器的優(yōu)缺點(diǎn) 153
練習(xí)題 155
第十一章 分類回歸樹 156
一、介紹 156
二、分類樹 157
三、評(píng)估分類樹的性能 161
四、避免過度擬合 162
五、樹的分類規(guī)則 164
六、兩類以上的分類樹 164
七、回歸樹 165
八、改進(jìn)預(yù)測:隨機(jī)森林和增強(qiáng)樹 166
九、樹的優(yōu)點(diǎn)和缺點(diǎn) 167
練習(xí)題 167
第十二章 邏輯回歸 169
一、介紹 169
二、邏輯回歸模型 170
三、評(píng)估分類性能 172
四、變量的選擇 173
五、邏輯回歸分析 175
練習(xí)題 180
第十三章 神經(jīng)網(wǎng)絡(luò) 181
一、介紹 181
二、神經(jīng)網(wǎng)絡(luò)的概念與結(jié)構(gòu) 181
三、使網(wǎng)絡(luò)適應(yīng)數(shù)據(jù) 182
四、必需的輸入 188
五、預(yù)測因素與結(jié)果的關(guān)系探討 189
六、神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn) 190
練習(xí)題 191
第十四章 判別分析 192
一、介紹 192
二、記錄與類的距離 194
三、費(fèi)雪線性分類函數(shù) 195
四、判別分析的分類性能 195
五、先驗(yàn)概率 196
六、不均衡的錯(cuò)誤分類代價(jià) 196
七、超過兩類的分類問題 196
八、判別分析的優(yōu)勢與劣勢 198
練習(xí)題 198
第十五章 關(guān)聯(lián)規(guī)則與協(xié)同過濾 200
一、關(guān)聯(lián)規(guī)則 200
二、協(xié)同過濾 206
三、總結(jié) 212
練習(xí)題 212
第十六章 聚類分析 214
一、介紹 214
二、測量兩條記錄之間的距離 217
三、兩簇間距離測量 221
四、分層(凝聚)聚類 222
五、非層次聚類 226
練習(xí)題 228
第十七章 時(shí)間序列預(yù)測 230
一、介紹 230
二、描述性與預(yù)測性建模 231
三、商業(yè)中流行的預(yù)測方法 231
四、時(shí)間序列成分 231
五、數(shù)據(jù)分區(qū)和性能評(píng)估 234
練習(xí)題 236
第十八章 社交網(wǎng)絡(luò)分析 237
一、介紹 237
二、有向網(wǎng)絡(luò)與無向網(wǎng)絡(luò) 238
三、可視化和分析網(wǎng)絡(luò) 239
四、社交數(shù)據(jù)度量和分類 241
五、使用網(wǎng)絡(luò)指標(biāo)進(jìn)行預(yù)測和分類 244
六、優(yōu)點(diǎn)和缺點(diǎn) 248
練習(xí)題 249
第十九章 文本挖掘 250
一、介紹 250
二、文本的表格式表示:術(shù)語-文檔矩陣和“詞袋” 250
三、詞袋與文檔意義提取 251
四、文本預(yù)處理 252
五、實(shí)現(xiàn)數(shù)據(jù)挖掘方法 255
六、總結(jié) 258
練習(xí)題 258
第四部分 經(jīng)典商務(wù)數(shù)據(jù)分析案例
第二十章 國際應(yīng)用案例 261
案例一 銀行金融營銷 261
案例二 波士頓住房 262
案例三 電腦的選擇 262
案例四 DriveTime汽車 266
案例五 寶潔公司洗衣皂 270
案例六 Studenmund餐廳 271
案例七 悉尼交通 272
案例八 ToutBay 273
案例九 查爾斯讀書俱樂部 275
案例十 德國信貸 279
案例十一 Tayko軟件目錄 283
案例十二 拒接出租車電話 287
案例十三 肥皂消費(fèi)者細(xì)分 288
案例十四 交叉銷售 290
案例十五 預(yù)測破產(chǎn) 291
第二十一章 國內(nèi)應(yīng)用案例 294
案例一 終端換機(jī)預(yù)測 294
案例二 高校本科生就業(yè)問題研究 296
案例三 國內(nèi)旅游收入影響因素研究 300
案例四 航空公司客戶價(jià)值分析 301
案例五 數(shù)據(jù)分析的其他商務(wù)應(yīng)用 304
參考文獻(xiàn) 309