注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)

零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)

零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)

定 價:¥69.00

作 者: 王國平 著
出版社: 清華大學(xué)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302589174 出版時間: 2021-10-01 包裝: 平裝
開本: 16開 頁數(shù): 257 字數(shù):  

內(nèi)容簡介

  《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》由一線的資深數(shù)據(jù)分析師精寫,以新版Python3.10作為數(shù)據(jù)分析與挖掘的編程語言,循序漸進地介紹了Python數(shù)據(jù)分析的方法與技巧以及機器學(xué)習(xí)算法及其應(yīng)用案例。《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》首先講解Python基礎(chǔ)語法,以便于從未接觸過編程的讀者能夠快速上手,然后介紹了當前流行的常用數(shù)據(jù)分析工具,如數(shù)值計算工具NumPy、數(shù)據(jù)處理工具Pandas、數(shù)據(jù)可視化工具Matplotlib和數(shù)據(jù)挖掘工具Sklearn等,最后介紹了10大常用機器學(xué)習(xí)算法及其在數(shù)據(jù)挖掘中的應(yīng)用,針對每一個算法均給出了案例實現(xiàn),以便于讀者能夠?qū)W有所用?!读慊A(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》凝聚編者十余年工作心得,以豐富實例介紹理論知識,并給出大量應(yīng)用實踐,很適合初入數(shù)據(jù)分析職場的從業(yè)者提升技能,《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》也可以作為統(tǒng)計學(xué)、數(shù)學(xué)、經(jīng)濟學(xué)、金融學(xué)、管理學(xué)以及相關(guān)理工科專業(yè)的本科生、研究生的教學(xué)參考書?!读慊A(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》特點:零基礎(chǔ)入手,精心設(shè)計的知識體系:《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》首先介紹Python3.10版本的基礎(chǔ)語法,并針對初學(xué)者構(gòu)建數(shù)據(jù)分析與機器學(xué)習(xí)的實驗環(huán)境,以便初學(xué)者無障礙上手。全書內(nèi)容循序漸進,在精要介紹基礎(chǔ)語法之后,還介紹了當前流行的數(shù)據(jù)分析工具,最后介紹了機器學(xué)習(xí)算法在數(shù)據(jù)分析和挖掘中的應(yīng)用。讀者通過閱讀《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》能夠整體上掌握數(shù)據(jù)分析的重要方法、工具與技術(shù)。全面介紹流行工具的使用,應(yīng)對工作需求:《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》針對當前流行的數(shù)據(jù)分析工具分章介紹,包括數(shù)值計算工具NumPy、數(shù)據(jù)處理工具Pandas、數(shù)據(jù)可視化工具Matplotlib、數(shù)據(jù)建模工具Sklearn等。每一個工具都從基礎(chǔ)講起,并輔之以案例演示,讀者可以邊學(xué)邊練,快速掌握技能,其中很多案例都來自于工作實踐,可以真正提升讀者的實戰(zhàn)技能,以應(yīng)對工作需求。詳細講解10大機器學(xué)習(xí)算法,并輔之以豐富的案例:《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》針對數(shù)據(jù)挖掘中經(jīng)常使用的算法進行了詳細的介紹,其中每一個算法首先介紹理論知識,然后給出算法在實際案例中的應(yīng)用,理論與實踐并重,可以幫助讀者真正理解算法并加以應(yīng)用,從而提升讀者數(shù)據(jù)分析和挖掘的綜合能力。配書資源豐富,大幅提升學(xué)習(xí)效率:為了方便讀者輕松、高效地學(xué)習(xí)《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》內(nèi)容,作者還為《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》錄制了全程教學(xué)視頻,針對各章內(nèi)容進行了詳細的講解,讀者掃描《零基礎(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》提供的二維碼即可隨時隨地觀看,大幅提升學(xué)習(xí)效率?!读慊A(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》還提供了全部實例的源代碼,所有源代碼均在Python3.10和相應(yīng)編程工具環(huán)境下測試通過,讀者下載后可以直接調(diào)用,以方便上機演練?!读慊A(chǔ)入門Python數(shù)據(jù)分析與機器學(xué)習(xí)》還制作了精彩的PPT課件,旨在方便有教學(xué)需求的讀者使用。

作者簡介

  王國平,畢業(yè)于上海海洋大學(xué),碩士,從業(yè)十余年,主要從事數(shù)據(jù)可視化、數(shù)據(jù)挖掘和大數(shù)據(jù)分析與研究等工作。精通Tableau.SPss、SPSS Modeler、Power BI等軟件,已出版《IBM SPSS Modeler數(shù)據(jù)與文本挖掘?qū)崙?zhàn)》《Microsoft Power BI數(shù)據(jù)可視化與數(shù)據(jù)分析》《Tableau數(shù)據(jù)可視化從入門到精通》《SPSS統(tǒng)計分析與行業(yè)應(yīng)用實戰(zhàn)》等專著。

圖書目錄

目 錄
第1章 構(gòu)建數(shù)據(jù)分析開發(fā)環(huán)境 1
1.1 數(shù)據(jù)分析概述 1
1.1.1 為什么要進行數(shù)據(jù)分析 1
1.1.2 數(shù)據(jù)分析的流程與思維 2
1.2 開發(fā)環(huán)境的構(gòu)建 4
1.2.1 安裝Anaconda 5
1.2.2 安裝Jupyter庫 6
1.2.3 安裝PyCharm社區(qū)版 8
1.2.4 包管理工具 11
1.2.5 環(huán)境測試 12
1.3 必會的Python數(shù)據(jù)分析包 12
1.3.1 NumPy數(shù)組操作 13
1.3.2 Pandas數(shù)據(jù)清洗 13
1.3.3 Matplotlib數(shù)據(jù)可視化 14
1.3.4 Sklearn數(shù)據(jù)建模 16
1.4 一個簡單的數(shù)據(jù)分析案例 17
1.5 小結(jié)與課后練習(xí) 19
第2章 Python核心基礎(chǔ) 20
2.1 Python數(shù)據(jù)類型 20
2.1.1 數(shù)值類型 20
2.1.2 字符串類型 21
2.1.3 列表類型 23
2.1.4 元組類型 24
2.1.5 集合類型 25
2.1.6 字典類型 27
2.2 Python基礎(chǔ)語法 28
2.2.1 代碼行與縮進 28
2.2.2 條件if及if嵌套 29
2.2.3 循環(huán):while與for 30
2.2.4 格式化:format()與% 32
2.3 Python高階函數(shù) 34
2.3.1 map()函數(shù) 34
2.3.2 reduce()函數(shù) 35
2.3.3 filter()函數(shù) 36
2.3.4 sorted()函數(shù) 36
2.4 Python編程技巧 37
2.4.1 自動補全程序 37
2.4.2 變量值的互換 38
2.4.3 列表解析式 39
2.4.4 元素序列解包 40
2.5 小結(jié)與課后練習(xí) 41
第3章 Python數(shù)據(jù)分析基礎(chǔ) 42
3.1 數(shù)據(jù)的讀取 42
3.1.1 本地離線數(shù)據(jù) 42
3.1.2 Web在線數(shù)據(jù) 44
3.1.3 常用數(shù)據(jù)庫數(shù)據(jù) 45
3.2 數(shù)據(jù)的索引 46
3.2.1 創(chuàng)建與查看索引 46
3.2.2 索引重構(gòu)與恢復(fù) 48
3.2.3 索引調(diào)整與排序 49
3.3 數(shù)據(jù)的切片 49
3.3.1 提取多列數(shù)據(jù) 50
3.3.2 提取多行數(shù)據(jù) 51
3.3.3 提取區(qū)域數(shù)據(jù) 51
3.4 數(shù)據(jù)的聚合 52
3.4.1 指定列數(shù)據(jù)統(tǒng)計 52
3.4.2 多字段分組統(tǒng)計 53
3.4.3 自定義聚合指標 54
3.5 小結(jié)與課后練習(xí) 55
第4章 NumPy數(shù)組操作 56
4.1 NumPy索引與切片 56
4.1.1 數(shù)組的索引 56
4.1.2 布爾型索引 57
4.1.3 花式索引 59
4.1.4 數(shù)組的切片 60
4.1.5 設(shè)置切片步長 61
4.2 NumPy維數(shù)變換 62
4.2.1 reshape()函數(shù) 62
4.2.2 shape()函數(shù) 63
4.2.3 resize()函數(shù) 64
4.2.4 ravel()函數(shù) 65
4.2.5 flatten()函數(shù) 66
4.3 NumPy廣播機制 67
4.3.1 廣播 67
4.3.2 廣播機制 68
4.3.3 廣播機制變化過程 69
4.3.4 廣播不兼容 70
4.4 NumPy矩陣運算 72
4.4.1 矩陣概述 72
4.4.2 矩陣的乘法 74
4.4.3 矩陣的內(nèi)積 74
4.4.4 矩陣的外積 75
4.5 小結(jié)與課后練習(xí) 77
第5章 Pandas數(shù)據(jù)清洗 78
5.1 重復(fù)值檢測與處理 78
5.1.1 重復(fù)值的檢測 78
5.1.2 重復(fù)值的處理 79
5.2 缺失值檢測與處理 80
5.2.1 缺失值的檢測 81
5.2.2 缺失值的處理 81
5.3 異常值檢測與處理 84
5.3.1 異常值的檢測 85
5.3.2 異常值的處理 86
5.4 金融數(shù)據(jù)的處理實戰(zhàn) 87
5.4.1 讀取上證指數(shù)數(shù)據(jù) 87
5.4.2 提取特定日期數(shù)據(jù) 88
5.4.3 填充非交易日數(shù)據(jù) 89
5.5 小結(jié)與課后練習(xí) 90
第6章 Matplotlib數(shù)據(jù)可視化 91
6.1 圖形參數(shù)設(shè)置 91
6.1.1 設(shè)置圖形線條 91
6.1.2 設(shè)置圖形坐標軸 94
6.1.3 設(shè)置圖形圖例 97
6.2 繪圖參數(shù)文件及主要函數(shù) 99
6.2.1 修改繪圖參數(shù)文件 99
6.2.2 主要繪圖函數(shù)簡介 100
6.2.3 繪圖函數(shù)應(yīng)用案例——分析某企業(yè)2020年銷售額增長情況 101
6.3 Matplotlib圖形整合 102
6.3.1 subplot()函數(shù) 103
6.3.2 subplots()函數(shù) 104
6.3.3 圖形整合實戰(zhàn)——分析2020年某企業(yè)產(chǎn)品銷售的區(qū)域差異性 105
6.4 Matplotlib可視化案例 107
6.4.1 商品區(qū)域銷售額條形圖 107
6.4.2 商品每周利潤率折線圖 110
6.4.3 商品利潤貢獻率餅圖 112
6.5 小結(jié)與課后練習(xí) 114
第7章 Scikit-Learn機器學(xué)習(xí) 116
7.1 機器學(xué)習(xí)及其類型 116
7.1.1 機器學(xué)習(xí)的特點 116
7.1.2 機器學(xué)習(xí)的分類 117
7.1.3 機器學(xué)習(xí)的應(yīng)用 119
7.2 Sklearn機器學(xué)習(xí)概述 120
7.2.1 Sklearn的基本概念 120
7.2.2 Sklearn的主要算法 121
7.2.3 選擇合適的算法 124
7.3 Sklearn機器學(xué)習(xí)流程 125
7.3.1 獲取數(shù)據(jù) 126
7.3.2 預(yù)處理數(shù)據(jù) 126
7.3.3 訓(xùn)練模型 127
7.3.4 評估模型 128
7.3.5 優(yōu)化模型 128
7.3.6 應(yīng)用模型 129
7.4 Sklearn自帶的數(shù)據(jù)集 129
7.4.1 鳶尾花數(shù)據(jù)集簡介 129
7.4.2 乳腺癌數(shù)據(jù)集簡介 131
7.4.3 波士頓房價數(shù)據(jù)集簡介 132
7.4.4 糖尿病數(shù)據(jù)集簡介 133
7.4.5 手寫數(shù)字數(shù)據(jù)集簡介 134
7.4.6 紅酒數(shù)據(jù)集簡介 135
7.5 小結(jié)與課后練習(xí) 136
第8章 監(jiān)督式機器學(xué)習(xí) 137
8.1 線性回歸及其案例 137
8.1.1 線性回歸簡介 137
8.1.2 線性回歸的建模 138
8.1.3 汽車價格的預(yù)測 141
8.2 邏輯回歸及其案例 145
8.2.1 邏輯回歸簡介 146
8.2.2 邏輯回歸的建模 146
8.2.3 客戶收入的預(yù)測 147
8.3 Lasso回歸與Ridge回歸 151
8.3.1 Lasso回歸及案例 151
8.3.2 Ridge回歸及案例 153
8.3.3 兩種回歸的比較 154
8.4 決策樹及其案例 155
8.4.1 決策樹簡介 155
8.4.2 決策樹的建模 158
8.4.3 蘑菇類型的預(yù)測 159
8.5 K近鄰算法及其案例 166
8.5.1 K近鄰算法簡介 166
8.5.2 K近鄰算法的建模 166
8.5.3 乳腺癌患者的分類 168
8.6 支持向量機及其案例 169
8.6.1 支持向量機簡介 169
8.6.2 支持向量機的建模 170
8.6.3 乳腺癌患者的分類 172
8.7 小結(jié)與課后練習(xí) 174
第9章 無監(jiān)督式機器學(xué)習(xí) 175
9.1 聚類分析及其案例 175
9.1.1 K均值聚類算法及案例 175
9.1.2 使用手肘法判斷聚類數(shù) 180
9.1.3 輪廓系數(shù)法判斷聚類數(shù) 181
9.2 因子分析及其案例 185
9.2.1 因子分析概述 185
9.2.2 因子分析的建模 186
9.2.3 地區(qū)競爭力的因子分析 187
9.3 主成分分析及其案例 193
9.3.1 主成分分析概述 193
9.3.2 主成分分析的建模 194
9.3.3 乳腺癌患者的主成分分析 195
9.4 關(guān)聯(lián)分析及其案例 198
9.4.1 關(guān)聯(lián)分析概述 198
9.4.2 關(guān)聯(lián)分析的建模 199
9.4.3 電商商品購物籃分析 200
9.5 離群點檢測及其案例 203
9.5.1 離群點檢測概述 203
9.5.2 橢圓模型擬合及案例 204
9.5.3 局部離群因子及案例 207
9.6 雙聚類分析及其案例 211
9.6.1 雙聚類分析概述 211
9.6.2 聯(lián)合譜聚類及案例 211
9.6.3 譜雙聚類及案例 213
9.7 小結(jié)與課后練習(xí) 216
第10章 模型評估與調(diào)優(yōu) 217
10.1 機器學(xué)習(xí)的挑戰(zhàn) 217
10.2 模型的評估方法 219
10.3 模型的調(diào)優(yōu)方法 231
10.4 小結(jié)與課后練習(xí) 236
第11章 Python中文文本分析 237
11.1 中文結(jié)巴分詞 237
11.2 中文關(guān)鍵詞提取 240
11.3 中文詞向量生成 242
11.4 中文情感分析 245
11.5 小結(jié)與課后練習(xí) 249
附錄A Python 3.10.0及第三方庫安裝 250
附錄B Python常用第三方工具包簡介 254

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號