注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡軟件與程序設計Python機器學習及實踐:從零開始通往Kaggle競賽之路(2022年度版)

Python機器學習及實踐:從零開始通往Kaggle競賽之路(2022年度版)

Python機器學習及實踐:從零開始通往Kaggle競賽之路(2022年度版)

定 價:¥99.00

作 者: 范淼、徐晟桐
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

購買這本書可以去


ISBN: 9787302614241 出版時間: 2022-10-01 包裝: 平裝-膠訂
開本: 16開 頁數: 字數:  

內容簡介

  本書在不涉及大量數學模型與復雜編程知識的前提下,從零開始逐步帶領讀者熟悉并掌握當下流行的基于Python 3的數據分析,以及支持單機、深度和分布式機器學習的開源程序庫,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全書分4部分。入門篇包括對全書核心概念的指南性介紹,以及在多種主流操作系統(tǒng)(Windows、macOS、Ubuntu)上配置基本編程環(huán)境的詳細說明?;A篇涵蓋Python 3的編程基礎、基于pandas的數據分析,以及使用Scikitlearn解決大量經典的單機(單核/多核)機器學習問題。進階篇介紹如何使用PyTorch、TensorFlow、PaddlePaddle搭建多種深度學習網絡框架,以及如何基于PySpark的ML編程庫完成一些常見的分布式機器學習任務。實踐篇利用全書所講授的Python編程、數據分析、機器學習知識,幫助讀者挑戰(zhàn)和參與Kaggle多種類型的競賽實戰(zhàn),同時介紹如何使用Git在Gitee、GitHub平臺上維護和管理日常代碼與編程項目。 本書適合所有對人工智能領域,特別是機器學習、數據挖掘、自然語言處理等技術及其實踐感興趣的初學者。

作者簡介

暫缺《Python機器學習及實踐:從零開始通往Kaggle競賽之路(2022年度版)》作者簡介

圖書目錄

第1部分  入門篇
第1章  全書指南3
1.1Python編程3
1.2數據分析5
1.3機器學習6
1.3.1任務9
1.3.2經驗10
1.3.3性能11
1.4Kaggle競賽13
1.5Git代碼管理14
1.6章  末小結15
第2章  基本環(huán)境搭建與配置16
2.1Windows操作系統(tǒng)下基本環(huán)境的搭建與配置16
2.1.1查看Windows的版本與原始配置16
2.1.2下載并安裝Anaconda3(Windows)17
2.1.3使用Anaconda Navigator創(chuàng)建虛擬環(huán)境python_env(Windows)19
2.1.4在虛擬環(huán)境python_env下使用Anaconda Navigator安裝
Jupyter Notebook與PyCharm Professional(Windows)20
2.2macOS操作系統(tǒng)下基本環(huán)境的搭建與配置21
2.2.1查看macOS的版本與原始配置21
2.2.2下載并安裝Anaconda3(macOS)23
2.2.3使用Anaconda Navigator創(chuàng)建虛擬環(huán)境python_env(macOS)24
2.2.4在虛擬環(huán)境python_env下使用Anaconda Navigator安裝
Jupyter Notebook與PyCharm Professional(macOS)24〖1〗Python機器學習及實踐——從零開始通往Kaggle競賽之路(2022年度版)〖1〗目錄2.3Ubuntu操作系統(tǒng)下基本環(huán)境的搭建與配置26
2.3.1查看Ubuntu的版本與原始配置26
2.3.2下載并安裝Anaconda3(Ubuntu)27
2.3.3在終端中創(chuàng)建虛擬環(huán)境python_env(Ubuntu)28
2.3.4在虛擬環(huán)境python_env下使用conda命令安裝Jupyter 
Notebook(Ubuntu)29
2.4Jupyter Notebook使用簡介31
2.4.1在虛擬環(huán)境python_env下啟動Jupyter Notebook31
2.4.2創(chuàng)建一個.ipynb文件32
2.4.3試運行.ipynb文件內的Python 3程序33
2.5PyCharm使用簡介34
2.5.1在虛擬環(huán)境python_env下啟動PyCharm34
2.5.2基于虛擬環(huán)境python_env的Python 3.8解釋器創(chuàng)建一個
.py文件35
2.5.3試運行.py文件內的Python 3程序35
2.6章  末小結37
第2部分  基礎篇
第3章  Python編程基礎41
3.1Python編程環(huán)境配置41
3.1.1基于命令行/終端的交互式編程環(huán)境41
3.1.2基于Web的交互式開發(fā)環(huán)境42
3.1.3集成式開發(fā)環(huán)境43
3.2Python基本語法44
3.2.1賦值44
3.2.2注釋45
3.2.3縮進46
3.3Python數據類型46
3.4Python數據運算49
3.5Python流程控制53
3.5.1分支語句53
3.5.2循環(huán)控制55
3.6Python函數設計56
3.7Python面向對象編程57
3.8Python編程庫(包)導入60
3.9Python編程綜合實踐62
3.10章  末小結63
第4章  pandas數據分析64
4.1pandas環(huán)境配置65
4.1.1使用Anaconda Navigator搭建和配置環(huán)境66
4.1.2使用conda命令搭建和配置環(huán)境66
4.2pandas核心數據結構67
4.2.1Series68
4.2.2DataFrame69
4.3pandas讀取/寫入文件數據70
4.3.1讀取/寫入CSV文件數據70
4.3.2讀取/寫入JSON文件數據73
4.3.3讀取/寫入Excel文件數據76
4.4pandas數據分析的常用功能80
4.4.1添加數據80
4.4.2刪除數據83
4.4.3查詢/篩選數據84
4.4.4修改數據86
4.4.5數據統(tǒng)計87
4.4.6數據排序89
4.4.7函數應用90
4.5pandas數據合并92
4.6pandas數據清洗93
4.7pandas數據分組與聚合95
4.8章  末小結97
第5章  Scikitlearn單機機器學習98
5.1Scikitlearn環(huán)境配置99
5.1.1使用Anaconda Navigator搭建和配置環(huán)境100
5.1.2使用conda命令搭建和配置環(huán)境100
5.2Scikitlearn無監(jiān)督學習102
5.2.1降維學習與可視化102
5.2.2聚類算法113
5.3Scikitlearn監(jiān)督學習模型121
5.3.1分類預測121
5.3.2數值回歸141
5.4Scikitlearn半監(jiān)督學習模型154
5.4.1自學習框架155
5.4.2標簽傳播算法157
5.5單機機器學習模型的常用優(yōu)化技巧159
5.5.1交叉驗證160
5.5.2特征工程162
5.5.3參數正則化170
5.5.4超參數尋優(yōu)174
5.5.5并行加速訓練176
5.6章  末小結179
第3部分  進階篇
第6章  PyTorch/TensorFlow/PaddlePaddle深度學習185
6.1PyTorch/TensorFlow/PaddlePaddle環(huán)境配置187
6.2前饋神經網絡191
6.2.1前饋神經網絡的PyTorch實踐192
6.2.2前饋神經網絡的TensorFlow實踐197
6.2.3前饋神經網絡的PaddlePaddle實踐199
6.3卷積神經網絡202
6.3.1卷積神經網絡的PyTorch實踐204
6.3.2卷積神經網絡的TensorFlow實踐208
6.3.3卷積神經網絡的PaddlePaddle實踐211
6.4循環(huán)神經網絡214
6.4.1循環(huán)神經網絡的PyTorch實踐216
6.4.2循環(huán)神經網絡的TensorFlow實踐220
6.4.3循環(huán)神經網絡的PaddlePaddle實踐222
6.5自動編碼器226
6.5.1自動編碼器的PyTorch實踐227
6.5.2自動編碼器的TensorFlow實踐231
6.5.3自動編碼器的PaddlePaddle實踐234
6.6神經網絡模型的常用優(yōu)化技巧238
6.6.1隨機失活238
6.6.2批量標準化249
6.7章  末小結260
第7章  PySparkML分布式機器學習262
7.1PySpark環(huán)境配置264
7.1.1使用Anaconda Navigator搭建和配置環(huán)境264
7.1.2使用conda命令搭建和配置環(huán)境265
7.1.3安裝JRE267
7.2PySpark分布式數據結構268
7.2.1RDD269
7.2.2DataFrame271
7.3PySpark分布式特征工程273
7.3.1特征抽取273
7.3.2特征轉換279
7.4PySparkML分布式機器學習模型284
7.5分布式機器學習模型的常用優(yōu)化技巧292
7.5.1留一驗證293
7.5.2K折交叉驗證295
7.6章  末小結297
第4部分  實踐篇
第8章  Kaggle競賽實踐301
8.1泰坦尼克號罹難乘客預測302
8.1.1數據分析303
8.1.2數據預處理305
8.1.3模型設計與尋優(yōu)306
8.1.4提交測試307
8.2Ames房產價值評估308
8.2.1數據分析309
8.2.2數據預處理315
8.2.3模型設計與尋優(yōu)316
8.2.4提交測試317
8.3推特短文本分類318
8.3.1數據分析320
8.3.2數據預處理321
8.3.3模型設計與尋優(yōu)322
8.3.4提交測試323
8.4CIFAR100圖像識別324
8.4.1數據分析326
8.4.2數據預處理327
8.4.3模型設計與尋優(yōu)328
8.4.4提交測試331
8.5章  末小結333
第9章  Git代碼管理334
9.1Git本地環(huán)境搭建335
9.1.1Windows下Git工具的安裝與配置335
9.1.2macOS下Git工具的安裝與配置336
9.1.3Ubuntu下Git工具的安裝與配置336
9.2Git遠程倉庫配置337
9.2.1GitHub介紹337
9.2.2GitHub遠程倉庫的創(chuàng)建與配置338
9.2.3Gitee介紹339
9.2.4Gitee遠程倉庫的創(chuàng)建與配置339
9.3Git基本指令340
9.3.1克隆倉庫340
9.3.2提交修改341
9.3.3遠程推送343
9.4Git分支管理343
9.4.1創(chuàng)建分支344
9.4.2分支合并345
9.4.3合并沖突346
9.4.4刪除分支347
9.5貢獻Git項目348
9.5.1Fork項目348
9.5.2本地克隆、修改與推送349
9.5.3發(fā)起拉取請求349
9.6章  末小結351
后記352
第1章  簡介篇1
1.1機器學習綜述1
1.1.1任務3
1.1.2經驗5
1.1.3性能5
1.2Python編程庫8
1.2.1為什么使用Python8
1.2.2Python機器學習的優(yōu)勢9
1.2.3NumPy & SciPy10
1.2.4Matplotlib11
1.2.5Scikitlearn11
1.2.6Pandas11
1.2.7Anaconda12
1.3Python環(huán)境配置12
1.3.1Windows系統(tǒng)環(huán)境12
1.3.2Mac OS 系統(tǒng)環(huán)境17
1.4Python編程基礎18
1.4.1Python基本語法19
1.4.2Python 數據類型20
1.4.3Python 數據運算22
1.4.4Python 流程控制26
1.4.5Python 函數(模塊)設計28
1.4.6Python 編程庫(包)的導入29
1.4.7Python 基礎綜合實踐30
1.5章  末小結33第2章  基礎篇34
2.1監(jiān)督學習經典模型34
2.1.1分類學習35
2.1.2回歸預測64
2.2無監(jiān)督學習經典模型81
2.2.1數據聚類81
2.2.2特征降維91
2.3章  末小結97
第3章  進階篇98
3.1模型實用技巧98
3.1.1特征提升99
3.1.2模型正則化111
3.1.3模型檢驗121
3.1.4超參數搜索122
3.2流行庫/模型實踐129
3.2.1自然語言處理包(NLTK)131
3.2.2詞向量(Word2Vec)技術133
3.2.3XGBoost模型138
3.2.4Tensorflow框架140
3.3章  末小結152
第4章  實戰(zhàn)篇153
4.1Kaggle平臺簡介153
4.2Titanic罹難乘客預測157
4.3IMDB影評得分估計165
4.4MNIST手寫體數字圖片識別174
4.5章  末小結180
后記181
參考文獻182

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號