Python機器學習案例教程（原書第2版）

定　價：￥89.00

作　者：	劉宇熙（Yuxi,Liu）
出版社：	機械工業(yè)出版社
叢編項：
標　簽：	暫缺

購買這本書可以去

ISBN：	9787111677109	出版時間：	2021-05-01	包裝：
開本：	16開	頁數(shù)：	233	字數(shù)：

內(nèi)容簡介

　　本書包括3部分：第1部分介紹機器學習的基本概念，它們是機器學習的預備知識；第2部分系統(tǒng)介紹幾種成熟的機器學習算法和技術；第3部分介紹貫穿整個機器學習工作流程的21個*佳案例，并且討論具有前瞻性的方法和想法，它們被公認為是機器學習未來的研究重點。本書中的代碼均在Python 3中測試通過。本書適合高等院校相關專業(yè)的大學生、研究生或教師閱讀學習，以及不具有機器學習或統(tǒng)計背景但是想要快速補充機器學習算法知識，以便在實際產(chǎn)品或平臺中應用的軟件工程師。 Copyright  Packt Publishing 2019 First published in the English language under the title“Python Machine Learning By Example-Second Edition-（9781789616729）” Copyright in the Chinese language（simplified characters） 2021 China Machine Press This title is published in China by China Machine Press with license from Packt Publishing LtdThis edition is authorized for sale in China only， excluding Hong Kong SAR， Macao SAR and TaiwanUnauthorized export of this edition is a violation of the Copyright ActViolation of this Law is subject to Civil and Criminal Penalties 本書由Packt Publishing Ltd授權機械工業(yè)出版社在中華人民共和國境內(nèi)（不包括香港、澳門特別行政區(qū)及臺灣地區(qū)）出版與發(fā)行。未經(jīng)許可的出口，視為違反著作權法，將受法律制裁。北京市版權局著作權合同登記圖字：01-2019-5823號。

作者簡介

暫缺《Python機器學習案例教程（原書第2版）》作者簡介

圖書目錄

譯者序

前言

第1部分機器學習的基礎

第1章機器學習和Python入門

11超高水平的機器學習技術概述

111機器學習任務的分類

112機器學習算法的發(fā)展簡史

12機器學習的核心——數(shù)據(jù)泛化

121過擬合、欠擬合和偏差-方差權衡

122利用交叉驗證避免過擬合

123利用正則化避免過擬合

124通過特征選擇和降維避免過擬合

13預處理、探索和特征工程

131缺失值

132標簽編碼

133獨熱編碼

134縮放

135多項式特征

136冪變換

137分箱

14組合模型

141投票法和平均法

142裝袋法

143提升方法

144堆疊法

15安裝軟件和設置

151設置Python和環(huán)境

152安裝各種軟件包

本章小結

習題

第2部分Python機器學習實例

第2章使用文本分析技術研究20組新聞數(shù)據(jù)集

21計算機如何理解語言——NLP

22瀏覽NLP庫并學習NLP基礎知識

221語料庫

222標記

223詞性

224命名實體識別

225詞干提取和詞形還原

226語義和主題建模

23獲取新聞組數(shù)據(jù)

24研究新聞組數(shù)據(jù)

25考慮文本數(shù)據(jù)的特性

251計算每個單詞表征的出現(xiàn)次數(shù)

252文本預處理

253丟棄停止詞

254詞干提取和詞形還原法

26使用t-SNE可視化新聞組數(shù)據(jù)

261什么是降維

262用于降維的t-SNE

本章小結

習題

第3章使用聚類和主題建模算法挖掘20組新聞數(shù)據(jù)集

31沒有指導的學習——無監(jiān)督學習

32使用k均值聚類算法對新聞數(shù)據(jù)集進行聚類

321k均值聚類算法是如何聚類的?

322從頭實現(xiàn)k均值聚類算法

323用機器學習實現(xiàn)k均值聚類算法

324k值的選擇

325使用k均值聚類新聞組數(shù)據(jù)

33在新聞組中發(fā)現(xiàn)基礎主題

34使用NMF進行主題建模

35使用LDA進行主題建模

本章小結

習題

第4章使用樸素貝葉斯檢測垃圾郵件

41從分類開始

411分類算法的類型

412文本分類的應用

42探索樸素貝葉斯

421通過案例來學習貝葉斯定理

422樸素貝葉斯的結構

423運用scratch庫實現(xiàn)樸素貝葉斯分類器

424運用scikit-learn庫實現(xiàn)樸素貝葉斯分類器

43分類性能評估

44模型調(diào)優(yōu)和交叉驗證

本章小結

習題

第5章使用支持向量機對新聞組主題進行分類

51用支持向量機尋找分離邊界

511通過不同的示例了解支持向量機如何工作

512實現(xiàn)支持向量機

513支持向量機的核心

514在線性核和RBF核之間進行選擇

52使用支持向量機對新聞組主題進行分類

53更多示例——心臟造影的胎兒狀態(tài)分類

54另一個示例——使用TensorFlow完成基于支持向量機的乳腺癌分類

本章小結

習題

第6章使用基于樹的算法預測在線廣告點擊率

61廣告點擊率預測概述

62兩種類型數(shù)據(jù)：數(shù)值型和分類型

63從根到葉探索決策樹

631構建決策樹

632衡量分裂的標準

64從頭實現(xiàn)決策樹

65用決策樹預測廣告點擊率

66集成決策樹——隨機森林

661使用TensorFlow實現(xiàn)隨機森林

本章小結

習題

第7章使用邏輯回歸預測在線廣告點擊率

71將分類特征轉換為數(shù)字特征——獨熱編碼和順序編碼

72用邏輯回歸對數(shù)據(jù)進行分類

721邏輯函數(shù)入門

722從邏輯函數(shù)到邏輯回歸

73訓練邏輯回歸模型

731利用梯度下降訓練邏輯回歸模型

732利用梯度下降的邏輯回歸模型預測在線廣告點擊率

733利用隨機梯度下降訓練邏輯回歸模型

734利用正則化訓練邏輯回歸模型

74通過在線學習訓練大型數(shù)據(jù)集

75處理多元分類

76使用TensorFlow實現(xiàn)邏輯回歸

77使用隨機森林進行特征選擇

本章小結

習題

第8章將預測擴展到TB級點擊日志

81學習Apache Spark的基本知識

811了解 Spark

812安裝Spark

813啟動和部署Spark程序

82在PySpark中編程

83使用Spark學習大量點擊日志

831加載點擊日志

832拆分和緩存數(shù)據(jù)

833對分類特征進行獨熱編碼

834訓練和測試邏輯回歸模型

84使用Spark對分類變量進行特征工程

841散列分類特征

842組合多個變量——特征交互

本章小結

習題

第9章使用回歸算法預測股票價格

91有關股票市場和股票價格的簡要概述

92什么是回歸

93獲取股價數(shù)據(jù)

931開始特征工程

932獲取數(shù)據(jù)并生成特征

94使用線性回歸來估計

941線性回歸是如何工作的

942實現(xiàn)線性回歸

95使用回歸樹進行預測

951從分類樹到回歸樹

952實現(xiàn)回歸樹

953實現(xiàn)隨機森林

96用支持向量回歸機進行評估

961實現(xiàn)支持向量回歸機

97用神經(jīng)網(wǎng)絡進行估算

971揭開神經(jīng)網(wǎng)絡的神秘面紗

972實現(xiàn)神經(jīng)網(wǎng)絡

98評估回歸性能

99使用四種回歸算法預測股票價格

本章小結

習題

第3部分Python機器學習最佳案例

第10章機器學習最佳案例

101機器學習解決方案流程

102數(shù)據(jù)準備階段的最佳案例

1021最佳案例1——完全理解項目目標

1022最佳案例2——收集所有相關的特征

1023最佳案例3——保持特征值的一致性

1024最佳案例4——處理缺失數(shù)據(jù)

1025最佳案例5——存儲大規(guī)模數(shù)據(jù)

103訓練集生成階段的最佳案例

1031最佳案例6——區(qū)分分類型特征與數(shù)值型特征

1032最佳案例7——決定是否要對分類型特征進行編碼

1033最佳案例8——決定是否要選擇特征和如何選擇

1034最佳案例9——決定是否要降維和如何降維

1035最佳案例10——決定是否重新調(diào)整特征取值

1036最佳案例11——在擁有專業(yè)知識的條件下進行特征工程

1037最佳案例12——在缺少專業(yè)知識的條件下進行特征工程

1038最佳案例13——記錄每個特征是如何生成的

1039最佳案例14——從文本數(shù)據(jù)中提取特征

104模型訓練、評估和選擇階段的最佳案例

1041最佳案例15——選擇合適的起步算法

1042最佳案例16——減少過擬合

1043最佳案例17——識別過擬合與欠擬合

1044最佳案例18——在大型數(shù)據(jù)集上建模

105部署和監(jiān)視階段的最佳案例

1051最佳案例19——保存、加載和重用模型

1052最佳案例20——監(jiān)控模型性能

1053最佳案例21——定期更新模型

本章小結

習題