定 價(jià):¥69.00
作 者: | (印度)A.奧利 |
出版社: | 機(jī)械工業(yè)出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787111611950 | 出版時(shí)間: | 2018-12-01 | 包裝: | 平裝 |
開(kāi)本: | 16開(kāi) | 頁(yè)數(shù): | 字?jǐn)?shù): |
譯者序
前言
第1章 Python、R和R數(shù)據(jù)科學(xué)簡(jiǎn)介1
1.1 什么是Python1
1.2 什么是R2
1.3 什么是數(shù)據(jù)科學(xué)2
1.4 數(shù)據(jù)科學(xué)家的未來(lái)3
1.5 什么是大數(shù)據(jù)4
1.6 商務(wù)分析與數(shù)據(jù)科學(xué)5
1.7 數(shù)據(jù)科學(xué)家可用的工具6
1.8 用于數(shù)據(jù)科學(xué)的Python添加包7
1.9 Python和R之間的異同8
1.9.1 為什么R用戶應(yīng)該了解有關(guān)Python的更多信息8
1.9.2 為什么Python用戶應(yīng)該了解有關(guān)R的更多信息9
1.10 教程9
1.11 同時(shí)使用R和Python9
1.12 其他軟件和Python13
1.13 將SAS與Jupyter一起使用13
1.14 如何將Python和R用于大數(shù)據(jù)分析13
1.15 什么是云計(jì)算15
1.16 如何在云上使用Python和R15
1.17 Python和R商業(yè)版本及其他替代版本16
1.17.1 數(shù)據(jù)科學(xué)家的常用Linux命令17
1.17.2 學(xué)習(xí)Git18
1.18 數(shù)據(jù)驅(qū)動(dòng)的決策32
1.18.1 企業(yè)管理戰(zhàn)略框架:非MBA和MBA的數(shù)據(jù)驅(qū)動(dòng)決策指南32
1.18.2 商務(wù)分析的其他框架37
參考文獻(xiàn)40
第2章 數(shù)據(jù)輸入41
2.1 pandas中的數(shù)據(jù)輸入41
2.2 網(wǎng)頁(yè)抓取數(shù)據(jù)輸入44
2.3 來(lái)自RDBMS的數(shù)據(jù)輸入48
2.3.1 Windows教程50
2.3.2 安裝50
2.3.3 配置ODBC52
第3章 數(shù)據(jù)檢查和數(shù)據(jù)質(zhì)量62
3.1 數(shù)據(jù)格式62
3.1.1 將字符串轉(zhuǎn)換為日期和時(shí)間63
3.1.2 將數(shù)據(jù)框轉(zhuǎn)換為NumPy數(shù)組并返回Python66
3.2 數(shù)據(jù)質(zhì)量68
3.3 數(shù)據(jù)檢查71
3.4 數(shù)據(jù)選擇74
3.4.1 隨機(jī)選擇數(shù)據(jù)76
3.4.2 條件選擇76
3.5 R中的數(shù)據(jù)檢查79
3.5.1 來(lái)自R ggplot2添加包中的diamond數(shù)據(jù)集83
3.5.2 修改R中的日期格式和字符串86
3.5.3 管理R中的字符串88
參考文獻(xiàn)88
第4章 探索性數(shù)據(jù)分析89
4.1 根據(jù)分析分組89
4.2 數(shù)值數(shù)據(jù)89
4.3 分類數(shù)據(jù)91
第5章 統(tǒng)計(jì)建模102
5.1 回歸的概念102
5.1.1 OLS103
5.1.2 R方103
5.1.3 p值104
5.1.4 異常值104
5.1.5 多重共線性和異方差性104
5.2 相關(guān)關(guān)系不是因果關(guān)系105
5.2.1 關(guān)于數(shù)據(jù)科學(xué)家統(tǒng)計(jì)的說(shuō)明106
5.2.2 中心趨勢(shì)的度量107
5.2.3 分散度的度量107
5.2.4 概率分布110
5.3 R和Python中的線性回歸114
5.4 R和Python中的Logistic回歸132
5.4.1 其他概念136
5.4.2 ROC曲線和AUC137
5.4.3 偏差與方差137
參考文獻(xiàn)138
第6章 數(shù)據(jù)可視化139
6.1 數(shù)據(jù)可視化的概念139
6.1.1 數(shù)據(jù)可視化的歷史139
6.1.2 Anscombe案例研究140
6.1.3 加載添加包141
6.1.4 獲得均值和標(biāo)準(zhǔn)差142
6.1.5 結(jié)論1144
6.1.6 數(shù)據(jù)可視化144
6.1.7 結(jié)論2146
6.2 Tufte關(guān)于數(shù)據(jù)可視化的工作147
6.3 Stephen Few關(guān)于儀表盤的設(shè)計(jì)147
6.4 基本繪圖149
6.5 高級(jí)繪圖156
6.6 交互式繪圖160
6.7 空間分析160
6.8 R中的數(shù)據(jù)可視化160
6.8.1 關(guān)于RStudio IDE共享R代碼的注意事項(xiàng)166
6.8.2 關(guān)于共享Jupyter筆記的注意事項(xiàng)167
6.8.3 特別說(shuō)明:關(guān)于Python的完整教程168
參考文獻(xiàn)180
第7章 機(jī)器學(xué)習(xí)變得更容易181
7.1 刪除最終決策樹(shù)模型中不需要的列186
7.2 時(shí)間序列207
7.3 關(guān)聯(lián)分析211
7.4 清洗語(yǔ)料庫(kù)并制作詞袋221
7.4.1 聚類分析224
7.4.2 Python中的聚類分析224
第8章 結(jié)論和總結(jié)233