注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)自動化技術(shù)、計算技術(shù)數(shù)據(jù)科學(xué)入門

數(shù)據(jù)科學(xué)入門

數(shù)據(jù)科學(xué)入門

定 價:¥69.00

作 者: [美] 格魯斯(Joel Grus) 著;高蓉,韓波 譯
出版社: 人民郵電出版社
叢編項(xiàng): 圖靈程序設(shè)計叢書
標(biāo) 簽: 計算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787115417411 出版時間: 2016-03-01 包裝: 平裝
開本: 16開 頁數(shù): 284 字?jǐn)?shù):  

內(nèi)容簡介

  本書基于易于理解且具有數(shù)據(jù)科學(xué)相關(guān)的豐富的庫的Python語言環(huán)境,從零開始講解數(shù)據(jù)科學(xué)工作。具體內(nèi)容包括:Python速成,可視化數(shù)據(jù),線性代數(shù),統(tǒng)計,概率,假設(shè)與推斷,梯度下降法,如何獲取數(shù)據(jù),k近鄰法,樸素貝葉斯算法,等等。作者借助大量具體例子以及數(shù)據(jù)挖掘、統(tǒng)計學(xué)、機(jī)器學(xué)習(xí)等領(lǐng)域的重要概念,詳細(xì)展示了什么是數(shù)據(jù)科學(xué)。

作者簡介

  Joel Grus是Google的一位軟件工程師,曾于數(shù)家創(chuàng)業(yè)公司擔(dān)任數(shù)據(jù)科學(xué)家。目前住在西雅圖,專注于數(shù)據(jù)科學(xué)工作并樂此不疲。

圖書目錄

前言 xiii
第1章 導(dǎo)論 1
1.1 數(shù)據(jù)的威力 1
1.2 什么是數(shù)據(jù)科學(xué) 1
1.3 激勵假設(shè):DataSciencester 2
1.3.1 尋找關(guān)鍵聯(lián)系人 3
1.3.2 你可能知道的數(shù)據(jù)科學(xué)家 5
1.3.3 工資與工作年限 8
1.3.4 付費(fèi)賬戶 10
1.3.5 興趣主題 11
1.4 展望 12
第2章 Python速成 13
2.1 基礎(chǔ)內(nèi)容 13
2.1.1 Python獲取 13
2.1.2 Python之禪 14
2.1.3 空白形式 14
2.1.4 模塊 15
2.1.5 算法 16
2.1.6 函數(shù) 16
2.1.7 字符串 17
2.1.8 異常 18
2.1.9 列表 18
2.1.10 元組 19
2.1.11 字典 20
2.1.12 集合 22
2.1.13 控制流 23
2.1.14 真和假 24
2.2 進(jìn)階內(nèi)容 25
2.2.1 排序 25
2.2.2 列表解析 25
2.2.3 生成器和迭代器 26
2.2.4 隨機(jī)性 27
2.2.5 正則表達(dá)式 28
2.2.6 面向?qū)ο蟮木幊? 28
2.2.7 函數(shù)式工具 29
2.2.8 枚舉 31
2.2.9 壓縮和參數(shù)拆分 31
2.2.10 args和kwargs 32
2.2.11 歡迎來到DataSciencester 33
2.3 延伸學(xué)習(xí) 33
第3章 可視化數(shù)據(jù) 34
3.1 matplotlib 34
3.2 條形圖 36
3.3 線圖 40
3.4 散點(diǎn)圖 41
3.5 延伸學(xué)習(xí) 44
第4章 線性代數(shù) 45
4.1 向量 45
4.2 矩陣 49
4.3 延伸學(xué)習(xí) 51
第5章 統(tǒng)計學(xué) 53
5.1 描述單個數(shù)據(jù)集 53
5.1.1 中心傾向 55
5.1.2 離散度 56
5.2 相關(guān) 58
5.3 辛普森悖論 60
5.4 相關(guān)系數(shù)其他注意事項(xiàng) 61
5.5 相關(guān)和因果 62
5.6 延伸學(xué)習(xí) 63
第6章 概率 64
6.1 不獨(dú)立和獨(dú)立 64
6.2 條件概率 65
6.3 貝葉斯定理 66
6.4 隨機(jī)變量 68
6.5 連續(xù)分布 68
6.6 正態(tài)分布 69
6.7 中心極限定理 72
6.8 延伸學(xué)習(xí) 74
第7章 假設(shè)與推斷 75
7.1 統(tǒng)計假設(shè)檢驗(yàn) 75
7.2 案例:擲硬幣 75
7.3 置信區(qū)間 79
7.4 P-hacking 80
7.5 案例:運(yùn)行A/B 測試 81
7.6 貝葉斯推斷 82
7.7 延伸學(xué)習(xí) 85
第8章 梯度下降 86
8.1 梯度下降的思想 86
8.2 估算梯度 87
8.3 使用梯度 90
8.4 選擇正確步長 90
8.5 綜合 91
8.6 隨機(jī)梯度下降法 92
8.7 延伸學(xué)習(xí) 93
第9章 獲取數(shù)據(jù) 94
9.1 stdin和stdout 94
9.2 讀取文件 96
9.2.1 文本文件基礎(chǔ) 96
9.2.2 限制的文件 97
9.3 網(wǎng)絡(luò)抓取 99
9.3.1 HTML和解析方法 99
9.3.2 案例:關(guān)于數(shù)據(jù)的O’Reilly 圖書 101
9.4 使用API 105
9.4.1 JSON(和XML) 105
9.4.2 使用無驗(yàn)證的API 106
9.4.3 尋找API 107
9.5 案例:使用Twitter API 108
9.6 延伸學(xué)習(xí) 111
第10章 數(shù)據(jù)工作 112
10.1 探索你的數(shù)據(jù) 112
10.1.1 探索一維數(shù)據(jù) 112
10.1.2 二維數(shù)據(jù) 114
10.1.3 多維數(shù)據(jù) 116
10.2 清理與修改 117
10.3 數(shù)據(jù)處理 119
10.4 數(shù)據(jù)調(diào)整 122
10.5 降維 123
10.6 延伸學(xué)習(xí) 129
第11章 機(jī)器學(xué)習(xí) 130
11.1 建模 130
11.2 什么是機(jī)器學(xué)習(xí) 131
11.3 過擬合和欠擬合 131
11.4 正確性 134
11.5 偏倚-方差權(quán)衡 136
11.6 特征提取和選擇 137
11.7 延伸學(xué)習(xí) 138
第12章 k近鄰法 139
12.1 模型 139
12.2 案例:最喜歡的編程語言 141
12.3 維數(shù)災(zāi)難 146
12.4 延伸學(xué)習(xí) 151
第13章 樸素貝葉斯算法 152
13.1 一個簡易的垃圾郵件過濾器 152
13.2 一個復(fù)雜的垃圾郵件過濾器 153
13.3 算法的實(shí)現(xiàn) 154
13.4 測試模型 156
13.5 延伸學(xué)習(xí) 158
第14章 簡單線性回歸 159
14.1 模型 159
14.2 利用梯度下降法 162
14.3 最大似然估計 162
14.4 延伸學(xué)習(xí) 163
第15章 多重回歸分析 164
15.1 模型 164
15.2 最小二乘模型的進(jìn)一步假設(shè) 165
15.3 擬合模型 166
15.4 解釋模型 167
15.5 擬合優(yōu)度 167
15.6 題外話:Bootstrap  168
15.7 回歸系數(shù)的標(biāo)準(zhǔn)誤差 169
15.8 正則化 170
15.9 延伸學(xué)習(xí) 172
第16章 邏輯回歸 173
16.1 問題 173
16.2 Logistic函數(shù) 176
16.3 應(yīng)用模型 178
16.4 擬合優(yōu)度 179
16.5 支持向量機(jī) 180
16.6 延伸學(xué)習(xí) 184
第17章 決策樹 185
17.1 什么是決策樹 185
17.2 熵 187
17.3 分割之熵 189
17.4 創(chuàng)建決策樹 190
17.5 綜合運(yùn)用 192
17.6 隨機(jī)森林 194
17.7 延伸學(xué)習(xí) 195
第18章 神經(jīng)網(wǎng)絡(luò) 196
18.1 感知器 196
18.2 前饋神經(jīng)網(wǎng)絡(luò) 198
18.3 反向傳播 201
18.4 實(shí)例:戰(zhàn)勝CAPTCHA 202
18.5 延伸學(xué)習(xí) 206
第19章 聚類分析 208
19.1 原理 208
19.2 模型 209
19.3 示例:聚會 210
19.4 選擇聚類數(shù)目k 213
19.5 示例:對色彩進(jìn)行聚類 214
19.6 自下而上的分層聚類 216
19.7 延伸學(xué)習(xí) 221
第20章 自然語言處理 222
20.1 詞云 222
20.2 n-grams 模型  224
20.3 語法 227
20.4 題外話:吉布斯采樣 229
20.5 主題建模 231
20.6 延伸學(xué)習(xí) 236
第21章 網(wǎng)絡(luò)分析 237
21.1 中介中心度 237
21.2 特征向量中心度 242
21.2.1 矩陣乘法 242
21.2.2 中心度 244
21.3 有向圖與PageRank 246
21.4 延伸學(xué)習(xí) 248
第22章 推薦系統(tǒng) 249
22.1 手工甄篩 250
22.2 推薦流行事物 250
22.3 基于用戶的協(xié)同過濾方法 251
22.4 基于物品的協(xié)同過濾算法 254
22.5 延伸學(xué)習(xí) 256
第23章 數(shù)據(jù)庫與SQL 257
23.1 CREATE TABLE與INSERT 257
23.2 UPDATE 259
23.3 DELETE 260
23.4 SELECT 260
23.5 GROUP BY 262
23.6 ORDER BY 264
23.7 JOIN 264
23.8 子查詢 267
23.9 索引 267
23.10 查詢優(yōu)化 268
23.11 NoSQL 268
23.12 延伸學(xué)習(xí) 269
第24章 MapReduce 270
24.1 案例:單詞計數(shù) 270
24.2 為什么是MapReduce 272
24.3 更加一般化的MapReduce 272
24.4 案例:分析狀態(tài)更新 273
24.5 案例:矩陣計算 275
24.6 題外話:組合器 276
24.7 延伸學(xué)習(xí) 277
第25章 數(shù)據(jù)科學(xué)前瞻 278
25.1 IPython 278
25.2 數(shù)學(xué) 279
25.3 不從零開始 279
25.3.1 NumPy 279
25.3.2 pandas 280
25.3.3 scikit-learn 280
25.3.4 可視化 280
25.3.5 R 281
25.4 尋找數(shù)據(jù) 281
25.5 從事數(shù)據(jù)科學(xué) 281
25.5.1 Hacker News 282
25.5.2 消防車 282
25.5.3 T 恤 282
25.5.4 你呢? 283
作者簡介 284
關(guān)于封面 284

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號