注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件實用數(shù)據(jù)分析(原書第2版)

實用數(shù)據(jù)分析(原書第2版)

實用數(shù)據(jù)分析(原書第2版)

定 價:¥59.00

作 者: [美] 赫克托·奎斯塔(Hector Cuesta),德爾·桑帕斯·庫馬爾(Dr.Sampath Kumar) 著;刁曉純 譯
出版社: 機械工業(yè)出版社
叢編項: 大數(shù)據(jù)技術叢書
標 簽: >程序設計 >計算機/網(wǎng)絡 >其他

ISBN: 9787111579212 出版時間: 2017-09-01 包裝: 平裝
開本: 16開 頁數(shù): 236 字數(shù):  

內容簡介

  本書提供了一系列將數(shù)據(jù)轉化為重要結論的現(xiàn)實案例。書中覆蓋了廣泛的數(shù)據(jù)分析工具和算法,用于進行分類分析、聚類分析、數(shù)據(jù)可視化、數(shù)據(jù)模擬以及預測。本書的目標是幫助讀者了解數(shù)據(jù)從而找到相應的模式、趨勢、相互關系以及重要結論。書中所包括的實用項目充分利用了MongoDB、D3.js和Python語言,并采用代碼片段和詳細描述的方式呈現(xiàn)本書的核心概念。

作者簡介

  作 者 簡 介About the AuthorHector Cuesta Dataxios(一家機器智能研發(fā)公司)的創(chuàng)辦人及首席數(shù)據(jù)科學家,擁有信息學士及計算機科學碩士學位。他在金融、零售、金融科技、在線學習、人力資源等領域提供數(shù)據(jù)驅動產品設計的咨詢服務。在空閑時間,他熱衷于研究機器人。可以關注他的推特:https://twitter.com/hmCuesta。本書獻給我的妻子Yolanda和我可愛的孩子Damian和Issac,他們?yōu)槲业纳顜砹藷o比的快樂。同時把本書獻給我的父母Elena和Miguel,感謝他們對我的支持和愛護。Dr. Sampath Kumar Telangana大學應用統(tǒng)計系的助理教授和系主任,他擁有理學碩士、哲學碩士和統(tǒng)計學博士學位,擁有5年研究生教學經驗,有超過4年的工作經驗。他是SAS和MATLAB軟件高級程序員,專長是利用SPSS、SAS、R、Minitab、MATLAB等軟件進行數(shù)據(jù)統(tǒng)計。他在不同的應用學科和純統(tǒng)計專業(yè)(如預測建模、應用回歸分析、多變量數(shù)據(jù)分析、運營管理等)方面具有教學經驗。

圖書目錄

譯者序
作者簡介
審校者簡介
前言
第1章 開始1
1.1 計算機科學1
1.2 人工智能2
1.3 機器學習2
1.4 統(tǒng)計學2
1.5 數(shù)學2
1.6 專業(yè)領域知識3
1.7 數(shù)據(jù)、信息和知識3
1.7.1 數(shù)據(jù)、信息和知識之間的相互性3
1.7.2 數(shù)據(jù)的本質4
1.8 數(shù)據(jù)分析過程5
1.8.1 問題6
1.8.2 數(shù)據(jù)準備6
1.8.3 數(shù)據(jù)探索7
1.8.4 預測建模7
1.8.5 結果可視化8
1.9 定量與定性數(shù)據(jù)分析9
1.10 數(shù)據(jù)可視化的重要性9
1.11 大數(shù)據(jù)10
1.12 自我量化12
1.12.1 傳感器和攝像頭12
1.12.2 社交網(wǎng)絡分析13
1.13 本書的工具和練習13
1.13.1 為什么使用 Python14
1.13.2 為什么使用mlpy14
1.13.3 為什么使用D3.js14
1.13.4 為什么使用 MongoDB15
1.14 小結15
第2章 數(shù)據(jù)預處理16
2.1 數(shù)據(jù)源16
2.1.1 開源數(shù)據(jù)17
2.1.2 文本文件18
2.1.3 Excel文件18
2.1.4 SQL數(shù)據(jù)庫18
2.1.5 NoSQL數(shù)據(jù)庫19
2.1.6 多媒體20
2.1.7 網(wǎng)頁檢索20
2.2 數(shù)據(jù)清洗22
2.2.1 統(tǒng)計方法23
2.2.2 文本解析23
2.2.3 數(shù)據(jù)轉化25
2.3 數(shù)據(jù)格式25
2.3.1 CSV26
2.3.2 JSON27
2.3.3 XML28
2.3.4 YAML29
2.4 數(shù)據(jù)歸約30
2.4.1 過濾及抽樣30
2.4.2 分箱算法30
2.4.3 降維31
2.5 開始使用OpenRefine工具32
2.5.1 text facet33
2.5.2 聚類33
2.5.3 文本過濾器34
2.5.4 numeric facet34
2.5.5 數(shù)據(jù)轉化35
2.5.6 數(shù)據(jù)輸出36
2.5.7 操作歷史記錄36
2.6 小結37
第3章 可視化38
3.1 可視化概述39
3.2 利用網(wǎng)頁版的可視化39
3.3 探索科學可視化39
3.4 在藝術上的可視化40
3.5 可視化生命周期40
3.6 可視化不同類型的數(shù)據(jù)41
3.6.1 HTML41
3.6.2 DOM42
3.6.3 CSS42
3.6.4 JavaScript43
3.6.5 SVG43
3.7 開始使用D3.js43
3.7.1 柱狀圖44
3.7.2 餅圖48
3.7.3 散點圖50
3.7.4 單線圖52
3.7.5 多線圖55
3.8 交互與動畫59
3.9 社交網(wǎng)絡中的數(shù)據(jù)61
3.10 可視化分析的摘要62
3.11 小結62
第4章 文本分類63
4.1 學習和分類63
4.2 貝葉斯分類64
4.3 E-mail主題測試器65
4.4 數(shù)據(jù)66
4.5 算法68
4.6 分類器的準確性71
4.7 小結73
第5章 基于相似性的圖像檢索74
5.1 圖像相似性搜索74
5.2 動態(tài)時間規(guī)整75
5.3 處理圖像數(shù)據(jù)集77
5.4 執(zhí)行DTW77
5.5 結果分析79
5.6 小結81
第6章 模擬股票價格82
6.1 金融時間序列82
6.2 隨機漫步模擬83
6.3 蒙特卡羅方法84
6.4 生成隨機數(shù)85
6.5 用D3.js實現(xiàn)86
6.6 計量分析師91
6.7 小結93
第7章 預測黃金價格94
7.1 處理時間序列數(shù)據(jù)94
7.2 平滑時間序列97
7.3 線性回歸100
7.4 數(shù)據(jù)—歷史黃金價格101
7.5 非線性回歸101
7.5.1 核嶺回歸102
7.5.2 平滑黃金價格時間序列104
7.5.3 平滑時間序列的預測105
7.5.4 對比預測值106
7.6 小結107
第8章 使用支持向量機的方法進行分析108
8.1 理解多變量數(shù)據(jù)集109
8.2 降維111
8.2.1 線性無差別分析112
8.2.2 主成分分析112
8.3 使用支持向量機114
8.3.1 核函數(shù)115
8.3.2 雙螺旋問題116
8.3.3 在mlpy中實現(xiàn)SVM116
8.4 小結119
第9章 應用細胞自動機的方法對傳染病進行建模120
9.1 流行病學簡介120
9.2 流行病模型122
9.2.1 SIR模型122
9.2.2 使用SciPy來解決SIR模型的常微分方程123
9.2.3 SIRS模型124
9.3 對細胞自動機進行建模125
9.3.1 細胞、狀態(tài)、網(wǎng)格和鄰域126
9.3.2 整體隨機訪問模型127
9.4 通過D3.js模擬CA中的SIRS模型127
9.5 小結135
第10章 應用社交圖譜136
10.1 圖譜的結構136
10.1.1 無向圖137
10.1.2 有向圖137
10.2 社交網(wǎng)絡分析137
10.3 捕獲Facebook圖譜138
10.4 使用Gephi再現(xiàn)圖譜139
10.5 統(tǒng)計分析142
10.6 度的分布144
10.6.1 圖譜直方圖145
10.6.2 集中度146
10.7 將GDF轉化為JSON148
10.8 在D3.js環(huán)境下進行圖譜可視化150
10.9 小結154
第11章 分析Twitter數(shù)據(jù)155
11.1 解析Twitter數(shù)據(jù)155
11.1.1 tweet156
11.1.2 粉絲156
11.1.3 熱門話題156
11.2 使用OAuth訪問Twitter API157
11.3 開始使用Twython158
11.3.1 利用Twython進行簡單查詢159
11.3.2 獲取時間表數(shù)據(jù)163
11.3.3 獲取粉絲數(shù)據(jù)165
11.3.4 獲取地點和趨勢信息167
11.3.5 獲取用戶數(shù)據(jù)168
11.3.6 API流169
11.4 小結171
第12章 使用MongoDB進行數(shù)據(jù)處理和聚合172
12.1 開始使用MongoDB172
12.1.1 數(shù)據(jù)庫173
12.1.2 集合175
12.1.3 文件175
12.1.4 Mongo shell175
12.1.5 Insert/Update/Delete176
12.1.6 查詢177
12.2 數(shù)據(jù)準備178
12.2.1 使用OpenRefine進行數(shù)據(jù)轉換179
12.2.2 通過PyMongo插入文件180
12.3 分組182
12.4 聚合框架184
12.4.1 流水線184
12.4.2 表達式185
12.5 小結186
第13章 使用MapReduce方法188
13.1 MapReduce概述188
13.2 編程模型189
13.3 在MongoDB中使用MapReduce190
13.3.1 map函數(shù)190
13.3.2 reduce函數(shù)191
......

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號