注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Java數(shù)據(jù)分析指南:Java

Java數(shù)據(jù)分析指南:Java

Java數(shù)據(jù)分析指南:Java

定 價(jià):¥79.00

作 者: [美] 約翰·哈伯德 著,高蓉,李茂 譯
出版社: 人民郵電出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787115494863 出版時(shí)間: 2018-12-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 331 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  當(dāng)今,數(shù)據(jù)科學(xué)已經(jīng)成為一個(gè)熱門(mén)的技術(shù)領(lǐng)域,例如數(shù)據(jù)處理、信息檢索、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、數(shù)據(jù)可視化等都得到了廣泛的應(yīng)用和發(fā)展。而Java作為一門(mén)經(jīng)典的編程語(yǔ)言,在數(shù)據(jù)科學(xué)領(lǐng)域也有著突出的表現(xiàn)。本書(shū)旨在通過(guò)Java編程來(lái)引導(dǎo)讀者更好地進(jìn)行數(shù)據(jù)分析。本書(shū)包含11章內(nèi)容,詳細(xì)地介紹了數(shù)據(jù)科學(xué)導(dǎo)論、數(shù)據(jù)預(yù)處理、數(shù)據(jù)可視化、統(tǒng)計(jì)、關(guān)系數(shù)據(jù)庫(kù)、回歸分析、分類(lèi)分析、聚類(lèi)分析、推薦系統(tǒng)、NoSQL數(shù)據(jù)庫(kù)以及Java大數(shù)據(jù)分析等重要主題。本書(shū)適合想通過(guò)Java解決數(shù)據(jù)科學(xué)問(wèn)題的讀者,也適合數(shù)據(jù)科學(xué)領(lǐng)域的專(zhuān)業(yè)人士以及普通的Java開(kāi)發(fā)者閱讀。通過(guò)閱讀本書(shū),讀者將能夠?qū)?shù)據(jù)分析有更加深入的理解,并且掌握實(shí)用的數(shù)據(jù)分析技術(shù)。

作者簡(jiǎn)介

  約翰·哈伯德(John R. Hubbard)任教于賓夕法尼亞州和弗吉尼亞州的高校,從事計(jì)算機(jī)數(shù)據(jù)分析工作長(zhǎng)達(dá)40余年。他擁有賓州州立大學(xué)的計(jì)算機(jī)科學(xué)碩士學(xué)位和密歇根大學(xué)的數(shù)學(xué)博士學(xué)位。目前,他在里士滿(mǎn)大學(xué)擔(dān)任數(shù)學(xué)和計(jì)算機(jī)科學(xué)的名譽(yù)教授,他在該校講授數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)值分析和大數(shù)據(jù)。哈伯德博士出版了許多著作并發(fā)表過(guò)多篇論文,除了本書(shū),他還出版過(guò)6本計(jì)算領(lǐng)域的著作。其中某些著作已經(jīng)翻譯為德文、法文、中文和其他5種語(yǔ)言。此外,他還是一位業(yè)余音樂(lè)家。

圖書(shū)目錄

第 1章 數(shù)據(jù)科學(xué)導(dǎo)論 1
1.1 數(shù)據(jù)分析起源 1
1.2 科學(xué)方法 2
1.3 精算科學(xué) 2
1.4 蒸汽計(jì)算 3
1.5 一個(gè)驚人的例子 4
1.6 赫爾曼·何樂(lè)禮 5
1.7 ENIAC 6
1.8 VisiCalc 7
1.9 數(shù)據(jù)、信息和知識(shí) 7
1.10 為什么用Java 7
1.11 Java集成開(kāi)發(fā)環(huán)境 8
1.12 小結(jié) 10
第 2章 數(shù)據(jù)預(yù)處理 11
2.1 數(shù)據(jù)類(lèi)型 11
2.2 變量 12
2.3 數(shù)據(jù)點(diǎn)和數(shù)據(jù)集 12
2.4 關(guān)系數(shù)據(jù)庫(kù)表 13
2.4.1 關(guān)鍵字段 13
2.4.2 鍵—值對(duì) 14
2.5 哈希表 14
2.6 文件格式 16
2.6.1 微軟Excel數(shù)據(jù) 18
2.6.2 XML和JSON數(shù)據(jù) 21
2.7 生成測(cè)試數(shù)據(jù)集 27
2.7.1 元數(shù)據(jù) 28
2.7.2 數(shù)據(jù)清洗 29
2.7.3 數(shù)據(jù)縮放 30
2.7.4 數(shù)據(jù)過(guò)濾 30
2.7.5 排序 33
2.7.6 合并 34
2.7.7 散列法 37
2.8 小結(jié) 38
第3章 數(shù)據(jù)可視化 39
3.1 表和圖 40
3.1.1 散點(diǎn)圖 40
3.1.2 線圖 42
3.1.3 條形圖 43
3.1.4 直方圖 43
3.2 時(shí)間序列 45
3.3 Java實(shí)現(xiàn) 46
3.4 移動(dòng)平均 49
3.5 數(shù)據(jù)排序 53
3.6 頻率分布 55
3.7 正態(tài)分布 57
3.8 指數(shù)分布 59
3.9 Java示例 59
3.10 小結(jié) 61
第4章 統(tǒng)計(jì) 62
4.1 描述性統(tǒng)計(jì)量 62
4.2 隨機(jī)抽樣 65
4.3 隨機(jī)變量 67
4.4 概率分布 67
4.5 累積分布 69
4.6 二項(xiàng)分布 70
4.7 多元分布 74
4.8 條件概率 76
4.9 概率事件的獨(dú)立性 77
4.10 列聯(lián)表 78
4.11 貝葉斯定理 78
4.12 協(xié)方差和相關(guān) 80
4.13 標(biāo)準(zhǔn)正態(tài)分布 82
4.14 中心極限定理 86
4.15 置信區(qū)間 87
4.16 假設(shè)檢驗(yàn) 89
4.17 小結(jié) 91
第5章 關(guān)系數(shù)據(jù)庫(kù) 92
5.1 關(guān)系數(shù)據(jù)模型 92
5.2 關(guān)系數(shù)據(jù)庫(kù) 93
5.3 外鍵 94
5.4 關(guān)系數(shù)據(jù)庫(kù)設(shè)計(jì) 95
5.4.1 創(chuàng)建數(shù)據(jù)庫(kù) 96
5.4.2 SQL命令 100
5.4.3 數(shù)據(jù)插入數(shù)據(jù)庫(kù) 104
5.4.4 數(shù)據(jù)庫(kù)查詢(xún) 106
5.4.5 SQL數(shù)據(jù)類(lèi)型 107
5.4.6 JDBC 108
5.4.7 使用JDBC PreparedStatement 110
5.4.8 批處理 112
5.4.9 數(shù)據(jù)庫(kù)視圖 115
5.4.10 子查詢(xún) 119
5.4.11 表索引 121
5.5 小結(jié) 123
第6章 回歸分析 124
6.1 線性回歸 124
6.1.1 Excel中的線性回歸 125
6.1.2 計(jì)算回歸系數(shù) 129
6.1.3 變異統(tǒng)計(jì)量 131
6.1.4 線性回歸的Java實(shí)現(xiàn) 134
6.1.5 安斯庫(kù)姆的四重奏 141
6.2 多項(xiàng)式回歸 143
6.2.1 多元線性回歸 147
6.2.2 Apache Commons的實(shí)現(xiàn) 150
6.2.3 曲線擬合 151
6.3 小結(jié) 153
第7章 分類(lèi)分析 154
7.1 決策樹(shù) 156
7.1.1 熵和它有什么關(guān)系? 157
7.1.2 ID3算法 160
7.1.3 Weka平臺(tái) 171
7.1.4 數(shù)據(jù)的ARFF文件類(lèi)型 171
7.1.5 Weka的Java實(shí)現(xiàn) 174
7.2 貝葉斯分類(lèi)器 175
7.2.1 Weka的Java實(shí)現(xiàn) 177
7.2.2 支持向量機(jī)算法 181
7.3 邏輯回歸 184
7.3.1 k近鄰算法 189
7.3.2 模糊分類(lèi)算法 193
7.4 小結(jié) 194
第8章 聚類(lèi)分析 195
8.1 測(cè)量距離 195
8.2 維數(shù)災(zāi)難 200
8.3 層次聚類(lèi)法 201
8.3.1 Weka實(shí)現(xiàn) 210
8.3.2 K-均值聚類(lèi) 212
8.3.3 K-中心點(diǎn)聚類(lèi) 218
8.3.4 仿射傳播聚類(lèi) 220
8.4 小結(jié) 228
第9章 推薦系統(tǒng) 229
9.1 效用矩陣 230
9.2 相似性度量 231
9.3 余弦相似性 233
9.4 一個(gè)簡(jiǎn)單的推薦系統(tǒng) 233
9.5 亞馬遜項(xiàng)目對(duì)項(xiàng)目的協(xié)同過(guò)濾推薦 244
9.6 實(shí)現(xiàn)用戶(hù)評(píng)分 250
9.7 大型稀疏矩陣 254
9.8 使用隨機(jī)訪問(wèn)文件 257
9.9 Netflix大獎(jiǎng)賽 260
9.10 小結(jié) 260
第 10章 NoSQL數(shù)據(jù)庫(kù) 261
10.1 映射數(shù)據(jù)結(jié)構(gòu) 261
10.2 SQL與NoSQL 263
10.3 Mongo數(shù)據(jù)庫(kù)系統(tǒng) 265
10.4 Library數(shù)據(jù)庫(kù) 270
10.5 MongoDB的Java開(kāi)發(fā) 273
10.6 MongoDB的地理空間數(shù)據(jù)庫(kù)擴(kuò)展 281
10.7 MongoDB中的索引 282
10.8 為什么選擇NoSQL,為什么選擇MongoDB 283
10.9 其他的NoSQL數(shù)據(jù)庫(kù)系統(tǒng) 284
10.10 小結(jié) 284
第 11章 Java大數(shù)據(jù)分析 285
11.1 擴(kuò)展、數(shù)據(jù)分塊和分片 285
11.2 谷歌的PageRank算法 286
11.3 谷歌的MapReduce框架 290
11.4 MapReduce的一些應(yīng)用示例 291
11.5 “單詞計(jì)數(shù)”示例 292
11.6 可擴(kuò)展性 296
11.7 MapReduce的矩陣操作 297
11.8 MongoDB中的MapReduce 301
11.9 Apache Hadoop 302
11.10 Hadoop MapReduce 303
11.11 小結(jié) 304
附錄 Java工具 305

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)