注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡軟件與程序設計Java數(shù)據(jù)科學實戰(zhàn)

Java數(shù)據(jù)科學實戰(zhàn)

Java數(shù)據(jù)科學實戰(zhàn)

定 價:¥59.00

作 者: [美] 邁克爾·R.布茹斯托維奇 著,姜建錦,趙緒營,張巖 譯
出版社: 人民郵電出版社
叢編項:
標 簽: 暫缺

ISBN: 9787115533302 出版時間: 2020-04-01 包裝: 平裝
開本: 16開 頁數(shù): 186 字數(shù):  

內(nèi)容簡介

  《Java數(shù)據(jù)科學實戰(zhàn)》基于清晰的、面向?qū)ο蟮腏ava代碼,討論了數(shù)據(jù)科學研究的一些基本原理。考慮到項目所需的可伸縮性、穩(wěn)健性以及便利性,Java是一門理想的語言。本書解釋了數(shù)據(jù)科學過程每個步驟背后的基本數(shù)學原理,以及如何將這些概念應用于Java。本書內(nèi)容涉及數(shù)據(jù)輸入與輸出、線性代數(shù)、統(tǒng)計學、數(shù)據(jù)操作、學習與預測,以及Hadoop MapReduce在這個過程中所扮演的關鍵角色。書中還提供了在應用程序中使用的代碼示例。

作者簡介

  邁克爾· R. 布茹斯托維奇(Michael R. Brzustowicz)從研究物理的博士后轉(zhuǎn)型為經(jīng)驗豐富的數(shù)據(jù)科學家,專注于建立分布式數(shù)據(jù)系統(tǒng),并從海量數(shù)據(jù)中提取知識。他大部分的時間都在編寫(日常大數(shù)據(jù)問題的)統(tǒng)計模型方法及機器學習方法的定制多線程代碼。他是多家創(chuàng)業(yè)公司的合伙人,并在舊金山大學擔任兼職教授?!咀g者簡介】姜建錦清華大學博士,北京電子科技學院網(wǎng)絡空間安全系教師,目前主要從事計算機系統(tǒng)結構、分布式系統(tǒng)等的研究及相關教學工作。趙緒營中科院博士,北京電子科技學院網(wǎng)絡空間安全系教師,目前主要從事生物特征識別與加密,計算機視覺的研究及相關教學工作。張巖博士,北京電子科技學院網(wǎng)絡空間安全系副教授,目前主要從事信息物理融合系統(tǒng)、軟件系統(tǒng)建模和驗證的研究及相關教學工作。

圖書目錄

前言 xi
第 1章 數(shù)據(jù)的輸入與輸出 1
1.1 究竟何謂數(shù)據(jù) 1
1.2 數(shù)據(jù)模型 2
1.2.1 一維數(shù)組 2
1.2.2 多維數(shù)組 2
1.2.3 數(shù)據(jù)對象 3
1.2.4 矩陣和向量 3
1.2.5 JSON 4
1.3 處理實際數(shù)據(jù) 4
1.3.1 空值 4
1.3.2 空格 5
1.3.3 解析錯誤 5
1.3.4 異常值 6
1.4 管理數(shù)據(jù)文件 6
1.4.1 首先理解文件內(nèi)容 7
1.4.2 讀取文本文件 8
1.4.3 讀取JSON文件 10
1.4.4 讀取圖像文件 11
1.4.5 寫入文本文件 12
1.5 掌握數(shù)據(jù)庫操作 15
1.5.1 命令行客戶端 15
1.5.2 結構化查詢語言 16
1.5.3 Java數(shù)據(jù)庫連接 18
1.6 通過繪圖將數(shù)據(jù)可視化 20
1.6.1 創(chuàng)建簡單圖形 21
1.6.2 混合類型圖的繪制 24
1.6.3 把圖存入文件 26
第 2章 線性代數(shù) 28
2.1 構造向量和矩陣 29
2.1.1 數(shù)組存儲 30
2.1.2 塊存儲 31
2.1.3 映射存儲 31
2.1.4 訪問元素 31
2.1.5 處理子陣 33
2.1.6 隨機化 34
2.2 向量與矩陣的運算 35
2.2.1 縮放 35
2.2.2 轉(zhuǎn)置 36
2.2.3 加與減 36
2.2.4 長度 37
2.2.5 距離 38
2.2.6 相乘 39
2.2.7 內(nèi)積 40
2.2.8 外積 41
2.2.9 逐項積 42
2.2.10 復合運算 43
2.2.11 仿射變換 43
2.2.12 映射函數(shù) 44
2.3 矩陣分解 47
2.3.1 Cholesky分解 47
2.3.2 LU分解 48
2.3.3 QR分解 48
2.3.4 奇異值分解 48
2.3.5 特征分解 49
2.3.6 行列式 50
2.3.7 矩陣逆 50
2.4 求解線性方程組 51
第3章 統(tǒng)計學 53
3.1 數(shù)據(jù)的概率起源 54
3.1.1 概率密度 54
3.1.2 累積概率 55
3.1.3 統(tǒng)計矩 55
3.1.4 熵 56
3.1.5 連續(xù)分布 57
3.1.6 離散分布 68
3.2 數(shù)據(jù)集的特征 73
3.2.1 矩的計算 73
3.2.2 描述性統(tǒng)計 74
3.2.3 多元統(tǒng)計 79
3.2.4 協(xié)方差與相關系數(shù) 81
3.2.5 回歸 82
3.3 處理大數(shù)據(jù)集 84
3.3.1 累積統(tǒng)計 85
3.3.2 統(tǒng)計結果的歸并 87
3.3.3 回歸 88
3.4 數(shù)據(jù)庫內(nèi)置函數(shù)的應用 89
第4章 數(shù)據(jù)操作 91
4.1 轉(zhuǎn)換文本數(shù)據(jù) 91
4.1.1 從文檔中提取標記 91
4.1.2 利用字典 92
4.1.3 文檔向量化 94
4.2 數(shù)值數(shù)據(jù)的縮放與歸一化 97
4.2.1 對列進行縮放 97
4.2.2 對行進行縮放 99
4.2.3 矩陣的縮放算子 100
4.3 將數(shù)據(jù)降維至主成分 102
4.3.1 協(xié)方差方法 105
4.3.2 SVD方法 106
4.4 創(chuàng)建訓練集、驗證集及測試集 108
4.4.1 基于索引的重新采樣 108
4.4.2 基于列表的重新采樣 110
4.4.3 小批量 111
4.5 標簽的編碼  111
4.5.1 泛型編碼器 111
4.5.2 一位有效編碼 112
第5章 學習與預測 115
5.1 學習算法 115
5.1.1 迭代學習過程 115
5.1.2 梯度下降優(yōu)化方法 117
5.2 評估學習過程 119
5.2.1 損失函數(shù)最小化 119
5.2.2 方差和的最小化 127
5.2.3 輪廓系數(shù) 127
5.2.4 對數(shù)似然性 128
5.2.5 分類器的準確率 129
5.3 無監(jiān)督型學習 131
5.3.1 K均值聚類 131
5.3.2 DBSCAN 133
5.3.3 高斯混合 137
5.4 監(jiān)督型學習 141
5.4.1 樸素貝葉斯 142
5.4.2 線性模型 148
5.4.3 深度網(wǎng)絡 156
第6章 Hadoop MapReduce 161
6.1 Hadoop分布式文件系統(tǒng) 161
6.2 MapReduce體系結構 162
6.3 編寫MapReduce應用 163
6.3.1 剖析MapReduce任務 164
6.3.2 Hadoop數(shù)據(jù)類型 164
6.3.3 映射器 167
6.3.4 歸約器 168
6.3.5 JSON字符串作為文本的簡單性 169
6.3.6 部署技巧 170
6.4 MapReduce 示例 171
6.4.1 單詞計數(shù) 171
6.4.2 定制單詞計數(shù) 172
6.4.3 稀疏線性代數(shù) 173
附錄A 數(shù)據(jù)集 177
作者簡介 186
關于封面 186

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號