注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)原理與實踐:復雜信息的準備、共享和分析(原書第2版)

大數(shù)據(jù)原理與實踐:復雜信息的準備、共享和分析(原書第2版)

大數(shù)據(jù)原理與實踐:復雜信息的準備、共享和分析(原書第2版)

定 價:¥119.00

作 者: [美] 朱爾斯-J-伯曼 著,張桂剛 邢春曉 任廣皓 王云譯 譯
出版社: 機械工業(yè)出版社
叢編項: 數(shù)據(jù)科學與工程技術叢書
標 簽: 暫缺

ISBN: 9787111657903 出版時間: 2020-06-01 包裝: 平裝
開本: 16開 頁數(shù): 372 字數(shù):  

內(nèi)容簡介

  當大數(shù)據(jù)資源變得越發(fā)復雜時,僅靠更強大的計算機系統(tǒng)已無法解決問題。本書帶我們重新審視數(shù)據(jù)準備環(huán)節(jié),重點討論了其中至關重要但又常常被忽略的主題——標識符、不變性、內(nèi)省和數(shù)據(jù)索引。此外,書中也涵蓋常見的與大數(shù)據(jù)設計、架構、操作和分析相關的內(nèi)容,以及涉及法律、社會和倫理問題的非技術性章節(jié)。全書視角獨特,涉獵廣博,尤以醫(yī)學大數(shù)據(jù)分析見長,強調基本原理,不關注編程細節(jié)和數(shù)學公式,適合企業(yè)決策者、技術專家以及計算機相關專業(yè)的學生閱讀。

作者簡介

  朱爾斯·J 伯曼(Jules J Berman) 擁有麻省理工學院數(shù)學和地球與行星科學兩個學士學位,天普大學哲學博士學位,以及邁阿密大學醫(yī)學博士學位。撰寫信息科學、計算機程序設計和病理學三個專業(yè)領域的著作近20本。2006年,伯曼博士成為美國病理信息學協(xié)會主席,2011年榮獲該協(xié)會終身成就獎。

圖書目錄

譯者序
第2版前言
第1版前言
作者簡介
第1章 引言1
11 大數(shù)據(jù)的定義1
12 大數(shù)據(jù)與小數(shù)據(jù)2
13 大數(shù)據(jù)在哪里5
14 大數(shù)據(jù)最常見的目的是產(chǎn)生小數(shù)據(jù)6
15 大數(shù)據(jù)是研究領域的中心話題6
術語表7
參考文獻11
第2章 為非結構化數(shù)據(jù)提供結構13
21 幾乎所有數(shù)據(jù)都是非結構化的、
 不可用的原始形式13
22 詞匯索引14
23 術語提取16
24 構建索引19
25 自動編碼20
26 案例研究:宇宙中任意原子精確位置的快速定位(需要安裝一些軟件)24
27 案例研究(高級):一個完整的自動編碼器(12行Python代碼)26
28 案例研究:以詞匯索引進行文本轉換28
29 案例研究(高級):Burrows Wheeler變換30
術語表32
參考文獻43
第3章 標識、去標識和重標識45
31 什么是標識符45
32 標識符和標識系統(tǒng)之間的區(qū)別46
33 生成唯一標識符48
34 糟糕的標識方法50
35 注冊唯一對象標識符53
36 去標識和重標識55
37 案例研究:數(shù)據(jù)清理57
38 案例研究(高級):圖像標題中的標識符59
39 案例研究:單向散列函數(shù)61
術語表63
參考文獻69
第4章 元數(shù)據(jù)、語義和三元組71
41 元數(shù)據(jù)71
42 可擴展標記語言71
43 語義和三元組72
44 命名空間74
45 案例研究:三元組的語法75
46 案例研究:Dublin Core77
術語表78
參考文獻80
第5章 分類和本體論81
51 關于對象關系的全部81
52 分類:最簡單的本體84
53 本體:有多個父類的類86
54 分類模型選擇88
55 類混合91
56 本體開發(fā)的常見陷阱92
57 案例研究:上層本體93
58 案例研究(高級):悖論94
59 案例研究(高級):RDF框架和類屬性96
510 案例研究(高級):可視化類關系98
術語表102
參考文獻111
第6章 內(nèi)省113
61 自我認知113
62 數(shù)據(jù)對象:每個大數(shù)據(jù)集合中最基本的元素116
63 大數(shù)據(jù)如何使用內(nèi)省117
64 案例研究:時間戳數(shù)據(jù)119
65 案例研究:TripleStore 簡介121
66 案例研究(高級):大數(shù)據(jù)必須是面向對象的證明125
術語表126
參考文獻127
第7章 標準和數(shù)據(jù)集成128
71 標準128
72 規(guī)范與標準132
73 版本控制134
74 合規(guī)問題135
75 案例研究:標準化巧克力茶壺135
術語表136
參考文獻137
第8章 不變性和永久性139
81 數(shù)據(jù)不變性的重要性139
82 不變性和標識符140
83 數(shù)據(jù)產(chǎn)生數(shù)據(jù)142
84 跨機構協(xié)調標識符143
85 案例研究:可信時間戳144
86 案例研究:區(qū)塊鏈和分布式賬本145
87 案例研究(高級):零知識協(xié)調147
術語表148
參考文獻150
第9章 評估大數(shù)據(jù)資源的充分性152
91 觀察數(shù)據(jù)152
92 大數(shù)據(jù)的最小必要屬性158
93 附加條件的數(shù)據(jù)161
94 案例研究:用于查看和搜索大型文件的實用程序162
95 案例研究:數(shù)據(jù)扁平化164
術語表164
參考文獻169
第10章 測量170
101 準確性與精度170
102 數(shù)據(jù)范圍171
103 計數(shù)173
104 數(shù)據(jù)標準化和變換176
105 約簡數(shù)據(jù)179
106 理解控制181
107 沒有實際意義的統(tǒng)計意義182
108 案例研究:基因計數(shù)183
109 案例研究:早期生物特征和狹窄數(shù)據(jù)范圍的意義184
術語表185
參考文獻186
第11章 快速簡單的大數(shù)據(jù)分析必不可少的技巧188
111 速度和可擴展性188
112 適用于大數(shù)據(jù)的快速操作,并且每臺計算機都支持193
113 點積—一種簡單快速的相關方法197
114 聚類199
115 數(shù)據(jù)持久性方法(不使用數(shù)據(jù)庫)201
116 案例研究:爬升分類202
117 案例研究(高級):數(shù)據(jù)庫示例203
118 案例研究(高級):NoSQL205
術語表205
參考文獻209
第12章 尋找大型數(shù)據(jù)集中的線索211
121 分母211
122 詞頻分布212
123 異常值和異常215
124 封底分析216
125 案例研究:預測用戶偏好218
126 案例研究:人口數(shù)據(jù)的多模態(tài)219
127 案例研究:大小黑洞220
術語表220
參考文獻224
第13章 使用隨機數(shù)將大數(shù)據(jù)分析問題的規(guī)??s小225
131?。▊危╇S機數(shù)的顯著效用225
132 重采樣230
133 蒙特卡羅模擬法234
134 案例研究:中心極限定理的證明236
135 案例研究:發(fā)生一連串小概率事件的頻率237
136 案例研究:臭名昭著的生日問題238
137 案例研究(高級):蒙提霍爾問題239
138 案例研究(高級):貝葉斯分析241
術語表242
參考文獻244
第14章 大數(shù)據(jù)分析中的特殊注意事項246
141 數(shù)據(jù)搜索理論246
142 理論搜索中的數(shù)據(jù)247
143 巨大的偏差248
144 大數(shù)據(jù)的數(shù)據(jù)子集:不可加和不傳遞251
145 其他大數(shù)據(jù)陷阱252
146 案例研究(高級):維數(shù)災難254
術語表257
參考文獻258
第15章 大數(shù)據(jù)的失敗以及如何避免260
151 失敗很常見260
152 失敗的標準261
153 復雜性264
154 逐步走進大數(shù)據(jù)分析265
155 失敗之后272
156 案例研究:癌癥生物醫(yī)學信息學網(wǎng)格—遙遠的橋273
157 案例研究:高斯Copula函數(shù)277
術語表278
參考文獻280
第16章 數(shù)據(jù)再分析:比分析更重要283
161 第一次分析(幾乎)總是錯的283
162 為什么再分析比分析更重要285
163 案例研究:舊JADE對撞機數(shù)據(jù)的再分析287
164 案例研究:通過再分析證明287
165 案例研究:從舊數(shù)據(jù)中尋找新行星288
術語表289
參考文獻290
第17章 大數(shù)據(jù)再利用294
171 什么是數(shù)據(jù)再利用294
172 暗數(shù)據(jù)、廢棄數(shù)據(jù)和遺留數(shù)據(jù)296
173 案例研究:從郵政編碼到人口統(tǒng)計學基礎297
174 案例研究:基因序列數(shù)據(jù)庫的科學推斷298
175 案例研究:將全球變暖與高強度颶風聯(lián)系起來298
176 案例研究:用地質數(shù)據(jù)推斷氣候趨勢299
177 案例研究:環(huán)月影像恢復工程299
術語表301
參考文獻301
第18章 數(shù)據(jù)共享和數(shù)據(jù)安全303
181 什么是數(shù)據(jù)共享,為什么我們不共享更多數(shù)據(jù)303
182 常見的不滿303
183 數(shù)據(jù)安全和加密協(xié)議308
184 案例研究:火星上的生命313
185 案例研究:個人標識符314
術語表315
參考文獻317
第19章 合法性320
191 對數(shù)據(jù)的準確性和合法性負責320
192 創(chuàng)建、使用和共享資源的權利322
193 因使用標準而招致的版權和專利侵權行為324
194 對個人的保護325
195 許可問題326
196 未經(jīng)許可的數(shù)據(jù)330
197 隱私策略332
198 案例研究:大數(shù)據(jù)的時效性333
199 案例:哈瓦蘇派的故事334
術語表335
參考文獻336
第20章 社會問題338
201 公眾的大數(shù)據(jù)感知338
202 用大數(shù)據(jù)降低成本和提高生產(chǎn)效率340
203 公眾的疑慮342
204 從自己做起343
205 誰是大數(shù)據(jù)344
206 傲慢和夸張349
207 案例研究:公民科學家351
208 案例研究:喬治·奧威爾的《1984》354
術語表354
參考文獻355

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號