注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)原理與實踐:復(fù)雜信息的準(zhǔn)備、共享和分析(原書第2版)

大數(shù)據(jù)原理與實踐:復(fù)雜信息的準(zhǔn)備、共享和分析(原書第2版)

大數(shù)據(jù)原理與實踐:復(fù)雜信息的準(zhǔn)備、共享和分析(原書第2版)

定 價:¥119.00

作 者: [美] 朱爾斯-J-伯曼 著,張桂剛 邢春曉 任廣皓 王云譯 譯
出版社: 機(jī)械工業(yè)出版社
叢編項: 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111657903 出版時間: 2020-06-01 包裝: 平裝
開本: 16開 頁數(shù): 372 字?jǐn)?shù):  

內(nèi)容簡介

  當(dāng)大數(shù)據(jù)資源變得越發(fā)復(fù)雜時,僅靠更強(qiáng)大的計算機(jī)系統(tǒng)已無法解決問題。本書帶我們重新審視數(shù)據(jù)準(zhǔn)備環(huán)節(jié),重點(diǎn)討論了其中至關(guān)重要但又常常被忽略的主題——標(biāo)識符、不變性、內(nèi)省和數(shù)據(jù)索引。此外,書中也涵蓋常見的與大數(shù)據(jù)設(shè)計、架構(gòu)、操作和分析相關(guān)的內(nèi)容,以及涉及法律、社會和倫理問題的非技術(shù)性章節(jié)。全書視角獨(dú)特,涉獵廣博,尤以醫(yī)學(xué)大數(shù)據(jù)分析見長,強(qiáng)調(diào)基本原理,不關(guān)注編程細(xì)節(jié)和數(shù)學(xué)公式,適合企業(yè)決策者、技術(shù)專家以及計算機(jī)相關(guān)專業(yè)的學(xué)生閱讀。

作者簡介

  朱爾斯·J 伯曼(Jules J Berman) 擁有麻省理工學(xué)院數(shù)學(xué)和地球與行星科學(xué)兩個學(xué)士學(xué)位,天普大學(xué)哲學(xué)博士學(xué)位,以及邁阿密大學(xué)醫(yī)學(xué)博士學(xué)位。撰寫信息科學(xué)、計算機(jī)程序設(shè)計和病理學(xué)三個專業(yè)領(lǐng)域的著作近20本。2006年,伯曼博士成為美國病理信息學(xué)協(xié)會主席,2011年榮獲該協(xié)會終身成就獎。

圖書目錄

譯者序
第2版前言
第1版前言
作者簡介
第1章 引言1
11 大數(shù)據(jù)的定義1
12 大數(shù)據(jù)與小數(shù)據(jù)2
13 大數(shù)據(jù)在哪里5
14 大數(shù)據(jù)最常見的目的是產(chǎn)生小數(shù)據(jù)6
15 大數(shù)據(jù)是研究領(lǐng)域的中心話題6
術(shù)語表7
參考文獻(xiàn)11
第2章 為非結(jié)構(gòu)化數(shù)據(jù)提供結(jié)構(gòu)13
21 幾乎所有數(shù)據(jù)都是非結(jié)構(gòu)化的、
 不可用的原始形式13
22 詞匯索引14
23 術(shù)語提取16
24 構(gòu)建索引19
25 自動編碼20
26 案例研究:宇宙中任意原子精確位置的快速定位(需要安裝一些軟件)24
27 案例研究(高級):一個完整的自動編碼器(12行Python代碼)26
28 案例研究:以詞匯索引進(jìn)行文本轉(zhuǎn)換28
29 案例研究(高級):Burrows Wheeler變換30
術(shù)語表32
參考文獻(xiàn)43
第3章 標(biāo)識、去標(biāo)識和重標(biāo)識45
31 什么是標(biāo)識符45
32 標(biāo)識符和標(biāo)識系統(tǒng)之間的區(qū)別46
33 生成唯一標(biāo)識符48
34 糟糕的標(biāo)識方法50
35 注冊唯一對象標(biāo)識符53
36 去標(biāo)識和重標(biāo)識55
37 案例研究:數(shù)據(jù)清理57
38 案例研究(高級):圖像標(biāo)題中的標(biāo)識符59
39 案例研究:單向散列函數(shù)61
術(shù)語表63
參考文獻(xiàn)69
第4章 元數(shù)據(jù)、語義和三元組71
41 元數(shù)據(jù)71
42 可擴(kuò)展標(biāo)記語言71
43 語義和三元組72
44 命名空間74
45 案例研究:三元組的語法75
46 案例研究:Dublin Core77
術(shù)語表78
參考文獻(xiàn)80
第5章 分類和本體論81
51 關(guān)于對象關(guān)系的全部81
52 分類:最簡單的本體84
53 本體:有多個父類的類86
54 分類模型選擇88
55 類混合91
56 本體開發(fā)的常見陷阱92
57 案例研究:上層本體93
58 案例研究(高級):悖論94
59 案例研究(高級):RDF框架和類屬性96
510 案例研究(高級):可視化類關(guān)系98
術(shù)語表102
參考文獻(xiàn)111
第6章 內(nèi)省113
61 自我認(rèn)知113
62 數(shù)據(jù)對象:每個大數(shù)據(jù)集合中最基本的元素116
63 大數(shù)據(jù)如何使用內(nèi)省117
64 案例研究:時間戳數(shù)據(jù)119
65 案例研究:TripleStore 簡介121
66 案例研究(高級):大數(shù)據(jù)必須是面向?qū)ο蟮淖C明125
術(shù)語表126
參考文獻(xiàn)127
第7章 標(biāo)準(zhǔn)和數(shù)據(jù)集成128
71 標(biāo)準(zhǔn)128
72 規(guī)范與標(biāo)準(zhǔn)132
73 版本控制134
74 合規(guī)問題135
75 案例研究:標(biāo)準(zhǔn)化巧克力茶壺135
術(shù)語表136
參考文獻(xiàn)137
第8章 不變性和永久性139
81 數(shù)據(jù)不變性的重要性139
82 不變性和標(biāo)識符140
83 數(shù)據(jù)產(chǎn)生數(shù)據(jù)142
84 跨機(jī)構(gòu)協(xié)調(diào)標(biāo)識符143
85 案例研究:可信時間戳144
86 案例研究:區(qū)塊鏈和分布式賬本145
87 案例研究(高級):零知識協(xié)調(diào)147
術(shù)語表148
參考文獻(xiàn)150
第9章 評估大數(shù)據(jù)資源的充分性152
91 觀察數(shù)據(jù)152
92 大數(shù)據(jù)的最小必要屬性158
93 附加條件的數(shù)據(jù)161
94 案例研究:用于查看和搜索大型文件的實用程序162
95 案例研究:數(shù)據(jù)扁平化164
術(shù)語表164
參考文獻(xiàn)169
第10章 測量170
101 準(zhǔn)確性與精度170
102 數(shù)據(jù)范圍171
103 計數(shù)173
104 數(shù)據(jù)標(biāo)準(zhǔn)化和變換176
105 約簡數(shù)據(jù)179
106 理解控制181
107 沒有實際意義的統(tǒng)計意義182
108 案例研究:基因計數(shù)183
109 案例研究:早期生物特征和狹窄數(shù)據(jù)范圍的意義184
術(shù)語表185
參考文獻(xiàn)186
第11章 快速簡單的大數(shù)據(jù)分析必不可少的技巧188
111 速度和可擴(kuò)展性188
112 適用于大數(shù)據(jù)的快速操作,并且每臺計算機(jī)都支持193
113 點(diǎn)積—一種簡單快速的相關(guān)方法197
114 聚類199
115 數(shù)據(jù)持久性方法(不使用數(shù)據(jù)庫)201
116 案例研究:爬升分類202
117 案例研究(高級):數(shù)據(jù)庫示例203
118 案例研究(高級):NoSQL205
術(shù)語表205
參考文獻(xiàn)209
第12章 尋找大型數(shù)據(jù)集中的線索211
121 分母211
122 詞頻分布212
123 異常值和異常215
124 封底分析216
125 案例研究:預(yù)測用戶偏好218
126 案例研究:人口數(shù)據(jù)的多模態(tài)219
127 案例研究:大小黑洞220
術(shù)語表220
參考文獻(xiàn)224
第13章 使用隨機(jī)數(shù)將大數(shù)據(jù)分析問題的規(guī)??s小225
131?。▊危╇S機(jī)數(shù)的顯著效用225
132 重采樣230
133 蒙特卡羅模擬法234
134 案例研究:中心極限定理的證明236
135 案例研究:發(fā)生一連串小概率事件的頻率237
136 案例研究:臭名昭著的生日問題238
137 案例研究(高級):蒙提霍爾問題239
138 案例研究(高級):貝葉斯分析241
術(shù)語表242
參考文獻(xiàn)244
第14章 大數(shù)據(jù)分析中的特殊注意事項246
141 數(shù)據(jù)搜索理論246
142 理論搜索中的數(shù)據(jù)247
143 巨大的偏差248
144 大數(shù)據(jù)的數(shù)據(jù)子集:不可加和不傳遞251
145 其他大數(shù)據(jù)陷阱252
146 案例研究(高級):維數(shù)災(zāi)難254
術(shù)語表257
參考文獻(xiàn)258
第15章 大數(shù)據(jù)的失敗以及如何避免260
151 失敗很常見260
152 失敗的標(biāo)準(zhǔn)261
153 復(fù)雜性264
154 逐步走進(jìn)大數(shù)據(jù)分析265
155 失敗之后272
156 案例研究:癌癥生物醫(yī)學(xué)信息學(xué)網(wǎng)格—遙遠(yuǎn)的橋273
157 案例研究:高斯Copula函數(shù)277
術(shù)語表278
參考文獻(xiàn)280
第16章 數(shù)據(jù)再分析:比分析更重要283
161 第一次分析(幾乎)總是錯的283
162 為什么再分析比分析更重要285
163 案例研究:舊JADE對撞機(jī)數(shù)據(jù)的再分析287
164 案例研究:通過再分析證明287
165 案例研究:從舊數(shù)據(jù)中尋找新行星288
術(shù)語表289
參考文獻(xiàn)290
第17章 大數(shù)據(jù)再利用294
171 什么是數(shù)據(jù)再利用294
172 暗數(shù)據(jù)、廢棄數(shù)據(jù)和遺留數(shù)據(jù)296
173 案例研究:從郵政編碼到人口統(tǒng)計學(xué)基礎(chǔ)297
174 案例研究:基因序列數(shù)據(jù)庫的科學(xué)推斷298
175 案例研究:將全球變暖與高強(qiáng)度颶風(fēng)聯(lián)系起來298
176 案例研究:用地質(zhì)數(shù)據(jù)推斷氣候趨勢299
177 案例研究:環(huán)月影像恢復(fù)工程299
術(shù)語表301
參考文獻(xiàn)301
第18章 數(shù)據(jù)共享和數(shù)據(jù)安全303
181 什么是數(shù)據(jù)共享,為什么我們不共享更多數(shù)據(jù)303
182 常見的不滿303
183 數(shù)據(jù)安全和加密協(xié)議308
184 案例研究:火星上的生命313
185 案例研究:個人標(biāo)識符314
術(shù)語表315
參考文獻(xiàn)317
第19章 合法性320
191 對數(shù)據(jù)的準(zhǔn)確性和合法性負(fù)責(zé)320
192 創(chuàng)建、使用和共享資源的權(quán)利322
193 因使用標(biāo)準(zhǔn)而招致的版權(quán)和專利侵權(quán)行為324
194 對個人的保護(hù)325
195 許可問題326
196 未經(jīng)許可的數(shù)據(jù)330
197 隱私策略332
198 案例研究:大數(shù)據(jù)的時效性333
199 案例:哈瓦蘇派的故事334
術(shù)語表335
參考文獻(xiàn)336
第20章 社會問題338
201 公眾的大數(shù)據(jù)感知338
202 用大數(shù)據(jù)降低成本和提高生產(chǎn)效率340
203 公眾的疑慮342
204 從自己做起343
205 誰是大數(shù)據(jù)344
206 傲慢和夸張349
207 案例研究:公民科學(xué)家351
208 案例研究:喬治·奧威爾的《1984》354
術(shù)語表354
參考文獻(xiàn)355

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號