注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)原理與實(shí)踐:復(fù)雜信息的準(zhǔn)備、共享和分析(原書第2版)

大數(shù)據(jù)原理與實(shí)踐:復(fù)雜信息的準(zhǔn)備、共享和分析(原書第2版)

大數(shù)據(jù)原理與實(shí)踐:復(fù)雜信息的準(zhǔn)備、共享和分析(原書第2版)

定 價(jià):¥119.00

作 者: [美] 朱爾斯-J-伯曼 著,張桂剛 邢春曉 任廣皓 王云譯 譯
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 數(shù)據(jù)科學(xué)與工程技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787111657903 出版時(shí)間: 2020-06-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 372 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  當(dāng)大數(shù)據(jù)資源變得越發(fā)復(fù)雜時(shí),僅靠更強(qiáng)大的計(jì)算機(jī)系統(tǒng)已無(wú)法解決問(wèn)題。本書帶我們重新審視數(shù)據(jù)準(zhǔn)備環(huán)節(jié),重點(diǎn)討論了其中至關(guān)重要但又常常被忽略的主題——標(biāo)識(shí)符、不變性、內(nèi)省和數(shù)據(jù)索引。此外,書中也涵蓋常見(jiàn)的與大數(shù)據(jù)設(shè)計(jì)、架構(gòu)、操作和分析相關(guān)的內(nèi)容,以及涉及法律、社會(huì)和倫理問(wèn)題的非技術(shù)性章節(jié)。全書視角獨(dú)特,涉獵廣博,尤以醫(yī)學(xué)大數(shù)據(jù)分析見(jiàn)長(zhǎng),強(qiáng)調(diào)基本原理,不關(guān)注編程細(xì)節(jié)和數(shù)學(xué)公式,適合企業(yè)決策者、技術(shù)專家以及計(jì)算機(jī)相關(guān)專業(yè)的學(xué)生閱讀。

作者簡(jiǎn)介

  朱爾斯·J 伯曼(Jules J Berman) 擁有麻省理工學(xué)院數(shù)學(xué)和地球與行星科學(xué)兩個(gè)學(xué)士學(xué)位,天普大學(xué)哲學(xué)博士學(xué)位,以及邁阿密大學(xué)醫(yī)學(xué)博士學(xué)位。撰寫信息科學(xué)、計(jì)算機(jī)程序設(shè)計(jì)和病理學(xué)三個(gè)專業(yè)領(lǐng)域的著作近20本。2006年,伯曼博士成為美國(guó)病理信息學(xué)協(xié)會(huì)主席,2011年榮獲該協(xié)會(huì)終身成就獎(jiǎng)。

圖書目錄

譯者序
第2版前言
第1版前言
作者簡(jiǎn)介
第1章 引言1
11 大數(shù)據(jù)的定義1
12 大數(shù)據(jù)與小數(shù)據(jù)2
13 大數(shù)據(jù)在哪里5
14 大數(shù)據(jù)最常見(jiàn)的目的是產(chǎn)生小數(shù)據(jù)6
15 大數(shù)據(jù)是研究領(lǐng)域的中心話題6
術(shù)語(yǔ)表7
參考文獻(xiàn)11
第2章 為非結(jié)構(gòu)化數(shù)據(jù)提供結(jié)構(gòu)13
21 幾乎所有數(shù)據(jù)都是非結(jié)構(gòu)化的、
 不可用的原始形式13
22 詞匯索引14
23 術(shù)語(yǔ)提取16
24 構(gòu)建索引19
25 自動(dòng)編碼20
26 案例研究:宇宙中任意原子精確位置的快速定位(需要安裝一些軟件)24
27 案例研究(高級(jí)):一個(gè)完整的自動(dòng)編碼器(12行Python代碼)26
28 案例研究:以詞匯索引進(jìn)行文本轉(zhuǎn)換28
29 案例研究(高級(jí)):Burrows Wheeler變換30
術(shù)語(yǔ)表32
參考文獻(xiàn)43
第3章 標(biāo)識(shí)、去標(biāo)識(shí)和重標(biāo)識(shí)45
31 什么是標(biāo)識(shí)符45
32 標(biāo)識(shí)符和標(biāo)識(shí)系統(tǒng)之間的區(qū)別46
33 生成唯一標(biāo)識(shí)符48
34 糟糕的標(biāo)識(shí)方法50
35 注冊(cè)唯一對(duì)象標(biāo)識(shí)符53
36 去標(biāo)識(shí)和重標(biāo)識(shí)55
37 案例研究:數(shù)據(jù)清理57
38 案例研究(高級(jí)):圖像標(biāo)題中的標(biāo)識(shí)符59
39 案例研究:?jiǎn)蜗蛏⒘泻瘮?shù)61
術(shù)語(yǔ)表63
參考文獻(xiàn)69
第4章 元數(shù)據(jù)、語(yǔ)義和三元組71
41 元數(shù)據(jù)71
42 可擴(kuò)展標(biāo)記語(yǔ)言71
43 語(yǔ)義和三元組72
44 命名空間74
45 案例研究:三元組的語(yǔ)法75
46 案例研究:Dublin Core77
術(shù)語(yǔ)表78
參考文獻(xiàn)80
第5章 分類和本體論81
51 關(guān)于對(duì)象關(guān)系的全部81
52 分類:最簡(jiǎn)單的本體84
53 本體:有多個(gè)父類的類86
54 分類模型選擇88
55 類混合91
56 本體開(kāi)發(fā)的常見(jiàn)陷阱92
57 案例研究:上層本體93
58 案例研究(高級(jí)):悖論94
59 案例研究(高級(jí)):RDF框架和類屬性96
510 案例研究(高級(jí)):可視化類關(guān)系98
術(shù)語(yǔ)表102
參考文獻(xiàn)111
第6章 內(nèi)省113
61 自我認(rèn)知113
62 數(shù)據(jù)對(duì)象:每個(gè)大數(shù)據(jù)集合中最基本的元素116
63 大數(shù)據(jù)如何使用內(nèi)省117
64 案例研究:時(shí)間戳數(shù)據(jù)119
65 案例研究:TripleStore 簡(jiǎn)介121
66 案例研究(高級(jí)):大數(shù)據(jù)必須是面向?qū)ο蟮淖C明125
術(shù)語(yǔ)表126
參考文獻(xiàn)127
第7章 標(biāo)準(zhǔn)和數(shù)據(jù)集成128
71 標(biāo)準(zhǔn)128
72 規(guī)范與標(biāo)準(zhǔn)132
73 版本控制134
74 合規(guī)問(wèn)題135
75 案例研究:標(biāo)準(zhǔn)化巧克力茶壺135
術(shù)語(yǔ)表136
參考文獻(xiàn)137
第8章 不變性和永久性139
81 數(shù)據(jù)不變性的重要性139
82 不變性和標(biāo)識(shí)符140
83 數(shù)據(jù)產(chǎn)生數(shù)據(jù)142
84 跨機(jī)構(gòu)協(xié)調(diào)標(biāo)識(shí)符143
85 案例研究:可信時(shí)間戳144
86 案例研究:區(qū)塊鏈和分布式賬本145
87 案例研究(高級(jí)):零知識(shí)協(xié)調(diào)147
術(shù)語(yǔ)表148
參考文獻(xiàn)150
第9章 評(píng)估大數(shù)據(jù)資源的充分性152
91 觀察數(shù)據(jù)152
92 大數(shù)據(jù)的最小必要屬性158
93 附加條件的數(shù)據(jù)161
94 案例研究:用于查看和搜索大型文件的實(shí)用程序162
95 案例研究:數(shù)據(jù)扁平化164
術(shù)語(yǔ)表164
參考文獻(xiàn)169
第10章 測(cè)量170
101 準(zhǔn)確性與精度170
102 數(shù)據(jù)范圍171
103 計(jì)數(shù)173
104 數(shù)據(jù)標(biāo)準(zhǔn)化和變換176
105 約簡(jiǎn)數(shù)據(jù)179
106 理解控制181
107 沒(méi)有實(shí)際意義的統(tǒng)計(jì)意義182
108 案例研究:基因計(jì)數(shù)183
109 案例研究:早期生物特征和狹窄數(shù)據(jù)范圍的意義184
術(shù)語(yǔ)表185
參考文獻(xiàn)186
第11章 快速簡(jiǎn)單的大數(shù)據(jù)分析必不可少的技巧188
111 速度和可擴(kuò)展性188
112 適用于大數(shù)據(jù)的快速操作,并且每臺(tái)計(jì)算機(jī)都支持193
113 點(diǎn)積—一種簡(jiǎn)單快速的相關(guān)方法197
114 聚類199
115 數(shù)據(jù)持久性方法(不使用數(shù)據(jù)庫(kù))201
116 案例研究:爬升分類202
117 案例研究(高級(jí)):數(shù)據(jù)庫(kù)示例203
118 案例研究(高級(jí)):NoSQL205
術(shù)語(yǔ)表205
參考文獻(xiàn)209
第12章 尋找大型數(shù)據(jù)集中的線索211
121 分母211
122 詞頻分布212
123 異常值和異常215
124 封底分析216
125 案例研究:預(yù)測(cè)用戶偏好218
126 案例研究:人口數(shù)據(jù)的多模態(tài)219
127 案例研究:大小黑洞220
術(shù)語(yǔ)表220
參考文獻(xiàn)224
第13章 使用隨機(jī)數(shù)將大數(shù)據(jù)分析問(wèn)題的規(guī)??s小225
131?。▊危╇S機(jī)數(shù)的顯著效用225
132 重采樣230
133 蒙特卡羅模擬法234
134 案例研究:中心極限定理的證明236
135 案例研究:發(fā)生一連串小概率事件的頻率237
136 案例研究:臭名昭著的生日問(wèn)題238
137 案例研究(高級(jí)):蒙提霍爾問(wèn)題239
138 案例研究(高級(jí)):貝葉斯分析241
術(shù)語(yǔ)表242
參考文獻(xiàn)244
第14章 大數(shù)據(jù)分析中的特殊注意事項(xiàng)246
141 數(shù)據(jù)搜索理論246
142 理論搜索中的數(shù)據(jù)247
143 巨大的偏差248
144 大數(shù)據(jù)的數(shù)據(jù)子集:不可加和不傳遞251
145 其他大數(shù)據(jù)陷阱252
146 案例研究(高級(jí)):維數(shù)災(zāi)難254
術(shù)語(yǔ)表257
參考文獻(xiàn)258
第15章 大數(shù)據(jù)的失敗以及如何避免260
151 失敗很常見(jiàn)260
152 失敗的標(biāo)準(zhǔn)261
153 復(fù)雜性264
154 逐步走進(jìn)大數(shù)據(jù)分析265
155 失敗之后272
156 案例研究:癌癥生物醫(yī)學(xué)信息學(xué)網(wǎng)格—遙遠(yuǎn)的橋273
157 案例研究:高斯Copula函數(shù)277
術(shù)語(yǔ)表278
參考文獻(xiàn)280
第16章 數(shù)據(jù)再分析:比分析更重要283
161 第一次分析(幾乎)總是錯(cuò)的283
162 為什么再分析比分析更重要285
163 案例研究:舊JADE對(duì)撞機(jī)數(shù)據(jù)的再分析287
164 案例研究:通過(guò)再分析證明287
165 案例研究:從舊數(shù)據(jù)中尋找新行星288
術(shù)語(yǔ)表289
參考文獻(xiàn)290
第17章 大數(shù)據(jù)再利用294
171 什么是數(shù)據(jù)再利用294
172 暗數(shù)據(jù)、廢棄數(shù)據(jù)和遺留數(shù)據(jù)296
173 案例研究:從郵政編碼到人口統(tǒng)計(jì)學(xué)基礎(chǔ)297
174 案例研究:基因序列數(shù)據(jù)庫(kù)的科學(xué)推斷298
175 案例研究:將全球變暖與高強(qiáng)度颶風(fēng)聯(lián)系起來(lái)298
176 案例研究:用地質(zhì)數(shù)據(jù)推斷氣候趨勢(shì)299
177 案例研究:環(huán)月影像恢復(fù)工程299
術(shù)語(yǔ)表301
參考文獻(xiàn)301
第18章 數(shù)據(jù)共享和數(shù)據(jù)安全303
181 什么是數(shù)據(jù)共享,為什么我們不共享更多數(shù)據(jù)303
182 常見(jiàn)的不滿303
183 數(shù)據(jù)安全和加密協(xié)議308
184 案例研究:火星上的生命313
185 案例研究:個(gè)人標(biāo)識(shí)符314
術(shù)語(yǔ)表315
參考文獻(xiàn)317
第19章 合法性320
191 對(duì)數(shù)據(jù)的準(zhǔn)確性和合法性負(fù)責(zé)320
192 創(chuàng)建、使用和共享資源的權(quán)利322
193 因使用標(biāo)準(zhǔn)而招致的版權(quán)和專利侵權(quán)行為324
194 對(duì)個(gè)人的保護(hù)325
195 許可問(wèn)題326
196 未經(jīng)許可的數(shù)據(jù)330
197 隱私策略332
198 案例研究:大數(shù)據(jù)的時(shí)效性333
199 案例:哈瓦蘇派的故事334
術(shù)語(yǔ)表335
參考文獻(xiàn)336
第20章 社會(huì)問(wèn)題338
201 公眾的大數(shù)據(jù)感知338
202 用大數(shù)據(jù)降低成本和提高生產(chǎn)效率340
203 公眾的疑慮342
204 從自己做起343
205 誰(shuí)是大數(shù)據(jù)344
206 傲慢和夸張349
207 案例研究:公民科學(xué)家351
208 案例研究:?jiǎn)讨?middot;奧威爾的《1984》354
術(shù)語(yǔ)表354
參考文獻(xiàn)355

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)