注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)自動(dòng)化技術(shù)、計(jì)算技術(shù)大數(shù)據(jù)技術(shù)前沿

大數(shù)據(jù)技術(shù)前沿

大數(shù)據(jù)技術(shù)前沿

定 價(jià):¥89.00

作 者: 阮彤,王吳奮,陳為 等 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787121282713 出版時(shí)間: 2016-03-01 包裝: 平裝
開本: 16開 頁數(shù): 284 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本選題以科普的方式系統(tǒng)地闡述了大數(shù)據(jù)前沿技術(shù)與研究進(jìn)展,對(duì)技術(shù)的來源、結(jié)論、對(duì)比、用途以及開源軟件進(jìn)行了深入淺出的描述,并不過多地涉及數(shù)學(xué)符號(hào)及基礎(chǔ)原理。以大數(shù)據(jù)可視化為切入點(diǎn),通過自然語言處理、社交網(wǎng)絡(luò)挖掘、語義網(wǎng)絡(luò)與知識(shí)圖譜三方面非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù),闡述大數(shù)據(jù)經(jīng)典應(yīng)用,利用基于圖數(shù)據(jù)庫、內(nèi)存計(jì)算、分布式存儲(chǔ)系統(tǒng)的大數(shù)據(jù)存儲(chǔ)與管理作為大數(shù)據(jù)平臺(tái)支撐,進(jìn)而探討基于眾包技術(shù)擴(kuò)充數(shù)據(jù)來源與提高數(shù)據(jù)質(zhì)量,并圍繞大數(shù)據(jù)環(huán)境下的隱私保護(hù)問題,探討了大數(shù)據(jù)安全技術(shù)。

作者簡(jiǎn)介

  阮彤,中科院軟件所博士,現(xiàn)任華東理工大學(xué)計(jì)算機(jī)技術(shù)研究所副所長,自然語言處理與大數(shù)據(jù)挖掘?qū)嶒?yàn)室主任,副教授。中國計(jì)算機(jī)學(xué)會(huì)(CCF)大數(shù)據(jù)專委會(huì)委員,中文信息處理學(xué)會(huì)“CCIR”專委會(huì)委員,中關(guān)村大數(shù)據(jù)聯(lián)盟學(xué)術(shù)委員會(huì)主任委員。

圖書目錄

第1章 大數(shù)據(jù)可視化 1
1.1 可視化基礎(chǔ) 2
1.1.1 可視化釋義 2
1.1.2 可視化流程 5
1.1.3 可視化對(duì)象 6
1.1.4 可視化方法 10
1.2 大數(shù)據(jù)可視化介紹 36
1.2.1 大數(shù)據(jù)可視化特點(diǎn) 37
1.2.2 大尺度數(shù)據(jù)的可視化 38
1.2.3 快速變化數(shù)據(jù)的可視化 41
1.2.4 多變量數(shù)據(jù)的可視化 44
1.2.5 非結(jié)構(gòu)化數(shù)據(jù)的可視化 50
1.2.6 大數(shù)據(jù)可視分析 53
1.3 可視化與可視分析研發(fā)資源 60
1.3.1 代表性開源與商業(yè)軟件 60
1.3.2 開發(fā)工具與編程語言 61
1.3.3 可視化信息資源 62
1.3.4 部分可視化科研機(jī)構(gòu) 63
參考文獻(xiàn) 64
第2章 文本大數(shù)據(jù)處理 67
2.1 文本大數(shù)據(jù)概述 67
2.2 中文詞法分析 70
2.3 句法分析 73
2.4 語義分析 74
2.5 開源項(xiàng)目與共享工具 75
2.6 文本大數(shù)據(jù)的部分應(yīng)用 76
2.6.1 概述 76
2.6.2 基于雙數(shù)組Trie樹的面向微博短文本的分詞 77
2.6.3 詞義消歧 80
2.6.4 未登錄詞識(shí)別 83
2.6.5 文本分類與文本聚類 84
2.6.6 機(jī)器翻譯 86
2.6.7 其他應(yīng)用 87
參考文獻(xiàn) 89
第3章 社交網(wǎng)絡(luò)大數(shù)據(jù)挖掘 91
3.1 概述 91
3.2 大規(guī)模異構(gòu)網(wǎng)絡(luò)集成 94
3.2.1 計(jì)算模型――COSNET 96
3.2.2 模型求解 98
3.2.3 實(shí)驗(yàn)結(jié)果 99
3.3 基于交互的網(wǎng)絡(luò)機(jī)器學(xué)習(xí) 101
3.3.1 網(wǎng)絡(luò)數(shù)據(jù)的主動(dòng)交互學(xué)習(xí) 101
3.3.2 算法模型――MaxCo 102
3.3.3 網(wǎng)絡(luò)流數(shù)據(jù)的主動(dòng)交互學(xué)習(xí) 103
3.3.4 算法模型 104
3.4 基于隨機(jī)路徑的高效網(wǎng)絡(luò)拓?fù)湎嗨贫人惴?106
3.4.1 問題定義 107
3.4.2 基于隨機(jī)路徑的網(wǎng)絡(luò)拓?fù)湎嗨贫人惴èD―Panther 107
3.4.3 實(shí)驗(yàn)結(jié)果 110
3.4.4 小結(jié) 113
3.5 個(gè)體行為與網(wǎng)絡(luò)分布的統(tǒng)一建??蚣塄D―M3D 113
3.5.1 研究方案 114
3.5.2 實(shí)驗(yàn)驗(yàn)證 115
3.6 總結(jié)和展望 117
參考文獻(xiàn) 117
第4章 語義大數(shù)據(jù)――知識(shí)圖譜 119
4.1 大規(guī)模知識(shí)圖譜技術(shù) 119
4.1.1 知識(shí)圖譜的表示及其在搜索中的展現(xiàn)形式 119
4.1.2 知識(shí)圖譜的構(gòu)建 121
4.1.3 知識(shí)圖譜在搜索中的應(yīng)用 126
4.1.4 總結(jié) 127
4.2 行業(yè)知識(shí)圖譜工具 127
4.2.1 簡(jiǎn)介 127
4.2.2 常見的行業(yè)知識(shí)圖譜 129
4.2.3 行業(yè)知識(shí)圖譜的構(gòu)建 131
4.2.4 行業(yè)知識(shí)圖譜的應(yīng)用 139
4.2.5 應(yīng)用案例 141
第5章 圖數(shù)據(jù)庫――基于圖的大數(shù)據(jù)管理 147
5.1 圖數(shù)據(jù)庫簡(jiǎn)介 147
5.1.1 大圖數(shù)據(jù) 148
5.1.2 OLTP與OLAP 149
5.1.3 圖數(shù)據(jù)模型 151
5.1.4 圖查詢語言 154
5.2 主流圖數(shù)據(jù)庫和圖計(jì)算引擎 160
5.2.1 最流行的圖數(shù)據(jù)庫――Neo4j 160
5.2.2 分布式圖數(shù)據(jù)庫――Titan 161
5.2.3 基于RDF三元組庫的圖數(shù)據(jù)庫――Blazegraph 162
5.2.4 基于Pregel框架的圖計(jì)算引擎――Giraph、Hama、
GraphLab、GraphX 163
5.3 圖數(shù)據(jù)庫關(guān)鍵技術(shù) 166
5.3.1 圖數(shù)據(jù)庫的存儲(chǔ) 166
5.3.2 圖數(shù)據(jù)庫的索引 169
5.3.3 圖數(shù)據(jù)庫的查詢處理 172
5.4 圖數(shù)據(jù)庫應(yīng)用 175
5.4.1 語義萬維網(wǎng) 175
5.4.2 社會(huì)網(wǎng)絡(luò) 176
5.4.3 生物信息學(xué) 177
第6章 內(nèi)存計(jì)算――高速大數(shù)據(jù)處理的核心技術(shù) 179
6.1 內(nèi)存計(jì)算技術(shù)的一個(gè)誤區(qū) 179
6.2 TimesTen的設(shè)計(jì)思路 180
6.3 Apache Spark的設(shè)計(jì)思路 182
6.4 SAP HANA的設(shè)計(jì)思路 184
6.5 YunTable 4.0的產(chǎn)品介紹 186
6.5.1 整體架構(gòu)與核心技術(shù) 186
6.5.2 MPP 188
6.5.3 列存2.0 188
6.5.4 動(dòng)態(tài)數(shù)據(jù)分發(fā) 190
6.5.5 內(nèi)存計(jì)算 191
6.5.6 性能和路線圖 191
6.6 總結(jié) 192
第7章 分布式存儲(chǔ)系統(tǒng)――大數(shù)據(jù)存儲(chǔ)支撐技術(shù) 193
7.1 大數(shù)據(jù)對(duì)存儲(chǔ)系統(tǒng)帶來的挑戰(zhàn)及其引發(fā)的變革 193
7.2 谷歌文件系統(tǒng)(GFS) 194
7.2.1 支持大數(shù)據(jù)集存取和離線批處理的分布式存儲(chǔ)系統(tǒng) 194
7.2.2 GFS架構(gòu)分析 195
7.2.3 系統(tǒng)交互 202
7.2.4 主節(jié)點(diǎn)的設(shè)計(jì) 206
7.2.5 容錯(cuò)和診斷 211
7.2.6 小結(jié) 214
7.3 支持海量數(shù)據(jù)和大規(guī)模并發(fā)訪問的分布式對(duì)象存儲(chǔ)
OpenStack Swift 214
7.3.1 互聯(lián)網(wǎng)化帶來新的存儲(chǔ)需求 214
7.3.2 OpenStack Swift的特點(diǎn) 216
7.3.3 Swift的數(shù)據(jù)模型和架構(gòu) 219
7.3.4 Swift的API 236
第8章 大數(shù)據(jù)安全技術(shù) 243
8.1 差分隱私保護(hù)方法簡(jiǎn)介 243
8.2 差分隱私研究保護(hù)方向――數(shù)據(jù)發(fā)布和數(shù)據(jù)挖掘 246
8.2.1 基于差分隱私保護(hù)的數(shù)據(jù)發(fā)布(DPDR) 246
8.2.2 差分隱私保護(hù)數(shù)據(jù)挖掘(DPDM) 247
8.3 常見隱私保護(hù)方法 247
8.3.1 差分隱私保護(hù)分類方法 247
8.3.2 差分隱私保護(hù)聚類方法 248
8.3.3 差分隱私頻繁模式挖掘 249
8.4 應(yīng)用案例和原型系統(tǒng) 249
參考文獻(xiàn) 251
第9章 眾包――數(shù)據(jù)來源與質(zhì)量保證 255
9.1 眾包 255
9.1.1 眾包的概念和模型 255
9.1.2 眾包的優(yōu)劣分析 257
9.2 眾包的關(guān)鍵技術(shù) 257
9.2.1 眾包流程 257
9.2.2 任務(wù)設(shè)計(jì) 259
9.2.3 任務(wù)分配 260
9.2.4 任務(wù)動(dòng)態(tài)優(yōu)化 261
9.2.5 眾包激勵(lì)機(jī)制 261
9.2.6 眾包質(zhì)量保障 263
9.3 眾包的成功案例和平臺(tái) 264
9.3.1 知識(shí)百科眾包 264
9.3.2 數(shù)據(jù)眾包 264
9.3.3 創(chuàng)新眾包 266
9.3.4 軟件眾包 267
9.3.5 眾籌 268
9.3.6 通用智力勞動(dòng)眾包 269
9.3.7 中國的眾包平臺(tái) 269
9.4 眾包研究趨勢(shì) 269
9.5 總結(jié)和展望 271
參考文獻(xiàn) 271

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)