注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)挖掘/數(shù)據(jù)倉(cāng)庫(kù)大數(shù)據(jù)技術(shù)

大數(shù)據(jù)技術(shù)

大數(shù)據(jù)技術(shù)

定 價(jià):¥118.00

作 者: 朱揚(yáng)勇 主編
出版社: 上??茖W(xué)技術(shù)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787547860984 出版時(shí)間: 2023-04-01 包裝: 平裝-膠訂
開本: 16開 頁(yè)數(shù): 162 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書全面介紹了數(shù)據(jù)開發(fā)利用技術(shù),包括大數(shù)據(jù)計(jì)算、大數(shù)據(jù)管理、大數(shù)據(jù)安全、大數(shù)據(jù)可視化、數(shù)據(jù)自治、數(shù)據(jù)爬蟲、知識(shí)圖譜、大數(shù)據(jù)挖掘、深度學(xué)習(xí)、區(qū)塊鏈等技術(shù),還特別介紹了數(shù)據(jù)產(chǎn)品生產(chǎn)技術(shù)。這些技術(shù)涵蓋了數(shù)據(jù)獲取與管理、數(shù)據(jù)分析與應(yīng)用、數(shù)據(jù)安全與流通等數(shù)據(jù)開發(fā)利用的各個(gè)環(huán)節(jié),形成一個(gè)較為完整的大數(shù)據(jù)技術(shù)體系。

作者簡(jiǎn)介

  朱揚(yáng)勇,復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院教授、學(xué)術(shù)委員會(huì)主任,上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任,上海市政府信息化專家委員會(huì)專家,中國(guó)計(jì)算機(jī)學(xué)會(huì)大數(shù)據(jù)專家委員會(huì)專家,美國(guó)馬里蘭大學(xué)客座教授。從事數(shù)據(jù)領(lǐng)域研究25年,是很早一批從事數(shù)據(jù)挖掘研究的學(xué)者,是數(shù)據(jù)科學(xué)研究的主要倡導(dǎo)者之一。主持過國(guó)家自然科學(xué)基金、國(guó)家863計(jì)劃項(xiàng)目、上海市科委重點(diǎn)等多項(xiàng)數(shù)據(jù)挖掘領(lǐng)域的研究課題,曾獲上海市科技進(jìn)步一、二、三等獎(jiǎng)。相關(guān)研究成果在具有影響力的外期刊或會(huì)議上發(fā)表論文100余篇,出版專著2本,教材3本。2009年發(fā)表了數(shù)據(jù)科學(xué)論文Data Explosion, Data Nature 等。

圖書目錄

第1章 緒論 1
1.1 大數(shù)據(jù)的技術(shù)挑戰(zhàn) 1
1.1.1 大數(shù)據(jù)的"大"1 
1.1.2 數(shù)據(jù)"大"的技術(shù)挑戰(zhàn) 3 
1.1.3 大數(shù)據(jù)決策的技術(shù)挑戰(zhàn) 5 
1.1.4 數(shù)據(jù)安全的技術(shù)問題 7 
1.2 大數(shù)據(jù)計(jì)算  8
1.2.1 大數(shù)據(jù)文件 9 
1.2.2 大數(shù)據(jù)計(jì)算框架  10 
1.2.3 大數(shù)據(jù)管理  11 
1.3 數(shù)據(jù)開發(fā) 12
1.3.1 數(shù)據(jù)獲取  12 
1.3.2 數(shù)據(jù)分析  13 
1.3.3 數(shù)據(jù)可視化  14 
1.4 數(shù)據(jù)產(chǎn)業(yè)支持 15
1.4.1 數(shù)據(jù)產(chǎn)業(yè)需要的技術(shù)支持  15 
1.4.2 數(shù)據(jù)資產(chǎn)化 16 
1.4.3 數(shù)據(jù)產(chǎn)品及其質(zhì)量  17 
1.4.4 數(shù)據(jù)流通與安全  18 
1.5 小結(jié)  19 
參考文獻(xiàn)  19
第 2章 大數(shù)據(jù)計(jì)算  21
2.1 數(shù)據(jù)訪問21
2.1.1 安全模型  21
2.1.2 訪問控制策略  23 
2.1.3 訪問控制與授權(quán)  24 
2.1.4 訪問控制與審計(jì)  24 
2.2 分布式文件系統(tǒng) 24
2.2.1 GoogleFS  25 
2.2.2 HDFS  27 
2.2.3 GlusterFS  28 
2.2.4 CephFS  29 
2.3 大數(shù)據(jù)計(jì)算框架 30
2.3.1  批處理 30 
2.3.2 流數(shù)據(jù)計(jì)算  38 
2.3.3 增量計(jì)算模型  41 
2.3.4 新興計(jì)算框架  44 
2.3.5 大數(shù)據(jù)計(jì)算框架的發(fā)展  46 
2.4 多地計(jì)算異地計(jì)算模式 48
2.4.1 概念48 
2.4.2 計(jì)算模型  49 
2.4.3 特點(diǎn)  49 2.5 小結(jié) 49 
參考文獻(xiàn)  49
第 3章 大數(shù)據(jù)管理  51
3.1 概述 51 
3.2 分布式文件系統(tǒng) HDFS  52
3.2.1  前提和設(shè)計(jì)目標(biāo) 53 
3.2.2 數(shù)據(jù)塊  53 
3.2.3  HDFS架構(gòu)  54 
3.2.4 HDFS容錯(cuò)機(jī)制  54 
3.3 列式存儲(chǔ)格式 Parquet  55
3.3.1 行存儲(chǔ)與列存儲(chǔ)文件格式  55 
3.3.2 Parquet 概述 56 
3.3.3 數(shù)據(jù)模型 56 
3.3.4 Parquet 文件的存儲(chǔ)格式 57 
3.4 NOSOL  58
3.4.1 鍵值對(duì)數(shù)據(jù)庫(kù)  58 
3.4.2 基于列族的數(shù)據(jù)庫(kù)  59 
3.4.3 基于文檔的數(shù)據(jù)庫(kù)  59 
3.4.4 基于圖的數(shù)據(jù)庫(kù)  60
3.5 鍵值數(shù)據(jù)庫(kù) Redis 60
3.5.1 Redis簡(jiǎn)介 60 
3.5.2 Redis數(shù)據(jù)類型 61 3.5.3 Redis事務(wù) 63 
3.5.4 Redis 持久化機(jī)制 63 
3.6 HBase  63
3.6.1  HBase簡(jiǎn)介  63 
3.6.2 HBase訪問接口 64 
3.6.3 HBase數(shù)據(jù)模型  64 
3.6.4 HBase系統(tǒng)架構(gòu)  65 
3.6.5 HBase存儲(chǔ)格式  66 
3.7 Dynamo67
3.7.1 Dynamo系統(tǒng)設(shè)計(jì)假設(shè)和前提  67 
3.7.2 Dynamo數(shù)據(jù)分布策略  68 
3.7.3 CAP原理  68 
3.7.4 Dynamo 的一致性實(shí)現(xiàn)技術(shù)  69 
3.7.5 Dynamo系統(tǒng)訪問接口 69 
3.8 Cassandra  69 
3.9 MongoDB 70
3.9.1 MongoDB簡(jiǎn)介 70 
3.9.2 MongoDB數(shù)據(jù)模型70 
3.9.3 MongoDB基礎(chǔ)操作71 
3.9.4 MongoDB聚集操作 73 
3.9.5 MongoDB復(fù)制機(jī)制75
3.9.6 MongoDB分片機(jī)制 76 
3.10 Neo4j  76
3.10.1 Neo4j簡(jiǎn)介 76 
3.10.2 Neo4j基礎(chǔ)概念  77 
3.10.3 NeO4j的Cypher查詢語言和模式 78 
......

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)