注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)浪潮:大數(shù)據(jù)整體解決方案及關(guān)鍵技術(shù)探索

大數(shù)據(jù)浪潮:大數(shù)據(jù)整體解決方案及關(guān)鍵技術(shù)探索

大數(shù)據(jù)浪潮:大數(shù)據(jù)整體解決方案及關(guān)鍵技術(shù)探索

定 價(jià):¥53.80

作 者: 陳敏
出版社: 華中科技大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘 數(shù)據(jù)庫(kù)

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787568012706 出版時(shí)間: 2015-11-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 260 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  本書(shū)站在大數(shù)據(jù)學(xué)科發(fā)展前沿和大數(shù)據(jù)產(chǎn)業(yè)發(fā)展方向上,結(jié)合學(xué)術(shù)界和工業(yè)界的研究成果和實(shí)踐經(jīng)驗(yàn),傳播大數(shù)據(jù)領(lǐng)域的研究動(dòng)態(tài)和先進(jìn)技術(shù)。全書(shū)通過(guò)“基礎(chǔ)、進(jìn)階、實(shí)戰(zhàn)、應(yīng)用”四個(gè)篇章,既深入淺出地介紹大數(shù)據(jù)的基本概念,又面面俱到地剖析了大數(shù)據(jù)整體解決方案所涉及的具體技術(shù)細(xì)節(jié)。本書(shū)既適合初學(xué)者作為基礎(chǔ)學(xué)習(xí)資料,又適合科研人員作為理論研究教程,更適合從業(yè)人員作為技術(shù)參考書(shū)目。

作者簡(jiǎn)介

  陳敏,男,1980年12月出生,教授,博士生導(dǎo)師,華中科技大學(xué)嵌入與普適計(jì)算實(shí)驗(yàn)室主任,23歲獲華南理工大學(xué)通信與信息系統(tǒng)博士學(xué)位。發(fā)表學(xué)術(shù)論文180余篇,其中包括SCI論文90余篇,IEEE/ACM期刊論文40余篇;相關(guān)論文在美國(guó)科技信息索引SCI 數(shù)據(jù)庫(kù)中他引總數(shù)500次,Google Scholar中引用總數(shù)超過(guò)4250次,單篇論文引用超高520次,其中十篇第一作者論著引用次數(shù)超過(guò)1800次,H-index = 29;曾獲第五屆國(guó)際異構(gòu)網(wǎng)服務(wù)質(zhì)量大會(huì)QShine 2008最佳論文獎(jiǎng)和IEEE ICC 2012最佳論文獎(jiǎng)。2012年入選國(guó)家第二批“青年千人計(jì)劃”,長(zhǎng)期從事普適計(jì)算、移動(dòng)通信、多媒體通信、傳感網(wǎng)、云計(jì)算、遠(yuǎn)程醫(yī)療等領(lǐng)域的研究工作,擔(dān)任Information Science等7個(gè)國(guó)際SCI學(xué)術(shù)期刊的副編輯或編委,以及IEEE Wireless Communications及IEEE Network等多個(gè)著名國(guó)際雜志及期刊的特邀編輯。任IEEE CIT 2012,TRIDENTCOM 2014,Mobimedia 2015等國(guó)際學(xué)術(shù)大會(huì)副總主席,任Cloudcomp 2014/2015大會(huì)指導(dǎo)委員會(huì)成員。陳敏教授具有多年海外工作經(jīng)驗(yàn),曾在韓國(guó)國(guó)立漢城大學(xué)、加拿大不列顛哥倫比亞大學(xué)從事博士后研究,曾任韓國(guó)首爾大學(xué)助理教授。1999年入選國(guó)際電子電氣工程師學(xué)會(huì)(IEEE)高級(jí)會(huì)員,2014年擔(dān)任IEEE計(jì)算機(jī)協(xié)會(huì)大數(shù)據(jù)技術(shù)委員會(huì)主席。入選愛(ài)思唯爾2014年中國(guó)高被引學(xué)者。

圖書(shū)目錄

目錄
1大數(shù)據(jù)背景(8)
1.1大數(shù)據(jù)時(shí)代的到來(lái)(8)
1.2大數(shù)據(jù)定義及特征(4)
1.3大數(shù)據(jù)價(jià)值(6)
1.4大數(shù)據(jù)備受關(guān)注(7)
1.5大數(shù)據(jù)帶來(lái)的挑戰(zhàn)(8)
2大數(shù)據(jù)基礎(chǔ)(10)
2.1云計(jì)算(10)
2.1.1云計(jì)算概述(10)
2.1.2云計(jì)算與大數(shù)據(jù)的聯(lián)系(12)
2.2物聯(lián)網(wǎng)(13)
2.2.1物聯(lián)網(wǎng)概述(13)
2.2.2物聯(lián)網(wǎng)與大數(shù)據(jù)(14)
2.3數(shù)據(jù)中心(14)
2.3.1數(shù)據(jù)中心概述(14)
2.3.2數(shù)據(jù)中心與大數(shù)據(jù)(15)
3大數(shù)據(jù)的生成和采集(19)
3.1大數(shù)據(jù)生成(19)
3.1.1企業(yè)內(nèi)部數(shù)據(jù)(19)
3.1.2物聯(lián)網(wǎng)數(shù)據(jù)(20)
3.1.3互聯(lián)網(wǎng)數(shù)據(jù)(21)
3.1.4生物醫(yī)療數(shù)據(jù)(21)
3.1.5其他科學(xué)數(shù)據(jù)(22)
3.2大數(shù)據(jù)采集(22)
3.2.1數(shù)據(jù)收集(23)
3.2.2數(shù)據(jù)傳輸(25)
3.2.3數(shù)據(jù)預(yù)處理(26)
4大數(shù)據(jù)存儲(chǔ)(28)
4.1海量存儲(chǔ)系統(tǒng)(28)
4.2分布式存儲(chǔ)系統(tǒng)(29)
4.3大數(shù)據(jù)存儲(chǔ)機(jī)制(31)
4.3.1數(shù)據(jù)庫(kù)技術(shù)(32)
4.3.2數(shù)據(jù)庫(kù)編程模型(36)
5大數(shù)據(jù)分析(39)
5.1傳統(tǒng)數(shù)據(jù)分析方法(39)
5.2大數(shù)據(jù)分析方法(40)
5.3大數(shù)據(jù)分析架構(gòu)(42)
5.4大數(shù)據(jù)挖掘和分析軟件(43)
大數(shù)據(jù)浪潮——大數(shù)據(jù)整體解決方案及關(guān)鍵技術(shù)探索目錄6大數(shù)據(jù)整體解決方案(47)
6.1大數(shù)據(jù)解決方案方法論(47)
6.1.1大數(shù)據(jù)解決方案參考模型(48)
6.1.2大數(shù)據(jù)解決方案分類(lèi)(49)
6.2大數(shù)據(jù)硬件平臺(tái)(50)
6.2.1可擴(kuò)展性設(shè)計(jì)(51)
6.2.2可定制性設(shè)計(jì)(52)
6.3大數(shù)據(jù)軟件系統(tǒng)(55)
6.3.1大數(shù)據(jù)處理系統(tǒng)核心模塊(55)
6.3.2發(fā)行版增強(qiáng)功能、企業(yè)應(yīng)用優(yōu)化和增值服務(wù)(56)
6.3.3基于內(nèi)存計(jì)算的大數(shù)據(jù)處理系統(tǒng)(60)
6.4大數(shù)據(jù)典型處理流程(63)
6.5大數(shù)據(jù)一體化解決方案比較(67)
7分布式文件系統(tǒng)HDFS(72)
7.1Hadoop I/O操作(72)
7.1.1I/O操作中的數(shù)據(jù)檢查(73)
7.1.2數(shù)據(jù)的壓縮(76)
7.1.3數(shù)據(jù)的I/O中序列化操作(78)
7.2Hadoop文件系統(tǒng)(87)
7.3HDFS體系結(jié)構(gòu)(89)
7.3.1HDFS的特點(diǎn)和局限(89)
7.3.2HDFS相關(guān)概念(90)
7.3.3HDFS架構(gòu)(91)
7.4 HDFS文件結(jié)構(gòu)(94)
7.4.1NameNode的文件結(jié)構(gòu)(94)
7.4.2編輯日志(edit log)及文件系統(tǒng)映像(filesystem image)(95)
7.4.3Secondary NameNode的目錄結(jié)構(gòu)(96)
7.4.4DataNode的目錄結(jié)構(gòu)(97)
7.5HDFS讀/寫(xiě)數(shù)據(jù)流(98)
7.5.1文件的讀取(98)
7.5.2文件的寫(xiě)入(99)
7.5.3一致性模型(101)
7.6HDFS命令詳解(102)
7.6.1通過(guò)distcp進(jìn)行并行復(fù)制(102)
7.6.2HDFS平衡(103)
7.6.3其他命令(103)
8并行編程模型MapReduce(108)
8.1MapReduce體系結(jié)構(gòu)(108)
8.1.1MapReduce基本模型(108)
8.1.2MapReduce作業(yè)執(zhí)行流程(108)
8.2MapReduce關(guān)鍵流程詳解(110)
8.2.1partiton過(guò)程(110)
8.2.2combine過(guò)程(111)
8.2.3shuffle過(guò)程(112)
8.3MapReduce高級(jí)應(yīng)用(114)
8.3.1二次排序(114)
8.3.2全排序(119)
8.3.3分布式緩存(121)
8.3.4MapReduce 小文件處理與文件壓縮(123)
8.3.5MapReduce負(fù)載均衡(125)
9NoSQL數(shù)據(jù)庫(kù)HBase(128)
9.1HBase體系結(jié)構(gòu)(128)
9.2RowKey的設(shè)計(jì)與數(shù)據(jù)訪(fǎng)問(wèn)(132)
9.3過(guò)濾器(135)
9.3.1比較過(guò)濾器(137)
9.3.2專(zhuān)用過(guò)濾器(137)
9.3.3附加過(guò)濾器(139)
9.3.4FilterList(139)
9.3.5自定義過(guò)濾器(140)
9.4HBase多維數(shù)據(jù)訪(fǎng)問(wèn)(142)
9.4.1通過(guò)Filter實(shí)現(xiàn)(142)
9.4.2通過(guò)設(shè)計(jì)RowKey實(shí)現(xiàn)(143)
9.5協(xié)處理器Coprocessor(143)
9.5.1Coprocessor類(lèi)(144)
9.5.2協(xié)處理器的加載(144)
9.5.3觀(guān)察者(146)
9.5.4終端(150)
9.6二級(jí)索引(154)
9.6.1全局索引(global index)(154)
9.6.2本地索引(local index)(155)
10交互式查詢(xún)語(yǔ)言Hive(157)
10.1Hive體系結(jié)構(gòu)(157)
10.1.1Hive客戶(hù)端(159)
10.1.2Metastore(159)
10.2Hive數(shù)據(jù)類(lèi)型(160)
10.2.1基本類(lèi)型(161)
10.2.2復(fù)雜類(lèi)型(161)
10.3Hive存儲(chǔ)方式和壓縮類(lèi)型(162)
10.3.1托管表和外部表(162)
10.3.2存儲(chǔ)方式(163)
10.4Hive關(guān)鍵技術(shù)(164)
10.4.1HiveQL簡(jiǎn)介(164)
10.4.2Hive表的創(chuàng)建(165)
10.4.3Hive表的數(shù)據(jù)加載(166)
10.4.4Hive表的查詢(xún)(167)
10.4.5Hive表的更改(170)
10.4.6Hive表的刪除(171)
10.4.7Hive表的分區(qū)(171)
10.4.8Hive表的分桶(173)
10.4.9用戶(hù)定義函數(shù)(174)
10.5Hive優(yōu)化技術(shù)(175)
10.5.1Join優(yōu)化(175)
10.5.2數(shù)據(jù)傾斜優(yōu)化(176)
10.5.3Map和Reduce個(gè)數(shù)控制(177)
11資源管理和調(diào)度框架——YARN(180)
11.1MRv1架構(gòu)面臨的問(wèn)題(180)
11.2YARN架構(gòu)(181)
11.2.1YARN整體架構(gòu)(181)
11.2.2RM組件的作用(183)
11.2.3AM組件的作用(184)
11.2.4NM組件的作用(185)
11.2.5運(yùn)行在YARN上的計(jì)算框架(186)
11.2.6在YARN上定制計(jì)算框架(187)
11.3YARN管理后臺(tái)簡(jiǎn)介(188)
11.4YARN資源調(diào)度(192)
12內(nèi)存計(jì)算引擎Spark(197)
12.1Spark簡(jiǎn)介(197)
12.2Spark整體架構(gòu)(198)
12.3Spark核心概念(199)
12.3.1彈性分布式數(shù)據(jù)集(199)
12.3.2RDD模型的優(yōu)點(diǎn)(200)
12.3.3Spark DAG(201)
12.4Spark編程模型(202)
12.4.1Spark初始化(203)
12.4.2RDDs(203)
12.4.3Shared Variables(205)
12.5Spark相關(guān)組件(207)
12.6Spark應(yīng)用實(shí)例(208)
12.6.1InMemory Analytics(208)
12.6.2Traffic Modeling(209)
12.6.3Twitter Spam Classification (209)
13大數(shù)據(jù)應(yīng)用(213)
13.1大數(shù)據(jù)應(yīng)用演化(213)
13.2大數(shù)據(jù)分析的關(guān)鍵領(lǐng)域(214)
13.2.1結(jié)構(gòu)化數(shù)據(jù)分析(214)
13.2.2文本分析(215)
13.2.3Web分析(216)
13.2.4多媒體分析(217)
13.2.5網(wǎng)絡(luò)分析(218)
13.2.6移動(dòng)分析(219)
14大數(shù)據(jù)案例分析(221)
14.1物聯(lián)網(wǎng)大數(shù)據(jù)(221)
14.1.1物聯(lián)網(wǎng)大數(shù)據(jù)的表示(222)
14.1.2物聯(lián)網(wǎng)大數(shù)據(jù)的預(yù)處理(223)
14.1.3物聯(lián)網(wǎng)大數(shù)據(jù)的快速處理(224)
14.1.4物聯(lián)網(wǎng)大數(shù)據(jù)的并行分析(226)
14.1.5物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的搭建(227)
14.2其他大數(shù)據(jù)的典型應(yīng)用(231)
14.2.1企業(yè)級(jí)應(yīng)用(231)
14.2.2社交網(wǎng)絡(luò)大數(shù)據(jù)(232)
14.2.3醫(yī)療健康(234)
14.2.4群智感知(235)
14.2.5智能電網(wǎng)(235)
15總結(jié)(237)
15.1大數(shù)據(jù)的研究熱點(diǎn)及研究方向(237)
15.1.1基礎(chǔ)理論研究(237)
15.1.2關(guān)鍵技術(shù)研究(238)
15.1.3應(yīng)用實(shí)踐研究(238)
15.1.4數(shù)據(jù)安全研究(239)
15.2展望(240)
參考文獻(xiàn)(243)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)