注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)工業(yè)技術(shù)自動化技術(shù)、計算技術(shù)大數(shù)據(jù)技術(shù)原理與應(yīng)用:概念、存儲、處理、分析與應(yīng)用

大數(shù)據(jù)技術(shù)原理與應(yīng)用:概念、存儲、處理、分析與應(yīng)用

大數(shù)據(jù)技術(shù)原理與應(yīng)用:概念、存儲、處理、分析與應(yīng)用

定 價:¥45.00

作 者: 林子雨 著
出版社: 人民郵電出版社
叢編項: 21世紀高等教育計算機規(guī)劃教材
標 簽: 暫缺

ISBN: 9787115392879 出版時間: 2015-08-01 包裝: 平裝
開本: 16開 頁數(shù): 250 字數(shù):  

內(nèi)容簡介

  大數(shù)據(jù)作為繼云計算、物聯(lián)網(wǎng)之后IT行業(yè)又一顛覆性的技術(shù),備受關(guān)注。大數(shù)據(jù)處不在,包括金融、汽車、零售、餐飲、電信、能源、政務(wù)、醫(yī)療、體育、娛樂等在內(nèi)的社會各行各業(yè),都融入了大數(shù)據(jù)的印跡,大數(shù)據(jù)對人類的社會生產(chǎn)和生活必將產(chǎn)生重大而深遠的影響。大數(shù)據(jù)時代的到來,迫切需要高校及時建立大數(shù)據(jù)技術(shù)課程體系,為社會培養(yǎng)和輸送一大批具備大數(shù)據(jù)專業(yè)素養(yǎng)的高級人才,滿足社會對大數(shù)據(jù)人才日益旺盛的需求。本書定位為大數(shù)據(jù)技術(shù)入門教材,為讀者搭建起通向“大數(shù)據(jù)知識空間”的橋梁和紐帶。本書將系統(tǒng)梳理總結(jié)大數(shù)據(jù)相關(guān)技術(shù),介紹大數(shù)據(jù)技術(shù)的基本原理和大數(shù)據(jù)主要應(yīng)用,幫助讀者形成對大數(shù)據(jù)知識體系及其應(yīng)用領(lǐng)域的輪廓性認識,為讀者在大數(shù)據(jù)領(lǐng)域“深耕細作”奠定基礎(chǔ)、指明方向。在本書的基礎(chǔ)上,感興趣的讀者可以通過其他諸如《Hadoop權(quán)威指南》等工具書,繼續(xù)深入學(xué)習(xí)和實踐大數(shù)據(jù)相關(guān)技術(shù)。

作者簡介

  \t林子雨,博士,廈門大學(xué)計算機科學(xué)系老師,中國高校首個“數(shù)字教師”的提出者和建設(shè)者。在數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等領(lǐng)域有著十多年的知識積累,對各個領(lǐng)域知識都有比較深入的了解,有比較寬泛的視野,將相關(guān)大數(shù)據(jù)知識綜合成一本適合本科和研究生教學(xué)的教材。

圖書目錄

第一篇大數(shù)據(jù)基礎(chǔ)第1章大數(shù)據(jù)概述1.1大數(shù)據(jù)時代1.1.1第三次信息化浪潮1.1.2信息科技為大數(shù)據(jù)時代提供技術(shù)支撐1.1.3數(shù)據(jù)產(chǎn)生方式的變革促成大數(shù)據(jù)時代的來臨1.1.4大數(shù)據(jù)的發(fā)展歷程1.2大數(shù)據(jù)的概念1.2.1數(shù)據(jù)量大1.2.2數(shù)據(jù)類型繁多1.2.3處理速度快1.2.4價值密度低1.3大數(shù)據(jù)的影響1.3.1大數(shù)據(jù)對科學(xué)研究的影響1.3.2大數(shù)據(jù)對思維方式的影響1.3.3大數(shù)據(jù)對社會發(fā)展的影響1.3.4大數(shù)據(jù)對就業(yè)市場的影響1.3.5大數(shù)據(jù)對人才培養(yǎng)的影響1.4大數(shù)據(jù)的應(yīng)用1.5大數(shù)據(jù)關(guān)鍵技術(shù)1.6大數(shù)據(jù)計算模式1.6.1批處理計算1.6.2流計算1.6.3圖計算1.6.4查詢分析計算1.7大數(shù)據(jù)產(chǎn)業(yè)1.8大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)1.8.1云計算1.8.2物聯(lián)網(wǎng)1.8.3大數(shù)據(jù)與云計算、物聯(lián)網(wǎng)的關(guān)系1.9本章小結(jié)1.10習(xí)題第2章大數(shù)據(jù)處理架構(gòu)Hadoop2.1概述2.1.1Hadoop簡介2.1.2Hadoop的發(fā)展簡史2.1.3Hadoop的特性2.1.4Hadoop的應(yīng)用現(xiàn)狀2.2Hadoop的項目結(jié)構(gòu)2.2.1Common2.2.2Avro2.2.3HDFS2.2.4HBase2.2.5MapReduce2.2.6Zookeeper2.2.7Hive2.2.8Pig2.2.9Sqoop2.2.10Chukwa2.3Hadoop的安裝與使用2.3.1創(chuàng)建Hadoop用戶2.3.2Java的安裝2.3.3SSH登錄權(quán)限設(shè)置2.3.4安裝單機Hadoop2.3.5Hadoop偽分布式安裝2.4本章小結(jié)2.5習(xí)題第二篇大數(shù)據(jù)存儲第3章Hadoop分布式文件系統(tǒng)3.1分布式文件系統(tǒng)3.1.1計算機集群結(jié)構(gòu)3.1.2分布式文件系統(tǒng)的結(jié)構(gòu)3.1.3分布式文件系統(tǒng)的設(shè)計需求3.2HDFS簡介3.3HDFS的相關(guān)概念3.3.1塊3.3.2名稱節(jié)點和數(shù)據(jù)節(jié)點3.4HDFS體系結(jié)構(gòu)3.4.1概述3.4.2HDFS命名空間管理3.4.3通信協(xié)議3.4.4客戶端3.4.5HDFS體系結(jié)構(gòu)的局限性3.5HDFS的存儲原理3.5.1冗余數(shù)據(jù)的保存3.5.2數(shù)據(jù)存取策略3.5.3數(shù)據(jù)錯誤與恢復(fù)3.6HDFS的數(shù)據(jù)讀寫過程3.6.1讀數(shù)據(jù)的過程3.6.2寫數(shù)據(jù)的過程3.7HDFS編程實踐3.7.1HDFS常用命令3.7.2HDFS的Web界面3.7.3HDFS常用JavaAPI及應(yīng)用實例3.8本章小結(jié)3.9習(xí)題第4章分布式數(shù)據(jù)庫HBase4.1概述4.1.1從BigTable說起4.1.2HBase簡介4.1.3HBase與傳統(tǒng)關(guān)系數(shù)據(jù)庫的對比分析4.2HBase訪問接口4.3HBase數(shù)據(jù)模型4.3.1數(shù)據(jù)模型概述4.3.2數(shù)據(jù)模型的相關(guān)概念4.3.3數(shù)據(jù)坐標4.3.4概念視圖4.3.5物理視圖4.3.6面向列的存儲4.4HBase的實現(xiàn)原理4.4.1HBase的功能組件4.4.2表和Region4.4.3Region的定位4.5HBase運行機制4.5.1HBase系統(tǒng)架構(gòu)4.5.2Region服務(wù)器的工作原理4.5.3Store的工作原理4.5.4HLog的工作原理4.6HBase編程實踐4.6.1HBase常用的Shell命令4.6.2HBase常用的JavaAPI及應(yīng)用實例4.7本章小結(jié)4.8習(xí)題第5章NoSQL數(shù)據(jù)庫5.1NoSQL簡介5.2NoSQL興起的原因5.2.1關(guān)系數(shù)據(jù)庫法滿足Web2.0的需求5.2.2關(guān)系數(shù)據(jù)庫的關(guān)鍵特性在Web2.時代成為雞肋5.3NoSQL與關(guān)系數(shù)據(jù)庫的比較5.4NoSQL的四大類型5.4.1鍵值數(shù)據(jù)庫5.4.2列族數(shù)據(jù)庫5.4.3文檔數(shù)據(jù)庫5.4.4圖形數(shù)據(jù)庫5.5NoSQL的三大基石5.5.1CAP5.5.2BASE5.5.3最終一致性5.6從NoSQL到NewSQL數(shù)據(jù)庫5.7本章小結(jié)5.8習(xí)題第6章云數(shù)據(jù)庫6.1云數(shù)據(jù)庫概述6.1.1云計算是云數(shù)據(jù)庫興起的基礎(chǔ)6.1.2云數(shù)據(jù)庫的概念6.1.3云數(shù)據(jù)庫的特性6.1.4云數(shù)據(jù)庫是個性化數(shù)據(jù)存儲需求的理想選擇6.1.5云數(shù)據(jù)庫與其他數(shù)據(jù)庫的關(guān)系6.2云數(shù)據(jù)庫產(chǎn)品6.2.1云數(shù)據(jù)庫廠商概述6.2.2Amazon的云數(shù)據(jù)庫產(chǎn)品6.2.3Google的云數(shù)據(jù)庫產(chǎn)品6.2.4微軟的云數(shù)據(jù)庫產(chǎn)品6.2.5其他云數(shù)據(jù)庫產(chǎn)品6.3云數(shù)據(jù)庫系統(tǒng)架構(gòu)6.3.1UMP系統(tǒng)概述6.3.2UMP系統(tǒng)架構(gòu)6.3.3UMP系統(tǒng)功能6.4云數(shù)據(jù)庫實踐6.4.1阿里云RDS簡介6.4.2RDS中的概念6.4.3購買和使用RDS數(shù)據(jù)庫6.4.4將本地數(shù)據(jù)庫遷移到云端RDS數(shù)據(jù)庫6.5本章小結(jié)6.6習(xí)題第三篇大數(shù)據(jù)處理與分析第7章MapReduce7.1概述7.1.1分布式并行編程7.1.2MapReduce模型簡介7.1.3Map和Reduce函數(shù)7.2MapReduce的工作流程7.2.1工作流程概述7.2.2MapReduce的各個執(zhí)行階段7.2.3Shuffle過程詳解7.3實例分析:WordCount7.3.1WordCount的程序任務(wù)7.3.2WordCount的設(shè)計思路7.3.3MapReduce的具體執(zhí)行過程7.3.4一個WordCount執(zhí)行過程的實例7.4MapReduce的具體應(yīng)用7.4.1MapReduce在關(guān)系代數(shù)運算中的應(yīng)用7.4.2分組與聚合運算7.4.3矩陣-向量乘法7.4.4矩陣乘法7.5MapReduce編程實踐7.5.1任務(wù)要求7.5.2編寫Map處理邏輯7.5.3編寫Reduce處理邏輯7.5.4編寫main方法7.5.5編譯打包代碼以及運行程序7.6本章小結(jié)7.7習(xí)題第8章流計算8.1流計算概述8.1.1靜態(tài)數(shù)據(jù)和流數(shù)據(jù)8.1.2批量計算和實時計算8.1.3流計算的概念8.1.4流計算與Hadoop8.1.5流計算框架8.2流計算的處理流程8.2.1概述8.2.2數(shù)據(jù)實時采集8.2.3數(shù)據(jù)實時計算8.2.4實時查詢服務(wù)8.3流計算的應(yīng)用8.3.1應(yīng)用場景1:實時分析8.3.2應(yīng)用場景2:實時交通8.4開源流計算框架Storm8.4.1Storm簡介

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號