注冊 | 登錄讀書好,好讀書,讀好書!
讀書網-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網絡家庭與辦公軟件大數據技術基礎

大數據技術基礎

大數據技術基礎

定 價:¥48.00

作 者: 鄂海紅,宋美娜,歐中洪 著
出版社: 北京郵電大學出版社
叢編項: 普通高等教育“十三五”規(guī)劃教材
標 簽: 暫缺

購買這本書可以去


ISBN: 9787563558780 出版時間: 2019-10-01 包裝: 平裝
開本: 16開 頁數: 字數:  

內容簡介

  《大數據技術基礎》圍繞大數據技術基礎,重點介紹了大數據存儲系統(分布式文件系統和NoSQL數據庫)、大數據處理框架(Hadoop的MapReduce、Spark及實時處理框架Storm和Flink)、大數據倉庫技術(Hive、Druid等)、大數據多維分析(Kylin)、大數據可視化技術和大數據綜合應用等,以及當今主流的大數據平臺構建技術和開源組件實踐知識,可以指導讀者全面、系統地掌握大數據各層的實現方案,開展各領域的大數據實踐?!洞髷祿夹g基礎》可作為計算機學科相關專業(yè),特別是數據科學與大數據技術專業(yè)的教材。

作者簡介

  鄂海紅,博士,北京郵電大學計算機學院 副教授;科技部現代服務業(yè)共性服務聯盟,副秘書長;中國通信標準化協會TC11-WG1副組長。長期從事大數據工程與數據分析、機器學習與人工智能服務、云計算與分布式系統領域的研究工作,有扎實寬廣的理論基礎和科研項目實踐能力。作為課題負責人及主研人,完成科研項目累計34項(其中,國家課題13項),累計發(fā)表SCI/EI論文62篇;申請國家發(fā)明專利34項,軟著登記25項;正式發(fā)布國家行業(yè)標準16項。曾獲得省部級特等獎獎勵 “中國服務業(yè)科技創(chuàng)新獎”,教育部“高等學??茖W研究優(yōu)秀成果獎”二等獎、“中國通信標準化協會科學技術獎”三等獎;教育部博士點基金資助;北京市“青年英才計劃”首批資助。

圖書目錄

第1章 大數據概述
本章思維導圖
1.1 大數據簡介
1.1.1 大數據的發(fā)展歷程
1.1.2 大數據的定義與特征
1.1.3 大數據與傳統數據的區(qū)別
1.2 大數據平臺應具備的能力
1.3 大數據平臺架構
1.4 Hadoop生態(tài)系統
1.5 大數據應用
1.5.1 互聯網大數據應用
1.5.2 金融行業(yè)大數據應用
1.5.3 醫(yī)療行業(yè)大數據應用
1.5.4 智慧交通大數據應用
本章課后習題
本章參考文獻
第2章 大數據存儲——分布式文件系統及NoSQL數據庫
本章思維導圖
2.1 分布式文件系統
2.1.1 HDFS相關概念
2.1.2 HDFS體系結構
2.1.3 HDFS存儲機制
2.1.4 HDFS讀/寫操作
2.1.5 HDFS數據導入
2.2 NoSQL數據庫
2.2.1 KeyValue模型
2.2.2 KeyDocument 模型
2.2.3 KeyColumn模型
2.2.4 圖模型
2.3 列族數據庫
2.3.1 列族數據庫簡介
2.3.2 HBase的基本原理
2.3.3 HBase的數據模型
2.4 鍵值數據庫
2.4.1 鍵值數據庫簡介
2.4.2 選擇鍵值數據庫的原因
2.4.3 Redis的數據結構簡介
2.4.4 Redis的數據持久化
2.4.5 Redis的數據復制
2.5 文檔數據庫
2.5.1 文檔數據庫簡介
2.5.2 MongoDB的數據類型
2.5.3 MongoDB的數據復制
2.6 圖數據庫
2.6.1 圖數據庫簡介
2.6.2 圖數據庫的優(yōu)勢
2.6.3 Neo4j的基本元素與概念
2.6.4 Cypher簡介
本章課后習題
本章參考文獻
第3章 大數據處理——MapReduce處理框架
本章思維導圖
3.1 MapReduce的發(fā)展背景
3.2 MapReduce框架
3.3 MapReduce的編程模型
3.3.1 MapReduce初析
3.3.2 MapReduce的運行機制
3.3.3 MapReduce的相關問題
3.4 MapReduce的集群調度
3.4.1 Hadoop1.x的傳統集群調度框架
3.4.2 Hadoop2.x的集群調度框架YARN
3.4.3 Hadoop作業(yè)調度器
本章課后習題
本章參考文獻
第4章 大數據處理——分布式內存處理框架Spark
本章思維導圖
4.1 Spark簡介
4.1.1 Spark介紹
4.1.2 提出Spark的原因
4.1.3 Spark中的關鍵術語
4.1.4 Spark的優(yōu)點
4.2 Spark框架
4.2.1 Spark框架圖
4.2.2 Spark運行圖
4.2.3 Spark任務調度方法
4.3 RDD概念理解
4.3.1 RDD介紹
4.3.2 RDD的操作
4.3.3 RDD的存儲
4.3.4 RDD分區(qū)
4.3.5 RDD優(yōu)先位置
4.3.6 RDD依賴關系
4.4 RDD操作
4.4.1 RDD創(chuàng)建
4.4.2 轉換操作
4.4.3 行動操作
4.5 Scala語言
4.5.1 Scala介紹
4.5.2 Scala基本語法
4.5.3 Scala編寫Spark示例
4.6 Spark SQL簡介
4.6.1 Spark SQL與Shark的對比
4.6.2 Spark SQL的優(yōu)勢
4.6.3 Spark SQL生態(tài)
4.7 MLlib簡介
4.7.1 MLlib介紹
4.7.2 MLlib支持機器學習算法
本章課后習題
本章參考文獻
第5章 大數據處理——實時處理框架
本章思維導圖
5.1 實時處理架構
5.1.1 基本概念
5.1.2 批量和流式計算
5.1.3 系統生態(tài)簡介
5.2 Storm框架
5.2.1 Storm的基本術語和概念
5.2.2 Storm特性及運行原理
5.2.3 消息的生命周期
5.2.4 消息的可靠性保障
5.3 Flume分布式日志收集
5.3.1 Flume的基本術語和概念
5.3.2 源
5.3.3 通道
5.3.4 接收器
5.4 Kafka分布式消息隊列
5.4.1 Kafka的基本術語和概念
5.4.2 生產者
5.4.3 消費者
5.4.4 數據傳遞的可靠性保障
5.5 Spark Streaming框架
5.5.1 Spark Streaming架構
5.5.2 輸入數據源
5.5.3 DStream的轉換操作
5.5.4 輸出存儲
5.5.5 容錯機制
5.6 Flink框架
5.6.1 Flink架構
5.6.2 Client
5.6.3 JobManager
5.6.4 TaskManager
本章課后習題
本章參考文獻
第6章 大數據查詢——分布式數據查詢
本章思維導圖
6.1 分布式數據查詢簡介
6.2 Hive分布式數據倉庫
6.2.1 Hive概述
6.2.2 Hive內部介紹
6.2.3 Hive架構介紹
6.2.4 HiveQL:數據定義
6.2.5 HiveQL:數據導入
6.2.6 HiveQL:查詢
6.3 Druid時序數據倉儲
6.3.1 Druid概述
6.3.2 架構詳解
6.3.3 數據攝入
6.3.4 數據查詢
6.4 Drill分布式實時查詢
6.4.1 使用Apache Drill的原因
6.4.2 Drill架構與原理
6.4.3 Drill核心模塊
6.4.4 使用Drill實現查詢
本章課后習題
本章參考文獻
第7章 大數據分析——Kylin分布式多維數據分析
本章思維導圖
7.1 使用Apache Kylin的原因
7.2 Kylin學習的前奏
7.2.1 數據倉庫的概念與產生需求
7.2.2 數據倉庫與數據分析型系統
7.2.3 多維數據分析
7.2.4 OLAP與數據立方體
7.3 Kylin工作原理
7.3.1 Cube與Cuboid
7.3.2 工作流程
7.4 Kylin架構
7.5 Kylin快速入門
7.5.1 在Hive中準備數據
7.5.2 設計數據模型
7.5.3 創(chuàng)建Cube
7.5.4 構建Cube
7.5.5 查詢Cube
7.6 增量構建
7.6.1 設計增量Cube
7.6.2 觸發(fā)增量構建
7.6.3 管理Cube碎片
7.7 查詢和可視化
7.7.1 Web GUI
7.7.2 Rest API
7.7.3 ODBC
7.7.4 通過Tableau訪問Kylin
7.8 Cube優(yōu)化
本章課后習題
本章參考文獻
第8章 數據可視化
本章思維導圖
8.1 數據可視化定義及分類
8.1.1 數據可視化定義
8.1.2 數據可視化分類
8.2 數據可視化基礎
8.2.1 數據可視化流程
8.2.2 可視化中的數據
8.2.3 可視化的基本圖表
8.2.4 視圖的交互
8.3 信息可視化分類
8.3.1 時空數據可視化
8.3.2 層次和網絡數據可視化
8.3.3 文本和文檔可視化
8.4 在商業(yè)智能中的數據可視化應用
8.4.1 商業(yè)智能可視化的基本元素
8.4.2 儀表盤的設計準則
8.5 數據可視化的實現
8.5.1 數據可視化工具
8.5.2 ECharts
8.5.3 Plotly
本章課后習題
本章參考文獻
第9章 大數據應用系統案例——互聯網應用大數據系統構建
本章思維導圖
9.1 互聯網業(yè)務背景介紹
9.2 案例的大數據平臺技術體系架構
9.2.1 數據采集
9.2.2 數據存儲
9.2.3 數據計算
9.2.4 數據應用
本章課后習題
本章參考文獻

本目錄推薦

掃描二維碼
Copyright ? 讀書網 m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網安備 42010302001612號