注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析

大數(shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析

大數(shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析

定 價:¥99.00

作 者: 開課吧 著
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787111686187 出版時間: 2021-09-01 包裝:
開本: 16開 頁數(shù): 238 字數(shù):  

內(nèi)容簡介

  《大數(shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析》全面詳細地介紹了大數(shù)據(jù)生態(tài)系統(tǒng)中的主流技術(shù)?!洞髷?shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析》共10章,主要包括大數(shù)據(jù)生態(tài)系統(tǒng)概述、大數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)存儲技術(shù)、大數(shù)據(jù)分析處理技術(shù)等內(nèi)容,書中涵蓋了Hadoop、Hive、Hbase、Kafka、Spark、Flink等技術(shù)的原理和實踐,其中重點介紹了Hadoop技術(shù)、Spark技術(shù)及Flink技術(shù)?!洞髷?shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析》詳細介紹了主流大數(shù)據(jù)技術(shù)框架的基本原理、環(huán)境搭建、操作使用和在典型行業(yè)中的具體應用,使讀者不僅能夠在宏觀上全面認知大數(shù)據(jù)生態(tài)系統(tǒng),而且還能在微觀上深入理解大數(shù)據(jù)技術(shù)細節(jié)?!洞髷?shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析》不僅適合大數(shù)據(jù)技術(shù)初學者閱讀,還可以幫助金融、電信、電商、能源、政府部門的大數(shù)據(jù)應用決策和技術(shù)人員,以及IT經(jīng)理、CTO、CIO等快速學習大數(shù)據(jù)技術(shù),并能作為大數(shù)據(jù)相關(guān)崗位培訓的教程。

作者簡介

暫缺《大數(shù)據(jù)技術(shù)入門到商業(yè)實戰(zhàn) Hadoop+Spark+Flink全解析》作者簡介

圖書目錄

前言
第1章 初識大數(shù)據(jù)
1.1 什么是大數(shù)據(jù)
1.2 大數(shù)據(jù)行業(yè)應用
1.3 什么是Hadoop
1.4 Hadoop產(chǎn)生背景
1.5 Hadoop的架構(gòu)模塊介紹
1.6 Hadoop在大數(shù)據(jù)、云計算中的位置和關(guān)系
1.7 國內(nèi)外Hadoop應用案例介紹
1.8 Hadoop生態(tài)圈以及各組成部分簡介
1.9 本章小結(jié)
第2章 Hadoop之分布式文件系統(tǒng)HDFS
2.1 構(gòu)建Hadoop集群
2.1.1 集群簡介
2.1.2 Hadoop集群部署
2.2 Hadoop集群啟動和停止
2.2.1 Hadoop集群啟動
2.2.2 Hadoop集群停止
2.3 HDFS的Shell命令行客戶端操作
2.4 HDFS的工作機制
2.4.1 HDFS概述
2.4.2 HDFS的重要特性
2.4.3 HDFS寫數(shù)據(jù)流程
2.4.4 HDFS讀數(shù)據(jù)流程
2.5 NameNode和SecondaryNameNode功能剖析
2.5.1 NameNode與SecondaryNameNode解析
2.5.2 元數(shù)據(jù)的checkpoint的條件
2.5.3 fsimage與edits詳解
2.5.4 fsimage和edits文件信息查看
2.6 DataNode的工作機制及存儲
2.6.1 DataNode工作機制
2.6.2 數(shù)據(jù)完整性保證
2.6.3 DataNode掉線判斷時限參數(shù)
2.7 HDFS的安全模式
2.8 本章小結(jié)
第3章 Hadoop之分布式計算MapReduce
3.1 MapReduce概述
3.1.1 MapReduce介紹
3.1.2 為什么要使用MapReduce
3.2 MapReduce框架結(jié)構(gòu)及核心運行機制
3.3 MapReduce編程規(guī)范和示例編寫
3.3.1 編程規(guī)范
3.3.2 MapReduce編程入門之單詞計數(shù)
3.4 MapTask數(shù)量及切片機制
3.4.1 MapTask個數(shù)
3.4.2 如何控制MapTask的個數(shù)
3.4.3 Map并行度的經(jīng)驗之談
3.5 ReduceTask并行度的決定
3.6 MapReduce中的combiner
3.7 MapReduce中的Shuffle
3.7.1 Map端
3.7.2 Reduce端
3.7.3 Shuffle小結(jié)
3.8 MapReduce與Yam
3.8.1 Yarn概述
3.8.2 Yarn的重要概念
3.9 MapReduce在Yarn上運行流程
……
第4章 分布式協(xié)調(diào)服務Zookeeper
第5章 分布式數(shù)據(jù)庫Hbase
第6章 數(shù)據(jù)倉庫Hive
第7章 日志采集框架Flume
第8章 分布式消息系統(tǒng)Kafka
第9章 Spark內(nèi)存計算框架
第10章 Flink實時流處理

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號