注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐

大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐

大數(shù)據(jù)技術(shù)架構(gòu):核心原理與應(yīng)用實(shí)踐

定 價(jià):¥89.00

作 者: 李智慧 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787121414183 出版時(shí)間: 2021-07-01 包裝: 平裝
開本: 16開 頁數(shù): 208 字?jǐn)?shù):  

內(nèi)容簡介

  在人工智能時(shí)代,不論是否從事大數(shù)據(jù)開發(fā),掌握大數(shù)據(jù)的原理和架構(gòu)早已成為每個(gè)工程師的必備技能。本書結(jié)合作者多年大數(shù)據(jù)開發(fā)、應(yīng)用的經(jīng)驗(yàn),深入淺出地闡述大數(shù)據(jù)的完整知識(shí)體系,幫助讀者從不同視角找到大數(shù)據(jù)方向的突破口,真正從普通開發(fā)者晉升為擁有大數(shù)據(jù)思維并能解決復(fù)雜問題的技術(shù)專家。本書一共分為7章,分別是大數(shù)據(jù)的前世今生與應(yīng)用場(chǎng)景、Hadoop大數(shù)據(jù)原理與架構(gòu)、大數(shù)據(jù)生態(tài)體系主要產(chǎn)品原理與架構(gòu)、大數(shù)據(jù)開發(fā)實(shí)踐、大數(shù)據(jù)平臺(tái)與系統(tǒng)集成、大數(shù)據(jù)分析與運(yùn)營、大數(shù)據(jù)算法與機(jī)器學(xué)習(xí)。本書既可作為初學(xué)者了解大數(shù)據(jù)技術(shù)的入門指南,也可作為有一定經(jīng)驗(yàn)的工程師深入理解大數(shù)據(jù)思維的有益參考。

作者簡介

  李智慧,同程旅行交通首席架構(gòu)師。曾任阿里巴巴、Intel架構(gòu)師,長期從事分布式系統(tǒng)與大數(shù)據(jù)開發(fā),Apache Spark 代碼貢獻(xiàn)者,騰訊云 TVP,著有暢銷書《大型網(wǎng)站技術(shù)架構(gòu):核心原理與案例分析》。

圖書目錄

1 大數(shù)據(jù)的前世今生與應(yīng)用場(chǎng)景\t1
大數(shù)據(jù)的前世今生:大數(shù)據(jù)簡史與大數(shù)據(jù)生態(tài)體系概述\t1
從搜索引擎到人工智能:大數(shù)據(jù)應(yīng)用發(fā)展史\t6
大數(shù)據(jù)應(yīng)用的搜索引擎時(shí)代\t6
大數(shù)據(jù)應(yīng)用的數(shù)據(jù)倉庫時(shí)代\t7
大數(shù)據(jù)應(yīng)用的數(shù)據(jù)挖掘時(shí)代\t7
大數(shù)據(jù)應(yīng)用的機(jī)器學(xué)習(xí)時(shí)代\t8
數(shù)據(jù)驅(qū)動(dòng)一切:大數(shù)據(jù)全領(lǐng)域應(yīng)用場(chǎng)景分析\t10
大數(shù)據(jù)在醫(yī)療健康領(lǐng)域的應(yīng)用\t10
大數(shù)據(jù)在社交媒體領(lǐng)域的應(yīng)用\t12
大數(shù)據(jù)在金融領(lǐng)域的應(yīng)用\t13
大數(shù)據(jù)在新零售領(lǐng)域的應(yīng)用\t13
大數(shù)據(jù)在交通領(lǐng)域的應(yīng)用\t13
2 Hadoop大數(shù)據(jù)原理與架構(gòu)\t15
移動(dòng)計(jì)算比移動(dòng)數(shù)據(jù)更劃算\t16
從RAID看垂直伸縮到水平伸縮的演化\t19
新技術(shù)層出不窮,HDFS依然是存儲(chǔ)的王者\(yùn)t23
為什么說MapReduce既是編程模型又是計(jì)算框架\t29
MapReduce如何讓數(shù)據(jù)完成一次旅行\(zhòng)t33
MapReduce作業(yè)啟動(dòng)和運(yùn)行機(jī)制\t34
MapReduce數(shù)據(jù)合并與連接機(jī)制\t37
為什么把Yarn稱為資源調(diào)度框架\t39
程序員應(yīng)該如何學(xué)好大數(shù)據(jù)技術(shù)\t44
3 大數(shù)據(jù)生態(tài)體系主要產(chǎn)品原理與架構(gòu)\t47
Hive是如何讓MapReduce實(shí)現(xiàn)SQL操作的\t47
用MapReduce實(shí)現(xiàn)SQL數(shù)據(jù)分析的原理\t48
Hive的架構(gòu)\t49
Hive如何實(shí)現(xiàn)join操作\t51
人們并沒有覺得MapReduce速度慢,直到Spark出現(xiàn)\t53
同樣的本質(zhì),為何Spark可以更高效\t57
Spark的計(jì)算階段\t57
Spark的作業(yè)管理\t61
Spark的執(zhí)行過程\t62
BigTable的開源實(shí)現(xiàn):HBase\t63
HBase可伸縮架構(gòu)\t64
HBase可擴(kuò)展數(shù)據(jù)模型\t65
HBase的高性能存儲(chǔ)\t66
流式計(jì)算的代表:Storm、Spark Streaming、Flink\t68
Storm\t68
Spark Streaming\t70
Flink\t71
ZooKeeper是如何保證數(shù)據(jù)一致性的\t74
分布式一致性原理\t75
Paxos算法與ZooKeeper架構(gòu)\t76
大數(shù)據(jù)技術(shù)應(yīng)用場(chǎng)景分析\t80
4 大數(shù)據(jù)開發(fā)實(shí)踐\t82
如何自己開發(fā)一個(gè)大數(shù)據(jù)SQL引擎\t83
Panthera架構(gòu)\t83
Panthera的SQL語法轉(zhuǎn)換\t84
比如這條SQL\t85
Panthera程序設(shè)計(jì)\t85
Spark的性能優(yōu)化案例分析\t89
Apache開源社區(qū)的組織和參與方式\t90
軟件性能優(yōu)化\t91
大數(shù)據(jù)開發(fā)的性能優(yōu)化\t91
Spark性能優(yōu)化\t92
案例1:Spark任務(wù)文件初始化調(diào)優(yōu)\t95
案例2:Spark任務(wù)調(diào)度優(yōu)化\t98
案例3:Spark應(yīng)用配置優(yōu)化\t102
案例4:操作系統(tǒng)配置優(yōu)化\t102
案例5:硬件優(yōu)化\t103
大數(shù)據(jù)基準(zhǔn)測(cè)試可以帶來什么好處\t105
大數(shù)據(jù)基準(zhǔn)測(cè)試的應(yīng)用\t105
大數(shù)據(jù)基準(zhǔn)測(cè)試工具HiBench\t107
從大數(shù)據(jù)性能測(cè)試工具Dew看如何快速開發(fā)大數(shù)據(jù)系統(tǒng)\t109
Dew設(shè)計(jì)與開發(fā)\t110
Akka的原理與應(yīng)用\t112
大數(shù)據(jù)開發(fā)實(shí)踐的啟示\t115
5 大數(shù)據(jù)平臺(tái)與系統(tǒng)集成\t117
大數(shù)據(jù)平臺(tái) = 互聯(lián)網(wǎng)產(chǎn)品 + 大數(shù)據(jù)產(chǎn)品\t117
數(shù)據(jù)采集\t119
數(shù)據(jù)處理\t119
數(shù)據(jù)輸出與展示\t119
大數(shù)據(jù)任務(wù)調(diào)度\t120
大數(shù)據(jù)平臺(tái)Lamda架構(gòu)\t120
數(shù)據(jù)在大數(shù)據(jù)平臺(tái)中的流轉(zhuǎn)\t121
大數(shù)據(jù)從哪里來\t123
從數(shù)據(jù)庫導(dǎo)入\t123
從日志文件導(dǎo)入\t124
前端埋點(diǎn)采集\t126
爬蟲系統(tǒng)\t128
數(shù)據(jù)的熵\t128
知名大廠如何搭建大數(shù)據(jù)平臺(tái)\t129
淘寶大數(shù)據(jù)平臺(tái)\t129
美團(tuán)大數(shù)據(jù)平臺(tái)\t130
滴滴大數(shù)據(jù)平臺(tái)\t131
學(xué)架構(gòu)就是學(xué)架構(gòu)模式\t133
盤點(diǎn)可供中小企業(yè)參考的商業(yè)大數(shù)據(jù)平臺(tái)\t134
大數(shù)據(jù)解決方案提供商\t134
大數(shù)據(jù)云計(jì)算服務(wù)商\t136
大數(shù)據(jù)SaaS服務(wù)商\t138
大數(shù)據(jù)開放平臺(tái)\t138
當(dāng)大數(shù)據(jù)遇上物聯(lián)網(wǎng)\t139
物聯(lián)網(wǎng)應(yīng)用場(chǎng)景分析\t139
物聯(lián)網(wǎng)平臺(tái)架構(gòu)\t140
大數(shù)據(jù)技術(shù)在物聯(lián)網(wǎng)中的應(yīng)用\t141
6 大數(shù)據(jù)分析與運(yùn)營\t144
老板想要監(jiān)控什么運(yùn)營指標(biāo)\t144
互聯(lián)網(wǎng)運(yùn)營的常用數(shù)據(jù)指標(biāo)\t145
數(shù)據(jù)可視化圖表與數(shù)據(jù)監(jiān)控\t147
一個(gè)用戶新增下降的數(shù)據(jù)分析案例\t150
數(shù)據(jù)分析案例\t151
數(shù)據(jù)分析方法\t154
AB測(cè)試與灰度發(fā)布必知必會(huì)\t156
A/B測(cè)試的過程\t157
A/B測(cè)試的系統(tǒng)架構(gòu)\t158
灰度發(fā)布\t159
如何利用大數(shù)據(jù)成為“增長黑客”\t160
Hotmail的增長黑客故事\t161
AARRR用戶增長模型\t161
利用大數(shù)據(jù)增長用戶數(shù)量\t163
為什么說數(shù)據(jù)驅(qū)動(dòng)運(yùn)營\t164
7 大數(shù)據(jù)算法與機(jī)器學(xué)習(xí)\t168
如何對(duì)數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)\t168
k近鄰分類算法\t169
數(shù)據(jù)的距離\t170
文本的特征值\t171
貝葉斯分類\t172
如何發(fā)掘數(shù)據(jù)的關(guān)系\t174
搜索排序\t174
關(guān)聯(lián)分析\t177
聚類\t179
如何預(yù)測(cè)用戶的喜好\t181
基于人口統(tǒng)計(jì)的推薦\t182
基于商品屬性的推薦\t183
基于用戶的協(xié)同過濾推薦\t184
基于商品的協(xié)同過濾推薦\t185
機(jī)器學(xué)習(xí)的數(shù)學(xué)原理是什么\t186
樣本\t187
模型\t187
算法\t188
為什么學(xué)機(jī)器學(xué)習(xí)要學(xué)數(shù)學(xué)\t189
從感知機(jī)到神經(jīng)網(wǎng)絡(luò)\t190
感知機(jī)\t191
神經(jīng)網(wǎng)絡(luò)\t192

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)