注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書教育/教材/教輔教材研究生/本科/??平滩?/a>分布式統(tǒng)計(jì)計(jì)算

分布式統(tǒng)計(jì)計(jì)算

分布式統(tǒng)計(jì)計(jì)算

定 價(jià):¥49.00

作 者: 馮興東,賀莘
出版社: 中國人民大學(xué)出版社
叢編項(xiàng): 新編21世紀(jì)研究生系列教材 應(yīng)用統(tǒng)計(jì)碩士
標(biāo) 簽: 暫缺

ISBN: 9787300315867 出版時(shí)間: 2023-04-01 包裝: 平裝
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書著重介紹分布式計(jì)算的思想其及在統(tǒng)計(jì)學(xué)以及機(jī)器學(xué)習(xí)中的應(yīng)用,將傳統(tǒng)統(tǒng)計(jì)學(xué)與機(jī)器學(xué)習(xí)中的經(jīng)典方法和現(xiàn)代分布式算法相結(jié)合,強(qiáng)化學(xué)生的分布式統(tǒng)計(jì)計(jì)算的編程能力和對相關(guān)方法的理解,努力在統(tǒng)計(jì)計(jì)算和分布式計(jì)算之間搭建起一座橋梁。本書亦圍繞統(tǒng)計(jì)學(xué)中的不同問題提供了豐富的實(shí)際案例以及詳細(xì)的實(shí)現(xiàn)代碼,從而幫助使用者快速理解相關(guān)分布式的核心思想,提升編程能力,進(jìn)而可以熟練地進(jìn)行大數(shù)據(jù)的統(tǒng)計(jì)分析和研究。本書可作為統(tǒng)計(jì)學(xué)與數(shù)據(jù)科學(xué)等相關(guān)專業(yè)高年級本科生與研究生教材,也可用作相關(guān)大數(shù)據(jù)分析方向從業(yè)者與研究者的參考書。

作者簡介

  馮興東 上海財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與管理學(xué)院院長、統(tǒng)計(jì)學(xué)教授、博士生導(dǎo)師。研究領(lǐng)域?yàn)閿?shù)據(jù)降維、穩(wěn)健回歸、分位數(shù)回歸以及在經(jīng)濟(jì)問題中的應(yīng)用、大數(shù)據(jù)統(tǒng)計(jì)計(jì)算、強(qiáng)化學(xué)習(xí)等,在國際頂級統(tǒng)計(jì)學(xué)期刊Journal of the American Statistical Association、Annals of Statistics、Journal of the Royal Statistical Society Series B、Biometrika以及人工智能頂級會議NeurIPS上發(fā)表論文多篇。2018年入選國際統(tǒng)計(jì)學(xué)會推選會員,2019年擔(dān)任全國青年統(tǒng)計(jì)學(xué)家協(xié)會副會長以及全國統(tǒng)計(jì)教材編審委員會第七屆委員會專業(yè)委員(數(shù)據(jù)科學(xué)與大數(shù)據(jù)應(yīng)用組),2020年成為第八屆國務(wù)院學(xué)位委員會學(xué)科評議組(統(tǒng)計(jì)學(xué))成員,2022年擔(dān)任全國應(yīng)用統(tǒng)計(jì)專業(yè)學(xué)位研究生教育指導(dǎo)委委員,2023年擔(dān)任全國工業(yè)統(tǒng)計(jì)學(xué)教學(xué)研究會副會長以及中國數(shù)學(xué)會概率統(tǒng)計(jì)分會常務(wù)理事,2022年起兼任國際統(tǒng)計(jì)學(xué)權(quán)威期刊Annals of Applied Statistics編委以及國內(nèi)統(tǒng)計(jì)學(xué)權(quán)威期刊《統(tǒng)計(jì)研究》編委。賀 莘 上海財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與管理學(xué)院副教授、博士生導(dǎo)師。主要研究領(lǐng)域?yàn)榻y(tǒng)計(jì)機(jī)器學(xué)習(xí)及其在經(jīng)濟(jì)金融、醫(yī)學(xué)健康中的應(yīng)用,研究成果發(fā)表在Journal of Machine Learning Research、Journal of the American Statistical Association、Journal of Computational and Graphical Statistics、Electronic Journal of Statistics、Statistica Sinica、Thyroid等國際權(quán)威期刊上。主持國家自然科學(xué)基金青年項(xiàng)目一項(xiàng)以及上海市浦江人才計(jì)劃項(xiàng)目一項(xiàng)。

圖書目錄

第 1 章 Apache Spark 簡介
1.1 Apache Spark 的歷史與現(xiàn)狀
1.2 安裝和運(yùn)行 Apache Spark
1.3 Apache Spark 編程簡介
1.4 Scala 語言簡介
1.4.1 Scala 開發(fā)環(huán)境配置及 IntelliJ IDEA
1.4.2 Scala 編程簡介
1.4.3 PySpark 編程簡介
1.5 Spark 編程
1.5.1 Spark 系統(tǒng)簡介
1.5.2 彈性分布式數(shù)據(jù)集
1.5.3 RDD 文件上的操作
1.5.4 Spark 中兩個抽象概念
1.6 公共數(shù)據(jù)集

第 2 章 Breeze 程序包
2.1 創(chuàng)建向量、矩陣及其簡單計(jì)算
2.2 整行或整列的運(yùn)算
2.3 常用數(shù)學(xué)計(jì)算
2.4 常用分布
2.5 基于 Breeze 包的分布式計(jì)算

第 3 章 隨機(jī)模擬和統(tǒng)計(jì)推斷
3.1 隨機(jī)數(shù)的產(chǎn)生
3.1.1 逆累積分布函數(shù)法
3.1.2 拒絕法
3.1.3 示例:從回歸模型中模擬數(shù)據(jù)
3.2 EM 優(yōu)化
3.2.1 EM 算法
3.2.2 收斂性分析
3.2.3 分布式 EM 算法
3.2.4 示例:高斯混合模型

第 4 章 馬爾科夫鏈蒙特卡洛方法
4.1 Metropolis-Hastings 算法
4.2 Slice 取樣法
4.3 Gibbs 取樣法

第 5 章 優(yōu)化算法
5.1 數(shù)值計(jì)算方法
5.1.1 (隨機(jī)) 梯度下降算法
5.1.2 示例:分布式的線性回歸估計(jì)
5.2 近端梯度算法
5.2.1 算法介紹
5.2.2 示例:基于近端梯度算法的分布式 Lasso 回歸參數(shù)估計(jì)
5.3 交替方向乘子法
5.3.1 算法介紹
5.3.2 示例:分位數(shù)回歸分布式參數(shù)估計(jì)
5.4 有限內(nèi)存 BFGS 算法

第 6 章 自舉法
6.1 自由自舉法
6.2 子集合自舉法

第 7 章 常用統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法
7.1 聚類分析
7.1.1 K 組中心法
7.1.2 隱狄利克雷分配法
7.1.3 功效迭代聚類法
7.2 分類分析
7.2.1 邏輯回歸
7.2.2 線性支持向量機(jī)
7.2.3 線性判別分析
7.2.4 決策樹
7.3 數(shù)據(jù)降維
7.3.1 基于正則化的稀疏性方法
7.3.2 示例:SCAD、MCP 等正則化項(xiàng)的 Scala 代碼實(shí)現(xiàn)
7.3.3 主成分分析
7.3.4 奇異值分解
7.3.5 示例:基于分布式計(jì)算的主成分分析
7.4 集成學(xué)習(xí)方法
7.4.1 基于 Bagging 算法――以隨機(jī)森林為例
7.4.2 基于 Boosting 算法――以 AdaBoost 為例
7.4.3 基于樹的集成學(xué)習(xí)算法
7.4.4 示例:航班延誤預(yù)測分類

第 8 章 主流分布式算法簡介
8.1 分治法
8.1.1 算法思想介紹
8.1.2 分治法在統(tǒng)計(jì)學(xué)習(xí)中的應(yīng)用
8.1.3 示例:線性支持向量機(jī)
8.2 基于梯度更新的分布式算法
8.2.1 算法介紹
8.2.2 示例:基于近端梯度算法的 Lasso 問題求解
8.2.3 示例:非參數(shù)嶺回歸
8.3 聯(lián)邦學(xué)習(xí)算法簡介
8.3.1 算法分類
8.3.2 聯(lián)邦平均算法介紹
8.3.3 安全聯(lián)邦線性回歸

第 9 章 案例集
9.1 案例一:基于 MM 算法和 EM 算法的負(fù)二項(xiàng)分布參數(shù)估計(jì)
9.1.1 負(fù)二項(xiàng)分布
9.1.2 MM 算法的負(fù)二項(xiàng)分布參數(shù)估計(jì)求解
9.1.3 EM 算法的負(fù)二項(xiàng)分布參數(shù)估計(jì)求解
9.1.4 數(shù)值模擬
9.1.5 實(shí)證分析
9.1.6 結(jié)論
9.1.7 源碼附錄
9.2 案例二:基于 EM 算法的混合指數(shù)分布參數(shù)估計(jì)
9.2.1 混合指數(shù)分布簡介
9.2.2 EM 算法
9.2.3 Spark 實(shí)現(xiàn)
9.2.4 效果評估
9.2.5 源碼附錄
9.3 案例三:基于 EM 算法的有限混合泊松分布的參數(shù)估計(jì)
9.3.1 有限混合泊松分布簡介
9.3.2 參數(shù)估計(jì)的 EM 算法
9.3.3 EM 加速算法――均方外推算法
9.3.4 實(shí)驗(yàn)設(shè)計(jì)
9.3.5 SQUAREM 加速算法比較
9.3.6 源碼附錄
9.4 案例四:基于不同優(yōu)化算法的邏輯回歸模型參數(shù)的估計(jì)
9.4.1 常用優(yōu)化算法簡介
9.4.2 邏輯回歸模型簡介
9.4.3 模擬數(shù)據(jù)應(yīng)用不同優(yōu)化算法的分布式實(shí)現(xiàn)及比較
9.4.4 源碼附錄
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號