注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)工業(yè)技術(shù)建筑科學(xué)建筑設(shè)計(jì)深入淺出R語(yǔ)言數(shù)據(jù)分析(新時(shí)代 技術(shù)新未來(lái))

深入淺出R語(yǔ)言數(shù)據(jù)分析(新時(shí)代 技術(shù)新未來(lái))

深入淺出R語(yǔ)言數(shù)據(jù)分析(新時(shí)代 技術(shù)新未來(lái))

定 價(jià):¥69.00

作 者: 米霖 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302543886 出版時(shí)間: 2020-09-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 257 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《深入淺出R語(yǔ)言數(shù)據(jù)分析/新時(shí)代·技術(shù)新未來(lái)》首先介紹數(shù)據(jù)分析的方法論,然后介紹數(shù)據(jù)分析的相關(guān)模型方法,并進(jìn)一步通過(guò)數(shù)據(jù)分析案例,講解數(shù)據(jù)分析的思維、方法及模型實(shí)現(xiàn)過(guò)程。該書重點(diǎn)介紹R語(yǔ)言在數(shù)據(jù)分析方面的應(yīng)用,讓讀者能夠快速地使用R語(yǔ)言進(jìn)行數(shù)據(jù)分析、構(gòu)建模型。全書分為17章,內(nèi)容包括:使用R語(yǔ)言獲取數(shù)據(jù)、數(shù)據(jù)分析中的數(shù)據(jù)處理與數(shù)據(jù)探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關(guān)聯(lián)規(guī)則、隨機(jī)森林、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、文本挖掘、社交網(wǎng)絡(luò)分析,以及關(guān)于R語(yǔ)言數(shù)據(jù)分析的兩個(gè)延伸內(nèi)容:H2O機(jī)器學(xué)習(xí)和R語(yǔ)言爬蟲。《深入淺出R語(yǔ)言數(shù)據(jù)分析/新時(shí)代·技術(shù)新未來(lái)》內(nèi)容通俗易懂,案例豐富,實(shí)用性強(qiáng),特別適合R語(yǔ)言的入門讀者和進(jìn)階讀者閱讀,也適合數(shù)據(jù)分析人員、數(shù)據(jù)挖掘人員等其他數(shù)據(jù)科學(xué)從業(yè)者。另外,該書也適用于統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、機(jī)器學(xué)習(xí)、數(shù)學(xué)等相關(guān)專業(yè)的本科生、研究生使用。

作者簡(jiǎn)介

  米霖,畢業(yè)于華中農(nóng)業(yè)大學(xué),本科數(shù)學(xué)專業(yè),研究生統(tǒng)計(jì)學(xué)專業(yè),8年R語(yǔ)言項(xiàng)目經(jīng)驗(yàn),擅長(zhǎng)機(jī)器學(xué)習(xí)、統(tǒng)計(jì)模型。曾開發(fā)了多門R語(yǔ)言相關(guān)課程,課程包括“Shiny初級(jí)教程”“R包開發(fā)”“H20機(jī)器學(xué)習(xí)模型”“信用評(píng)分模型開發(fā)”“R語(yǔ)言文本挖掘”等,學(xué)員累計(jì)超過(guò)5000人。完成過(guò)很多數(shù)據(jù)分析項(xiàng)目,例如廣告虛假流量識(shí)別項(xiàng)目(通過(guò)虛假流量數(shù)據(jù)的挖掘幫助企業(yè)節(jié)省了上百萬(wàn)元的營(yíng)銷成本)、信貸中的信用評(píng)分項(xiàng)目、電商風(fēng)控項(xiàng)目等。

圖書目錄

第1章 數(shù)據(jù)分析項(xiàng)目的流程
1.1 數(shù)據(jù)分析項(xiàng)目中的角色
1.2 數(shù)據(jù)分析項(xiàng)目的階段
1.2.1 制定目標(biāo)
1.2.2 收集數(shù)據(jù)
1.2.3 數(shù)據(jù)處理和分析
1.2.4 構(gòu)建模型
1.2.5 評(píng)估模型
1.2.6 展示結(jié)果
1.2.7 部署與維護(hù)模型
1.3 總結(jié)
第2章 數(shù)據(jù)的讀取
2.1 RData數(shù)據(jù)
2.2 readr高效讀取數(shù)據(jù)
2.3 讀取Excel數(shù)據(jù)
2.4 讀取SPSS、SAS、STATA數(shù)據(jù)
2.5 R語(yǔ)言操作數(shù)據(jù)庫(kù)
2.6 總結(jié)
第3章 數(shù)據(jù)探索
3.1 缺失值的識(shí)別與處理
3.1.1 缺失值的識(shí)別與描述性統(tǒng)計(jì)
3.1.2 缺失值的可視化展示
3.1.3 缺失值的處理方法
3.2 異常值
3.3 dlookr數(shù)據(jù)處理包
3.3.1 所有變量的一般性診斷
3.3.2 數(shù)值型變量的診斷
3.3.3 分類變量的診斷
3.3.4 異常值的診斷
3.3.5 創(chuàng)建診斷報(bào)告
3.3.6 數(shù)據(jù)處理
3.3.7 缺失值處理
3.3.8 異常值處理
3.3.9 數(shù)據(jù)轉(zhuǎn)換
3.3.10 數(shù)據(jù)分箱
3.3.11 創(chuàng)建數(shù)據(jù)轉(zhuǎn)換報(bào)告
3.4 數(shù)據(jù)相關(guān)性
3.5 自動(dòng)化創(chuàng)建數(shù)據(jù)探索報(bào)告
3.6 總結(jié)
第4章 生存分析
4.1 生存分析的基本內(nèi)容
4.2 使用R 語(yǔ)言進(jìn)行生存分析
4.3 非參數(shù)模型
4.3.1 使用Kaplan-Meier 方法擬合數(shù)據(jù)
4.3.2 Kaplan-Meier 方法的可視化
4.4 半?yún)?shù)模型生存分析方法
4.4.1 構(gòu)建Cox 模型
4.4.2 檢查假設(shè)
4.4.3 Coxph 模型可視化
4.4.4 預(yù)測(cè)
4.4.5 分層
4.5 參數(shù)模型
4.6 隨機(jī)生存森林模型
4.7 總結(jié)
第5章 主成分分析
5.1 概述
5.1.1 維度相關(guān)的問(wèn)題
5.1.2 檢測(cè)多重共線性
5.1.3 方差膨脹因子
5.2 主成分分析詳解
5.2.1 主成分分析的定義
5.2.2 主成分分析的簡(jiǎn)單原理
5.2.3 主成分分析的算法
5.3 使用R 語(yǔ)言進(jìn)行主成分分析
5.3.1 主成分分析的實(shí)現(xiàn)
5.3.2 主成分分析案例
5.4 總結(jié)
第6章 多維縮放
6.1 MDS 的工作原理
6.3 MDS 的優(yōu)點(diǎn)
6.2 在R 語(yǔ)言中實(shí)現(xiàn)MDS
6.4 總結(jié)
第7章 線性回歸模型
7.1 線性回歸模型概述
7.2 在R 語(yǔ)言中實(shí)現(xiàn)回歸模型
7.2.1 圖形分析
7.2.2 建立線性模型
7.2.3 回歸模型的圖形診斷
7.2.4 預(yù)測(cè)模型
7.2.5 抽樣方法
7.3 總結(jié)
第8章 邏輯回歸模型
8.1 邏輯回歸的原理
8.2 在R 語(yǔ)言中實(shí)現(xiàn)邏輯回歸模型
8.2.1 數(shù)據(jù)探索
8.2.2 構(gòu)建邏輯回歸模型
8.2.3 邏輯回歸預(yù)測(cè)
8.2.4 邏輯回歸模型評(píng)估
8.3 總結(jié)
第9章 聚類模型
9.1 概述
9.1.1 聚類算法
9.1.2 K均值聚類的原理
9.2 在R 語(yǔ)言中實(shí)現(xiàn)聚類模型
9.2.1 K均值聚類
9.2.2 層次聚類
9.2.3 Medoids 聚類(PAM)
9.3 總結(jié)
第10章 關(guān)聯(lián)規(guī)則
10.1 關(guān)聯(lián)規(guī)則概述
10.2 關(guān)聯(lián)規(guī)則的基本概念
10.3 在R 語(yǔ)言中實(shí)現(xiàn)關(guān)聯(lián)規(guī)劃
10.3.1 訓(xùn)練模型
10.3.2 模型的評(píng)估
10.3.3 提升關(guān)聯(lián)規(guī)則的效果
10.3.4 關(guān)聯(lián)規(guī)則的可視化
10.4 總結(jié)
第11章 隨機(jī)森林
11.1 隨機(jī)森林的基本概念
11.3 總結(jié)
11.2 在R 語(yǔ)言中實(shí)現(xiàn)隨機(jī)森林
第12章 支持向量機(jī)
12.1 概述
12.3 總結(jié)
12.2 在R語(yǔ)言中實(shí)現(xiàn)支持向量機(jī)
第13章 神經(jīng)網(wǎng)絡(luò)
13.2.2 評(píng)估模型效果
13.1 概述
13.2 在R 語(yǔ)言中實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)
13.3 總結(jié)
13.2.1 構(gòu)建神經(jīng)網(wǎng)絡(luò)模型
第14章 文本挖掘
14.1 概述
14.2 text2vec 背景及其基本原理
14.3 DTM 與TFIDF 的原理和實(shí)現(xiàn)
14.3.1 DTM 和TFIDF 的原理
14.3.2 DTM 的實(shí)現(xiàn)
14.3.3 TFIDF 的實(shí)現(xiàn)
14.4 情感分析
14.5 LDA 主題模型及其實(shí)現(xiàn)
14.6 構(gòu)建自動(dòng)問(wèn)答系統(tǒng)
14.7 總結(jié)
第15章 社交網(wǎng)絡(luò)分析
15.1 社交網(wǎng)絡(luò)概述
15.2 igraph 簡(jiǎn)介
15.2.1 準(zhǔn)備工作
15.2.2 圖的指標(biāo)計(jì)算
15.3 社交網(wǎng)絡(luò)的常見結(jié)構(gòu)
15.4 社交網(wǎng)絡(luò)分析算法
15.4.1 Girvan-Newman
15.4.2 基于傳播標(biāo)簽的社區(qū)檢測(cè)
15.4.3 基于貪婪優(yōu)化模塊的社區(qū)檢測(cè)
15.4.4 自旋轉(zhuǎn)玻璃社群
15.5 微博社交群體分析
15.5.1 自旋轉(zhuǎn)玻璃社群
15.5.2 社群檢測(cè)
15.6 總結(jié)
第16章 H2O 機(jī)器學(xué)習(xí)
16.1 H2O 機(jī)器學(xué)習(xí)平臺(tái)
16.2 在R 語(yǔ)言中使用H2O
16.2.1 H2O 的安裝
16.2.2 案例應(yīng)用
16.2.3 H2O 常用API
16.2.4 模型的通用參數(shù)
16.2.5 參數(shù)調(diào)整
16.3 H2O Flow
16.3.1 H2O Flow 的安裝
16.3.2 H2O Flow 的基本使用方法
16.4 總結(jié)
第17章 R語(yǔ)言爬蟲
17.1 快速爬取網(wǎng)頁(yè)數(shù)據(jù)
17.2 rvest 簡(jiǎn)介
17.2.1 rvest API
17.2.2 rvest API 詳解
17.3 爬取BOSS 直聘數(shù)據(jù)
17.4 模擬登錄

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)