注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)R語言數(shù)據(jù)分析與可視化從入門到精通

R語言數(shù)據(jù)分析與可視化從入門到精通

R語言數(shù)據(jù)分析與可視化從入門到精通

定 價(jià):¥119.00

作 者: 程乾,劉永,高博 著
出版社: 北京大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787301314807 出版時(shí)間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 504 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  R語言是一個(gè)自由、免費(fèi)、源代碼開放的編程語言和環(huán)境,它提供了強(qiáng)大的數(shù)據(jù)分析功能和豐富的數(shù)據(jù)可視化手段。隨著數(shù)據(jù)科學(xué)的快速發(fā)展,R語言已經(jīng)成為數(shù)據(jù)分析領(lǐng)域炙手可熱的通用語言。全書分為3篇共12章,具體內(nèi)容如下?!〉?篇:入門篇(第1章~第3章)。本篇將帶領(lǐng)讀者逐步走進(jìn)R語言的世界,幫助讀者對(duì)R語言形成初步的認(rèn)識(shí),并學(xué)會(huì)如何獲取和安裝R語言,以及如何在需要時(shí)獲取幫助。然后介紹R語言的一些基礎(chǔ)知識(shí),這些知識(shí)是靈活應(yīng)用R語言的必要前提。最后重點(diǎn)介紹R語言函數(shù)的使用方法,同時(shí)也會(huì)涉及一些其他相關(guān)內(nèi)容,如流程控制和R語言環(huán)境等?!〉?篇:進(jìn)階篇(第4章~第11章)。本篇介紹R語言數(shù)據(jù)管理、數(shù)據(jù)分析和數(shù)據(jù)可視化的三大威力,包括通過數(shù)據(jù)獲取、導(dǎo)出、整合和清理等操作將零散的數(shù)據(jù)整合為可以分析處理的數(shù)據(jù)集的多種方法;并介紹一些常用基礎(chǔ)統(tǒng)計(jì)和高級(jí)統(tǒng)計(jì)的實(shí)現(xiàn)方法,以及R語言的圖形生成、圖形修飾、外部繪圖插件和圖形展示等功能?!〉?篇:實(shí)戰(zhàn)篇(第12章)。本篇通過一個(gè)實(shí)戰(zhàn)案例,綜合講解R語言在數(shù)據(jù)處理與可視化分析方面的實(shí)戰(zhàn)技能。

作者簡(jiǎn)介

  程乾,長期從事教育測(cè)量和教育大數(shù)據(jù)分析,擅長教育測(cè)量技術(shù)、數(shù)據(jù)可視化、數(shù)據(jù)挖掘算法和數(shù)據(jù)庫管理,并致力于R的推廣和普及。劉永,R語言極客,數(shù)據(jù)分析專家,曾任職于科大訊飛(深圳),新光在線(深圳),擅長數(shù)據(jù)管理、數(shù)據(jù)可視化、潛在分類分析、結(jié)構(gòu)方程建模和統(tǒng)計(jì)計(jì)算,對(duì)R語言有深入研究。高博,高級(jí)工程師,主要研究方向?yàn)樵朴?jì)算與大數(shù)據(jù)、數(shù)據(jù)可視化等,熟悉R語言、.Net、PHP、Python、DevOps、MySQL、SQLServer等技術(shù)和工具。參與編寫了《代碼的力量——Discuz!源碼分析與插件開發(fā)實(shí)例進(jìn)階》《PHP+MySQL+AJAX Web開發(fā)給力起飛》《Java Web應(yīng)用開發(fā)給力起飛》等圖書。主持省部級(jí)縱向課題3項(xiàng),參與縱向、橫向課題16項(xiàng),獲得軟件著作權(quán)12項(xiàng)。

圖書目錄

第1篇 入門篇第1章 R語言快速入門 /3
1.1 R語言及其歷史 /4
1.1.1 R語言的源起 /4
1.1.2 R語言的版本更新 /4
1.2 R語言的優(yōu)勢(shì)和劣勢(shì) /5
1.2.1 R語言的優(yōu)勢(shì) /5
1.2.2 R語言的劣勢(shì) /6
1.3 R語言的軟件獲取及安裝 /6
1.3.1 獲取R語言軟件 /6
1.3.2 在Windows平臺(tái)上安裝 /7
1.3.3 在Linux平臺(tái)上安裝 /10
1.3.4 在Mac OS平臺(tái)上安裝 /11
1.4 R語言的輔助工具 /13
1.4.1 R GUI /13
1.4.2 RStudio /16
1.4.3 獲取幫助 /19
1.5 新手問答 /21
1.6 小試牛刀:練習(xí)設(shè)置RStudio全局選項(xiàng) /21
本章小結(jié)  /23
第2章 R語言的編程基礎(chǔ)(上) /24
2.1 對(duì)象與變量 /25
2.1.1 對(duì)象 /25
2.1.2 變量 /26
2.1.3 變量的列舉和刪除 /28
2.2 數(shù)據(jù)類型 /30
2.2.1 常用數(shù)據(jù)類型 /31
2.2.2 特殊值 /31
2.3 數(shù)據(jù)結(jié)構(gòu) /32
2.3.1 向量 /32
2.3.2 矩陣和數(shù)組 /38
2.3.3 因子 /43
2.3.4 列表 /46
2.3.5 數(shù)據(jù)框 /50
2.3.6 原子向量和遞歸向量 /53
2.4 數(shù)學(xué)運(yùn)算 /58
2.4.1 基礎(chǔ)運(yùn)算 /58
2.4.2 向量運(yùn)算 /61
2.4.3 矩陣運(yùn)算 /64
2.5 新手問答 /65
2.6 小試牛刀:提取數(shù)據(jù)框子集,并對(duì)部分列做統(tǒng)計(jì)計(jì)算 /66
本章小結(jié)  /67
第3章 R語言的編程基礎(chǔ)(下) /68
3.1 流程控制 /69
3.1.1 repeat循環(huán) /69
3.1.2 while循環(huán) /70
3.1.3 for循環(huán) /70
3.1.4 if…else語句 /72
3.1.5 switch語句 /73
3.2 編寫R函數(shù) /74
3.2.1 函數(shù)格式 /74
3.2.2 函數(shù)參數(shù) /75
3.2.3 返回值 /77
3.2.4 函數(shù)調(diào)用 /77
3.3 R語言常用函數(shù) /78
3.3.1 文件操作函數(shù) /78
3.3.2 基礎(chǔ)計(jì)算函數(shù) /81
3.3.3 概率分布函數(shù) /86
3.3.4 字符處理函數(shù) /90
3.4 R包 /94
3.4.1 R包的管理 /94
3.4.2 R包的加載 /97
3.4.3 自定義R包 /98
3.5 環(huán)境空間 /103
3.5.1 環(huán)境空間的種類 /103
3.5.2 環(huán)境空間的使用方法 /104
3.5.3 環(huán)境空間的特征 /106
3.6 新手問答 /108
3.7 小試牛刀:編寫函數(shù)并實(shí)現(xiàn)調(diào)用  /109
本章小結(jié)  /110
第2篇 進(jìn)階篇第
4章 R語言的數(shù)據(jù)獲取與導(dǎo)出 /113
4.1 數(shù)據(jù)獲取 /114
4.1.1 導(dǎo)入R語言系統(tǒng)格式數(shù)據(jù) /114
4.1.2 導(dǎo)入帶有分隔符的文本數(shù)據(jù) /114
4.1.3 導(dǎo)入Excel數(shù)據(jù) /115
4.1.4 讀取數(shù)據(jù)庫數(shù)據(jù) /119
4.1.5 讀取其他統(tǒng)計(jì)工具的數(shù)據(jù) /128
4.1.6 從互聯(lián)網(wǎng)抓取數(shù)據(jù) /136
4.2 數(shù)據(jù)導(dǎo)出 /151
4.2.1 寫入R語言系統(tǒng)格式的數(shù)據(jù) /151
4.2.2 寫入文本文件 /152
4.2.3 寫入Excel文件 /152
4.2.4 寫入數(shù)據(jù)庫 /153
4.3 新手問答 /155
4.4 小試牛刀:比較R語言讀/寫文件的效率 /156
本章小結(jié)  /158
第5章 R語言的數(shù)據(jù)管理威力之?dāng)?shù)據(jù)操作 /159
5.1 R語言內(nèi)置數(shù)據(jù)操作函數(shù) /160
5.1.1 查看和編輯數(shù)據(jù) /160
5.1.2 篩選 /163
5.1.3 合并 /165
5.1.4 分組和匯總 /168
5.1.5 排序 /170
5.1.6 轉(zhuǎn)換 /173
5.2 數(shù)據(jù)重塑 /175
5.3 apply函數(shù)族 /178
5.3.1 apply()函數(shù) /178
5.3.2 lapply()函數(shù) /181
5.3.3 sapply()函數(shù) /183
5.3.4 vapply()函數(shù) /183
5.3.5 mapply()函數(shù) /184
5.4 plyr擴(kuò)展包 /184
5.5 用sqldf()函數(shù)實(shí)現(xiàn)數(shù)據(jù)框的SQL風(fēng)格查詢 /189
5.6 dplyr擴(kuò)展包 /191
5.7 新手問答  /199
5.8 牛刀小試:對(duì)矩陣各列使用不同的
函數(shù) /200
本章小結(jié)  /202
第6章 語言的數(shù)據(jù)分析威力之基本統(tǒng)計(jì) /203
6.1 描述性統(tǒng)計(jì) /204
6.1.1 描述性統(tǒng)計(jì)量 /204
6.1.2 列聯(lián)表 /206
6.1.3 同時(shí)呈現(xiàn)多個(gè)統(tǒng)計(jì)量 /210
6.2 計(jì)數(shù)數(shù)據(jù)的檢驗(yàn) /215
6.2.1 卡方檢驗(yàn)的基本原理 /215
6.2.2 在R語言中實(shí)現(xiàn)卡方檢驗(yàn) /216
6.3 相關(guān)分析 /220
6.3.1 相關(guān)的類型 /220
6.3.2 各種相關(guān)系數(shù)計(jì)算在R語言中的實(shí)現(xiàn) /221
6.4 t檢驗(yàn) /224
6.4.1 獨(dú)立樣本t檢驗(yàn) /225
6.4.2 非獨(dú)立樣本t檢驗(yàn) /227
6.4.3 對(duì)t檢驗(yàn)的前提假設(shè)進(jìn)行檢驗(yàn) /228
6.5 方差分析 /230
6.5.1 方差分析的基本術(shù)語 /230
6.5.2 aov()函數(shù) /231
6.5.3 單因素非重復(fù)測(cè)量方差分析 /232
6.5.4 單因素協(xié)方差分析 /235
6.5.5 單因素重復(fù)測(cè)量方差分析 /238
6.5.6 兩因素方差分析 /240
6.5.7 對(duì)方差分析前提假設(shè)的檢驗(yàn) /242
6.6 非參數(shù)檢驗(yàn) /242
6.6.1 兩總體比較 /243
6.6.2 多于兩總體比較 /244
6.7 回歸分析 /244
6.7.1 lm()函數(shù) /245
6.7.2 模型擬合 /245
6.7.3 模型診斷 /249
6.7.4 模型改進(jìn) /251
6.8 新手問答 /257
6.9 小試牛刀:獨(dú)立樣本均值差異檢驗(yàn) /257
本章小結(jié)  /259
第7章 R語言的數(shù)據(jù)分析威力之高級(jí)方法 /262
7.1 判別分析 /263
7.1.1 判別分析的原理 /263
7.1.2 判別分析在R語言中的實(shí)現(xiàn) /264
7.2 聚類分析 /273
7.2.1 聚類分析的原理 /274
7.2.2 聚類分析在R語言中的實(shí)現(xiàn) /279
7.3 主成分分析 /289
7.3.1 主成分分析的原理 /289
7.3.2 主成分分析在R語言中的實(shí)現(xiàn) /290
7.4 因子分析 /292
7.4.1 因子分析的原理 /293
7.4.2 因子分析在R語言中的實(shí)現(xiàn) /295
7.5 新手問答 /302
7.6 小試牛刀:嘗試實(shí)現(xiàn)層次聚類 /302
本章小結(jié)  /303
第8章 R語言的可視化威力之圖形生成 /304
8.1 R語言繪圖系統(tǒng) /305
8.2 單變量繪圖和雙變量繪圖 /305
8.2.1 散點(diǎn)圖 /305
8.2.2 折線圖 /309
8.2.3 條形圖 /312
8.2.4 餅圖 /314
8.2.5 箱線圖 /315
8.2.6 直方圖和核密度圖 /317
8.3 多變量繪圖 /319
8.3.1 氣泡圖 /319
8.3.2 熱圖 /321
8.3.3 馬賽克圖 /322
8.3.4 相關(guān)矩陣圖 /325
8.3.5 三維散點(diǎn)圖 /327
8.4 新手問答 /328
8.5 小試牛刀:將兩個(gè)數(shù)據(jù)源繪制在同一個(gè)坐標(biāo)系中 /329
本章小結(jié)  /330
第9章 R語言的可視化威力之圖形優(yōu)化 /331
9.1 添加圖形元素 /332
9.1.1 坐標(biāo)軸 /332
9.1.2 圖例 /337
9.1.3 文本注解 /341
9.1.4 標(biāo)題 /343
9.1.5 參考線 /344
9.1.6 線段和帶箭頭的線段 /346
9.1.7 矩形陰影 /347
9.2 控制圖形外觀 /348
9.2.1 整體外觀 /348
9.2.2 局部外觀 /351
9.2.3 文本 /352
9.2.4 線條 /353
9.2.5 矩形 /354
9.2.6 點(diǎn)的形狀 /355
9.3 圖形配色與布局 /356
9.3.1 顏色與調(diào)色板 /356
9.3.2 面板和分面 /362
9.3.3 圖形組合 /365
9.4 新手問答 /368
9.5 小試牛刀:使用網(wǎng)格系統(tǒng)組合圖形 /369
本章小結(jié)  /370
第10章 R語言的可視化威力之外部插件 /371
10.1 ggvis插件包 /372
10.1.1 ggivs與ggplot2的對(duì)比 /372
10.1.2 繪圖語法 /374
10.1.3 圖層 /377
10.1.4 圖形修飾 /384
10.2 plotly插件包 /391
10.2.1 plotly插件包對(duì)ggplot2包繪圖對(duì)象的擴(kuò)展 /392
10.2.2 繪圖語法 /393
10.2.3 繪圖示例 /403
10.2.4 圖形修飾 /416
10.3 新手問答 /422
10.4 小試牛刀:使用plotly插件包繪制組合圖 /423
本章小結(jié)  /425
第11章 R語言的可視化威力之圖形展示 /426
11.1 傳統(tǒng)圖形輸出 /427
11.1.1 輸出為位圖文件 /427
11.1.2 輸出為PDF文件 /428
11.1.3 輸出為矢量圖 /429
11.2 網(wǎng)頁輸出 /429
11.2.1 使用R Markdown輸出為網(wǎng)頁 /430
11.2.2 使用shiny輸出為網(wǎng)頁 /437
11.3 新手問答 /443
11.4 小試牛刀:將繪圖輸出為HTML文檔 /444
本章小結(jié)  /446
第3篇 實(shí)戰(zhàn)篇
第12章 R語言對(duì)產(chǎn)品性價(jià)比的數(shù)據(jù)分析與可視化 /449
12.1 數(shù)據(jù)采集 /450
12.1.1 分析頁面結(jié)構(gòu) /450
12.1.2 編寫爬蟲程序 /454
12.1.3 抓取數(shù)據(jù)并保存 /463
12.2 數(shù)據(jù)清理 /463
12.2.1 變量(字符)拆分與抽取 /464
12.2.2 檢測(cè)數(shù)據(jù)缺失與重復(fù)值 /466
12.2.3 變量類型轉(zhuǎn)化與重命名 /468
12.3 數(shù)據(jù)分析與數(shù)據(jù)可視化 /470
12.3.1 探索性數(shù)據(jù)分析 /470
12.3.2 圖書價(jià)格和評(píng)論指標(biāo)的聚類分析 /484
12.3.3 圖書性價(jià)比分析 /487
本章小結(jié)  /496
參考文獻(xiàn) /497

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)