注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)現(xiàn)代數(shù)據(jù)科學(xué)(R語言·第2版)

現(xiàn)代數(shù)據(jù)科學(xué)(R語言·第2版)

現(xiàn)代數(shù)據(jù)科學(xué)(R語言·第2版)

定 價(jià):¥128.00

作 者: 本杰明·S.鮑默,丹尼爾·T.卡普蘭 著,張小明,郭華,張騫允 譯
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787302598794 出版時(shí)間: 2022-03-01 包裝:
開本: 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡介

  本書對(duì)上一版做了全面更新,與日益強(qiáng)大的tidyverse套包保持同步,納入sf、purrr、tidymodels和tidytext等包中的新功能。代碼的內(nèi)容和格式都經(jīng)過修改,以方便閱讀和理解。部分 章節(jié)被拆分、重新組織和重新構(gòu)思,以適應(yīng)不斷變化的實(shí)踐環(huán)境。

作者簡介

  Benjamin S. Baumer是美國史密斯學(xué)院統(tǒng)計(jì)與數(shù)據(jù)科學(xué)專業(yè)的副教授。Benjamin 于2004年成為紐約大都會(huì)隊(duì)第一位全職統(tǒng)計(jì)分析師,此后一直擔(dān)任應(yīng)用數(shù)據(jù)科學(xué)家。Benjamin曾榮獲美國棒球研究學(xué)會(huì)頒發(fā)的2019年Waller教育獎(jiǎng)和2016年突出貢獻(xiàn)者獎(jiǎng),參與撰寫了TheSabermetric Revolution-書。Daniel T. Kaplan是美國瑪卡萊斯特學(xué)院數(shù)學(xué)和計(jì)算機(jī)科學(xué)系的名譽(yù)教授,是多本統(tǒng)計(jì)建模和統(tǒng)計(jì)計(jì)算教科書的作者。Daniel獲 得2006年瑪卡萊斯特學(xué)院卓越教學(xué)獎(jiǎng)和2017年終身成就獎(jiǎng)。Nicholas J. Horton是美國阿默斯特學(xué)院統(tǒng)計(jì)和數(shù)據(jù)科學(xué)系的教授,是ASA和AAAS的高級(jí)會(huì)員,美國國家科學(xué)院應(yīng)用與理論統(tǒng)計(jì)委員會(huì)的聯(lián)合主席,多項(xiàng)美國國家教學(xué)獎(jiǎng)的獲得者,一系列統(tǒng)計(jì)計(jì)算書籍的作者,并積極參與編寫數(shù)據(jù)科學(xué)課程,幫助學(xué)生“用數(shù)據(jù)思考。

圖書目錄

第Ⅰ部分 數(shù)據(jù)科學(xué)簡介
第1章 序言:為什么有數(shù)據(jù)科學(xué)? 2
1.1 數(shù)據(jù)科學(xué)是什么 3
1.2 案例學(xué)習(xí):棒球資料統(tǒng)計(jì)分析
的演變 5
1.3 數(shù)據(jù)集 6
1.4 擴(kuò)展資源 7
第2章 數(shù)據(jù)可視化 8
2.1 2012年聯(lián)邦大選周期 8
2.1.1 這兩組數(shù)據(jù)有區(qū)別嗎? 10
2.1.2 圖形變化 11
2.1.3 檢查變量之間的關(guān)系 12
2.1.4 網(wǎng)絡(luò) 14
2.2 組成數(shù)據(jù)圖形 15
2.2.1 數(shù)據(jù)圖形分類 15
2.2.2 顏色 17
2.2.3 剖析數(shù)據(jù)圖形 19
2.3 數(shù)據(jù)圖形的重要性:
挑戰(zhàn)者號(hào) 21
2.4 創(chuàng)建有效的演示 25
2.5 更廣闊的數(shù)據(jù)可視化世界 25
2.6 擴(kuò)展資源 27
2.7 練習(xí)題 28
2.8 附加練習(xí) 29
第3章 圖形語法 30
3.1 數(shù)據(jù)圖形語法 30
3.1.1 畫面 31
3.1.2 刻度 33
3.1.3 指南 35
3.1.4 方面 35
3.1.5 層次 36
3.2 R中的規(guī)范數(shù)據(jù)圖形 38
3.2.1 單變量顯示 38
3.2.2 多元顯示 40
3.2.3 地圖 46
3.2.4 網(wǎng)絡(luò) 46
3.3 擴(kuò)展示例:歷史嬰兒名字 47
3.3.1 至今仍活著的人口的
百分比 48
3.3.2 最普通的女性名字 53
3.4 擴(kuò)展資源 56
3.5 練習(xí)題 56
3.6 附加練習(xí) 58
第4章 在一張表中整理數(shù)據(jù) 59
4.1 數(shù)據(jù)整理語法 59
4.1.1 select()和filter() 59
4.1.2 mutate()和rename() 62
4.1.3 arrange() 64
4.1.4 用group_by()進(jìn)行
summarize() 66
4.2 擴(kuò)展示例:Ben在大都會(huì)隊(duì)
(Mets)的時(shí)間 67
4.3 擴(kuò)展資源 75
4.4 練習(xí)題 76
4.5 附加練習(xí) 79
第5章 多張表的數(shù)據(jù)整理 80
5.1 inner_join() 80
5.2 left_join() 82
5.3 擴(kuò)展示例:Manny Ramirez 83
5.4 擴(kuò)展資源 90
5.5 練習(xí)題 90
5.6 附加練習(xí) 92
第6章 數(shù)據(jù)規(guī)整 93
6.1 規(guī)整數(shù)據(jù) 93
6.1.1 動(dòng)機(jī) 93
6.1.2 規(guī)整的數(shù)據(jù)是什么 95
6.2 重塑數(shù)據(jù) 101
6.2.1 用于從寬到窄以及從窄到
寬轉(zhuǎn)換的數(shù)據(jù)動(dòng)詞 103
6.2.2 pivot_wider()函數(shù) 103
6.2.3 pivot_longer()函數(shù) 103
6.2.4 list-column 104
6.2.5 示例:中性姓名 108
6.3 命名約定 110
6.4 數(shù)據(jù)獲取 111
6.4.1 數(shù)據(jù)表友好的格式 111
6.4.2 API 115
6.4.3 清洗數(shù)據(jù) 115
6.4.4 示例:日本核反應(yīng)堆 121
6.5 擴(kuò)展資源 124
6.6 練習(xí)題 124
6.7 附加練習(xí) 127


第17章 使用地理空間數(shù)據(jù) 348
17.1 動(dòng)機(jī):地理空間數(shù)據(jù)有什么了不起的? 348
17.2 空間數(shù)據(jù)結(jié)構(gòu) 351
17.3 制作地圖 353
17.3.1 靜態(tài)地圖 353
17.3.2 投影 354
17.3.3 基于leaflet的動(dòng)態(tài)地圖 360
17.4 擴(kuò)展示例:國會(huì)選區(qū) 362
17.4.1 選舉結(jié)果 362
17.4.2 國會(huì)選區(qū) 365
17.4.3 整合所有數(shù)據(jù) 367
17.4.4 使用ggplot2 368
17.4.5 使用leaflet 369
17.5 有效的地圖:如何避免撒謊 370
17.6 投影多邊形 371
17.7 有效利用其他技術(shù) 373
17.8 擴(kuò)展資源 374
17.9 練習(xí)題 374
17.10 附加練習(xí) 374
第18章 地理空間計(jì)算 375
18.1 地理空間操作 375
18.1.1 地理編碼、路線和距離 375
18.1.2 幾何運(yùn)算 378
18.2 地理空間聚合 384
18.3 地理空間聯(lián)接 386
18.4 拓展示例:MacLeish中的路徑海拔 387
18.5 擴(kuò)展資源 391
18.6 練習(xí)題 391
18.7 附加練習(xí) 392
第19章 文本數(shù)據(jù) 393
19.1 使用Macbeth的正則表達(dá)式 393
19.1.1 解析蘇格蘭戲劇文本 393
19.1.2 Macbeth中的生與死 397
19.2 擴(kuò)展示例:分析arXiv.org的文本數(shù)據(jù) 399
19.2.1 語料庫 402
19.2.2 詞云 404
19.2.3 情感分析 405
19.2.4 bigrams和N-grams 407
19.2.5 文檔詞項(xiàng)矩陣 408
19.3 獲取文本 412
19.4 擴(kuò)展資源 415
19.5 練習(xí)題 416
19.6 附加練習(xí) 418
第20章 網(wǎng)絡(luò)科學(xué) 419
20.1 網(wǎng)絡(luò)科學(xué)引言 419
20.1.1 定義 419
20.1.2 網(wǎng)絡(luò)科學(xué)簡史 420
20.2 擴(kuò)展示例:Kristen Stewart的六度空間理論 424
20.2.1 收集好萊塢數(shù)據(jù) 424
20.2.2 構(gòu)建好萊塢網(wǎng)絡(luò) 427
20.2.3 建立Kristen Stewart預(yù)言 430
20.3 PageRank 433
20.4 擴(kuò)展示例:1996年男子大學(xué)籃球賽 435
20.5 擴(kuò)展資源 442
20.6 練習(xí)題 442
20.7 附加練習(xí) 443
第21章 結(jié)束語:走向“大數(shù)據(jù)” 444
21.1 大數(shù)據(jù)的一些概念 444
21.2 更大數(shù)據(jù)的工具 446
21.2.1 大數(shù)據(jù)的數(shù)據(jù)和內(nèi)存結(jié)構(gòu) 446
21.2.2 編譯 447
21.2.3 并行和分布式計(jì)算 447
21.2.4 SQL的替代方案 454

21.3 R的替代方案 455
21.4 結(jié)束語 456
21.5 擴(kuò)展資源 456
第Ⅳ部分 附錄
附錄A 本書使用的包 458
附錄B R和RStudio簡介 465
附錄C 算法思維 483
附錄D 可再現(xiàn)性分析和工作流程 495
附錄E 回歸建模 504
附錄F 安裝數(shù)據(jù)庫服務(wù)器 524

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)