注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python

玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python

玩轉(zhuǎn)大數(shù)據(jù):SAS+R+Stata+Python

定 價:¥198.00

作 者: 孫江偉,王韻章,寧錚,李夏,王吟曦 ... 著
出版社: 清華大學(xué)出版社
叢編項:
標(biāo) 簽: 暫缺

ISBN: 9787302570677 出版時間: 2021-06-01 包裝: 平裝
開本: 16開 頁數(shù): 640 字?jǐn)?shù):  

內(nèi)容簡介

  面對日漸復(fù)雜的大數(shù)據(jù),科技工作者很難用單一的統(tǒng)計軟件高效、完美地完成從數(shù)據(jù)挖掘、數(shù)據(jù)清洗、統(tǒng)計分析到結(jié)果呈現(xiàn)的全部工作,因此需要熟悉和掌握多種統(tǒng)計工具,各取所長、整合使用。本書立足于大數(shù)據(jù)研究的現(xiàn)狀,基于實際醫(yī)療案例,介紹數(shù)學(xué)基礎(chǔ)知識和統(tǒng)計學(xué)基礎(chǔ)知識,SAS、R語言、Stata和Python這4款大數(shù)據(jù)常用分析工具的基礎(chǔ)編程知識及實踐操作。 本書主要面向在校本科生、研究生,以及要掌握SAS、R語言、Stata和Python的數(shù)據(jù)工作者,熟悉四個軟件的任意一個且想要在短時間內(nèi)掌握其他軟件的讀者,也適合醫(yī)科學(xué)生、臨床醫(yī)生或藥企人員等醫(yī)療相關(guān)人員學(xué)習(xí)使用。

作者簡介

  孫江偉復(fù)旦大學(xué)流行病與衛(wèi)生統(tǒng)計學(xué)專業(yè)碩士,曾在強(qiáng)生公司(Johnson &Johnson)任生物統(tǒng)計師,對國內(nèi)醫(yī)藥臨床領(lǐng)域及國外醫(yī)療注冊系統(tǒng)等大數(shù)據(jù)的數(shù)據(jù)管理、數(shù)據(jù)清洗、研究設(shè)計及統(tǒng)計分析,有豐富的理論及實踐經(jīng)驗,現(xiàn)于瑞典卡羅林斯卡醫(yī)學(xué)院進(jìn)行衛(wèi)生統(tǒng)計學(xué)方面的研究深造。在American Journal of Epidemiology、European Journal of Neurology等雜志發(fā)表相關(guān)領(lǐng)域SCI論文10篇。

圖書目錄

第1章數(shù)學(xué)基礎(chǔ)1
1.1常用的數(shù)學(xué)符號1
1.2常見概念2
1.2.1集合2
1.2.2極限3
1.3微積分5
1.3.1導(dǎo)數(shù)與微分5
1.3.2基本初等函數(shù)的導(dǎo)函數(shù)和微分公式6
1.3.3導(dǎo)數(shù)與微分的運算法則7
1.3.4定積分與不定積分8
1.3.5基本的不定積分公式9
1.3.6定積分與不定積分的性質(zhì)10
1.4線性代數(shù)11
1.4.1標(biāo)量與向量11
1.4.2矩陣與線性方程組11
1.4.3行列式的定義與運算12
1.4.4矩陣的運算法則14
1.4.5特殊的矩陣16
1.4.6矩陣的秩17
1.4.7矩陣的轉(zhuǎn)置與矩陣的逆18
1.4.8特征向量與特征值18
第2章統(tǒng)計學(xué)基礎(chǔ)20
2.1概率論的基本概念20
2.2隨機(jī)變量與分布21
2.2.1隨機(jī)變量21
2.2.2累積分布函數(shù)222.2.3概率函數(shù)22
2.3隨機(jī)變量的數(shù)學(xué)特征23
2.3.1數(shù)學(xué)期望23
2.3.2期望值的規(guī)律24
2.3.3條件期望25
2.3.4協(xié)方差與相關(guān)系數(shù)25
2.3.5樣本均值和方差26
2.4常見的隨機(jī)變量分布27
2.4.1離散變量分布27
2.4.2連續(xù)變量分布28
2.5統(tǒng)計學(xué)基本概念32
2.5.1總體與樣本32
2.5.2參數(shù)和統(tǒng)計量32
2.5.3中心極限定理32
2.6統(tǒng)計描述32
2.6.1定量資料的統(tǒng)計描述32
2.6.2分類資料的統(tǒng)計描述34
2.7統(tǒng)計推斷34
2.7.1參數(shù)估計34
2.7.2假設(shè)檢驗38
2.8多因素回歸模型40
2.8.1多因素線性回歸模型40
2.8.2多因素Logistic回歸模型41
2.8.3多因素Cox回歸模型43
第3章軟件基礎(chǔ)總論45
3.1軟件初識45
3.1.1SAS45
3.1.2R語言45
3.1.3Stata45
3.1.4Python46
3.24個軟件的比較46
第4章SAS基礎(chǔ)52
4.1SAS介紹與資源52
4.1.1SAS語言及程序結(jié)構(gòu)52
4.1.2SAS工作界面53
4.1.3獲得幫助54
4.2數(shù)據(jù)的導(dǎo)入與導(dǎo)出55
4.2.1導(dǎo)入數(shù)據(jù)55
4.2.2導(dǎo)出數(shù)據(jù)67
4.3SAS中常用的函數(shù)70
4.3.1字符型函數(shù)70
4.3.2數(shù)值型函數(shù)80
4.3.3日期型函數(shù)84
4.3.4特殊函數(shù)86
4.3.5其他函數(shù)89
4.4SAS變量91
4.4.1變量屬性92
4.4.2自動變量92
4.4.3變量列表的縮寫規(guī)則92
4.4.4創(chuàng)建變量94
4.4.5改變變量屬性96
4.4.6改變變量類型96
4.5SAS數(shù)據(jù)處理97
4.5.1選取變量97
4.5.2創(chuàng)建變量99
4.5.3對觀測求和100
4.5.4選取并操作部分觀測102
4.5.5循環(huán)和數(shù)組104
4.5.6數(shù)據(jù)集的橫向合并和縱向合并107
4.5.7增加數(shù)據(jù)集處理靈活性的SAS選項111
4.6SAS中常見的proc步113
4.6.1proc contents113
4.6.2proc datasets114
4.6.3proc freq116
4.6.4proc means118
4.6.5proc sort120
4.6.6proc transpose121
4.6.7proc univariate123
4.6.8proc corr125
4.6.9proc reg126
4.6.10proc logistic128
4.6.11proc lifetest129
4.6.12proc phreg130
4.7PROC SQL131
4.7.1檢索數(shù)據(jù)131
4.7.2合并數(shù)據(jù)集135
4.7.3使用PROC SQL管理表137
4.8SAS宏介紹143
4.8.1宏變量143
4.8.2宏函數(shù)147
4.8.3宏程序151
4.8.4宏參數(shù)152
4.8.5宏語言與data步153
4.8.6宏語言與PROC SQL157
4.8.7條件語句和循環(huán)語句在宏語言中的使用161
第5章R語言基礎(chǔ)163
5.1R語言介紹163
5.1.1R語言的特點與資源163
5.1.2RStudio使用簡介163
5.2R語言的基本規(guī)則164
5.2.1對象165
5.2.2函數(shù)使用基礎(chǔ)165
5.2.3擴(kuò)展包166
5.2.4幫助167
5.3數(shù)據(jù)類型167
5.3.1vector167
5.3.2factor169
5.3.3date171
5.3.4matrix172
5.3.5list175
5.3.6data.frame179
5.3.7formula181
5.4常用函數(shù)介紹182
5.4.1數(shù)據(jù)的讀入和導(dǎo)出182
5.4.2條件判斷183
5.4.3循環(huán)186
5.4.4文本處理188
5.4.5基本作圖190
5.4.6自定義函數(shù)192
5.5常用數(shù)據(jù)處理與統(tǒng)計分析函數(shù)195
5.5.1單變量分析195
5.5.2雙變量、多變量分析198
5.5.3線性回歸模型200
5.5.4Logistic回歸模型202
5.5.5生存分析模型203
5.6dplyr包簡介206
5.6.1安裝dplyr包206
5.6.2dplyr包中常用的5個函數(shù)206
5.6.3用%>%運算符連接多個函數(shù)211
5.6.4dplyr包中其他實用的函數(shù)212
5.7ggplot2包簡介214
5.7.1安裝ggplot2包214
5.7.2使用ggplot2畫圖的基本思路214
5.7.3使用geom_histogram函數(shù)繪制直方圖215
5.7.4使用geom_bar函數(shù)繪制柱狀圖217
5.7.5使用geom_boxplot函數(shù)繪制箱形圖217
5.7.6使用geom_point函數(shù)繪制散點圖220
5.7.7使用geom_smooth函數(shù)在散點圖上添加線性回歸結(jié)果223
5.7.8對圖中細(xì)節(jié)進(jìn)行微調(diào)224
5.7.9將多個圖合并為一個圖225
5.7.10保存圖228
第6章Stata基礎(chǔ)229
6.1Stata簡介229
6.1.1界面介紹229
6.1.2在菜單欄中選擇命令230
6.1.3輸入命令代碼230
6.2獲得幫助230
6.2.1檢索關(guān)鍵詞230
6.2.2查看幫助231
6.2.3幫助建議231
6.3語法結(jié)構(gòu)231
6.3.1變量集232
6.3.2by前綴233
6.3.3命令234
6.3.4=表達(dá)式234
6.3.5if表達(dá)式236
6.3.6in范圍236
6.3.7權(quán)重237
6.3.8命令選項237
6.3.9數(shù)值集合238
6.3.10文件名238
6.4數(shù)據(jù)轉(zhuǎn)換與分析239
6.4.1導(dǎo)入數(shù)據(jù)239
6.4.2瀏覽數(shù)據(jù)與基本描述240
6.4.3數(shù)值變量243
6.4.4文本變量247
6.4.5日期變量252
6.4.6缺失值253
6.4.7注釋變量254
6.4.8調(diào)整數(shù)據(jù)結(jié)構(gòu)256
6.4.9基本描述258
6.4.10統(tǒng)計檢驗260
6.4.11相關(guān)分析262
6.4.12回歸分析263
6.4.13導(dǎo)出數(shù)據(jù)267
6.5輸出結(jié)果調(diào)用268
6.5.1一般統(tǒng)計命令結(jié)果調(diào)用268
6.5.2估計命令結(jié)果調(diào)用269
6.6重復(fù)命令271
6.6.1by前綴271
6.6.2foreach循環(huán)274
6.6.3forvalues循環(huán)275
6.7編程工具275
6.7.1do文件275
6.7.2標(biāo)量變量276
6.7.3宏變量277
6.7.4矩陣279
6.7.5程序283
第7章Python基礎(chǔ)284
7.1Python的安裝284
7.1.1使用Python安裝包安裝Python 3284
7.1.2通過Anaconda安裝Python 3285
7.2常用交互式語言開發(fā)環(huán)境287
7.2.1編輯器288
7.2.2控制臺289
7.2.3變量管理器290
7.3常用數(shù)據(jù)類型、數(shù)據(jù)結(jié)構(gòu)與基本語句291
7.3.1Python中的變量命名規(guī)則291
7.3.2常見的數(shù)據(jù)類型及運算291
7.3.3常見的數(shù)據(jù)結(jié)構(gòu)及運算291
7.3.4個程序295
7.3.5函數(shù)295
7.3.6常用邏輯語句298
7.4數(shù)據(jù)的導(dǎo)入與導(dǎo)出302
7.4.1數(shù)據(jù)的讀取302
7.4.2數(shù)據(jù)存儲304
7.5基礎(chǔ)運算常用包——NumPy 304
7.5.1基本性質(zhì)304
7.5.2矢量化運算306
7.5.3NumPy中的函數(shù)306
7.5.4ndarray的軸、索引與切片309
7.5.5實戰(zhàn)舉例: 用NumPy進(jìn)行圖像處理313
7.6數(shù)據(jù)處理常用包——Pandas316
7.6.1主要數(shù)據(jù)類型316
7.6.2對DataFrame的描述318
7.6.3缺失值的檢測與處理319
7.6.4DataFrame的索引321
7.6.5常見操作325
7.6.6字符處理專題328
7.6.7apply專題331
7.6.8groupby專題333
7.7統(tǒng)計分析常用包338
7.7.1單樣本t檢驗339
7.7.2獨立樣本t檢驗340
7.7.3兩個連續(xù)型變量的相關(guān)性341
7.7.4兩個分類變量的頻數(shù)統(tǒng)計341
7.7.5線性回歸模型342
7.7.6Logistic回歸模型345
7.7.7生存分析347
7.8繪圖常用包352
7.8.1Pandas352
7.8.2Matplotlib356
7.8.3Seaborn360
第8章軟件實踐總論366
8.1本書使用的數(shù)據(jù)集366
8.1.1病人基本信息數(shù)據(jù)集366
8.1.2診斷信息數(shù)據(jù)集367
8.1.3實驗室檢測結(jié)果數(shù)據(jù)集(一)368
8.1.4實驗室檢測結(jié)果數(shù)據(jù)集(二)368
8.1.5用藥信息數(shù)據(jù)集368
8.1.6急性心肌梗死數(shù)據(jù)集369
8.2軟件實踐步驟369
8.2.1數(shù)據(jù)清洗369
8.2.2數(shù)據(jù)準(zhǔn)備370
8.2.3數(shù)據(jù)分析370
8.2.4結(jié)果整理370
8.2.5代碼的重復(fù)使用370
8.3實例: 擬研究的課題371
第9章SAS實踐部分372
9.1數(shù)據(jù)的清洗與管理372
9.1.1病人基本信息數(shù)據(jù)集372
9.1.2診斷信息數(shù)據(jù)集376
9.1.3實驗室檢測結(jié)果數(shù)據(jù)集(一)381
9.1.4實驗室檢測結(jié)果數(shù)據(jù)集(二)387
9.1.5用藥信息數(shù)據(jù)集390
9.2數(shù)據(jù)分析與結(jié)果整理393
9.2.1定量數(shù)據(jù)的統(tǒng)計描述394
9.2.2分類數(shù)據(jù)的統(tǒng)計描述398
9.2.3相關(guān)分析402
9.2.4線性回歸分析406
9.2.5Logistic回歸分析412
9.2.6Cox回歸分析418
第10章R語言實踐部分425
10.1數(shù)據(jù)的清洗與管理425
10.1.1病人基本信息數(shù)據(jù)集425
10.1.2診斷信息數(shù)據(jù)集431
10.1.3實驗室檢測結(jié)果數(shù)據(jù)集(一)435
10.1.4實驗室檢測結(jié)果數(shù)據(jù)集(二)439
10.1.5用藥信息數(shù)據(jù)集442
10.2數(shù)據(jù)分析與結(jié)果整理445
10.2.1定量數(shù)據(jù)的統(tǒng)計描述446
10.2.2分類數(shù)據(jù)的統(tǒng)計描述449
10.2.3相關(guān)分析452
10.2.4線性回歸分析453
10.2.5Logistic回歸分析457
10.2.6Cox回歸分析463
第11章Stata實踐部分470
11.1數(shù)據(jù)的清洗與管理470
11.1.1病人基本信息數(shù)據(jù)集470
11.1.2診斷信息數(shù)據(jù)集483
11.1.3實驗室檢測結(jié)果數(shù)據(jù)集(一)490
11.1.4實驗室檢測結(jié)果數(shù)據(jù)集(二)495
11.1.5用藥信息數(shù)據(jù)集500
11.2數(shù)據(jù)分析與結(jié)果整理504
11.2.1定量數(shù)據(jù)的統(tǒng)計描述504
11.2.2分類數(shù)據(jù)的統(tǒng)計描述511
11.2.3相關(guān)分析516
11.2.4一般線性回歸分析519
11.2.5Logistic回歸分析526
11.2.6Cox回歸分析535
11.3Stata在Meta分析中的應(yīng)用545
11.3.1Meta分析簡介545
11.3.2二分類變量的Meta分析548
11.3.3連續(xù)性變量的Meta分析552
11.3.4發(fā)表偏倚分析553
第12章Python實踐部分557
12.1數(shù)據(jù)的清洗與管理557
12.1.1病人基本信息數(shù)據(jù)集557
12.1.2診斷信息數(shù)據(jù)集566
12.1.3實驗室檢測結(jié)果數(shù)據(jù)集(一)571
12.1.4實驗室檢測結(jié)果數(shù)據(jù)集(二)578
12.1.5用藥信息數(shù)據(jù)集582
12.2數(shù)據(jù)準(zhǔn)備和數(shù)據(jù)分析584
12.2.1定量數(shù)據(jù)的統(tǒng)計描述584
12.2.2分類數(shù)據(jù)的統(tǒng)計描述587
12.2.3相關(guān)分析589
12.2.4線性回歸分析591
12.2.5Logistic回歸分析595
12.2.6Cox回歸分析602參考文獻(xiàn)609附錄A常用假設(shè)檢驗方法610附錄B正則表達(dá)式619附錄C系統(tǒng)綜述與Meta分析技術(shù)路線圖622

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號