注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)網(wǎng)絡(luò)與數(shù)據(jù)通信網(wǎng)絡(luò)服務(wù)數(shù)據(jù)科學(xué)實(shí)用算法

數(shù)據(jù)科學(xué)實(shí)用算法

數(shù)據(jù)科學(xué)實(shí)用算法

定 價(jià):¥98.00

作 者: (美)布賴(lài)恩·斯蒂爾,約翰·錢(qián)德勒,斯瓦納·雷迪
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302531104 出版時(shí)間: 2019-12-01 包裝:
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《數(shù)據(jù)科學(xué)實(shí)用算法》分為三部分。第I部分“數(shù)據(jù)約簡(jiǎn)”首先討論數(shù)據(jù)約簡(jiǎn)和數(shù)據(jù)映射等概念,然后講述關(guān)聯(lián)統(tǒng)計(jì)、可擴(kuò)展算法和分布式計(jì)算等基礎(chǔ)知識(shí)。第II部分“從數(shù)據(jù)中提取信息”呈現(xiàn)線(xiàn)性回歸、數(shù)據(jù)可視化和聚類(lèi)分析等主題,用一章的篇幅介紹醫(yī)療分析的關(guān)鍵領(lǐng)域。第III部分“預(yù)測(cè)分析”通過(guò)開(kāi)發(fā)兩個(gè)基本且廣泛使用的預(yù)測(cè)函數(shù)(k近鄰和樸素貝葉斯)向讀者介紹預(yù)測(cè)分析技術(shù),用一章的篇幅專(zhuān)門(mén)論述預(yù)報(bào),*后一章重點(diǎn)介紹數(shù)據(jù)流。

作者簡(jiǎn)介

  Brian Steele是蒙大拿州立大學(xué)的數(shù)學(xué)教授,是SoftMath咨詢(xún)公司的資深數(shù)據(jù)科學(xué)家。 Steele博士發(fā)表過(guò)多篇關(guān)于EM算法、精確bagging、bootstrap和諸多統(tǒng)計(jì)應(yīng)用的技術(shù)文章。Steele主要講授數(shù)據(jù)分析和統(tǒng)計(jì)課程,并為客戶(hù)提供與數(shù)據(jù)科學(xué)和統(tǒng)計(jì)有關(guān)的咨詢(xún)。John Chandler自1999年以來(lái)一直從事前沿的營(yíng)銷(xiāo)和數(shù)據(jù)分析工作,曾幫助多家《財(cái)富》100強(qiáng)公司評(píng)價(jià)廣告效果,改善績(jī)效。Chandler博士從2015年開(kāi)始在蒙大拿州立大學(xué)商學(xué)院擔(dān)任市場(chǎng)營(yíng)銷(xiāo)教授,講授高級(jí)營(yíng)銷(xiāo)分析和數(shù)據(jù)科學(xué)課程。Chandler也是Ars Quanta咨詢(xún)公司的創(chuàng)始人和首席數(shù)據(jù)科學(xué)家。Swarna Reddy是蒙大拿州立大學(xué)數(shù)學(xué)系教授,也是SoftMath咨詢(xún)公司的創(chuàng)始人、首席執(zhí)行官和資深數(shù)據(jù)科學(xué)家。Reddy專(zhuān)門(mén)研究計(jì)算數(shù)學(xué)和運(yùn)籌學(xué),曾發(fā)表過(guò)多篇論文,已開(kāi)發(fā)出多個(gè)重大的生物信息學(xué)、網(wǎng)絡(luò)安全和商業(yè)分析方案。

圖書(shū)目錄

第I部分  數(shù)據(jù)約簡(jiǎn)
第1 章  數(shù)據(jù)科學(xué)概述   3
1.1  什么是數(shù)據(jù)科學(xué)?   3
1.2  美國(guó)的糖尿病數(shù)據(jù)   5
1.3  《聯(lián)邦黨人文集》的作者數(shù)據(jù)   6
1.4  預(yù)測(cè)納斯達(dá)克股價(jià)   8
1.5  述評(píng)   9
1.6  關(guān)于本書(shū)   10
1.7  算法   12
1.8  Python語(yǔ)言   13
1.9  R語(yǔ)言   13
1.10  術(shù)語(yǔ)和符號(hào)   14
1.11  本書(shū)網(wǎng)站   16
第2 章  數(shù)據(jù)映射和數(shù)據(jù)字典   17
2.1  數(shù)據(jù)約簡(jiǎn)   17
2.2  政治捐款   18
2.3  字典   19
2.4  教程:大金主   20
2.5  數(shù)據(jù)約簡(jiǎn)   24
2.5.1  符號(hào)和術(shù)語(yǔ)   24
2.5.2  政治捐款示例   25
2.5.3  映射   26
2.6  教程:選舉周期捐款   27
2.7  相似度度量   33
2.8  教程:計(jì)算相似度   37
2.9  關(guān)于字典的總結(jié)性述評(píng)   41
2.10  練習(xí)   41
2.10.1  概念練習(xí)   41
2.10.2  計(jì)算練習(xí)   42
第3 章  可擴(kuò)展算法和聯(lián)合統(tǒng)計(jì)   45
3.1  引言   45
3.2  示例:美國(guó)的肥胖癥數(shù)據(jù)   46
3.3  關(guān)聯(lián)統(tǒng)計(jì)數(shù)據(jù)   47
3.4  單變量觀(guān)測(cè)   48
3.4.1  直方圖   50
3.4.2  直方圖的構(gòu)建   51
3.5  函數(shù)   52
3.6  教程:直方圖的構(gòu)建   53
3.7  多變量數(shù)據(jù)   65
3.7.1  符號(hào)和術(shù)語(yǔ)   65
3.7.2  估計(jì)量   66
3.7.3  增廣“矩”矩陣   69
3.7.4  述評(píng)   70
3.8  教程:計(jì)算相關(guān)矩陣   70
3.9  線(xiàn)性回歸簡(jiǎn)介   77
3.9.1  線(xiàn)性回歸模型   77
3.9.2  β的估計(jì)值   78
3.9.3  準(zhǔn)確性評(píng)估   81
3.9.4  計(jì)算    82
3.10  教程:計(jì)算    83
3.11  練習(xí)   89
3.11.1  概念練習(xí)   89
3.12.2  計(jì)算練習(xí)   90
第4 章  Hadoop和MapReduce   93
4.1  引言   93
4.2  Hadoop生態(tài)系統(tǒng)   94
4.2.1  Hadoop分布式文件系統(tǒng)   94
4.2.2  MapReduce   95
4.2.3  映射   96
4.2.4  約簡(jiǎn)   97
4.3  開(kāi)發(fā)Hadoop應(yīng)用程序   98
4.4  醫(yī)療保險(xiǎn)支付   98
4.5  命令行環(huán)境   99
4.6  教程:編程實(shí)現(xiàn)MapReduce算法   100
4.6.1  映射器   102
4.6.2  約簡(jiǎn)器   105
4.6.3  概要   108
4.7  教程:使用亞馬遜網(wǎng)絡(luò)服務(wù)   109
4.8  練習(xí)   113
4.8.1  概念練習(xí)   113
4.8.2  計(jì)算練習(xí)   113
第II部分  從數(shù)據(jù)中提取信息
第5 章  數(shù)據(jù)可視化   117
5.1  引言   117
5.2  數(shù)據(jù)可視化的原則   118
5.3  做出正確選擇   121
5.3.1  單變量數(shù)據(jù)   122
5.3.2  雙變量和多變量數(shù)據(jù)   125
5.4  利用好這臺(tái)機(jī)器   132
5.4.1  繪制圖5.2   134
5.4.2  繪制圖5.3   135
5.4.3  繪制圖5.4   136
5.4.4  繪制圖5.5   136
5.4.5  繪制圖5.8   138
5.4.6  繪制圖5.10   139
5.4.7  繪制圖5.11   140
5.5  練習(xí)   141
第6 章  線(xiàn)性回歸方法   143
6.1  引言   143
6.2  線(xiàn)性回歸模型   144
6.2.1  示例:抑郁癥、宿命論和簡(jiǎn)單化   145
6.2.2  小二乘法   147
6.2.3  置信區(qū)間   149
6.2.4  分布條件   150
6.2.5  假設(shè)檢驗(yàn)   151
6.2.6  警示語(yǔ)   154
6.3  R語(yǔ)言簡(jiǎn)介   155
6.4  教程:R語(yǔ)言   156
6.5  教程:大數(shù)據(jù)集和R語(yǔ)言   159
6.6  因子   164
6.6.1  交互   166
6.6.2  擴(kuò)展平方和F檢驗(yàn)   168
6.7  教程:共享單車(chē)   171
6.8  殘差分析   175
6.8.1  線(xiàn)性   176
6.8.2  示例:共享單車(chē)問(wèn)題   177
6.8.3  獨(dú)立性   179
6.9  教程:殘差分析   182
6.10  練習(xí)   185
6.10.1  概念練習(xí)   185
6.10.2  計(jì)算練習(xí)   185
第7 章  醫(yī)療分析   189
7.1  引言   189
7.2  行為風(fēng)險(xiǎn)因素監(jiān)測(cè)系統(tǒng)   190
7.2.1  患病率的估計(jì)   192
7.2.2  發(fā)病率的估計(jì)   193
7.3  教程:糖尿病的患病率和發(fā)病率   194
7.4  預(yù)測(cè)具有患病風(fēng)險(xiǎn)的個(gè)人   203
7.5  教程:確認(rèn)具有患病風(fēng)險(xiǎn)的個(gè)體   208
7.6  非尋常的人口特征   213
7.7  教程:構(gòu)建近鄰集合   215
7.8  練習(xí)   219
7.8.1  概念練習(xí)   219
7.8.2  計(jì)算練習(xí)   220
第8 章  聚類(lèi)分析   223
8.1  引言   223
8.2  凝聚層次聚類(lèi)   224
8.3  各州間的對(duì)比   225
8.4  教程:各州的層次聚類(lèi)   228
8.5  k均值算法   235
8.6  教程:k均值算法   236
8.7  練習(xí)   242
8.7.1  概念練習(xí)   242
8.7.2  計(jì)算練習(xí)   242
第III部分  預(yù)測(cè)分析
第9 章  k近鄰預(yù)測(cè)函數(shù)   247
9.1  引言   247
9.2  符號(hào)和術(shù)語(yǔ)   249
9.3  距離度量   251
9.4  k近鄰預(yù)測(cè)函數(shù)   252
9.5  指數(shù)加權(quán)k近鄰   253
9.6  教程:數(shù)字識(shí)別   255
9.7  準(zhǔn)確性估計(jì)   262
9.8  k近鄰回歸   264
9.9  預(yù)測(cè)標(biāo)準(zhǔn)普爾500指數(shù)   265
9.10  教程:利用模式回歸進(jìn)行預(yù)測(cè)   266
9.11  交叉驗(yàn)證   273
9.12  練習(xí)   275
9.12.1  概念練習(xí)   275
9.12.2  計(jì)算練習(xí)   275
第10 章  多項(xiàng)式樸素貝葉斯預(yù)測(cè)函數(shù)   279
10.1  引言   279
10.2  聯(lián)邦黨人文集   280
10.3  多項(xiàng)式樸素貝葉斯預(yù)測(cè)函數(shù)   281
10.4  教程:約簡(jiǎn)《聯(lián)邦黨人文集》   285
10.5  教程:預(yù)測(cè)有爭(zhēng)議的《聯(lián)邦黨人文集》的作者   291
10.6  教程:客戶(hù)細(xì)分   294
10.6.1  加法平滑   295
10.6.2  數(shù)據(jù)   296
10.6.3  述評(píng)   303
10.7  練習(xí)   303
10.7.1  概念練習(xí)   303
10.7.2  計(jì)算練習(xí)   304
第11 章  預(yù)報(bào)   307
11.1  引言   307
11.2  教程:處理時(shí)間   309
11.3  分析方法   313
11.3.1  符號(hào)   313
11.3.2  均值和方差的估計(jì)   313
11.3.3  指數(shù)預(yù)報(bào)   315
11.3.4  自相關(guān)   316
11.4  教程:計(jì)算    318
11.5  漂移和預(yù)報(bào)   322
11.6  Holt-Winters指數(shù)型預(yù)報(bào)   323
11.7  教程:Holt-Winters預(yù)報(bào)   326
11.8  基于回歸的股價(jià)預(yù)報(bào)   330
11.9  教程:基于回歸的預(yù)報(bào)   331
11.10  時(shí)變回歸預(yù)報(bào)器   336
11.11  教程:時(shí)變回歸預(yù)報(bào)器   337
11.12  練習(xí)   339
11.12.1  概念練習(xí)   339
11.12.2  計(jì)算練習(xí)   339
第12 章  實(shí)時(shí)分析   343
12.1  引言   343
12.2  用納斯達(dá)克報(bào)價(jià)數(shù)據(jù)流進(jìn)行預(yù)報(bào)   344
12.3  教程:預(yù)報(bào)Apple公司信息流   346
12.4  Twitter信息流API   351
12.5  教程:訪(fǎng)問(wèn)Twitter數(shù)據(jù)流   352
12.6  情感分析   357
12.7  教程:主題標(biāo)簽分組的情感分析   358
12.8  練習(xí)   360
附錄  A  練習(xí)答案   363
附錄  B  使用Twitter API   377
參考文獻(xiàn)   379
 

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)