注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)家庭與辦公軟件數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道

數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道

數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道

定 價(jià):¥85.00

作 者: [美] Vincent Granville(文森特·格蘭維爾) 著;吳博,張曉峰,季春霖 譯
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)?網(wǎng)絡(luò) 計(jì)算機(jī)期刊雜志

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787121308833 出版時(shí)間: 2017-05-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 356 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是一本跟數(shù)據(jù)科學(xué)和數(shù)據(jù)科學(xué)家有關(guān)的“手冊(cè)”,它還包含傳統(tǒng)統(tǒng)計(jì)學(xué)、編程或計(jì)算機(jī)科學(xué)教科書(shū)中所沒(méi)有的信息?!稊?shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》有3個(gè)組成部分:一是多層次地討論數(shù)據(jù)科學(xué)是什么,以及數(shù)據(jù)科學(xué)涉及哪些其他學(xué)科;二是數(shù)據(jù)科學(xué)的技術(shù)應(yīng)用層面,包括教程和案例研究;三是給正在從業(yè)和有抱負(fù)的數(shù)據(jù)科學(xué)家介紹一些職業(yè)資源?!稊?shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》中有很多職業(yè)和培訓(xùn)相關(guān)資源(如數(shù)據(jù)集、網(wǎng)絡(luò)爬蟲(chóng)源代碼、數(shù)據(jù)視頻和如何編寫(xiě)API),所以借助《數(shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》,你現(xiàn)在就可以開(kāi)始數(shù)據(jù)科學(xué)實(shí)踐,并快速地提升你的職業(yè)水平?!稊?shù)據(jù)天才:數(shù)據(jù)科學(xué)家修煉之道》是寫(xiě)給數(shù)據(jù)科學(xué)家和相關(guān)專業(yè)人士的(如業(yè)務(wù)分析師、計(jì)算機(jī)科學(xué)家、軟件工程師、數(shù)據(jù)工程師和統(tǒng)計(jì)學(xué)家),也適合有興趣轉(zhuǎn)投大數(shù)據(jù)科學(xué)事業(yè)的人閱讀。

作者簡(jiǎn)介

  Vincent Granville博士,是一名富有遠(yuǎn)見(jiàn)的數(shù)據(jù)科學(xué)家,有 15 年大數(shù)據(jù)、預(yù)測(cè)建模、數(shù)字分析和業(yè)務(wù)分析的經(jīng)驗(yàn)。Vincent 在評(píng)分技術(shù)、欺詐檢測(cè)和網(wǎng)絡(luò)流量?jī)?yōu)化及增長(zhǎng)等領(lǐng)域,是舉世公認(rèn)的專家。在過(guò)去的 10 年中,他曾與 Visa 一起研究實(shí)時(shí)信用卡欺詐檢測(cè),與CNET一起研究廣告組合優(yōu)化,與Microsoft(微軟公司)一起研究“改變點(diǎn)檢測(cè)”,與Wells Fargo(富國(guó)銀行)一起研究在線用戶體驗(yàn),與InfoSpace一起研究搜索智能,與eBay一起研究自動(dòng)競(jìng)價(jià),與各大搜索引擎、廣告網(wǎng)絡(luò)和大型廣告客戶一起研究點(diǎn)擊欺詐檢測(cè)。Vincent 也管理著LinkedIn上龐大的“大數(shù)據(jù)及分析數(shù)據(jù)科學(xué)家”小組,該小組擁有超過(guò)100 000名成員。近期,Vincent推出了數(shù)據(jù)科學(xué)中心(Data Science Center)這個(gè)大數(shù)據(jù)、業(yè)務(wù)分析和數(shù)據(jù)科學(xué)界的領(lǐng)先社區(qū)。Vincent曾是劍橋大學(xué)和美國(guó)國(guó)家統(tǒng)計(jì)科學(xué)學(xué)院的博士后。他曾入圍沃頓商業(yè)計(jì)劃競(jìng)賽和比利時(shí)數(shù)學(xué)奧林匹克的決賽。Vincent 已經(jīng)在統(tǒng)計(jì)期刊上發(fā)表了40篇論文,并且是許多國(guó)際會(huì)議的受邀演講嘉賓。他還開(kāi)發(fā)了一種新的數(shù)據(jù)挖掘技術(shù),被稱為隱性決策樹(shù),他還擁有多項(xiàng)專利,是發(fā)表數(shù)據(jù)科學(xué)書(shū)籍的第1人,并籌集了600萬(wàn)美元的創(chuàng)業(yè)啟動(dòng)資金。根據(jù)福布斯的排名,Vincent 是大數(shù)據(jù)領(lǐng)域前20位有影響力的人物之一,被VentureBeat、MarketWatch和美國(guó)有線新聞網(wǎng)(CNN)專門(mén)報(bào)道。吳博,利茲大學(xué)博士后,具備多年機(jī)器學(xué)習(xí)研發(fā)、數(shù)據(jù)科學(xué)從業(yè)經(jīng)驗(yàn)。曾任愛(ài)立信大數(shù)據(jù)高級(jí)研究員,多家公司數(shù)據(jù)科學(xué)家及數(shù)據(jù)變現(xiàn)業(yè)務(wù)負(fù)責(zé)人。現(xiàn)任深圳市宜遠(yuǎn)智能科技有限公司創(chuàng)始人。張曉峰,哈爾濱工業(yè)大學(xué)深圳研究生院計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副教授、博士生導(dǎo)師,主要研究方向?yàn)閿?shù)據(jù)挖掘、隱私保護(hù)和機(jī)器學(xué)習(xí)等。曾在北大方正研究院、香港大學(xué)電子技術(shù)研究所工作。主持包括國(guó)家自然科學(xué)基金面上項(xiàng)目,以及其他省/市縱向、橫向課題十余項(xiàng)。已在國(guó)內(nèi)外重要學(xué)術(shù)刊物與會(huì)議上發(fā)表SCI/EI索引論文40余篇。季春霖,深圳光啟高等理工研究院聯(lián)合創(chuàng)始人,副院長(zhǎng);深圳市統(tǒng)計(jì)學(xué)會(huì)副會(huì)長(zhǎng);哈佛大學(xué)博士后,杜克大學(xué)統(tǒng)計(jì)學(xué)博士,劍橋大學(xué)碩士;廣東省自然科學(xué)基金杰青項(xiàng)目獲得者;發(fā)表包括Science在內(nèi)的論文60余篇,授權(quán)專利400余項(xiàng)。熱衷于貝葉斯統(tǒng)計(jì)學(xué)及其應(yīng)用。

圖書(shū)目錄

第1章 數(shù)據(jù)科學(xué)是什么 1
-真?zhèn)螖?shù)據(jù)科學(xué)對(duì)比 2
- - 偽數(shù)據(jù)科學(xué)的兩個(gè)例子 5
- - 新大學(xué)的面貌 7
-數(shù)據(jù)科學(xué)家 10
- - 數(shù)據(jù)科學(xué)家與數(shù)據(jù)工程師 10
- - 數(shù)據(jù)科學(xué)家與統(tǒng)計(jì)學(xué)家 12
- - 數(shù)據(jù)科學(xué)家與業(yè)務(wù)分析師 13
-13個(gè)真實(shí)世界情景中的數(shù)據(jù)科學(xué)應(yīng)用 14
- - 情景1:國(guó)家對(duì)烈性酒銷(xiāo)售的壟斷結(jié)束后,DUI(酒后駕駛)逮捕量減少 15
- - 情景2:數(shù)據(jù)科學(xué)與直覺(jué) 17
- - 情景3:數(shù)據(jù)故障將數(shù)據(jù)變成亂碼 19
- - 情景4:異??臻g的回歸 21
- - 情景5:分析與誘導(dǎo)在提升銷(xiāo)量上有何不同價(jià)值 22
- - 情景6:關(guān)于隱藏?cái)?shù)據(jù) 24
- - 情景7:汽油中的鉛會(huì)導(dǎo)致高犯罪率。真的嗎 25
- - 情景8:波音787(夢(mèng)幻客機(jī))問(wèn)題 26
- - 情景9:NLP的7個(gè)棘手句子 27
- - 情景10:數(shù)據(jù)科學(xué)家決定著我們所吃的食品 28
- - 情景11:用較好的相關(guān)性增加亞馬遜的銷(xiāo)售量 30
- - 情景12:檢測(cè)Facebook上的假檔案或假“喜歡”數(shù) 32
- - 情景13:餐廳的分析 33
-數(shù)據(jù)科學(xué)的歷史、開(kāi)拓者和現(xiàn)代趨勢(shì) 33
- - 統(tǒng)計(jì)學(xué)將會(huì)復(fù)興 34
- - 歷史與開(kāi)拓者 36
- - 現(xiàn)代的趨勢(shì) 38
- - 最近的問(wèn)答討論 40
-總結(jié) 44
第2章 大數(shù)據(jù)的獨(dú)特性 45
-兩個(gè)大數(shù)據(jù)的問(wèn)題 45
- - 大數(shù)據(jù)“詛咒” 45
- - 數(shù)據(jù)快速流動(dòng)問(wèn)題 50
-大數(shù)據(jù)技術(shù)示例 56
- - 大數(shù)據(jù)問(wèn)題是數(shù)據(jù)科學(xué)所面臨挑戰(zhàn)的縮影 56
- - 大規(guī)模數(shù)據(jù)集的聚類(lèi)和分類(lèi) 58
- - 1億行的Excel 63
-MapReduce不能做什么 67
- - 問(wèn)題 67
- - 3種解決方案 68
- - 結(jié)論:何時(shí)使用MapReduce 69
-溝通問(wèn)題 70
-數(shù)據(jù)科學(xué):統(tǒng)計(jì)學(xué)的終結(jié) 72
- - 8種最差的預(yù)測(cè)建模技術(shù) 72
- - 把計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)和行業(yè)專業(yè)知識(shí)結(jié)合在一起 74
-大數(shù)據(jù)生態(tài)系統(tǒng) 78
-總結(jié) 79
第3章 成為一名數(shù)據(jù)科學(xué)家 80
-數(shù)據(jù)科學(xué)家的主要特征 80
- - 數(shù)據(jù)科學(xué)家的職能 80
- - 橫向與縱向數(shù)據(jù)科學(xué)家 83
-數(shù)據(jù)科學(xué)家的類(lèi)型 86
- - 偽數(shù)據(jù)科學(xué)家 86
- - 自學(xué)成才的數(shù)據(jù)科學(xué)家 86
- - 業(yè)余數(shù)據(jù)科學(xué)家 87
- - 極限數(shù)據(jù)科學(xué)家 89
-數(shù)據(jù)科學(xué)家人群特征 90
-數(shù)據(jù)科學(xué)方面的培訓(xùn) 91
- - 大學(xué)課程 91
- - 公司和協(xié)會(huì)培訓(xùn)項(xiàng)目 95
- - 免費(fèi)培訓(xùn)項(xiàng)目 96
-數(shù)據(jù)科學(xué)家職業(yè)道路 98
- - 獨(dú)立顧問(wèn) 98
- - 創(chuàng)業(yè)者 105
-總結(jié) 118
第4章 數(shù)據(jù)科學(xué)的技術(shù)(I) 119
-新型指標(biāo) 120
- - 優(yōu)化數(shù)字營(yíng)銷(xiāo)活動(dòng)的指標(biāo) 121
- - 欺詐檢測(cè)的指標(biāo) 122
-選擇合適的分析工具 124
- - 分析軟件 124
- - 可視化工具 125
- - 實(shí)時(shí)產(chǎn)品 126
- - 編程語(yǔ)言 128
-可視化 128
- - 用R生成數(shù)據(jù)視頻 129
- - 更復(fù)雜的視頻 133
-無(wú)模型的統(tǒng)計(jì)建模 134
- - 無(wú)模型的統(tǒng)計(jì)建模是什么 135
- - 該算法是如何工作的 135
- - 源代碼生成數(shù)據(jù)集 137
-三類(lèi)指標(biāo):中心性、波動(dòng)性、顛簸性 137
- - 中心性、波動(dòng)性和顛簸性之間的關(guān)系 138
- - 定義顛簸性 138
- - 在Excel中計(jì)算顛簸性 139
- - 使用顛簸系數(shù) 141
-大數(shù)據(jù)的統(tǒng)計(jì)聚類(lèi) 141
-大數(shù)據(jù)的相關(guān)性和擬合度 143
- - 一系列新的秩相關(guān)性 146
- - 漸近分布與歸一化 148
- - -計(jì)算復(fù)雜度 152
- - 計(jì)算q(n) 152
- - 理論上的解決方案 155
-結(jié)構(gòu)系數(shù) 156
-確定簇的數(shù)量 157
- - 方法 157
- - 例子 158
-網(wǎng)絡(luò)拓?fù)溆成? 159
-安全通信:數(shù)據(jù)加密 163
-總結(jié) 166
第5章 數(shù)據(jù)科學(xué)的技術(shù)(II) 167
-數(shù)據(jù)字典 168
- - 什么是數(shù)據(jù)字典 168
- - 建立數(shù)據(jù)字典 169
-隱性決策樹(shù) 169
- - 實(shí)現(xiàn)方法 171
- - 示例:互聯(lián)網(wǎng)流量打分 173
- - 結(jié)論 175
-與模型無(wú)關(guān)的置信區(qū)間 175
- - 方法 175
- - 分析橋第一定理 176
- - 應(yīng)用 177
- - 源代碼 178
-隨機(jī)數(shù) 179
-解決問(wèn)題的4個(gè)辦法 181
- - 擁有超強(qiáng)直覺(jué)能力的業(yè)務(wù)分析師的直觀法 182
- - 軟件工程師的蒙特卡洛模擬法 182
- - 統(tǒng)計(jì)學(xué)家的統(tǒng)計(jì)建模方法 183
- - 計(jì)算機(jī)科學(xué)家的大數(shù)據(jù)方法 183
-因果關(guān)系和相關(guān)性 183
-怎樣檢測(cè)因果關(guān)系 184
-數(shù)據(jù)科學(xué)項(xiàng)目的生命周期 186
-預(yù)測(cè)模型的錯(cuò)誤 189
-邏輯相關(guān)回歸 191
- - 變量之間的相互作用 191
- - 一階近似 191
- - 二階近似 193
- - 用Excel進(jìn)行回歸分析 195
-實(shí)驗(yàn)設(shè)計(jì) 196
- - 有趣的指標(biāo) 196
- - 把患者分成不同的人群進(jìn)行治療 196
- - 私人定制的治療 197
-分析即服務(wù)和應(yīng)用程序接口 198
- - 工作原理 199
- - 實(shí)施案例 199
- - 關(guān)鍵詞相關(guān)的API的源代碼 200
-其他主題 204
- - 當(dāng)數(shù)據(jù)庫(kù)改變時(shí),保存好數(shù)值 204
- - 優(yōu)化網(wǎng)絡(luò)爬蟲(chóng) 205
- - 哈希連接 206
- - 用于模擬簇的簡(jiǎn)單源代碼 207
-Hadoop和大數(shù)據(jù)的新型合成方差 208
- - Hadoop和MapReduce的介紹 208
- - 綜合指標(biāo) 209
- - Hadoop、數(shù)值的和統(tǒng)計(jì)的穩(wěn)定性 210
- - 方差的抽象概念 211
- - 一個(gè)新的大數(shù)據(jù)定理 213
- - 平移不變性的度量標(biāo)準(zhǔn) 214
- - 實(shí)現(xiàn):通信和計(jì)算成本 214
- - 最終意見(jiàn) 215
-總結(jié) 215
第6章 數(shù)據(jù)科學(xué)應(yīng)用案例研究 217
-股票市場(chǎng) 217
- - 使回報(bào)率提高500%的模式 217
- - 優(yōu)化統(tǒng)計(jì)交易策略 220
- - 股票交易的API:統(tǒng)計(jì)模型 222
- - 股票交易的API:具體實(shí)現(xiàn) 225
- - 股票市場(chǎng)模擬 226
- - 些許數(shù)學(xué)知識(shí) 229
- - 新趨勢(shì) 231
-加密 232
- - 數(shù)據(jù)科學(xué)應(yīng)用:隱寫(xiě)術(shù) 232
- - 好的電子郵件加密 236
- - 驗(yàn)證碼破解 239
-欺詐檢測(cè) 240
- - 點(diǎn)擊欺詐 241
- - 連續(xù)點(diǎn)擊評(píng)分與二進(jìn)制欺詐/非欺詐 242
- - 數(shù)學(xué)模型與基準(zhǔn) 244
- - 虛假轉(zhuǎn)化產(chǎn)生的偏差 245
- - 一些誤解 246
- - 統(tǒng)計(jì)面臨的挑戰(zhàn) 246
- - 點(diǎn)擊評(píng)分優(yōu)化關(guān)鍵詞出價(jià) 247
- - 組合優(yōu)化自動(dòng)快速的特征選擇 249
- - 特征的預(yù)測(cè)能力:交叉驗(yàn)證 250
- - 勾連檢測(cè)和僵尸網(wǎng)絡(luò)的關(guān)聯(lián)規(guī)則檢測(cè) 254
- - 模式檢測(cè)的極值理論 255
-數(shù)字分析 256
- - 在線廣告:到達(dá)率和頻率的計(jì)算公式 256
- - 電子郵件營(yíng)銷(xiāo):提高300%的性能 257
- - 在7天內(nèi)優(yōu)化關(guān)鍵詞廣告宣傳活動(dòng) 258
- - 自動(dòng)新聞提要優(yōu)化 260
- - 用bit-ly進(jìn)行競(jìng)爭(zhēng)情報(bào)分析 261
- - 測(cè)量 Twitter 哈希標(biāo)簽(hashtag)的收益 263
- - 用3個(gè)修補(bǔ)方法提升谷歌搜索 267
- - 改進(jìn)相關(guān)性的算法 270
- - 廣告循環(huán)問(wèn)題 272
-雜項(xiàng) 273
- - 簡(jiǎn)單模型會(huì)獲得更好的銷(xiāo)售預(yù)測(cè) 273
- - 更好的醫(yī)療欺詐檢測(cè) 275
- - 歸因模型 276
- - 預(yù)測(cè)隕石撞擊 277
- - 在路口停車(chē)場(chǎng)收集數(shù)據(jù) 281
- - 數(shù)據(jù)科學(xué)的其他應(yīng)用 282
-總結(jié) 282
第7章 踏上你的數(shù)據(jù)科學(xué)職業(yè)之路 283
-面試問(wèn)題 283
- - 關(guān)于工作經(jīng)驗(yàn)的問(wèn)題 283
- - 技術(shù)問(wèn)題 285
- - 一般性問(wèn)題 286
- - 關(guān)于數(shù)據(jù)科學(xué)項(xiàng)目的問(wèn)題 288
-測(cè)試你自己的視覺(jué)和分析思維 291
- - 通過(guò)肉眼的檢測(cè)模式 292
- - 識(shí)別偏差 294
- - 誤導(dǎo)性的時(shí)間序列和隨機(jī)游走 295
-從統(tǒng)計(jì)學(xué)家到數(shù)據(jù)科學(xué)家 296
- - 數(shù)據(jù)科學(xué)家也是統(tǒng)計(jì)從業(yè)人員 297
- - 誰(shuí)應(yīng)該給數(shù)據(jù)科學(xué)家教統(tǒng)計(jì)學(xué) 298
- - 雇傭問(wèn)題 298
- - 數(shù)據(jù)科學(xué)家與數(shù)據(jù)架構(gòu)師密切合作 299
- - 誰(shuí)應(yīng)該參與戰(zhàn)略思考 299
- - 兩種類(lèi)型的統(tǒng)計(jì)學(xué)家 300
- - 大數(shù)據(jù)與取樣 301
-數(shù)據(jù)科學(xué)家的分類(lèi) 302
- - 數(shù)據(jù)科學(xué)最流行的技能集合 302
- - LinkedIn上的頂級(jí)數(shù)據(jù)科學(xué)家 306
-400個(gè)數(shù)據(jù)科學(xué)家職位頭銜 309
-薪酬調(diào)查 311
- - 根據(jù)技能和位置的薪酬分類(lèi) 312
- - 創(chuàng)建自己的薪酬調(diào)查表 316
-總結(jié) 317
第8章 數(shù)據(jù)科學(xué)資源 318
-專業(yè)資源 318
- - 數(shù)據(jù)集 318
- - 書(shū)籍 319
- - 會(huì)議與組織 322
- - 網(wǎng)站 324
- - 概念定義 324
-職業(yè)建設(shè)資源 327
- - 招聘數(shù)據(jù)科學(xué)家的公司 328
- - 數(shù)據(jù)科學(xué)招聘廣告的樣本 329
- - 簡(jiǎn)歷樣本 329
-總結(jié) 331

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)