注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)工業(yè)技術(shù)建筑科學(xué)建筑設(shè)計(jì)Python數(shù)據(jù)科學(xué)導(dǎo)論:概念、技術(shù)與應(yīng)用

Python數(shù)據(jù)科學(xué)導(dǎo)論:概念、技術(shù)與應(yīng)用

Python數(shù)據(jù)科學(xué)導(dǎo)論:概念、技術(shù)與應(yīng)用

定 價(jià):¥59.00

作 者: (西)勞拉·伊瓜爾,桑蒂·塞吉
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787111604648 出版時(shí)間: 2018-09-01 包裝:
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《Python數(shù)據(jù)科學(xué)導(dǎo)論》通過(guò)理論與實(shí)踐相結(jié)合的方式來(lái)闡述數(shù)據(jù)科學(xué)的一系列重要概念及算法,以使讀者學(xué)會(huì)如何管理并利用數(shù)據(jù)。本書(shū)共有11章,第1章概要地介紹了數(shù)據(jù)科學(xué)的現(xiàn)狀并給出了一些使用本書(shū)的建議;第2章介紹了Python語(yǔ)言數(shù)據(jù)科學(xué)生態(tài)系統(tǒng),涉及NumPy、SciPy和Pandas等熱門(mén)第三方庫(kù);第3~7章著重講解了統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的知識(shí),涉及描述統(tǒng)計(jì)學(xué)、統(tǒng)計(jì)推斷、監(jiān)督學(xué)習(xí)、回歸分析、無(wú)監(jiān)督學(xué)習(xí)等主題;第8~10章詳細(xì)介紹了數(shù)據(jù)科學(xué)的一些主要應(yīng)用,如網(wǎng)絡(luò)分析、推薦系統(tǒng)和情感分析;第11章介紹了并行計(jì)算及性能優(yōu)化方法。

作者簡(jiǎn)介

  Laura Igual博士是巴塞羅那大學(xué)數(shù)學(xué)和計(jì)算機(jī)科學(xué)系的副教授。她于2000 年獲得西班牙瓦倫西亞大學(xué)的數(shù)學(xué)學(xué)位,并于2006 年獲得西班牙龐培法布拉大學(xué)的博士學(xué)位。她的研究領(lǐng)域包括計(jì)算機(jī)視覺(jué)、醫(yī)學(xué)成像、機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)。Santi Seguí博士是巴塞羅那大學(xué)數(shù)學(xué)和計(jì)算機(jī)科學(xué)系的助理教授。自2007 年起,他擔(dān)任了西班牙巴塞羅那自治大學(xué)的計(jì)算機(jī)科學(xué)工程師。他于2011 年獲得西班牙巴塞羅那大學(xué)的博士學(xué)位。他的研究領(lǐng)域包括計(jì)算機(jī)視覺(jué)、應(yīng)用機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)。

圖書(shū)目錄

譯者序

原書(shū)前言

作者和貢獻(xiàn)者簡(jiǎn)介

第1章 數(shù)據(jù)科學(xué)概述 // 1 

1.1 什么是數(shù)據(jù)科學(xué) //1 

1.2 關(guān)于本書(shū) //2

第2章 數(shù)據(jù)專(zhuān)家的工具箱 //4 

2.1 引言 // 4 

2.2 為什么選擇Python // 4 

2.3 數(shù)據(jù)專(zhuān)家的基本Python庫(kù) // 5 

2.3.1 數(shù)值和科學(xué)計(jì)算:NumPy和SciPy // 5 

2.3.2 Scikit-learn:Python中的機(jī)器學(xué)習(xí)庫(kù) // 5 

2.3.3 Pandas:Python數(shù)據(jù)分析庫(kù) // 5 

2.4 數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)的安裝 // 6 

2.5 集成開(kāi)發(fā)環(huán)境 // 6 

2.5.1 網(wǎng)絡(luò)集成開(kāi)發(fā)環(huán)境:Jupyter // 7 

2.6 數(shù)據(jù)專(zhuān)家從Python開(kāi)始 // 7 

2.6.1 讀取 // 11 

2.6.2 選擇數(shù)據(jù) // 13 

2.6.3 篩選數(shù)據(jù) // 14 

2.6.4 篩選缺失的數(shù)據(jù) // 15 

2.6.5 處理數(shù)據(jù) // 15 

2.6.6 排序 // 19 

2.6.7 分組數(shù)據(jù) // 20 

2.6.8 重排數(shù)據(jù) // 21 

2.6.9 對(duì)數(shù)據(jù)進(jìn)行排名 // 22 

2.6.10 繪圖 // 23 

2.7 小結(jié) // 24

第3章 描述統(tǒng)計(jì)學(xué) // 25 

3.1 引言 // 25 

3.2 數(shù)據(jù)準(zhǔn)備 // 25 

3.2.1 Adult數(shù)據(jù)集示例 // 26 

3.3 探索性數(shù)據(jù)分析 // 28 

3.3.1 匯總數(shù)據(jù) // 28 

3.3.2 數(shù)據(jù)分布 // 31 

3.3.3 離群點(diǎn)的處理 // 33 

3.3.4 測(cè)量不對(duì)稱(chēng)性:偏度和皮爾遜中值偏度系數(shù) // 36 

3.3.5 連續(xù)分布 // 38 

3.3.6 核密度 // 39 

3.4 估計(jì) // 41 

3.4.1 樣本和估計(jì)均值、方差和標(biāo)準(zhǔn)記分 // 41 

3.4.2 協(xié)方差、皮爾遜相關(guān)和斯皮爾曼秩相關(guān) // 42 

3.5 小結(jié) // 44

參考文獻(xiàn) // 45 

第4章 統(tǒng)計(jì)推斷 // 46 

4.1 引言 // 46 

4.2 統(tǒng)計(jì)推斷:頻率論方法 // 46 

4.3 測(cè)量估計(jì)的差異性 // 47 

4.3.1 點(diǎn)估計(jì) // 47 

4.3.2 置信區(qū)間 // 50 

4.4 假設(shè)檢驗(yàn) // 53 

4.4.1 用置信區(qū)間檢驗(yàn)假設(shè) // 53 

4.4.2 使用p值檢驗(yàn)假設(shè) // 55 

4.5 效應(yīng)E是真實(shí)的嗎 // 57 

4.6 小結(jié) // 57

參考文獻(xiàn) // 58

第5章 監(jiān)督學(xué)習(xí) // 59 

5.1 引言 // 59 

5.2 問(wèn)題 // 60 

5.3 第一步 // 60 

5.4 什么是學(xué)習(xí)? // 69 

5.5 學(xué)習(xí)曲線 // 70 

5.6 訓(xùn)練、驗(yàn)證和測(cè)試 // 73 

5.7 兩種學(xué)習(xí)模型 // 76 

5.7.1 學(xué)習(xí)三要素 // 76 

5.7.2 支持向量機(jī) // 77 

5.7.3 隨機(jī)森林 // 79 

5.8 結(jié)束學(xué)習(xí)過(guò)程 // 80 

5.9 商業(yè)案例 // 81 

5.10 小結(jié) // 83

參考文獻(xiàn) // 83

第6章 回歸分析 // 84 

6.1 引言 // 84 

6.2 線性回歸 // 84 

6.2.1 簡(jiǎn)單線性回歸 // 85 

6.2.2 多元線性回歸和多項(xiàng)式回歸 // 90 

6.2.3 稀疏模型 // 90 

6.3 邏輯斯蒂回歸 // 97 

6.4 小結(jié) // 99

參考文獻(xiàn) // 99

第7章 無(wú)監(jiān)督學(xué)習(xí) // 100 

7.1 引言 // 100 

7.2 聚類(lèi) // 100 

7.2.1 相似度和距離 // 101 

7.2.2 什么是一個(gè)好的聚類(lèi)?定義衡量聚類(lèi)質(zhì)量的度量 // 101 

7.2.3 聚類(lèi)技術(shù)的分類(lèi)標(biāo)準(zhǔn) // 104 

7.3 案例學(xué)習(xí) // 113 

7.4 小結(jié) // 118

參考文獻(xiàn) // 119

第8章 網(wǎng)絡(luò)分析 // 120 

8.1 引言 // 120 

8.2 圖的基本定義 // 121 

8.3 社交網(wǎng)絡(luò)分析 // 122 

8.3.1 NetworkX基礎(chǔ) // 122 

8.3.2 實(shí)際案例:Facebook數(shù)據(jù)集 // 123 

8.4 中心性 // 125 

8.4.1 在圖中繪制中心性 // 130 

8.4.2 PageRank // 132 

8.5 自我網(wǎng)絡(luò) // 134 

8.6 社區(qū)發(fā)現(xiàn) // 138 

8.7 小結(jié) // 139

參考文獻(xiàn) // 139 

第9章 推薦系統(tǒng) // 140 

9.1 引言 // 140 

9.2 推薦系統(tǒng)如何工作? // 140 

9.2.1 基于內(nèi)容的過(guò)濾 // 141 

9.2.2 協(xié)作過(guò)濾 // 141 

9.2.3 混合推薦系統(tǒng) // 141 

9.3 建模用戶(hù)偏好 // 142 

9.4 評(píng)估推薦系統(tǒng) // 142 

9.5 實(shí)際案例 // 143 

9.5.1 MovieLens數(shù)據(jù)集 // 143 

9.5.2 基于用戶(hù)的協(xié)作過(guò)濾 // 145 

9.6 小結(jié) // 153

參考文獻(xiàn) // 153

第10章 用于情感分析的統(tǒng)計(jì)自然語(yǔ)言處理 // 154 

10.1 引言 // 154 

10.2 數(shù)據(jù)清洗 // 155 

10.3 文本表示 // 158 

10.3.1 二元組和n元組 // 163 

10.4 實(shí)際案例 // 163 

10.5 小結(jié) // 168

參考文獻(xiàn) // 168

第11章 并行計(jì)算 // 169 

11.1 引言 // 169 

11.2 架構(gòu) // 170 

11.2.1 入門(mén)指南 // 171 

11.2.2 連接到集群(引擎)// 171 

11.3 多核編程 // 172 

11.3.1 引擎的直接視圖 // 172 

11.3.2 引擎的負(fù)載均衡視圖 // 175 

11.4 分布式計(jì)算 // 176 

11.5 實(shí)際應(yīng)用:紐約出租車(chē)旅行 // 177 

11.5.1 直接視圖非阻塞方案 // 178 

11.5.2 實(shí)驗(yàn)結(jié)果 // 180 

11.6 小結(jié) // 182

參考文獻(xiàn) // 182


本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)