注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫Python數(shù)據(jù)分析

Python數(shù)據(jù)分析

Python數(shù)據(jù)分析

定 價(jià):¥79.00

作 者: 江雪松,鄒靜 著
出版社: 清華大學(xué)出版社
叢編項(xiàng): 人工智能科學(xué)與技術(shù)叢書
標(biāo) 簽: 暫缺

ISBN: 9787302555179 出版時(shí)間: 2020-07-01 包裝: 平裝
開本: 16開 頁數(shù): 320 字?jǐn)?shù):  

內(nèi)容簡介

  這是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,如何解讀數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)變?yōu)橹R(shí)、利用知識(shí)做出決策將是所有企業(yè)必不可少的能力。在數(shù)據(jù)分析過程中我們清洗數(shù)據(jù),探索數(shù)據(jù),利用數(shù)據(jù)進(jìn)行決策。本書將以當(dāng)前z流行數(shù)據(jù)科學(xué)分析工具Python為基礎(chǔ)介紹如何構(gòu)建基于Python的數(shù)據(jù)科學(xué)環(huán)境,利用Pandas處理與分析數(shù)據(jù),如何利用Matplotlib以及Seaborn進(jìn)行數(shù)據(jù)可視化。同時(shí)本書還將以商業(yè)應(yīng)用為目標(biāo),通過學(xué)習(xí)還將掌握何利用學(xué)習(xí)到的Python數(shù)據(jù)分析知識(shí)來完成客戶留存分析,同期群分析,時(shí)間序列分析,產(chǎn)品銷售數(shù)據(jù)的關(guān)聯(lián)分析,客戶聚類,統(tǒng)計(jì)檢驗(yàn)等數(shù)據(jù)分析。

作者簡介

  江雪松2001年獲工學(xué)碩士學(xué)位,曾服務(wù)于華為、諾基亞等公司,有豐富的產(chǎn)品團(tuán)隊(duì)與研發(fā)團(tuán)隊(duì)管理經(jīng)驗(yàn)。先后擔(dān)任項(xiàng)目經(jīng)理、研發(fā)經(jīng)理、產(chǎn)品研發(fā)負(fù)責(zé)人,管理多個(gè)產(chǎn)品全球支持與交付團(tuán)隊(duì),軟件維護(hù)業(yè)務(wù)。 鄒靜2006年獲理學(xué)碩士學(xué)位,現(xiàn)服務(wù)于四川省人民醫(yī)院,擔(dān)任副主任藥師。擁有十多年的臨床藥物試驗(yàn)設(shè)計(jì)、數(shù)據(jù)統(tǒng)計(jì)與分析經(jīng)驗(yàn)。先后參加了多個(gè)國家自然科學(xué)基金項(xiàng)目及四川省衛(wèi)生廳科研項(xiàng)目。

圖書目錄


目錄




上篇Pandas數(shù)據(jù)分析基礎(chǔ)

第1章數(shù)據(jù)分析初探

1.1“數(shù)據(jù)+”時(shí)代的到來

1.2什么是數(shù)據(jù)分析

1.2.1數(shù)據(jù)分析的目標(biāo)

1.2.2數(shù)據(jù)分析分類

1.2.3典型的數(shù)據(jù)分析方法

1.3數(shù)據(jù)分析的基本流程

1.3.1問題定義

1.3.2收集數(shù)據(jù)

1.3.3數(shù)據(jù)處理

1.3.4數(shù)據(jù)分析

1.3.5結(jié)果解讀與應(yīng)用

1.4硝煙中的數(shù)據(jù)分析

1.4.1數(shù)據(jù)分析的產(chǎn)生

1.4.2驗(yàn)證問題

1.4.3尋找原因

1.4.4數(shù)據(jù)怎么說

1.4.5數(shù)據(jù)分析中應(yīng)該避免的典型問題

第2章搭建數(shù)據(jù)科學(xué)開發(fā)環(huán)境

2.1為什么選擇Python

2.1.1人生苦短,我用Python

2.1.2為何Python是數(shù)據(jù)科學(xué)家的最佳選擇

2.2Python數(shù)據(jù)科學(xué)開發(fā)棧

2.2.1Cython

2.2.2NumPy

2.2.3IPython

2.2.4Jupyter

2.2.5SciPy

2.2.6Matplotlib

2.2.7Pandas

2.2.8Scikitlearn


2.2.9NetworkX


2.2.10PyMC3

2.2.11數(shù)據(jù)科學(xué)領(lǐng)域中最新的一些Python包

2.3Anaconda的安裝與使用

2.3.1安裝Anaconda

2.3.2利用Conda管理Python環(huán)境

2.3.3利用Conda管理Python包

2.3.4安裝本書所需的包

2.4使用Jupyter Notebook進(jìn)行可重復(fù)數(shù)據(jù)分析

2.4.1Jupyter Notebook的配置

2.4.2Jupyter Notebook中的單元格

2.4.3Jupyter Notebook中的命令模式與編輯模式鍵

2.4.4使用Jupyter Notebook進(jìn)行數(shù)據(jù)分析





第3章Pandas基礎(chǔ)

3.1什么是DataFrame

3.1.1DataFrame的基本要素

3.1.2數(shù)據(jù)類型

3.1.3了解Series

3.1.4鏈?zhǔn)椒椒?br />
3.2索引與列

3.2.1修改索引與列

3.2.2添加、修改或刪除列

3.3選擇多列

第4章數(shù)據(jù)篩選

4.1使用.loc和.iloc篩選行與列數(shù)據(jù)

4.1.1選擇Series和DataFrame中的行

4.1.2同時(shí)選擇行與列

4.2布爾選擇

4.2.1計(jì)算布爾值

4.2.2多條件篩選數(shù)據(jù)

第5章開始利用Pandas進(jìn)行數(shù)據(jù)分析

5.1了解元數(shù)據(jù)

5.2數(shù)據(jù)類型轉(zhuǎn)換

5.3缺失數(shù)據(jù)與異常數(shù)據(jù)處理

5.3.1缺失值與重復(fù)值

5.3.2處理缺失數(shù)據(jù)

5.3.3NumPy與Pandas對(duì)缺失數(shù)據(jù)的不同處理方式

5.3.4填充缺失值

5.4處理重復(fù)數(shù)據(jù)

5.5異常值

5.6描述性統(tǒng)計(jì)


第6章數(shù)據(jù)整理

6.1什么是數(shù)據(jù)整理

6.1.1數(shù)據(jù)的語義

6.1.2整齊的數(shù)據(jù)


6.2數(shù)據(jù)整理實(shí)戰(zhàn)

6.2.1列標(biāo)題是值,而非變量名

6.2.2多個(gè)變量存儲(chǔ)在一列中

6.2.3變量既在列中存儲(chǔ),又在行中存儲(chǔ)

6.2.4多個(gè)觀測單元存儲(chǔ)在同一表中

6.2.5一個(gè)觀測單元存儲(chǔ)在多個(gè)表中

6.2.6思考

第7章分組統(tǒng)計(jì)

7.1分組、應(yīng)用和聚合

7.2Pandas中的GroupBy操作

7.2.1單列數(shù)據(jù)分組統(tǒng)計(jì)

7.2.2多列數(shù)據(jù)分組統(tǒng)計(jì)

7.2.3使用自定義函數(shù)進(jìn)行分組統(tǒng)計(jì)

7.2.4數(shù)據(jù)過濾與變換

第8章數(shù)據(jù)整合

8.1數(shù)據(jù)讀入

8.1.1基本數(shù)據(jù)讀入方法

8.1.2文件讀取進(jìn)階

8.1.3讀取其他格式文件

8.2數(shù)據(jù)合并

8.2.1認(rèn)識(shí)merge操作

8.2.2merge進(jìn)階

8.2.3join與concat

第9章數(shù)據(jù)可視化

9.1Matplotlib

9.1.1繪制第一個(gè)散點(diǎn)圖

9.1.2理解figure與axes

9.1.3Matplotlib中面向?qū)ο笈c類Matlab語法的區(qū)別

9.1.4修改坐標(biāo)軸屬性

9.1.5修改圖形屬性

9.1.6定制圖例,添加標(biāo)注

9.1.7子圖

9.1.8利用Matplotlib繪制各種圖形

9.2Pandas繪圖

9.2.1Pandas基礎(chǔ)繪圖

9.2.2整合Pandas繪圖與Matplotlib繪圖

9.3Seaborn

9.3.1Seaborn中的樣式

9.3.2Seaborn繪制統(tǒng)計(jì)圖形

9.4可視化進(jìn)階

9.4.1其他可視化工具

9.4.2推薦讀物

第10章探索性數(shù)據(jù)分析——某電商銷售數(shù)據(jù)分析

10.1數(shù)據(jù)清洗

10.1.1分析準(zhǔn)備

10.1.2了解數(shù)據(jù)

10.2數(shù)據(jù)清洗與整理

10.2.1數(shù)據(jù)類型轉(zhuǎn)換與錯(cuò)誤數(shù)據(jù)刪除

10.2.2添加新數(shù)據(jù)

10.3探索性數(shù)據(jù)分析

10.3.1客戶分析

10.3.2訂單趨勢分析

10.3.3客戶國家分析

10.3.4留給讀者的問題

下篇Python數(shù)據(jù)分析實(shí)戰(zhàn)

第11章群組分析

11.1群組分析概述

11.1.1從AARRR到RARRA的轉(zhuǎn)變

11.1.2什么是群組分析

11.2群組分析實(shí)戰(zhàn)

11.2.1定義群組以及周期

11.2.2群組分析具體過程

11.2.3思考

第12章利用RFM分析對(duì)用戶進(jìn)行分類

12.1RFM分析簡介

12.1.1RFM模型概述

12.1.2理解RFM

12.2RFM實(shí)戰(zhàn)

12.2.1R、F、M值的計(jì)算

12.2.2利用RFM模型對(duì)客戶進(jìn)行細(xì)分

12.2.3思考

第13章購物籃分析

13.1購物籃分析概述

13.1.1什么是購物籃分析

13.1.2購物籃分析在超市中的應(yīng)用

13.1.3購物籃分析實(shí)現(xiàn)

13.2購物籃分析案例

13.2.1Mlxtend庫中Apriori算法使用介紹

13.2.2在線銷售數(shù)據(jù)購物籃分析

13.3留給讀者的思考

第14章概率分布

14.1隨機(jī)數(shù)

14.2常見的概率分布


14.2.1均勻分布

14.2.2正態(tài)分布

14.2.3二項(xiàng)分布

14.2.4泊松分布

14.2.5幾何分布與指數(shù)分布

14.3點(diǎn)估計(jì)與置信區(qū)間

14.3.1點(diǎn)估計(jì)

14.3.2抽樣分布與中心極限定理

14.3.3置信區(qū)間

14.4留給讀者的思考

第15章假設(shè)檢驗(yàn)

15.1假設(shè)檢驗(yàn)概述

15.1.1初識(shí)假設(shè)檢驗(yàn)

15.1.2假設(shè)檢驗(yàn)的步驟

15.1.3假設(shè)檢驗(yàn)中的Ⅰ類錯(cuò)誤與Ⅱ類錯(cuò)誤

15.2Python中的假設(shè)檢驗(yàn)

15.2.1單樣本ttest

15.2.2雙樣本ttest

15.2.3配對(duì)ttest

15.2.4卡方檢驗(yàn)

15.3留給讀者的思考

第16章一名數(shù)據(jù)分析師的游戲上線之旅

16.1游戲啟動(dòng)時(shí)間是否超過目標(biāo)

16.1.1啟動(dòng)時(shí)間是否超過3秒

16.1.2構(gòu)造啟動(dòng)時(shí)間監(jiān)測圖

16.2次日留存率是否大于30%

16.3應(yīng)該在游戲第幾關(guān)加入關(guān)聯(lián)微信提示

16.3.1A/B測試

16.3.2貝葉斯解決方案

16.4如何定價(jià)

16.5留給讀者的思考

第17章利用數(shù)據(jù)分析找工作

17.1設(shè)定分析目標(biāo)

17.1.1問題定義

17.1.2獲取數(shù)據(jù)

17.2準(zhǔn)備分析數(shù)據(jù)

17.2.1數(shù)據(jù)準(zhǔn)備

17.2.2數(shù)據(jù)清洗

17.3開始數(shù)據(jù)分析

17.3.1職位來自哪里

17.3.2職位薪酬如何

17.3.3崗位要求

17.3.4思考

第18章用數(shù)據(jù)解讀成都房價(jià)

18.1設(shè)定分析目標(biāo)

18.1.1問題定義

18.1.2獲取數(shù)據(jù)

18.2解讀成都二手房

18.2.1數(shù)據(jù)準(zhǔn)備

18.2.2列名調(diào)整

18.2.3數(shù)據(jù)類型轉(zhuǎn)換

18.2.4數(shù)據(jù)解讀

18.2.5思考

第19章時(shí)間序列分析

19.1認(rèn)識(shí)時(shí)間序列數(shù)據(jù)

19.1.1讀入時(shí)間序列數(shù)據(jù)

19.1.2時(shí)間序列數(shù)據(jù)的可視化

19.2時(shí)間序列數(shù)據(jù)的分解

19.2.1認(rèn)識(shí)時(shí)間序列數(shù)據(jù)中的模式

19.2.2Python中進(jìn)行時(shí)間序列數(shù)據(jù)的分解

19.3時(shí)間序列的平穩(wěn)性

19.3.1認(rèn)識(shí)平穩(wěn)與非平穩(wěn)時(shí)間序列

19.3.2如何讓時(shí)間序列平穩(wěn)

19.4利用ARIMA模型分析家具銷售

19.4.1ARIMA模型簡介

19.4.2數(shù)據(jù)準(zhǔn)備

19.4.3ARIMA模型中的參數(shù)

19.5留給讀者的思考

第20章股票數(shù)據(jù)分析

20.1股票收益分析

20.1.1獲取股票數(shù)據(jù)

20.1.2計(jì)算每日收益

20.1.3多只股票收益比較

20.1.4股價(jià)相關(guān)性分析

20.2CAPM資產(chǎn)定價(jià)模型選股

20.2.1CAPM公式

20.2.2在Python中實(shí)現(xiàn)CAPM

20.3留給讀者的思考

第21章大規(guī)模數(shù)據(jù)處理

21.1不同規(guī)模數(shù)據(jù)處理工具的選擇

21.2利用Pandas處理大規(guī)模數(shù)據(jù)

21.2.1文件分塊讀入

21.2.2使用數(shù)據(jù)庫

21.2.3使用DASK

21.3其他可選方法

21.4留給讀者的思考

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)