注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)(第2版)

Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)(第2版)

Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)(第2版)

定 價(jià):¥129.00

作 者: 宋天龍 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787111627760 出版時(shí)間: 2019-07-01 包裝: 平裝
開本: 16開 頁數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  這是一本將數(shù)據(jù)分析技術(shù)與數(shù)據(jù)使用場(chǎng)景深度結(jié)合的著作,從實(shí)戰(zhàn)角度講解了如何利用Python進(jìn)行數(shù)據(jù)分析和數(shù)據(jù)化運(yùn)營(yíng)。 暢銷書全新、大幅升級(jí),第1版近乎100%的好評(píng),第2版不僅將Python升級(jí)到了新的版本,而且對(duì)具體內(nèi)容進(jìn)行了大幅度的補(bǔ)充和優(yōu)化。作者是有10余年數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)的資深大數(shù)據(jù)專家,書中對(duì)50余個(gè)數(shù)據(jù)工作流知識(shí)點(diǎn)、14個(gè)數(shù)據(jù)分析與挖掘主題、4個(gè)數(shù)據(jù)化運(yùn)營(yíng)主題、8個(gè)綜合性案例進(jìn)行了全面的講解,能讓數(shù)據(jù)化運(yùn)營(yíng)結(jié)合數(shù)據(jù)使用場(chǎng)景360°落地。 全書一共9章,分為兩個(gè)部分: 第一部分(第1-4章) Python數(shù)據(jù)分析與挖掘 首先介紹了Python和數(shù)據(jù)化運(yùn)營(yíng)的基本知識(shí),然后詳細(xì)講解了Python數(shù)據(jù)獲取(結(jié)構(gòu)化和非結(jié)構(gòu)化)、預(yù)處理、分析和挖掘的關(guān)鍵技術(shù)和經(jīng)驗(yàn),包含10大類預(yù)處理經(jīng)驗(yàn)、14個(gè)數(shù)據(jù)分析與挖掘主題,50余個(gè)知識(shí)點(diǎn)。 第二部分(第5~9章) Python數(shù)據(jù)化運(yùn)營(yíng) 這是本書的核心,詳細(xì)講解了會(huì)員運(yùn)營(yíng)、商品運(yùn)營(yíng)、流量運(yùn)營(yíng)和內(nèi)容運(yùn)營(yíng)4大主題,以及提升數(shù)據(jù)化運(yùn)營(yíng)價(jià)值的方法。每個(gè)運(yùn)營(yíng)主題中都包含了基本知識(shí)、評(píng)估指標(biāo)、應(yīng)用場(chǎng)景、數(shù)據(jù)分析模型、數(shù)據(jù)分析小技巧、數(shù)據(jù)分析大實(shí)話以及2個(gè)綜合性的應(yīng)用案例。

作者簡(jiǎn)介

  宋天龍(TonySong) 大數(shù)據(jù)技術(shù)專家,觸脈咨詢合伙人兼副總裁,前Webtrekk中國(guó)區(qū)技術(shù)和咨詢負(fù)責(zé)人(Webtrekk,德國(guó)的在線數(shù)據(jù)分析服務(wù)提供商)。 擅長(zhǎng)數(shù)據(jù)挖掘、建模、分析與運(yùn)營(yíng),精通端到端數(shù)據(jù)價(jià)值場(chǎng)景設(shè)計(jì)、業(yè)務(wù)需求轉(zhuǎn)換、數(shù)據(jù)結(jié)構(gòu)梳理、數(shù)據(jù)建模與學(xué)習(xí)以及數(shù)據(jù)工程交付。在電子商務(wù)、零售、銀行、保險(xiǎn)等多個(gè)行業(yè)擁有豐富的數(shù)據(jù)項(xiàng)目工作經(jīng)驗(yàn),參與過集團(tuán)和企業(yè)級(jí)數(shù)據(jù)體系規(guī)劃、DMP與數(shù)據(jù)倉(cāng)庫(kù)建設(shè)、大數(shù)據(jù)產(chǎn)品開發(fā)、網(wǎng)站流量系統(tǒng)建設(shè)、個(gè)性化智能推薦與精準(zhǔn)營(yíng)銷、企業(yè)大數(shù)據(jù)智能等。參與實(shí)施客戶案例包括聯(lián)合利華、Webpower、德國(guó)OTTO集團(tuán)電子商務(wù)(中國(guó))、Esprit中國(guó)、豬八戒網(wǎng)、順豐優(yōu)選、樂視商城、泰康人壽、酒仙網(wǎng)、國(guó)美在線、迪信通等。 著有多部暢銷書: 《Python數(shù)據(jù)分析與數(shù)據(jù)化運(yùn)營(yíng)》 《網(wǎng)站數(shù)據(jù)挖掘與分析:系統(tǒng)方法與商業(yè)實(shí)踐》 《企業(yè)大數(shù)據(jù)系統(tǒng)構(gòu)建實(shí)戰(zhàn):技術(shù)、架構(gòu)、實(shí)施與應(yīng)用》

圖書目錄

前言
第1章 Python和數(shù)據(jù)化運(yùn)營(yíng)1
1.1 用Python做數(shù)據(jù)化運(yùn)營(yíng)1
1.1.1 Python是什么1
1.1.2 數(shù)據(jù)化運(yùn)營(yíng)是什么2
1.1.3 Python用于數(shù)據(jù)化運(yùn)營(yíng)5
1.2 數(shù)據(jù)化運(yùn)營(yíng)所需的Python相關(guān)工具和組件5
1.2.1 Python程序6
1.2.2 Python交互環(huán)境Jupyter7
1.2.3 Python第三方庫(kù)23
1.2.4 數(shù)據(jù)庫(kù)和客戶端29
1.2.5 SSH遠(yuǎn)程客戶端30
1.3 內(nèi)容延伸:Python的OCR和tensorflow31
1.3.1 OCR工具:Tesseract-ocr31
1.3.2 機(jī)器學(xué)習(xí)框架:TensorFlow31
1.4 第1個(gè)用Python實(shí)現(xiàn)的數(shù)據(jù)化運(yùn)營(yíng)分析實(shí)例、銷售預(yù)測(cè)32
1.4.1 案例概述32
1.4.2 案例過程32
1.4.3 案例小結(jié)36
1.5 本章小結(jié)37
第2章 數(shù)據(jù)化運(yùn)營(yíng)的數(shù)據(jù)來源40
2.1 數(shù)據(jù)化運(yùn)營(yíng)的數(shù)據(jù)來源類型40
2.1.1 數(shù)據(jù)文件40
2.1.2 數(shù)據(jù)庫(kù)41
2.1.3 API42
2.1.4 流式數(shù)據(jù)43
2.1.5 外部公開數(shù)據(jù)43
2.1.6 其他來源44
2.2 使用Python獲取運(yùn)營(yíng)數(shù)據(jù)44
2.2.1 從文本文件讀取運(yùn)營(yíng)數(shù)據(jù)44
2.2.2 從Excel獲取運(yùn)營(yíng)數(shù)據(jù)55
2.2.3 從關(guān)系型數(shù)據(jù)庫(kù)MySQL讀取運(yùn)營(yíng)數(shù)據(jù)57
2.2.4 從非關(guān)系型數(shù)據(jù)庫(kù)MongoDB讀取運(yùn)營(yíng)數(shù)據(jù)64
2.2.5 從API獲取運(yùn)營(yíng)數(shù)據(jù)68
2.3 內(nèi)容延伸:讀取非結(jié)構(gòu)化網(wǎng)頁、文本、圖像、視頻、語音72
2.3.1 從網(wǎng)頁中獲取運(yùn)營(yíng)數(shù)據(jù)72
2.3.2 讀取非結(jié)構(gòu)化文本數(shù)據(jù)73
2.3.3 讀取圖像數(shù)據(jù)74
2.3.4 讀取視頻數(shù)據(jù)78
2.3.5 讀取語音數(shù)據(jù)81
2.4 本章小結(jié)85
第3章 10條數(shù)據(jù)化運(yùn)營(yíng)不得不知道的數(shù)據(jù)預(yù)處理經(jīng)驗(yàn)87
3.1 數(shù)據(jù)清洗:缺失值、異常值和重復(fù)值的處理87
3.1.1 數(shù)據(jù)列缺失的4種處理方法87
3.1.2 不要輕易拋棄異常數(shù)據(jù)89
3.1.3 數(shù)據(jù)重復(fù)就需要去重嗎90
3.1.4 代碼實(shí)操:Python數(shù)據(jù)清洗92
3.2 將分類數(shù)據(jù)和順序數(shù)據(jù)轉(zhuǎn)換為標(biāo)志變量100
3.2.1 分類數(shù)據(jù)和順序數(shù)據(jù)是什么100
3.2.2 運(yùn)用標(biāo)志方法處理分類和順序變量101
3.2.3 代碼實(shí)操:Python標(biāo)志轉(zhuǎn)換101
3.3 大數(shù)據(jù)時(shí)代的數(shù)據(jù)降維104
3.3.1 需要數(shù)據(jù)降維的情況104
3.3.2 基于特征選擇的降維105
3.3.3 基于特征轉(zhuǎn)換的降維106
3.3.4 基于特征組合的降維112
3.3.5 代碼實(shí)操:Python數(shù)據(jù)降維114
3.4 解決樣本類別分布不均衡的問題123
3.4.1 哪些運(yùn)營(yíng)場(chǎng)景中容易出現(xiàn)樣本不均衡124
3.4.2 通過過抽樣和欠抽樣解決樣本不均衡124
3.4.3 通過正負(fù)樣本的懲罰權(quán)重解決樣本不均衡124
3.4.4 通過組合/集成方法解決樣本不均衡125
3.4.5 通過特征選擇解決樣本不均衡125
3.4.6 代碼實(shí)操:Python處理樣本不均衡125
3.5 數(shù)據(jù)化運(yùn)營(yíng)要抽樣還是全量數(shù)據(jù)128
3.5.1 什么時(shí)候需要抽樣128
3.5.2 如何進(jìn)行抽樣129
3.5.3 抽樣需要注意的幾個(gè)問題130
3.5.4 代碼實(shí)操:Python數(shù)據(jù)抽樣131
3.6 解決運(yùn)營(yíng)數(shù)據(jù)的共線性問題135
3.6.1 如何檢驗(yàn)共線性135
3.6.2 解決共線性的5種常用方法136
3.6.3 代碼實(shí)操:Python處理共線性問題137
3.7 有關(guān)相關(guān)性分析的混沌139
3.7.1 相關(guān)和因果是一回事嗎139
3.7.2 相關(guān)系數(shù)低就是不相關(guān)嗎139
3.7.3 代碼實(shí)操:Python相關(guān)性分析140
3.8 標(biāo)準(zhǔn)化,讓運(yùn)營(yíng)數(shù)據(jù)落入相同的范圍141
3.8.1 實(shí)現(xiàn)中心化和正態(tài)分布的Z-Score141
3.8.2 實(shí)現(xiàn)歸一化的Max-Min142
3.8.3 用于稀疏數(shù)據(jù)的MaxAbs142
3.8.4 針對(duì)離群點(diǎn)的RobustScaler142
3.8.5 代碼實(shí)操:Python數(shù)據(jù)標(biāo)準(zhǔn)化處理142
3.9 離散化,對(duì)運(yùn)營(yíng)數(shù)據(jù)做邏輯分層145
3.9.1 針對(duì)時(shí)間數(shù)據(jù)的離散化145
3.9.2 針對(duì)多值離散數(shù)據(jù)的離散化146
3.9.3 針對(duì)連續(xù)數(shù)據(jù)的離散化146
3.9.4 針對(duì)連續(xù)數(shù)據(jù)的二值化147
3.9.5 代碼實(shí)操:Python數(shù)據(jù)離散化處理147
3.10 內(nèi)容延伸:非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理151
3.10.1 網(wǎng)頁數(shù)據(jù)解析151
3.10.2 網(wǎng)絡(luò)用戶日志解析159
3.10.3 圖像的基本預(yù)處理164
3.10.4 自然語言文本預(yù)處理169
3.11 本章小結(jié)172
第4章 跳過運(yùn)營(yíng)數(shù)據(jù)分析和挖掘的“大坑”174
4.1 聚類分析174
4.1.1 當(dāng)心數(shù)據(jù)異常對(duì)聚類結(jié)果的影響175
4.1.2 超大數(shù)據(jù)量時(shí)應(yīng)該放棄K均值算法175
4.1.3 聚類不僅是建模的終點(diǎn),更是重要的中間預(yù)處理過程177
4.1.4 高維數(shù)據(jù)上無法應(yīng)用聚類嗎178
4.1.5 如何選擇聚類分析算法179
4.1.6 案例:客戶特征的聚類與探索性分析179
4.2 回歸分析196
4.2.1 注意回歸自變量之間的共線性問題197
4.2.2 相關(guān)系數(shù)、判定系數(shù)和回歸系數(shù)之間是什么關(guān)系197
4.2.3 判定系數(shù)是否意味著相應(yīng)的因果聯(lián)系197
4.2.4 注意應(yīng)用回歸模型時(shí)研究自變量是否產(chǎn)生變化198
4.2.5 如何選擇回歸分析算法198
4.2.6 案例:大型促銷活動(dòng)前的銷售預(yù)測(cè)199
4.3 分類分析206
4.3.1 防止分類模型的過擬合問題207
4.3.2 使用關(guān)聯(lián)算法做分類分析207
4.3.3 用分類分析來提煉規(guī)則、提取變量、處理缺失值208
4.3.4 類別劃分:分類算法和聚類算法都是好手209
4.3.5 如何選擇分類分析算法210
4.3.6 案例:用戶流失預(yù)測(cè)分析與應(yīng)用210
4.4 關(guān)聯(lián)分析221
4.4.1 頻繁規(guī)則不一定是有效規(guī)則221
4.4.2 不要被啤酒尿布的故事禁錮你的思維222
4.4.3 被忽略的“負(fù)相關(guān)”模式真的毫無用武之地嗎223
4.4.4 頻繁規(guī)則只能打包組合應(yīng)用嗎2

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)