注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)工業(yè)技術(shù)建筑科學建筑設(shè)計Python數(shù)據(jù)分析全流程實操指南

Python數(shù)據(jù)分析全流程實操指南

Python數(shù)據(jù)分析全流程實操指南

定 價:¥79.00

作 者: 尚濤 著
出版社: 北京大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787301289495 出版時間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 352 字數(shù):  

內(nèi)容簡介

  本書主要圍繞整個數(shù)據(jù)分析方法論的常規(guī)流程,介紹了Python常用的工具包,包括科學計算庫Numpy、數(shù)據(jù)分析庫Pandas、數(shù)據(jù)挖掘庫Scikit-Learn,以及數(shù)據(jù)可視化庫Matplotlib和Seaborn的基本知識,并從數(shù)據(jù)分析挖掘的實際業(yè)務應用出發(fā),講解了互聯(lián)網(wǎng)、金融及零售等行業(yè)的真實案例,比如客戶分群、產(chǎn)品精準營銷、房價預測、特征降維等,深入淺出、循序漸進地介紹了Python數(shù)據(jù)分析的全過程。 本書內(nèi)容精煉、重點突出、案例豐富,適合在企業(yè)中從事數(shù)據(jù)分析、數(shù)據(jù)挖掘、機器學習等工作的人員學習使用,同樣適合想從事數(shù)據(jù)分析挖掘工作的各大中專院校的學生與教師,以及其他對數(shù)據(jù)分析挖掘技術(shù)領(lǐng)域有興趣愛好的各類人員。

作者簡介

  尚濤,畢業(yè)于上海交通大學數(shù)學系,擁有數(shù)學碩士學位,研究方向為數(shù)據(jù)挖掘及機器學習領(lǐng)域,曾任職于平安科技、易方達基金?,F(xiàn)任職于南方基金,專注于信用風險評分、精準營銷、推薦系統(tǒng)等領(lǐng)域的數(shù)據(jù)挖掘項目的研發(fā)工作,擁有超過10年的數(shù)據(jù)挖掘和優(yōu)化建模經(jīng)驗,以及多年使用Python、SAS、R等軟件的經(jīng)驗。在從業(yè)經(jīng)歷中,為所在公司的業(yè)務方成功實施了眾多深受好評的數(shù)據(jù)挖掘項目,取得了較好的業(yè)務價值。

圖書目錄

第一章 數(shù)據(jù)分析方法
11.1 什么是數(shù)據(jù)分析2
1.2 數(shù)據(jù)分析標準流程2
1.3 數(shù)據(jù)清洗7
1.4 數(shù)據(jù)探索8
1.5 模型開發(fā)10
1.6 模型應用11


第二章 初識Python12
2.1 Python基本概述13
2.2 Python編程語法基礎(chǔ)14
2.3 數(shù)據(jù)分析常用Python庫22
2.4 第三方Python庫介紹23


第三章 NumPy數(shù)組與矩陣25
3.1 Ndarray對象26
3.2 數(shù)據(jù)類型27
3.3 數(shù)組屬性28
3.4 創(chuàng)建數(shù)組30
3.5 數(shù)據(jù)索引與切片34
3.6 數(shù)組操作37
3.7 數(shù)組排序51
3.8 函數(shù)54
3.9 矩陣62


第四章 Pandas數(shù)據(jù)分析65
4.1 系列(Series)66
4.2 數(shù)據(jù)幀(DataFrame)68
4.3 基本功能介紹70
4.4 讀取和寫入數(shù)據(jù)78
4.5 索引和選擇數(shù)據(jù)84
4.6 數(shù)據(jù)合并87
4.7 累計與分組91
4.8 時間序列處理96
4.9 缺失數(shù)據(jù)處理101
4.10 函數(shù)107
4.11 描述性統(tǒng)計115
4.12 繪制圖形118


第五章 Scikit-Learn數(shù)據(jù)挖掘126
5.1 機器學習問題127
5.2 機器學習的基本流程127
5.3 數(shù)據(jù)處理128
5.4 特征選擇131
5.5 模型調(diào)用135
5.6 模型參數(shù)說明138
5.7 交叉驗證148
5.8 模型部署151


第六章 數(shù)據(jù)可視化153
6.1 Matplotlib繪制圖形154
6.2 Seaborn繪制圖形163
6.3 重要類型圖形的繪制184


第七章 數(shù)據(jù)導入與導出192
7.1 連接數(shù)據(jù)庫193
7.2 讀取外部數(shù)據(jù)194
7.3 導出數(shù)據(jù)201


第八章 數(shù)據(jù)預處理203
8.1 數(shù)據(jù)去重204
8.2 缺失值處理205
8.3 變量操作210
8.4 樣本選擇217
8.5 數(shù)據(jù)集操作220


第九章 數(shù)據(jù)探索226
9.1 集中趨勢227
9.2 離散程度230
9.3 分布狀態(tài)234
9.4 相關(guān)分析236


第十章 線性回歸分析241
10.1 線性回歸模型242
10.2 最小二乘估計243
10.3 顯著性檢驗244
10.4 預測245
10.5 相關(guān)性246
10.6 共線性247
10.7 案例分析——波士頓地區(qū)房價預測247


第十一章 Logistic回歸分析260
11.1 邏輯回歸模型介紹261
11.2 案例分析——泰坦尼克生存預測262


第十二章 決策樹275
12.1 決策樹介紹276
12.2 案例分析——金融產(chǎn)品推薦277


第十三章 主成分分析292
13.1 主成分分析的數(shù)學模型293
13.2 PCA函數(shù)說明294
13.3 案例分析——數(shù)據(jù)降維295


第十四章 聚類分析304
14.1 距離305
14.2 聚類方法306
14.3 確定聚類數(shù)309
14.4 聚類的分析步驟311
14.5 案例分析——客戶群聚類分析312


第十五章 時間序列分析323
15.1 時間序列的組成部分324
15.2 確定性的時間序列模型325
15.3 隨機時間序列模型325
15.4 ARMA模型的識別327
15.5 時間序列的分析步驟329
15.6 模型參數(shù)的估計329
15.7 案例分析——大氣二氧化碳濃度預測331

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號