定 價(jià):¥99.00
作 者: | 常國(guó)珍,趙仁乾 |
出版社: | 機(jī)械工業(yè)出版社 |
叢編項(xiàng): | |
標(biāo) 簽: | 暫缺 |
ISBN: | 9787111603092 | 出版時(shí)間: | 2018-07-01 | 包裝: | |
開本: | 頁(yè)數(shù): | 字?jǐn)?shù): |
前言
第1章數(shù)據(jù)科學(xué)家的武器庫(kù)
1.1數(shù)據(jù)科學(xué)的基本概念
1.2數(shù)理統(tǒng)計(jì)技術(shù)
1.2.1描述性統(tǒng)計(jì)分析
1.2.2統(tǒng)計(jì)推斷與統(tǒng)計(jì)建模
1.3數(shù)據(jù)挖掘的技術(shù)與方法
1.4描述性數(shù)據(jù)挖掘算法示例
1.4.1聚類分析——客戶細(xì)分
1.4.2關(guān)聯(lián)規(guī)則分析
1.5預(yù)測(cè)性數(shù)據(jù)挖掘算法示例
1.5.1決策樹
1.5.2KNN算法
1.5.3Logistic回歸
1.5.4神經(jīng)網(wǎng)絡(luò)
1.5.5支持向量機(jī)
1.5.6集成學(xué)習(xí)
1.5.7預(yù)測(cè)類模型講解
1.5.8預(yù)測(cè)類模型評(píng)估概述
第2章Python概述
2.1Python概述
2.1.1Python簡(jiǎn)介
2.1.2Python與數(shù)據(jù)科學(xué)
2.1.3Python2與Python3
2.2Anaconda Python的安裝、使用
2.2.1下載與安裝
2.2.2使用Jupyter Notebook
2.2.3使用Spyder
2.2.4使用conda或pip管理
第三方庫(kù)
第3章數(shù)據(jù)科學(xué)的Python編程基礎(chǔ)
3.1Python的基本數(shù)據(jù)類型
3.1.1字符串(str)
3.1.2浮點(diǎn)數(shù)和整數(shù)(float、int)
3.1.3布爾值(Bool:True/False)
3.1.4其他
3.2Python的基本數(shù)據(jù)結(jié)構(gòu)
3.2.1列表(list)
3.2.2元組(tuple)
3.2.3集合(set)
3.2.4字典(dict)
3.3Python的程序控制
3.3.1三種基本的編程結(jié)構(gòu)簡(jiǎn)介
3.3.2順承結(jié)構(gòu)
3.3.3分支結(jié)構(gòu)
3.3.4循環(huán)結(jié)構(gòu)
3.4Python的函數(shù)與模塊
3.4.1Python的函數(shù)
3.4.2Python的模塊
3.5Pandas讀取結(jié)構(gòu)化數(shù)據(jù)
3.5.1讀取數(shù)據(jù)
3.5.2寫出數(shù)據(jù)
第4章描述性統(tǒng)計(jì)分析與繪圖
4.1描述性統(tǒng)計(jì)進(jìn)行數(shù)據(jù)探索
4.1.1變量度量類型與分布類型
4.1.2分類變量的統(tǒng)計(jì)量
4.1.3連續(xù)變量的分布與集中趨勢(shì)
4.1.4連續(xù)變量的離散程度
4.1.5數(shù)據(jù)分布的對(duì)稱與高矮
4.2制作報(bào)表與統(tǒng)計(jì)制圖
4.3制圖的步驟
第5章數(shù)據(jù)整合和數(shù)據(jù)清洗
5.1數(shù)據(jù)整合
5.1.1行列操作
5.1.2條件查詢
5.1.3橫向連接
5.1.4縱向合并
5.1.5排序
5.1.6分組匯總
5.1.7拆分、堆疊列
5.1.8賦值與條件賦值
5.2數(shù)據(jù)清洗
5.2.1重復(fù)值處理
5.2.2缺失值處理
5.2.3噪聲值處理
5.3RFM方法在客戶行為分析上的運(yùn)用
5.3.1行為特征提取的RFM方法論
5.3.2使用RFM方法計(jì)算變量
5.3.3數(shù)據(jù)整理與匯報(bào)
第6章數(shù)據(jù)科學(xué)的統(tǒng)計(jì)推斷基礎(chǔ)
6.1基本的統(tǒng)計(jì)學(xué)概念
6.1.1總體與樣本
6.1.2統(tǒng)計(jì)量
6.1.3點(diǎn)估計(jì)、區(qū)間估計(jì)和中心極限定理
6.2假設(shè)檢驗(yàn)與單樣本t檢驗(yàn)
6.2.1假設(shè)檢驗(yàn)
6.2.2單樣本t檢驗(yàn)
6.3雙樣本t檢驗(yàn)
6.4方差分析(分類變量和連續(xù)變量關(guān)系檢驗(yàn))
6.4.1單因素方差分析
6.4.2多因素方差分析
6.5相關(guān)分析(兩連續(xù)變量關(guān)系檢驗(yàn))
6.5.1相關(guān)系數(shù)
6.5.2散點(diǎn)矩陣圖
6.6卡方檢驗(yàn)(二分類變量關(guān)系檢驗(yàn))
6.6.1列聯(lián)表
6.6.2卡方檢驗(yàn)
第7章客戶價(jià)值預(yù)測(cè):線性回歸模型與診斷
7.1線性回歸
7.1.1簡(jiǎn)單線性回歸
7.1.2多元線性回歸
7.1.3多元線性回歸的變量篩選
7.2線性回歸診斷
7.2.1殘差分析
7.2.2強(qiáng)影響點(diǎn)分析
7.2.3多重共線性分析
7.2.4小結(jié)線性回歸診斷
7.3正則化方法
7.3.1嶺回歸
7.3.2LASSO回歸
第8章Logistic回歸構(gòu)建初始信用評(píng)級(jí)
8.1Logistic回歸的相關(guān)關(guān)系分析
8.2Logistic回歸模型及實(shí)現(xiàn)
8.2.1Logistic回歸與發(fā)生比
8.2.2Logistic回歸的基本原理
8.2.3在Python中實(shí)現(xiàn)Logistic回歸
8.3Logistic回歸的極大似然估計(jì)
8.3.1極大似然估計(jì)的概念
8.3.2Logistics回歸的極大似然估計(jì)
8.4模型評(píng)估
8.4.1模型評(píng)估方法
8.4.2ROC曲線的概念
8.4.3在Python中實(shí)現(xiàn)ROC曲線
第9章使用決策樹進(jìn)行初始信用評(píng)級(jí)
9.1決策樹概述
9.2決策樹算法
9.2.1ID3建樹算法原理
9.2.2C4.5建樹算法原理
9.2.3CART建樹算法原理
9.2.4決策樹的剪枝
9.3在Python中實(shí)現(xiàn)決策樹
9.3.1建模
9.3.2模型評(píng)估
9.3.3決策樹的可視化
9.3.4參數(shù)搜索調(diào)優(yōu)
第10章神經(jīng)網(wǎng)絡(luò)
10.1神經(jīng)元模型
10.2單層感知器
10.3BP神經(jīng)網(wǎng)絡(luò)
10.4多層感知器的scikitlearn代碼實(shí)現(xiàn)
第11章分類器入門:最近鄰域與樸素貝葉斯
11.1KNN算法
11.1.1KNN算法原理
11.1.2在Python中實(shí)現(xiàn)KNN算法
11.2樸素貝葉斯分類
11.2.1貝葉斯公式
11.2.2樸素貝葉斯分類原理
11.2.3樸素貝葉斯的參數(shù)估計(jì)
11.2.4在Python中實(shí)現(xiàn)樸素貝葉斯
第12章高級(jí)分類器:支持向量機(jī)
12.1線性可分與線性不可分
12.2線性可分支持向量機(jī)
12.2.1函數(shù)間隔和幾何間隔
12.2.2學(xué)習(xí)策略
12.2.3對(duì)偶方法求解
12.2.4線性可分支持向量機(jī)例題
12.3線性支持向量機(jī)與軟間隔最大化
12.4非線性支持向量機(jī)與核函數(shù)
12.4.1核函數(shù)
12.4.2非線性支持向量機(jī)的學(xué)習(xí)
12.4.3示例與Python實(shí)現(xiàn)
12.5使用支持向量機(jī)的案例
第13章連續(xù)變量的特征選擇與轉(zhuǎn)換
13.1方法概述
13.2主成分分析
13.2.1主成分分析簡(jiǎn)介
13.2.2主成分分析原理
13.2.3主成分分析的運(yùn)用
13.2.4在Python中實(shí)現(xiàn)主成分分析
13.3基于主成分的冗余變量篩選
13.4因子分析
13.4.1因子分析模型
13.4.2因子分析算法
13.4.3在Python中實(shí)現(xiàn)因子分析
第14章客戶分群與聚類
14.1聚類算法概述
14.2聚類算法基本概念
14.2.1變量標(biāo)準(zhǔn)化與分布形態(tài)轉(zhuǎn)換
14.2.2變量的維度分析
14.3聚類模型的評(píng)估
14.4層次聚類
14.4.1層次聚類原理
14.4.2層次聚類在Python中的實(shí)現(xiàn)
14.5基于劃分的聚類
14.5.1kmeans聚類原理
14.5.2kmeans聚類