注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡網(wǎng)絡與數(shù)據(jù)通信網(wǎng)絡服務Python大數(shù)據(jù)分析算法與實例

Python大數(shù)據(jù)分析算法與實例

Python大數(shù)據(jù)分析算法與實例

定 價:¥69.00

作 者: 鄧立國 著
出版社: 清華大學出版社
叢編項:
標 簽: 暫缺

ISBN: 9787302551065 出版時間: 2020-05-01 包裝: 平裝
開本: 16開 頁數(shù): 332 字數(shù):  

內(nèi)容簡介

  大數(shù)據(jù)時代,大數(shù)據(jù)分析是關鍵技術。Python是一款優(yōu)秀的大數(shù)據(jù)分析軟件,《Python大數(shù)據(jù)分析算法與實例》以Python 3結合第三方開源工具進行大數(shù)據(jù)分析,以小的代價編程實現(xiàn)數(shù)據(jù)的提取、處理、分析和可視化?!∪珪譃?章,首先介紹大數(shù)據(jù)分析的背景和行業(yè)應用,給出了數(shù)據(jù)特征算法分析;然后基于Python 3介紹常用典型第三方大數(shù)據(jù)分析工具的場景應用;最后比較翔實地闡述大數(shù)據(jù)分析算法與經(jīng)典實例應用。 《Python大數(shù)據(jù)分析算法與實例》適合從事大數(shù)據(jù)分析的研究人員、計算機或數(shù)學等相關專業(yè)的從業(yè)者參考學習,也可以作為計算機或數(shù)學等專業(yè)本科高年級或研究生的專業(yè)用書。

作者簡介

  鄧立國,東北大學計算機應用博士畢業(yè)。2005年開始在沈陽師范大學軟件學院、教育技術學院任教,主要研究方向:數(shù)據(jù)挖掘、知識工程、大數(shù)據(jù)處理、云計算、分布式計算等。以第一作者發(fā)表學術論文30多篇(26篇EI),主編教材 1 部,主持科研課題6項,經(jīng)費10余萬元,多次獲得校級科研優(yōu)秀獎,作為九三社員提出的智慧城市提案被市政府采納,研究成果被教育廳等單位采用。

圖書目錄

目 錄

第1章 大數(shù)據(jù)分析概述 1
1.1 大數(shù)據(jù)分析背景 1
1.2 大數(shù)據(jù)分析的應用 2
1.3 大數(shù)據(jù)分析算法 3
1.4 大數(shù)據(jù)分析工具 6
1.5 本章小結 9
第2章 數(shù)據(jù)特征算法分析 10
2.1 數(shù)據(jù)分布性分析 10
2.1.1 數(shù)據(jù)分布特征集中趨勢的測定 10
2.1.2 數(shù)據(jù)分布特征離散程度的測定 15
2.1.3 數(shù)據(jù)分布特征偏態(tài)與峰度的測定 19
2.2 數(shù)據(jù)相關性分析 21
2.2.1 數(shù)據(jù)相關關系 21
2.2.2 數(shù)據(jù)相關分析的主要內(nèi)容 24
2.2.3 相關關系的測定 24
2.3 數(shù)據(jù)聚類性分析 26
2.3.1 聚類分析定義 26
2.3.2 聚類類型 27
2.3.3 聚類應用 29
2.4 數(shù)據(jù)主成分分析 29
2.4.1 主成分分析的原理及模型 30
2.4.2 數(shù)據(jù)主成分分析的幾何解釋 31
2.4.3 數(shù)據(jù)主成分的導出 32
2.4.4 證明主成分的方差是依次遞減的 34
2.4.5 數(shù)據(jù)主成分分析的計算 35
2.5 數(shù)據(jù)動態(tài)性分析 36
2.6 數(shù)據(jù)可視化 40
2.7 本章小結 42
第3章 大數(shù)據(jù)分析工具:NumPy 43
3.1 NumPy簡介 43
3.2 NumPy環(huán)境安裝配置 44
3.3 ndarray對象 45
3.4 數(shù)據(jù)類型 47
3.5 數(shù)組屬性 49
3.6 數(shù)組創(chuàng)建例程 52
3.7 切片和索引 57
3.8 廣播 60
3.9 數(shù)組操作與迭代 61
3.10 位操作與字符串函數(shù) 87
3.11 數(shù)學運算函數(shù) 91
3.12 算數(shù)運算 93
3.13 統(tǒng)計函數(shù) 97
3.14 排序、搜索和計數(shù)函數(shù) 101
3.15 字節(jié)交換 104
3.16 副本和視圖 105
3.17 矩陣庫 107
3.18 線性代數(shù)模塊 109
3.19 Matplotlib庫 112
3.20 Matplotlib 繪制直方圖 114
3.21 IO文件操作 116
3.22 NumPy實例:GPS定位 117
3.23 本章小結 120
第4章 大數(shù)據(jù)分析工具:SciPy 121
4.1 SciPy簡介 121
4.2 文件輸入和輸出:SciPy.io 122
4.3 特殊函數(shù):SciPy.special 123
4.4 線性代數(shù)操作:SciPy.linalg 124
4.5 快速傅里葉變換:sipy.fftpack 124
4.6 優(yōu)化器:SciPy.optimize 125
4.7 統(tǒng)計工具:SciPy.stats 126
4.8 SciPy實例 127
4.8.1 最小二乘擬合 127
4.8.2 函數(shù)最小值 128
4.9 本章小結 130
第5章 大數(shù)據(jù)分析工具:Matplotlib 131
5.1 初級繪制 131
5.2 圖像、子區(qū)、子圖、刻度 137
5.3 其他種類的繪圖 140
5.4 本章小結 147
第6章 大數(shù)據(jù)分析工具:Pandas 148
6.1 Pandas系列 148
6.2 Pandas數(shù)據(jù)幀 151
6.3 Pandas面板 155
6.4 Pandas快速入門 158
6.5 本章小結 172
第7章 大數(shù)據(jù)分析工具:Statsmodels與Gensim 173
7.1 Statsmodels 173
7.1.1 Statsmodels統(tǒng)計數(shù)據(jù)庫 173
7.1.2 Statsmodels典型的擬合模型概述 175
7.1.3 Statsmodels舉例 176
7.2 Gensim 178
7.2.1 基本概念 178
7.2.2 訓練語料的預處理 179
7.2.3 主題向量的變換 180
7.2.4 文檔相似度的計算 181
7.3 本章小結 182
第8章 大數(shù)據(jù)分析算法與實例 183
8.1 描述統(tǒng)計 183
8.2 假設檢驗 188
8.3 信度分析 192
8.4 列聯(lián)表分析 195
8.5 相關分析 196
8.6 方差分析 198
8.6.1 單因素方差分析 199
8.6.2 多因素方差分析 201
8.7 回歸分析 203
8.8 聚類分析 207
8.9 判別分析 212
8.10 主成分分析 216
8.11 因子分析 218
8.12 時間序列分析 221
8.13 生存分析 224
8.14 典型相關分析 245
8.15 RoC分析 250
8.16 距離分析 255
8.17 對應分析 264
8.18 決策樹分析 265
8.19 神經(jīng)網(wǎng)絡-深度學習 271
8.19.1 深度學習的基本模型 271
8.19.2 新聞分類實例 275
8.20 蒙特·卡羅模擬 280
8.20.1 蒙特·卡羅模擬基本模型 281
8.20.2 蒙特·卡羅模擬計算看漲期權實例 281
8.21 關聯(lián)規(guī)則 287
8.21.1 關聯(lián)規(guī)則的概念 288
8.21.2 Apriori算法及實例 289
8.21.3 FP樹頻集算法 292
8.22 Uplift Modeling 301
8.23 集成方法 306
8.24 異常檢測 311
8.25 文本挖掘 315
8.26 Boosting算法(提升法和Gradient Boosting) 322
8.27 本章小結 325
參考文獻 326

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號