注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件工程及軟件方法學(xué)數(shù)據(jù)之魅:基于開源工具的數(shù)據(jù)分析

數(shù)據(jù)之魅:基于開源工具的數(shù)據(jù)分析

數(shù)據(jù)之魅:基于開源工具的數(shù)據(jù)分析

定 價(jià):¥89.00

作 者: Philipp K.Janert 著 黃權(quán),陸昌輝,鄒雪梅 譯
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 軟件工程/開發(fā)項(xiàng)目管理

ISBN: 9787302290988 出版時(shí)間: 2012-07-01 包裝: 平裝
開本: 16開 頁(yè)數(shù): 524 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  《數(shù)據(jù)之魅:基于開源工具的數(shù)據(jù)分析》結(jié)合作者雅奈特多年來(lái)從事數(shù)據(jù)分析工作的豐富經(jīng)驗(yàn),闡述了數(shù)據(jù)分析所涉及的概念和方法。本書四部分19章,主題包括如何通過圖表來(lái)觀察數(shù)據(jù),如何通過各種建模方法來(lái)分析數(shù)據(jù),然后著重闡述如何進(jìn)行數(shù)據(jù)挖掘,最后強(qiáng)調(diào)數(shù)據(jù)分析在商業(yè)和金融等領(lǐng)域的實(shí)際應(yīng)用。本書包含大量的模擬過程及結(jié)果展示,并通過實(shí)例來(lái)闡述如何使用開源工具來(lái)進(jìn)行數(shù)據(jù)分析。通過本書的閱讀,讀者可以清楚地了解這些方法的實(shí)際用法及用途?!稊?shù)據(jù)之魅:基于開源工具的數(shù)據(jù)分析》結(jié)構(gòu)合理,通俗易懂,適合數(shù)據(jù)分析愛好者和從業(yè)者閱讀,也適合以科學(xué)計(jì)算為工具的科研人員參考。同時(shí),本書還適用于計(jì)算機(jī)科學(xué)、數(shù)學(xué)、工程技術(shù)和其他相關(guān)專業(yè)本科或研究生的數(shù)據(jù)分析課程,是一本不錯(cuò)的參考書。

作者簡(jiǎn)介

  Philipp K. Janer,憑借著自己多年來(lái)?yè)?dān)任物理學(xué)家和軟件工程師的經(jīng)驗(yàn),為數(shù)據(jù)分析和數(shù)學(xué)建模提供咨詢服務(wù)。他是Gnuplot in Action: Understanding Data with Graphs(Manning出版)的作者,也在O’Reilly Network、IBM developerWorks和IEEE Software發(fā)表過大量文章。他擁有華盛頓大學(xué)理論物理學(xué)博士學(xué)位。

圖書目錄

第1 章導(dǎo)論
數(shù)據(jù)分析
本書內(nèi)容
關(guān)于講習(xí)班
關(guān)于數(shù)學(xué)
需要具備的知識(shí)
本書不涉及的內(nèi)容
第Ⅰ部分圖表:觀察數(shù)據(jù)
第 2 章單一變量:形狀和分布
數(shù)據(jù)點(diǎn)和抖動(dòng)圖
直方圖和核密度估計(jì)
直方圖
核密度估計(jì)
(選學(xué))如何選擇最優(yōu)帶寬
累積分布函數(shù)
(選學(xué))概率圖分布和QQ 圖
分布的對(duì)比
秩序圖和上升圖
僅用于適當(dāng)時(shí)機(jī):匯總統(tǒng)計(jì)量和箱形圖
匯總統(tǒng)計(jì)量
Box-and-Whisker 圖
(講習(xí)班)NumPy
NumPy 實(shí)踐
NumPy 詳解
擴(kuò)展閱讀
第3 章兩個(gè)變量:建立關(guān)系
散點(diǎn)圖
克服噪聲:平滑
樣條
LOESS
示例
殘差
其他觀點(diǎn)及提醒
對(duì)數(shù)圖
傾斜
線性回歸以及諸如此類的方法
描述重要信息
圖形分析與圖形演示
(講習(xí)班)matplotlib
交互式使用matplotlib
案例學(xué)習(xí):matplotlib 與
LOESS
控制屬性
matplotlib 對(duì)象模型及結(jié)構(gòu) 零碎知識(shí)
擴(kuò)展閱讀
第4 章以時(shí)間為變量:
時(shí)序分析
示例
任務(wù)
需求和現(xiàn)實(shí)
平滑處理
移動(dòng)平均法
指數(shù)平滑法
不要忽視顯而易見的東西
相關(guān)函數(shù)
示例
實(shí)現(xiàn)上的問題
(選學(xué))過濾器和卷積
(講習(xí)班)scipysignal
擴(kuò)展閱讀
第5 章多變量:圖形的多變量分析
假色圖
概覽:多值圖
散點(diǎn)圖矩陣
協(xié)作圖
變種
組成問題
組成的改變
多維組成:樹形圖和馬賽克圖
新穎的曲線類型標(biāo)識(shí)符
平行坐標(biāo)圖
交互式探索
查詢和縮放
連接和涂層
大游覽與投影尋蹤工具
(講習(xí)班)多變量圖形工具R
實(shí)驗(yàn)工具Python 的Chaco 庫(kù)
擴(kuò)展閱讀
第6 章插曲:數(shù)據(jù)分析會(huì)話
數(shù)據(jù)分析會(huì)話
(講習(xí)班)gnuplot 軟件
擴(kuò)展閱讀
第Ⅱ部分分析:數(shù)據(jù)建模
第 7 章推算和粗略計(jì)算
推算的原理
估計(jì)大小
建立關(guān)聯(lián)
使用數(shù)字
10 的冪
小擾動(dòng)
對(duì)數(shù) 更多示例
我所知道的一些常見事(物)
的相關(guān)數(shù)字
這些數(shù)字是否足夠好?
準(zhǔn)備工作:可行性和成本
完成之后:引用和
呈現(xiàn)數(shù)字
(選學(xué))進(jìn)一步探索攝動(dòng)理論和
誤差傳播
誤差傳播
(講習(xí)班)Gnu 科學(xué)庫(kù)(GSL)
擴(kuò)展閱讀
第8 章縮放參數(shù)模型
模型
建模
模型的運(yùn)用和誤用
參數(shù)的縮放
縮放參數(shù)
示例:維度參數(shù)
示例:優(yōu)化問題
示例:成本模型
(選學(xué))縮放參數(shù)與
量綱分析
其他理論
平均場(chǎng)近似
背景知識(shí)和其他示例
常見的時(shí)間演變方案
無(wú)限增長(zhǎng)和衰減現(xiàn)象
約束增長(zhǎng):邏輯斯諦方程
振蕩
案例學(xué)習(xí):多少臺(tái)服務(wù)器才是
最好的?
為什么要建模?
(講習(xí)班)Sage
擴(kuò)展閱讀
第9 章關(guān)于概率模型的討論
91 二項(xiàng)分布和伯努利試驗(yàn)
精確的結(jié)果
利用伯努利試驗(yàn)建立平均場(chǎng)
模型
92 高斯分布和中心極限定理
中心極限定理
中心項(xiàng)與尾項(xiàng)
為什么高斯分布如此實(shí)用?
(選學(xué))高斯積分
冪律分布和非常規(guī)統(tǒng)計(jì)學(xué)
冪律分布的用法
(選學(xué))期望值為無(wú)限時(shí)的
分布
接下來(lái)的研究
其他分布
幾何分布
泊松分布
對(duì)數(shù)正態(tài)分布
特殊用途的分布 (選學(xué))案例學(xué)習(xí)--隨時(shí)間變化的單一訪問者數(shù)量
(講習(xí)班)冪律分布
擴(kuò)展閱讀
第10 章你真正需要了解的經(jīng)典統(tǒng)計(jì)學(xué)知識(shí)起源
統(tǒng)計(jì)學(xué)的定義
從統(tǒng)計(jì)學(xué)角度解釋
示例:公式測(cè)驗(yàn)
VS 圖解法
控制實(shí)驗(yàn)VS 觀察研究
實(shí)驗(yàn)設(shè)計(jì)
前景
(選學(xué))貝葉斯統(tǒng)計(jì)--
另一種觀點(diǎn)
用頻率論來(lái)解釋概率
用貝葉斯方法來(lái)理解概率
貝葉斯數(shù)據(jù)分析: 一個(gè)實(shí)際有
效的例子
貝葉斯推理:總結(jié)與討論
(講習(xí)班)R 語(yǔ)言
擴(kuò)展閱讀
第11 章插敘:數(shù)學(xué)大搜捕--
大腳怪和最小二
乘等
111 如何平均均值
辛普森(Simpson)悖論
標(biāo)準(zhǔn)差
如何計(jì)算
(選學(xué))應(yīng)該選擇哪一個(gè)
(選學(xué))標(biāo)準(zhǔn)誤差
最小二乘
統(tǒng)計(jì)參數(shù)估計(jì)
函數(shù)逼近
擴(kuò)展閱讀
第Ⅲ部分計(jì)算:數(shù)據(jù)挖掘
第 12 章模擬
熱身問題
蒙特卡洛模擬
組合問題
獲得結(jié)果分布
優(yōu)點(diǎn)和缺點(diǎn)
重新采樣方法
拔靴法
拔靴法適用于哪些情況?
拔靴變量
(講習(xí)班)SimPy 離散事件模擬
SimPy 簡(jiǎn)介
最簡(jiǎn)單的排隊(duì)過程
(選學(xué))排隊(duì)理論
運(yùn)行SimPy 模擬
小結(jié) 擴(kuò)展閱讀
第13 章找出簇
簇由什么組成?
一種不同的觀點(diǎn)
距離計(jì)算和相似度計(jì)算
常見的距離和相似度
計(jì)算方法
聚類方法
中心探索法
樹形構(gòu)造器
鄰居生長(zhǎng)器
前期處理和后期處理
規(guī)模的規(guī)范化
類的屬性和評(píng)估
其他想法
具體案例:超市購(gòu)物籃的
分析
提醒
(講習(xí)班)Pycluster 和C 聚類庫(kù)
擴(kuò)展閱讀
第14 章一木見林:
找出重要屬性
主成分分析法
動(dòng)機(jī)
(選學(xué))理論
解釋
計(jì)算
實(shí)用觀點(diǎn)
雙標(biāo)圖
可視化技術(shù)
多元尺度法
網(wǎng)絡(luò)圖
柯霍南圖
(講習(xí)班)用R 進(jìn)行PCA
擴(kuò)展閱讀
線性代數(shù)
第15 章插曲:當(dāng)數(shù)據(jù)不成
比例地增長(zhǎng)時(shí)
一個(gè)真實(shí)的故事
一些建議
map/reduce 如何
(講習(xí)班)生成排列
擴(kuò)展閱讀
第Ⅳ部分應(yīng)用:數(shù)據(jù)的使用
第 16 章報(bào)表、商務(wù)智能和
儀表板
商務(wù)智能
報(bào)表
企業(yè)指標(biāo)和儀表板
關(guān)于指標(biāo)計(jì)劃的建議
數(shù)據(jù)的質(zhì)量問題
數(shù)據(jù)的可用性
數(shù)據(jù)的一致性
(講習(xí)班)Berkeley DB 和SQLite Berkeley DB
SQLite
擴(kuò)展閱讀
第17 章金融計(jì)算與建模
貨幣的時(shí)間價(jià)值
一次性支付:未來(lái)值和
現(xiàn)值
多筆付款:復(fù)利
復(fù)利的計(jì)算技巧
概覽:現(xiàn)金流分析和
凈現(xiàn)值
計(jì)劃成本和機(jī)會(huì)成本中的
不確定性
用賬戶的期望值來(lái)考慮
不確定性
機(jī)會(huì)成本
成本概念及貶值
直接成本和間接成本
固定成本和可變成本
資本開支與運(yùn)營(yíng)成本
是否應(yīng)該加以關(guān)注?
這些就是全部嗎?
(講習(xí)班)報(bào)紙經(jīng)銷商問題
(選學(xué))精確解
擴(kuò)展閱讀
報(bào)紙經(jīng)銷商問題
第18 章預(yù)測(cè)分析
預(yù)測(cè)分析的主題
一些分類術(shù)語(yǔ)
分類算法
基于實(shí)例的分類和最近鄰
分類算法
貝葉斯分類器
回歸
支持向量機(jī)
決策樹和基于規(guī)則的
分類器
其他分類算法
流程
集成方法:Bagging 和
Boosting
估計(jì)預(yù)測(cè)誤差
類不平衡問題
私家秘訣
統(tǒng)計(jì)學(xué)習(xí)的本質(zhì)
(講習(xí)班)自己編寫的兩個(gè)
分類器
擴(kuò)展閱讀
第19 章結(jié)語(yǔ):事實(shí)并非
現(xiàn)實(shí)
附錄A 科學(xué)計(jì)算與數(shù)據(jù)分析的
編程環(huán)境
附錄B 應(yīng)用:微積分
附錄C 使用數(shù)據(jù)
索引

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)