注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)數(shù)據(jù)庫實(shí)用數(shù)據(jù)分析

實(shí)用數(shù)據(jù)分析

實(shí)用數(shù)據(jù)分析

定 價(jià):¥59.00

作 者: Hector Cuesta 著
出版社: 機(jī)械工業(yè)出版社
叢編項(xiàng): 大數(shù)據(jù)技術(shù)叢書
標(biāo) 簽: 計(jì)算機(jī)與互聯(lián)網(wǎng) 數(shù)據(jù)庫

ISBN: 9787111476238 出版時(shí)間: 2014-09-01 包裝: 平裝
開本: 16開 頁數(shù): 335 字?jǐn)?shù):  

內(nèi)容簡介

  本書共14章,主要內(nèi)容包括:第1章探討數(shù)據(jù)分析的基本原理和數(shù)據(jù)分析步驟。第2章解釋如何清洗并準(zhǔn)備好數(shù)據(jù)并介紹了數(shù)據(jù)清洗工具OpenRefine。第3章展示在JavaScript可視化框架下應(yīng)用D3.js語言來實(shí)現(xiàn)各類數(shù)據(jù)的可視化方法。第4章介紹如何應(yīng)用樸素貝葉斯算法來區(qū)分垃圾郵件。第5章介紹了一個(gè)應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整方法來尋找圖像間相似性的項(xiàng)目。第6章解釋如何使用隨機(jī)游走算法和可視化的D3.js動(dòng)畫技術(shù)來模擬股票價(jià)格。第7章介紹核嶺回歸(KRR)的原理以及如何使用此方法和時(shí)間序列數(shù)據(jù)來預(yù)測黃金價(jià)格。第8章描述如何使用支持向量機(jī)的方法進(jìn)行分類分析。第9章應(yīng)用細(xì)胞自動(dòng)機(jī)的方法對(duì)傳染病進(jìn)行建模。第10章解釋如何應(yīng)用Gephi從Facebook獲取你的社會(huì)化媒體圖譜并使之實(shí)現(xiàn)可視化。第11章介紹如何應(yīng)用Twitter數(shù)據(jù)進(jìn)行情感分析。第12章介紹使用MongoDB進(jìn)行數(shù)據(jù)處理和聚合。第13章詳細(xì)介紹了如何在MongoDB數(shù)據(jù)庫中應(yīng)用MapReduce編程模型。第14章介紹如何應(yīng)用IPython和Wakari開展線上數(shù)據(jù)分析。

作者簡介

  Hector Cuesta,資深數(shù)據(jù)分析咨詢師,為金融服務(wù)、社會(huì)化網(wǎng)絡(luò)、在線學(xué)習(xí)和人力資源等多個(gè)行業(yè)提供軟件工程與數(shù)據(jù)分析方面的咨詢服務(wù)。他是墨西哥州自治大學(xué)計(jì)算機(jī)科學(xué)系的講師,主要研究領(lǐng)域涉及計(jì)算流行病學(xué)、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、高性能計(jì)算、大數(shù)據(jù)、模擬和數(shù)據(jù)可視化。他是《Software Guru》雜志的專欄作家,并且在一些國際期刊和會(huì)議中發(fā)表多篇科學(xué)論文。業(yè)余時(shí)間,他是樂高機(jī)器人和樹莓派的狂熱愛好者。

圖書目錄

Preface前言
本書提供了一系列現(xiàn)實(shí)中將數(shù)據(jù)轉(zhuǎn)化為洞察力的案例。書中覆蓋了廣泛的數(shù)據(jù)分析工具和算法,用于進(jìn)行分類分析、聚類分析、數(shù)據(jù)可視化、數(shù)據(jù)模擬以及預(yù)測。本書的目標(biāo)是幫助你了解數(shù)據(jù)從而找到相應(yīng)的模式、趨勢、相互關(guān)系以及洞察力。
書中所包括的實(shí)用項(xiàng)目充分利用了MongoDB、D3.js和Python語言并采用代碼片段和詳細(xì)描述的方式向讀者呈現(xiàn)本書的核心概念。
本書組織結(jié)構(gòu)
第1章探討數(shù)據(jù)分析的基本原理和數(shù)據(jù)分析步驟。
第2章解釋如何清洗并準(zhǔn)備好數(shù)據(jù)來開展分析,同時(shí)介紹了數(shù)據(jù)清洗工具OpenRefine的使用方式。
第3章展示在JavaScript可視化框架下應(yīng)用D3.js語言來實(shí)現(xiàn)各類數(shù)據(jù)的可視化方法。
第4章介紹了應(yīng)用樸素貝葉斯算法(Na?ve Bayes)來區(qū)分垃圾文本的一種二元分類法。
第5章展示了一個(gè)應(yīng)用動(dòng)態(tài)時(shí)間規(guī)整方法來尋找圖像間相似性的項(xiàng)目。
第6章解釋了如何使用隨機(jī)游走算法和可視化的D3.js動(dòng)畫技術(shù)來模擬股票價(jià)格的內(nèi)容。
第7章介紹核嶺回歸(Kernel Ridge Regression,KRR)的原理以及如何使用此方法和時(shí)間序列數(shù)據(jù)來預(yù)測黃金價(jià)格。
第8章描述如何使用支持向量機(jī)的方法進(jìn)行分類分析。
第9章介紹了對(duì)流行病進(jìn)行模擬計(jì)算的基本概念并解釋如何應(yīng)用細(xì)胞自動(dòng)機(jī)方法、D3.js和JavaScript語言來實(shí)現(xiàn)對(duì)流行病爆發(fā)的模擬。
第10章解釋如何應(yīng)用Gephi從Facebook獲取你的社會(huì)化媒體圖譜并使之實(shí)現(xiàn)可視化。
第11章解釋如何應(yīng)用Twitter的應(yīng)用程序編程接口(API)來獲取Twitter的數(shù)據(jù)。讀者也將看到如何改進(jìn)文本分類分析方法并將其應(yīng)用于情感分析。這一過程是在自然語言工具包(Natural Language Toolkit, NLTK)中應(yīng)用了樸素貝葉斯算法。
第12章介紹在MongoDB數(shù)據(jù)庫中進(jìn)行基本操作以及進(jìn)行分組、過濾和聚合的方法。
第13章詳細(xì)介紹如何在MongoDB數(shù)據(jù)庫中應(yīng)用MapReduce編程模型。
第14章解釋了如何使用Wakari平臺(tái),同時(shí)介紹了IPython中運(yùn)用Pandas進(jìn)行數(shù)據(jù)處理和使用PIL圖像處理庫的方法。
附錄提供書中所使用的軟件工具的詳細(xì)安裝信息。
本書技能要求

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)