注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計程序設(shè)計綜合Mahout實踐指南

Mahout實踐指南

Mahout實踐指南

定 價:¥49.00

作 者: (美)Piero Giacomelli 著,靳小波 譯
出版社: 機械工業(yè)出版社
叢編項:
標 簽: 編程語言與程序設(shè)計 計算機與互聯(lián)網(wǎng)

ISBN: 9787111467144 出版時間: 2014-06-01 包裝:
開本: 頁數(shù): 字數(shù):  

內(nèi)容簡介

  《Mahout實踐指南》是軟件開發(fā)專家數(shù)十年行業(yè)經(jīng)驗的結(jié)晶,深入淺出地論述如何使用Mahout進行數(shù)據(jù)分類、聚類和預(yù)測,涉及Mahout開發(fā)環(huán)境、序列文件使用方式、整合Mahout和外部資源、實現(xiàn)樸素貝葉斯分類器、股市預(yù)測、頂棚聚類、頻譜預(yù)測、K-均值聚類等。本書是面向編程的,不涉及深奧的理論,簡單、易學(xué),可以幫助讀者快速掌握Mahout的基本用法,實用性強。全書共分10章。第1章介紹如何在單臺機器上創(chuàng)建完整的Mahout開發(fā)環(huán)境。第2章重點介紹序列文件的使用方式。第3章詳細介紹如何使用命令行工具和代碼從RDBMS中讀寫數(shù)據(jù)。第4章詳細討論樸素貝葉斯分類器和互補樸素貝葉斯分類器的使用方法。第5章介紹如何使用logistic回歸和隨機森林預(yù)測股市。第6章描述Mahout框架中最常用的算法,包括大數(shù)據(jù)的聚類分析和分類。第7章描述頻譜聚類的使用方式。第8章描述使用K-均值(包括序列方式和MapReduce方式)對主題中的文本文檔進行分類。第9章介紹頻繁模式挖掘算法的使用方式。第10章描述使用遺傳算法解決旅行商問題和提取規(guī)則。

作者簡介

  Piero Giacomelli,資深軟件技術(shù)專家,精通Java、.NET和PHP等多種編程語言,尤其對Java語言有獨到見解。他曾先后在多家大中型公司擔(dān)任行政和技術(shù)職務(wù),包括航空航天、網(wǎng)絡(luò)服務(wù)、塑料制造業(yè)和電子健康協(xié)會。他在FP7歐盟項目中參與了多項歐盟研究基金資助的工程,如CHRONIOUS、I-DONT-FALL、FEARLESS和CHROMED等。他在科研期刊上發(fā)表了若干篇論文,并兩次獲得由IARIA頒發(fā)的最佳論文獎。2012年,他出版了Apache HornetQ框架標準參考書《HornetQ Messaging Developer’s Guide》。

圖書目錄

第1章 Mahout入門 / 1 秘笈1 安裝Java和Hadoop / 1 秘笈2 設(shè)置Maven和NetBeans開發(fā)環(huán)境 / 6 秘笈3 編寫一個基本的推薦系統(tǒng) / 9 第2章 使用序列文件——什么時候和為什么 / 19 秘笈4 從命令行創(chuàng)建序列文件 / 20 秘笈5 編寫代碼創(chuàng)建序列文件 / 23 秘笈6 編碼實現(xiàn)讀取序列文件 / 28 第3章 將Mahout和外部資源整合 / 33 秘笈7 導(dǎo)入外部資源到HDFS / 34 秘笈8 將數(shù)據(jù)從HDFS導(dǎo)入到RDBMS / 43 秘笈9 創(chuàng)建一個Sqoop作業(yè)來處理RDBMS / 45 秘笈10 使用Sqoop API導(dǎo)入數(shù)據(jù) / 47 第4章 實現(xiàn)樸素貝葉斯分類器 / 49 秘笈11 使用Mahout文本分類器演示基本的使用樣例 / 50 秘笈12 編碼實現(xiàn)樸素貝葉斯分類器 / 60 秘笈13 通過命令行使用互補樸素貝葉斯 / 64 秘笈14 編碼使用互補樸素貝葉斯分類器 / 65 第5章 股市預(yù)測 / 67 秘笈15 為logistic回歸準備數(shù)據(jù) / 67 秘笈16 使用logistic預(yù)測GOOG股票動態(tài) / 71 秘笈17 通過Java編碼使用自適應(yīng)的logistic回歸 / 76 秘笈18 在大規(guī)模的數(shù)據(jù)集上使用logistic回歸 / 79 秘笈19 使用隨機森林預(yù)測市場動態(tài) / 83 第6章 頂棚聚類 / 87 秘笈20 基于命令行的頂棚聚類 / 87 秘笈21 基于帶參數(shù)命令行的頂棚聚類 / 91 秘笈22 通過Java代碼使用頂棚聚類 / 95 秘笈23 編寫你自己的距離估計 / 98 第7章 頻譜聚類 / 101 秘笈24 通過命令行使用EigenCuts / 101 秘笈25 在Java代碼中使用EigenCuts / 104 秘笈26 從原始數(shù)據(jù)創(chuàng)建相似度矩陣 / 108 秘笈27 使用頻譜聚類進行圖像分割 / 114 第8章 K-均值聚類 / 119 秘笈28 在Java代碼中使用K-均值聚類 / 119 秘笈29 使用K-均值聚類對交通事故進行聚類 / 124 秘笈30 使用MapReduce進行K-均值聚類 / 128 秘笈31 命令行方式使用K-均值聚類 / 132 第9章 軟計算 / 139 秘笈32 使用Mahout進行頻繁模式挖掘 / 139 秘笈33 為頻繁模式挖掘創(chuàng)建評價準則 / 142 秘笈34 在Java代碼中使用頻繁模式挖掘 / 147 秘笈35 使用LDA創(chuàng)建主題 / 153 第10章 實現(xiàn)遺傳算法 / 159 秘笈36 設(shè)置Mahout以便使用遺傳算法 / 159 秘笈37 在圖上使用遺傳算法 / 163 秘笈38 在Java代碼中使用遺傳算法 / 167

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號