注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術計算機/網(wǎng)絡家庭與辦公軟件大數(shù)據(jù)之美:挖掘、Hadoop、架構,更精準地發(fā)現(xiàn)業(yè)務與營銷

大數(shù)據(jù)之美:挖掘、Hadoop、架構,更精準地發(fā)現(xiàn)業(yè)務與營銷

大數(shù)據(jù)之美:挖掘、Hadoop、架構,更精準地發(fā)現(xiàn)業(yè)務與營銷

定 價:¥49.00

作 者: 黃宏程 等
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 計算機/網(wǎng)絡 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)庫

ISBN: 9787121293443 出版時間: 2016-07-01 包裝: 平裝
開本: 16開 頁數(shù): 260 字數(shù):  

內(nèi)容簡介

  本書從大數(shù)據(jù)的基本概念出發(fā),深入解析了大數(shù)據(jù)應用的關鍵技術與應用。以大數(shù)據(jù)的數(shù)據(jù)挖掘技術、大數(shù)據(jù)的存儲與處理、大數(shù)據(jù)應用的總體架構三方面為線索,詳細闡述了大數(shù)據(jù)挖掘的諸多常用算法,介紹了Hadoop、HDFS及MapReduce等大數(shù)據(jù)存儲與處理的關鍵技術與應用、大數(shù)據(jù)應用的框架與構架。本書以通信運營商及互聯(lián)網(wǎng)電子商務等應用為背景,從典型實例的角度系統(tǒng)地介紹了大數(shù)據(jù)挖掘應用從目標構建、算法建模到程序?qū)崿F(xiàn),再到大數(shù)據(jù)分析及結果描述應用的整個過程,以期為讀者提供從理論到實務的有效借鑒。

作者簡介

  黃宏程:重慶郵電大學副教授,主要從事復雜網(wǎng)絡與信息處理、大數(shù)據(jù)技術等方向的研究與應用,近年來,作為項目負責人或主研人員,參加多項國家自然科學基金和省部級重點科研項目10余項,2012、2013年度中國人民解放軍科學技術進步獎獲得者。發(fā)表論文20余篇,其中SCI/EI檢索10余篇次,申請國家發(fā)明專利8項,授權5項。

圖書目錄

第1章 大數(shù)據(jù)概述 1 1.1 大數(shù)據(jù)的概念 1 1.1.1 什么是大數(shù)據(jù) 1 1.1.2 大數(shù)據(jù)的產(chǎn)生和來源 2 1.1.3 大數(shù)據(jù)的技術 3 1.1.4 大數(shù)據(jù)的特征 8 1.1.5 數(shù)據(jù)、信息與知識 10 1.2 大數(shù)據(jù)的價值與挑戰(zhàn) 10 1.2.1 大數(shù)據(jù)的潛在價值 11 1.2.2 大數(shù)據(jù)對業(yè)務的挑戰(zhàn) 12 1.2.3 大數(shù)據(jù)對技術架構的挑戰(zhàn) 13 1.2.4 大數(shù)據(jù)對管理策略的挑戰(zhàn) 14 1.3 大數(shù)據(jù)與相關領域的關系 16 1.3.1 大數(shù)據(jù)與統(tǒng)計分析 16 1.3.2 大數(shù)據(jù)與數(shù)據(jù)挖掘 16 1.3.3 大數(shù)據(jù)與云計算 17 1.4 大數(shù)據(jù)發(fā)展狀況 20 參考文獻 23 第2章 大數(shù)據(jù)挖掘技術 24 2.1 數(shù)據(jù)挖掘與過程 24 2.1.1 數(shù)據(jù)挖掘的七大功能 24 2.1.2 數(shù)據(jù)挖掘的實質(zhì) 25 2.2 數(shù)據(jù)挖掘過程 26 2.2.1 定義挖掘目標 27 2.2.2 數(shù)據(jù)取樣 28 2.2.3 數(shù)據(jù)探索 30 2.2.4 數(shù)據(jù)預處理 32 2.2.5 數(shù)據(jù)模式發(fā)現(xiàn) 37 2.2.6 模型評價 40 2.3 常用算法 47 2.3.1 決策樹 48 2.3.2 回歸 50 2.3.3 關聯(lián)規(guī)則 54 2.3.4 聚類 59 2.3.5 貝葉斯分類方法 66 2.3.6 神經(jīng)網(wǎng)絡 69 2.3.7 支持向量機(SVM) 73 2.3.8 假設檢驗 77 2.3.9 遺傳算法 81 參考文獻 84 第3章 大規(guī)模存儲與處理技術 86 3.1 Hadoop概述 86 3.1.1 什么是Hadoop 86 3.1.2 Hadoop發(fā)展簡史 88 3.1.3 Hadoop的優(yōu)勢 90 3.1.4 Hadoop的子項目 90 3.2 HDFS 92 3.2.1 HDFS的設計目標 93 3.2.2 HDFS文件系統(tǒng)的原型GFS 93 3.2.3 HDFS文件的基本結構 95 3.2.4 HDFS的文件讀/寫操作 97 3.2.5 HDFS的存儲過程 101 3.3 MapReduce編程框架 105 3.3.1 MapReduce的發(fā)展歷史 105 3.3.2 MapReduce的基本工作過程 107 3.3.3 MapReduce的特點 110 3.4 建立Hadoop開發(fā)環(huán)境 111 3.4.1 相關準備工作 111 3.4.2 JDK的安裝配置 113 3.4.3 SSH無鑰登錄 113 3.4.4 安裝、配置Hadoop環(huán)境變量 115 3.5 大數(shù)據(jù)處理系統(tǒng)分類 118 3.5.1 批量數(shù)據(jù)處理系統(tǒng) 118 3.5.2 流式數(shù)據(jù)處理系統(tǒng) 119 3.5.3 交互式數(shù)據(jù)處理 122 3.5.4 圖數(shù)據(jù)處理系統(tǒng) 124 3.6 大數(shù)據(jù)查詢和分析技術:SQL on Hadoop 126 3.6.1 數(shù)據(jù)庫簡介 126 3.6.2 圖數(shù)據(jù)庫 128 3.6.3 Hive:基本的Hadoop分析 130 3.6.4 實時互動的SQL:Impala和Drill 134 3.7 以通信業(yè)務分析為例的大數(shù)據(jù)的技術環(huán)境部署 136 3.7.1 應用架構規(guī)劃與設計 136 3.7.2 技術環(huán)境部署與配置 137 第4章 大數(shù)據(jù)應用的總體架構和關鍵技術 148 4.1 大數(shù)據(jù)的業(yè)務分析 148 4.2 大數(shù)據(jù)的總架體構模型 152 4.3 大數(shù)據(jù)高級分析 161 4.3.1 數(shù)據(jù)倉庫與聯(lián)機分析處理技術 162 4.3.2 大數(shù)據(jù)分析與傳統(tǒng)分析 167 4.3.3 非結構化復雜數(shù)據(jù)分析 168 4.3.4 實時預測分析 177 4.4 可視化分析 181 4.4.1 可視化技術 181 4.4.2 可視化工具 192 參考文獻 195 第5章 運營商數(shù)據(jù)分析 196 5.1 案例背景 196 5.1.1 大數(shù)據(jù)運營已為大勢所趨 196 5.1.2 采取大數(shù)據(jù)運營的原因 196 5.1.3 大數(shù)據(jù)分析如何提升電信行業(yè)績效 197 5.1.4 大數(shù)據(jù)的社會價值 199 5.2 挖掘目標的提出 200 5.3 案例分析 201 5.3.1 體系架構 201 5.3.2 Hadoop集群抽取模塊 202 5.3.3 數(shù)據(jù)處理模塊 208 5.3.4 數(shù)據(jù)分發(fā) 211 5.4 MapReduce操作 218 5.5 結果分析 221 第6章 互聯(lián)網(wǎng)電影推薦系統(tǒng) 223 6.1 背景描述 223 6.2 業(yè)務目標 224 6.3 業(yè)務需求 225 6.4 協(xié)同過濾推薦系統(tǒng)建模 225 6.4.1 推薦系統(tǒng)概述 225 6.4.2 基于對立用戶的協(xié)同過濾模型 227 6.5 項目處理過程 229 6.5.1 項目數(shù)據(jù) 229 6.5.2 數(shù)據(jù)預處理 230 6.5.3 Hadoop并行算法 242 6.6 總結 250

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號