本書緊扣Hadoop 生態(tài)圈相關系統(tǒng)對大數(shù)據(jù)處理架構進行全方位介紹,重點圍繞大數(shù)據(jù)基本概念、集群搭建、存儲管理、各類數(shù)據(jù)分析計算以及可視化等方面的基本理論、方法和關鍵技術的介紹,通過豐富的應用案例展示了大數(shù)據(jù)的應用場景以及數(shù)據(jù)價值。全書共分10 章,分別是認識大數(shù)據(jù)、Hadoop 集群搭建、HDFS 分布式文件系統(tǒng)、MapReduce 分布式計算框架、ZooKeeper 分布式協(xié)調服務、HBase 分布式數(shù)據(jù)庫、Hive 數(shù)據(jù)倉庫、Sqoop 數(shù)據(jù)遷移、Storm 流計算和數(shù)據(jù)可視化。全書遵循“理論夠用、實用第一”的原則選擇內容,編排合理,表述深入淺出,所有操作命令全部按序列出,并配有解釋和截圖,指導性、實用性強,能使讀者快速、輕松地掌握Hadoop 大數(shù)據(jù)平臺運維和分析的基本技術。本書可作為高等職業(yè)教育本科、專科院校包括大數(shù)據(jù)技術與應用專業(yè)在內的電子信息類專業(yè)相關課程教材,也可作為非計算機專業(yè)通識課程教學用書以及大數(shù)據(jù)愛好者的參考讀物。本書附有配套電子課件、源碼、教案、教學設計等資源,讀者可從中國水利水電出版社網站(www.waterpub.com.cn)或萬水書苑網站(www.wsbookshow.com)免費下載。