大數據是當前最為流行的熱點概念之一,其已由技術名詞衍生到對很多行業(yè)產生顛覆性影響的社會現(xiàn)象,作為最明確的技術發(fā)展趨勢之一,基于大數據的各種新型產品必將會對每個人的日常生活產生日益重要的影響。本書從架構與算法角度全面梳理了大數據存儲與處理的相關技術。大數據技術具有涉及的知識點異常眾多且正處于快速演進發(fā)展過程中等特點,其技術點包括底層的硬件體系結構、相關的基礎理論、大規(guī)模數據存儲系統(tǒng)、分布式架構設計、各種不同應用場景下的差異化系統(tǒng)設計思路、機器學習與數據挖掘并行算法以及層出不窮的新架構、新系統(tǒng)等。本書對眾多紛繁蕪雜的相關技術文獻和系統(tǒng)進行了擇優(yōu)汰劣并系統(tǒng)性地對相關知識分門別類地進行整理和介紹,將大數據相關技術分為大數據基礎理論、大數據系統(tǒng)體系結構、大數據存儲,以及包含批處理、流式計算、交互式數據分析、圖數據庫、并行機器學習的架構與算法以及增量計算等技術分支在內的大數據處理等幾個大的方向。通過這種體系化的知識梳理與講解,相信對于讀者整體系統(tǒng)地了解、吸收和掌握相關的優(yōu)秀技術有極大的幫助與促進作用。