《數據館員的Spark簡明手冊》旨在協助初級數據館員們能夠迅速了解Spark方面的知識、用途及整體概貌,作為進一步實踐操作之前的入門基礎讀物?!稊祿^員的Spark簡明手冊》力求簡單、通俗、易懂,以讀者能夠快速把握重點為主,從而開展項目、課題、實驗和研究。本手冊旨在知識模塊化,有了整體概述,可以方便讀者與其他解決方案進行比較,在實踐中遇到問題可以盡快發(fā)現需要深入鉆研的部分?!稊祿^員的Spark簡明手冊》包括8章。第1章概述Spark的發(fā)展背景、計算框架及機器學習等。第2章描述Spark的安裝與運行。第3章概述Scala編程實現的方式。第4章概述Spark編程模型和解析。第5章進入到Spark數據挖掘的應用。第6章考慮大數據實時計算的問題,進行方案比較,突出Spark的特點。第7章闡明進一步優(yōu)化Spark的方式。第8章概述Spark SQL來闡明如何在Spark上使用人們比較熟悉的SQL數據庫語言的方式。