本書翻譯自Sam R. Alapati 的Expert Hadoop Administration。Sam R. Alapati 是Sabre 公司的首席Hadoop 管理員,具有多年的Hadoop 運維管理經驗。他希望通過本書,為Hadoop 集群開發(fā)與管理人員提供一些有益指導。從事Hadoop 的管理工作,首先要了解Hadoop 的架構,只進行單純的操作并不能被稱為合格的管理員?;诖耍緯诮榻BHadoop 及其生態(tài)組件時,都會首先介紹其架構,以期讀者能夠在更高的層次認識管理工作。本書首先介紹了Hadoop 的整體架構及其部署與使用;然后著重介紹了兩個重要的計算引擎MapReduce 與Spark ;接著介紹了Hadoop 的數據存儲與安全、數據均衡等特性;最后則介紹了如何進行參數調優(yōu)與故障排除。整個流程下來,讀者能夠建立起完整的關于Hadoop 管理的體系架構。