本書使用MPI標準介紹了數據科學中的高性能計算,幫助讀者了解分布式存儲模型中的并行編程的知識。全書分為兩部分,*部分(第1~6章)基于消息傳遞接口介紹高性能計算,內容包括:阻塞與非阻塞的點對點通信、死鎖、全局通信函數(廣播、散播等)、協同計算(歸約)的基本概念;互聯網絡的拓撲結構(環(huán)、環(huán)面和超立方體)以及相應的全局通信程序;基于分布式內存的并行排序及其實現,涵蓋相關并行線性代數知識;MapReduce模型。第二部分(第7~11章)介紹計算機集群中的高性能數據分析,內容包括:數據聚類技術(平面劃分聚類、層次聚類);基于k-NN的有監(jiān)督分類;核心集以及相關降維技術;圖算法(稠密子圖、圖同構檢測)。每章章末附有各種難度的練習和參考文獻,可供讀者進行自測和深入學習。本書適合作為“高性能計算”相關課程的本科生教材。