面向大規(guī)模應(yīng)用的高性能計算編程與優(yōu)化

定　價：￥58.00

作　者：	文梅，柴俊，蘇華友，董辛楠，張春元
出版社：	科學(xué)出版社
叢編項：
標(biāo)　簽：	暫缺

購買這本書可以去

ISBN：	9787030462596	出版時間：	2015-11-01	包裝：
開本：	16開	頁數(shù)：	188	字?jǐn)?shù)：

內(nèi)容簡介

　　隨著信息技術(shù)的不斷發(fā)展，應(yīng)用對計算的需求不斷增加，需要借助高性能計算系統(tǒng)來解決相關(guān)領(lǐng)域的問題。如何高效地利用高性能計算資源解決工程和科學(xué)問題成為急需解決的問題。《面向大規(guī)模應(yīng)用的高性能計算編程與優(yōu)化》源自于作者系列超級計算機進行大規(guī)模應(yīng)用開發(fā)的經(jīng)驗和研究成果，對高性能計算相關(guān)的基礎(chǔ)知識和優(yōu)化關(guān)鍵技術(shù)進行系統(tǒng)的介紹?！睹嫦虼笠?guī)模應(yīng)用的高性能計算編程與優(yōu)化》共9章，第1章緒論，主要介紹大規(guī)模應(yīng)用對計算的需求，闡述編程方面的挑戰(zhàn)；第2～5章介紹高性能計算的基礎(chǔ)知識，重點介紹GPu和MIC編程及優(yōu)化技術(shù)；第6～8章闡述作者基于天河一1A、天河2號超級計算機開發(fā)的三個典型應(yīng)用案例，重點介紹大規(guī)模計算集群的優(yōu)化技術(shù)；第9章介紹未來的高性能計算，E級計算的挑戰(zhàn)以及一些新興應(yīng)用，并討論未來高性能計算可能的發(fā)展方向?！睹嫦虼笠?guī)模應(yīng)用的高性能計算編程與優(yōu)化》主要面向?qū)ｉT從事高性能計算的程序員和工程師以及使用大規(guī)模異構(gòu)集群系統(tǒng)進行科學(xué)計算的科研人員，也可作為相關(guān)專業(yè)本科生和研究生的參考書。

作者簡介

　　文梅，女，國防科學(xué)技術(shù)大學(xué)計算機學(xué)院研究員，碩士生導(dǎo)師。長期從事超高性能加速器體系結(jié)構(gòu)、并行計算、媒體處理等研究。2011年在挪威Simula實驗室擔(dān)任客座科學(xué)家。近年來，主持及參與國家重大項目10余項，其中包括世界上64位流處理器FT64的研制、流處理系列國家自然科學(xué)基金項目（重點、面上、青年項目）、中挪合作項目等。目前研究興趣包括深度學(xué)習(xí)加速器以及相關(guān)圖像處理。在國際會議和期刊上以優(yōu)秀作者／通信作者身份發(fā)表論文20余篇，總計發(fā)表論文100余篇，其中SCI8篇，EI17篇。完成學(xué)術(shù)專著3部。柴俊，男，工程師，2014年獲得國防科學(xué)技術(shù)大學(xué)計算機學(xué)院博士學(xué)位，研究方向為并行編程、高性能科學(xué)計算、計算機系統(tǒng)結(jié)構(gòu)。蘇華友，男，助理研究員，2014年獲得國防科學(xué)技術(shù)大學(xué)計算機學(xué)院博士學(xué)位。研究方向為GPGPU并行計算、媒體處理等。董辛楠，女，助理工程師，2014年獲得國防科學(xué)技術(shù)大學(xué)計算機學(xué)院碩士學(xué)位。張春元，男，國防科學(xué)技術(shù)大學(xué)計算機學(xué)院教授，博士生導(dǎo)師，IEEE會員，享受國務(wù)院政府特殊津貼。長期從事計算機體系結(jié)構(gòu)、并行計算等領(lǐng)域研究和教學(xué)工作。研究領(lǐng)域主要涉及新型計算機系統(tǒng)結(jié)構(gòu)技術(shù)、高性能計算、嵌入式系統(tǒng)及應(yīng)用技術(shù)、并行與分布處理技術(shù)、Web應(yīng)用技術(shù)等。作為項目負(fù)責(zé)人和主要研究人員主持或參加的各類項目（包括國家自然科學(xué)基金、國家863高技術(shù)研究項目、國家973安全重大基礎(chǔ)研究項目、國家重點型號項目和對外合作等）共計20多項。發(fā)表高水平科研論文

圖書目錄

序
前言
第1章緒論
1．1 大規(guī)模應(yīng)用對高性能計算的迫切需求
1．2 高性能計算硬件基礎(chǔ)
1．2．1 多核通用處理器
1．2．2 眾核加速器
1．2．3 加速器增強型異構(gòu)系統(tǒng)
1．3 高性能計算編程挑戰(zhàn)與研究現(xiàn)狀
1．3．1 高性能計算編程挑戰(zhàn)
1．3．2 高性能計算編程研究現(xiàn)狀
參考文獻
第2章高性能計算并行基礎(chǔ)
2．1 并行計算分類
2．1．1 數(shù)據(jù)并行
2．1．2 任務(wù)并行
2．2 并行計算的度量
2．2．1 性能
2．2．2 擴展性
2．3 并行程序測試集
2．3．1 Linpack
2．3．2 13類基準(zhǔn)測試分類體系
2．3．3 其他測試集
參考文獻
第3章并行程序設(shè)計
3．1 共享存儲計算機
3．1．1 共享存儲體系結(jié)構(gòu)
3．1．2 OpenMP編程
3．1．3 實例
3．2 分布式存儲計算機
3．2．1 分布式存儲體系結(jié)構(gòu)
3．2．2 MPI消息傳遞機制
3．2．3 實例
3．3 大規(guī)模并行計算
3．3．1 混合編程模型
3．3．2 大規(guī)模系統(tǒng)節(jié)點問通信優(yōu)化
參考文獻
第4章 GPU并行計算
4．1 GPU體系結(jié)構(gòu)
4．1．1 GPU的發(fā)展歷程
4．1．2 GPU硬件體系結(jié)構(gòu)
4．2 CUDA編程模型
4．2．1 程序結(jié)構(gòu)
4．2．2 存儲模型
4．3 性能優(yōu)化
4．3．1 大規(guī)模線程并行
4．3．2 全局帶寬的利用
4．3．3 SM片上資源優(yōu)化
4．4 單節(jié)點多GPU編程
4．4．1 單線程多GPU編程
4．4．2 多線程多GPU編程
4．4．3 多GPU P2P直接通信模式
4．5 大規(guī)模CPU-GPU異構(gòu)計算
參考文獻
第5章 MIC并行計算
5．1 MIC體系結(jié)構(gòu)
5．1．1 MIC體系結(jié)構(gòu)概述
5．1．2 MIC計算核
5．1．3 MIC環(huán)形網(wǎng)絡(luò)
5．1．4 MIC存儲層次
5．2 MIC編程模式
5．2．1 offioad編程模式
5．2．2 native編程模式
5．2．3 底層編程接口
5．3 性能優(yōu)化策略
5．3．1 并行優(yōu)化
5．3．2 訪存優(yōu)化
5．3．3 通信優(yōu)化
5．4 節(jié)點內(nèi)多MIC并行計算
5．4．1 基于stencil計算的任務(wù)劃分
5．4．2 基于pragma卸載模式的優(yōu)化
5．4．3 基于系統(tǒng)級接口的卸載模式
5．4．4 基于MPI-OpenMP的對稱模式
5．4．5 不同卸載模式的比較
5．5 大規(guī)模CPU-MIC并行計算
5．5．1 大規(guī)模CPU-MIC異構(gòu)系統(tǒng)
5．5．2 基于MIC加速器的大規(guī)模異構(gòu)系統(tǒng)的編程模型
5．5．3 基于MIC加速器的大規(guī)模異構(gòu)系統(tǒng)的并行優(yōu)化
5．6 本章小結(jié)
參考文獻
第6章面向貝葉斯進化分析的大規(guī)模異構(gòu)混合計算
6．1 引言
6．2 背景
6．2．1 MrBayes概述
6．2．2 同時利用CPI_J和GPIJ的挑戰(zhàn)
6．3 方法
6．3．1 OMC3算法
6．3．2 負(fù)載劃分策略
6．4 結(jié)果和討論
6．4．1 實驗設(shè)置
6．4．2 單計算節(jié)點上的性能
6．4．3 驗證負(fù)載劃分策略
6．4．4 多節(jié)點擴展性
6．5 小結(jié)
參考文獻
第7章基于CPU-GPU異構(gòu)系統(tǒng)的雙巖沉降模擬
7．1 概述
7．2 數(shù)學(xué)模型和數(shù)值方法
7．3 并行實現(xiàn)設(shè)計
7．3．1 基于MPI的CPU-only實現(xiàn)
7．3．2 GPU-only實現(xiàn)
7．3．3 CPU-GPU混合實現(xiàn)
7．4 實驗評估與分析
7．4．1 實驗設(shè)置和結(jié)果
7．4．2 單GPU性能比較與分析
7．4．3 擴展性評測
7．4．4 時間分布
7．5 小結(jié)
參考文獻
第8章接近納米級精度的鈣動力模擬并行計算
8．1 引言
8．2 應(yīng)用描述
8．2．1 數(shù)學(xué)模型
8．2．2 數(shù)值方法
8．3 目標(biāo)體系結(jié)構(gòu)
8．4 實現(xiàn)和優(yōu)化
8．4．1 整體策略
8．4．2 單協(xié)處理器利用
8．4．3 單節(jié)點利用
8．4．4 多節(jié)點效率
8．5 性能研究
8．5．1 單協(xié)處理器性能
8．5．2 單節(jié)點性能
8．5．3 弱擴展性
8．5．4 強擴展性
8．6 模擬結(jié)果
8．7 小結(jié)
參考文獻
第9章未來的高性能計算
9．1 E級計算的挑戰(zhàn)
9．2 Scale up與Scale out的比較
9．3 未來可能的發(fā)展方向
9．3．1 大規(guī)模機器學(xué)習(xí)
9．3．2 熱點方向
參考文獻