?。鹤髡吆喗椋汉拿溃╓en-mei W. Hwu) MulticoreWare公司聯(lián)合創(chuàng)始人兼CTO,現(xiàn)任美國伊利諾伊大學厄巴納-香檳分校(UIUC)電氣與計算機工程系教授,兼任并行計算研究中心(Microsoft和Intel聯(lián)合資助)首席科學家,以及全球CUDA卓越中心(NVIDIA資助)首席研究員。胡教授是IEEE和ACM會士,在編譯器設計、計算機體系結(jié)構(gòu)、微體系結(jié)構(gòu)和并行計算方面貢獻卓著。:譯者簡介:方娟北京工業(yè)大學計算機學院教授,計算機系統(tǒng)結(jié)構(gòu)系主任。長期從事計算機體系結(jié)構(gòu)領域的教學和科研工作,近年來致力于異構(gòu)多核體系結(jié)構(gòu)的研究。
圖書目錄
出版者的話
譯者序
推薦序
前言
作者簡介
第1章 引言 1
第2章 HSA 概述 5
2.1 GPU計算簡史:HSA解決的問題 5
2.2 HSA的支柱 9
2.2.1 HSA內(nèi)存模型 9
2.2.2 HSA排隊模型 9
2.2.3 HSAIL虛擬ISA 10
2.2.4 HSA上下文切換 10
2.3 HSA規(guī)范 10
2.3.1 HSA平臺系統(tǒng)體系結(jié)構(gòu)規(guī)范 10
2.3.2 HSA運行時規(guī)范 10
2.3.3 HSA程序員參考手冊—HSAIL SPEC 11
2.4 HSA軟件 11
2.5 HSA基金會 12
2.6 小結(jié) 13
第3章 HSAIL——虛擬并行ISA 14
3.1 引言 14
3.2 編譯流程示例 15
3.3 HSAIL執(zhí)行模型 16
3.4 HSAIL指令集簡介 17
3.4.1 原子操作 18
3.4.2 寄存器 18
3.4.3 分段 19
3.4.4 波前和通道 20
3.5 HSAIL機器模型和配置文件 21
3.6 HSAIL編譯流程 22
3.7 HSAIL編譯工具 23
3.7.1 編譯器框架 23
3.7.2 CL離線編譯 24
3.7.3 HSAIL匯編器/反匯編器 25
3.7.4 ISA和機器碼匯編器/反匯編器 25
3.8 小結(jié) 25
第4章 HSA運行時 26
4.1 引言 26
4.2 HSA核心運行時API 28
4.2.1 運行時的初始化和關閉 28
4.2.2 運行時的通知 29
4.2.3 系統(tǒng)和HSA代理信息 29
4.2.4 信號 30
4.2.5 隊列 31
4.2.6 體系結(jié)構(gòu)排隊語言 31
4.2.7 內(nèi)存 32
4.2.8 代碼對象和可執(zhí)行文件 34
4.3 HSA運行時擴展 35
4.3.1 HSAIL 終止化 35
4.3.2 圖像和采樣器 35
4.4 小結(jié) 37
參考文獻 38
第5章 HSA 內(nèi)存模型 39
5.1 引言 39
5.2 HSA內(nèi)存結(jié)構(gòu) 40
5.2.1 分段 41
5.2.2 平面尋址 42
5.2.3 共享虛擬尋址 42
5.2.4 所有權(quán) 43
5.2.5 圖像內(nèi)存 43
5.3 HSA內(nèi)存一致性基礎 43
5.3.1 背景:順序一致性 44
5.3.2 背景:沖突和競爭 45
5.3.3 單一內(nèi)存范圍的HSA內(nèi)存模型 45
5.3.4 多個內(nèi)存范圍的HSA內(nèi)存模型 48
5.3.5 內(nèi)存段 51
5.3.6 匯總:HSA競爭自由 51
5.3.7 附加觀察和注意事項 52
5.4 HSA內(nèi)存模型中的高級一致性 52
5.4.1 松弛原子 52
5.4.2 所有權(quán)和范圍界限 54
5.5 小結(jié) 54
參考文獻 55
第6章 HSA 排隊模型 56
6.1 引言 56
6.2 用戶模式隊列 56
6.3 體系結(jié)構(gòu)排隊語言 59
6.3.1 包的類型 60
6.3.2 創(chuàng)建數(shù)據(jù)包 63
6.4 包的提交與調(diào)度 64
6.5 小結(jié) 70
參考文獻 70
第7章 編譯器技術(shù) 71
7.1 引言 71
7.2 C++ AMP簡介 71
7.2.1 C++ AMP array_view 73
7.2.2 C++ AMP parallel_for_each或內(nèi)核調(diào)用 73