注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)軟件與程序設(shè)計高性能計算的問題解決之道:Linux態(tài)勢感知方法、實用工具及實踐技巧

高性能計算的問題解決之道:Linux態(tài)勢感知方法、實用工具及實踐技巧

高性能計算的問題解決之道:Linux態(tài)勢感知方法、實用工具及實踐技巧

定 價:¥79.00

作 者: [美] 伊戈爾·盧布希斯(Igor Ljubuncic) 著;張文力譯 譯
出版社: 機械工業(yè)出版社
叢編項: 高性能計算技術(shù)叢書
標(biāo) 簽: LINUX 操作系統(tǒng)/系統(tǒng)開發(fā) 計算機/網(wǎng)絡(luò)

ISBN: 9787111589785 出版時間: 2018-02-01 包裝: 平裝
開本: 16開 頁數(shù): 253 字數(shù):  

內(nèi)容簡介

  本書由Intel架構(gòu)師撰寫,創(chuàng)造性地采用Linux態(tài)勢感知方法來解決高性能計算的問題,涵蓋技術(shù)、監(jiān)控和配置管理等多個方面。書中針對大規(guī)模數(shù)據(jù)中心、云平臺架構(gòu)和高性能計算環(huán)境,建立了一套基于統(tǒng)計工程和實驗設(shè)計的方法論,從識別問題和理解問題,到再現(xiàn)問題和解決問題,一步一步地排除故障,形成了一套高效的工作流程。書中包含大量實戰(zhàn)案例和代碼,并介紹了不同工具的使用技巧,適合從事高性能計算相關(guān)工作的技術(shù)人員和管理人員參考。

作者簡介

暫缺《高性能計算的問題解決之道:Linux態(tài)勢感知方法、實用工具及實踐技巧》作者簡介

圖書目錄

Contents 目  錄
譯者序
前 言
致 謝
引言 數(shù)據(jù)中心與高端計算 1
數(shù)據(jù)中心一覽 1
現(xiàn)代數(shù)據(jù)中心布局 1
歡迎來到BORG,抵抗是徒勞的 2
那就是力量 2
企業(yè)與Linux 2
經(jīng)典的辦公室 2
Linux計算環(huán)境 3
Linux云 3
10000個1不等于10000 3
問題的非線性擴展 3
大數(shù)定律 4
同質(zhì)化 4
企業(yè)的當(dāng)務(wù)之急 4
7天24小時全天候開放 5
任務(wù)危急 5
停機時間等于金錢 5
千里之堤潰于蟻穴 5
參考文獻 5
第1章 你有問題嗎 6
問題的識別 6
如果森林里有一棵樹倒下,沒人能聽到 6
一步一步地識別 7
總是優(yōu)先使用簡單工具 7
過多的知識導(dǎo)致誤區(qū) 9
問題的定義 9
當(dāng)前發(fā)生或可能的問題 10
停機規(guī)模和嚴重性與業(yè)務(wù)需求 11
已知與未知 13
問題的再現(xiàn) 13
你能隔離問題嗎 13
偶發(fā)性問題需要特殊處理 14
計劃如何控制混亂 14
放手是最難的事 15
因與果 16
不要流連于癥狀 16
先有雞還是先有蛋 16
嚴格控制環(huán)境改變,直到你理解了問題的本質(zhì) 18
如果改變,確保你知道預(yù)期結(jié)果是什么 18
結(jié)論 19
參考文獻 19
第2章 開始研究 20
隔離問題 20
推動從生產(chǎn)到測試 20
重新運行獲得結(jié)果所需的最小集 21
忽略偏見信息,避免假設(shè) 21
與健康系統(tǒng)和已知參考的比較 22
那不是程序錯誤,而是一個特性 22
將預(yù)期結(jié)果與正常系統(tǒng)作比較 23
性能和行為的參考是必需的 24
對變化的線性與非線性響應(yīng) 24
一次一個變量 25
線性復(fù)雜度的問題 25
非線性問題 25
響應(yīng)可能會延遲或掩蓋 25
Y到X而不是X到Y(jié) 26
組件搜索 26
結(jié)論 26
第3章 基礎(chǔ)研究 27
刻畫系統(tǒng)狀態(tài) 27
環(huán)境監(jiān)控 27
機器可訪問性、響應(yīng)性和正常
運行時間 27
本地和遠程登錄以及管理控制臺 29
喊狼來了的監(jiān)控 29
讀取系統(tǒng)信息和日志 30
使用ps和top 30
系統(tǒng)日志 36
進程記賬 39
檢查命令執(zhí)行的模式 40
與問題表現(xiàn)相關(guān) 41
避免快速的結(jié)論 41
統(tǒng)計作為輔助 41
vmstat 41
iostat 43
系統(tǒng)活動報告(SAR) 47
結(jié)論 49
參考文獻 50
第4章 深入探討系統(tǒng) 51
使用/proc 51
層次 52
每個進程的變量 52
內(nèi)核數(shù)據(jù) 56
進程空間 60
檢查內(nèi)核可調(diào)參數(shù) 63
sys子系統(tǒng) 63
內(nèi)存管理 64
文件系統(tǒng)管理 65
網(wǎng)絡(luò)管理 65
SunRPC 66
內(nèi)核 67
sysctl 69
結(jié)論 70
參考文獻 70
第5章 變身極客——跟蹤和調(diào)試應(yīng)用 72
使用strace和ltrace 72
strace 72
ltrace 86
結(jié)合兩種工具獲得最佳結(jié)果 87
其他工具 90
使用perf 93
介紹 93
為什么不用OProfile 94
前提 94
基本使用 94
基礎(chǔ)實例 99
高級實例 103
小結(jié) 107
使用gdb 107
介紹 107
前提 108
簡單實例 108
不那么簡單的實例 113
其他有用的命令 122
結(jié)論 124
參考文獻 124
第6章 極客進級——應(yīng)用和內(nèi)核核心、內(nèi)核調(diào)試器 126
收集應(yīng)用核心 126
如何轉(zhuǎn)儲應(yīng)用核心 127
收集內(nèi)核核心(Kdump) 132
Kdump服務(wù)概覽 133
Kdump配置 137
測試配置 143
Kdump網(wǎng)絡(luò)轉(zhuǎn)儲功能 145
Kdump使用 146
小結(jié) 147
崩潰分析(crash) 147
前提 147
運行crash 148
內(nèi)核崩潰核心分析 156
超級極客技能:C代碼分析 167
小例子 168
中級例子 172
困難的例子 176
內(nèi)核崩潰的bug報告 182
崩潰分析結(jié)果 184
內(nèi)核bug與硬件錯誤 185
小結(jié) 186
內(nèi)核調(diào)試器 186
內(nèi)核編譯 186
進入調(diào)試器 187
基本命令 187
小結(jié) 189
結(jié)論 189
參考文獻 189
第7章 問題的解決方案 191
如何處理收集到的數(shù)據(jù) 191
文檔 191
數(shù)據(jù)的雜亂 193
最佳實踐 195
搜索引擎、郵件列表以及供應(yīng)商支持 202
找到根本原因 203
消除問題 204
實現(xiàn)和跟蹤 206
結(jié)論 207
參考文獻 208
第8章 監(jiān)控和預(yù)防 209
監(jiān)控什么數(shù)據(jù) 209
過多的數(shù)據(jù)比沒有數(shù)據(jù)更糟 209
Y到X將定義你所需要的監(jiān)控 210
不要害怕改變 210
如何監(jiān)控和分析趨勢 211
設(shè)置你關(guān)心的監(jiān)控 211
監(jiān)控不等于報告 212
不監(jiān)控隨機指標(biāo) 212
定義數(shù)學(xué)趨勢 213
如何應(yīng)對趨勢 215
當(dāng)它來得太晚 216
內(nèi)務(wù)管理 217
預(yù)防是解決問題的關(guān)鍵 217
配置審核 218
為什么審核有用 218
控制環(huán)境的變化 219
安全方面 219
系統(tǒng)數(shù)據(jù)收集工具 219
定制工具 220
商業(yè)支持 220
結(jié)論 221
參考文獻 221
第9章 讓你的環(huán)境更安全、更健壯 222
版本控制 222
為什么需要版本控制 222
Subversion、Git及相關(guān)軟件 223
簡單回滾 223
配置管理 223
變懶:自動化 224
大環(huán)境下的熵 225
掌控混亂 225
配置管理軟件 225
環(huán)境中引入變化的正確方法 226
一次一個變化 226
不要急著沖到截止時間 227
理解影響 228
沒報告問題意味著什么都沒有 228
連鎖反應(yīng) 228
結(jié)論 229
參考文獻 229
第10章 微調(diào)系統(tǒng)性能 230
日志大小與日志輪轉(zhuǎn) 230
系統(tǒng)日志會一直增長 230
慢點,倒帶 232
確定消息的內(nèi)容 232
文件系統(tǒng)調(diào)優(yōu) 234
Ext3/4文件系統(tǒng) 234
XFS文件系統(tǒng) 235
sysfs文件系統(tǒng) 236
層次 236
blo

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號