注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學技術(shù)計算機/網(wǎng)絡計算機輔助設計與工程計算計算機輔助綜合高可用性系統(tǒng)設計

高可用性系統(tǒng)設計

高可用性系統(tǒng)設計

定 價:¥59.00

作 者: (美)Evan Marcus,(美)Hal Stern著;汪青青,盧祖英譯;汪青青譯
出版社: 清華大學出版社
叢編項:
標 簽: 系統(tǒng)分析與設計

ISBN: 9787302108658 出版時間: 2005-07-01 包裝: 平裝
開本: 23cm 頁數(shù): 426 字數(shù):  

內(nèi)容簡介

  本書介紹的專家級技術(shù)是傳授大家如何來設計具備最大可用性及可預測的當機時間的系統(tǒng)??紤]到公司的名譽和利益,在出現(xiàn)事故時,將本應24小時服務的站點關(guān)機并不是好的選擇。另外,低下的應用程序性能也是很令人煩惱的。本書的作者向大家介紹了如何設計可用性最大化的系統(tǒng)。本書包括以下內(nèi)容:·實施高效的備份-恢復與磁帶管理戰(zhàn)略;·使用磁盤陣列來避免由不可抗故障導致的當機;·使用諸如存儲區(qū)域網(wǎng)(SAN)、網(wǎng)絡連接存儲(NAS)、虛擬化和集群等技術(shù);·當部分系統(tǒng)出現(xiàn)故障時,高效地恢復應用程序;·通過網(wǎng)絡將關(guān)鍵數(shù)據(jù)復制到遠程系統(tǒng)。

作者簡介

  EvanMarcus是VERITASSoftware公司的總工程師和數(shù)據(jù)可用性專家。他從1992年起就參與高可用性系統(tǒng)的設計工作,當時他與其他人共同設計了第一個基于Sun的商業(yè)群集軟件的關(guān)鍵部分。他在一家華爾街大型金融機構(gòu)做過一段時間的股票交易廳系統(tǒng)管理員之后,又在VERITASSoftware做了4年的銷售工程師,咨詢和撰寫包括高可用性,集群和數(shù)據(jù)恢復等許多不同的問題。他為很多雜志和網(wǎng)站寫過文章,包括最近的TechTarget.com,他還是很多業(yè)界事件的很受尊敬的發(fā)言人。自從完成了本書第l版后,他還成為TheResilientEnterprise(VERITAS2002年出版的關(guān)于數(shù)據(jù)恢復的書,這是VERITAS出版的第一部包括業(yè)界作者合作的書)的編輯和特約編輯。Evan擁有利哈伊大學(LehighUniversity)計算機科學的學士學位,同時還是拉特斯哥大學(RutgersU:niversitv)的工商管理碩士。HalStern是SunMicrosvstems的副總裁和杰出的工程師。他是SunServices的首席技術(shù)官,負責高可靠系統(tǒng)和其

圖書目錄

第1章 介紹1
1.1 為什么需要一本可用性的書1
1.2 問題解決方法2
1.3 不包括的內(nèi)容3
1.4 我們的任務3
1.5 可用性指數(shù)4
1.6 總結(jié)4
1.7 本書的組織結(jié)構(gòu)5
1.8 要點6
第2章 測量數(shù)據(jù)7
2.1 測量可用性7
2.1.1 “9”表示法9
2.1.2 定義停機故障11
2.1.3 引起停機故障的原因11
2.1.4 可用性12
2.1.5 平均數(shù)14
2.1.6 可接受性15
2.2 故障模式16
2.2.1 硬件16
2.2.2 環(huán)境和物理故障17
2.2.3 網(wǎng)絡故障18
2.2.4 文件和打印服務器故障18
2.2.5 數(shù)據(jù)庫系統(tǒng)故障19
2.2.6 網(wǎng)頁和應用程序服務器故障20
2.2.7 拒絕服務攻擊21
2.3 對測量的信心22
2.3.1 可恢復性22
2.3.2 Sigma(σ)和“9”表示法23
2.4 要點24
第3章 可用性的價值25
3.1 高可用性的含義25
3.2 停機故障損失26
3.2.1 停機故障直接損失26
3.2.2 停機故障的間接損失27
3.3 可用性的價值30
3.3.1 例子1:雙節(jié)點群集配置33
3.3.2 例子2:未知的停機損失36
3.4 可用性變化區(qū)間37
3.5 可用性指數(shù)圖39
3.6 停機過程40
3.6.1 停機41
3.6.2 數(shù)據(jù)丟失42
3.6.3 降級模式43
3.6.4 預定停機44
3.7 要點46
第4章 可用性政治策略 47
4.1 開始游說47
4.1.1 從內(nèi)部著手47
4.1.2 然后走出去48
4.1.3 開始行動50
4.2 你的聽眾53
4.2.1 獲得聽眾53
4.2.2 了解聽眾53
4.3 表達信息53
4.3.1 幻燈演示54
4.3.2 報告54
4.4 傳遞信息之后55
4.5 要點57
第5章 20條關(guān)鍵的高可用性設計原則57
5.1 # 20:切勿貪便宜 58
5.2 # 19:不要想當然59
5.3 #18:消除單點故障60
5.4 #17:執(zhí)行安全61
5.5 #16:加強服務器的性能62
5.6 #15:留意速度63
5.7 #14:實施更改控制64
5.8 #13:時時備案65
5.9 #12:采用服務級協(xié)議65
5.10 #11:超前策劃66
5.11 #10:盡量多試驗67
5.12 # 9:隔離你的環(huán)境68
5.13 # 8:以史為鑒69
5.14 # 7:設計要留有余地70
5.15 # 6:選擇成熟的軟件70
5.16 # 5:選擇成熟可靠的硬件72
5.17 # 4:重新使用配置73
5.18 # 3:利用外部資源74
5.19 # 2:一步一個腳印75
5.20 #1:盡量簡單化……76
5.21 要點78
第6章 備份與恢復79
6.1 備份的基本規(guī)則79
6.2 備份能否真正提供高可用性81
6.3 對需要什么進行備份 81
6.3.1 對備份進行備份82
6.3.2 獲得異地備份82
6.4 備份軟件83
6.4.1 商業(yè)軟件還是自主研發(fā) 83
6.4.2 商業(yè)備份軟件實例83
6.4.3 商業(yè)備份軟件的特性84
6.5 備份性能86
6.5.1 提高備份性能:找出瓶頸86
6.5.2 解決性能問題90
6.6 備份類型93
6.6.1 增量備份93
6.6.2 數(shù)據(jù)庫增量備份95
6.6.3 縮短備份窗口90
6.6.4 熱備份90
6.6.5 數(shù)據(jù)越少,越省時間
(和空間)97
6.6.6 使用更多的硬件99
6.6.7 復雜的軟件特征101
6.7 處理備份磁帶和數(shù)據(jù)104
常規(guī)備份安全106
6.8 恢復106
恢復所需要的磁盤空間108
6.9 總結(jié)108
6.10 要點109
第7章 高度可用的數(shù)據(jù)管理110
7.1 四個基本原理110
7.1.1 磁盤發(fā)生故障的可能性111
7.1.2 磁帶盤上的數(shù)據(jù)111
7.1.3 保護數(shù)據(jù)111
7.1.4 確保數(shù)據(jù)的可達112
7.2 數(shù)據(jù)存儲和管理的六個獨立層次 112
7.3 磁盤硬件與連通性術(shù)語113
7.3.1 SCSI113
7.3.2 光纖通道 115
7.3.3 多路徑115
7.3.4 多主機116
7.3.5 磁盤陣列116
7.3.6 熱交換116
7.3.7 邏輯設備(LUN)和卷117
7.3.8 JBOD(就是一組磁盤)117
7.3.9 熱備件117
7.3.10 寫入高速緩存117
7.3.11 存儲區(qū)域網(wǎng)絡(SAN)117
7.4 RAID技術(shù)119
7.4.1 RAID的級別119
7.4.2 其他種類的RAID126
7.5 磁盤空間和文件系統(tǒng)131
7.5.1 大磁盤還是小磁盤 132
7.5.2 當LUN填滿時會出現(xiàn)什么
情況 132
7.5.3 管理磁盤和卷的可用性133
7.5.4 文件系統(tǒng)的恢復134
7.6 要點134
第8章 存儲區(qū)域網(wǎng)絡、網(wǎng)絡連接存儲與存儲虛
擬化136
8.1 存儲區(qū)域網(wǎng)絡136
8.1.1 選用SAN的理由138
8.1.2 SAN硬件設備簡介140
8.2 網(wǎng)絡連接存儲141
8.3 SAN與NAS比較142
8.4 存儲虛擬化145
8.4.1 選擇存儲虛擬化的理由145
8.4.2 存儲虛擬化的類型146
8.5 要點149
第9章 組網(wǎng)150
9.1 網(wǎng)絡故障分類151
9.1.1 網(wǎng)絡可靠性挑戰(zhàn)151
9.1.2 網(wǎng)絡故障模式152
9.1.3 物理設備故障153
9.1.4 IP層故障154
9.1.5 擁塞引起的故障155
9.2 構(gòu)建冗余網(wǎng)絡158
9.2.1 虛擬IP地址158
9.2.2 冗余網(wǎng)絡連接159
9.2.3 多重網(wǎng)絡的配置162
9.2.4 IP路由冗余164
9.2.5 網(wǎng)絡恢復模式選擇165
9.3 負載平衡和網(wǎng)絡重定向167
9.3.1 循環(huán)DNS167
9.3.2 網(wǎng)絡重定向168
9.4 動態(tài)IP地址170
9.5 網(wǎng)絡服務可靠性170
9.5.1 網(wǎng)絡服務依賴性171
9.5.2 強化核心服務173
9.5.3 拒絕服務攻擊174
9.6 要點176
第10章 數(shù)據(jù)中心和本地環(huán)境177
10.1 數(shù)據(jù)中心177
10.1.1 數(shù)據(jù)中心機架179
10.1.2 平衡安全性和可訪問性181
10.1.3 數(shù)據(jù)中心觀光182
10.1.4 異地主機設施183
10.2 電185
UPS185
10.3 線纜鋪設187
10.4 冷卻及環(huán)境問題189
10.5 系統(tǒng)命名慣例190
10.6 要點192
第11章 人與程序193
11.1 系統(tǒng)管理與修正193
11.1.1 維護計劃與步驟194
11.1.2 系統(tǒng)修正195
11.1.3 備用設備方針197
11.1.4 預防性維護198
11.2 供應商管理198
11.2.1 選擇關(guān)鍵的供應商199
11.2.2 與供應商合作201
11.2.3 在系統(tǒng)恢復中供應商的
角色202
11.3 安全性203
11.3.1 數(shù)據(jù)中心的安全205
11.3.2 病毒與蠕蟲205
11.4 文檔206
11.4.1 文檔的使用者207
11.4.2 文檔與安全208
11.4.3 檢查文檔208
11.5 系統(tǒng)管理員209
11.6 內(nèi)部擴增211
故障標識213
11.7 要點213
第12章 客戶端與用戶214
12.1 強化企業(yè)客戶端214
12.1.1 客戶端備份215
12.1.2 客戶端補給216
12.1.3 瘦客戶端217
12.2 容許數(shù)據(jù)服務故障218
12.2.1 文件服務器客戶端恢復218
12.2.2 數(shù)據(jù)庫應用程序恢復(Database Application Recovery)220
12.2.3 Web客戶端恢復(Web Client Recovery)221
12.3 要點223
第13章 應用程序設計224
13.1 應用程序恢復概覽225
13.1.1 應用程序的故障模式225
13.1.2 應用程序恢復技術(shù)226
13.1.3 更軟性的故障228
13.2 從系統(tǒng)故障中進行應用程序恢復228
13.2.1 虛擬內(nèi)存耗盡229
13.2.2 I/O 錯誤230
13.2.3 數(shù)據(jù)庫應用程序的重新
連接230
13.2.4 網(wǎng)路連通性231
13.2.5 重啟網(wǎng)絡服務232
13.2.6 網(wǎng)絡擁塞、重發(fā)和超時
設定233
13.3 內(nèi)部應用程序故障235
13.3.1 內(nèi)存訪問錯誤235
13.3.2 內(nèi)存濫用和恢復236
13.3.3 掛起進程237
13.4 開發(fā)人員“衛(wèi)生學”237
13.4.1 返回值檢查238
13.4.2 邊界條件檢查239
13.4.3 基于值的安全240
13.4.4 日志支持241
13.5 進程復制242
13.5.1 冗余服務進程243
13.5.2 進程狀態(tài)多路廣播244
13.5.3 檢查點技術(shù)245
13.6 不做假設,管理一切246
13.7 要點247
第14章 數(shù)據(jù)和Web服務248
14.1 網(wǎng)絡文件系統(tǒng)服務248
14.1.1 檢測RFC故障249
14.1.2 NFS服務器的約束250
14.1.3 文件鎖定252
14.1.4 失效文件句柄254
14.2 數(shù)據(jù)庫服務器255
14.2.1 管理恢復時間256
14.2.2 破壞之中求生存258
14.2.3 任何(高)速度下的不安
全狀態(tài)258
14.3 冗余和可用性260
多個實例對比更大的實例261
14.4 基于Web的服務可靠性262
14.4.1 Web服務器集群262
14.4.2 應用服務器264
14.4.3 目錄服務器266
14.4.4 Web服務標準267
14.5 要點268
第15章 本地群集和故障轉(zhuǎn)移270
15.1 群集技術(shù)簡介271
15.2 服務器故障和故障轉(zhuǎn)移273
15.3 邏輯性的以應用為中心的思想275
15.4 故障轉(zhuǎn)移的要求276
15.4.1 服務器278
15.4.2 服務器間的差異278
15.4.3 網(wǎng)絡280
15.4.4 磁盤286
15.4.5 應用程序289
15.5 大型群集289
15.6 要點290
第16章 故障轉(zhuǎn)移管理和難題291
16.1 故障轉(zhuǎn)移管理軟件291
16.2 部件監(jiān)控292
16.2.1 實施檢測的人和關(guān)于其他部件監(jiān)測的問題293
16.2.2 當部件檢測失敗時294
16.3 進行手工故障轉(zhuǎn)移的時機295
16.4 自主開發(fā)的故障轉(zhuǎn)移軟件還是商業(yè)
軟件?297
16.5 商業(yè)故障轉(zhuǎn)移管理軟件298
16.6 當好的故障轉(zhuǎn)移軟件出錯時299
16.6.1 腦裂綜合癥299
16.6.2 不受歡迎的故障轉(zhuǎn)移303
16.7 驗證和檢測304
16.7.1 狀態(tài)轉(zhuǎn)換圖304
16.7.2 測試作品306
16.8 管理故障轉(zhuǎn)移307
16.8.1 系統(tǒng)監(jiān)測307
16.8.2 控制臺307
16.8.3 工具308
16.8.4 時間問題309
16.9 其他群集話題309
16.9.1 復制數(shù)據(jù)群集309
16.9.2 群集之間的距離311
16.9.3 負載均衡群集和故障
轉(zhuǎn)移311
16.10 要點312
第17章 故障轉(zhuǎn)移結(jié)構(gòu)313
17.1 雙節(jié)點故障轉(zhuǎn)移結(jié)構(gòu)313
17.1.1 “主-從”故障轉(zhuǎn)移313
17.1.2 “主-主”故障轉(zhuǎn)移318
17.1.3 “主-主”還是
“主-從” 319
17.2 服務組故障轉(zhuǎn)移320
17.3 更大型的群集系統(tǒng)結(jié)構(gòu)322
17.3.1 N對1群集系統(tǒng)322
17.3.2 N加1 群集系統(tǒng)323
17.4 群集系統(tǒng)的規(guī)模應該有多大?325
17.5 要點356
第18章 數(shù)據(jù)復制327
18.1 復制概述327
18.2 進行復制的原因328
18.3 復制類型328
18.3.1 四類按延遲時間劃分的復
制類型328
18.3.2 五種按啟動程序劃分的
復制類型332
18.4 有關(guān)復制的其他思想345
18.4.1 SAN:復制的另一種方式345
18.4.2 多個目的地系統(tǒng)346
18.4.3 遠程應用程序故障轉(zhuǎn)移348
18.5 要點348
第19章 虛擬機和資源管理349
19.1 分區(qū)和域:系統(tǒng)級的VM350
19.2 容器:操作系統(tǒng)級的VM351
19.3 資源管理352
19.4 要點354
第20章 災難恢復計劃355
20.1 DR計劃的是與非356
20.2 DR計劃的3個主要目標356
20.2.1 員工的健康與保護356
20.2.2 企業(yè)的存活357
20.2.3 企業(yè)的連續(xù)性357
20.3 良好的DR計劃357
20.4 準備構(gòu)建DR計劃358
20.5 選擇DR現(xiàn)場 362
20.5.1 實際位置362
20.5.2 DR現(xiàn)場安全364
20.5.3 停留在DR現(xiàn)場的時間365
20.6 分發(fā)DR計劃365
20.6.1 DR計劃內(nèi)容365
20.6.2 分發(fā)措施366
20.7 計劃受眾367
20.8 時間線368
20.9 災難恢復小組任務指派369
20.9.1 指派人員369
20.9.2 管理層的角色369
20.10 DR計劃的多與寡370
20.11 共用DR現(xiàn)場371
20.12 裝備DR現(xiàn)場372
20.13 DR計劃的測試373
20.13.1 高質(zhì)量演習的特性374
20.13.2 演習計劃374
20.13.3 演習之后378
20.14 三種演習類型379
20.14.1 全面演練379
20.14.2 桌上演練379
20.14.3 電話鏈演練 380
20.15 災難對人員的影響 380
20.15.1 對災難的典型反應 380
20.15.2 企業(yè)應采取的措施 381
20.16 要點 382
第21章 彈性企業(yè)383
21.1 紐約期貨交易所383
21.1.1 第一次災難的發(fā)生 385
21.1.2 大型交易所決不該是
這樣的 386
21.1.3 對千年蟲問題的準備 388
21.1.4 9·11事件 390
21.1.5 恢復運行 391
21.1.6 混亂的交易環(huán)境 393
21.1.7 災難恢復現(xiàn)場的改進 395
21.1.8 新數(shù)據(jù)中心 396
21.1.9 新交易設施 397
21.1.10 未來的災難恢復計劃 397
21.1.11 技術(shù) 398
21.1.12 對人的影響 401
21.2 總結(jié) 402
第22章 未來技術(shù)展望403
22.1 iSCSI403
22.2 InfiniBand404
22.3 全部文件系統(tǒng)還原405
22.4 網(wǎng)格計算406
22.5 刀片計算407
22.6 全球存儲儲存庫408
22.7 自主的、基于政策的計算409
22.8 媒介410
22.9 軟件質(zhì)量和Byzantine可靠性411
22.10 業(yè)務連續(xù)性412
22.11 要點412
第23章 別語 413
23.1 我們怎么到達這里 413

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號