第1章 緒論 1
1.1 機器視覺 1
1.2 應用問題 2
1.2.1 數(shù)字圖像 2
1.2.2 查詢圖像數(shù)據(jù)庫 3
1.2.3 檢查交叉支撐桿上的螺孔 3
1.2.4 診斷人腦內部 5
1.2.5 處理掃描的文本頁面 6
1.2.6 解釋積雪覆蓋 6
1.2.7 理解零件場景 7
1.3 圖像運算 8
1.3.1 鄰域運算 8
1.3.2 整幅圖像增強 9
1.3.3 多幅圖像運算 9
1.3.4 圖像特征計算 10
1.3.5 抽取非圖像表示 10
1.4 面臨的問題 11
1.5 計算機和應用軟件 11
1.6 相關領域 12
1.7 內容安排 12
1.8 參考文獻 12
1.9 附加習題 14
第2章 圖像生成與圖像表示 17
2.1 光線感測 17
2.2 成像設備 18
2.2.1 CCD攝像機 18
2.2.2 圖像形成 19
2.2.3 視頻攝像機 20
2.2.4 人眼 21
2.3 數(shù)字圖像中的問題* 21
2.3.1 幾何畸變 21
2.3.2 散射 21
2.3.3 光暈 21
2.3.4 CCD差異 22
2.3.5 削波與逆變 22
2.3.6 彩色畸變 22
2.3.7 量化效應 22
2.4 圖像函數(shù)與數(shù)字圖像 22
2.4.1 圖像類型 22
2.4.2 圖像量化與空間度量 24
2.5 數(shù)字圖像格式* 27
2.5.1 圖像文件頭 28
2.5.2 圖像數(shù)據(jù) 28
2.5.3 數(shù)據(jù)壓縮 28
2.5.4 常用圖像格式 28
2.5.5 游程編碼二值圖像 28
2.5.6 PGM格式 28
2.5.7 GIF格式 29
2.5.8 TIFF格式 30
2.5.9 JPEG格式 30
2.5.10 PostScript格式 30
2.5.11 MPEG格式 30
2.5.12 圖像格式比較 31
2.6 成像影響因素 31
2.7 從二維圖像到三維結構 32
2.8 5種參考坐標系 33
2.8.1 像素坐標系I 33
2.8.2 物體坐標系O 34
2.8.3 攝像機坐標系C 34
2.8.4 實際圖像坐標系F 34
2.8.5 世界坐標系W 34
2.9 其他類型的傳感器* 34
2.9.1 測微密度計 34
2.9.2 彩色圖像和多譜圖像 35
2.9.3 X射線 35
2.9.4 磁共振成像 36
2.9.5 距離掃描儀和深度圖像 36
2.10 參考文獻 38
第3章 二值圖像分析 39
3.1 像素與鄰域 39
3.2 圖像模板運算 40
3.3 目標計數(shù) 41
3.4 連通成分標記 42
3.4.1 遞歸標記算法 43
3.4.2 逐行標記算法 45
3.5 二值圖像形態(tài)學 49
3.5.1 結構元 49
3.5.2 基本運算 49
3.5.3 二值形態(tài)學的應用 51
3.5.4 條件膨脹 54
3.6 區(qū)域特征 54
3.7 區(qū)域鄰接圖 61
3.8 灰度級圖像閾值化 62
3.8.1 直方圖閾值選擇 62
3.8.2 自動閾值處理:Otsu方法* 63
3.9 參考文獻 66
第4章 模式識別 69
4.1 模式識別問題 69
4.2 分類模型 70
4.2.1 類別 70
4.2.2 傳感器/變換器 70
4.2.3 特征抽取算子 70
4.2.4 分類器 70
4.2.5 分類系統(tǒng)的建立 70
4.2.6 系統(tǒng)錯誤估計 71
4.2.7 誤報和漏報 72
4.3 查準率與查全率 72
4.4 特征表示 73
4.5 特征向量表示 74
4.6 分類器的實現(xiàn) 75
4.6.1 最近均值分類 75
4.6.2 最近鄰分類 76
4.7 結構方法 77
4.8 混淆矩陣 79
4.9 決策樹 79
4.10 貝葉斯決策 83
4.11 多維數(shù)據(jù)決策 87
4.12 機器學習 88
4.13 人工神經網絡* 88
4.13.1 感知器模型 88
4.13.2 多層前向網絡 91
4.14 參考文獻 94
第5章 圖像濾波與增強 95
5.1 圖像處理 95
5.1.1 改善圖像質量 95
5.1.2 檢測低層特征 95
5.2 灰度級映射 96
5.3 去除小圖像區(qū)域 99
5.3.1 去除鹽椒噪聲 99
5.3.2 去除小成分 100
5.4 圖像平滑 100
5.5 中值濾波 102
5.6 差分模板邊緣檢測 104
5.6.1 1D信號差分 104
5.6.2 2D圖像差分算子 107
5.7 高斯濾波與LOG邊緣檢測 111
5.7.1 LOG邊緣檢測 112
5.7.2 人類視覺的邊緣檢測 114
5.7.3 馬爾-海爾德斯理論 115
5.8 Canny邊緣檢測 116
5.9 匹配濾波模板* 117
5.9.1 向量空間 117
5.9.2 利用正交基 119
5.9.3 柯西-施瓦茨不等式 120
5.9.4 m×n圖像的向量空間 120
5.9.5 2×2鄰域的Robert基 120
5.9.6 3×3鄰域的Frei-Chen基 121
5.10 卷積和交叉相關* 124
5.10.1 模板運算定義 124
5.10.2 卷積運算 125
5.10.3 并行計算 128
5.11 正弦波空間頻率分析* 128
5.11.1 傅里葉基 128
5.11.2 2D圖像函數(shù) 131
5.11.3 離散傅里葉變換 132
5.11.4 帶通濾波器 134
5.11.5 傅里葉變換討論 135
5.11.6 卷積定理* 135
5.12 總結和討論 136
5.13 參考文獻 137
第6章 顏色與明暗分析 139
6.1 顏色物理學 139
6.1.1 感測被照射物體 140
6.1.2 其他因素 141
6.1.3 感受器的敏感性 141
6.2 RGB三基色 142
6.3 其他基色系統(tǒng) 143
6.3.1 CMY減色系統(tǒng) 143
6.3.2 HSI系統(tǒng) 144
6.3.3 電視信號的YIQ與YUV系統(tǒng) 146
6.3.4 基于顏色的分類 147
6.4 顏色直方圖 147
6.5 顏色分割 149
6.6 明暗分析 150
6.6.1 來自單一光源的照射 151
6.6.2 漫反射 151
6.6.3 鏡面反射 152
6.6.4 隨距離增大而變暗 153
6.6.5 復雜因素 154
6.6.6 phong明暗模型* 154
6.6.7 基于明暗的人類感知 155
6.7 相關話題* 155
6.7.1 顏色應用 155
6.7.2 人類的色感機制 155
6.7.3 多譜圖像 156
6.7.4 主題圖像 156
6.8 參考文獻 156
第 7章 紋理分析 159
7.1 紋理、紋理素和統(tǒng)計 159
7.2 基于紋理素的描述 160
7.3 定量紋理測度 161
7.3.1 邊緣密度和方向 161
7.3.2 局部二值分解 162
7.3.3 共生矩陣和特征 162
7.3.4 Laws紋理能量測度 164
7.3.5 自相關和功率譜 166
7.4 紋理分割 166
7.5 參考文獻 167
第8章 基于內容的圖像檢索 169
8.1 圖像數(shù)據(jù)庫實例 169
8.2 圖像數(shù)據(jù)庫查詢 170
8.3 示例查詢 171
8.4 圖像距離度量 171
8.4.1 顏色相似性度量 172
8.4.2 紋理相似性度量 174
8.4.3 形狀相似性度量 175
8.4.4 目標檢測及空間關系度量 179
8.5 數(shù)據(jù)庫組織 182
8.5.1 標準索引 182
8.5.2 空間索引 184
8.5.3 基于內容的多距離測度圖像索引 184
8.6 參考文獻 185
第9章 二維運動分析 187
9.1 運動現(xiàn)象及應用 187
9.2 圖像相減 188
9.3 計算運動向量 189
9.3.1 Decathlete游戲 190
9.3.2 點對應 191
9.3.3 MPEG視頻壓縮 194
9.3.4 圖像流計算* 195
9.3.5 圖像流方程* 195
9.3.6 利用傳播約束求解圖像流* 197
9.4 計算運動點路徑 197
9.5 檢測視頻中的顯著變化 202
9.5.1 視頻序列分割 203
9.5.2 忽略攝影特效 205
9.5.3 存儲視頻子序列 205
9.6 參考文獻 205
第10章 圖像分割 207
10.1 區(qū)域分割 207
10.1.1 聚類方法 208
10.1.2 區(qū)域增長 214
10.2 區(qū)域表示 215
10.2.1 覆蓋圖 215
10.2.2 標記圖像 216
10.2.3 邊界編碼 216
10.2.4 四叉樹 217
10.2.5 特征表 217
10.3 輪廓分割 218
10.3.1 區(qū)域邊界跟蹤 218
10.3.2 Canny邊緣檢測和連接 220
10.3.3 相鄰連貫的邊緣生成曲線 223
10.3.4 用霍夫變換檢測直線和圓弧 225
10.4 線段擬合模型 231
10.5 識別更高層結構 235
10.5.1 條帶檢測 235
10.5.2 角點檢測 236
10.6 運動一致性分割 237
10.6.1 時空邊界 237
10.6.2 運動軌跡聚類 237
10.7 參考文獻 239
第11章 2D匹配 241
11.1 2D數(shù)據(jù)配準 241
11.2 點的表示 242
11.2.1 參考坐標系 242
11.2.2 齊次坐標 243
11.3 仿射映射函數(shù) 243
11.3.1 縮放 243
11.3.2 旋轉 244
11.3.3 正交和標準正交變換* 245
11.3.4 平移 245
11.3.5 旋轉、縮放和平移 245
11.3.6 仿射變形實例 246
11.3.7 目標識別與定位實例 247
11.3.8 一般仿射變換* 249
11.4 最佳2D仿射變換* 250
11.5 仿射映射法2D目標識別 251
11.5.1 局部特征焦點法 252
11.5.2 位姿聚類 254
11.5.3 幾何散列 256
11.6 相關匹配法2D目標識別 259
11.6.1 解釋樹 260
11.6.2 離散松弛 262
11.6.3 連續(xù)松弛* 264
11.6.4 相關距離匹配 266
11.6.5 相關索引 269
11.7 非線性變形 269
11.7.1 徑向畸變矯正 271
11.7.2 多項式映射 272
11.8 總結 272
11.9 參考文獻 272
第12章 2D圖像中的3D信息 275
12.1 本征圖像 275
12.2 線條圖標記 278
12.3 2D圖像中的3D線索 283
12.4 其他3D現(xiàn)象 286
12.4.1 從X恢復形狀 286
12.4.2 消隱點 289
12.4.3 根據(jù)焦距變化求深度 289
12.4.4 運動現(xiàn)象 290
12.4.5 邊界和虛擬線 290
12.4.6 非偶然對齊 290
12.5 透視成像模型 291
12.6 通過立體視覺求深度 293
12.7 薄透鏡方程* 297
12.8 總結性討論 300
12.9 參考文獻 300
第13章 3D感知與目標位姿計算 303
13.1 一般體視結構 303
13.2 3D仿射變換 304
13.2.1 坐標系 305
13.2.2 平移 306
13.2.3 縮放 306
13.2.4 旋轉 306
13.2.5 任意旋轉 308
13.2.6 基于變換的比對 309
13.3 攝像機模型 311
13.3.1 透視變換矩陣 311
13.3.2 正投影與弱透視投影 314
13.3.3 基于多攝像機的3D點計算 315
13.4 最佳仿射標定矩陣 317
13.4.1 標定物 317
13.4.2 最小二乘問題 317
13.4.3 仿射方法討論 321
13.5 使用結構光 322
13.6 簡單的位姿估計過程 323
13.7 改進的攝像機標定法* 327
13.7.1 攝像機內部參數(shù) 327
13.7.2 攝像機外部參數(shù) 328
13.7.3 標定舉例 331
13.8 位姿估計* 334
13.8.1 2D-3D點對應求位姿 334
13.8.2 約束線性最優(yōu)化 335
13.8.3 計算變換Tr={R,T} 336
13.8.4 位姿驗證和位姿最優(yōu)化 337
13.9 3D目標重建 338
13.9.1 數(shù)據(jù)獲取 338
13.9.2 視圖配準 340
13.9.3 表面重建 341
13.9.4 空間切割算法 341
13.10 從明暗恢復形狀 343
13.10.1 光度立體 345
13.10.2 結合空間約束 346
13.11 從運動恢復結構 346
13.12 參考文獻 348
第14章 3D模型和匹配 351
14.1 模型表示 351
14.1.1 3D網格模型 351
14.1.2 表面-邊-頂點模型 352
14.1.3 廣義圓柱體模型 353
14.1.4 八叉樹 354
14.1.5 超二次曲面模型 355
14.2 實際3D模型與視類模型 356
14.3 物理學模型和可變形模型 357
14.3.1 蛇形活動輪廓模型 357
14.3.2 3D氣球模型 360
14.3.3 建立心臟跳動模型 361
14.4 3D目標識別范例 361
14.4.1 幾何模型比對匹配 362
14.4.2 關系模型匹配 367
14.4.3 功能模型匹配 372
14.4.4 基于外觀的識別 374
14.5 參考文獻 379
第15章 虛擬現(xiàn)實 383
15.1 虛擬現(xiàn)實系統(tǒng)的特征 383
15.2 虛擬現(xiàn)實的應用 384
15.2.1 建筑漫游 384
15.2.2 飛行仿真 384
15.2.3 解剖組織的交互式分割 384
15.3 增強現(xiàn)實 385
15.4 遙操作 386
15.5 虛擬現(xiàn)實設備 388
15.5.1 頭戴式顯示器 389
15.5.2 虛擬靈巧手術 390
15.5.3 立體顯示設備 390
15.6 虛擬現(xiàn)實感知設備 391
15.6.1 視覺 391
15.6.2 聽覺 391
15.6.3 位姿 391
15.6.4 觸覺 391
15.6.5 運動覺 391
15.7 簡單3D模型繪制 392
15.8 實際圖像和合成圖像融合 393
15.9 人機交互與心理問題 395
15.10 參考文獻 395
第16章 案例研究 397
16.1 Veggie Vision系統(tǒng) 397
16.1.1 應用場合和要求 397
16.1.2 系統(tǒng)設計 398
16.1.3 識別過程 398
16.1.4 詳細分析 399
16.1.5 性能分析 400
16.2 基于虹膜的身份識別 401
16.2.1 對識別系統(tǒng)的要求 401
16.2.2 系統(tǒng)設計 402
16.2.3 系統(tǒng)性能 404
16.3 參考文獻 405
索引 407