第1章 視頻業(yè)務
1.1 圖像與視頻
1.2 視頻業(yè)務
1.3 視頻信息源的特點
1.3.1 時變吞吐
1.3.2 時間依賴
1.3.3 雙向對稱
1.4 視頻信號的傳輸
1.4.1 視頻通信的基本模式[5,9]
1.4.2 適用于視頻傳輸?shù)木W絡性能參數(shù)
1.4.3 視頻傳輸對網絡的要求
參考文獻
第2章 視頻編碼技術的發(fā)展
2.1 概述
2.2 編碼方法的分類
2.3 基本編碼方法
2.3.1 熵編碼
2.3.2 變換編碼
2.3.3 預測編碼
2.3.4 矢量量化
2.3.5 實際編碼方案
2.4 編碼標準
2.4.1 JPEG
2.4.2 MPEG-1
2.4.3 MPEG-2
2.4.4 MPEG-4
2.4.5 H.261
2.4.6 H.263
2.5 討論
2.5.1 MPEG-7與MPEG-21
2.5.2 JPEG-2000
參考文獻
第3章 小波編碼技術
3.1 小波分析基礎
3.1.1 時頻局域化分析和連續(xù)小波變換
3.1.2 多分辨率分析
3.1.3 小波基的構造
3.1.4 離散小波變換的快速算法
3.2 小波變換編碼
3.2.1 小波圖像的特點
3.2.2 小波變換編碼的關鍵技術
參考文獻
第4章 基于感興趣區(qū)的人眼視覺特性
4.1 視覺掩蓋效應
4.1.1 靜態(tài)對比靈敏度[5~9]
4.1.2 動態(tài)對比靈敏度
4.1.3 分辨力
4.1.4 視覺惰性
4.1.5 Mach效應
4.2 視覺感興趣區(qū)
4.3 靜止圖像的質量評價
4.3.1 基本概念
4.3.2 質量評價模型
4.3.3 實驗結果
4.4 視頻序列的質量評價
4.4.1 基本概念
4.4.2 運動程度的描述方法
4.4.3 視頻序列的質量評價方法
4.4.4 實驗結果[17,19]
參考文獻
第5章 基于對象的視頻編碼
5.1 第二代視頻編碼技術
5.1.1 基于對象的視頻編碼的基本概念
5.1.2 基于對象的視頻編碼框架
5.2 基于對象的視頻編碼方法
5.2.1 MPEG-4的結構與語法
5.2.2 形狀編碼
5.2.3 運動信息編碼
5.2.4 紋理編碼
5.2.5 可分級擴展編碼
5.3 Sprite編碼
5.4 基于對象的視頻編碼應用之一:圖像/視頻中字符區(qū)域的定位
5.4.1 概述
5.4.2 定位算法
5.4.3 實驗結果及討論[17]
5.5 基于對象的視頻編碼應用之二:頭肩序列圖像的視頻編碼
參考文獻
第6章 人臉檢測
6.1 概述
6.2 人臉檢測的基本概念
6.3 Mosaic圖和橫紋目標提取
6.3.1 Mosaic圖
6.3.2 橫紋目標提取
6.4 復雜背景下的自動人臉檢測
6.4.1 預處理
6.4.2 粗檢
6.4.3 細檢
6.4.4 人臉檢測算法的總體流程
6.4.5 實驗結果
6.5 人臉檢測算法的改進
6.5.1 算法改進的思路
6.5.2 討論
參考文獻
第7章 人臉跟蹤
7.1 概述
7.2 數(shù)學形態(tài)學基礎
7.2.1 腐蝕和膨脹
7.2.2 開和閉
7.3 嘴區(qū)的確定與分割
7.3.1 檢測幀的嘴區(qū)確定
7.3.2 跟蹤幀的嘴區(qū)確定
7.3.3 嘴目標的分割
7.4 人臉的準確定位
7.4.1 人臉中軸線的求取
7.4.2 人臉準確定位
7.5 人臉的快速跟蹤
7.5.1 人臉跟蹤的快速算法
7.5.2 實驗結果
7.6 人臉跟蹤算法的改進
7.6.1 算法改進的思路
7.6.2 討論
參考文獻
第8章 頭肩序列圖像的小波編碼
8.1 概述
8.2 頭肩靜止圖像的小波編碼
8.2.1 編碼結構
8.2.2 矢量量化中的碼本設計
8.2.3 編碼過程
8.2.4 碼流結構設計
8.2.5 實驗結果
8.3 頭肩序列圖像的小波編碼
8.3.1 圖像組的結構
8.3.2 頭肩序列圖像的編碼與解碼
8.3.3 恢復圖像的拼接
8.3.4 實驗結果
8.4 討論
參考文獻
第9章 極低碼率的視頻編碼技術
9.1 H.263的基本框架
9.1.1 H.263標準概述
9.1.2 視頻源的格式
9.1.3 視頻編碼算法基礎
9.1.4 編碼策略
9.1.5 強制更新
9.1.6 起始碼的字節(jié)對齊
9.2 H.263的四個可選模式
9.2.1 非限制運動矢量模式
9.2.2 基于語法的算術編碼模式
9.2.3 先進預測模式
9.2.4 PB幀模式
9.3 H.263碼流的語法結構
9.3.1 圖像層
9.3.2 塊組層
9.3.3 宏塊層
9.3.4 塊層
參考文獻
第10章 增強的極低碼率的視頻編碼技術
10.1 一般性增強
10.1.1 視頻格式多樣化
10.1.2 擴大適用范圍
10.2 壓縮能力的提高
10.2.1 非限制運動矢量模式
10.2.2 高級幀內編碼模式
10.2.3 (增強)PB幀模式
10.2.4 交替幀間VLC選擇模式
10.3 抗誤碼能力的增強
10.3.1 分片結構模式
10.3.2 (增強)參考幀選擇模式
10.3.3 獨立分段解碼模式
10.3.4 數(shù)據(jù)分割模式
10.4 圖像主觀質量的改善
10.4.1 去方塊效應濾波器
10.4.2 降低分辨率更新模式
10.4.3 修正量化模式
10.5 可分級擴展編碼能力
10.5.1 時間域可分級擴展編碼
10.5.2 信噪比可分級擴展編碼
10.5.3 空間域可分級擴展編碼
10.6 典型的協(xié)議子集
參考文獻
第11章 低速率視頻傳輸中的抗誤碼技術
11.1 誤碼檢測與誤碼隱藏
11.1.1 誤碼檢測技術
11.1.2 誤碼隱藏技術
11.2 信源/信道的抗誤碼技術
11.2.1 分層編碼與分級傳輸
11.2.2 多描述編碼
11.2.3 信源/信道聯(lián)合編碼
11.2.4 魯棒編碼
11.2.5 傳輸層控制
11.3 交互式抗誤碼技術
11.3.1 選擇性編碼方法
11.3.2 自適應傳輸
11.4 MPEG-4中的差錯控制方法
11.5 實驗系統(tǒng)
11.5.1 實驗系統(tǒng)的構成
11.5.2 比特率控制技術與感興趣區(qū)優(yōu)先編碼策略
11.5.3 抗誤碼策略
11.6 討論
參考文獻
第12章 低速率視頻傳輸中的比特率控制
12.1 概述
12.2 圖像層比特率控制
12.2.1 設計策略
12.2.2 控制理論在圖像層比特率控制中的應用
12.3 宏塊層比特率控制
12.3.1 率失真模型
12.3.2 宏塊層比特率控制
12.4 感興趣區(qū)優(yōu)先編碼策略的實現(xiàn)
12.4.1 基本框架
12.4.2 感興趣區(qū)與非感興趣區(qū)之間的比特分配
12.4.3 感興趣區(qū)比特率控制方法
12.4.4 實驗結果及討論
參考文獻
第13章 基于H.324標準的可視電話系統(tǒng)
13.1 概述
13.2 可視電話系統(tǒng)的構成
13.2.1 系統(tǒng)框圖
13.2.2 功能子系統(tǒng)
13.2.3 關鍵技術的討論
13.3 視頻編碼中的幾種快速算法
13.3.1 運動估計技術
13.3.2 快速DCT變換
13.3.3 預先判零技術
13.4 MMX技術在H.263視頻編解碼中的應用
13.4.1 MMX技術
13.4.2 采用MMX技術的程序優(yōu)化
13.4.3 實驗結果
13.5 一個基于H.324標準的可視電話系統(tǒng)設計
13.5.1 基本結構與設計特點
13.5.2 視頻采集與編解碼
13.5.3 語音采集與編解碼
13.5.4 軟件模塊的設計
參考文獻
縮寫詞