数字图像处理:第二十章 视频编码与压缩
第二十章 視頻編碼與壓縮
目錄
1.??? 引言
2.??? 有運動補償的預測編碼
3.??? 運動估計算法
作業
1. 引言
??? 視頻信號具有巨大的數據量,例如:在不做任何壓縮的條件下,對于NTSC視頻信號的數字化傳輸需要每秒傳30楨720x480的8位象素,達248Mbps;而對于高清晰度視頻信號需要每秒傳30楨1920x1080的8位象素,高達1.5Gbps;對于35"電影膠片數字化需要4096x3112的10位象素表示,如果每秒傳輸24楨,則達9Gbps (1.15Gbyte per second)。為了有效地存儲和傳輸視頻信號,必須對視頻信號進行編碼壓縮。
??? 視頻是時變圖象圖象序列,是時空(spatial-temperal)信號,與靜態圖象相比不僅在空間上存在冗余,而且在時間上存在冗余。視頻的壓縮一方面可以利用圖象本身的空間相關性,還可以利用時間上的相關性。視頻編碼需要將楨內(intraframe)編碼和楨間(interframe)編碼混合起來達到高的壓縮率。楨內編碼即單幅圖象本身的編碼過程,通常采用DCT變換編碼方法,參見第十四章。楨間編碼可分為無運動補償的差分脈碼調制(DPCM)和有運動補償的差分脈碼調制。
2. 有運動補償的預測編碼
??? 楨內編碼通常是以宏塊為單位的DCT編碼,楨間編碼是在楨內編碼的基礎上進行的,在不同楨之間以對應的宏塊為對象進行DPCM編碼。所謂運動補償是指對宏塊在下一楨的位置做運動估計,將該運動估計用于確定下一楨對應宏塊的位置,再進行DPCM編碼,使編碼考慮了圖象的運動分量,即對運動做了補償,提高編碼效率。
??? 如下圖所示,對于大小為NxM的宏塊的運動估計是在參考圖象中一定的范圍內尋找最佳的匹配的過程[1]。這種估計方法實際上是假設宏塊內部象素具有同樣的運動參數,即平滑性約束條件。這只能是一種近似方法,宏塊越小平滑性就越好,但運動估計的可靠性也越差,因為匹配時考慮的象素數目就越少,另外尋找最佳匹配的快速算法對較大的宏塊比較有效??紤]到多種因素,在視頻壓縮標準中,N=M=16,而運動估計范圍對于視頻廣播來說,對于頭肩型的視頻節目p=15性能較好,而對于運動項目則p=63可以獲得較好的效果。
3. 運動估計算法
??? 運動估計中的匹配準則采用模板匹配方法,定義代價函數如下:
?????? 平均絕對誤差(MeanAbsolute Error):
??????
??? 運動估計是搜索一定范圍內使上述誤差最小的運動矢量的過程。運動估計算法是個搜索算法,有完全搜索、兩維對數搜索等多種不同的算法,差別主要在于計算量、精度和是否可以獲得最佳解。
3.1 完全搜索
最簡單的方法是完全搜索,可以保證得到最佳估計。對于楨率為F而大小為IxJ的視頻需要:
?(OPS: operation per second)
對于典型的廣播視頻(I=720, J=480, F=30),基于完全搜索的運動估計當p=15時需要29.89GOPS (Giga operations per second),當p=7時需要6.99GOPS??梢娺@種方法計算量很大。
3.2 兩維對數搜索
??? 兩維對數搜索與折半查找相似。第一步,將[-p,p]的搜索矩形分成兩個區域:一是內部的[-p/2,p/2](取整數)矩形,二是它之外的部分。進一步,我們僅在9個位置上:(0,0)點和[-p/2,p/2]矩形邊界上的8個主要點,計算各自的平均絕對誤差(MAE),而不是其整個區域。即若設這些點彼此的距離為d1,則我們從如下的9個點:(0,0),(0,d1),(0,-d1),(-d1,0),(d1,0),(d1,d1),(d1,-d1),(-d1,d1),(-d1,-d1),計算最小的MAE,距離d1由下式給出:
例如,當p=7時, k=3, d1=4。用目前最佳匹配的位置作為起點,通過計算位于d2= d1/2距離上的8個點獲得下一個最佳匹配位置。如此循環進行下去,直到第k次循環時距離為1個象素時為止。
??? 對于楨率為F而大小為IxJ的視頻需要:
?(OPS: operationper second)
對于典型的廣播視頻(I=720, J=480, F=30),基于兩維對數搜索的運動估計當p=15(k=4)時需要大致1GOPS,計算復雜性僅為完全搜索方法的3.3%。
??? 常用的三步對數搜索(TSS, Three-Step Search)過程如下圖所示,其中可,k=3,p=7 (對于視頻會議系統,p=7就可以獲得足夠好的性能):
??? 此外,還有許多其它運動估計方法,例如并行分層一維搜索(Parallel hierarchical one-dimensionalsearch (PHODS),分層運動估計等[1]。.
作業
參考文獻
1.?????VasudevBhaskaran, Konstantinos Konstantinides, Image and video compression standards:algorithms and architectures, Kluwer Academic Publishers, Boston, 1995.
2.??? 鐘玉琢,多媒體技術,(高級),清華大學出版社,1999。
3.??? A.M. Tekalp (崔之祜、江春、陳麗鑫 譯), Digital video processing, PrenticeHall 電子工業出版社,1998。
4.?????P.K.Andleigh, K. Thakrar (徐光佑、史元春譯),多媒體系統設計,Prentice Hall, 1998.
5.?????BorkoFurht, Stephen W. Smoliar, HongJiang Zhang, Video and image processing inmultimedia systems, Kluwer Academic Publishers, Boston ,1995.
返回主目錄返回本章目錄
清華大學計算機系 艾海舟
最近修改時間:2000年4月11日
出處:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/CourseImageProcess.html
總結
以上是生活随笔為你收集整理的数字图像处理:第二十章 视频编码与压缩的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数字图像处理:第十九章 立体视觉
- 下一篇: 数字图像处理:第二十一章 视频压缩标准