数字图像处理:第二十一章 视频压缩标准
第二十一章視頻壓縮標(biāo)準(zhǔn)
目錄
作業(yè)
1. 引言
視頻壓縮標(biāo)準(zhǔn)是多媒體領(lǐng)域中的重要內(nèi)容,針對(duì)視頻會(huì)議、網(wǎng)絡(luò)通訊、數(shù)字廣播等廣泛的應(yīng)用場(chǎng)合制定了一系列的標(biāo)準(zhǔn),包括H.261, MPEG-1, MPEG-2等,目前正在制定的標(biāo)準(zhǔn)有, MPEG-4,, MPEG-7。
本章只簡(jiǎn)單地介紹其基本情況,詳細(xì)的內(nèi)容請(qǐng)參照數(shù)字視頻和多媒體方面的書籍[1][2][3]。
2. H.261標(biāo)準(zhǔn)
H.261是用于視頻會(huì)議和可視電話業(yè)務(wù)的以px64kbps, p=1,…,30的速率在綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)上傳送視頻信號(hào)的壓縮標(biāo)準(zhǔn)。例如,64kbps (p=1) 用于低端的可視電話業(yè)務(wù),其中視頻信號(hào)傳輸占用48 kbps的帶寬,剩下的16 kbps用于音頻信號(hào);384 kbps(p=6)或更高的速率用于高端的視頻會(huì)議業(yè)務(wù)。在ISDN信道上最高傳輸率為19.2Mbps (p=30),足以傳送VHS質(zhì)量的視頻信號(hào)。
H.261頒布于1990年,主要用于雙向視頻通信,允許的最大編碼延遲為150ms。它的輸入圖象格式為通用(同時(shí)適用于625線和525線的視頻標(biāo)準(zhǔn))中間格式CIF (352x288),低端可用其四分之一大小的QCIF (176x144)格式,楨率為30,15,10,7.5四種,隔行(interlaced)視頻,寬高比4:3。
H.261的編碼方案是基于DCT和DPCM的預(yù)測(cè)編碼算法,運(yùn)動(dòng)每楨圖象分成8x8的子塊,再組成宏塊、塊組,宏塊由4個(gè)8x8的亮度塊和2個(gè)8x8的色度塊組成,每個(gè)塊組由3x11個(gè)宏塊組成。每幅QCIF圖象有3個(gè)塊組,每幅CIF圖象有12個(gè)塊組,形成一個(gè)多層次的塊結(jié)構(gòu)。
H.263是在H.261的基礎(chǔ)上針對(duì)低碼率(低于64kbp)視頻壓縮提出的標(biāo)準(zhǔn),與H.261不同的是采用半象素精度運(yùn)動(dòng)補(bǔ)償算法和變長(zhǎng)編碼,并引進(jìn)了16種可協(xié)商的編碼選項(xiàng)用于提高壓縮性能和支持新增加的功能[2]。
3. MPEG-1標(biāo)準(zhǔn)
MPEG-1是1992年通過(guò)的視頻壓縮標(biāo)準(zhǔn),用于CIF格式的視頻在速率約1.5Mbps的各種數(shù)字存儲(chǔ)介質(zhì)(如CD-ROM,DAT,硬盤及光驅(qū)等)上的編碼表示,主要應(yīng)用在交互式多媒體系統(tǒng)中。
MPEG-1算法與H.261算法相似,另外有一些自己的特點(diǎn)。它在1.2Mbps(視頻信號(hào))速率下壓縮和解壓縮CIF格式的視頻質(zhì)量與VHS記錄的模擬視頻質(zhì)量相當(dāng)。它是一種通用標(biāo)準(zhǔn),在這個(gè)標(biāo)準(zhǔn)中,規(guī)定了編碼位流的表示語(yǔ)法和解碼方法,提供的支持操作有運(yùn)動(dòng)估計(jì)、運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)、DCT、量化和變長(zhǎng)編碼。與JPEG不同的是其中沒(méi)有定義產(chǎn)生合法數(shù)據(jù)流所需的詳細(xì)算法,為編碼器設(shè)計(jì)提供了大量的靈活性。MPEG-1的特點(diǎn)有:(1)隨機(jī)存取,(2)支持快速雙向搜索,(3)允許大約1秒的編碼/解碼延遲,比H.261的150ms內(nèi)的嚴(yán)格限制松得多。
MPEG-1采用了三種類型的圖象:楨內(nèi)圖I(intra-picture),預(yù)測(cè)圖P(Predicted picture),雙向預(yù)測(cè)圖B(Bidrectioanl prediction)。MPEG-1采用楨間運(yùn)動(dòng)補(bǔ)償以提高壓縮率。
MPEG-1是針對(duì)逐行視頻的,輸入視頻首先要轉(zhuǎn)換為MPEG-1標(biāo)準(zhǔn)輸入格式(SIF,352x240,30Hz),采用(Y,Cr,Cb)顏色空間,亮度和色度象素都是8位編碼。楨內(nèi)壓縮與JPEG類似.
楨間壓縮有兩種不同模式:
- P-圖象
參考前一楨I-圖象或P-圖象,使用運(yùn)動(dòng)補(bǔ)償前向預(yù)測(cè)編碼。
- B-圖象
B-圖象是MPEG-1的一個(gè)主要特點(diǎn),使用了運(yùn)動(dòng)補(bǔ)償內(nèi)插編碼技術(shù)。這可看作為時(shí)間多分辨率技術(shù),首先重構(gòu)I-圖象和P-圖象(通常占所有圖象的1/3),然后從重構(gòu)的I-圖象和P-圖象中插補(bǔ)剩余的圖象,產(chǎn)生的內(nèi)插誤差用DCT編碼。
MPEG-1的位流遵循一種層次的數(shù)據(jù)結(jié)構(gòu)[1],包括六層:塊、宏塊、切片、圖象、圖象組、序列。切片由宏塊組成,主要用于誤差恢復(fù);許多切片組成圖象,有I-圖象、P-圖象和B-圖象,此外還有D-圖象(僅包含DC分量,用于超低速率下提供瀏覽功能);由圖象組成圖象組,再由圖象組形成序列。
4. MPEG-2標(biāo)準(zhǔn)
MPEG-2是1993年通過(guò)的視頻壓縮標(biāo)準(zhǔn),用于高清晰度視頻和音頻的編碼,也包含用于可視電話中的超低碼率(8-32kbps)的壓縮編碼。MPEG-2是MPEG-1的兼容擴(kuò)展,廣泛應(yīng)用于各種速率(2-20Mbps)和各種分辨率情況下的場(chǎng)合。
MPEG-2不僅接受逐行掃描視頻,也可以接受隔行掃描視頻,高清晰度視頻,提供可伸縮調(diào)節(jié)的位流,提供改進(jìn)的量化和編碼選項(xiàng)。它包含了多個(gè)級(jí)別的分辨率:
5. MPEG-4標(biāo)準(zhǔn)
MPEG-4與MPEG-1和 MPEG-2標(biāo)準(zhǔn)區(qū)別在于它是基于內(nèi)容的壓縮編碼方法,它對(duì)一幅圖象按內(nèi)容切分為塊,將感興趣的物體從場(chǎng)景中分割出來(lái)進(jìn)行編碼,可以獲得高壓縮比效果,而且可以支持基于內(nèi)容的交互。MPEG-4引入視頻對(duì)象VO(Video Object)和視頻對(duì)象平面VOP(Video Object Plane)概念來(lái)表示內(nèi)容。視頻對(duì)象VO的構(gòu)成依賴于具體的應(yīng)用和實(shí)際系統(tǒng)所處的環(huán)境。VO的描述通過(guò)三類信息來(lái)實(shí)現(xiàn):運(yùn)動(dòng)信息、形狀信息和紋理信息。
MPEG-4 overview
參見(jiàn):賀玉文的報(bào)告:MPEG-4, MPEG-7簡(jiǎn)介
6. MPEG-7標(biāo)準(zhǔn)
MPEG-7的目的是定義“多媒體內(nèi)容描述接口”標(biāo)準(zhǔn)以支持基于內(nèi)容的視頻檢索。
MPEG-7 overview
參見(jiàn):賀玉文的報(bào)告:MPEG-4, MPEG-7簡(jiǎn)介
參考文獻(xiàn)
作業(yè)
返回主目錄返回本章目錄
清華大學(xué)計(jì)算機(jī)系 艾海舟
最近修改時(shí)間:2000年4月12日
出處:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/CourseImageProcess.html總結(jié)
以上是生活随笔為你收集整理的数字图像处理:第二十一章 视频压缩标准的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 数字图像处理:第二十章 视频编码与压缩
- 下一篇: 数字图像处理:第二十二章 基于模型的编码