當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

mad的问题汇总

發(fā)布時間：2023/12/18 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 mad的问题汇总小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Q：我想將I幀的預(yù)測圖像和原始圖像的平均絕對誤差給輸出來，請問這個在JM86中需要在哪一點(diǎn)改動呢？謝謝 A：差值保存在diffy中： diffy[j][i] = imgY_org[img->opix_y+j][img->opix_x+i] - pred[j][i]; 分析MAD不知道程序中在哪求可以直接搜索"MAD“ 結(jié)果中有一個函數(shù)： img->MADofMB[img->current_mb_nr] = calc_MAD(); 就是這個了，進(jìn)去看一下： //calculate MAD for the current macroblock double calc_MAD() { int k,l; int s = 0; double MAD; for (k = 0; k < 16; k++) for (l = 0; l < 16; l++) s+= abs(diffy[k][l]); MAD=s*1.0/256; return MAD; } 剛好是根據(jù)diffy求MAD Q:看了很多的文獻(xiàn)，不論是經(jīng)典的二次R-Q模型，還是其它什么模型，其中總有一個用于表示編碼復(fù)雜度的變量，如二次R-Q模型中是MAD，有的模型中是SATD等，根據(jù)二次R-Q模型的源出文獻(xiàn)《Scalable Rate Control for MPEG-4 Video》，MAD的引入是為了使模型scalable with video content，但是為什么有這種效果卻沒有講。請教各位，MAD的引入的原因是為了什么，有什么數(shù)據(jù)來證明或文獻(xiàn)支持？謝謝高手賜教！ A:就是為了根據(jù)前一幀的復(fù)雜度來預(yù)測當(dāng)前幀的復(fù)雜度啊。我說的是R-Q模型中，引入了MAD，不是使用MAD的線性預(yù)測模型 A:《Scalable Rate Control for MPEG-4 Video》中最初得到的二次模型是一個碼率和QP之間的關(guān)系，但是實(shí)際中并不是QP越高，碼率就越小，不同的圖像復(fù)雜度不同，對得到的碼率也會有影響，因此，需要對原先的二次模型做一個修正，加入圖像復(fù)雜度這個因素。而對于為什么MAD可以近似代表圖像復(fù)雜度，我想不用我解釋了吧，自己好好想下就知道了。 Q:道理確實(shí)是如此，從二次模型的公式來看，對某個圖像，給定QP時，BIts/MAD就是一個常數(shù)，這意味著Bits和MAD就是線性關(guān)系，但從《Scalable Rate Control for MPEG-4 Video》中，并沒有看到相關(guān)的證明！ A:率失真模型中，一方面關(guān)心的是比特率與QP值（或量化步長）的關(guān)系，另外一方面關(guān)心的是比特率與圖像編碼復(fù)雜度之間的關(guān)系。假定QP值如果和編碼復(fù)雜度相互獨(dú)立的話，那么率失真模型應(yīng)當(dāng)相當(dāng)優(yōu)雅。但是實(shí)際的情況并非如此，特別是在H.264中。在MPEG-4及以前版本中，計算MAD的方法是用運(yùn)動估值后的殘差信息。這樣MAD值與比特之間確實(shí)存在一種線性關(guān)系（注意是線性，而不是正比），雖然在樓主提到的文獻(xiàn)Scalable Rate Control for MPEG-4 Video 中并沒有給出圖。為了方便，或者為了避免一些無法解決的問題，該文獻(xiàn)將MAD直接寫入了二次率失真模型中，作為正比項存在，并一直主導(dǎo)著視頻圖像編碼的碼率控制算法。在下通過大量的實(shí)驗(yàn)數(shù)據(jù)，繪制出了H.264中比特率與MAD的關(guān)系，甚至是預(yù)測MAD（JVT-G012線性預(yù)測方法）的關(guān)系圖。從圖中可以看到，在H.264中比特率與MAD的線性關(guān)系存在，但不明顯，而且線性截距很大，不可忽略。比特率與預(yù)測MAD的關(guān)系可以用不相關(guān)三個字來形容。個中特點(diǎn)，各自揣摩。談一點(diǎn)我個人的看法： MAD如果統(tǒng)計的是運(yùn)動估值后的殘差信息，確實(shí)可以直接理解為圖像的編碼復(fù)雜度。因?yàn)檫@個時候的MAD已經(jīng)帶有雙重特性：其一運(yùn)動估值，其二殘差。這個時候的MAD的表征對象就是馬上用于變換編碼和量化的基礎(chǔ)。很多早期的文獻(xiàn)對此都有評論，推導(dǎo)或改進(jìn)。但是如果MAD不能直接取到的話，再用MAD的任何預(yù)測形式來做圖像復(fù)雜度都是自欺欺人的做法。 “從二次模型的公式來看，對某個圖像，給定QP時，BIts/MAD就是一個常數(shù)” 從在下的若干實(shí)驗(yàn)看來，BIts/MAD不會是個常數(shù)。原因很簡單，BIts/（MAD+b）才是常數(shù)，b表示截距。我想 Scalable Rate Control for MPEG-4 Video 的作者是知道的，但是他不愿這樣做，所以沒有給出圖。另外特別注意，MAD和QP不獨(dú)立，在H.264中。十年放羊寫的“BIts/（MAD+b）才是常數(shù)”才是常數(shù)，這個很早就有文獻(xiàn)，就是在二次模型中那個常數(shù)項是不能省掉的，我也做了這方面的實(shí)驗(yàn)，MAD確實(shí)與QP有關(guān)系，而且關(guān)系應(yīng)該能用模型表示出來，應(yīng)該可以進(jìn)行理論推導(dǎo) Q:JM86中關(guān)了RDO后原始圖像和運(yùn)動預(yù)測補(bǔ)償后的MAD怎么突然變的很大？是什么原因，我覺得應(yīng)該變的小一點(diǎn)才是正確的為什么差別那么大，RDO開著的時候是1點(diǎn)多關(guān)掉的時候是 6點(diǎn)多，不一定RDO最準(zhǔn)確，RDO只是選擇使代價最小的點(diǎn)作為匹配點(diǎn)，不一定是最匹配的位置，應(yīng)該是開著RDO好一點(diǎn)，因?yàn)榭梢赃M(jìn)行模式選擇，對宏塊進(jìn)行細(xì)分 A:你說的對。RDO 最小并不是 MAD 最小。所以 RDO 跟 MAD 之間沒有規(guī)律性。 Q:在編碼中，P幀中也有使用幀內(nèi)預(yù)測模式來進(jìn)行預(yù)測編碼的，那么在計算該P(yáng)幀的MAD時，是否計算幀內(nèi)預(yù)測模式下編碼宏塊的MAD值？在JM配置文件中有沒有選項使編碼P幀時只使用幀間編碼模式，將幀內(nèi)編碼模式關(guān)掉，如果有是哪個參數(shù)呢？謝謝~~~~~ A:配置文件中沒有，JM86 可以強(qiáng)制修改 encode_one_macroblock 函數(shù)中的 valid 變量 Q:JSVM9.17中，jsvmCalcMAD好像不是計算的MAD，是SAD啊，程序如下 unsigned int MbEncoder::jsvmCalcMAD( IntMbTempData*& rpcMbBestData, MbDataAccess& rcMbDataAccess ) { UInt uiDist = 0; UInt uiDelta = 1; Int n, m; IntMbTempData *rpcMbTempData = new IntMbTempData; rpcMbTempData->init( rcMbDataAccess ); rpcMbTempData->loadLuma ( *m_pcIntOrgMbPelData ); rpcMbTempData->loadChroma ( *m_pcIntOrgMbPelData ); XPel* pucDst = rpcMbBestData->getMbLumAddr(); XPel* pucSrc = rpcMbTempData->getMbLumAddr(); Int iStride = rpcMbTempData->getLStride(); Int iDeltaXStride = uiDelta * iStride; AOF( iStride == rpcMbBestData->getLStride() ); for( n = 0; n < 16; n += uiDelta ) { for( m = 0; m < 16; m += uiDelta ) { uiDist += abs( pucSrc[m] - pucDst[m] ); } pucSrc += iDeltaXStride; pucDst += iDeltaXStride; } delete rpcMbTempData; return uiDist; } 最后的uiDist應(yīng)該再除以16*16才對吧 A:MAD,SAD都是衡量失真的準(zhǔn)則，其作用就是用來做比較如果每個塊的sad都要除以16x16以后再互相比大小，不覺得這很多余么 SAD足矣，這里的確是計算的SAD而不是MAD Q:在264的碼率控制中要用到MAD值，請問對于幀間和幀內(nèi)編碼的宏塊其MAD值分別是怎么計算的？我在JM代碼中看不太明白，有知道的朋友能給說說？謝謝了！ A: I幀和第一個P幀用固定的Qp，不進(jìn)行MAD值的預(yù)測，從第二個P幀開始，利用前一幀相同位置basic unit的MAD值線性預(yù)測當(dāng)前basic unit的MAD值 Q: 我的意思是實(shí)際MAD值是怎樣計算的？對于幀間編碼宏塊 MAD=（原宏塊像素值-運(yùn)動補(bǔ)償后的預(yù)測宏塊像素值）/256; 對于幀內(nèi)編碼宏塊 MAD=(原宏塊像素值-幀內(nèi)預(yù)測宏塊像素值）/256；我這樣理解對嗎？ A: 對，在JM86代碼的calc_MAD() 函數(shù)中 Q:都知道在二次模型中有MAD。但是為什么這里要用MAD。有沒有文獻(xiàn)或者數(shù)據(jù)的支持呢。為什么可以引入。無論是MAD還是SSD，有具體推導(dǎo)的過程嗎 A:為某幀編碼后大小也即Rate可以用MAD與QP的函數(shù)表達(dá), 即 RATE=function(MAD,QP)q Q:在計算QP的時候，有RD的二次關(guān)系。但是RD二次模型的基礎(chǔ)是圖像復(fù)雜度相似的情況。D可以由QP表達(dá)。引入MAD是為了讓圖像scalable。我想知道MAD引入有沒有嚴(yán)格的理論證明。 A:是針對 R=X1*Q^(-1)+X2*Q^(-2)這個式子對吧. X1,X2表征和圖像復(fù)雜度有關(guān)的變量, 實(shí)際操作中通過MAD計算, 我沒有記錯吧? 嗯....那個X1X2的部分我是有點(diǎn)記錯了, 不過幸好不是錯得很離譜, 式子應(yīng)該是R/MAD_predicted=X1*Q^(-1)+X2*Q^(-2) MAD是用來近似描述圖像復(fù)雜度的一個參數(shù) (scalable這個詞在這里怪怪的, 我不是很確定你用這個詞在這里的意思), 實(shí)際編碼不可能存在輸入任何源固定一個Q的情況下編出來的比特數(shù)都一樣嘛. 當(dāng)然是和源的復(fù)雜度有關(guān)的. 至于描述復(fù)雜度也可以用其他參數(shù), 如上面說的SSD. Q:Q:在JM的碼率控制中，函數(shù)calc_mad()是用來計算一個宏塊的MAD，而且這個函數(shù)encode_one_macroblock()中調(diào)用。我想使用前面已經(jīng)計算過的相鄰宏塊的MAD，那怎么得到它的值呢？可有數(shù)組儲存已經(jīng)計算出來的MAD的值？還有，在JVT-G012中，MAD線性模型是用來預(yù)測基本單元的MAD的，那它能和一個宏塊的MAD相加嗎？ A:當(dāng)然有存儲mad的數(shù)組了，自己跟蹤代碼，就能找到了。mad的和，本來就是為了計算每個bu的mad以及每幀的mad，當(dāng)然要把每個mad加起來了。不過單純的一個bu的mad加上一個不屬于該bu的宏塊的mad沒有什么意義。 Q:請教各位大俠，在碼率控制中有一部分要預(yù)測當(dāng)前基本單元的MAD。一開始我以為是整個BasicUnit 總的MAD，但我看了代碼后覺得好像是BasicUnit 中宏塊的MAD。請問到底怎么理解基本單元的MAD呢？ A:是整個 BasicUnit 的平均 MAD。也就是 BasicUnit 中所有 MB 的 MAD 求和再平均。提案里就是這么提的，就這么做就可以了。 (第二人解釋）最終得到的值,表示的是當(dāng)前恢復(fù)圖像的basic unit 與原始圖像中對應(yīng)的部分,平均每個像素值的差別. Q：在jvt-o12,jvt-h017提到的碼率控制算法中,幀層碼率控制和basic unit的碼率控制時都要由前一幀的mad來預(yù)測當(dāng)前的mad,提案中采用的是線性預(yù)測,即: pred_mad = C0xprev_mad + C1 pred_mad:預(yù)測的當(dāng)前幀mad; prev_mad:為前一幀的實(shí)際mad C0,C1為預(yù)測系數(shù); 每次幀編碼完成后,得到當(dāng)前幀的實(shí)際mad,更新C0,C1; 我的問題是更新C0,C1具體是如何進(jìn)行的. A：經(jīng)過研究,還是不知道具體采用的了理論是什么,不過看明白了代碼的做法.代碼做法是對于每個線性預(yù)測關(guān)系 pred_mad = C0xprev_mad + C1; 兩端乘以prev_mad ,得到 pred_madxpred_mad = C0xprev_madxpred_mad + C1xpred_mad; 以上兩式連立,寫成矩陣形式: B = AC; 其中 B為1x2,B0 = pred_mad,B1 = pred_madxpred_mad; A為2x2,A00 = 1,A01 = A10 = prev_mad,A11 = prev_madxprev_mad; C就是由待更新的C0,C1組成的1x2矩陣. 假設(shè)有n個A - B 的對應(yīng)關(guān)系,則可以得到n個Bi = AiC(i = 1,2,,,n),將這些等式相加,得到總的SUM(B) = SUM(A)C; 再由克來母公式計算出C. Q&A說過無數(shù)次了，跟代碼最接近的是 JVT-H017r3

總結(jié)

以上是生活随笔為你收集整理的mad的问题汇总的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：基于DirectShow的流媒体解码和回
下一篇： 8086汇编寄存器及指令汇总

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

mad的问题汇总

總結(jié)