Metal之探究理解视频渲染RGB与YUV颜色编码
生活随笔
收集整理的這篇文章主要介紹了
Metal之探究理解视频渲染RGB与YUV颜色编码
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、顏色編碼
① RGB 顏色編碼
- RGB 三個字母分別代表了 紅、綠、藍,這三種顏色作為三個基底顏色,將它們以不同的比例相加,可以產生多種多樣的顏色。
- RGB 圖像中,每個像素點都有紅、綠、藍三個基底顏色,其中每種原色都占用 8 bit,也就是一個字節(0-255),那么一個像素點也就占用 24 bit,也就是三個字節。
- 在圖像顯示中,一張 1280 * 720 大小的圖片,就代表著它有 1280 * 720 個像素點。其中每一個像素點的顏色顯示都采用 RGB 編碼方法,將 RGB 分別取不同的值,就會展示不同的顏色,就占用 1280 * 720 * 3 / 1024 / 1024 = 2.63 MB 存儲空間。
② YUV 顏色編碼
- YUV 是指亮度參量和色度參量分開表示的像素格式,而這樣分開的好處就是不但可以避免相互干擾,還可以降低色度的采樣率而不會對圖像質量影響太大。
- YUV 顏色編碼采用的是明亮度和色度來指定像素的顏色。
- Y表示明亮度(Luminance、Luma) U 和 V 表示色度(Chrominance、Chroma)而色度又定義了顏色的兩個方面:色調和飽和度。
-
- Y 通道數值越高,圖片則越亮;
-
- U 通道數值越高,顏色就越接近藍色;
-
- V 通道數值越高,顏色就越接近紅色。
- YUV 顏色編碼格式在默認情況下是圖像和視頻壓縮的標準。
- 和 RGB 表示圖像類似,每個像素點都包含 Y、U、V 分量。但是它的 Y 和 UV 分量是可以分離的,如果沒有 UV 分量一樣可以顯示完整的圖像,只不過是黑白的,如下圖所示:
- 對于 YUV 圖像來說,并不是每個像素點都需要包含了 Y、U、V 三個分量,根據不同的采樣格式,可以每個 Y 分量都對應自己的 UV 分量,也可以幾個 Y 分量共用 UV 分量。
二、RGB 與 YUV 的相互轉換
- 對于圖像顯示器來說,它是通過 RGB 模型來顯示圖像的,而在傳輸圖像數據時又是使用 YUV 模型,這是因為 YUV 模型可以節省帶寬。因此就需要采集圖像時將 RGB 模型轉換到 YUV 模型,顯示時再將 YUV 模型轉換為 RGB 模型。
- RGB 到 YUV 的轉換,就是將圖像所有像素點的 R、G、B 分量轉換到 Y、U、V 分量。公式如下:
Y = 0.299 * R + 0.587 * G + 0.114 * B
U = -0.147 * R - 0.289 * G + 0.436 * B
V = -0.615 * R - 0.515 * G - 0.100 * B - YUV 到 RGB 的轉換如下:
R = Y + 1.14 * V
G = Y - 0.39 * U - 0.58 * V
B = Y + 2.03 * U - 此時的轉換結束后,每個像素點都有完整的 Y、U、V 分量。而之前提到 Y 和 UV 分量是可以分離的,接下來通過不同的采樣方式,可以將圖像的 Y、U、V 分量重新組合。
- 不同采樣格式都是在一張圖像所有像素的 RGB 轉換到 YUV 基礎上進行的。
三、采樣方式
- YUV 的優點之一是,色度頻道的采樣率可比 Y 頻道低,同時不會明顯降低視覺質量。有一種表示法可用來描述 U 和 V 與 Y 的采樣頻率比例,這個表示法稱為 A:B:C 表示法。
① YUV 4:4:4 采樣
- 表示色度頻道沒有下采樣, 每個 Y 分量對應自己的 UV 分量。
- 其中的 Y、U、V 三個分量的采樣比例是相同的,所以每個像素點的分量信息都是完整的,每個分量占用 8bit,一個像素點占用 1 個字節。與 RGB 顏色編碼相比,并沒有節省帶寬,占用的存儲空間也沒有減少。
- 假設原始圖像的像素為(一對[]表示一個像素點):
[Y0, U0, V0]; [Y1, U1, V1]; [Y2, U2, V2]; [Y3, U3, V3]; - 將原始圖像像素按照YUV4:4:4采樣的碼流為(相對原始像素是原樣輸出):
Y0, U0, V0, Y1, U1, V1, Y2, U2, V2, Y3, U3, V3 - 最后映射還原的像素點 = 原始圖像的像素,為:
[Y0, U0, V0]; [Y1, U1, V1]; [Y2, U2, V2]; [Y3, U3, V3]; - 可以看到這種采樣方式的圖像和 RGB 顏色模型的圖像大小是一樣,并沒有達到節省帶寬的目的,當將 RGB 圖像轉換為 YUV 圖像時,也是先轉換為 YUV 4:4:4 采樣的圖像。
② YUV 4:2:2 采樣
- 表示 2:1 的水平下采樣,沒有垂直下采樣。
- 對于每兩個 U 樣例或 V 樣例,每個掃描行都包含四個 Y 樣例。
- 兩個 Y 分量共用一套 UV 分量,意味著 UV 分量是 Y 分量采樣的一半,Y 分量和 UV 分量按照 2 : 1 的比例采樣。如果水平方向有 4 個像素點,那么采樣了 4 個 Y 分量,而只采樣了 2 個 UV 分量。
- 每采樣一個像素點,都會采樣 Y 分量,而 U、V 分量則會間隔一個采集一個;
- 假設原始圖像的像素為(一對[]表示一個像素點):
[Y0, U0, V0]; [Y1, U1, V1]; [Y2, U2, V2]; [Y3, U3, V3]; - 將原始圖像像素按照 YUV4:2:2 采樣的碼流為:
Y0, U0, Y1, V1, Y2, U2, Y3, V3 - 最后映射還原的像素點為:
[Y0, U0, V1]; [Y1, U0, V1]; [Y2, U2, V3]; [Y3, U2, V3]; - 采樣的碼流映射為像素點,還是要滿足每個像素點有 Y、U、V 三個分量。但是可以看到,第一和第二像素點公用了 U0、V1 分量,第三和第四個像素點公用了 U2、V3 分量,這樣就節省了圖像空間。
③ YUV 4:2:0 采樣
- 表示 2:1 的水平下采樣,2:1 的垂直下采樣。 4個Y分量共用一套UV分量。
- YUV 4:2:0 采樣,并不是指只采樣 U 分量而不采樣 V 分量。而是指,在每一行掃描時,只掃描一種色度分量(U 或者 V),和 Y 分量按照 2 : 1 的方式采樣。
- 第一行掃描時,YU 按照 2 : 1 的方式采樣,那么第二行掃描時,YV 分量按照 2:1 的方式采樣。
- 對于每個色度分量來說,它的水平方向和豎直方向的采樣和 Y 分量相比都是 2:1 。
- 在田字格的 4 個像素點中,4 個 Y 分量共用了一套 UV 分量,如圖所示
- 假設原始圖像的像素為(一對[]表示一個像素點):
[Y0, U0, V0]; [Y1, U1, V1]; [Y2, U2, V2]; [Y3, U3, V3];
[Y5, U5, V5]; [Y6, U6, V6]; [Y7, U7, V7]; [Y8, U8, V8]; - 將原始圖像像素按照YUV4:2:0采樣的碼流為:
Y0, U0, Y1, Y2, U2, Y3,
Y5, V5, Y6, Y7, V7, Y8, - 最后映射還原的像素點為:
[Y0, U0, V5]; [Y1, U0, V5]; [Y2, U2, V7]; [Y3, U2, V7];
[Y5, U0, V5]; [Y6, U0, V5]; [Y7, U2, V7]; [Y8, U2, V7]; - 從映射出的像素點中可以看到,四個 Y 分量是共用了一套 UV 分量,而且是按照 2*2 的小方格的形式分布的,相比 YUV 4:2:2 采樣中兩個 Y 分量共用一套 UV 分量,這樣更能夠節省空間。
④ YUV 4:1:1 采樣
- 表示 4:1 的水平下采樣,沒有垂直下采樣。對于每個 U 樣例或 V 樣例,每個掃描行都包含四個 Y 樣例。
- 與其他格式相比,4:1:1 采樣不太常用,本文不對其進行詳細討論
四、YUV 存儲格式
① 平面格式與打包格式
YUV 格式可以分為打包格式和平面格式。在打包格式中,Y、U 和 V 組件存儲在一個數組中。像素被組織到了一些巨像素組中,巨像素組的布局取決于格式。在平面格式中,Y、U 和 V 組件作為三個單獨的平面進行存儲。
- planar 平面格式:
指先連續存儲所有像素點的 Y 分量,然后存儲 U 分量,最后是 V 分量。 - packed 打包模式:
指每個像素點的 Y、U、V 分量是連續交替存儲的。
② 基于 YUV 4:2:2 采樣的格式
常見的基于 YUV 4:2:2 采樣的格式如下:YUYV 格式、UYVY 格式、YUV 422P 格式。
- YUYV 格式
YUYV 格式是采用打包格式進行存儲的,指每個像素點都采用 Y 分量,但是每隔一個像素采樣它的 UV 分量,排列順序如下:
Y0 UO Y1 V0 Y2 U2 Y3 V2
(Y0 和 Y1 公用 U0 V0 分量,Y2 和 Y3 公用 U2 V2 分量….) - UYVY 格式
UYVY 格式也是采用打包格式進行存儲,它的順序和 YUYV 相反,先采用 U 分量再采樣 Y 分量,排列順序如下:
U0 Y0 V0 Y1 U2 Y2 V2 Y3
(Y0 和 Y1 公用 U0 V0 分量,Y2 和 Y3 公用 U2 V2 分量….) - YUV 422P 格式
YUV 422P 格式,又叫做 I422,采用的是平面格式進行存儲,先存儲所有的 Y 分量,再存儲所有的 U 分量,再存儲所有的 V 分量。
③ 基于 YUV 4:2:0 采樣的格式
- 基于 YUV 4:2:0 采樣的格式主要有 YUV 420P 和 YUV 420SP 兩種類型,每個類型又對應其他具體格式。
| YV12 格式 | NV12 格式 |
| YU12 格式 | NV21 格式 |
- YUV 420P 和 YUV 420SP 都是基于 Planar 平面模式 進行存儲的,先存儲所有的 Y 分量后, YUV420P 類型就會先存儲所有的 U 分量或者 V 分量,而 YUV420SP 則是按照 UV 或者 VU 的交替順序進行存儲了,具體查看看下圖:
- YUV420P 的格式:
五、RGB 與YUV 轉換矩陣的幾何含義
- YUV 與 RGB 的轉換公式不止一種,主要原因是具體格式下,標準不同,這里采用蘋果 Demo 中給出的轉換矩陣,其它轉換公式中,具體數值可能不同:
- 將上面向量與矩陣乘法寫成行列式形式,可能更符合大家的直覺:
- 可以發現,這個 YUV 轉 RGB 的公式其實是個線性變換,用幾何的方式表達就是說:
-
- 將一個 RGB 的顏色用 xyz 坐標表示,那么將這個坐標(旋轉、縮放、平移)之后,新的 xyz 坐標就可以表示 YUV 顏色值;
-
- 反之也是,將一個 YUV 顏色分量當做 xyz 坐標,那么將這個坐標逆向(旋轉、縮放、平移)之后,新的 xyz 坐標就可以表示 RGB 顏色值;
- 于是,可以在 3D 空間中畫一個邊長為 1 的正方體,后方左下角(0, 0, 0) 就代表黑色,前方右上角(1, 1, 1) 就代表白色,如下圖右下角立方體。同樣復制一個,并將其坐標用矩陣轉換到 YUV 空間,如下圖左上角傾斜的長方體。
- 對于 RGB 的立方體,比較簡單:它的 x 坐標越大,越往右方,顏色越紅;y 坐標越大,越往上方,顏色越綠;z 坐標越大,越往前方,顏色越藍。
- 而 YUV 的長方體,它的 x 坐標越大,越往右方,亮度越大;y 坐標越大,越往上方,顏色從黃到藍;z 坐標越大,越往前方,顏色從青綠到紅。
六、總結
- YUV4:4:4 中 Y、U、V 分量的采樣比例相同,既可以理解為原始圖像像素點原樣輸出,存儲空間沒有任何變化。
- YUV4:2:2 采樣格式,是指每采樣一個像素點,都會采樣 Y 分量,而 U、V 分量則會間隔一個采集一個,本質是通過左右相鄰像素點共用 U/V 分量。相比 RGB 顏色編碼格式,節省了 1/3 的存儲空間,同時節約了在傳輸時的帶寬。
- YUV4:2:0 采樣格式,是實際開發中最常用的顏色編碼格式,相比 YUV4:2:2 采樣格式,更能節省空間。是指在 2*2 的田字格中有 4 個像素點,其中 4 個 Y 分量共用一套 UV 分量,其本質是通過田字格的上下左右像素點共用 U/V 分量。
總結
以上是生活随笔為你收集整理的Metal之探究理解视频渲染RGB与YUV颜色编码的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Metal之MTLBuffer批量加载顶
- 下一篇: iOS之深入解析dispatch sou