當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

背景建模与前景检测3(Background Generation And Foreground Detection Phase 3)

發布時間：2025/7/25 编程问答 13 豆豆

生活随笔收集整理的這篇文章主要介紹了背景建模与前景检测3(Background Generation And Foreground Detection Phase 3) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

背景建模與前景檢測之三(Background Generation And Foreground Detection Phase 3)

作者：王先榮

??? 在上一篇文章里，我嘗試翻譯了《Nonparametric Background Generation》，本文主要介紹以下內容：如何實現該論文的算法，如果利用該算法來進行背景建模及前景檢測，最后談談我的一些體會。為了使描述更加簡便，以下將該論文的算法及實現稱為NBGModel。
1 使用示例
??? NBGModel在使用上非常的簡便，您可以仿照下面的代碼來使用它：

//初始化NBGModel對象
NBGModel nbgModel = new NBGModel(320, 240);
//訓練背景模型
nbgModel.TrainBackgroundModel(historyImages);
//前景檢測
nbgModel.Update(currentFrame);
//利用結果
pbResult.Image = nbgModel.ForegroundMask.Bitmap;
//釋放對象
nbgModel.Dispose();

下面是更加完整的示例：

更加完整的示例

2 實現NBGModel
????2.1 我在實現NBGModel的時候基本上跟論文中的方式一樣，不過有以下兩點區別：
（1）論文中的MeanShift計算使用了Epanechnikov核函數，我使用的是矩形窗形式的MeanShift計算。主要是因為我自己不會實現MeanShift，只能利用OpenCV中提供的cvMeanShift函數。這樣做也有一個好處——不再需要計算與保存典型點。
（2）論文中的方法在檢測的過程中聚集中心會不斷的增加，我模仿CodeBook的實現為其增加了一個清除消極聚集中心的ClearStable方法。這樣可以在必要的時候將長期不活躍的聚集中心清除掉。

????2.2 NBGModel中用到的數據成員如下所示：
??????? private int width;????????????????????????????????????????? //圖像的寬度
??????? private int height;???????????????????????????????????????? //圖像的高度
??????? private NBGParameter param;???????????????????????????????? //非參數背景模型的參數

??????? private List<Image<Ycc, Byte>> historyImages = null;??????? //歷史圖像：列表個數為param.n，在更新時如果個數大于等于param.n，刪除最早的歷史圖像，加入最新的歷史圖像
??????? //由于這里采用矩形窗口方式的MeanShift計算，因此不再需要分組圖像的典型點。這跟論文不一樣。
??????? //private List<Image<Ycc,Byte>> convergenceImages = null;?? //收斂圖像：列表個數為param.m，僅在背景訓練時使用，訓練結束即被清空，因此這里不再聲明
??????? private Image<Gray, Byte> sampleImage = null;?????????????? //樣本圖像：保存歷史圖像中每個像素在Y通道的值，用于MeanShift計算
??????? private List<ClusterCenter<Ycc>>[,] clusterCenters = null;? //聚集中心數據：將收斂點分類之后得到的聚集中心，數組大小為：height x width，列表元素個數不定q（q<=m）。
??????? private Image<Ycc, Byte> mrbm = null;?????????????????????? //最可靠背景模型

??????? private Image<Gray, Byte> backgroundMask = null;??????????? //背景掩碼圖像

??????? private double frameCount = 0;????????????????????????????? //總幀數（不包括訓練階段的幀數n）

其中，NBGParameter結構包含以下成員：
??????? public int n;?????????????????????? //樣本數目：需要被保留的歷史圖像數目
??????? public int m;?????????????????????? //典型點數目：歷史圖像需要被分為多少組
??????? public double theta;??????????????? //權重系數：權重大于該值的聚集中心為候選背景
??????? public double t;??????????????????? //最小差值：觀測值與候選背景的最小差值大于該值時，為前景；否則為背景
??????? public MCvTermCriteria criteria;??? //Mean Shift計算的終止條件：包括最大迭代次數和終止計算的精度

聚集中心ClusterCenter使用類而不是結構，是為了方便更新，它包含以下成員：
??????? public TColor ci;????????????? //聚集中心的像素值
??????? public double wi;????????????? //聚集中心的權重
??????? public double li;????????????? //聚集中心包含的收斂點數目
??????? public double updateFrameNo;?? //更新該聚集中心時的幀數：用于清除消極的聚集中心

????2.3 NBGModel中的關鍵流程
1.背景建模
（1）將訓練用的樣本圖像添加到歷史圖像historyImages中；
（2）將歷史圖像分為m組，以每組所在位置的矩形窗為起點進行MeanShift計算，結果窗的中點為收斂中心，收斂中心的像素值為收斂值，將收斂值添加到收斂圖像convergenceImages中；
（3）計算收斂圖像的聚集中心：（a）得到收斂中心的最小值Cmin；（b）將[0,Cmin+t]區間中的收斂中心劃分為一類；（c）計算已分類收斂中心的平均值，作為聚集中心的值；（d）刪除已分類的收斂中心；（e）重復a～d，直到收斂中心全部歸類；
（4）得到最可靠背景模型MRBM：在聚集中心中選取wi最大的值作為某個像素的最可靠背景。

2.前景檢測
（1）用wi≥theta作為條件選擇可能的背景組Cb；
（2）對每個觀測值x0，計算x0與Cb的最小差值d；
（3）如果d>t，則該點為前景；否則為背景。

3.背景維持
（1）如果某點為背景，更新最近聚集中心的wi為(li+1)/m；
（2）如果某點為前景：（a）以該點所在的矩形窗為起點進行MeanShift計算，可得到新的收斂中心Cnew（wi=1/m)；（b）將Cnew加入到聚集中心clusterCenters；
（3）在必要的時候，清理消極的聚集中心。

????2.4 NBGModel的實現代碼
值得注意的是：在實現代碼中，有好幾個以2結尾的私有方法，它們主要用于演示算法流程，實際上并未使用。為了優化性能而增加了不少指針操作之后的代碼可讀性變得很差。

NBGModel實現代碼

3 NBGModel類介紹
????3.1 屬性
Width——獲取圖像的寬度
Height——獲取圖像的高度
Param——獲取參數設置
Mrbm——獲取最可靠背景模型圖像
BackgroundMask——獲取背景掩碼圖像
ForegroundMask——獲取前景掩碼圖像
FrameCount——獲取已被檢測的幀數

????3.2 構造函數
public NBGModel(int width, int height)——用默認的參數初始化NBGModel，等價于NBGModel(width, height, NBGParameter.GetDefaultNBGParameter())
public NBGModel(int width, int height, NBGParameter param)——用指定的參數初始化NBGModel

????3.3 方法
AddHistoryImage——添加一幅或者一組歷史圖像
TrainBackgroundModel——訓練背景模型；如果傳入了歷史圖像，則先添加歷史圖像，然后再訓練背景模型
Update——更新背景模型，同時檢測前景
ClearStale——清除消極的聚集中心
Dispose——釋放資源

4 體會
??? NBGModel的確非常有效，非常簡潔，特別適用于伴隨復雜運動對象的背景建模。我特意選取了PETS2009中的素材對其做了一些測試，結果也證明了NBGModel的優越性。不過需要指出的是，它需要占用大量的內存（主要因為需要保存n幅歷史圖像）；它的計算量比較大。
在使用的過程中，它始終需要在內存中緩存n幅歷史圖像，1幅最可靠背景模型圖像，1幅背景掩碼圖像，近似m幅圖像（聚集中心）；而在訓練階段，更需要臨時存儲m幅收斂圖像。
例如：樣本數目為100，典型點數目為10，圖像尺寸為768x576時，所用的內存接近300M，訓練背景需要大約需要33秒，而對每幅圖像進行前景檢測大約需要600ms。雖然可以使用并行編程來提高性能，但是并不能從根本上解決問題。
（注：測試電腦的CPU為AMD閃龍3200+，內存1.5G。）
??? 看來，有必要研究一種新的方法，目標是檢測效果更好，內存占用低，處理更快速。目前的想法是使用《Wallflower: Principles and Practice of Background Manitenance》中的3層架構（時間軸上的像素級處理，像素間的區域處理，幀間處理），但是對每層架構都選用目前流行的處理方式，并對處理方式進行優化。時間軸上的像素級處理打算使用CodeBook方法，但是增加本文的一些思想。像素間的區域處理打算參考《基于區域相關的核函數背景建模算法》中的方法。幀間處理預計會采用全局灰度統計值作為依據。

最后，按照慣例：感謝您耐心看完本文，希望對您有所幫助。
本文所述方法及代碼僅用于學習研究，不得用于商業目的。

總結

以上是生活随笔為你收集整理的背景建模与前景检测3(Background Generation And Foreground Detection Phase 3)的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：背景建模与前景检测2(Backgroun
下一篇： Harris及Shi-Tomasi原理及

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

背景建模与前景检测3(Background Generation And Foreground Detection Phase 3)

背景建模與前景檢測之三(Background Generation And Foreground Detection Phase 3)

總結