CVPR 2017 ECO:《ECO: Efficient Convolution Operators for Tracking》论文笔记
? 理解出錯之處望不吝指正。
? 以下內容部分摘自https://zhuanlan.zhihu.com/p/24971525,在這個鏈接里可以看到公式推導~
? 本文模型叫做ECO,是對C-COT模型的改進,出發點是提高時間效率和空間效率。作者分析了模型速度慢的三個原因,也就是本文的動機:
? (1).模型大小。可以理解為特征的復雜度。比如說C-COT用了CNN+HOG+CN這樣非常全面的特征組合,它每次更新模型的時候,需要更新的參數有800000個,速度當然很慢,而且易引起過擬合;
? (2).訓練集大小。這里所指的訓練集是指保存了每一幀的跟蹤結果的訓練集,也就是說,每一次進行model update的時候,要用在這一幀之前所有跟蹤到的樣本。那么隨著視頻越來越長,這個訓練集就會越來越大。那么一般的解決方案是保存比較新的樣本,丟棄老的樣本,具體策略每個方法都不一樣。這樣一來,模型還是容易過擬合。因為當目標被遮擋或者丟失的時候,比較新的這些樣本本身就是錯的,那么模型很容易有model drift,就是被背景或者錯誤的目標污染,導致跟蹤結果出錯。另外,樣本集的保存也會使得空間效率低下,增加計算負擔;
? (3).模型更新。模型如果每幀都更新,速度肯定比間歇更新要慢。另外每幀都更新也會帶來model drift問題。
? ?針對上述三個問題,作者分別采取了不同的應對策略。
? (1).模型大小 - A Factorized Convolution Operator
? ECO在特征提取上做了簡化,用了原來特征的子集,從D維的特征中選了其中的C維。
? C-COT是每個維度的特征對應一個濾波器,D維的特征就有D個濾波器,其實很多濾波器的貢獻很小。C-COT的大部分濾波器的能量很小,而ECO只選擇其中貢獻較多的C個濾波器,C<D,然后每一維特征用這C個濾波器的線性組合來表示。
? 如何對特征進行組合?作者這里使用一個的矩陣來表示線性組合的系數,這個矩陣是通過學習得到的。
? (2).訓練集大小 - A Compact Generative Model
? 圖中下面一行是傳統的訓練集,每更新一幀就加一個進來,那么連續的數幀后訓練集里面的樣本都是高度相似的,即容易對最近的數幀樣本過擬合。
? 上面一行是ECO的做法,ECO用了高斯混合模型(GMM)來生成不同的component,每一個component基本就對應一組比較相似的樣本,不同的component之間有較大的差異性。隨著時間推移,計算和存儲樣本之間的差異,差異小的將替換掉,保證存儲的樣本的多樣性。
? (3).模型更新 - A Conservative Model Update Strategy
? ECO這里的做法很簡單,就是簡單地規定每隔幀更新一次。注意這里的只是對模型的更新,樣本的更新是每一幀都要做的。最后的實驗中,設置為6。
? 模型更新頻率降低,節約了時間,并且可以避免模型的漂移問題,一定程度上可以改進效果,但是也不可以把取得太大,否則會使得模型跟不上目標的變化。
總結
以上是生活随笔為你收集整理的CVPR 2017 ECO:《ECO: Efficient Convolution Operators for Tracking》论文笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CVPR 2017 CFNet:《End
- 下一篇: ICCV 2017 UCT:《UCT: