【星球知识卡片】视频分类与行为识别有哪些核心技术,对其进行长期深入学习...
大家好,歡迎來到我們的星球知識小卡片專欄,本期給大家分享視頻分類的核心技術點。
作者&編輯 | 言有三
1 3D卷積
視頻相對于圖像多出了一個維度,而3D卷積正好可以用于處理這個維度,因此也非常適合視頻分類任務,不過缺點是計算量比較大,下圖展示了一個簡單的3D模型。
2 RNN與LSTM
視頻和語音信號都是時序信號,而RNN和LSTM正是處理時序信號的模型,也是早期用于視頻分類的重要模型。
3 雙流法
視頻中的目標往往是運動的,因此光流也是非常重要的信息。雙流法包含兩個通道,一個是RGB圖像通道,用于建??臻g信息。一個是光流通道,用于建模時序信息。兩者聯合訓練,并進行信息融合。
4 光流預測模型
由于雙流模型是當前視頻分類的主流模型,而其中光流信息對結果影響很大,因此光流預測模型至關重要,尤其是輕量級的光流預測模型非常值得研究。
5 多框架融合
Two-Stream網絡和3D網絡各有優點,都可以很好的建模時序關系,但是計算量巨大,因此有的框架致力于融合兩類框架,并降低計算量。
6 其他
總的來說,視頻分類和行為識別有非常多的研究方向,包括:
(1) 三維卷積的改進。
(2) 光流提取模型的改進。
(3) RGB和光流特征的融合改進。
(4) 多模態信息融合。
(5) 多標簽視頻分類。
(6) 更加細粒度的動作分類。
(7) 更長程信息的捕獲。
(8) 行為定位。
(9) 視頻標注。
以上內容,如果你不想自己學習,可以去我們知識星球的網絡結構1000變板塊—視頻分類板塊閱讀。
有三AI知識星球
知識星球是有三AI的付費內容社區,里面包括各領域的模型學習,數據集下載,公眾號的付費圖文原稿,技術總結PPT和視頻,知識問答,書籍下載,項目推薦,線下活動等資源,了解詳細請閱讀以下文章:
【雜談】有三AI知識星球一周年了!為什么公眾號+星球才是完整的?
【雜談】萬萬沒想到,有三還有個保密的‘朋友圈’,那里面都在弄啥!
轉載文章請后臺聯系
侵權必究
往期精選
【雜談】2020年有三AI計算機視覺培養計劃詳解,該不該學&怎么學CV的簡單討論
【年終總結】2019年有三AI做了什么,2020年我們要做什么?
【總結】有三AI秋季劃模型優化組3月直播講了哪些內容,為什么每一個從事深度學習的同學都應該掌握模型優化的內容
【總結】有三AI秋季劃人臉算法組3月直播講了哪些內容,計算機視覺你不可能繞開人臉圖像
【總結】有三AI秋季劃圖像質量組3月直播講了哪些內容,為什么解決好底層圖像處理問題那么重要
【星球知識卡片】殘差網絡家族10多個變種學習卡片,請收下!
【星球知識卡片】移動端高效率的分組網絡都發展到什么程度了?
【星球知識卡片】注意力機制發展如何了,如何學習它在各類任務中的應用?
【星球知識卡片】模型剪枝有哪些關鍵技術,如何對其進行長期深入學習
【星球知識卡片】模型量化的核心技術點有哪些,如何對其進行長期深入學習
【星球知識卡片】模型蒸餾的核心技術點有哪些,如何對其進行長期深入學習
總結
以上是生活随笔為你收集整理的【星球知识卡片】视频分类与行为识别有哪些核心技术,对其进行长期深入学习...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AutoML】强化学习如何用于自动模型
- 下一篇: 【通知】2020年有三AI-CV夏季划升