AI在茫茫人海中,看到只有你被Deepfake了丨阿里安全出品
魚羊發自凹非寺
量子位報道公眾號 QbitAI
自打有了 deepfake,再也不敢相信「眼見為實」了。
要說把朱茵換臉成楊冪,把海王換臉成徐錦江,大家還可以一笑而過。
△圖源:微博用戶@慢三與偏見
可若是公眾人物被 deepfake 了什么不該說的話、不該做的事,就讓人細思極恐了。
為了防止世界被破壞,為了維護世界的和平,(狗頭)現在,阿里安全圖靈實驗室也加入了“圍剿”deepfake 的隊列:
打造 deepfake 檢測算法S-MIL,多人現場視頻,只要其中 1 人被換臉,就能精準識別。
基于多實例學習的 deepfake 檢測方法
魔高一尺,道高一丈。deepfake 和 deepfake 檢測技術的較量其實早已展開。
不過,此前存在的 deepfake 檢測方法主要分為兩類:幀級檢測和視頻級檢測。
基于幀級的方法需要高成本的幀級別標注,在轉化到視頻級任務時,也需要設計巧妙的融合方法才能較好地將幀級預測轉化為視頻級預測。簡單的平均值或者取最大值極易導致漏檢或誤檢。
而基于視頻級別的檢測方法,比如 LSTM 等,在 deepfake 視頻檢測時,過多專注于時序建模,導致 deepfake 視頻的檢測效果受到了一定的限制。
△部分 deepfake 攻擊,四個人中只有一人被換臉
為了解決這些問題,阿里安全圖靈實驗室的研究人員們提出了基于多實例學習的 Sharp-MIL(S-MIL)方法,只需視頻級別的標注,就能對 deepfake 作品進行檢測。
核心思想是,只要視頻中有一張人臉被篡改,那么該視頻就被定義為 deepfake 視頻。這就和多實例學習的思想相吻合。
在多實例學習中,一個包由多個實例組成,只要其中有一個實例是正類,那么該包就是正類的,否則就是負類。
S-MIL 就將人臉和輸入視頻分別當作多實例學習里的實例和包進行檢測。
并且,通過將多個實例的聚合由輸出層提前到特征層,一方面使得聚合更加靈活,另一方面也利用了偽造檢測的目標函數直接指導實例級深度表征的學習,來緩解傳統多實例學習面臨的梯度消失難題。
具體而言,算法主要由三個關鍵部分組成。
首先,對輸入視頻中的采樣幀進行人臉檢測,并將提取的人臉喂給 CNN,以獲取特征作為實例。
在實例設計上,與傳統多實例學習的設定一樣,實例與實例間是相互獨立的。
但由于 deepfake 是單幀篡改的,導致同一人臉在相鄰幀上會有一些抖動,就像這樣:
為此,研究人員設計了時空實例,用來刻畫幀間一致性,用于輔助 deepfake 檢測。
具體而言,使用文本分類里常用的1-d 卷積,使用不同大小的核對輸入的人臉序列從多視角上進行編碼,以得到時空實例,用于最終檢測。
也就是說,第二步,是將編碼后的時空實例提取出來,形成時間核大小不同的時空包。這些包被一起用來表示一段視頻。
最后,對這些包進行S-MIL,算出所有包的 fake 分數,這樣,就能得到整個視頻的最終 fake 分數,從而判斷視頻到底是不是 deepfake。
S-MIL 定義如下:
其中,pi 和p(i)^(j)分別是第i個包及其包里的第j個實例的正類概率;M為包里的實例數;w是網絡參數;h(i)^(j)是包i里的實例j對應的特征。
由于現有的帶幀標簽的數據集中,同一視頻中真假人臉混雜的樣本較少,研究人員還構建了一個部分攻擊數據集FFPMS。
FFPMS 共包含 14000 幀,包括 4 種類型的造假視頻(DF、F2F、FS、NT)和原始視頻,既有幀級標簽,也包含視頻級標簽。
檢測效果達到 SOTA
研究人員在 DFDC、Celeb 和 FFPMS 數據集上對S-MIL 進行了評估。
實驗結果表明,假臉的權重比較高,說明該方法在僅需視頻級別標簽的情況下,可以很好地定位到假臉,具有一定的可解釋性:
并且,該方法在視頻檢測上能到達到 state-of-the-art 的效果。
團隊介紹
據阿里安全圖靈實驗室資深算法專家華棠介紹,截止目前,阿里已經將該檢測技術使用在內容安全場景中,后續也會在直播場景中進行布局。
阿里安全成立于 2005 年,目標是面向阿里巴巴經濟體建立全面的網絡安全、業務安全、數據安全與平臺治理的管理機制,利用大數據構建強大的實時風險防御能力。
目前所涵蓋的業務范疇既包括最底層的設備層、網關層以及流量層的網絡威脅防御,也包括了業務層的安全治理,例如賬號安全、假貨與欺詐識別、內容合規、數據及信息保護、營商環境治理等等。同時,安全中臺能力還全面輸出給阿里巴巴經濟體內的跨境公司以及生態伙伴。
阿里安全圖靈實驗室是阿里安全旗下的機器學習研發團隊,從事安全與風險方面的 AI 系統研發,核心技術包括計算機視覺、自然語言處理、生物特征識別、AI 安全、圖計算以及異常檢測和分析等。
傳送門
論文地址:
https://arxiv.org/abs/2008.04585
總結
以上是生活随笔為你收集整理的AI在茫茫人海中,看到只有你被Deepfake了丨阿里安全出品的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 天猫发布新规:下单2天不发货 自动赔付
- 下一篇: 酒入论坛网(酒入)