商汤科技发布迄今最大人脸检测数据集,绝杀Deepfake!
作者:KYLE WIGGERS
近日,發表于 Venturebeat 的一篇文章稱,商湯科技研究院與新加坡南洋理工大學合作設計了迄今為止最大的人臉偽造檢測數據集——DeeperForensics-1.0。
換臉是一種深度偽造技術,它從現實中提取人臉,并用其他人的面部特征代替,通常通過人工智能或機器學習實現。
目前,它已經被 MixBooth 和 SnapChat 等應用推廣開來,雖然底層的技術使復雜的圖像編輯成為可能,但這也引發了人們對潛在的錯用或濫用的擔憂。
相關組織已經編譯了很多被操控媒體的資料,以支持人臉交換檢測方法的發展,但到目前為止公布的樣本數量相對較少,或者人為因素影響較大。
研究人員表示,DeeperForensics-1.0 是一種新的大規模的人臉偽造檢測數據集,被稱為是同類中最大的語料庫,有超過 6 萬個視頻,大約有 1760 萬幀。
研究人員稱,DeeperForensics-1.0 中的所有源視頻都是經過精心挑選的,因為它們的質量和多樣性都很高。
從表面上看,它們比其他數據集更真實,因為它們更接近于現實世界中的檢測場景,并且它們包含與 in the wild 的壓縮,模糊和傳輸偽像相匹配的特征。
為了構建 DeeperForensics-1.0,研究人員收集了來自 26 個不同國家的 100 名演員的面部數據,他們的年齡從 20 歲到 45 歲不等,他們被要求在九種不同的燈光下轉動頭部,用超過 53 種表情自然地說話。
他們通過一個人工智能框架(DeepFake Variational AutoEncoder,簡稱 DF-VAE)來運行這些數據,該框架使用了 1000 個 YouTube 視頻作為目標視頻,其中 100 名演員的臉被交換到 10 個目標面部上。
他用 35 種不同的方式扭曲每個視頻來模擬真實世界的場景,最終的數據集包含了 5 萬個未經處理的視頻和 1 萬個經過處理的視頻。
研究人員在一份詳細說明其工作的印論文中寫道:“我們發現,源面部在構建高質量數據集方面比目標面部發揮著至關重要的作用。”“特別是,源面部的表情,姿勢和照明越豐富,面部特征交換后的質量越高。”研究人員還在 DeeperForensics-1.0 中創建了他們所謂的“隱藏”測試集——一組精心挑選的 400 個視頻,以便在真實場景中更好地模擬假視頻。
策劃這組視頻的過程包括收集由未知的換臉方法生成的假視頻,并用真實場景中常見的失真來掩蓋這些假視頻,最后只選擇在用戶研究中愚弄了至少 50 個(總共 100 個)人類觀察者的視頻。
為了評估 DeeperForensics-1.0 與其他公開數據集的質量,研究人員讓 100 名計算機視覺專家對其中一部分視頻的質量進行排序。
他們報告稱,與 FaceForensics++、Celeb-DF 和其他流行的 deepfake 檢測語料相比,DeeperForensics-1.0 在真實性方面領先。
在未來的工作中,研究團隊打算逐步深入取證領域,并與研究社區合作,確定人臉偽造檢測方法的評估指標。
與 Deepfake 的斗爭似乎正在升溫。去年夏天,美國國防部高級研究計劃局的媒體取證項目成員測試了一個原型系統,該系統可以自動檢測人工智能生成的視頻,部分方法是尋找類似眨眼不自然這樣的線索。
初創公司 Truepic 在 7 月獲得了 800 萬美元的融資,它們正在試驗 deepfakes 的“探測即服務”商業模式。
2019 年 12 月,Facebook 與人工智能合作伙伴、微軟和學術界共同發起了 Deepfake 探測挑戰,該挑戰將提供數百萬美元的資助和獎勵,以促進 Deepfake 探測系統的發展。
原文鏈接:
https://venturebeat.com/2020/01/15/sensetime-face-forgery-research-deepfakes/
總結
以上是生活随笔為你收集整理的商汤科技发布迄今最大人脸检测数据集,绝杀Deepfake!的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 台积电、三星争霸2nm工艺:能做出来,但
- 下一篇: AI教育就像莱特兄弟的飞行实验 需要时间