Facebook公布新AI模型,用机器学习来识别假账号
澎湃新聞記者 王心馨
社交網站上的假賬號,通常會被欺詐者利用來傳播垃圾郵件、網絡釣魚鏈接或惡意軟件。無論是平臺上的無辜用戶還是平臺本身,這類假賬戶都極其危險。
為了解決這個問題,Facebook正式發布了能打擊假賬號的工具——DEC,也稱為深度實體分類系統(Deep Entity Classification)。這是一套利用機器學習來識別假賬號的工具。
據Facebook透露,這套工具不僅會評估可疑帳戶的行為,還會評估賬號的周邊信息,包括可疑帳戶的交互帳戶和瀏覽頁面行為。Facebook稱,使用這套工具后,垃圾郵件和欺詐賬號的數量減少了27%。
從Facebook公開的詳細信息看,DEC能區分兩類假賬戶。一類是錯誤分類的賬號,這些賬號的個人資料被包裝成了商業信息頁面。要處理這類假賬號,相對簡單,只要替換個人資料信息就可以。第二類是違法賬號,這些賬號涉及欺詐、垃圾郵件和違反平臺服務條款等行為。對于這類賬號處理起來更加棘手,平臺需要盡快刪除,又不能全部刪除相關賬號,否則可能會誤刪真實賬號。
那么,整套系統是如何做到的?
DEC的主要方式是通過分析用戶的連接模式來區分真假用戶。這些模式被稱為“深層特征”,其中包括用戶朋友的平均年齡或性別分布。Facebook使用了20000種深層特征來刻畫用戶畫像,通過這些深層特征,系統會了解每個用戶的行為,也讓攻擊者難以改變策略來躲避偵查。
深層特征的提取,首先使用的是大量低精度機器生成的標簽。這些標簽由混合規則和其他機器學習模型生成,可以用來判斷用戶是真還是假。接著,將這些標簽用來訓練神經網絡,再加上一小批高精度的手工標記數據對整個模型進行微調,這部分數據是由世界各地了解本地文化的人手工生成的。
最終系統可以識別出四種類型的虛假賬號:不能代表個人的非法帳戶,欺詐者已經接管的真實賬戶,重復發送創收垃圾郵件的賬戶,以及操縱賬號泄露個人信息的賬戶。
2019年,Facebook每個季度平均刪除20億個偽造賬號。自從使用DEC以來,Facebook稱,平臺上假賬戶的數量保持在每月活躍用戶的5%左右。但即便是這樣,情況也不樂觀,在每月有25億活躍用戶的情況下,整個平臺仍有1.25億個偽造帳戶。
隨著2020年美國總統大選臨近,Facebook此時發布DEC系統的詳細信息,似乎有些巧合。此前,Facebook曾被指責放縱第三方,泄露用戶數據操控選舉?!斑@只是發現一般的違法行為, Facebook并不專門針對任何選舉主題?!?Facebook社區誠信團隊工程經理Daniel Bernhardt在接受媒體采訪時稱。
總結
以上是生活随笔為你收集整理的Facebook公布新AI模型,用机器学习来识别假账号的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 赛尔号怎么打缪斯(盖亚)?
- 下一篇: 好听的现场音乐歌曲 70-80年代摇滚老