揭秘阿里打假AI大脑:数据总量186个国家图书馆
李根發自廈門
量子位報道公眾號 QbitAI
“令人震驚的是,在打假這方面,美國竟然遠遠落后!”一個月前,美國司法委員會副主席、共和黨參議員道格·柯林斯痛陳美國被假貨所困的問題,其話言猶在耳,近日阿里打假技術又拿下國內高規格的技術大獎。
8 月 9 日,由工信部、公安部及網信辦三部委指導主辦的“中國人工智能高峰論壇”在廈門召開,經過層層評選,阿里巴巴知產保護科技大腦被三部委評為“人工智能創新之星” 。
知識產權保護所指,更喜聞樂見的叫法就是打假。而阿里的知產保護科技大腦是一套阿里 20 年間積累的海量線上線下假貨特征庫、打假經驗聚合而成的算法技術系統,獨創“安全 AI”大腦是核心。
這套系統 24 小時自動運轉,96% 的疑似侵權鏈接在發布的那一剎那就已被秒殺。在過去 3 年,阿里已使用這套技術協助全國 31 個省份、227 個區縣的警方抓獲制售假嫌疑人 4439 人,搗毀制售假窩點 4289 個。
從美國議員點贊到國內技術大獎,可以說時節已至,阿里打假正進入爆發性收獲階段。量子位也了解到這背后的安全 AI 運作之力、創新之功,接下來為大家一一揭秘。
1 AI 大腦=5 萬人類
知產保護科技大腦,就是誠心和技術創新的集大成產品。
該“大腦”完全由阿里自主研發,已經被廣泛應用于阿里生態內外,對假貨、山寨、侵權盜版等進行偵測和打擊。
而且作為一支上崗 AI,各方面實力,不僅比人類干得好,而且很多能力人類干不了。
阿里方面公布了一系列驚人數據表現:
如果人工查看 1 張圖片的信息需要 10 秒鐘,那么 5 萬人同時工作的效率才能勉強趕上“知產保護科技大腦”掃描甄別圖片的速度。淘寶天貓平臺每日新發商品量以千萬計,如果人工巡查,138889 人工作 1 天才能把這項工作完成。
阿里安全圖靈實驗室負責人薛暉透露,這套系統的樣本數據總量相當于 186 個中國國家圖書館藏量,僅累積的打假圖片樣本量就超過 137 億張,用 0.3 毫米的標準相紙打印疊加后高達 4110 千米,是世界最高建筑迪拜塔的 4964 倍,約等于 464 個珠穆朗瑪峰。
驚人的效果背后是阿里在安全場景里不斷進化技術力量所鍛造的“安全 AI”風控體系。
安全 AI 如何服務知識產權保護?
所謂安全 AI,是指安全場景中進化出的 AI,擁有更強、更多元化的能力;與當前通用 AI 的理念不同,阿里安全更注重在業務安全領域垂直縱深的技術積淀,開發出適應更多安全場景的新一代 AI,讓傳統的安全問題找到新的 AI 解法。阿里在今年年初提出這一全新理念,稱其將成為未來網絡安全問題的核心解法。
據悉,阿里知產科技大腦的秘密在于四大智能核心引擎,涵蓋阿里上百項自主研發的安全 AI 技術。分而解之,涉及感知引擎、認知引擎、決策引擎和計算引擎。
實際也是通用人工智能(AGI)必不可少的四大引擎,只是阿里垂直為打假服務。
從項目申報說明里,也能尋得宏觀架構脈絡。
感知引擎:核心技術是計算機視覺技術及語音識別技術,是整個系統的感官系統,是對象識別的基礎,為形成后續一系列處理動作邁出第一步。
包括,用于開店身份認證環節的人臉識別、聲紋識別、活體檢測等生物識別技術;用于開店資質核驗環節的證件識別、篡改檢測技術;用于線上商品識別的商標檢測、物體檢測、光學字符識別技術;用于營銷環節檢測的廣告圖片分析和視頻直播監測技術,以及用于原創作品保護的多媒體檢索和圖像水印技術等。
正是“感官系統”精準的語音、圖像、音頻、視頻感知能力,整個系統才能在數億復雜數據中準確識別出需要保護和防御的對象,進行下一步處理。
認知引擎:核心技術是自然語言處理技術。
認知引擎是系統的“翻譯官”,讓機器懂得文字的意思、人類聲音的含義,以及人們動作的性質,從而判斷善意\惡意、危險\安全。
具體包括針對海量商品結構化與非結構化數據構建的知識圖譜技術;面向海外電商的多語言分析和機器翻譯技術,針對外部反饋的評價、輿情進行識別的語義分析技術;以及融合多模態信息,對商品的全面認知和理解的技術。
第三,決策引擎:核心技術包括深度學習和強化學習兩塊,用來解決現實中的復雜決策問題。
它是系統的“軍師”,決定了系統該如何動作,如何更合理有效地作出最佳應對。例如當面臨商家實時博弈、信息內容的變異,以及黑產的惡意攻擊時,在全局視角下做出更有利的決策。
最后還有計算引擎,包括實時指標計算系統、分布式異構計算系統、和大規模圖神經網絡系統。
這是打假 AI 大腦的發動機,它強大的性能保證了系統在數千并發、數十億數據面前坦然自若、精準高效。
計算引擎背后,支撐的是阿里云機器學習平臺 - PAI 3.0。
它可以實現單任務支持上千 worker 并發訓練,并支持 5k+ 超大規模異構計算集群,保證全天候監控數十億商品異常情況,以及對經營者行為的全方位監督。
臺上一分鐘,技術 20 年功
值得一提的是,四大引擎架構宏觀,但背后每一項技術積累,都是工程師們日夜苦功的結果。
值得一提的是,打假 AI 大腦是阿里安全“安全 AI”落地應用場景之一。阿里在高風險、強對抗的場景中不斷進化 AI 的力量,通過小樣本學習、多模態、自監督學習等新技術的持續應用,在內容安全、新零售安全、交易安全等百余場景中持續應用,其凝聚著阿里安全圖靈實驗室在 AI 領域超過 10 年的技術積淀,實現水滴石穿。
從最近阿里安全圖靈實驗室在人工智能頂會的論文中,不難發現其功力所在。
這是阿里發表于 ECCV Workshop 2018 的論文,核心分享了其在視頻分析領域的技術進展。
也是阿里從視頻中識假打假,保護原創的秘訣所在。
當前業內通行的視頻分析,往往先預訓練 CNN 網絡提取特征分類,其后采用循環神經網絡(RNN、LSTM)進行序列建模。
但視頻的特征序列一般較長,且含有多級結構(hierarchical data structure),即一個視頻包含幀、鏡頭、場景、事件等。
而且幀與幀、鏡頭與鏡頭間的關系十分復雜,不僅僅是前后幀的順序關系,通過一般的序列建模方法,RNN 無法表達如此復雜的關系,建模效果較差。
因此阿里研究團隊通過深度卷積圖神經網絡(DCGN)對視頻的幀、鏡頭、事件進行多級的建模,逐漸地從幀級、鏡頭級,一直到視頻級進行抽象,從而獲得視頻全局的表達,進而進行分類:
最后方法在 youtube8m 數據集上驗證后,效果相對其他經典的序列建模方法,都有提升。
論文傳送門:https://arxiv.org/abs/1906.00377
還有自然語言處理領域的進展,同樣是知產保護科技大腦的關鍵技術。
阿里安全圖靈實驗室入選 IJCAI 2019 的文章,主題是面向對象的情感分析,主要目標是挖掘出評論對象,同時判斷情感表達的極性。
一般而言,很多對于商品質量描述的蛛絲馬跡,會隱藏在用戶對商品的評論中,卻很難從商品本身中發現問題,這也是 NLP 技術能夠施展拳腳的場景。
論文中提出的方法,通俗來說是利用全局信息、結合上下文語境去識別情感對象,而不再是預測每個字對應的序列標簽。
這種方法基于詞塊方法,提出更簡單高效的聯合模型,同時抽取情感表達對象以及判斷其情感極性。
具體步驟上,首先對評論語句中的所有候選詞塊進行向量表示,然后提出了一種基于詞塊的注意力機制來預測詞塊對應的標簽和極性。
最后公開數據集評測對比后,證明比現有方法表現更好。
另一項體現場景挑戰和技術水平的是安全場景特有的對抗性問題。
售假賣家往往會通過改變“標題”和“描述”以躲避傳統規則和模型的識別,但這并非完全無跡可尋。
混淆語言是一種被用于在對抗交流場景下實現規避檢測的技術手段。
對抗交流場景包括敏感信息傳播、負面情感表達、秘密行動策劃以及違法交易等。混淆語言的實現方式通常是在原始文本里進行變異詞的替換。
監管機構在識別此類文本時,需要根據一組關鍵詞進行掃描過濾。盡管引入了一些語義擴展技術,但是由于文本中的歧義性以及變異的無邊界,導致識別此類文本的準確率和召回率都十分有限。
阿里在 WWW 2019 上發表的論文,集中披露了該方向上的核心進展。
該論文的主要思路是將混淆語言識別轉化為一個文本匹配任務,即每條待檢測信息,是否匹配一個掃描關鍵詞,并且同時整合了文本信息的文本表示和視覺表示。
這里的視覺表示指的是文字自身的視覺效果,而不是信息中的圖片,主要是因為在進行文本變異混淆時,經常會出用一些看起來像的字符進行替換,這種變異導致了混淆后的內容在語義上可能已經跟原始內容沒有任何關聯,但是從視覺效果上卻可以產生聯系。
阿里的模型利用 BiLSTM 對文本特征進行表示,通過基于模板匹配的方式對視覺特征進行表示,通過多模態的整合,可以比傳統方法表現出更高的準確率和召回率。
另外就是結合圖像視頻和自然語言處理的多模態任務解決方法。
論文發表于 ICASSP 2019,其中列舉的任務也頗有意思:通過一段文本描述,自動地編輯源圖像使其符合給出的文本描述,從而簡化圖像編輯流程,是一種基于文本的圖像編輯方法。電商網站中的商品本身就是文字與圖片的混合內容,因此可以期待這項技術可以加強對商品內涵的理解,更有助于發現假、劣商品。
感興趣的盆友可移步傳送門:http://arxiv.org/abs/1903.07499
最后再介紹一項業內 sexy,且對打假 AI 貢獻不小的技術進展:小樣本學習。
假貨問題(安全問題)中最頭疼的點,莫過于對新出現的風險缺乏足夠訓練的樣本,導致諸多優秀機器學習算法望而卻步。
在 CVPR 2018 上,阿里安全圖靈實驗室團隊,圍繞業內前沿的“零樣本視頻檢索”挑戰,給出解決方案。
視頻檢索,通常要在文本和視頻之間提取跨模態相關性,需要基于內容匹配。
但阿里的方法之不同,在于提出了一種內容無關的方法,通過雙重深度編碼網絡來將視頻和文本編碼為各自模態的密集式表征。
并且雙重編碼概念簡單、切實有效,還可以端到端學習。
在三個基準數據集 MSR-VTT、TRECVID2016、2017 上實驗后,證明阿里提出的零樣本視頻檢索方法已達到目前最佳。
論文傳送門:http://arxiv.org/abs/1809.06181
就在最近的機器學習頂會 IJCAI-2019 上,阿里安全成功舉辦了第一屆 AAAC 競賽(Alibaba Adversarial AI Challenge)以及 AIBS 研討會(Artificial Intelligence for Business Security),旨在探索面臨對抗攻擊時,如何解決 AI 模型的安全性問題。競賽和會議吸引了來自 24 個國家和地區的 2000 多支隊伍參與,過程中涌現出不少新思路和新方法,極大地推動了這一領域的發展。
“AI 發展趨勢是一定的,但 AI 應用來解決安全問題時并不能生搬硬套,需要根據實際場景進行 AI 的技術升級,”薛暉在今年年初的公開采訪中就指出,安全會成為未來 AI 開發的最大挑戰, “安全 AI”會成為未來網絡安全問題的新解法,也將在 2019 年迎來爆發期。
如今阿里“知產保護科技大腦”的成功實踐不斷得到行業乃至全球的認可,正印證了這一斷言。
阿里打假 AI,用技術解決社會問題
打假 AI 大腦成功,幕后原因并不難分析。這也會是阿里各項業務在 AI 時代里還會更繁榮的保證。
打假作為綜合因素導致的社會問題,利用 AI 等技術實現其實并非易事,沒有對比,可能就難看出誠心誠意。
比如美國電商巨頭亞馬遜,其實也在今年新推出一項名為“Project Zero”的打假防偽項目,通過與品牌方合作,打擊消除假貨。
但在具體技術機制上,就目前披露情況而言,相較阿里的打假 AI 大腦,技術上稍遜一籌。
因為亞馬遜的打假 AI,還需要合作品牌提供 logo、商標和其他信息,甚至讓品牌方利用工具標記并禁止仿冒品。
仍更多依賴監督學習的方式,自動化程度和 AI 通用能力還相對不足,對于阿里無監督、小數據學習和系統性大腦,技術能力和挑戰,高下立判。
所以也難怪美國眾議院司法委員會副主席道格·柯林斯在調研了亞馬遜、eBay、阿里在內的電商平臺后,給出評價:“阿里巴巴的打假政策和項目比任何美國同行都有效得多。”
阿里之道の一以貫之
最后,阿里的做事方式,依然值得關注。
宏觀層面來看,知產保護科技大腦,依然是又一次阿里式創新的成功。
打假難題,源頭在社會發展階段和人性劣根處。面臨的挑戰,跟電商、支付、物流、計算和自主芯片,本質相同,困難無差。
但阿里之道一以貫之,為打假而生的 AI 大腦系統,依然是淘寶天貓、支付寶、阿里云,菜鳥和平頭哥模式的延續:
技術驅動,打造系統平臺,從根本上解決問題。而且俠之大者,未來也會兼濟天下,賦能各行各業甚至各國,能力所至,皆受其益。
會有那么一天,天下再無假貨嗎?夢想或許還是可以有的。
畢竟 AI can do,Ali is doing……
總結
以上是生活随笔為你收集整理的揭秘阿里打假AI大脑:数据总量186个国家图书馆的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 美国再砸6亿美元造E级超算,2023年问
- 下一篇: Adobe更新Lightroom Cla