知识图谱应用实战案例100篇(一)-阿里巴巴超大规模知识图谱预训练实践:商品分类
基于電子商務平臺上億級的龐大商品庫,電子商務交易得以不斷增長。
為了更好地支持日常業務,需要將這些海量的商品以一種更優的方式進行描述、存儲和計算,并且需要支持融合不同來源的數據,建立實體之間的語義連接,因此采用了知識圖譜這種數據構架。
阿里巴巴積累了上千億規模的商品數據作為商品知識圖譜,這些數據來源于淘寶、天貓、阿里巴巴等在內的多個阿里旗下平臺,囊括了品牌制造商、消費者、國家機構、物流提供商等多方利益相關者的數據。
從知識產權保護或購物體驗的角度來看,商品信息的標準化和內外部數據的深度關聯挖掘,對電子商務業務至關重要。
利用自然語言處理、語義推理和深度學習方法的最新進展,通過提供產品的全球概況、假冒產品治理、行業運營的完整產品信息,可以為搜索業務、推薦業務、平臺治理、智能問答等開發人工智能相關服務,為消費者提供更好的使用體驗。
目前,商品知識圖譜包含標準產品、標準品牌、標準條碼和標準分類四個關鍵組成部分,集成了公眾情感、百科全書、國家行業標準等九大本體論數據集,運用實體識別、實體鏈接、語義分析等方法構建了大規模的知識圖譜。
目前,商品知識圖譜包含700多億個三元組和300多萬個規則,建立了一個完整而龐大的數據視圖,極大地支撐了基于知識的項目服務。例如,商品知識圖譜能支持語義搜索、智能問答、商品推薦等各種知識增強任務。
在阿里巴巴電商實際場景中,圍繞商品知識圖譜展開了一系列的技術研究和應用,其中主要業務場景包括商品分類、同款商品識別、商品推薦、商品標簽發現、商品屬性預測等。
為了在不同的任務中使用知識圖譜信息,應用知識圖譜預訓練(Pre-trained Knowledge Graph,PKG)技術對知識圖譜進行建模?
總結
以上是生活随笔為你收集整理的知识图谱应用实战案例100篇(一)-阿里巴巴超大规模知识图谱预训练实践:商品分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AUTOSAR从入门到精通100讲(六十
- 下一篇: AUTOSAR专业知识篇(七)-比亚迪汉