人民大学赵鑫:基于知识与推理的序列化推荐技术研究
不到現(xiàn)場(chǎng),照樣看最干貨的學(xué)術(shù)報(bào)告!
嗨,大家好。這里是學(xué)術(shù)報(bào)告專欄,讀芯術(shù)小編不定期挑選并親自跑會(huì),為大家奉獻(xiàn)科技領(lǐng)域最優(yōu)秀的學(xué)術(shù)報(bào)告,為同學(xué)們記錄報(bào)告干貨,并想方設(shè)法搞到一手的PPT和現(xiàn)場(chǎng)視頻——足夠干貨,足夠新鮮!話不多說(shuō),快快看過(guò)來(lái),希望這些優(yōu)秀的青年學(xué)者、專家杰青的學(xué)術(shù)報(bào)告 ,能讓您在業(yè)余時(shí)間的知識(shí)閱讀更有價(jià)值。
人工智能論壇如今浩如煙海,有硬貨、有干貨的講座卻百里挑一。“AI未來(lái)說(shuō)·青年學(xué)術(shù)論壇”系列講座由中國(guó)科學(xué)院大學(xué)主辦,承辦單位為中國(guó)科學(xué)院大學(xué)學(xué)生會(huì),協(xié)辦單位為中國(guó)科學(xué)院計(jì)算所研究生會(huì)、網(wǎng)絡(luò)中心研究生會(huì)、人工智能學(xué)院學(xué)生會(huì)、化學(xué)工程學(xué)院學(xué)生會(huì)、公共政策與管理學(xué)院學(xué)生會(huì)、微電子學(xué)院學(xué)生會(huì),百度為支持單位,讀芯術(shù)、PaperWeekly為合作自媒體。“AI未來(lái)說(shuō)·青年學(xué)術(shù)論壇”第九期“個(gè)性化內(nèi)容推薦”專場(chǎng)已于2019年9月22日下午在中科院舉行。人民大學(xué)趙鑫為大家?guī)?lái)報(bào)告《基于知識(shí)與推理的序列化推薦技術(shù)研究》。
趙鑫全場(chǎng)報(bào)告視頻
趙鑫,中國(guó)人民大學(xué)信息學(xué)院副教授,博士生導(dǎo)師。近五年內(nèi)在國(guó)內(nèi)外著名學(xué)術(shù)期刊與會(huì)議上以主要作者身份發(fā)表論文60余篇。所發(fā)表的學(xué)術(shù)論文取得了一定的關(guān)注度,據(jù)Google Scholar統(tǒng)計(jì),已發(fā)表論文共計(jì)被引用2800余次,其中以第一作者發(fā)表的《Comparing Twitter and Traditional Media Using Topic Models》被引用1100余次。擔(dān)任多個(gè)重要的國(guó)際會(huì)議或者期刊評(píng)審,入選第二屆CCF青年人才發(fā)展計(jì)劃。曾獲得CIKM 2017最佳短文候選以及AIRS 2017最佳論文獎(jiǎng)。
報(bào)告內(nèi)容:推薦系統(tǒng)一直是工業(yè)界和學(xué)術(shù)界的研究熱點(diǎn)。傳統(tǒng)序列化推薦算法已經(jīng)取得了非常不錯(cuò)的實(shí)戰(zhàn)效果,但是這些已有算法對(duì)于可解釋性關(guān)注不夠,所采用的模型大部分只能刻畫(huà)用戶行為的序列性。本次報(bào)告主要借鑒最近幾年深度學(xué)習(xí)模型在推理機(jī)制方面和知識(shí)融入方面的進(jìn)展,提出了能夠同時(shí)刻畫(huà)序列性和可解釋性的推薦算法。為了加強(qiáng)推理能力、改善可解釋性,在推薦算法中引入了外部知識(shí)信息。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,所提出算法在推薦準(zhǔn)確率以及可解釋性兩個(gè)方面均有提升。
基于知識(shí)與推理的序列化推薦技術(shù)研究
趙鑫老師首先簡(jiǎn)單概括了報(bào)告的內(nèi)容,報(bào)告內(nèi)容與知識(shí)圖譜和序列化推薦相關(guān),但是集中于序列化推薦這個(gè)點(diǎn)上,并簡(jiǎn)要介紹了學(xué)術(shù)界和工業(yè)界做推薦的差異。
然后先講了序列化推薦系統(tǒng)的整體概覽,在推薦系統(tǒng)中,用戶的采納行為是一個(gè)序列決策過(guò)程,包括next-basket和next-item的推薦。然后介紹了推薦系統(tǒng)中的常用方法,大致可分為經(jīng)典方法和主流方法兩類。
其中,經(jīng)典方法包括基于頻率的馬爾可夫模型和基于頻率的個(gè)性化馬爾可夫模型,前者主要是基于轉(zhuǎn)移矩陣,項(xiàng)目之間存在轉(zhuǎn)移,比如項(xiàng)目A后大概率是項(xiàng)目B,項(xiàng)目B后大概率是項(xiàng)目C,但是所有人共享這樣的轉(zhuǎn)移矩陣顯然不是特別合理的,所以后者在前者的基礎(chǔ)上進(jìn)行了改進(jìn),使用個(gè)性化的分解模型,使下一個(gè)物品和上一個(gè)物品的表示,和當(dāng)前的用戶表示是有關(guān)系的,該模型也可以計(jì)算出當(dāng)前候選物品的得分。
在介紹主流方法之前,先介紹了基本的RNN模型。其中,主流方法包括個(gè)性化推薦的層級(jí)RNN模型和基于注意力的RNN模型。層級(jí)RNN模型可以更好地從層次化和個(gè)性化方面建模推薦系統(tǒng),而基于注意力的RNN模型則把注意力集中于最需要關(guān)注的事物上,對(duì)一些對(duì)相應(yīng)的推薦作用比較小的事物具有一定的過(guò)濾作用,對(duì)于長(zhǎng)序列的建模很重要。
對(duì)于推薦系統(tǒng)來(lái)說(shuō),上下文是很重要的,而且很多種類的非結(jié)構(gòu)化信息是可以獲得的,因此基于上下文的推薦系統(tǒng)也是很常用的。其常見(jiàn)的方法有因子分解機(jī)(Factorization Machine,FM)和具有上下文意識(shí)(Context-aware)的RNN模型。
接著,又介紹了鏈接知識(shí)庫(kù)的推薦系統(tǒng)。由于知識(shí)庫(kù)包含的實(shí)體擁有豐富的屬性和關(guān)系信息,因而對(duì)于推薦系統(tǒng)來(lái)說(shuō)有輔助的作用。然后講到了自己所在團(tuán)隊(duì)提出的一個(gè)大的公共的鏈接知識(shí)庫(kù)推薦系統(tǒng)的KB4Rec數(shù)據(jù)集,并介紹了數(shù)據(jù)集的數(shù)據(jù)格式和相關(guān)的統(tǒng)計(jì)信息。此外,進(jìn)一步介紹了現(xiàn)有的基于知識(shí)庫(kù)的推薦系統(tǒng)方法,如協(xié)同知識(shí)庫(kù)嵌入(Colloborative Knowledge base Embedding)模型、深度知識(shí)意識(shí)的網(wǎng)絡(luò)(Deep Knowledge-aware Network)模型和連鎖網(wǎng)絡(luò)(Ripple Network)模型。
在介紹完現(xiàn)有的典型的方法之后,趙鑫老師又介紹了自己所在團(tuán)隊(duì)提出的三類方法,分別為基于屬性的記憶網(wǎng)絡(luò)的知識(shí)整合模型(SIGIR 2018)、基于分類記憶網(wǎng)絡(luò)的知識(shí)整合模型(WSDM 2019)和基于元路徑的協(xié)同注意力網(wǎng)絡(luò)的知識(shí)整合模型(SIGKDD 2018)。
現(xiàn)有的基于RNN的方法仍存在一些問(wèn)題:1)很難進(jìn)行解釋,比如任何事物都是被嵌入表達(dá)的;2)有限制的模型建模能力,如長(zhǎng)時(shí)序依賴和弱的推理能力。而基于屬性的記憶網(wǎng)絡(luò)知識(shí)整合模型可以解決這些問(wèn)題。該模型由知識(shí)圖譜、GRU網(wǎng)絡(luò)和鍵-值記憶網(wǎng)絡(luò)(Key-Value Memory Network)組成,通過(guò)連接推薦系統(tǒng)中的項(xiàng)目實(shí)體和知識(shí)圖譜中存在的實(shí)體,來(lái)增強(qiáng)鍵-值記憶網(wǎng)絡(luò)的語(yǔ)義表達(dá)能力。其中,GRU網(wǎng)絡(luò)用于捕捉序列的偏好,而鍵-值記憶網(wǎng)絡(luò)用于捕捉基于屬性的偏好。
在介紹基于分類記憶網(wǎng)絡(luò)的知識(shí)整合模型之前,先介紹了先前的基于多跳推理推薦方法存在的一些問(wèn)題,比如對(duì)于每一跳缺乏必要的解釋,典型的實(shí)例為連鎖網(wǎng)絡(luò)(Ripple Net)。而基于分類記憶網(wǎng)絡(luò)的知識(shí)整合模型使用了分類結(jié)構(gòu)進(jìn)行多跳推理對(duì)齊的方法,可以解決這些問(wèn)題,該模型由GRU網(wǎng)絡(luò)和層級(jí)多跳記憶網(wǎng)絡(luò)組成,可以根據(jù)不同級(jí)別的項(xiàng)目類別層級(jí)地學(xué)習(xí)多個(gè)細(xì)粒度的喜好表達(dá),而且可以在項(xiàng)目選擇的過(guò)程中捕捉用戶喜好的演化和改進(jìn)。
在介紹基于元路徑的協(xié)同注意力網(wǎng)絡(luò)的知識(shí)整合模型之前,先介紹了異質(zhì)信息網(wǎng)路和元路徑的定義,并列舉了元路徑的實(shí)例。該模型是為了尋找更靈活的結(jié)構(gòu)來(lái)表示知識(shí)。現(xiàn)有的基于異質(zhì)信息網(wǎng)絡(luò)(HIN-based)的方法主要存在兩類:1)基于路徑的語(yǔ)義關(guān)聯(lián)作為推薦特征的方法,如OptRank和SemRec;2)基于路徑的增強(qiáng)用戶或項(xiàng)目表達(dá)的相似度的方法,如HeteRec、FMG和NeuACF。其缺點(diǎn)包括:1)很少顯示地表達(dá)推薦的路徑或元路徑;2)集中于兩通路的用戶和項(xiàng)目的交互,沒(méi)有考慮用戶、項(xiàng)目和路徑之間的相互的影響。針對(duì)這些問(wèn)題,趙鑫老師所在的團(tuán)隊(duì)提出了相應(yīng)的解決方法:1)學(xué)習(xí)基于元路徑的上下文剪枝的用于推薦的顯式表達(dá);2)描述一個(gè)三通路的交互<用戶、元路徑、項(xiàng)目>。
最后,趙鑫老師對(duì)報(bào)告的內(nèi)容進(jìn)行了總結(jié):1)知識(shí)庫(kù)對(duì)于提高序列推薦系統(tǒng)的性能是很有用的;2)知識(shí)可以被有效地融合于潛在的神經(jīng)網(wǎng)絡(luò)的推理架構(gòu)中;3)記憶網(wǎng)絡(luò)可以在長(zhǎng)時(shí)間內(nèi)存儲(chǔ)知識(shí)和有用信息。
?
AI未來(lái)說(shuō)*青年學(xué)術(shù)論壇
第一期 數(shù)據(jù)挖掘?qū)?chǎng)
1.?李國(guó)杰院士:理性認(rèn)識(shí)人工智能的“頭雁”作用
2.?百度熊輝教授:大數(shù)據(jù)智能化人才管理
3.?清華唐杰教授:網(wǎng)絡(luò)表示學(xué)習(xí)理論及應(yīng)用
4.?瑞萊智慧劉強(qiáng)博士:深度學(xué)習(xí)時(shí)代的個(gè)性化推薦
5.?清華柴成亮博士:基于人機(jī)協(xié)作的數(shù)據(jù)管理
第二期?自然語(yǔ)言處理專場(chǎng)
1.?中科院張家俊:面向自然語(yǔ)言生成的同步雙向推斷模型
2.?北郵李蕾:關(guān)于自動(dòng)文本摘要的分析與討論
3.?百度孫珂:對(duì)話技術(shù)的產(chǎn)業(yè)化應(yīng)用與問(wèn)題探討
4.?阿里譚繼偉:基于序列到序列模型的文本摘要及淘寶的實(shí)踐
5.?哈工大劉一佳:通過(guò)句法分析看上下文相關(guān)詞向量
第三期?計(jì)算機(jī)視覺(jué)專場(chǎng)
1.?北大彭宇新:跨媒體智能分析與應(yīng)用
2.?清華魯繼文:深度強(qiáng)化學(xué)習(xí)與視覺(jué)內(nèi)容理解
3.?百度李穎超:百度增強(qiáng)現(xiàn)實(shí)技術(shù)及應(yīng)?
4.?中科院張士峰:基于深度學(xué)習(xí)的通用物體檢測(cè)算法對(duì)比探索
5.?港中文李弘揚(yáng) :物體檢測(cè)最新進(jìn)展
第四期?語(yǔ)音技術(shù)專場(chǎng)
1.?
2.?
3.?
4.?
5.?
第五期?量子計(jì)算專場(chǎng)
1.?
2.?
3.?
4.?
5.?
第六期?機(jī)器學(xué)習(xí)專場(chǎng)
1.?中科院張文生:健康醫(yī)療大數(shù)據(jù)時(shí)代的認(rèn)知計(jì)算
2.?中科院莊福振:基于知識(shí)共享的機(jī)器學(xué)習(xí)算法研究及應(yīng)用
3.?百度胡曉光:飛槳(PaddlePaddle)核心技術(shù)與應(yīng)用實(shí)踐
4.?清華大學(xué)王奕森:Adversarial Machine Learning: Attack and Defence
5.?南京大學(xué)趙申宜:SCOPE - Scalable Composite Optimization for Learning
第七期 自動(dòng)駕駛專場(chǎng)
1.?北京大學(xué)查紅彬:基于數(shù)據(jù)流處理的SLAM技術(shù)
2.?清華大學(xué)鄧志東:自動(dòng)駕駛的“感”與“知” - 挑戰(zhàn)與機(jī)遇
3.?百度朱帆:開(kāi)放時(shí)代的自動(dòng)駕駛 - 百度Apollo計(jì)劃
4.?北理宋文杰:時(shí)空域下智能車輛未知區(qū)域自主導(dǎo)航技術(shù)
第八期 深度學(xué)習(xí)專場(chǎng)
1.?中科院文新:深度學(xué)習(xí)入門基礎(chǔ)與學(xué)習(xí)資源
2.?中科院陳智能:計(jì)算機(jī)視覺(jué)經(jīng)典——深度學(xué)習(xí)與目標(biāo)檢測(cè)
3.?中科院付鵬:深度學(xué)習(xí)與機(jī)器閱讀
留言 點(diǎn)贊 發(fā)個(gè)朋友圈
我們一起分享AI學(xué)習(xí)與發(fā)展的干貨
推薦文章閱讀
ACL2018論文集50篇解讀
EMNLP2017論文集28篇論文解讀
2018年AI三大頂會(huì)中國(guó)學(xué)術(shù)成果全鏈接
ACL2017 論文集:34篇解讀干貨全在這里
10篇AAAI2017經(jīng)典論文回顧
長(zhǎng)按識(shí)別二維碼可添加關(guān)注
讀芯君愛(ài)你
總結(jié)
以上是生活随笔為你收集整理的人民大学赵鑫:基于知识与推理的序列化推荐技术研究的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 变频器LED显示灯闪烁_东莞变频器常见故
- 下一篇: 发放豆瓣电台邀请!