本周有哪些值得读的 AI 论文?进来告诉你答案
在碎片化閱讀充斥眼球的時代,越來越少的人會去關注每篇論文背后的探索和思考。
在這個欄目里,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。
點擊本文底部的「閱讀原文」即刻加入社區,查看更多最新論文推薦。
這是 PaperDaily 的第 121?篇文章@Zsank 推薦
#Attention Mechanism
本文來自佐治亞理工學院,這是一篇 Attention 機制在自然語言處理方面的綜述文章,包括基本概念和 Attention 在不同 NLP 任務上的模型變種。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2520
@tobiaslee 推薦
#Text Generation
本文是北京大學孫栩老師組和微軟亞洲研究院發表在 AAAI 2019 上的工作。文章介紹了“彈幕生成”任務,根據一定時間范圍內的視頻幀和評論文本進行彈幕評論的生成,并且構建了基于 B 站的數據集。
通過對數據集的分析發現:彈幕評論長度較短;相鄰時間間隔的評論具有較高的關聯度。基于此,文章先是利用傳統的 Seq2Seq 架構,設計了 Video Encoder 和 Text Encoder 進行圖像和文字信息的融合,再交由 Comment Decoder 進行生成;進一步地,利用 Transformer 替代 RNN Encoder,提出了一個 Unified Transformer Model。
并且,為了更好的評估模型的性能,文章提出了一個基于生成概率對候選評論進行排序的指標,對比之前的 Seq2Seq 模型,文章提出的兩個模型能夠取得更好的效果。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2524
@paperweekly 推薦
#Relation Classification
本文是清華大學劉知遠老師組發表于 EMNLP 2018 的工作。和 SQuAD、QAngaroo、CoQA 和 SWAG 等 QA 數據集不同的是,本文基于 Few-Shot Learning 提出了一個大規模有監督關系分類數據集——FewRel。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2465
源碼鏈接
https://github.com/thunlp/FewRel
@Arborday 推薦
#Word Embeddings
本文是 Zalando Research 發表于 COLING 2018 的工作,論文提出了一種全新產生 embedding 的 BiLSTM 模型結構,模型特點:
1. 模型以 character 為原子單位,在網絡中,每個 character 都有一個對應的 hidden state。這個特點對需要多一步分詞的中文來說可能有避免因為分詞錯誤導致下游 function 繼續錯誤的弊端;
2. 輸出以 word 為單位的 embedding,這個 embedding 由前向 LSTM 中,該詞最后一個字母的 hidden state 和反向 LSTM 中該詞第一個字母的 hidden state 拼接組成,這樣就能夠兼顧上下文信息。
這種動態 embedding 的方法在序列標注上取得了良好效果,特別值得一提的是,在 NER 上的表現甚至超越了 BERT,但訓練成本只是一個 GPU*一周,訓練數據在十億個詞量,與 BERT 相比對硬件的要求極大降低,訓練成本的大幅減少卻仍有性能上的提升,動態 embedding 的思路值得借鑒和嘗試。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2519
源碼鏈接
https://github.com/zalandoresearch/flair
@paperweekly 推薦
#Dialog Systems
本文是微軟和臺灣大學發表于 ACL 2018 的工作,論文提出了一種針對任務型對話系統的學習方式——Deep Dyna-Q,在僅使用少量真實用戶交互數據的前提下,基于集成規劃的方法進行對話策略學習。作者將 world model 引入對話 agent,模仿真實的用戶響應并不斷學習生成模擬的用戶對話,利用真實和模擬的對話經驗對 agent 進行優化。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2545
源碼鏈接
https://github.com/MiuLab/DDQ
@CYRYOU 推薦
#Natural Language Inference
本文介紹了一種便攜式表型系統,它能夠集成基于規則和基于統計機器學習的方法。論文利用 UMLS 從非結構化文本中提取臨床相關特征,然后通過結合 OHDSI 的 OMOP 促進不同機構和數據系統的可移植性通用數據模型(CDM),用于標準化必要的數據元素。論文提出的系統還可以以 OMOP-CDM 的格式存儲基于規則的系統的關鍵組件(例如,正則表達式匹配),從而實現許多現有的基于規則的臨床 NLP 系統的重用、適應和擴展。
論文在 i2b2 的肥胖挑戰賽中對便攜式表型系統進行了實驗,作為一項試點研究。系統基于非結構化患者出院總結,促進肥胖的便攜式表型分析及其15種合并癥,同時實現了通常在挑戰參與者中排名前十的表現。這種標準化使得能夠在下游一致地應用許多基于規則和基于機器學習的分類技術。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2455
源碼鏈接
https://github.com/mocherson/portableNLP
@Luolc 推薦
#Goal-Oriented Dialog
本文是微軟亞洲研究院和北京大學孫栩組共同完成即將發表在 AAAI 2019 的工作。為對話系統引入個性化是今年對話領域最為火熱的研究方向之一。此前有一些工作研究在開放式對話(chitchat)中引入個性化,使得對話生成中可以包含一定的對話者身份的信息,使對話質量更高。而本文關注在鮮有人研究且更加困難的任務型對話領域,探索如何能針對用戶的不同身份采取不同的對話策略,提高任務完成率和用戶滿意度。
本文提出了 Personalized MemN2N 模型,引入 profile embedding,并在對話模型和 KB 之間建立聯系,有效地提升了對話系統質量,達到任務型對話個性化數據集上新的 state-of-the-art。在針對任務型研究較少的環境下,這一工作具有非常高的參考價值。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2522
@hsu 推薦
#Semantic Segmentation
本文是阿德萊德大學發表于 BMVC 2018 的工作,論文關注的問題為實時語義分割。作者將源自 CVPR 2017 的 RefineNet 作為基礎網絡,結合兩種殘差模塊 RCU(殘差卷積單元)和 CRP(鏈式殘差池化)有效減少模型參數和計算量,在 512 x 512 大小的輸入圖像上將分割速度從 20 FPS 顯著提升至 55 FPS。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2555
源碼鏈接
https://github.com/DrSleep/light-weight-refinenet
@jhy1993 推薦
#Gaussian Embedding
本文來自 Google AI Research。之前的 Gaussian Embedding 都是將 Object 映射為一個高斯分布來捕捉不確定性,但是一個高斯分布足夠嗎?本文將 Object 映射為一組高斯分布,即混合高斯。本文提出了 HIB 來解決上述問題,所謂的”hedging its bets”就是為了避免損失,多處下注。對應到本文,對于有歧義的輸入,將其映射為多個高斯分布,每個高斯分布代表其中一個意思。
針對圖像的歧義需求,作者設計了 N?digitsMNIST 數據集,即將 MNIST 中的數字組合成一張新圖,這樣每張圖就有歧義了。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2506
數據集鏈接
https://github.com/google/n-digit-mnist
@Kralkatorrik 推薦
#Face Recognition
本文是商湯科技、香港中文大學和南洋理工大學發表于 ECCV 2018 的工作。在人臉識別數據獲取成本越來越高的情況下,作者提出了一種稱為 Consensus-Driven Propagation 的模型,采用少量標注數據和大量無標簽數據訓練,即可獲得接近所有數據都有標注的精度。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2527
源碼鏈接
https://github.com/XiaohangZhan/cdp/
@vimjian推薦
#Object Pose Estimation
本文來自歐姆龍和中京大學,論文關注的問題是實時 6D 物體姿態估計。作者提出了一個基于 model 的匹配算法,效果卓越。在 CPU 上就可以達到實時,并且訓練只需 CAD 模型。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2572
@SXKDZ 推薦
#Session-based Recommendation
本文是中國科學院自動化所智能感知與計算中心被 AAAI 2019 接收的論文。會話(session)是服務器端用來記錄識別用戶的一種機制。在推薦系統中,基于會話的推薦(session-based recommendation)是依據一個時間窗口內用戶連續的行為進行推薦。比如,一位用戶在登錄淘寶的這段時間里連續點擊了 10 個商品,那么這 10 個商品就構成了一個會話短序列。由于會話數據具有海量、匿名的特點,基于會話的推薦近來受到了廣泛的關注。?
為了更好地捕獲會話的結構并考慮節點間的轉換,該論文提出了一種基于圖形神經網絡(graph neural network, GNN)的會話推薦(SR-GNN)方法。該方法將所有會話序列聚合在一起并建模為圖結構。基于該圖,GNN 可以捕獲項目的轉換關系。之后 SR-GNN 使用注意力機制將每個會話表示為全局偏好和會話當前興趣的組合并據此進行推薦。在兩個開源數據集上,SR-GNN 模型的性能持續并顯著地好于其他 SOTA 方法。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2518
源碼鏈接
https://github.com/CRIPAC-DIG/SR-GNN
@paperweekly 推薦
#Graph Convolutional Networks
本文是華盛頓大學發表于 KDD 2018 的工作。圖卷積神經網絡當前面臨著兩大挑戰:1)圖中節點的鄰節點數量具有不確定性;2)鄰節點之間雜亂無序。
本文提出了一個可學習圖卷積層(LGCN)來解決上述挑戰。LGCL 基于數值排序自動選擇固定數目的鄰居節點作為圖卷積神經網絡的輸入特征,使用常規的卷積操作來進行圖編碼,并借助子圖訓練方法使 LGCL 能夠適用于大圖訓練。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2487
源碼鏈接
https://github.com/divelab/lgcn/
@Rcypw 推薦
#Network Embedding
本文是南開大學發表于 KDD 2018 的工作,該論文首次將網絡表示學習問題轉化為機器翻譯任務,解決了目前網絡表示學習方法中向量組合策略結果不理想問題,以及復雜網絡難以捕獲長距離路徑結構的問題。作者在不同的應用上對幾個模型進行比較,取得了較好的效果。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2530
源碼鏈接
http://dm.nankai.edu.cn/code/STNE.rar
@paperweekly 推薦
#Recommender System
本文是新加坡國立大學發表于 WWW 2018 的工作。在推薦系統任務上,基于 embedding 的方法雖然具有良好的推薦表現,但其整體仿若一個黑盒,難以解釋具體推薦原因。相反,基于決策樹的推薦方法則能夠從數據中進行規則推理,進而給出具體的決策原因。
本文的寫作動機便是將二者的優勢加以結合,提出一個全新的 Tree-enhanced Embedding 方法,既保持基于決策樹方法的可解釋性,又具備基于 embedding 方法的良好推薦效果,進而保證了整個推薦過程的透明、可解釋性。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2548
@HarryLiu?推薦
#Convolutional Neural Network
本文是北京大學發表于 AAAI 2019 的工作。作者使用 Grammar-based CNN 對代碼進行生成,CNN + shortcut connect 進行 encode,對于樹結構輸入數據,使用 pre-order 遍歷后做編碼,并結合使用 tree-path 做編碼,為 input 為結構化數據提供了思路。 在 decoder 階段通過對 max-pooling 結果和 encoding 結果做 attention 計算。
文章對 code generation 現有做法了做了一些回顧,網絡結構有對現有組件的直接使用,也有做創新性的調整,內容較為豐富。 在結構化相關任務的 end2end 模型思路上值得借鑒。
▲?論文模型:點擊查看大圖
論文鏈接
https://www.paperweekly.site/papers/2571
源碼鏈接
https://github.com/zysszy/GrammarCNN
#推 薦 有 禮#
本期所有入選論文的推薦人
均將獲得PaperWeekly紀念周邊一份
▲?深度學習主題行李牌/卡套 + 防水貼紙
?禮物領取方式?
推薦人請根據論文詳情頁底部留言
添加小助手領取禮物
想要贏取以上周邊好禮?
點擊閱讀原文即刻推薦論文吧!
點擊以下標題查看往期推薦:?
??又為寫作思路熬到禿頭?16篇最新論文打包送你
??收下這 16 篇最新論文,周會基本不用愁
??這 16 篇最新論文,幫你輕松積攢知識點
??本周份AI論文推薦新鮮出爐!真的很skr了~
??想了解推薦系統最新進展?請收好這些篇論文
正經煉丹師如何完美安排國慶長假?
#投 稿 通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢??答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
??來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
? 投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 獲取更多論文推薦
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的本周有哪些值得读的 AI 论文?进来告诉你答案的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习工具那么多,究竟哪款最适合你?|
- 下一篇: 综述:Image Caption 任务之