每周论文清单:对话系统综述,全新中文分词框架,视频生成,文字识别
在碎片化閱讀充斥眼球的時代,越來越少的人會去關(guān)注每篇論文背后的探索和思考。
在這個欄目里,你會快速 get 每篇精選論文的亮點和痛點,時刻緊跟 AI 前沿成果。
點擊本文底部的「閱讀原文」即刻加入社區(qū),查看更多最新論文推薦。
這是 PaperDaily 的第?33?篇文章[ 自然語言處理 ]
@jueliangguke 推薦
#Convolutional Neural Network
本文提出了一個全新的中文分詞框架,使用深度卷積網(wǎng)絡(luò)在多個數(shù)據(jù)集上達到了 state-of-the-art。
A Survey on Dialogue Systems: Recent Advances and New Frontiers@paperweekly 推薦
#Dialog Systems
本文來自京東數(shù)據(jù)科學團隊,這是一篇非常全面的對話系統(tǒng)綜述,引用了 100+ 篇相關(guān)論文,并對論文進行了分類。
How to Make Context More Useful?
@zhangjianhai 推薦
#ContextQA
在自然語言對話領(lǐng)域,論文首先對比了目前幾種流行的 Context-aware 模型,包括 Non-hierarchical 模型(將 context 與 query 作為一個序列建模)以及 Hierarchical 模型(將 context 與 query 分別建模生成向量表示,在此基礎(chǔ)上采用不同的方式進行整合,包括 sum,concat,sequential integration 等)。
最后,論文提出了一種 Weighted Sequential Integration 的上下文整合方式,對不同的上下文賦予不同的權(quán)重。對 ContextQA 相關(guān)工作具有一定借鑒意義。
@cfjmonkey 推薦
#Text Style Transfer
該文實現(xiàn)了基于給定屬性的文本風格的轉(zhuǎn)換。屬性包括標題、作者和類別。不同類別的文章用詞分布不同,同一作者的寫作風格是一致的,標題個人理解可以看做關(guān)鍵詞定基調(diào),相比關(guān)鍵詞語料更豐富。
實驗在新聞、影評和歌詞三大類文本中進行。 該工作作者來自今日頭條,eBay 和清華。
Globally Normalized Reader@zhangjun 推薦
#Question Answering
來自百度的 QA 系統(tǒng),本文已被 EMNLP 2017 接收。
Panoptic Segmentation@YiqiYan 推薦
#Semantic Segmentation
本文提出了一種新的概念 — Panoptic Segmentation,它是對 instance sengmentation 和 semantic segmentation 的統(tǒng)一。
例如一副街景:instance sengmentation 只分割出一些實例,但是要區(qū)分同一類別的個體(分割出車 a,車 b,車 c);semantic segmentation 是把每一個像素分入一個類別,但是不區(qū)分個體;Panoptic Segmentation 既要完成 semantic segmentation 的任務(wù),又要區(qū)分同一個類別的不同個體。
Adversarial Patch@Synced 推薦
#Adversarial Training
該論文提出了一種在現(xiàn)實世界中創(chuàng)建通用、魯棒、針對性的對抗圖像 patch 的方法。該 patch 是通用的,因為它們可用于攻擊任何場景;是魯棒的,因為它們在多種圖像變換中都是有效的;是有針對性的,因為它們可以令分類器輸出任意目標類。
這些對抗樣本可以被打印出來,添加到任意的場景、照片,并展示給圖像分類器;即使 patch 很小,也能導致分類器忽略場景中的其它物體,輸出選定的目標類。
@Aidon 推薦
#Video Captioning
文章指出現(xiàn)有的 captioning 模型都是用交叉熵損失(XE: cross-entropy loss)訓練的,而實際評估的時候用的是其他指標比如 BLEU,METEOR 等。
這里對應的是第一個問題:objective mismatch,很自然地會想到可以直接對評價指標進行優(yōu)化。第二個問題是 exposure bias,即訓練集和測試集上 captions 的分布很有可能是不一樣的。雖然強化學習有被用于解決第一個問題,但它的計算開銷大,并且在每一步都有指定 baseline reward 才能保證模型的收斂。
針對以上問題,文章提出基于一致性的序列訓練來做 video captioning。首先從理論上解釋了 XE training 和 RL training 之間的聯(lián)系,即后者是前者的一個加權(quán)形式;然后引入一個簡單的 WXE pre-training 來近似 RL training,這樣就解決了前面提到的第一個問題。
更進一步地,文章提出用 full REINFORCE 來進行 fine-tune,利用 gt captions 的 consensus score 作為 baseline reward,這樣就可以避免 XE training 帶來的第二個問題。
@zhangjun 推薦
#Video Generation
本文是 MILA 最近的一篇工作,實現(xiàn)了一個根據(jù) text 合成唇同步視頻的架構(gòu),并以奧巴馬做了一個 demo,命名為 ObamaNet。
Demo 地址:http://ritheshkumar.com/obamanet/
Arbitrarily-Oriented Text Recognition@chenhong 推薦
#Text Detection
論文中 2D 圖像的任意方向的字符編碼為 4 個方向的 4 個特征序列表示:左→右,右→左,上→下,下→上(每個方向的特征序列長度相同)。
論文提出一個魯棒性算法,基于 AON 識別規(guī)則和不規(guī)則自然場景字符。基于 top-down,無需檢測字符,直接預測原始圖像整個字符,end-to-end 實現(xiàn)。
本文由 AI 學術(shù)社區(qū) PaperWeekly 精選推薦,社區(qū)目前已覆蓋自然語言處理、計算機視覺、人工智能、機器學習、數(shù)據(jù)挖掘和信息檢索等研究方向,點擊「閱讀原文」即刻加入社區(qū)!
我是彩蛋?
?解鎖新功能:熱門職位推薦!
PaperWeekly小程序升級啦
今日arXiv√猜你喜歡√熱門職位√
找全職找實習都不是問題
?
?解鎖方式?
1. 識別下方二維碼打開小程序
2. 用PaperWeekly社區(qū)賬號進行登陸
3. 登陸后即可解鎖所有功能
?職位發(fā)布?
請?zhí)砑有≈治⑿?#xff08;pwbot01)進行咨詢
?
長按識別二維碼,使用小程序
*點擊閱讀原文即可注冊
關(guān)于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術(shù)平臺。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結(jié)
以上是生活随笔為你收集整理的每周论文清单:对话系统综述,全新中文分词框架,视频生成,文字识别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 今晚直播:GAN在网络特征学习中的应用
- 下一篇: 专题解读 |「知识图谱」领域近期值得读的