【ACL2020】Relabel the Noise: Joint Extraction of Entities and Relations via Cooperative Multiagents
生活随笔
收集整理的這篇文章主要介紹了
【ACL2020】Relabel the Noise: Joint Extraction of Entities and Relations via Cooperative Multiagents
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
文章目錄
- 1.本文問題
- 2.方法
- 3.用于
- 4. 結(jié)論
1.本文問題
解決問題:
- 去噪
- shifted label distribution
- 普遍存在此問題,但大家都不解決,只著重于拋棄噪聲實例
- 遠程監(jiān)督標記的噪聲數(shù)據(jù)(KB)和人類標注的測試集分布不同
- shifted label distribution
- pipeline
- pipeline會增加噪聲的傳遞–傳遞錯誤
2.方法
本文方法:多智能體合作重新標注噪聲實例的聯(lián)合模型
- 細粒度地處理
- 原來:舍棄或留下,二選一,僅對FP
- 本文:分配置信度,重新標記
- 選擇目標:噪聲實例
- 輸入
- KG embedding: transE–type embedding
- extractor:
- PCNN(僅有關(guān)系抽取,實體部分使用CoType)
- CoType(比PCNN好,因為PCNN是pipeline的
- 多智能體MRL
- 每個智能體從自己的角度單獨計算一個連續(xù)的置信度
- 相互獨立–分散的
- 利用實體和關(guān)系之間的關(guān)聯(lián)性,
- curriculum +PPO:
- reward大于threshold,或者隊列滿了–使用PPO學(xué)習(xí)agent策略
- curriculum learnin:
- 隊列和采樣的目的:加強任務(wù)之間的交互信息和加強agent的探索
- 每個智能體從自己的角度單獨計算一個連續(xù)的置信度
- confident consensus module:聚合多智能體的智慧
- 置信度:
- 連續(xù)
- 使用置信度重新分布noisy training data 用于調(diào)整loss
- 使用RL去探索合適的標簽分布,通過使用置信標簽重分布訓(xùn)練集
- 這個方法實用,并且是robust的
- 并不使用真實世界應(yīng)用的測試集的信息:不引入真實世界的額外的知識
3.用于
本文方法可作為post-processing plugin:DS,WS
4. 結(jié)論
- joint>pipeline
- MRL>joint:
- MRL可以重新標記實例
總結(jié)
以上是生活随笔為你收集整理的【ACL2020】Relabel the Noise: Joint Extraction of Entities and Relations via Cooperative Multiagents的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 秒懂系列 | 史上最简单的Python
- 下一篇: 顺序栈的介绍及实现