直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取
「AI Drive」是由 PaperWeekly 和 biendata 共同發起的學術直播間,旨在幫助更多的青年學者宣傳其最新科研成果。我們一直認為,單向地輸出知識并不是一個最好的方式,而有效地反饋和交流可能會讓知識的傳播更加有意義,從而產生更大的價值。
本期 AI Drive,我們邀請到浙江大學助理研究員張寧豫,為大家帶來長文本知識抽取:基于語義分割的文檔級三元組關系抽取專題報告。對本期主題感興趣的小伙伴,9?月 29 日(本周三)晚 7 點,我們準時相約 PaperWeekly 直播間。
直播信息
關系抽取 (Relation Extraction) 是從純文本中提取未知關系事實。過去的關系抽取方法主要將注意力集中于抽取單個實體對在某個句子內反映的關系,然而單句關系抽取在實踐中受到不可避免的限制:在真實場景如醫療、金融文檔中,有許多關系事實是蘊含在文檔中不同句子的實體對中的,且文檔中的多個實體之間,往往存在復雜的相互關系。文檔級關系抽取旨在從文檔中抽取多個實體對之間的關系,然而現有的基于 graph 或基于 transformer 的模型僅單獨地使用實體對,而未考慮關系三元組之間的全局信息。
在本文中,我們創新性地提出 DocuNet 模型,將文檔級關系抽取任務類比于計算機視覺中的語義分割任務。DocuNet 模型利用編碼器模塊捕獲實體的上下文信息,并采用 U-shaped 分割模塊在 image-style 特征圖上捕獲三元組之間的全局相互依賴性,通過預測實體級關系矩陣來捕獲 local 和 global 信息以增強文檔級關系抽取。實驗結果表明,我們的方法可以在三個基準數據集 DocRED,CDR 和 GDA 上獲得 SOTA 性能。
論文標題:
Document-level Relation Extraction as Semantic Segmentation
論文鏈接:
https://www.ijcai.org/proceedings/2021/0551.pdf
本次分享的具體內容有:?
背景介紹:關系抽取的簡單介紹
研究動機:文檔級關系抽取的難點與挑戰
具體方法:介紹提出的模型的主要架構
實驗結果:在基準數據集上與之前方法的對比與分析
工作總結:總結與展望
嘉賓介紹
?張寧豫?/ 浙江大學軟件學院助理研究員?
張寧豫,博士,浙江大學軟件學院助理研究員,阿里巴巴-浙江大學前沿技術聯合研究中心(AZFT)研究員,主要研究方向為知識圖譜、大數據系統、自然語言處理等,曾在 WWW、KDD、WSDM、AAAI、IJCAI、ACL、ENNLP、NAACL、ACMMM、IEEE TASLP 等國際頂級學術會議和期刊發表多篇論文。
直播地址?& 交流群
本次直播將在 PaperWeekly 視頻號和 B 站直播間進行,掃描下方海報二維碼或點擊閱讀原文即可免費觀看。線上分享結束后,嘉賓還將在直播交流群內實時 QA,在 PaperWeekly 微信公眾號后臺回復「AI Drive」,即可獲取入群通道。
視頻號直播間:
掃描下方二維碼關注 PaperWeekly 視頻號,第一時間獲取開播提醒。
B 站直播間:
https://live.bilibili.com/14884511
合作伙伴
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
·
總結
以上是生活随笔為你收集整理的直播预告 | 长文本知识抽取:基于语义分割的文档级三元组关系抽取的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WWW 2021最佳论文亚军:基于属性补
- 下一篇: 《失控玩家》爆火背后:什么才是拥抱人工智