8天 = 4万元奖金 + CNCC参会资助 | 2019科研文本理解比赛
生活随笔
收集整理的這篇文章主要介紹了
8天 = 4万元奖金 + CNCC参会资助 | 2019科研文本理解比赛
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
2019年10月2日,DiggScience 2019正式開始。本次比賽由AMiner ,Microsoft ,北京智源人工智能研究院和biendata聯合組織。本次比賽要求選手提出可以理解和匹配科研文本的方法,預測論文引用和論文描述的關系。比賽預計將于2019年10月12日結束。獲獎選手將分享4萬元獎金,并獲資助參加2019年中國計算機大會(CNCC 2019)上組織的頒獎儀式。比賽鏈接:https://biendata.com/competition/digsci2019/科學研究已經成為現代社會創新的主要動力。大量科研數據的積累也讓我們可以理解和預測科研發展,并能用來指導未來的研究。論文是人類最前沿知識的媒介,因此如果可以理解論文中的數據,可以極大地擴充計算機理解知識的能力和范圍。在論文中,作者經常會引用其他論文,并對被引論文做出對應描述。如果我們可以自動地理解、識別描述對應的被引論文,不僅可以加深對科研脈絡的理解,還能在科研知識圖譜、科研自動問答系統和自動摘要系統等領域有所進步。
比賽任務
本次比賽將提供一個論文庫(約含20萬篇論文),同時提供對論文的描述段落,來自論文中對同類研究的介紹。參賽選手需要為描述段落匹配三篇最相關的論文。例子:
描述An efficient implementation based on BERT [1] andgraph neural network (GNN) [2] is introduced.相關論文:
[1] BERT: Pre-training of deep bidirectional transformers for language understanding.
[2] Relational inductive biases, deep learning, and graph networks.
數據描述
本次比賽要求選手根據一句或一段科研描述,匹配3篇最相關的論文。1.?candidate.csv候選的論文數據集,內含大約20萬篇論文,其中有一部分已經在訓練集中匹配了句子。選手需要從中選擇論文匹配驗證集中的句子。格式如下:
- paper_id論文ID- title?? ?論文標題
- abstract?? ?論文摘要- journal?論文所在期刊- keywords論文關鍵詞
?2.?train_release.csv
訓練集,包括句子和匹配的論文ID。格式如下:
- description_id描述科研的句子或段落的ID- paper_id匹配論文的ID
- description_text對科研的描述的文本(有時為句子,有時為一段話)。論文原來的引標用“[**##**]”代替。如:Rat brain membrane preparation and opioid binding wasperformed as described previously by Loukas et al. [[**##**]]. Briefly, bindingwas performed in Tris-HCl buffer (10 mM, pH 7.4), in a final volume of 1.0 ml.The protein concentration was 300 μg/assay.在這句中,對應的論文應該與“Rat brain membrane preparation and opioid binding wasperformed as described previously by Loukas et al. ”這句描述相關。3.?validation_release.csv與train.csv格式相同,但是沒有paper_id ,需要選手自己匹配。
?
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 報名參賽
總結
以上是生活随笔為你收集整理的8天 = 4万元奖金 + CNCC参会资助 | 2019科研文本理解比赛的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: iPhone11成上半年最畅销手机 共
- 下一篇: 工行薪金溢5号的利弊