会议交流 - CNCC 技术论坛 | NLP中知识和数据怎么选?当然是全都要!——第四届中文信息技术发展战略研讨会...
本文轉(zhuǎn)載自公眾號:中國計算機學會 。
本論壇將于CNCC2020期間,10月23日下午16:00-18:00,在北京新世紀日航飯店3層南京廳舉行。本論壇將邀請多位來自國內(nèi)著名高校和人工智能企業(yè)的知名自然語言處理專家介紹他們在知識圖譜、知識獲取、預訓練模型、表示學習等方面的最新研發(fā)進展。歡迎光臨!
自然語言處理技術是人工智能技術的最重要分支之一,被譽為“人工智能皇冠上的明珠”。近年來,各種來源的標注數(shù)據(jù)、未標注數(shù)據(jù)、自然標注數(shù)據(jù)為基于機器學習、深度學習的自然語言處理提供了海量的訓練語料,為自然語言處理算法性能的巨大提升提供了數(shù)據(jù)保障;知識圖譜、百科知識、問答知識等知識資源為自然語言處理技術的實用化進一步插上了翅膀。本次論壇將以融合知識和數(shù)據(jù)的自然語言處理為主題,邀請多位來自國內(nèi)著名高校和人工智能企業(yè)的知名自然語言處理專家介紹他們在知識圖譜、知識獲取、預訓練模型、表示學習等方面的最新研發(fā)進展。
講者簡介
浙江大學
陳華鈞
報告一題目: 知識圖譜與低資源學習
報告摘要: 低資源是很多真實業(yè)務問題所面臨的迫切挑戰(zhàn),本報告嘗試探討知識圖譜與低資源問題之間的關系。一方面,討論低資源條件下知識圖譜的構(gòu)建與推理問題,分別介紹了對抗關系學習(Adversarial Relational Learning),元關系學習(Meta Relational Learning)以及融合圖神經(jīng)網(wǎng)絡等不同方法在長尾關系抽取、少樣本關系預測等方面的應用。另外一方面,進一步探討知識圖譜與零樣本學習(Zero-shot Learning)之間的關系,提出利用知識圖譜建模標簽語義空間可以更加有效實現(xiàn)零樣本條件下的知識遷移,同時增強零樣本學習的可解釋性。
報告人簡介: 陳華鈞博士,浙江大學計算機科學與技術學院教授/博導,主要研究方向為知識圖譜、自然語言處理、大數(shù)據(jù)系統(tǒng)、智能生物醫(yī)藥等。浙大阿里知識引擎聯(lián)合實驗室主任、浙江省大數(shù)據(jù)智能計算重點實驗室副主任、愛思唯爾Elsevier Big Data Research 主編、CCF杰出演講者、中國人工智能學會知識工程與分布智能專業(yè)委員會副主任、中國中文信息學會語言與知識計算專業(yè)委員會副主任、中文開放知識圖譜OpenKG牽頭發(fā)起人。在WWW/WSDM/ISWC, IJCAI/AAAI/KR, ACL/EMNLP/NAACL, VLDB/ICDE, ?IEEE Computational Intelligence, IEEE Intelligent System, TKDE, AI in Medicine 等國際頂級會議或期刊上發(fā)表多篇論文,并曾獲國際語義網(wǎng)會議ISWC2006最佳論文獎(第一作者)。作為負責人主持國家自然科學基金重點項目、國家重點研發(fā)計劃項目、國家重大科技專項項目及企業(yè)合作項目等二十余項。曾獲得教育部技術發(fā)明一等獎、國家科技進步二等獎、阿里巴巴優(yōu)秀學術合作獎、博文視點圖書獎等獎勵。
清華大學
劉知遠?
報告二題目: 開放域知識獲取技術及其挑戰(zhàn)
報告摘要: 從海量文本中自動獲取結(jié)構(gòu)化知識,是構(gòu)建和擴展大規(guī)模知識圖譜,實現(xiàn)知識指導的自然語言處理的關鍵技術。現(xiàn)有實體關系抽取技術,主要從單句中挖掘?qū)嶓w關系的語義模式,面臨知識覆蓋度低等問題。如何面向開放領域的復雜語境進行建模,是知識獲取面臨的關鍵挑戰(zhàn)之一。本報告將主要介紹在文檔級關系抽取、少次學習關系抽取、新類型關系識別等方面的最新進展,并展望開放域關系抽取的未來發(fā)展方向。
報告人簡介: 劉知遠博士,清華大學計算機系副教授、博士生導師。主要研究方向為表示學習、知識圖譜和社會計算。2011年獲得清華大學博士學位,已在ACL、IJCAI、AAAI等人工智能領域的著名國際期刊和會議發(fā)表相關論文80余篇,Google Scholar統(tǒng)計引用超過1萬次。承擔多項國家自然科學基金。曾獲中文信息學會青年創(chuàng)新獎,入選《麻省理工科技評論》“35歲以下科技創(chuàng)新35人”中國區(qū)榜單(MIT TR-35 China)、智源青年科學家、中國科協(xié)青年人才托舉工程。
微軟亞洲研究院
段楠
報告三題目: Learning Universal Representations via Multitask Multilingual Multimodal Pre-training
報告摘要:In this talk, we will first review the most representative pre-trained models and then present a Multitask Multilingual Multimodal Pre-trained model (M^3P) that combines multilingual-monomodal pre-training and monolingual-multimodal pre-training into a unified framework via multitask learning. This model learns universal representations that can map objects occurred in different modalities or expressed in different languages to vectors in a common semantic space. To verify the generalization capability of M3P, we fine-tune the pre-trained model for different types of downstream tasks: multilingual image-text retrieval, multilingual image captioning, multimodal machine translation, multilingual natural language inference and multilingual text generation. Evaluation shows that M3P can (i) achieve comparable results on multilingual tasks and English multimodal tasks, compared to the state-of-the-art models pre-trained for these two types of tasks separately, and (ii) obtain new state-of-the-art results on non-English multimodal tasks in the zero-shot or few-shot setting. In the last part, we will present our current progress and future plan on learning better universal representations based on different types of knowledge.
報告人簡介: 段楠博士,微軟亞洲研究院高級研究員/研究經(jīng)理,從事包括自動問答、語義分析、多語言多模態(tài)預訓練、機器推理等在內(nèi)的自然語言處理基礎研究,多項成果用于必應搜索、必應廣告、微軟新聞、語音助手等人工智能產(chǎn)品。CCF A/B類會議發(fā)表學術論文80余篇,著有《智能問答》。
論壇:融合知識和數(shù)據(jù)的自然語言處理
嘉賓:陳華鈞 浙江大學,劉知遠 清華大學,段楠 微軟亞洲研究院,趙軍 中科院自動化所,邱錫鵬 復旦大學
論壇主題:3位講者和2位論壇嘉賓將同臺就融合知識和數(shù)據(jù)的自然語言處理技術的發(fā)展和應用場景進行進一步研討。專家與聽眾互動,展現(xiàn)更多角度的觀點,啟發(fā)與會者對知識和數(shù)據(jù)在自然語言處理中如何作用和融合的更深認識。
嘉賓簡介:
趙軍,中國科學院自動化研究所模式識別國家重點實驗室研究員,博士生導師;中國科學院大學人工智能學院崗位教授。研究領域為自然語言處理、知識圖譜等。發(fā)表論文80余篇,谷歌學術引用9千余次。曾獲第25屆國際計算語言學大會COLING 2014最佳論文獎,曾獲2018年度中國中文信息學會“錢偉長中文信息處理科學技術獎”一等獎。在中國科學院大學主講《知識圖譜導論》等課程,主持編著《知識圖譜》一書入選國家十三五重點圖書出版規(guī)劃。
嘉賓簡介:
邱錫鵬博士,復旦大學計算機科學技術學院教授,博士生導師,于復旦大學獲得理學學士和博士學位。主要從事自然語言處理、深度學習等方向的研究,發(fā)表CCF-A類論文30余篇,獲ACL2017杰出論文獎,CCL 2019最佳論文獎,領導開發(fā)了被廣泛使用的開源自然語言處理框架FudanNLP和FastNLP,獲中國中文信息學會“錢偉長中文信息處理科學技術獎青年創(chuàng)新一等獎”,中國科協(xié)人才托舉工程,Aminer “2020年度AI 2000人工智能全球最具影響力提名學者”。
點擊“閱讀原文”,報名參會。
?
?
OpenKG
開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進知識圖譜和語義技術的普及和廣泛應用。
總結(jié)
以上是生活随笔為你收集整理的会议交流 - CNCC 技术论坛 | NLP中知识和数据怎么选?当然是全都要!——第四届中文信息技术发展战略研讨会...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 论文浅尝 | 面向多语言语义解析的神经网
- 下一篇: 论文浅尝 | 面向开放域的无监督实体对齐