多模态语义分析_情感分析、多模态NLP、多语言翻译...这场NLP知识盛宴不可错过!...
本期報告會邀請了南京理工大學計算機學院教授-夏睿、京東集團副總裁-何曉冬、阿里巴巴達摩院資深算法專家-陳博興三位特邀報告嘉賓,另外還有蘇州大學自然語言處理實驗室周國棟教授進行了開場介紹,北京大學王選計算機研究所萬小軍教授、西湖大學特聘研究員張岳主持了本次報告會。
在本次報告會上,專家們圍繞《文本中的情緒與原因聯(lián)合抽取》、《多模態(tài)自然語言處理與智能人機交互》、《Machine Translation for 45,582 Language Pairs》三大主題展開了精彩報告。
嘉賓分享回顧
首先,北京大學王選計算機研究所萬小軍教授進行了主持,歡迎直播間各位嘉賓的到來。
接著,蘇州大學自然語言處理實驗室周國棟教授進行了簡短的開場介紹。周老師對往期走進高校活動的舉辦效果表示了肯定,并對主辦方和承辦方的精心準備、嘉賓們的到來表示衷心的感謝,祝大家冬至節(jié)日快樂,預祝活動圓滿成功。
? ? ?
隨后,東道主華中師范大學周光有教授向大家介紹了華中師范大學的學校概況、辦學理念和矚目成就,對分享嘉賓和主持人的到來以及承辦方的精心準備表示衷心的感謝。— ? 1 ? —接下來的報告環(huán)節(jié)中,首先進行分享的是南京理工大學計算機學院教授-夏睿老師,分享主題是《文本中的情緒與原因聯(lián)合抽取》。夏老師首先介紹了文本中情緒分析的背景,接著從情緒識別任務過渡到情緒原因抽取,分析了傳統(tǒng)的基于子句獨立建模的情緒原因抽取和它存在的問題,并在此基礎上相繼提出了一種動態(tài)的情緒原因抽取方法,和一種同步的情緒原因抽取方法。夏老師還分析了情緒原因抽取任務原因抽取必須事先標注情緒這樣的一個缺點,提出了情緒和原因的聯(lián)合分析,具體來說是提出了一種情緒和原因配對的抽取的新任務,以及一種兩步走的方法的框架。最后,夏老師介紹了他和團隊進一步將基于parkline的兩步走框架推廣到基于端到端的一體化的情緒原因配對抽取任務上,提出了基于2D表示、交互和預測的模型框架,以及一種基于滑動窗口的多標簽學習的情緒原因抽取框架。在問答環(huán)節(jié),夏老師就同學們提出的關于“數(shù)據(jù)集以后是否會擴充?”、“能否對情感原因抽取做預訓練?”、“多種情感句子怎么處理?”等問題進行了耐心解答。— ? 2 ? —在夏睿老師之后,京東集團副總裁-何曉冬老師進行了題為《多模態(tài)自然語言處理與智能人機交互》的報告。
何老師首先提出了人機對話是翻越“人機交流障礙”的核心技術,接著帶大家回顧了智能對話機器人的發(fā)展歷程,向大家展示了近期對話機器人的新進展:走向大規(guī)模端到端的對話模型,體現(xiàn)出很強的應答有效性和精確性。通過介紹GPT-3模型的優(yōu)勢和目前存在的缺陷,指出最新的超大規(guī)模語言模型實驗帶來了哪些挑戰(zhàn)。隨后何老師通過“導購咨詢對話”的例子簡單探討了復雜任務導向型人機對話的應用。何老師還介紹了自然語言任務的決策優(yōu)化等相關工作在人機對話、多模態(tài)智能、多模態(tài)交互技術等多個方面的研究。最后通過數(shù)字人多模態(tài)交互和商品直播全流程自動化的例子向大家介紹了產(chǎn)業(yè)界對話系統(tǒng)應用的最新進展。
在問答環(huán)節(jié),何老師就大家提出的“京東打算把NLP技術應用于客服培訓領域嗎?”、“研究領域和工業(yè)應用中對話技術的不同點”、“是否有測試客戶對虛擬客服和客服人員的反感程度?”、“小語種和nlp結合如何走進企業(yè)”等問題進行了耐心的解答。
— ? 3 ? —
最后一位進行報告的是阿里巴巴達摩院資深算法專家-陳博興老師,報告主題為《Machine Translation for 45,582 Language Pairs》。
陳老師首先介紹了什么是多語言的神經(jīng)機器翻譯(包括動機、定義和遇到的一些挑戰(zhàn))。然后介紹了針對語言的選擇和清理、龐大的數(shù)據(jù)量和運算量、算法方面的挑戰(zhàn),陳老師團隊做了一些相應的研究(包括基于中介語言的新架構、基于迭代修復的數(shù)據(jù)擴展、整合預訓練模型、加速策略等算法上和工程上的一些改進)。最后陳老師還向大家介紹了多語言的神經(jīng)機器翻譯在阿里巴巴的一些應用:例如為了支持阿里巴巴“全球購買,全球銷售,全球旅游,全球支付,全球運輸”戰(zhàn)略,開發(fā)了NMT系統(tǒng)可以在214種語言之間進行翻譯,這里為了便于擴展和維護,使用了一個模型對所有語言進行翻譯的系統(tǒng)。以及開發(fā)了阿里翻譯等適用于全球用戶學習和使用的翻譯平臺。
最后的問答環(huán)節(jié),陳老師就觀眾們提出的“各語言語料數(shù)據(jù)量相差很大,怎么處理?”、“偽數(shù)據(jù)是否也要進行清洗等預處理操作,在進行改進之前還需要做哪些預操作呢?還有小數(shù)據(jù)一般的最小值是需要多少?”“大語料間的翻譯邏輯會自動遷移到小語料中嗎?”等問題進行了耐心的解答。
— ? 總結 ? —
最后,張岳老師進行了活動總結,再次向參加活動的各位專家學者和華中師范大學以及AI研習社表示感謝,并期待更多的專家、老師和同學能持續(xù)關注NLP領域的研究進展,一起推動這一領域繼續(xù)向前發(fā)展。
此后還將會有更多的高校加入CCF -NLP走進高校系列活動,下一站分享活動已經(jīng)定于2021年1月17日(星期日) 18:30-21:55 走進天津大學&南開大學,更多分享會信息請持續(xù)關注“AI科技評論”和AI研習社官網(wǎng)(https://www.yanxishe.com/)。
主辦方介紹
中國計算機學會自然語言處理專委會(CCF-NLP)1987年10月成立, 專委會成立之初即確定了“中國語言文字處理的計算機系統(tǒng)”和“以計算機為工具研究語言文字處理技術”兩個主要研究方向,主要包括(或涉及)中國各民族語言文字的自然語言處理、機器翻譯、信息抽取、數(shù)據(jù)挖掘、信息檢索、智能問答、語音識別與合成、社會網(wǎng)絡計算等眾多學術領域,以及中文計算,即中國語言文字處理的應用技術領域。專委會致力于團結、聯(lián)合、組織中文信息技術相關領域的各界專業(yè)人士,開展學術/技術交流、發(fā)展戰(zhàn)略研究、專業(yè)技術標準制定、專業(yè)技術評測、專業(yè)培訓等相關活動,提高中文信息技術領域的科研、教學、應用水平,促進研究成果的應用和向產(chǎn)品的轉(zhuǎn)化,提升在國家科技活動和國際學術方面的影響力。
承辦方介紹
華中師范大學位于九省通衢的湖北省武漢市,坐落在武昌南湖之濱的桂子山上,占地面積120余萬平方米,是國家教育部直屬重點綜合性師范大學,是國家“211工程”重點建設大學、國家教師教育“985工程優(yōu)勢學科創(chuàng)新平臺”建設高校和國家首批“雙一流”建設高校。學校現(xiàn)有國家“雙一流”建設學科2個、國家重點學科8個。根據(jù)USNews發(fā)布的2020世界大學排行榜數(shù)據(jù),華中師范大學排名第477位,在內(nèi)地高校排名第30位。學校從戰(zhàn)略上進行定位,通過“信息化”和“國際化”,建設一流文科、高水平理科和有特色工科,成為教育信息化研究與實踐的引領者。
活動背景
為了促進更多師生對自然語言處理前沿進展的了解,幫助在校計算機及相關專業(yè)大學生成長和發(fā)展,CCF-NLP致力于讓領域內(nèi)的權威大牛們走進更多的高校,與師生進行溝通和交流。這是成為我國NLP領域發(fā)展的迫切需求。自然語言處理專委會為此將舉辦一系列 CCF -NLP走進高校系列活動。CCF-NLP后續(xù)還將與更多高校合作,繼續(xù)召開一系列的“走進高校”分享活動,進一步促進各高校之間的學術交流,推動科研合作發(fā)展,為 NLP 的研究添磚加瓦。
以下為本次活動的視頻回放地址:
https://www.yanxishe.com/events/ccf-nlp-ccnu
總結
以上是生活随笔為你收集整理的多模态语义分析_情感分析、多模态NLP、多语言翻译...这场NLP知识盛宴不可错过!...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 21度适合穿什么衣服 21度适合穿的的衣
- 下一篇: 建行生活卡