如何构建行业知识图谱 (以医疗行业为例)
The world is not made?of?strings,but is made of things.
?— 辛格博士,from?Google
隨著人工智能走到臺前,人們越來越認識到,場景才是盤活存量數據、吸附和創造增量數據,最終產生更加強大智能的核心。數據驅動的人工智能正在朝著場景驅動的人工智能發展。如果要用數字化給一個行業賦能,那么機器首先要理解這個行業,而理解這個行業的最直接的表現就是能夠玩轉這個行業的知識圖譜。可以說,知識圖譜,是場景的骨架和靈魂,是把更多行業知識、領域知識轉化為數字化生產力的知識基礎設施。
以電商行業為例,阿里巴巴生態積累了海量的商品數據,這些寶貴的數據來自淘寶、天貓、1688、AliExpress等多個市場,同時品牌商、行業運營、治理運營、消費者、國家機構、物流商等多種角色參與其中,貢獻并校正著這樣一個龐大的商品庫。阿里基于以上數據庫建立起了知識圖譜,打造全網商品智能服務體系,被廣泛應用于搜索、前端導購、平臺治理、智能問答、品牌商運營等核心、創新業務,為阿里生態的營收立下了汗馬功勞。
與此同時,國內的知識圖譜創業公司近年來開始涌現。一些大數據公司開始在自己的名字后面加上“知識圖譜”四個字,以更好地承接業務。為避免與BAT直接交鋒,創業公司們另辟蹊徑,切入智能客服、金融、法律、公安、航空、醫療等 “知識密集型”行業,在知識圖譜這片藍海中分別找到了自己的定位和市場。
“知識圖譜”百度搜索指數逐年提升,近幾年“越來越火”
隨著知識圖譜技術在搜索、聊天機器人、大數據風控、智能醫療、證券投資、推薦系統等行業的應用以及各類企業的入場,相關人才需求逐年增加,供不應求。在各大主流招聘網站上,可以看到知識圖譜工程師的薪資普遍高于其他AI領域。越來越多技術人員開始轉向知識圖譜領域的研發,但是由于知識圖譜知識點廣,可參考的資料不多,同時線上線下有價值的知識圖譜實戰類課程極少,給知識圖譜的入門和能力提升帶來極大困難。
圖片來源于招聘網站Boss直聘
基于此,深藍學院聯合國內知識圖譜領域的知名學者,增開第三期知識圖譜線下集訓課程,地點定于北京。集訓為時4天,致力于通過8個半天和4個晚自習的高強度課程學習&實踐,即學即練,幫助學員系統掌握知識圖譜各個生命周期的主流核心技術,學會如何獨立實現一個基于知識圖譜的問答系統,并最終構建行業知識圖譜。(本次集訓以構建醫療行業知識圖譜為教學實戰案例)
本次集訓提供所有代碼、說明文檔及操作視頻(如下所示),為了確保學員的實戰效果,還另外安排一個月的線上答疑和實戰項目指導。
講師介紹
曾博,高校講師,中科院自動化所模式識別國家重點實驗室博士,主要研究方向為信息抽取、知識圖譜、自然語言處理,迄今在包括ACL、EMNLP、COLING、IJCAI等國際頂級會議上發表多篇學術論文,曾獲得COLING、CCL最佳論文獎。主持多項國家自然科學基金青年基金、湖南省自然科學基金等項目,參與了國家自然科學基金、國家重點基礎研究發展計劃(973計劃)及華為等多個科研項目,具有豐富的知識圖譜落地實踐經驗。本次集訓適合誰參加
1. 研究方向與知識圖譜相關的碩博研究生
2. 想成為或者轉型做知識圖譜工程師的學員
3. 計劃拓展知識圖譜相關業務、想提升團隊專業素質的企業人員
完成本次集訓你將獲得哪些技能
集訓課程大綱
實踐項目介紹
前兩期現場回顧
第一期和第二期集訓地點分別設在北京、上海,目前均已經順利收官!報名的學員里有來自華為、航旅縱橫等企業人員以及來自中科院、國防科大、中國人民大學、北航、中南大學、浙江工業大學、山東大學、南京大學等科研院所的學生。圖為第一期知識圖譜線下集訓現場,講師正在授課、答疑
圖為第二期知識圖譜線下集訓現場,講師正在授課、答疑
圖為第一期知識圖譜線下集訓師生合影
圖為第二期知識圖譜線下集訓師生合影
第三期集訓的時間、地點、費用等其他信息
時間:2019年10月24日(周四)- 27日(周日)地點:北京?(具體地點將在答疑群里同步給大家)
剩余名額:8
費用:4999元,學費將主要用于Cover場地+人力成本+學習材料等相關費用。
需要具備的基礎:線性代數和概率論基本概念、Python 3基礎知識、最好可以了解深度學習基礎知識(卷積神經網絡、循環神經網絡等)
完成集訓將獲得:全套紙質版講義、實踐項目所有代碼、80篇知識圖譜精選論文、《知識圖譜》《知識圖譜:方法、實踐與應用》(兩本專業書籍可任選一本)
如何申請參加本次集訓
注:本文含商業推廣內容
點擊“閱讀原文”,查看集訓詳細安排總結
以上是生活随笔為你收集整理的如何构建行业知识图谱 (以医疗行业为例)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Nature论文解读:深度学习助力毫秒之
- 下一篇: 系统的u盘还原系统怎么办啊 如何使用U盘