Keras命名体识别(NER)实战---自然语言处理技术
生活随笔
收集整理的這篇文章主要介紹了
Keras命名体识别(NER)实战---自然语言处理技术
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
命名體識別(Name Entity Recognition)是自然語言處理(Nature Language Processing)領域中比較重要的一個任務,幾乎百分之50的和文本處理有關的項目中都會涉及到命名體識別。筆者認為其中最關鍵的原因是:從廣義的角度來講,如果把一句話比作一串珍珠的話,命名實體就是這串珍珠項鏈中的珍珠,句子的其他部分是把珍珠串起來的線。
舉個例子: "小明在1992年從哈佛大學畢業 "
其中小明,1992年,哈佛大學都是命名實體,而這些實體包含了這句話里面的極為重要信息:人物信息,時間信息,還有組織信息。而其他的詞將這些實體串起來,才能表達出這句話完整的語義。
而在一些專業領域,比如化學,醫藥領域,經常出現一些四氧化三鐵,阿爾茲海默癥等專業詞匯,如果只通過簡單的分詞很難將這些重要的關鍵詞匯識別出來。而在這樣的場景下,NER就能發揮出它的威力了。
總而言之,NER 的任務就是要將這些包含信息的或者專業領域的實體給識別出來。這個過程是不是很像在一串珍珠項鏈里面識別出寶貴的珍珠(這個比喻筆者覺得只能算湊合)。
NER任務簡介
NER是一個序列標注任務,和分詞,詞性標注的任務屬同一類。任務的輸入是一串序列,輸出也是一串序列。例子如下:
輸入:[北,京,天,氣,真,不,錯]
輸出:[1,2,0,0,0
總結
以上是生活随笔為你收集整理的Keras命名体识别(NER)实战---自然语言处理技术的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 基于 Kafka 与 Debezium
- 下一篇: 深度学习核心技术精讲100篇(十)-机器