CRF++ 特征工程
生活随笔
收集整理的這篇文章主要介紹了
CRF++ 特征工程
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
Name Entity Recognition(命名實(shí)體識(shí)別) - 知乎
特征除了人工的方式還可以用深度學(xué)習(xí)的方式提取
可嘗試的特征:
1.Bag of word features
--當(dāng)前詞:Colin
--前后詞:prefessor,proposed
--bigram: Prefessor Colin,Colin proposed
2.詞性相關(guān)的
--當(dāng)前詞:名詞
--前后詞:名詞,動(dòng)詞
3.前綴 or 后綴
當(dāng)前詞:Co,in
前后詞:pr,ed,or
4.單詞特點(diǎn)
--詞長
--是否包含大寫?
--統(tǒng)計(jì)多少個(gè)大寫?
--是否包含"-"
--是否包含數(shù)字
5.stemming(可以先用統(tǒng)計(jì)的算法得到) + 單詞特征
6.句法特征
--語法(句法分析 ,Parsing)
通過cky(動(dòng)態(tài)規(guī)劃)算法獲取語法樹
--依賴關(guān)系(Dependency Parsing)
總結(jié)
以上是生活随笔為你收集整理的CRF++ 特征工程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jieba分词实现原理(C++版 + p
- 下一篇: 自然语言理解难在哪儿?