机器学习(二十三)——Beam Search, NLP机器翻译常用评价度量, 模型驱动 vs 数据驱动
https://antkillerfarm.github.io/
Beam Search
Beam Search(集束搜索)是一種啟發(fā)式圖搜索算法,通常用在圖的解空間比較大的情況下,為了減少搜索所占用的空間和時間,在每一步深度擴(kuò)展的時候,剪掉一些質(zhì)量比較差的結(jié)點,保留下一些質(zhì)量較高的結(jié)點。
這樣減少了空間消耗,并提高了時間效率,但缺點就是有可能存在潛在的最佳方案被丟棄,因此Beam Search算法是不完全的,一般用于解空間較大的系統(tǒng)中。
上圖是一個Beam Search的剪枝示意圖。
Beam Search主要用于機(jī)器翻譯、語音識別等系統(tǒng)。這類系統(tǒng)雖然從理論來說,也就是個多分類系統(tǒng),然而由于分類數(shù)等于詞匯數(shù),簡單的套用softmax之類的多分類方案,明顯是計算量過于巨大了。
PS:中文驗證碼識別估計也可以采用該技術(shù)。
參見:
http://people.csail.mit.edu/srush/optbeam.pdf
Optimal Beam Search for Machine Translation
http://www.cnblogs.com/xxey/p/4277181.html
Beam Search(集束搜索/束搜索)
http://blog.csdn.net/girlhpp/article/details/19400731
束搜索算法(Andrew Jungwirth 初稿)BEAM Search
NLP機(jī)器翻譯常用評價度量
機(jī)器翻譯的評價指標(biāo)主要有:BLEU、NIST、Rouge、METEOR等。
參考:
http://blog.csdn.net/joshuaxx316/article/details/58696552
BLEU,ROUGE,METEOR,ROUGE-淺述自然語言處理機(jī)器翻譯常用評價度量
http://blog.csdn.net/guolindonggld/article/details/56966200
機(jī)器翻譯評價指標(biāo)之BLEU
http://blog.csdn.net/han_xiaoyang/article/details/10118517
機(jī)器翻譯評估標(biāo)準(zhǔn)介紹和計算方法
http://blog.csdn.net/lcj369387335/article/details/69845385
自動文檔摘要評價方法—Edmundson和ROUGE
https://mp.weixin.qq.com/s/XiZ6Uc5cHZjczn-qoupQnA
對話系統(tǒng)評價方法綜述
模型驅(qū)動 vs 數(shù)據(jù)驅(qū)動
最近閱讀了這篇文章,深有感慨:
https://mp.weixin.qq.com/s/N7DE0kvf8THhJQwroHj4vA
成不了AI高手?因為你根本不懂?dāng)?shù)據(jù)!聽聽這位老教授多年心血練就的最實用統(tǒng)計學(xué)
注:吳喜之教授是我國著名的統(tǒng)計學(xué)家,退休前在中國人民大學(xué)統(tǒng)計學(xué)院任統(tǒng)計學(xué)教授。吳教授上世紀(jì)六十年代就讀于北京大學(xué)數(shù)學(xué)力學(xué)系,八十年代出國深造,在美國北卡羅來納大學(xué)獲得統(tǒng)計學(xué)博士學(xué)位,是改革開放之后第一批留美并獲得統(tǒng)計學(xué)博士學(xué)位的中國學(xué)者。多年來吳教授在國內(nèi)外數(shù)十所高校講授統(tǒng)計學(xué)課程,在國內(nèi)統(tǒng)計學(xué)界享有盛譽(yù)。其知名的學(xué)生有李艦和劉思喆。
李艦,從2003年開始,一直把R當(dāng)作隨身武器奮戰(zhàn)在統(tǒng)計學(xué)和數(shù)據(jù)分析的第一線,是Rweibo、Rwordseg、tmcn等高質(zhì)量R包的作者,在業(yè)界積累了大量的經(jīng)驗,目前供職于Mango Solutions(中國),任數(shù)據(jù)總監(jiān)。
劉思喆,2012至2016年就職于京東商城,推薦系統(tǒng)平臺部高級經(jīng)理,主要負(fù)責(zé)和推薦系統(tǒng)離線、在線相關(guān)的用戶行為、商品特征的建模,以及數(shù)據(jù)監(jiān)控平臺。因工作業(yè)績,在《京東技術(shù)解密》一書中獲“數(shù)據(jù)達(dá)人”稱號。
總結(jié)
以上是生活随笔為你收集整理的机器学习(二十三)——Beam Search, NLP机器翻译常用评价度量, 模型驱动 vs 数据驱动的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深度学习(十二)——Winograd(2
- 下一篇: 深度学习(十三)——花式池化, Batc