分类(二):基于向量空间模型的文本分类
生活随笔
收集整理的這篇文章主要介紹了
分类(二):基于向量空间模型的文本分类
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
2019獨(dú)角獸企業(yè)重金招聘Python工程師標(biāo)準(zhǔn)>>>
????利用向量空間模型進(jìn)行文本分類的思路主要基于鄰近假設(shè)(contiguity hypothesis)。
鄰近假設(shè):
????同一類的文檔會(huì)構(gòu)成一個(gè)鄰近區(qū)域,而不同類的鄰近區(qū)域之間是互不重疊的。
1、Rocchio方法
????Rocchio方法時(shí)基于質(zhì)心或原型將整個(gè)向量空間劃分成多個(gè)區(qū)域,每個(gè)質(zhì)心或原型代表一類,利用質(zhì)心來(lái)定義劃分邊界。
2、KNN,k近鄰,k nearest neighbor
????KNN通過(guò)局部信息來(lái)確定類別邊界,將與測(cè)試文檔最近的k篇文檔所屬的主類賦給該文檔。
轉(zhuǎn)載于:https://my.oschina.net/u/1020238/blog/520192
總結(jié)
以上是生活随笔為你收集整理的分类(二):基于向量空间模型的文本分类的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: [Bugku][Web][CTF] 9-
- 下一篇: 用for循环打印出大写字母的ASCII码