BadRank
BadRank是通過spam種子來發現更多的spam頁面的一種方法。該方法基于的假設是:指向spam頁面的頁面通常也是spam頁面(TrustRank假設的逆否)。將WEB的所有鏈接反向,得到反向的WEB圖。人工選擇一些spam頁面種子,在pagerank中的初始向量d中,這些種子對應的分量置1,其余為0。然后對d做一下規一化處理。最后在反向圖上,利用該d跑偏向性的pagerank算法,得到的pagerank值即為BadRank值,該值越高說明是spam的機率越大。
總結
- 上一篇: 《Microsoft Sql serve
- 下一篇: TI Davinci DM6446 开发