人肉搜索引擎
實際上,這里所說的人肉搜索引擎就是指更多的利用人工參與來提純搜索引擎提供的信息的一種機制。貓撲的人肉搜索引擎就是其中一個比較成功的例子。后面我們會根據貓撲的人肉搜索引擎給出一個更加具體的描述。
針對搜索引擎的Link Farm和Spam也許永遠不會停止,因為他們能夠從他們的作惡中得到利益。我們知道得到利益不是作惡的唯一原因,然而大規模的工業化的作惡唯一的原因當然是那樣可以得到利益。
所以,這是一場永遠無法結束的戰爭,只要搜索引擎還是應用最廣泛的一種互聯網應用,只要搜索引擎還是用戶用戶找到合適服務的最主要手段,這就是一場永遠無法結束的戰爭。很多人把問題歸結于PageRank技術,歷史是何其相似啊,當年人們也是這樣地抱怨META關鍵字和描述技術。也許Google或者其他的公司能夠研究出來更加偉大的技術(注一)來取代PageRank,但是誰知道這新的技術什么時候又會變成明日黃花。
搜索引擎是利用機器自動化的收集網絡信息并有序化的一種技術。搜索引擎高效快速,然而因為現在人工智能并不完善,搜索引擎還很難甄別刻意的修飾過的信息,所以SEO Spam才會那么猖獗。所以,有些人想從搜索引擎的反面來解決問題,那就是更多的利用人工把搜索引擎得到的信息進一步萃取,進一步有序化,我們稱之為人肉搜索引擎。
很多人知道的中國有一個叫做貓撲的論壇,人氣非常旺。Tiny在2001年到2004年期間是這個論壇的忠實用戶。在我的印象中,人肉搜索引擎的概念應該出自于貓撲。
跟很多論壇一樣,貓撲上面也經常有人問這個問題那個問題。同時貓撲有種虛擬貨幣叫做Mp,問問題的人往往會用Mp來獎勵可以幫助他們的人。雖然Mp不能吃不能喝,但是還是很多人醉心于掙取更多的Mp(注二)。那些慣于通過回答問題掙取Mp的人在貓撲一般叫做賞金獵人。
于是很有趣味的一幕出現了,某人需要解決一個問題,就在貓撲發貼并許與一定數量的Mp作為酬謝。很快,就會有賞金獵人看到這個貼子,他們就會去用搜索引擎來尋找問題的答案,然后爭先恐后地把找到的答案回在帖子里面邀功。最后,提問題的人得到了答案,賞金獵人得到了Mp,皆大歡喜。這也就形成了所謂的人肉搜索引擎的機制。有趣的是,我們可以發現人肉搜索引擎的搜索流程和搜索引擎在不同服務器之間的分布式搜索流程看起來是那么的相似,區別僅僅在于發動和執行流程的是人,還是機器。
人肉搜索引擎的質量怎樣保證呢?這是一個非常有趣的問題,從剛才的流程上大家可以發現,如果有足夠多的賞金獵人,他們之間就會產生競爭,尋找資料速度的競爭,資料準確性的競爭。競爭的結果是,一個速度又快資料又準確全面的賞金獵人會有越來越多的Mp,這會給他帶來更多的成就感(注三),同時他也會更加的醉心于賞金獵人的工作。甚至,據我所知很多賞金獵人會形成自己的職業道德和行為準則,這樣可以給他們更大的自我實現,同時提高了用戶的滿意程度。這就形成可一個正反饋,一個良性循環,前提是有足夠的激勵(Mp)投入和足夠產生競爭的參與者(賞金獵人)。
同時很多人也為自己是一個人肉搜索引擎的用戶感到自豪,因為這確實太好用了,不需要擔心分詞不準確,不用擔心電腦錯誤的理解了你的話,不用擔心搜索引擎收錄范圍不同造成的風險(注四),甚至不需要學習搜索引擎怎么用(注五),而且答案也不會僅僅局限于搜索引擎能找到的信息,雖然絕大部分問題是通過搜索引擎就可以找到的。
然而,人肉搜索引擎幾年來僅僅是一個概念,沒有成為一種產品,在貓撲,人肉搜索引擎只能幫助貓撲提升人氣,并不能成為一個產品給貓撲帶來效益,同時也給更多的人服務。這是為什么呢?我想可能有4點原因:
1、貓撲人肉搜索引擎和論壇的差異不夠明顯。或者說在貓撲里,人肉搜索引擎只是論壇的一種應用而已,任何需要人肉搜索引擎服務的人必須是論壇的用戶,這降低了用戶普及度(注六)。
2、Mp過于游戲化。Mp是虛擬貨幣,是游戲化的貨幣,這也給貓撲的人肉搜索引擎加上了游戲性的標簽。做賞金獵人的人僅僅是喜歡這個游戲化氛圍的人,或者說是能被Mp這樣的虛擬貨幣激勵的人,這影響了賞金獵人隊伍的擴大,從而影響了人肉搜索引擎的擴大。
3、人肉搜索引擎的反映比較慢。Google可以在0.00001秒內給你一個答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出結果才會有所反應。
4、貓撲人肉搜索引擎不能保留歷史紀錄,每次有一個問題出現,就會引發一次分布式搜索。即使問題是重復的,也會同樣引發這個流程,而且相同的問題在不同的時間問,答案可能迥異(注七),不能對相同答案給予一致性的結果。
或者說,我覺得以上4點如果能夠解決,人肉搜索引擎將能幫助我們更快更好的找到有用的信息。
-------------------
注一:按照某些人的猜測,新的搜索引擎頁面估值革命性技術也許是利用Google加速器記錄的用戶訪問行為來評估網站的流量,這個方案可以解決 PageRank的動態性不足問題。然而這個方案和Alexa何其的類似,一旦出臺新一輪的作弊風潮一定出現,可以想象每個商業網站都會要求員工安裝 Google加速器了,就像他們現在要求員工安裝Alexa一樣。當然Google的技術實力遠非Alexa可比,一切也還僅僅是某些人的猜測。題外話,如果Google真的有一天聲稱會用Google加速器的訪問記錄來評估網站,那么Google加速器在中國安裝量一定會非常的驚人,看起來這倒可以作為一個不錯的推廣方法。
注二:這實際上就是Mp機制帶來的游戲性造成的,在分析貓撲的時候,Mp是一個關鍵,它造成了貓撲的游戲性,而貓撲的游戲性應該是它一直以來人氣旺盛的主要原因。有人甚至說貓撲就是最好玩的網游,這還是有一定道理的。
注三:我猜測這是Mp機制的動力,也是其他的游戲機制的動力。
參考資料: http://www.086ok.com/Info/Bice_Sech_Kil/0582708130733544.htm
針對搜索引擎的Link Farm和Spam也許永遠不會停止,因為他們能夠從他們的作惡中得到利益。我們知道得到利益不是作惡的唯一原因,然而大規模的工業化的作惡唯一的原因當然是那樣可以得到利益。
所以,這是一場永遠無法結束的戰爭,只要搜索引擎還是應用最廣泛的一種互聯網應用,只要搜索引擎還是用戶用戶找到合適服務的最主要手段,這就是一場永遠無法結束的戰爭。很多人把問題歸結于PageRank技術,歷史是何其相似啊,當年人們也是這樣地抱怨META關鍵字和描述技術。也許Google或者其他的公司能夠研究出來更加偉大的技術(注一)來取代PageRank,但是誰知道這新的技術什么時候又會變成明日黃花。
搜索引擎是利用機器自動化的收集網絡信息并有序化的一種技術。搜索引擎高效快速,然而因為現在人工智能并不完善,搜索引擎還很難甄別刻意的修飾過的信息,所以SEO Spam才會那么猖獗。所以,有些人想從搜索引擎的反面來解決問題,那就是更多的利用人工把搜索引擎得到的信息進一步萃取,進一步有序化,我們稱之為人肉搜索引擎。
很多人知道的中國有一個叫做貓撲的論壇,人氣非常旺。Tiny在2001年到2004年期間是這個論壇的忠實用戶。在我的印象中,人肉搜索引擎的概念應該出自于貓撲。
跟很多論壇一樣,貓撲上面也經常有人問這個問題那個問題。同時貓撲有種虛擬貨幣叫做Mp,問問題的人往往會用Mp來獎勵可以幫助他們的人。雖然Mp不能吃不能喝,但是還是很多人醉心于掙取更多的Mp(注二)。那些慣于通過回答問題掙取Mp的人在貓撲一般叫做賞金獵人。
于是很有趣味的一幕出現了,某人需要解決一個問題,就在貓撲發貼并許與一定數量的Mp作為酬謝。很快,就會有賞金獵人看到這個貼子,他們就會去用搜索引擎來尋找問題的答案,然后爭先恐后地把找到的答案回在帖子里面邀功。最后,提問題的人得到了答案,賞金獵人得到了Mp,皆大歡喜。這也就形成了所謂的人肉搜索引擎的機制。有趣的是,我們可以發現人肉搜索引擎的搜索流程和搜索引擎在不同服務器之間的分布式搜索流程看起來是那么的相似,區別僅僅在于發動和執行流程的是人,還是機器。
人肉搜索引擎的質量怎樣保證呢?這是一個非常有趣的問題,從剛才的流程上大家可以發現,如果有足夠多的賞金獵人,他們之間就會產生競爭,尋找資料速度的競爭,資料準確性的競爭。競爭的結果是,一個速度又快資料又準確全面的賞金獵人會有越來越多的Mp,這會給他帶來更多的成就感(注三),同時他也會更加的醉心于賞金獵人的工作。甚至,據我所知很多賞金獵人會形成自己的職業道德和行為準則,這樣可以給他們更大的自我實現,同時提高了用戶的滿意程度。這就形成可一個正反饋,一個良性循環,前提是有足夠的激勵(Mp)投入和足夠產生競爭的參與者(賞金獵人)。
同時很多人也為自己是一個人肉搜索引擎的用戶感到自豪,因為這確實太好用了,不需要擔心分詞不準確,不用擔心電腦錯誤的理解了你的話,不用擔心搜索引擎收錄范圍不同造成的風險(注四),甚至不需要學習搜索引擎怎么用(注五),而且答案也不會僅僅局限于搜索引擎能找到的信息,雖然絕大部分問題是通過搜索引擎就可以找到的。
然而,人肉搜索引擎幾年來僅僅是一個概念,沒有成為一種產品,在貓撲,人肉搜索引擎只能幫助貓撲提升人氣,并不能成為一個產品給貓撲帶來效益,同時也給更多的人服務。這是為什么呢?我想可能有4點原因:
1、貓撲人肉搜索引擎和論壇的差異不夠明顯。或者說在貓撲里,人肉搜索引擎只是論壇的一種應用而已,任何需要人肉搜索引擎服務的人必須是論壇的用戶,這降低了用戶普及度(注六)。
2、Mp過于游戲化。Mp是虛擬貨幣,是游戲化的貨幣,這也給貓撲的人肉搜索引擎加上了游戲性的標簽。做賞金獵人的人僅僅是喜歡這個游戲化氛圍的人,或者說是能被Mp這樣的虛擬貨幣激勵的人,這影響了賞金獵人隊伍的擴大,從而影響了人肉搜索引擎的擴大。
3、人肉搜索引擎的反映比較慢。Google可以在0.00001秒內給你一個答案,然而人肉搜索引擎需要等待有人看到你的帖子,并找出結果才會有所反應。
4、貓撲人肉搜索引擎不能保留歷史紀錄,每次有一個問題出現,就會引發一次分布式搜索。即使問題是重復的,也會同樣引發這個流程,而且相同的問題在不同的時間問,答案可能迥異(注七),不能對相同答案給予一致性的結果。
或者說,我覺得以上4點如果能夠解決,人肉搜索引擎將能幫助我們更快更好的找到有用的信息。
-------------------
注一:按照某些人的猜測,新的搜索引擎頁面估值革命性技術也許是利用Google加速器記錄的用戶訪問行為來評估網站的流量,這個方案可以解決 PageRank的動態性不足問題。然而這個方案和Alexa何其的類似,一旦出臺新一輪的作弊風潮一定出現,可以想象每個商業網站都會要求員工安裝 Google加速器了,就像他們現在要求員工安裝Alexa一樣。當然Google的技術實力遠非Alexa可比,一切也還僅僅是某些人的猜測。題外話,如果Google真的有一天聲稱會用Google加速器的訪問記錄來評估網站,那么Google加速器在中國安裝量一定會非常的驚人,看起來這倒可以作為一個不錯的推廣方法。
注二:這實際上就是Mp機制帶來的游戲性造成的,在分析貓撲的時候,Mp是一個關鍵,它造成了貓撲的游戲性,而貓撲的游戲性應該是它一直以來人氣旺盛的主要原因。有人甚至說貓撲就是最好玩的網游,這還是有一定道理的。
注三:我猜測這是Mp機制的動力,也是其他的游戲機制的動力。
參考資料: http://www.086ok.com/Info/Bice_Sech_Kil/0582708130733544.htm
總結
- 上一篇: WinRAR 4.00 beta1 简体
- 下一篇: php bug修复,PHPWind BU