《集体智慧编程》——第一章导读
為什么80%的碼農都做不了架構師?>>> ??
- 什么是集體智慧
其含義是指:為了長早新的想法,而將一群人的行為、偏好或思想組合在一起。
完成這項工作的一種最為基礎的方法,便是使用調查問卷或普查。從一大群人中搜集的答案可以使我們得出關于群組的統計結論:組中的個體成員將會被忽視。從獨立的數據提供者那里得出新的結論,是集體智慧所真正關注的。
一直以來,人們都是利用Internet來購買所需、搜集信息、尋求娛樂,以及架設自己的Web站點。所有的這些行為都可以得到監控,并且不必要讓用戶放下手頭的工作而進行詢問,可以從他們的行文中得到信息,挖掘出有價值的結論。已經有大量的方法可以對這些信息進行加工和解釋。有兩個例子:wikipedia和Google搜索。wikipedia是通過所有用戶共同編輯來創建或編輯詞條,雖然存在惡意用戶,但大多數的主題都會被認為是準確的。Google搜索是從web內容的創建者對自己網站的操作中提取關鍵詞,并且利用這些信息為Google的使用者設定各個網站的分值。
但這本《集體智慧編程》關注的不是像wikipedia歸功于提供內容的用戶,而在于算法,這其中包括了Google的PageRank算法。該算法會搜集用戶的數據,對數據進行計算分析,并從中創造出可以增強用戶體驗的新信息。數據的獲取有兩種方式:第一種是明確搜集,例如需要用戶投票打分的方式;第二種是偶然搜集,如觀察用戶的購買行為。通過搜集信息后,還有通過一種智能化的方式對這些信息進行處理,并產生出有用的新信息來。
而這本書,就是告訴我們如何利用開放的API來搜集數據,同時還會討論到各種機器學習算法和統計方法。將二者結合起來,可以借助集體智慧的相關方法,對由自己編寫的應用程序搜集得到的數據進行分析;同時,可以從其他地方搜集數據,并對數據進行試驗。
- 什么是機器學習
缺點:受限于大量模式上的歸納能力,而一個模式如果不同于算法先前所曾見到過得任何其他模式,那么它很有可能被“誤解”。也有過度歸納的可能性。
轉載于:https://my.oschina.net/gzckj/blog/100799
總結
以上是生活随笔為你收集整理的《集体智慧编程》——第一章导读的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [转]一个人脸检测器
- 下一篇: linux命令行抓取网页快照-(xvfb