《集体智慧编程》笔记(1 / 12):集体智慧导言
文章目錄
- 什么是集體智慧
- 什么是機器學習
- 機器學習的局限性
- 真實生活中的例子
- 學習型算法的其他用途
- 小結
Netflix, Google都適用了先進算法,將來自不同人群的數(shù)據(jù)加以組合,進而得出新的結論,并創(chuàng)造新的商機。
更多類似例子:
- 約會網站希望幫助人們更快地找到他們的最佳拍檔;
- 預測機票價格變化的公司如雨后春筍般不斷涌現(xiàn);
- 為了創(chuàng)造更有針對性的廣告。
什么是集體智慧
集體智慧通常含義:為了創(chuàng)造新的想法,而將一群人的行為、偏好或思想組合在一起。
集體智慧出現(xiàn)早于Internet,可用調查問卷或普查完成最為基礎的方法。
從一大群人中收集的答案可以使我們得出關于群組的統(tǒng)計結論:組中的個體成員將會被忽視。從獨立的數(shù)據(jù)提供者那里得出新的結論,是集體智慧所真正關注的。
例如:金融市場眾多參與者的交易行為預測
Internet出現(xiàn)之后,集體智慧有更多體現(xiàn)
- Wikipedia 在線百科全書由大量用戶共同維護
- Google是根據(jù)其他網頁對當前網頁的引用數(shù)多少來評價網頁等級的搜索引擎。這種評價等級的方法,搜集了數(shù)以千計的人對某一頁面的評價信息。
目標:利用開放的API來搜集數(shù)據(jù),同時還會討論到各種機器學習算法和統(tǒng)計方法。將二者結合起來,可借助集體智慧的相關方法,對由自己編寫的應用程序搜集得到的數(shù)據(jù)進行分析;同時,也可以從其他地方搜集數(shù)據(jù),并對數(shù)據(jù)進行試驗。
什么是機器學習
機器學習是人工智能領域中與算法相關的一個子域,它允許計算機不斷地進行學習。
大多數(shù)情況下,這相當于將一組數(shù)據(jù)傳遞給算法,并由算法推斷出這些數(shù)據(jù)的屬性相關的信息——借助這些信息,算法就能夠推測出未來有可能會出現(xiàn)的其他數(shù)據(jù)。
這種預測是完全有可能的,因為幾乎所有的非隨機數(shù)據(jù)中,都會包含這樣或那樣的“模式Patterns”,這些模式的存在使機器的得以據(jù)此進行歸納。
為實現(xiàn)歸納,機器會利用它所認定的出現(xiàn)于數(shù)據(jù)中的重要特征對數(shù)據(jù)進行“訓練”,并借此得到一個模型
垃圾過濾算法——從一堆垃圾郵件中歸納總結出是某單詞是垃圾郵件重要依據(jù)。下次收到郵件可根據(jù)結論判別郵件是否是垃圾郵件。
各種機器學習算法各有所長,適應不同類型的問題。
許多機器學習算法都很依仗數(shù)學和統(tǒng)計學。
統(tǒng)計學不是數(shù)學一個分支
機器學習的局限性
當對新的信息進行決策時,人們能夠從中識別出相似的信息來,而機器學習方法卻只能憑借已經見過的數(shù)據(jù)進行歸納,而且歸納的方式受到很大的限制,
例子:
- 將介紹到垃圾郵件過濾方法,是以單詞或單詞組合出現(xiàn)為依據(jù),根本未給予考慮單詞的含義及句子結構。這是因為后者要比前者復雜多得多。
- 機器學習算法都有過度歸納的可能性。垃圾郵件過濾方法將友人的一封郵件視為垃圾郵件。
真實生活中的例子
- 網頁排名
- 推薦系統(tǒng)
- 市場預測
- 交友匹配
學習型算法的其他用途
- 生物工藝學 DNA序列,蛋白質結構,化合物篩選等海量數(shù)據(jù),需進一步理解生物進程的模式。
- 金融欺詐偵測
- 機器視覺
- 產品市場化
- 供應鏈優(yōu)化
- 股票市場分析
- 國家安全
小結
一旦掌握一些機器學習的算法,會發(fā)現(xiàn)他們的應用隨處可見。
總結
以上是生活随笔為你收集整理的《集体智慧编程》笔记(1 / 12):集体智慧导言的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《Python Cookbook 3rd
- 下一篇: pySerial -- Python的串