数据挖掘——我们能从股市数据得出什么,以及一些算法
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘——我们能从股市数据得出什么,以及一些算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
數據挖掘——我們能從股市數據得出什么,以及一些算法
//一個備忘錄了,寫給我們金融信息系統項目小組的同學。沒有列出參考文獻,因為都是大白話。有些刪節。
數據挖掘/機器學習大概處理以下幾個問題:
分別論述了。分類的算法有:
聚類的算法以K-均值為代表,它先是選擇K個初始的質心,接著按就近原則將其他觀測值向它凝聚,這樣指派到每一個質心的點集稱為一個簇。然后根據指派到簇的點,更新每個簇的質心,這樣重復指派和更新,直到質心不再發生變化(即收斂)。這里“最近”的概念用的是歐幾里德距離。在我們的股市數據中,如果我們不再事先指定哪些股票是好是壞(即沒有輸出變量),通過聚類分析也能把它們分類。
關聯分析用來發現隱藏在大型數據集中令人感興趣的聯系,比如尿布和啤酒之間的關聯,一種叫Apriori的算法可以實現,它根據變量及其賦值對整個數據集的覆蓋程度來建立起兩個或幾個變量之間的聯系。這個算法用在我們的股市數據中,可以幫我們找到幾只單股之間的關聯,這種關聯可能沒有道理。
轉自: http://johnthu.spaces.live.com/blog/cns!2053CD511E6D5B1E!147.entry
總結
以上是生活随笔為你收集整理的数据挖掘——我们能从股市数据得出什么,以及一些算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据采集策略:数据挖掘与统计学的一个区别
- 下一篇: 决策树的构造——一个手工例子