股票量化交易系统搭建问题探究
如果想不清楚如何解決如下問題,那么冒然搭建股票量化交易系統(tǒng)是非常危險(xiǎn)的。本文根據(jù)多年開發(fā)心得,將搭建過程中遇到的重難點(diǎn)問題進(jìn)行了梳理。
1、社會(huì)中的各種信息是否已經(jīng)全部反映在了K線中?
有不少觀點(diǎn)認(rèn)為K線中已經(jīng)蘊(yùn)含了所有信息,估計(jì)有更多的人不認(rèn)同這個(gè)觀點(diǎn)。對(duì)于不認(rèn)同的觀點(diǎn)而言,一個(gè)簡單的反例是我拿出一大筆錢在某一時(shí)刻隨機(jī)買入某一只股票對(duì)其股價(jià)造成波動(dòng),那么從歷史K線就無法預(yù)測出我的這個(gè)行為,然而這種行為是噪聲而不是規(guī)律。在很多其它的機(jī)器學(xué)習(xí)問題中也會(huì)遇到這種噪聲點(diǎn)。所以我認(rèn)為上面這個(gè)反例并不合適。是否有更好的反例?
2、量化交易模型的貝葉斯誤差有多大?
不像圖像分類這種問題,可以很容易找到很多人類專家來估計(jì)出貝葉斯誤差。想找到操盤專家的難度相對(duì)較大。那么對(duì)應(yīng)的貝葉斯誤差也不容易估計(jì)出來。然而人類不一定能完成的事情計(jì)算機(jī)往往可以完成,比如天氣預(yù)報(bào)。
3、如何保證評(píng)估集和測試集具有相同的分布?
不同于圖像分類、翻譯、語音識(shí)別這類問題,量化交易對(duì)劃分?jǐn)?shù)據(jù)集的要求更高。首先它需要確保訓(xùn)練集不能透露出未來信息,舉個(gè)例子,不能讓模型在t時(shí)刻知道任何與[t+1,正無窮)相關(guān)的信息。其次,評(píng)估集和測試集的分布幾乎一定是不一樣的,因?yàn)闇y試集的分布每天都在變化。
如果按照下面的代碼生成評(píng)估集和訓(xùn)練集,評(píng)估集和訓(xùn)練集的分布是一樣,和測試集的分布不一樣,所以評(píng)估集沒有發(fā)揮出其應(yīng)有的作用。此處的評(píng)估集更像是train-val,測試集更像是dev,而實(shí)盤更像是test。
if (initialMode.equals(Mode.train)) {//最后一段序列不參與評(píng)估if (count == 1) {總結(jié)
以上是生活随笔為你收集整理的股票量化交易系统搭建问题探究的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。