当深度学习遇上量化交易——图与知识图谱篇
?PaperWeekly 原創 ·?作者|桑運鑫
學校|上海交通大學碩士生
研究方向|圖神經網絡在金融領域的應用
本文主要回顧三篇將圖和知識圖譜應用到量化交易上的文章。
NeurIPS 2019
論文標題:Exploring Graph Neural Networks for Stock Market Predictions with RollingWindow Analysis
論文來源:NeurIPS 2019
論文鏈接:https://arxiv.org/abs/1909.10660
這篇文章指出除了從股票的歷史交易數據中產生的各種指標,專業的投資者在選擇股票時還會考慮與該股票相關的企業,比如供應商、消費者、股份持有者等,我們應該想辦法將這些信息利用起來用于股價預測。那么到了需要建模這種圖關系數據的時候,自然就輪到圖神經網絡出場了。
對于一個圖而言,最重要的就是點的表示和邊的構建。
在點的方式方面,作者使用 LSTM 從原始的技術因子中生成結點的 embedding。
論文將企業間的關系分為下面七類。其中第一序列關系(first order)是兩個企業間的直接關系,但這種關系是比較稀疏的,并且已經被股票投資者廣泛使用了。第二序列關系則是將具有共同特點的兩個企業連接起來。
最后將構建好的圖通過一種稱為 Temporal graph convolution 的方式進行訓練,得到結點的 embedding。
這個公式最重要的改進就是加入了 作為系數來表示兩個企業之間關系的動態變化。因為兩只股票最近在價格上的走勢也接近,那么 就越大,他們之間的關系也就越強。
論文中使用 Nikkei 225 market 上的 176 只股票,利用 Nikkei Value Search dataset 來抽取企業之間的關系。利用回報率 和夏普率 作為衡量指標。實驗結果如下圖所示。
實驗證明了 customer-of 是企業間幾種關系中最為重要的一種,對企業股價具有比較好的預測作用。具有這種關系的兩家企業的股價在時序上具有比較好的相關性。此外,在不同的時間跨度上,不同的關系對于不同時期股價的預測作用不同。
從上圖可以看出,customer-of ?關系對于股價的預測作用在 1-day 時是最好的。此外,同一種關系在不同的跳數(hop)上預測作用的時間長短也是不同的,這是一個可以擴展的方向。
CIKM 2018
論文標題:Incorporating Corporation Relationship via Graph Convolutional Neural Networks for Stock Price Prediction
論文來源:CIKM 2018
論文鏈接:https://dl.acm.org/doi/10.1145/3269206.3269269
與上篇論文的出發點相似的,這篇論文也將企業間的關系納入考慮。但與之不同的是,這篇論文更多地將其作為一種數據增強的手段,而不是直接在圖上進行股價預測。文章使用如下方式建圖:
圖中的每個點代表一個企業,他們之間的邊代表兩家企業間的持股關系,變得權重表示持股比例。之后提出兩個模型利用圖進行股價預測:Pipeline Prediction Model、Joint Prediction Model Based on GCN。
Pipline Prediction Model 使用 DeepWalk, node2vec 和 LINE 三種方法生成節點的 embedding。之后計算兩個結點之間的 cos 相似度選出與目標公司最相似的 家企業,把它們的特征取平均拼接到目標企業的特征向量上:
最后將 輸入到 LSTM 中進行預測。
Joint Prediction Model Based on GCN 則是用 LSTM 獲得結點的向量表示,從前面構建的圖中獲取鄰接矩陣,之后輸入到一個三層的 GCN 中完成預測。
對 2017 年的 CSI 300 的驗證結果表明 LSTM+GCN 的預測準確率更高(這里的評價指標選的相當不專業,一般來說我們要選擇回報率以及能夠排除掉整個市場趨勢的一些指標來衡量模型的實際盈利能力)。在所有圖表示學習的方法中,LINE 方法的表現更好。
COLING 2016
論文標題:Knowledge-Driven Event Embedding for Stock Prediction
論文來源:COLING 2016
論文鏈接:https://www.aclweb.org/anthology/C16-1201/
在股票市場上,各種 event 對于股價是有較大影響的。這篇文章使用知識圖譜來抽取 event embedding,之后用于股價預測。
對于event可以將其看作一個三元組 ,其中 是行動者(actor)或主體(subject), 是行動或謂語(predicate), 是被施加行為的客體。首先可以使用預訓練的詞向量做平均來分別表示 ,之后使用 neural tensor network (NTN) 來計算隱向量。
為了合理的訓練,采用隨機替換 中單詞的方式來獲得負樣本(corrupted event tuple),損失函數如下:
但上述方式訓練出的 event embedding 存在兩個的問題:
1. 不能獲取兩個在語義或語法上相似事件的關系,如果兩者沒有相似的詞向量;
2. 同樣地,有兩個相似詞向量的事件不一定是相關的。
這兩個問題出現的原因是在訓練 event embedding 的時候沒有加入背景知識。而想要獲取背景知識就要利用知識圖譜,知識圖譜中存在兩種知識:關系知識(relational knowledge)和和類別知識(categorical knowledge)。
這兩種關系同樣可以使用簡單的 NTN 網絡來計算,其中 是兩個實體, 是某種關系:
通過隨機替換 獲得負樣本 ,極小化如下的目標函數:
最后將兩個模型組合起來進行訓練,就可以獲得包含知識的event embedding。
目標函數為:
實驗從 Reuters News 和 Bloomberg News 抽取結構化事件,使用 YAGO 作為知識圖譜,對標準普爾 500 指數和單個股票進行預測。使用 Acc 和 MCC (Matthews Correlation Cofficient) 作為指標。結果如下:
總結
這三篇論文是近五年圖神經網絡和知識圖譜在量化投資上的應用嘗試,主要集中與挖掘企業之間的相關關系,但也存在一些問題,如三篇文章都沒有很好的解決市場的動態性,企業間的關系是隨時間不斷變動的,并且使用一個靜態的知識圖譜或數據集來抽取關系是否會造成數據泄露的問題也沒有指明。
因為相關的資料確實相當匱乏,我在 GitHub 上新建了一個 repo 用于收集、整理相關的研究論文、書籍、數據、網站等,歡迎 star。
https://github.com/sangyx/deep-stock
如果您對深度學習在量化交易中的應用感興趣,歡迎加我微信一起學習探討。
點擊以下標題查看更多往期內容:?
當深度學習遇上量化交易——因子挖掘篇
針對復雜問題的知識圖譜問答最新進展
圖神經網絡三劍客:GCN、GAT與GraphSAGE
GELU的兩個初等函數近似是怎么來的?
協作多智能體強化學習中的回報函數設計
將“softmax+交叉熵”推廣到多標簽分類問題
#投 稿?通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
?????來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
?????投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結
以上是生活随笔為你收集整理的当深度学习遇上量化交易——图与知识图谱篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我如何一分钱没花学完AI课程,入职新浪算
- 下一篇: 中行信用卡封卡后可以分期吗