【数据竞赛】数据竞赛中最贵的四个特征
作者:杰少
四大量化強特
簡介
本文介紹四個在量化問題中非常重要的特征,對量化有興趣的朋友可以參考學習,此處的資料主要來源于Optiver團隊在Kaggle賽事中的分享。
四大量化強特
01
bid/ask spread
由于不同的股票在市場上的交易水平不同,我們采用最佳報價(best offer price)和最佳買入價(best bid price)的比值來計算買賣價差。
買賣價差的計算公式可采用以下形式:
注:最佳買入價是有人愿意購買的最高價格,最佳報價(或出價)是有人愿意出售的最低價格。
01
Weighted averaged price
訂單(Order) Book是股票估值的重要來源之一。公允的賬面價值評估必須考慮兩個因素:訂單的水平和規模。我們可以使用加權平均價格(WAP)來計算股票的瞬時估值,并以實際波動率為目標。
WAP的公式如下,它考慮了最高級別的價格和數量信息:
如果兩本books在同一價格水平上分別有出價(bid offer)和要價(ask offer),那么出價越多的book將產生較低的股票估值,因為書中有更多的意向賣家,而賣家越多意味著市場上的供應越多,導致股票估值越低。
在大多數情況下,在連續交易時間內,訂單簿不應出現bid order高于offer或ask order的情況。
03
Log returns
假設是股票在時刻的價格,我們通過下面的方式計算和時刻的log return,
通常我們會計算在10分鐘之內的log return。Log returns有很多優勢,例如:
它們可以在時間軸上相加:
一般的returns不可能低于-100%,但是log return是不受限的;
04
Realized volatility
模型的有價值輸入是股票對數收益的標準差。對于在較長或較短時間間隔內計算的對數收益率,標準差會有所不同,因此通常:
將其標準化為1年期,而年化標準差就被稱為波動率(volatility)。
我們一般會使用WAP作為股票的價值來計算log returns。
代碼
1.bid/ask spread
def?ba_spread(best_offer,?best_bid):ba_spread?=??best_offer?/?best_bid?-?1.0return?ba_spread2.WAP
def?wap(book):wap?=?(book['bid_price1']?*?book['ask_size1']?+\book['ask_price1']?*?book['bid_size1'])?/?(book['bid_size1']+?book['ask_size1'])return?wap3.Log returns
def?log_return(list_stock_prices):return?np.log(list_stock_prices).diff()?4.Realized volatility
def?realized_volatility(series_log_return):return?np.sqrt(np.sum(series_log_return**2))?適用問題
股票等問題的建模。
參考文獻
Introduction to financial concepts and data?
往期精彩回顧本站qq群851320808,加入微信群請掃碼:適合初學者入門人工智能的路線及資料下載
機器學習及深度學習筆記等資料打印
機器學習在線手冊
深度學習筆記專輯
《統計學習方法》的代碼復現專輯
AI基礎下載
機器學習的數學基礎專輯
溫州大學《機器學習課程》視頻
總結
以上是生活随笔為你收集整理的【数据竞赛】数据竞赛中最贵的四个特征的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 物联网协议比较 MQTT CoAP RE
- 下一篇: 怎样更换UC浏览器的字体?更换UC浏览器