看机器学习如何预测债券收益率
用機器學習預測股票收益率的工作已經屢見不鮮,并有了非常不錯的結果,如《當實證資產定價遇上機器學習》。那么,能不能把同樣的方法運用到債券中呢?2020年在Review of Financial Studies上的“Bond Risk Premiums with Machine Learning”一文,就使用機器學習方法對債券超額收益率進行了預測。該文作者是倫敦大學瑪麗王后學院(Queen Mary, University of London)的Daniele Bianchi、華威大學的Matthias Bu?chner和羅格斯大學商學院(Rutgers Business School)的 Andrea Tamoni。
1 研究設計
1.1 實驗框架
該文做了兩個實驗:
使用收益率曲線數據(即在當前時間的1-10年到期的零息債券的年化到期收益率,共10個),預測某一到期時間的債券在未來一年的超額收益率(即價格漲幅減去無風險利率);
在收益率曲線基礎上,再用上128個宏觀變量,再進行一樣的預測。這些宏觀變量分為了幾組:真實產出和收入,就業和工作時間,零售業、制造業銷售數據,國際貿易,消費者支出,住房建造,存貨和存貨銷售率,訂單和未履行訂單,薪酬和勞動力成本,價格指數,利率和利差,股指,外匯測度。
數據集來自(Liu和Wu,2020)的零息債券收益率曲線。該數據集是日頻,構造了每一時間點的1-360個月到期的零息債券的年化到期收益率。
按過去數據的85%和15%劃分訓練集和驗證集(按時間序列順序),測試集是未來一年的超額收益率。每次測試后,訓練集和驗證集整體遞歸地向前擴大一個月,并保持二者比例不變,保持測試集長度為一年。整個數據集時間為1971.08到2018.12(美國的10年到期債券從1971.9開始發行),從1990.1開始進行第一次測試。示意圖如下:
對于每次測試,記錄預測的結果,在最后計算樣本外(R^2):
[R^2_ ext{OOS}=1-dfrac{sum_{t_0=1}^{T-1}left(xr_{t+1}^{(n)}-widehat{xr}_{t+1}^{(n)}(mathcal{M}_s)ight)}{sum_{t_0=1}^{T-1}left(xr_{t+1}^{(n)}-overline{xr}_{t+1}^{(n)}ight)}
]
其中(xr_{t+1}^{(n)})表示(t+n)時刻到期的零息債券在從(t)時刻到(t+1)時刻的超額收益率,(mathcal{M}_s)為使用的機器學習算法。
該文只預測到期為2、3、4、5、7、10年的零息債券,還用這6種債券構造了等權重組合,并預測該組合的(R^2)。
檢驗的原假設為(R^2<0),使用MSPE調整后的Clark和West(2007)統計量。
1.2 機器學習算法
這里簡單介紹下該文所用的機器學習算法。首先是用了主成分回歸和偏最小二乘法,然后還使用了帶懲罰項的幾種回歸方法,即LASSO回歸、嶺回歸、彈性網絡。另外,該文還使用了回歸樹的擴展——梯度提升樹(Gradient boosted tree)、隨機森林和極限樹,如下圖:
最后,該文使用了一些不同的神經網絡結構。當只用收益率曲線數據做預測時,就用經典的前饋神經網絡結構,如下圖:
當同時使用收益率曲線數據和宏觀數據進行預測時,該文設計了3種不同的網絡結構,如下圖:
第一種是將利率數據不經過隱含層直接接入輸出層(稱為hybrid網絡),第二種是將兩個網絡(利率網絡和宏觀變量網絡)聯合起來,第三種是在第二種基礎上將宏觀變量分組集成(稱為group ensembling)。
2 實驗結果
2.1 只用收益率曲線預測
實驗結果如圖:
Panel A中,先對收益率曲線取主成分PC,分別取3、5、10個,當用10個主成分時 就是Cochrane和Piazzesi(2005)中的實驗。結果(R^2)都是負的,用更多PC反而效果更差,再加入非線性項PC的平方后,發現結果更差了。若改用PLS,也無法提高表現。
Panel B中,嶺回歸(R^2)為負,而帶有稀疏性的模型(LASSO回歸、彈性網絡),在預測4年以上到期的債券時(R^2)為正,并且預測組合的(R^2)也為正。
Panel C中,在一系列樹模型中極限樹表現最好,可能是因為它有對特征劃分位置的隨機化。而對于神經網絡,淺層網絡(1層隱含層,3個結點)表現與深層網絡(2層隱含層,7個結點)一樣好,再加深網絡則會使結果變差;另外,Cochrane和Piazzesi(2005)指出,滯后1-11期的的遠期利率包含了遠期利率中沒有的有關超額收益率的信息,該文將滯后1-11期的的遠期利率和10個遠期利率一起放入1層隱含層7個結點的網絡中,與淺層網絡做比較,發現效果沒有變好,因此滯后的收益率曲線不能幫助當前時刻的收益率曲線提高預測能力。
2.2 同時用收益率曲線和宏觀數據預測
結果如圖:
在Panel A和Panel B中,為了與Ludvigson和Ng(2009)可比,第2行是按它的設定,從宏觀變量中提取出前8個主成分后再取它的一個子集,而收益率數據上有些(4、5、6行)用了Cochrane和Piazzesi(2005)提取的CP因子 (遠期利率的一個線性組合)。結果發現,稠密模型如嶺回歸或數據壓縮,樣本外表現很差,稀疏模型則表現較好,并且與2.1中的實驗結果相比有明顯提高,說明加入宏觀變量有助于預測。
Panel C是3種網絡的結果,其中混合網絡效果拔群,并且加深深度可提高其準確率,而如果用經濟學的先驗知識選擇網絡結構,會顯著影響預測效果,1層的分組集成網絡與3層混合網絡效果一樣好,并且在7年和10年到期的債券中效果更好。另外,在幾種樹模型中加入宏觀變量后效果也更好,其中極限樹效果相對最好。
3 剖析預測性
在經濟擴張期和衰退期,可預測性會不會不一樣?用NBER的recession indicator劃分擴張期和衰退期,分別計算樣本外(R^2),結果如圖:
將收益率曲線提取主成分PC,前3個主成分分別代表了收益率曲線的水平(level)、斜率、曲率,可以用回歸檢驗神經網絡抽取出的隱含因子對前3個主成分的變動有無預測能力:
[PC_{i,t+1}-PC_{i,t}=b_0 + oldsymbol_1^T mathcal{P}_t + oldsymbol_2^T oldsymbol{x}_t + epsilon_{i,t+1} ext{ for } i=1,2,3
]
其中(oldsymbol{x}_t)為神經網絡抽取出的隱含因子,即隱含層的輸出。結果如下(第一行為不加入隱含因子,作為參照):
哪些變量重要?可以計算預測值對某個變量的偏微分:
[mathbb{E}left[dfrac{partial}{partial y_{it}} xr_{t+1}^{(n)}igg| y_{it}=ar{y}_iight]
]
取絕對值后,對所有(t)取平均,就得到某個變量的重要性。如果對每組宏觀變量的重要性再取平均,就可以得到每組的重要性。
下圖(a)(b)分別為預測2年到期和10年到期債券超額收益率時的各個變量重要性。(c)(d)分別為預測2年到期和10年到期債券超額收益率時,分組后各組的重要性。
以上結果都說明非線性很重要,但能提高表現的非線性究竟是來自組間的交互,還是組內的交互?可分別對全連接網絡和分組集成網絡求組間二階微分:
[mathbb{E}left[dfrac{partial^2}{partial y_{i} partial y_j} xr_{t+1}^{(n)}igg| y_{i}in G_A, y_jin G_Bight]
]
結果如下圖:
Panel A表明,全連接網絡中組間交互作用很大,Panel B表明,兩種神經網絡中組內交互作用差不多。因此,分組集成神經網絡的優異表現,來自于它禁止了組間交互作用,而允許組內交互。
4 可預測性的經濟收益
可預測性能否轉化為投資收益?該文考慮了單變量和多變量資產配置實驗。單變量實驗中,投資者只考慮投資于無風險債券和(n)年到期的風險債券,在文中只關注(n=2)或(n=10)的情況。在多變量情況中,投資者同時考慮到期為2-10年的債券和無風險債券。結果如下表,正的數值表明預測模型強于EH(expectation hypothesis)模型,選用的神經網絡結構分別是表1和表2中最優的結構。
5 可預測性的經濟驅動力
下圖中,(a)(b)是畫出了預測的10年到期債券收益率(實線)和美國工業產值(Industrial Production,IP)指數的增長率(虛線),(c)(d)是將虛線換成實現的10年到期債券收益率。
還可以計算衰退期和擴張期的夏普比率:
以上證據都表明,債券風險溢價的逆周期性很明顯。
再用10年到期債券超額收益率的預測值,對一些資產定價理論中的債券風險溢價的關鍵驅動因子作回歸。因子有:
(DiB(g))和(DiB(pi))代表了對超額收益率的信念的分歧程度,分別表示真實分歧和名義分歧,分別來自提前4季度對GDP和CPI的預測,數據來自SPF數據庫。
(-Surplus)是加權消費增長率的10年平均取相反數,代表風險規避,另外還用了RAbex(來自Bekaert,Engstrom和Xu,2019)作為時變的風險規避。
(UnC(g))和(UnC(pi))分別代表了經濟增長和通貨膨脹的不確定性。
({TYVIX})是1個月的10年到期債券風險中性隱含波動率,(sigma_B^{(n)})是10年零息債券的月內收益率變化平方和,這兩個代理變量度量了債券的波動性。
結果見下表:
再計算10年到期債券超額收益率的預測和3個主觀風險溢價代理變量(EBR*、SUBJ_BRP、GLS)的相關系數,3個變量來自Blue Chip Financial Forecasts(BCFF)的調查,相關系數見下表:
參考文獻
Bekaert, Geert, Eric C. Engstrom, and Nancy R. Xu. The time variation in risk appetite and uncertainty. No. w25673. National Bureau of Economic Research, 2019.
Bianchi, Daniele, Matthias Büchner, and Andrea Tamoni. "Bond risk premiums with machine learning." The Review of Financial Studies (2020).
Cochrane, John H., and Monika Piazzesi. "Bond risk premia." American Economic Review 95.1 (2005): 138-160.
Liu, Yan, and Jing Cynthia Wu. Reconstructing the yield curve. No. w27266. National Bureau of Economic Research, 2020.
Ludvigson, Sydney C., and Serena Ng. "Macro factors in bond risk premia." The Review of Financial Studies 22.12 (2009): 5027-5067.
總結
以上是生活随笔為你收集整理的看机器学习如何预测债券收益率的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [蓝桥杯][2019年第十届真题]扫地机
- 下一篇: P3373 【模板】线段树 2(区间乘法