以往我们可能会构建短窗口波动、反转等特征控制组合短期量价风险,相较于手工构建风险特征,利用神经网络模型挖掘短期量价风险指标是更为高效的方式。本章节中,我们将尝试利用神经网络模型从各类量价数据中提取短期风险特征。
2.1 数据输入
我们依据不同数据源构建特征集合独立训练神经网络模型。数据集1到6为本文基础数据集合,相比之前的报告,我们以日内量价统计量更新了数据集6的特征构成。
此外,对于数据集1)和2),除短窗口特征外,我们增加了150日长窗口的训练。
2.2 网络结构
对于提取风险特征的网络结构,我们延续之前提取alpha信息的神经网络架构,采用时序网络以及截面网络的组合。
首先,我们采用了LSTM结合自注意力机制的结构,从股票的量价数据中有效提取了时序特征。LSTM(长短期记忆网络)作为RNN(循环神经网络)的一种,它在处理股票时间序列信息方面表现出色,能够捕捉到关键的时序动态。
其次,在实际的投资决策中,除了单只股票的时间序列信息外,股票之间的截面关联同样蕴含着至关重要的信息。为了捕捉这种股票间的相互关系,我们引入了图注意力网络GAT(Graph Attention Network)。GAT是一种图神经网络,它通过注意力机制来编码股票之间的复杂截面关系,从而为我们提供了一个全面的视角来分析和预测市场动态。
最终,通过结合LSTM的时序分析能力和GAT的截面关联捕捉能力,我们的模型能够更全面地理解股票市场的行为,为投资决策提供更为深入和精确的洞察。
因此,在本文中我们结合时序分析和图结构分析构建复合模型,以全面捕捉股票市场的特征。LSTM模型处理每个样本在时间维度上的迭代,其能够记住长期依赖关系,但并不涉及样本数据间的交互。将LSTM的输出接入自注意力机制捕捉序列内部的依赖关系,再接入图注意力网络GAT以捕捉不同股票之间的相互关联。
我们具体的网络结构如下:
其中input为模型输入,MLP之后得到output为网络模型输出,其为长度N的向量,对于任意时间点的N只股票,我们得到1个风险因子;[]符号表示矩阵concat操作,下标表示在时间维度取索引,adj为图网络中的股票邻接矩阵。
对比以往报告中我们对于alpha特征的提取,考虑到风险因子的不可加性,我们并未在一个特征集合提取多个风险特征,这将导致风险特征的维度爆炸。因此,我们选择在一个数据特征集合中只提取一个风险表示。
神经网络的训练过程中,我们遵循以下步骤提取风险信息:
滚动训练策略:我们采用滚动训练方法,每年更新模型,使用过去8年的历史数据作为训练基础,确保模型能够适应时间序列的变化;
数据时间序列拆分:我们将数据集按照时间顺序进行划分,将最后10%的数据保留作为验证集,用于评估模型的泛化能力,而其余数据则用于训练模型;
-
按日拆分训练批次:在训练过程中,我们按照日为单位将数据拆分为不同的批次,确保每批次输入网络的样本来自同一时间点;
早停机制:为了预防模型训练过程中的过拟合现象,我们引入了早停机制。该机制会在验证集上的性能不再提升时停止训练,从而保证模型的泛化性能。
因此,对于图网络模型而言,邻接矩阵的定义至为重要。在以往报告中,挖掘量价数据中的alpha信息时,我们认为股票节点之间的连通性与它们的风险暴露紧密相关,而行业和风格正是风险最自然的刻画,因此我们据此构建图结构。
行业以及风格的图结构关系长期稳健,而我们挖掘风险信息时希望更快速捕捉股票市场的风险变化,因此我们借助于股票走势趋同性获取更快速变化的图结构:
任意截面,初始化股票间原始邻接矩阵 A_style=ones(N,N),N为股票数;
根据股票历史收益序列,计算股票直接的协方差矩阵 corr=correlation(ret);
对于任意股票i, for i=1,…,N;
选取日收益率相关性最高的k只股票,作为邻接节点 idx=argtopk(corr[i,:]);
默认股票i与其余股票之间均不连通 A_style [i,-idx]=0;
此外,对于损失函数而言,我们比较alpha和风险异同。alpha因子与风险因子的相似点在于,二者均要求因子对于股票截面收益具有较高的解释度,若我们以因子与股票截面收益之间的相关系数𝒊𝒄来度量解释能力:
对于alpha因子,我们要求ic_t序列在时间序列上方向是一致的,因此提取特征时通过最大化相关系数𝒊𝒄来达到目标;
对于风险因子,我们不要求ic_t序列在时间序列上具有一致性的方向,因此我们将目标设置为最大化相关性绝对量|𝒊𝒄|;
同时,对于标签label的设定,以往我们挖掘alpha时,经常在股票原始收益基础上剥离风格收益,以股票的alpha收益作为预测目标;但考虑对于风险做预测时,风险是由真实的截面收益差异所表征,我们想获取风险特征和股票真实涨跌之间的关联。
因此,我们将标签label定义为股票未来5日真实收益率:同时将损失函数定义为
2.3 风险因子
基于数据输入和网络模型,我们得到8个维度的量价风险刻画。对于股票未来5日收益而言,这8个风险因子大体符合我们对于风险的定义,因子在各年份中均具有较低的IC均值水平,以及较高的|IC|均值。
以|IC|均值度量因子对于截面收益差异的解释能力,对比barra风格因子,对于股票周度等短窗口收益而言,短周期量价风险特征在单因子维度表现出更强的解释能力。
此外,对比2019年以来|IC|均值以及2024年|IC|均值,barra风格因子中SIZE和BETA风格在2024年均值显著高于历史均值,2024年市场风险放大在barra风格因子中主要反应在这两个维度,这与我们在开篇中对于组合业绩归因的结论相一致。
同时,相比于传统量价风格因子,本文的风险特征对于风险的解释能力在2024年显著高于历史均值,在量价风险放大的市场行情中,这些因子恰好提供了更有的风险解释能力。然而传统风格因子中如低波动、低流动性等量价指标,对于单只股票维度而言,这些特征的暴露实质上是长期稳健的,其对于快速风险变化的风控能力有限。
对于风险因子,我们希望得到的是一个IC序列围绕零均值大幅波动的因子表示。对比本文构建的量价风险特征,我们发现部分指标在特定年份仍呈现出较强的alpha属性。
究其原因,在训练神经网络时,我们要求任意截面上预测值和标签之间具有较高的|IC|,然而若一个因子长期IC稳定为正向且幅度较高,其应被认定为alpha,但是在我们的训练体系中会将其误判为风险因子。
为此,我们尝试对风险因子进行alpha中性处理,以剥离原始风险特征中可能蕴含的alpha信息。
具体地,我们会对每个数据特征集合独立进行二次训练,分别提取风险因子和alpha因子特征,并将风险因子对alpha因子进行中性处理。
从结果上看,剥离alpha信息对于这些短周期量价风险特征的风险解释能力影响不大,因子|IC|均值略微下降,但仍保持较高水平;同时,因子的alpha属性显著减弱,各因子在各年份的IC均值基本在0附近波动,整体表现为更为纯粹的风险属性。
对于风险特征而言,我们不寄希望于其能提高组合收益,但我们想验证对于投资组合这些风险特征能否有效降低组合的波动和回撤。在构建组合之前,我们先在后续章节简述本文的alpha架构。最终,结合风险和alpha检验量价风险指标对于组合的风控效果。