社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

量化专题:基于深度学习的短周期量价风控体系

留富兵法 • 2 周前 • 35 次点击  

      内容简介




指数增强的超额回撤
2024年以来,由于市场波动放大、风格切换速度加快等原因,指数增强基金出现过数次大幅跑输业绩基准,超额收益明显回撤的行情。从组合业绩归因来看,风格因子贡献了显著的负超额收益。
然而我们发现,在组合构建时约束风格因子的相对暴露,对于组合的风险表现改善并无明显效果。为此,我们希望基于量价数据提取变化更为迅速的风险特征以改善指增组合的风险表现。
基于深度学习量价风险因子
我们基于深度学习从不同类别的数据特征集合中构建了8个维度的短周期量价风险刻画,这些风险指标对于股票周度窗口的截面收益呈现出显著的解释能力。
为了避免构建的风险特征中夹杂alpha选股信息,我们在风险因子中剥离其蕴含的alpha信息,得到因子IC序列围绕零均值波动的纯粹风险刻画。
指数增强组合的量价风控
对于中证500、中证1000等宽基指数增强组合而言,历史上短周期量价风险约束能保证不损失组合收益前提下,有效降低组合的波动和回撤,显著改善指增组合的风险表现。
尤其在于2024年,约束短周期量价风险后,指数增强组合超额收益的回撤幅度明显降低。

1

  指数增强的超额回撤 



《基于深度学习的指数增强策略》报告中,我们探讨了在基本面指标大面积失效的环境下,如何利用神经网络从股票量价数据中挖掘有效选股信息;在《提升AI模型边际效能:图注意力网络与特征集成》报告中,我们探讨了如何构建AI选股信号的多维度集成以增强选股能力。
至此,AI 选股策略中的 alpha 信号构建工作已基本完成,我们转而将目光聚焦在组合风险部分。
2024年以来,指数增强基金在获取超额收益方面已经面临着严峻挑战,许多基金出现阶段性的大幅超额回撤,组合风控重要性愈加凸显。
2024年春节假期前后,由于市场大小盘风格切换,跟踪中证500、中证1000等指数的量化私募产品出现大幅超额回撤;9月末到10月初的市场单边上涨行情中,许多公募指数增强基金跑输基准;10月下旬后市场板块轮动加快、风格切换频繁,也增大了指数增强基金获取超额收益的难度。

以我们跟踪的中证500和中证1000指数增强组合为例,2024年出现了两次较大幅度的超额收益回撤。其中,春节前后指数增强超额收益回撤主要来自于SIZE风格,而9月下旬以后,BETA风格暴露则是组合主要的负向超额收益来源。

从风格因子净值走势来看,部分风格因子在2024年的波动显著放大,SIZE、BETA等指标在2024年2月和10月份分别出现两次剧烈的因子收益跳动。
因此,风格因子收益的剧烈波动是2024年以来指增超额回撤的一个重要原因,通常风格因子波动率放大时,控制组合风格暴露往往能有效改善组合的风险表现。

然而,2024年以来,组合端约束传统风格因子暴露却难以有效改善组合的风险表现。以2024年9月末以来指增的超额收益回撤为例,事后绩效归因看,低BETA暴露贡献了组合大部分负向超额收益。
但是,我们在组合维度约束BETA风格因子的相对偏离,随着风险约束收紧,2024年以来组合超额收益明显降低,但是组合超额收益的回撤幅度却不出现下降。

为此,我们寻求更有效的风险优化特征。相比于barra风格因子侧重于长窗口收益的解释,2024年明显的变化是风格切换速度加快,同时AI选股模型偏向于交易型的信号更容易让组合在短期量价风险维度有更高暴露,因而我们希望基于量价数据提取变化更为迅速的风险特征。 
对于风险特征而言,我们认为有两种方式可以改善组合的风险绩效:
  1. 利用风险调整alpha信号:面对组合回撤,我们归因于alpha信号失效,通过风险特征调整alpha,进而改善组合绩效; 
  2. 利用风险调整组合暴露:面对组合回撤,我们归因于选股体系遭遇短期风险事件,通过在组合优化端调整组合风险暴露,进而改善组合风险绩效; 
alpha架构体系依靠着长年的研究积累,轻易改变并非易事。因此,我们倾向于在组合优化端,通过风控体系调整组合面临的风险暴露。本文将尝试基于神经网络,从量价数据中训练、提取有效的短周期量价风险特征。


2

  基于深度学习的量价风险因子 



以往我们可能会构建短窗口波动、反转等特征控制组合短期量价风险,相较于手工构建风险特征,利用神经网络模型挖掘短期量价风险指标是更为高效的方式。本章节中,我们将尝试利用神经网络模型从各类量价数据中提取短期风险特征。

2.1 数据输入

我们依据不同数据源构建特征集合独立训练神经网络模型。数据集1到6为本文基础数据集合,相比之前的报告,我们以日内量价统计量更新了数据集6的特征构成。

此外,对于数据集1)和2),除短窗口特征外,我们增加了150日长窗口的训练。


2.2 网络结构

对于提取风险特征的网络结构,我们延续之前提取alpha信息的神经网络架构,采用时序网络以及截面网络的组合。 

首先,我们采用了LSTM结合自注意力机制的结构,从股票的量价数据中有效提取了时序特征。LSTM(长短期记忆网络)作为RNN(循环神经网络)的一种,它在处理股票时间序列信息方面表现出色,能够捕捉到关键的时序动态。 

其次,在实际的投资决策中,除了单只股票的时间序列信息外,股票之间的截面关联同样蕴含着至关重要的信息。为了捕捉这种股票间的相互关系,我们引入了图注意力网络GAT(Graph Attention Network)。GAT是一种图神经网络,它通过注意力机制来编码股票之间的复杂截面关系,从而为我们提供了一个全面的视角来分析和预测市场动态。 

最终,通过结合LSTM的时序分析能力和GAT的截面关联捕捉能力,我们的模型能够更全面地理解股票市场的行为,为投资决策提供更为深入和精确的洞察。 

因此,在本文中我们结合时序分析和图结构分析构建复合模型,以全面捕捉股票市场的特征。LSTM模型处理每个样本在时间维度上的迭代,其能够记住长期依赖关系,但并不涉及样本数据间的交互。将LSTM的输出接入自注意力机制捕捉序列内部的依赖关系,再接入图注意力网络GAT以捕捉不同股票之间的相互关联。

我们具体的网络结构如下:

其中input为模型输入,MLP之后得到output为网络模型输出,其为长度N的向量,对于任意时间点的N只股票,我们得到1个风险因子;[]符号表示矩阵concat操作,下标表示在时间维度取索引,adj为图网络中的股票邻接矩阵。

对比以往报告中我们对于alpha特征的提取,考虑到风险因子的不可加性,我们并未在一个特征集合提取多个风险特征,这将导致风险特征的维度爆炸。因此,我们选择在一个数据特征集合中只提取一个风险表示。

神经网络的训练过程中,我们遵循以下步骤提取风险信息:

  1. 滚动训练策略:我们采用滚动训练方法,每年更新模型,使用过去8年的历史数据作为训练基础,确保模型能够适应时间序列的变化; 

  2. 数据时间序列拆分:我们将数据集按照时间顺序进行划分,将最后10%的数据保留作为验证集,用于评估模型的泛化能力,而其余数据则用于训练模型; 

  3. 按日拆分训练批次:在训练过程中,我们按照日为单位将数据拆分为不同的批次,确保每批次输入网络的样本来自同一时间点; 

  4. 早停机制:为了预防模型训练过程中的过拟合现象,我们引入了早停机制。该机制会在验证集上的性能不再提升时停止训练,从而保证模型的泛化性能。

因此,对于图网络模型而言,邻接矩阵的定义至为重要。在以往报告中,挖掘量价数据中的alpha信息时,我们认为股票节点之间的连通性与它们的风险暴露紧密相关,而行业和风格正是风险最自然的刻画,因此我们据此构建图结构。

行业以及风格的图结构关系长期稳健,而我们挖掘风险信息时希望更快速捕捉股票市场的风险变化,因此我们借助于股票走势趋同性获取更快速变化的图结构:

  1. 任意截面,初始化股票间原始邻接矩阵 A_style=ones(N,N),N为股票数; 

  2. 根据股票历史收益序列,计算股票直接的协方差矩阵 corr=correlation(ret); 

  3. 对于任意股票i, for i=1,…,N;

  4. 选取日收益率相关性最高的k只股票,作为邻接节点 idx=argtopk(corr[i,:]); 

  5. 默认股票i与其余股票之间均不连通 A_style [i,-idx]=0;

此外,对于损失函数而言,我们比较alpha和风险异同。alpha因子与风险因子的相似点在于,二者均要求因子对于股票截面收益具有较高的解释度,若我们以因子与股票截面收益之间的相关系数𝒊𝒄来度量解释能力:

  1. 对于alpha因子,我们要求ic_t序列在时间序列上方向是一致的,因此提取特征时通过最大化相关系数𝒊𝒄来达到目标;

  2. 对于风险因子,我们不要求ic_t序列在时间序列上具有一致性的方向,因此我们将目标设置为最大化相关性绝对量|𝒊𝒄|;

同时,对于标签label的设定,以往我们挖掘alpha时,经常在股票原始收益基础上剥离风格收益,以股票的alpha收益作为预测目标;但考虑对于风险做预测时,风险是由真实的截面收益差异所表征,我们想获取风险特征和股票真实涨跌之间的关联。

因此,我们将标签label定义为股票未来5日真实收益率:同时将损失函数定义为


2.3 风险因子

基于数据输入和网络模型,我们得到8个维度的量价风险刻画。对于股票未来5日收益而言,这8个风险因子大体符合我们对于风险的定义,因子在各年份中均具有较低的IC均值水平,以及较高的|IC|均值。

以|IC|均值度量因子对于截面收益差异的解释能力,对比barra风格因子,对于股票周度等短窗口收益而言,短周期量价风险特征在单因子维度表现出更强的解释能力。

此外,对比2019年以来|IC|均值以及2024年|IC|均值,barra风格因子中SIZE和BETA风格在2024年均值显著高于历史均值,2024年市场风险放大在barra风格因子中主要反应在这两个维度,这与我们在开篇中对于组合业绩归因的结论相一致。

同时,相比于传统量价风格因子,本文的风险特征对于风险的解释能力在2024年显著高于历史均值,在量价风险放大的市场行情中,这些因子恰好提供了更有的风险解释能力。然而传统风格因子中如低波动、低流动性等量价指标,对于单只股票维度而言,这些特征的暴露实质上是长期稳健的,其对于快速风险变化的风控能力有限。

对于风险因子,我们希望得到的是一个IC序列围绕零均值大幅波动的因子表示。对比本文构建的量价风险特征,我们发现部分指标在特定年份仍呈现出较强的alpha属性。

究其原因,在训练神经网络时,我们要求任意截面上预测值和标签之间具有较高的|IC|,然而若一个因子长期IC稳定为正向且幅度较高,其应被认定为alpha,但是在我们的训练体系中会将其误判为风险因子。

为此,我们尝试对风险因子进行alpha中性处理,以剥离原始风险特征中可能蕴含的alpha信息。

具体地,我们会对每个数据特征集合独立进行二次训练,分别提取风险因子和alpha因子特征,并将风险因子对alpha因子进行中性处理。

从结果上看,剥离alpha信息对于这些短周期量价风险特征的风险解释能力影响不大,因子|IC|均值略微下降,但仍保持较高水平;同时,因子的alpha属性显著减弱,各因子在各年份的IC均值基本在0附近波动,整体表现为更为纯粹的风险属性。

对于风险特征而言,我们不寄希望于其能提高组合收益,但我们想验证对于投资组合这些风险特征能否有效降低组合的波动和回撤。在构建组合之前,我们先在后续章节简述本文的alpha架构。最终,结合风险和alpha检验量价风险指标对于组合的风控效果。


3

 基于深度学习的alpha架构



本文的alpha信号来源于神经网络模型在不同数据源中提取的选股信息。类似于风险特征的提取,数据集1到6为本文基础量价数据,其中alpha数据源与风险数据源的差异点在于alpha架构中包含基本面信息,数据集7为常用基本面因子构成的特征集合。

最终的alpha架构为多模型集成。每个数据集我们采用多个神经网络进行特征提取,并且进行特征交叉之后形成多组特征集合;对于每组特征集合我们考虑预测目标多样性以及预测算法多样性构建得到多个综合信号。

最终,我们将得到数量为“综合特征集数×集成算法数×标签数”的收益率预测信号。对于这些收益率预测取均值,即得本文多维度集成的alpha信号。

AI信号2024年以来在全A股票中表现不佳,多头组合勉强持平全A等权收益,相比于2023年以前因子在全A中的高幅度超额,衰减迅速。但是我们并不认为深度学习选股模型就此失效,因此如我们在第一章节所述,我们倾向于用风险特征调整风控而非alpha。

首先,综合信号在沪深300、中证500和中证1000等核心指数成分中并未失效,多头组合在2024年的超额收益仍然显著;其次,从细分因子来看,神经网络模型在各数据集上提取的细分因子,2024年以来多头组合超额收益虽然相比于2023年进一步衰减,但大部分因子仍然保持有正向的多头超额收益。


4

 指数增强组合的量价风控



我们构建沪深300、中证500和中证1000指增组合,检验量价风险因子的风控能力:

  1. 每个组合分别构建对照组、实验组,它们共享基础风控约束条件; 

  2. 在基础风控信息以外,实验组增加了组合在短周期量价风险因子的相对暴露约束; 

其中基础风控信息如下:

  1. 每周末得到持仓,按照周一均价撮合,按照双边0.3%计算交易成本;

  2. 指数成分权重下限80%,单次调仓约束单边10%换手上限;

  3. 风格暴露:SIZE相对偏离上限0.2,行业最大相对偏离上限2%;

  4. 个股偏离:沪深300指数1.2%,中证500指数0.8%,中证1000指数0.5%;


4.1 中证500指数

首先,对于中证500指数增强组合而言,约束短周期量价风险能在不损伤收益前提下有效降低波动和回撤。

两个组合年化超额收益均约16.90%,但是约束风险后,组合跟踪误差从5.5%下降到5.1%,信息比从2.66提高到2.86;截至20241031日,组合在2024年超额收益最大回撤从7.3%下降到5.7%。


4.2 中证1000指数

对于中证1000指数增强组合而言,合理控制短周期量价风险暴露,同样也能在不损害收益的基础上有效降低组合的波动和回撤。

约束量价风险之后,收益维度,组合2019年以来年化超额收益从23.2%下降到22.1%,整体下降幅度并不大;但在风险维度,组合跟踪误差从6.1%下降到5.2%,信息比从3.22提高到3.65;截至2024-10-31日,组合在2024年超额收益最大回撤从9.0%下降到5.9%。

整体而言,对于中证500、中证1000等中小市值以下的宽基指数增强而言,我们发现这些短周期量价风险的约束对于组合的波动和回撤都有明显控制效果;同时,因为我们在构建风险特征之时剥离了alpha信息,因此这些风险特征对于组合收益的损伤非常有限。


4.3 沪深300指数

然而,对于沪深300指数增强组合而言,约束短周期量价风险暴露对于组合波动、回撤等风险表现能发挥的风控效果非常有限。

在约束量价风险暴露之前,沪深300指数增强组合从2019年以来年化超额收益12.9%,跟踪误差5.2%,信息比2.23;截至20241031日,组合在2024年超额收益5.5%,超额最大回撤幅度约5.4%。

在沪深300指增组合上增加对于短周期量价风险的暴露约束,我们发现组合风险表现并未出现显著改善,收益反而出现降低。

2019年以来,约束风险后组合超额收益最大回撤幅度从5.4%下降到5.3%,略微降低,跟踪误差从5.2%下降到4.7%;但是,超额收益年化值从12.9%下降到10.8%,整体信息比从2.23下降到2.06。

我们猜测可能的原因有二:

其一,从沪深300指数增强组合在2024年的绩效来看,其最大5.4%的超额回撤相较于中证500和中证1000指数增强组合而言要低很多,这意味着大市值蓝筹股本身受到量价风险的影响较小,我们在组合中约束这些风险本身意义不大;

其二,我们所有的风险特征都基于全A股票样本训练构建,在中小市值股票占多数的市场中,这些风险指标更适配于中证500、中证1000等中小市值宽基指数的风险控制。


5

 总结



2024年以来,由于市场波动放大、风格切换速度加快等原因,指数增强基金出现过数次大幅跑输业绩基准,超额收益明显回撤的行情。从组合业绩归因来看,风格因子贡献了显著的负超额收益。

然而我们发现,在组合构建时约束风格因子的相对暴露,对于组合的风险表现改善并无明显效果。为此,我们希望基于量价数据提取变化更为迅速的风险特征以改善指增组合的风险表现。

我们基于深度学习从不同类别的数据特征集合中构建了8个维度的短周期量价风险刻画,这些风险指标对于股票周度窗口的截面收益呈现出显著的解释能力。

为了避免构建的风险特征中夹杂alpha选股信息,我们在风险因子中剥离其蕴含的alpha信息,得到因子IC序列围绕零均值波动的纯粹风险刻画。

对于中证500、中证1000等宽基指数增强组合而言,历史上短周期量价风险约束能保证不损失组合收益前提下,有效降低组合的波动和回撤,显著改善指增组合的风险表现。

尤其在2024年,约束短周期量价风险后,指数增强组合超额收益的回撤幅度出现明显降低。



风险提示:报告结论基于历史数据统计建模,模型过拟合、市场风格切换均可能导致失效。

本文节选自国盛证券研究所于2025年1月16日发布的报告《基于深度学习的短周期量价风控体系》,具体内容请详见相关报告。

缪铃凯    S0680521120003    miaolingkai@gszq.com

刘富兵    S0680518030007    liufubing@gszq.com 

特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。


重要声明:本订阅号是国盛证券金融工程团队设立的。本订阅号不是国盛金融工程团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。


本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。


版权所有,未经许可禁止转载或传播。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178099
 
35 次点击