本部分主要展示未来5日和未来10日因子的周频、双周频及月频选股能力。由于调仓路径可能影响因子选股效果,故后文若未特别说明,因子的表现均为多路径的平均。例如,测试周频选股能力时,IC、年化ICIR、胜率等为5条路径的平均值。当然,后文也会展示不同路径的结果。
如下表所示,两个因子均呈现十分显著的周度选股能力。不同成交价假设下,因子周均IC和Rank IC接近甚至超过0.1,周度胜率逾85%。相对而言,未来5日因子的表现更优,但自相关性更低,因而换手率略高。
如果我们希望获得Rank IC更高的因子,可对预测标签进行强制正态分布调整。这样一来,因子周均IC虽小幅下降,但Rank IC提升明显(表2)。当然,本文并不单纯追求更高的Rank IC,因此后文依旧以未调整的预测标签训练因子。
上述深度学习因子以低频量价和高频量价特征作为模型输入,且未在训练中添加相关性约束,可以预期,它与原始量价类因子存在一定的相关性。因此,我们计算了该因子与常见因子之间的截面相关性均值及截面相关性绝对值的均值,结果如下表所示。
混频深度学习因子与反转、换手率和波动率三个低频量价因子的相关性相对较高,绝对值均值处在0.2-0.3之间;和风格类因子(市值、估值)及高频量价因子(后5行)的相关性在0.1-0.2之间,和基本面因子(ROE和SUE)的相关性最低,不超过0.1。
下表展示了两个因子多头组合相对全市场平均的分年度超额收益。为了更贴近实践,本文在构建多头组合时,考虑了股票停牌及涨跌停板的限制,并假定按次日均价成交。
TOP 10%组合的多路径平均年化超额收益约为30%,而TOP 100组合的多路径平均年化超额收益更高,达到34%以上。2023年以来,未来10日因子的多头效应更强。
由表1和2可知,两个因子的换手率高达60%左右。因此,我们在双边千三的交易成本假定下,进一步考察因子的费后多头超额收益。
如上表所示,交易成本对因子多头效应的影响较为明显。不同标签下,超额收益都降至20%左右。由于未来5日因子的换手率更高,故受到的影响更大。不仅年化超额收益不足20%,2023年以来仍为负超额收益。
在上文的回测中,为避免调仓路径的影响,我们以多条路径的均值评价因子的选股能力。下表进一步展示了每条路径上,因子的IC和多头组合超额收益。从中可见,TOP 100组合在预测标签为5日的情形下,年化超额收益受路径的影响最大。最优路径和最差路径上,年化超额收益的差异超过10%。我们猜测,这一现象很可能是各调仓路径上,因股票的可交易状态不同使得待选池有所差异而导致的。
上述结果都是从全市场所有股票(剔除次新和ST)的回测中得到,但考虑到大多数公募基金的量化产品都有较为严格的选股范围约束,我们进一步测试了因子在不同指数成分股内及各市值和成交金额区间的选股能力。
由下表可见,如果按宽基指数划分,因子在中证800与1000外的股票中,IC和多头超额收益最优,其次是全市场中。表现相对较差的是在沪深300成分股中,但IC依然有0.071,多头超额收益也能达到25%。
若按市值大小划分,处于中间40%的股票中,因子的IC和多头超额收益皆为最高,其次是市值最小的30%股票;若按成交金额高低划分,反而是最高的30%股票中,因子表现更好,IC超过0.11,多头超额收益更是在35%以上。
总体来看,该因子在不同范围内的选股效果都较为出色。相对而言,成交金额较高、市值适中的这一类股票,更适合因子的发挥。
在前期的深度学习因子挖掘报告中,我们使用30分钟的高频特征训练得到因子,并将其放入传统的线性加权打分模型,和其他因子共同预测收益,而本文则是通过一个非线性模型直接完成了上述三个步骤。为了探究这两种方式的差异,我们对比了高频深度学习因子(改进GRU和残差注意力)、高频深度学习因子和低频量价因子经IC加权复合后的因子及混频深度学习因子的选股效果。
由上表可见,与低频量价因子复合较为显著地提升了原始高频深度学习因子的IC和RankIC,但也付出了ICIR和胜率下降的代价。而将低频和高频特征一同输入深度学习模型,则获得了IC最高的因子。同时,其余评价指标,如ICIR、RankIC、胜率等,都处在较优的水平上。
进一步对比多头组合的超额收益,结论也是类似的。2017年以来,混频因子的年化超额收益高于另两类因子10-20个百分点。因此,我们认为,在原先仅使用高频数据训练因子的基础上加入低频量价特征,以及采用非线性的加权,都有可能获得更好的因子或收益预测。这也给了我们另外一个启示,如果想要构建更多、更有效的量价因子,混频训练的深度学习模型或许是一条可行的思路,下文也将对此给出简单的示例。
我们进一步考察在双周和月的换仓频率下,因子的选股能力。如下表所示,当持有期延长后,因子的IC显著上升。在任何一种成交价格的假设下,IC和Rank IC都高于0.1。但是,作为高频因子,更低的换仓频率必然导致超额收益大幅下降。月频换仓下,因子多头年化超额收益仅为15%左右,相比表4中周度换仓的30%,降幅高达50%。即使是考虑3‰交易成本的周频换仓因子(表5),超额收益依然高于未计算成本的月频因子。因此,我们认为,在相对合理的成本下,高频因子还是更加适合在短周期下使用。
类似地,我们也回测了双周频和月频因子在不同选股范围内的年化多头超额收益,结果如以下两图所示。在中证800和中证1000以外或成交金额较大的股票中,因子的多头超额收益更高。
和周频换仓相比,双周频和月频换仓的路径更多,因而不同路径上的超额收益差异也更大。由以下两图可见,双周频和月频因子TOP 10%多头组合在最优和最差路径上,年化超额收益的差异分别接近4%和7%。