本期推荐一篇最新发表在RFS的论文《机器学习在连续时间金融中的应用》。在金融领域,动态规划是研究投资者、管理者等经济主体决策行为的重要工具,但传统方法在处理高维状态空间时面临“维度的诅咒”,即随着状态变量数量的增加,计算时间和内存需求呈指数级增长,极大地限制了模型的复杂性和适用性。为了解决这一问题,本文提出了一种基于机器学习的新型算法——深度策略迭代(DPI)算法,旨在探索如何高效地解决高维非线性连续时间金融模型中的动态规划问题。
该研究旨在探讨如何利用深度学习技术克服传统方法在高维状态空间中的计算瓶颈,从而能够处理更为复杂的经济环境和更为丰富的模型设定。研究方法的核心在于结合深度神经网络、伊藤引理以及自动微分技术。具体而言,通过深度神经网络来近似价值函数和策略函数,利用伊藤引理和自动微分技术高效计算连续时间动态系统中的期望值,从而避免了传统方法中计算高维偏导数所带来的高昂计算成本。此外,该算法还采用了基于策略梯度的广义策略迭代方法,通过逐步改进策略函数来解决高维问题中的优化难题。
研究结论表明,DPI算法在多个金融领域的应用中表现出色。在资产定价方面,该算法能够成功解决包含多达100棵树的Lucas果园经济模型,且计算时间随状态变量数量的增加而线性增长,显著优于传统的Smolyak投影方法。在公司金融领域,DPI算法能够准确处理具有尖点的策略函数,解决了企业面临股权发行和投资调整成本时的动态决策问题。在投资组合选择方面,该算法不仅能够处理高维问题,还能通过逆向工程技术验证其在复杂投资环境中的准确性和效率。这些结果表明,DPI算法为金融经济学研究提供了一种强大的新工具,能够有效解决高维非线性问题,为深入研究复杂的经济现象提供了可能。
Machine Learning for Continuous-Time FinancVictor Duarte, Diogo Duarte, Dejanir H Silva