社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

中信建投 | 机器学习在上市公司财务造假识别中的应用

中信建投证券研究 • 7 小时前 • 0 次点击  


重要提示:通过本订阅号发布的观点和信息仅供中信建投证券股份有限公司(下称“中信建投”)客户中符合《证券期货投资者适当性管理办法》规定的机构类专业投资者参考。因本订阅号暂时无法设置访问限制,若您并非中信建投客户中的机构类专业投资者,为控制投资风险,请您请取消关注,请勿订阅、接收或使用本订阅号中的任何信息。对由此给您造成的不便表示诚挚歉意,感谢您的理解与配合!


|王程畅

财务造假会影响投资者的判断,从而给投资者带来巨大的损失。本文选取了2001至2022年间,证监会,上交所以及深交所发布的公告中搜集到发生财务造假的A股上市公司作为造假样本,共涉及1503家公司的3959份年报。从财务指标、公司基本情况和市场指标三个维度入手,构建了特征变量池。使用了 Logistic 回归、XGBoost和MLP,3种机器学习方法,构建上市公司财务造假识别模型。其中XGBoost 回归结果最优,XGBoost结果为准确率76.43%,精确率18.12%,召回率69.63%,特异性76.93%。通过对特征重要度的分析可以发现,非标的审计意见、与财务费用相关的指标、与净利润相关的指标、预付款项等,在现实中如果要判断财务造假,可以从这些特征入手,观察它们是否出现异常。

财务造假数量增加,虚假记载是最主要的造假动机

2001至2022年,涉及财务造假的公司达1503家。财务造假会影响投资者的判断,从而给投资者带来巨大的损失,也给中国资本市场的健康发展蒙上了阴影。财务造假数量呈现增长趋势,虽然近两年有所缓解,但对财务造假的甄别仍然值得关注。经统计,超过90%的财务造假处罚类型均为虚假记载,因此可以围绕利润的形成过程,构建识别的特征。本文选取了2001至2022年间,证监会,上交所以及深交所发布的公告中搜集到发生财务造假的A股上市公司作为造假样本,共涉及1503家公司的3959份年报。为了保证模型的可回测性,选取控制样本为当年所有无造假的上市公司。对于连续年度造假的样本,将每一年都视为一个独立的造假样本。

根据财务指标、公司基本情况和市场指标,构建特征变量池,结合显著性检验筛选,使用多种机器学习算法构建预测模型

依据财务造假常见的手段,从财务指标、公司基本情况和市场指标三个维度入手,构建了特征变量池,结合显著性检验进一步筛选。本文使用了 Logistic 回归、XGBoost和MLP,3种机器学习方法,构建上市公司财务造假识别模型。不同算法的原理不同,表现相近。结果表明,XGBoost 回归结果最优,XGBoost结果为准确率76.43%,精确率18.12%,召回率69.63%,特异性76.93%。

不同机器学习算法中特征重要度均较高的特征是财务造假识别的关键特征 

通过对特征重要度的分析可以发现,在现实中如果要判断财务造假,可以从非标的审计意见、与财务费用相关的指标、与净利润相关的指标、预付款项等特征入手,观察它们是否出现异常。

数据质量风险:财务造假可能存续很多年,当前已经发现财务造假的公司可能并不全面,如果用于训练的数据集不完整,模型可能无法准确学习到财务造假的特征。如果训练数据存在偏差,模型可能会产生错误的预测,导致误报或漏报。

机器学习模型风险:机器学习模型可能会过度适应训练数据,导致在新的、未见过的数据上表现不佳。许多机器学习模型,尤其是深度学习模型,被认为是“黑箱”模型,其决策过程难以解释。这在财务审计领域可能是一个问题,因为审计师需要能够解释和验证模型的预测。模型可能会产生误报(将合法的财务行为错误地识别为造假)和漏报(未能识别出实际的财务造假行为)。

依赖风险:过度依赖机器学习模型可能会导致审计人员忽视其他重要的审计程序和迹象。

王程畅:中信建投资深策略分析师,CFA,北京大学计算机硕士,中南大学统计学学士;7年策略研究经验(2年私募基金,5年券商研究所),2019年加入中信建投研究发展部,专注另类投资策略研究,探索卖方策略研究的“AI+HI”模式,覆盖经济周期定位、行业配置、文本分析、期权衍生品等领域;2019年、2020年Wind金牌分析师第2名、第5名团队核心成员,2023年21世纪金牌分析师策略第4名团队核心成员。

证券研究报告名称:《机器学习在上市公司财务造假识别中的应用

对外发布时间:2024年11月20日

报告发布机构:中信建投证券股份有限公司 

本报告分析师: 

王程畅 SAC 编号: S1440520010001


近期热门视频

更多精彩视频,尽在中信建投证券研究视频号,欢迎关注~

免责声明

本订阅号(微信号:中信建投证券研究)为中信建投证券股份有限公司(下称“中信建投”)研究发展部依法设立、独立运营的唯一官方订阅号。

本订阅号所载内容仅面向符合《证券期货投资者适当性管理办法》规定的机构类专业投资者。中信建投不因任何订阅或接收本订阅号内容的行为而将订阅人视为中信建投的客户。

本订阅号不是中信建投研究报告的发布平台,所载内容均来自于中信建投已正式发布的研究报告或对报告进行的跟踪与解读,订阅者若使用所载资料,有可能会因缺乏对完整报告的了解而对其中关键假设、评级、目标价等内容产生误解。提请订阅者参阅中信建投已发布的完整证券研究报告,仔细阅读其所附各项声明、信息披露事项及风险提示,关注相关的分析、预测能够成立的关键假设条件,关注投资评级和证券目标价格的预测时间周期,并准确理解投资评级的含义。

中信建投对本订阅号所载资料的准确性、可靠性、时效性及完整性不作任何明示或暗示的保证。本订阅号中资料、意见等仅代表来源证券研究报告发布当日的判断,相关研究观点可依据中信建投后续发布的证券研究报告在不发布通知的情形下作出更改。中信建投的销售人员、交易人员以及其他专业人士可能会依据不同假设和标准、采用不同的分析方法而口头或书面发表与本订阅号中资料意见不一致的市场评论和/或观点。

本订阅号发布的内容并非投资决策服务,在任何情形下都不构成对接收本订阅号内容受众的任何投资建议。订阅者应当充分了解各类投资风险,根据自身情况自主做出投资决策并自行承担投资风险。订阅者根据本订阅号内容做出的任何决策与中信建投或相关作者无关。

本订阅号发布的内容仅为中信建投所有。未经中信建投事先书面许可,任何机构和/或个人不得以任何形式转发、翻版、复制、发布或引用本订阅号发布的全部或部分内容,亦不得从未经中信建投书面授权的任何机构、个人或其运营的媒体平台接收、翻版、复制或引用本订阅号发布的全部或部分内容。版权所有,违者必究。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176144
 
0 次点击