从基础报告到全面评估(检查表中的主要部分):
· 第一部分:研究目标和可行性评估,帮助研究人员更好地评估其可用资源
· 第二部分:包括对数据来源、来源类型、数据类型、数据伦理的报告,以及关于数据点数量及其质量的详细信息
· 第三部分:包括对数据清理、数据增强、特征工程、数据分割及最终处理后数据的方法和明细的报告
· 第四部分:包括对所选ML方法和总体建模安排的报告
· 第五部分:包括了模型性能的评估和超参数优化 (HPO) 的重要方面
· 第六部分:包括了更好地理解和报告模型的可解释性、解释性以及因果关系
· 第七部分:着重于数据泄露和污染的管理,强调了机器学习建模并非简单的线性过程,而是一个相互嵌套的过程,其中每一步都对其他步骤产生影响
· 第八部分:数据和代码的分享,及其他重要信息