急性肾损伤(AKI, Acute Kidney Injury)是住院患者中常见的临床综合征,与诸多不良后果相关联,包括发病率、死亡率以及医疗保健成本的增加。共识标准以血清肌酐(SCr, Serum Creatinine)浓度升高或尿输出减少作为定义AKI的标志物。生物标记物在检测AKI上的应用始于数年之前,然而,至今为止,这些工具的大规模真实性验证和实际应用仍存在相当大的局限性。在研究早期AKI的尿液和血清生物标志物的同时,数个研究团队已经对能够在SCr浓度发生变化之前识别AKI的电子健康记录风险评分的准确性进行了详尽的报告。这些已发布的算法涵盖了从基于规则的精简评分到复杂的机器学习评分等多种模式。然而,无论使用何种评分模型,这些风险评估工具的外部验证范围相对较窄。
本研究计划对AKI评分简易版在混合数据集(包括市中心三级转诊医院[UC]以及其他两个独立健康系统如洛约拉医学中心[LUMC]和北岸大学卫生系统[NUS]的回顾性队列数据)进行内外部验证。
本研究纳入了三种不同类型的成年患者群体(年龄均为≥18周岁),用于对前期研究开发的AKI算法中的前瞻性采集数据进行详细研究。其中,对于内部验证,直接参照了在UC中已发布的验证队列(自2008年至2016年)中所有入院且符合AKI标准的成人群体的相关数据。至于外部验证,则参考了自2007年至2017年在LUMC以及自2006年至2016年的NUS中入院的成年患者。最终队列总计包括495971名成年患者,这些患者分别来自于三个卫生系统的六家医院。
本研究采用了内部验证和外部验证的方法来评估一个机器学习风险评分模型对AKI的预测能力。内部验证:研究使用了来自UC的数据作为内部验证集。首先,研究团队使用UC数据开发了一个梯度提升机模型,该模型包括97个变量,并使用离散时间生存分析进行了模型开发和验证。然后,为了将其精简至59个变量,本研究在前期研究的基础上,以相同的衍生队列进行模型开发,并在衍生数据中采用10倍交叉验证来调整模型的超参数。在内部验证阶段,研究团队使用这个简化模型对UC的数据进行预测,并计算了接收者操作特征曲线下面积(AUC)来评估模型的预测性能。外部验证:研究使用了来自LUMC和NUS的数据作为外部验证集。在外部验证阶段,研究团队同样使用了之前在UC数据上开发的简化模型对LUMC和NUS的数据进行预测,并计算了AUC来评估模型的预测性能。
表1展示了所有三个队列中预测AKI所有阶段和未来48小时肾脏替代疗法(KRT, Kidney Replacement Therapy)需求的模型判别结果,对于所有预期结果,UC小组中的表现与其他两组基本相当或略高。模型预测了2期AKI在48小时内的发展,UC队列的AUC为0.86,NUS队列的AUC为0.86,LUMC队列的AUC为0.85。模型对于预测未来48小时内需要进行KRT治疗的患者的准确性尤其优异,其AUC值均达到0.95或更高。
表2提供了三个队列根据患者住址,入院血清肌酐(SCr, Serum Creatinine),和既往手术室状态对未来48小时内发展为第二阶段AKI的预测模型的AUC值。在UC和LUMC队列中,模型在ICU患者中预测第二阶段AKI的能力相对于病房患者略高。在所有三个队列中,模型在预测未来48小时内病房患者的第二阶段AKI方面具有非常相似的辨识能力。在所有三个队列中,模型在入院SCr浓度较高的患者中表现更好,尤其是入院SCr浓度在2.0至2.9mg/dL之间的患者。在所有站点的所有子组中,未来48小时内发展为第二阶段AKI的AUC值均大于0.80。如图1所示,若设定高敏感度(60%),以LUMC为对照,在UC和NUS触发的警报相对较少。
综上所述,本研究从内部和外部角度对新型机器学习风险评分进行了严谨的验证,旨在在所有医院环境中对AKI的预测进行评估。此工具包含了患者人口统计特征、生命体征、实验室数值以及护理评估等要素,能够有效识别出可能处于严重AKI发展风险及需要KRT治疗的患者。将此风险评分与早期以肾脏为重点的护理相结合,有望改善那些处于AKI发展最高风险的患者的预后。