如图1所示,开发的模型在测试集中分别展示了以下预测能力:非截肢(AUC=0.90),轻度截肢(AUC=0.86),重度截肢(AUC=0.85)。模型的其他评价指标,包括敏感性、特异性、NPV和PPV,如表1所示。上述结果表明,多类分类模型具有较强的预测能力,其加权平均AUC(0.90)、敏感性(87.1%)、特异性(74.4%)、NPV(79.7%)和PPV(86.3%)。此外,如图2所示,各类别的校准曲线均接近45°线,而Brier评分(名解1)的加权平均值为0.086,说明模型的预测概率接近观测概率。
如图3所示,通过计算训练集样本中模型预测的平均值,可以得出一名住院期间接受了小型截肢手术的患者非截肢、轻度截肢、重度截肢的基线风险分别为0.76、0.11、0.13,使用模型后,显示出该患者非截肢、轻度截肢、重度截肢的预测概率分别为0.28、0.51、0.21。这表明SHAP算法潜在地解释了如何根据基线风险(名解2)和患者特征获得预测概率。
总而言之,本研究开发了一种可解释的机器学习模型,用于预测DFU患者在住院期间的截肢风险。该模型被发现具有很高的预测能力,可以准确估计DFU患者的截肢率。SHAP 算法用于解释模型的预测,并深入了解每个特征对预测的贡献。