传统的回归模型,如线性回归和逻辑回归,已经在临床研究中使用了几十年。而近十年来,近十年来,机器学习技术在临床研究领域异军突起,正逐步获得学术界的广泛关注与青睐。随着计算能力的飞跃式提升与大数据资源的爆发式增长,机器学习方法在处理非线性复杂关系及高维数据方面展现出独特优势。例如,像支持向量机(SVM)、随机森林(RF)、决策树(DT)及极端梯度提升(XGBoost)等机器学习方法已经在临床研究中得到了广泛应用。那么在临床研究的演进历程中,机器学习方法是否终将全面取代传统回归模型的主导地位呢?
近日,来自中国医科大学的研究员们在BMC Geriatrics期刊发表了题为“A cross-sectional study comparing machine learning and logistic regression techniques for predicting osteoporosis in a group at high risk of cardiovascular disease among old adults”的研究论文,确定了在预测骨质疏松症时,其传统回归模型优于四种机器学习方法,并且发现低钠盐饮食和拷贝数变异与骨质疏松患病风险显著相关。
一、研究背景
骨质疏松症是一种以骨量低下,骨微结构损坏,导致骨脆性增加,易发生骨折为特征的全身性骨病,已成为全球公共健康的重要议题,尤其是在老年群体中。随着人们寿命延长,患病风险和数量逐渐增加。该病由遗传、生活方式、环境等多因素引起,与骨密度、心血管疾病等发生发展密切相关。
现有研究的风险评估方法多依赖于传统的回归模型,如逻辑回归(LR),已被广泛用于识别风险因素和预测疾病概率。而随着高级统计技术的发展,机器学习(
ML)为提高预测准确性提供了有前景的替代方案,像DT、RF、SVM和XGBoost等机器学习方法,构建预测模型会有较高的预测准确度。然而,目前针对老年高心血管疾病风险人群骨质疏松症的预测研究仍较为匮乏,所以本研究致力于比较机器学习和普通回归构建预测模型哪个更好,并探讨骨质疏松症的影响因素和患病概率,为开发老年人心血管疾病高风险预防策略奠定基础。
二、研究方法
本研究共纳入211名高风险心血管患者进行数据收集,使用了LR和四种成熟的ML算法(DT、RF、SVM和XGBoost),结合包括年龄、性别、血糖、甘油三酯(TG)、中风病史、骨折病史等临床数据,构建骨质疏松风险预测模型。
在数据分析过程中,ML数据集按8:2比例随机划分,其中20%作为测试集。基于混淆矩阵的几个性能指标对模型进行评估(包括真阳性(TPs)、真阴性(TNs)、假阳性(FP)和假阴性(FN)、受试者工作曲线下特征面积(AUC)、正确率、召回率、F1得分等)。
LR通过AUC(曲线下面积)评估模型的区分能力;Brier评分和校准曲线评估模型的校准度;根据决策曲线分析(DCA),判断老年人可能会从预测模型中获得什么样的净收益。最后,为确保结果的可靠性,本研究还使用了bootstrap
重采样进行内部验证,并通过列线图(nomogram)可视化模型、回归分析,筛选出对骨质疏松有显著影响的关键变量。
三、研究结论
1. 本研究其传统回归模型优于机器学习方法
研究员发现,在预测骨质疏松症时,LR的AUC值为0.751,优于其他机器学习(如SVM0.72,RF0.70,XGBoost模型0.697,DT0.69)。LR不仅具有较高的辨别能力,而且其变量解读清晰,适合临床应用。
2. 低钠盐饮食与骨质疏松的关系
此外,研究表明,低钠盐饮食在老年心血管高风险群体中或能成为骨质疏松症的重要影响因素之一。现有研究较少涉及此领域,本研究为低钠盐饮食干预提供了新的视角。特别是在结合其他临床和遗传因素后,低钠盐的摄入对骨质疏松风险干预具有参考价值。
3. 基因变异与骨质疏松风险的关系
值得注意的是,研究员通过将遗传因素纳入模型,发现基因组结构变异中最常见的变异类型-拷贝数变异(CNV)特别是nssv659422,与骨质疏松症患病风险显著相关。此研究首次将CNV纳入骨质疏松预测模型,为未来个性化医疗和预防干预奠定了基础。
参考来源:
Peng Y, Zhang C, Zhou B. A cross-sectional study comparing machine learning and logistic regression techniques for predicting osteoporosis in a group at high risk of cardiovascular disease among old adults. BMC Geriatr. 2025 Mar 29;25(1):209. doi: 10.1186/s12877-025-05840-w. PMID: 40158079; PMCID: PMC11954202.
撰写:彤彤
编辑:小饼干
授权转载等事宜请联系梅斯学术管理员
梅斯学术管理员微信bjy1689902068,备注学术转载
点击“阅读原文”,即刻加入科研会员,限时折扣开通中