l题目:基于机器学习的甲胎蛋白阳性肝细胞癌预后预测模型的开发l杂志:Journal of Translational Medicinel影响因子:IF=6.1l发表时间:2024年5月(友情提示:文末可获取文献的链接哦~或者关注小塔,回复“666”直接后台获取原文!文献编号:240721)研究背景肝癌是一种恶性肿瘤,随着机器学习应用日益普及,机器学习在肝癌治疗领域的研究也日益增多。本研究利用机器学习算法,对肝癌患者的生存数据进行模型的建立、训练和验证。数据来源本研究使用的数据来源于SEER(Surveillance, Epidemiology, and End Results)数据库。研究纳入了2004年至2015年间诊断为AFP阳性肝细胞癌(HCC)的患者数据,最终筛选出2038名符合条件的AFP阳性HCC患者。研究思路首先,研究人员从SEER数据库中下载肝癌患者的数据,根据预设的纳入和排除标准筛选出符合条件的患者。接着,研究人员将这些数据随机分为训练集和测试集,利用六种机器学习算法(XGBoost、逻辑回归、支持向量机、随机森林、K近邻算法和决策树)建立预后模型,预测了肝癌患者的生存率,并通过ROC曲线等方法评估模型的预测性能。研究结果1.模型特征的选择研究人员从SEER项目中获得了AFP阳性肝细胞癌(HCC)患者的信息,大多数患者(74.0%)具有高纤维化评分,约59.0%的患者接受了手术治疗,41.6%接受了化疗,仅有6.7%接受了放疗。研究人员按不同预后年限建立了XGBoost模型,并评估了不同特征的重要性(图1)。在1年预后模型中,最显著影响预后的前五个变量依次为手术、AJCC分期、肿瘤大小、婚姻状况和家庭收入中位数;而在3年和5年预后模型中,影响最大的五个变量分别为手术、AJCC分期、肿瘤大小、SEER分期和年龄。图1 XGBoost模型特征重要性分析2.预后模型的建立研究人员按7:3的比例随机分为训练集(n=1,428)和测试集(n=610)。研究人员利用XGBoost、逻辑回归、支持向量机、随机森林、K近邻算法和决策树算法训练了预后模型,并采用了十折交叉验证进行迭代测试和调优,经过多次测试并调整模型,最终确定了关键超参数(图2)。
文章小结这篇文章通过机器学习,建立预后模型预测了肝癌患者的预后表现,并分析了影响患者生存的关键因素。看到这不知道小伙伴们有没有想法?快快行动起来吧!有需要机器学习思路设计或定制生信计算资源的小伙伴欢迎联系小塔,小塔这有各种创新思路和资源哟~文章索引:Development of a machine learning-based model to predict prognosis of alpha-fetoprotein-positive hepatocellular carcinomahttps://doi.org/10.1186/s12967-024-05203-w