社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

全体目光向我看齐!给大家介绍个新思路!SEER数据库+6种机器学习,纯分析1区6分+,发文就是这么简单!

生信塔 • 9 月前 • 273 次点击  

各位小伙伴们大家好,我是小塔,我们又见面啦~今天小塔给小伙伴们带来了一篇优秀的机器学习文章!
常做科研的小伙伴们都知道,跑代码容易找数据难!最近,小塔发现了一个新数据库,下面小塔将结合文章思路详细给大家介绍一下。那么,这篇文章是如何进行研究的呢?让小塔为大家一一揭晓答案吧~
1,应用多种机器学习算法进行预后预测:文章比较了六种不同的机器学习算法在肝癌(HCC)患者预后预测中的表现,为疾病的研究提供了更全面的视角;
2,关键预后因素的识别:文章通过机器学习模型的特征重要性分析,确定了在生存预测中重要的因素。这些发现有助于医生更好地理解影响患者预后的关键因素,从而制定更有效的个性化治疗方案。想发SCI的小伙伴们可以参考一下本文的研究思路~~(ps:对于生信研究,往往找到合适的数据后再整合恰当的思路方法,即可轻松复制。方法对了,发文章就是这么简单!不知道如何整合需要帮助?需要相关思路设计或复现的小伙伴可以来找小塔!)。


定制生信分析

云服务器租赁

加微信备注99领取使用


l题目:基于机器学习的甲胎蛋白阳性肝细胞癌预后预测模型的开发
l杂志:Journal of Translational Medicine    
l影响因子:IF=6.1
l发表时间:2024年5月
友情提示:文末可获取文献的链接哦~或者关注小塔,回复“666”直接后台获取原文!文献编号:240721
研究背景
肝癌是一种恶性肿瘤,随着机器学习应用日益普及,机器学习在肝癌治疗领域的研究也日益增多。本研究利用机器学习算法,对肝癌患者的生存数据进行模型的建立、训练和验证。
数据来源
本研究使用的数据来源于SEER(Surveillance, Epidemiology, and End Results)数据库。研究纳入了2004年至2015年间诊断为AFP阳性肝细胞癌(HCC)的患者数据,最终筛选出2038名符合条件的AFP阳性HCC患者。
研究思路
首先,研究人员从SEER数据库 中下载肝癌患者的数据,根据预设的纳入和排除标准筛选出符合条件的患者。接着,研究人员将这些数据随机分为训练集和测试集,利用六种机器学习算法(XGBoost、逻辑回归、支持向量机、随机森林、K近邻算法和决策树)建立预后模型,预测了肝癌患者的生存率,并通过ROC曲线等方法评估模型的预测性能。    
研究结果
1.模型特征的选择
研究人员从SEER项目中获得了AFP阳性肝细胞癌(HCC)患者的信息,大多数患者(74.0%)具有高纤维化评分,约59.0%的患者接受了手术治疗,41.6%接受了化疗,仅有6.7%接受了放疗。
研究人员按不同预后年限建立了XGBoost模型,并评估了不同特征的重要性(图1)。在1年预后模型中,最显著影响预后的前五个变量依次为手术、AJCC分期、肿瘤大小、婚姻状况和家庭收入中位数;而在3年和5年预后模型中,影响最大的五个变量分别为手术、AJCC分期、肿瘤大小、SEER分期和年龄。    
图1 XGBoost模型特征重要性分析
2.预后模型的建立
研究人员按7:3的比例随机分为训练集(n=1,428)和测试集(n=610)。研究人员利用XGBoost、逻辑回归、支持向量机、随机森林、K近邻算法和决策树算法训练了预后模型,并采用了十折交叉验证进行迭代测试和调优,经过多次测试并调整模型,最终确定了关键超参数(图2)。    
2 XGBoost模型的评估
3. 预后模型的评估
研究人员评估了多种预测模型在肝癌患者生存率方面的性能(表1)。XGBoost模型在1年、3年和5年生存预测中表现最佳,而其他模型的AUC值整体表现不及XGBoost。XGBoost模型的混淆矩阵显示出较高的预测准确性,且XGBoost模型的校准曲线展示了预测结果与实际观察结果的一致性(图3)。
         

 

表1不同算法建立的预后模型的表现结果
       
图3 XGBoost模型的决策曲线分析曲线
文章小结    
这篇文章通过机器学习,建立预后模型预测了肝癌患者的预后表现,并分析了影响患者生存的关键因素。看到这不知道小伙伴们有没有想法?快快行动起来吧!有需要机器学习思路设计或定制生信计算资源的小伙伴欢迎联系小塔,小塔这有各种创新思路和资源哟~
文章索引:
Development of a machine learning-based model to predict prognosis of alpha-fetoprotein-positive hepatocellular carcinoma
https://doi.org/10.1186/s12967-024-05203-w

小塔有话说


生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call小塔,我们团队竭诚为您的科研助力!

文献思路复现

定制生信分析

服务器租赁


 往期 · 推荐 

【倒计时提醒】抓住618大促尾巴:首月5折享16T空间,千元礼包等你领!

超赞!39分+!孟德尔随机化再次令人瞩目,UKB数据库+双疾病联合GWAS!配置超豪华,赶紧来学习吧!

这个思路藏不住了,再不学习就晚啦!天津中医药大学王耀刚团队1区13+:环境因素+孟德尔随机化研究,快学起来!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172492
 
273 次点击