Py学习  »  机器学习算法

“泼天富贵”降临诺奖“机器学习”!复旦中山医院神操作,10种机器学习+101种算法组合+多组学,纯分析搞定1区top!

生信塔 • 昨天 • 9 次点击  

实在是按捺不住,生信塔这两天集中发布的主要是“机器学习(ML)”,原因大概分2点:
1,受到空前的关注:人工智能(AI)本来就是自带B格的话题,机器学习更是其中的典型,在数据分析和决策制定中优势显著;这次AI获得物理和化学双诺奖,是表彰ML过去取得的成绩,也为其未来的发展和应用前景再次背书(这对我们做生信的人来讲,这绝对是重大利好,能显著的提高“AI”的影响力和认可度)。
2,在临床和基础医学都应用广泛:生信塔过去介绍的大部分文献思路,一般都只能针对部分粉丝群体,受众面都有限制。但是机器学习工具可谓老少咸宜,临床/基础都可用。无论是临床数据还是高通量测序数据,ML都有用武之地,而且已经演变为最佳工具之一。比如,在临床层面,除了“药物设计与筛选”和“药物副作用预测”等药物研发领域,“机器学习”应用最广的还是“疾病诊断和预测”,包括“辅助影像诊断”和“诊断/预后模型构建”等(ps:我们也不是完全为了追热点而选择“机器学习”,而是“机器学习”确实可以让临床预后模型不再是“盲盒”,而是变成了“精准预测的神器”)。
所以生信塔也趁热打铁,今日推出一篇机器学习领域的“黑科技”文章,由复旦中山医院团队在9.1分的Cancer Letters发表。该研究利用算法建立DNA损伤修复(DDR)指数,助力肝细胞癌的靶向治疗与预后分析,具有以下创新点:
1,10种机器学习方法的101种算法组合应用:本文可谓一桌“满汉全席”!将一般机器学习算法从3-5种直接升级到10种,并且,作者将RSF、LASSO等具备降维和变量筛选功能的算法与其他算法进行组合,最终足足做够了101种算法组合,大大提高了目的基因识别的准确度。(做到极致也是特色,而且不同算法在应用中,各具特色,小伙伴们也多加选择,或者参考本文,也来个“一锅炖”。文献中的10种算法共包括如下类型,小伙伴各取所需:RSF, Enet, Lasso, Ridge, Stepwise Cox, CoxBoost, plsRcox, SuperPC, GBM和survival-SVM等    
2,结合单细胞及多组学的公共数据,以DNA损伤修复(DDR)为研究角度,探索影响肝细胞癌(HCC)的肿瘤微环境。本文不仅方法全,而且数据足这擦出来的“火花”自然更加耀眼,还想纯分析拿下TOP期刊,本文思路不容忽视。
(PS:看到这,是不是非常期盼自己也能开发新的机器学习框架?有梦想就对了,多组学分析、机器学习都是生信塔的拿手绝活,想要复现本文思路,我们通通帮你全搞定,还不快来滴滴生信塔,有惊喜在等着你哦!)


定制生信分析

云服务器租赁

加微信备注99领取使用

l题目:通过深度转录组分析解码肝细胞癌的免疫调节和DNA损伤修复模式的治疗意义
l杂志:Cancer Letters
l影响因子:IF= 9.1
l发表时间:20242    
公众号回复“666领取原文PDF,文献编号:241014
研究背景
DNA损伤修复(DDR)在肝细胞癌(HCC)中扮演着关键角色,但其对患者的药物响应程度尚不清楚。作者利用多组学分析和机器学习算法,揭示了DDR与肿瘤微环境(TME)的相互作用。
数据来源 

 

研究思路
作者通过预处理单细胞RNA测序数据,开发了一种算法来评估恶性细胞的DNA损伤修复(DDR)状态,并用优势比(Odds Ratios, ORs)分析细胞类型分布。进一步,他们利用RNA测序和机器学习技术,创建了DDR评分系统(DDRscore),这有助于预测肝细胞癌(HCC)患者的总体生存率和对PD-1疗法的抵抗性。研究还探讨了DDR在HCC免疫调节中的作用,以及DDR评分在预测治疗反应和患者预后中的应用潜力。    
研究结果
1.肝癌恶性细胞的DDR异质性分析
作者运用bulk RNA-seq和scRNA-seq数据,结合101种机器学习算法,深入分析了肝细胞癌(HCC)的细胞群。鉴定了19个基因模块,筛选出3230个关键基因,其中56个参与DDR过程,为理解肿瘤进展提供了新视角。
1 恶性细胞中的DDR异质性
2.不同DDR条件下HCC中TME生态系统的不同概况
作者基于患者DDR状态将肿瘤微环境分为“高DDR”和“低DDR”两组。通过优势比分析,发现自然杀伤(NK)细胞与“低DDR”组关联最强。    
 2 使用单细胞RNA测序(scRNA-seq)分析不同DDR水平下肝细胞癌(HCC)肿瘤微环境
3.免疫检查点阻断后高DDR介导免疫抑制特点分析
作者利用“TransferData”算法,成功地从单细胞分析数据中推断出细胞类型并进行了注释。发现“低DDR”组中脂肪酸代谢途径、WNT途径和可能的致癌MYC途径被激活,为HCC治疗提供了新的视角。
 3 免疫治疗阻断介导的DDR免疫微环境特征
4.DDR共识特征预测HCC预后和免疫治疗反应性
作者利用留一法交叉验证(LOOCV)框架,结合101种机器学习算法,开发了DDR评分模型。通过计算每个模型的C指数,筛选出最佳的预测模型(Lasso + 随机生存森林,RSF)。应用此模型,研究发现“高DDR”患者的总体生存率(OS)显著低于“低DDR”组。
4使用批量测序数据和机器学习方法的组合开发并验证了共识DDRscore
文章小结
总之,本文算是“机器学习”在临床中的经典应用,进行诊断、预后模型的构建。基于101种机器学习算法组合、单基因数据和DDRscore系统开发等创新点,成功实现0实验纯分析斩获1区9分+期刊,实属人生赢家。相信这也是我们苦苦追寻的那种“纯生信”研究。101种机器学习算法组合是真的豪横,0实验纯生信就是要这么做,小伙伴们好好学学吧!想趁着诺奖这波东风,在机器学习上吃一波红利,就得赶紧动手了!如果想复现本文思路,抓紧联系生信塔哦。

小塔有话说


生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call小塔,我们团队竭诚为您的科研助力!


文献思路复现

定制生信分析

服务器租赁


 往期 · 推荐 

中医药又一利好消息!7分+毕业神刊助力,中医药SCI将迎来大爆发!网药+分子对接+实验验证,思路简单易复现,冲就完了~

生信的尽头是“机器学习”? 联合双硫死亡+lnRNA,这个思路爽翻了,这届年轻人有自己的科研密码!现成基因集,复现即躺赢!

这才是孟德尔随机化升级思路的正确打开方式!山东第一医科大学团队6分新作,机器学习+多组学分析,快来抄作业吧!

   

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/174980
 
9 次点击