社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

“泼天富贵”降临诺奖“机器学习”!复旦中山医院神操作,10种机器学习+101种算法组合+多组学,纯分析搞定1区top!

生信塔 • 3 月前 • 104 次点击  

实在是按捺不住,生信塔这两天集中发布的主要是“机器学习(ML)”,原因大概分2点:
1,受到空前的关注:人工智能(AI)本来就是自带B格的话题,机器学习更是其中的典型,在数据分析和决策制定中优势显著;这次AI获得物理和化学双诺奖,是表彰ML过去取得的成绩,也为其未来的发展和应用前景再次背书(这对我们做生信的人来讲,这绝对是重大利好,能显著的提高“AI”的影响力和认可度)。
2,在临床和基础医学都应用广泛:生信塔过去介绍的大部分文献思路,一般都只能针对部分粉丝群体,受众面都有限制。但是机器学习工具可谓老少咸宜,临床/基础都可用。无论是临床数据还是高通量测序数据,ML都有用武之地,而且已经演变为最佳工具之一。比如,在临床层面,除了“药物设计与筛选”和“药物副作用预测”等药物研发领域,“机器学习”应用最广的还是“疾病诊断和预测”,包括“辅助影像诊断”和“诊断/预后模型构建”等(ps:我们也不是完全为了追热点而选择“机器学习”,而是“机器学习”确实可以让临床预后模型不再是“盲盒”,而是变成了“精准预测的神器”)。
所以生信塔也趁热打铁,今日推出一篇机器学习领域的“黑科技”文章,由复旦中山医院团队在9.1分的Cancer Letters发表。该研究利用算法建立DNA损伤修复(DDR)指数,助力肝细胞癌的靶向治疗与预后分析,具有以下创新点:
1,10种机器学习方法的101种算法组合应用:本文可谓一桌“满汉全席”!将一般机器学习算法从3-5种直接升级到10种,并且,作者将RSF、LASSO等具备降维和变量筛选功能的算法与其他算法进行组合,最终足足做够了101种算法组合,大大提高了目的基因识别的准确度。(做到极致也是特色,而且不同算法在应用中,各具特色,小伙伴们也多加选择,或者参考本文,也来个“一锅炖”。文献中的10种算法共包括如下类型,小伙伴各取所需:RSF, Enet, Lasso, Ridge, Stepwise Cox, CoxBoost, plsRcox, SuperPC, GBM和survival-SVM等    
2,结合单细胞及多组学的公共数据,以DNA损伤修复(DDR)为研究角度,探索影响肝细胞癌(HCC)的肿瘤微环境。本文不仅方法全,而且数据足这擦出来的“火花”自然更加耀眼,还想纯分析拿下TOP期刊,本文思路不容忽视。
(PS:看到这,是不是非常期盼自己也能开发新的机器学习框架?有梦想就对了,多组学分析、机器学习都是生信塔的拿手绝活,想要复现本文思路,我们通通帮你全搞定,还不快来滴滴生信塔,有惊喜在等着你哦!)


定制生信分析

云服务器租赁

加微信备注99领取使用

l题目:通过深度转录组分析解码肝细胞癌的免疫调节和DNA损伤修复模式的治疗意义
l杂志:Cancer Letters
l影响因子:IF= 9.1
l发表时间:20242    
公众号回复“666领取原文PDF,文献编号:241014
研究背景
DNA损伤修复(DDR)在肝细胞癌(HCC)中扮演着关键角色,但其对患者的药物响应程度尚不清楚。作者利用多组学分析和机器学习算法,揭示了DDR与肿瘤微环境(TME)的相互作用。
数据来源 

 

研究思路
作者通过预处理单细胞RNA测序数据,开发了一种算法来评估恶性细胞的DNA损伤修复(DDR)状态,并用优势比(Odds Ratios, ORs)分析细胞类型分布。进一步,他们利用RNA测序和机器学习技术,创建了DDR评分系统(DDRscore),这有助于预测肝细胞癌(HCC)患者的总体生存率和对PD-1疗法的抵抗性。研究还探讨了DDR在HCC免疫调节中的作用,以及DDR评分在预测治疗反应和患者预后中的应用潜力。    
研究结果
1.肝癌恶性细胞的DDR异质性分析
作者运用bulk RNA-seq和scRNA-seq数据,结合101种机器学习算法,深入分析了肝细胞癌(HCC)的细胞群。鉴定了19个基因模块,筛选出3230个关键基因,其中56个参与DDR过程,为理解肿瘤进展提供了新视角。
1 恶性细胞中的DDR异质性
2.不同DDR条件下HCC中TME生态系统的不同概况
作者基于患者DDR状态将肿瘤微环境分为“高DDR”和“低DDR”两组。通过优势比分析,发现自然杀伤(NK)细胞与“低DDR”组关联最强。    
 2 使用单细胞RNA测序(scRNA-seq)分析不同DDR水平下肝细胞癌(HCC)肿瘤微环境
3.免疫检查点阻断后高DDR介导免疫抑制特点分析
作者利用“TransferData”算法,成功地从单细胞分析数据中推断出细胞类型并进行了注释。发现“低DDR”组中脂肪酸代谢途径、WNT途径和可能的致癌MYC途径被激活,为HCC治疗提供了新的视角。
 3 免疫治疗阻断介导的DDR免疫微环境特征
4.DDR共识特征预测HCC预后和免疫治疗反应性
作者利用留一法交叉验证(LOOCV)框架,结合101种机器学习算法,开发了DDR评分模型。通过计算每个模型的C指数,筛选出最佳的预测模型(Lasso + 随机生存森林,RSF)。应用此模型,研究发现“高DDR”患者的总体生存率(OS)显著低于“低DDR”组。
4使用批量测序数据和机器学习方法的组合开发并验证了共识DDRscore
文章小结
总之,本文算是“机器学习”在临床中的经典应用,进行诊断、预后模型的构建。基于101种机器学习算法组合、单基因数据和DDRscore系统开发等创新点,成功实现0实验纯分析斩获1区9分+期刊,实属人生赢家。相信这也是我们苦苦追寻的那种“纯生信”研究。101种机器学习算法组合是真的豪横,0实验纯生信就是要这么做,小伙伴们好好学学吧!想趁着诺奖这波东风,在机器学习上吃一波红利,就得赶紧动手了!如果想复现本文思路,抓紧联系生信塔哦。

小塔有话说


生信塔公众号持续为大家带来最新生信思路,更多创新性分析思路请点击往期推荐,快来查看吧!想复现这种思路或者定制更多创新性思路欢迎直接call小塔,我们团队竭诚为您的科研助力!


文献思路复现

定制生信分析

服务器租赁


 往期 · 推荐 

中医药又一利好消息!7分+毕业神刊助力,中医药SCI将迎来大爆发!网药+分子对接+实验验证,思路简单易复现,冲就完了~

生信的尽头是“机器学习”? 联合双硫死亡+lnRNA,这个思路爽翻了,这届年轻人有自己的科研密码!现成基因集,复现即躺赢!

这才是孟德尔随机化升级思路的正确打开方式!山东第一医科大学团队6分新作,机器学习+多组学分析,快来抄作业吧!

   

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/174980
 
104 次点击