社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

这本高质量生信友好期刊一般人我不告诉他!微生物组学+代谢组学+机器学习,4图轻松发Nature子刊!速速收藏!

生信图书馆 • 3 月前 • 131 次点击  

哈喽!朋友们!最近,馆长这真是风雨不断呀!幸好馆长没有什么出行计划。哈哈!毕竟馆长可是致力于给大家推送好文章,构思发文好思路的科研之友,只想在文献中遨游。这不,今天就给大家分享生信友好期刊(npj Precision Oncology)中关于结直肠癌的文章。下面,让馆长带大家一起学习一下这篇文章的研究思路和方法吧~
1.多组学分析:研究重点证明采用代谢组学微生物组学揭示早发型结直肠癌与一般性结直肠癌中不同的宿主-微生物组关联的可行性。结合微生物组学研究早发型结直肠癌的生物标志物是文章的一大亮点。
2.机器学习+网络分析:对微生物组学及非靶向代谢组学数据构建机器学习分类模型。然后,进行网络分析,揭示代谢物之间的关联。文章思路简单,生信分析是主体。想要发表高分SCI的小伙伴们也可以借鉴一下本文的研究思路哦~PS:馆长每天游走于生信江湖,手握机器学习、网络分析等最新资讯,需要生信分析和课题设计的朋友,欢迎扫码来聊,还有超多生信干货在等你哦!

定制生信分析

云服务器租赁

加好友备注“99”领取试用


题目:多组学机器学习研究早发型结直肠癌患者的宿主-微生物相互作用
杂志:npj Precision Oncology
影响因子:IF=6.8
发表时间:2024年7月
公众号回复“666”二字可以领取本文献,文献编号:240812
研究背景
近年来,早发型结直肠癌(eoCRC)的发病率有所上升,但其病因和发病机理尚不清晰。eoCRC困扰着美国少数种族和族裔,但一般在晚期才被发现。及时诊断和治疗将有利于年轻人保留生育能力,减少对工作的影响等。但是,用传统方法进行全民筛查不是解决eoCRC发病率上升的有效且经济的办法。因此,有必要更好地了解eoCRC的发病机制,并确定生物标志物,以进行风险适应性筛查,从而预防并进行癌症定向治疗。故本研究基于微生物组学和代谢组学开展机器学习以及网络分析,与一般性结直肠癌(aoCRC)作对比,挖掘与eoCRC相关的不同宿主-微生物组关联。    
数据来源
血浆样本于2004年1月至2021年3月从克利夫兰诊所的前瞻性结直肠和肝脏肿瘤生物样本库中获得。肝脏生物样本库作为非CRC对照血液样本的来源。样本在手术当天从个体获得,进行清点,并立即存储在−80°C。临床信息通过回顾电子病历获得。
研究思路
将I-IV期CRC(n=64)分为eoCRC(≤50岁,n=20)和aoCRC(≥60岁,n=44)。对肿瘤组织进行非靶向血浆代谢组学和16SrRNA扩增子测序(微生物组分析)。结合DIABLO(使用组学研究的潜在变量方法进行生物标志物发现的数据集成分析),使用成对的多组学(微生物组学和代谢组学)数据构建一个有监督的机器学习分类模型,并识别eoCRC特有的关联。同时,进行差异关联网络分析,评估代谢物的生物学相关性。
研究结果
1.基线特征
研究人群包括64例CRC患者(N=20eoCRC和N=44aoCRC)。基线特征的差异无统计学意义(p>0.05)。具体情况见表1。    
表1:分析所选择人群的基线特征-分类变量用n(%)描述、连续变量用中位数(四分位数范围-IQR)描述
2.多组学模型中代谢组学和微生物组学特征的判别聚类
在多组学降维图中观察到不同的聚类模式,如图1所示的。曲线下面积(AUC)图(附图1a,b)证实了代谢组学分类(AUC0.98)的性能优于微生物组分类(AUC0.61)。结合微生物组和代谢组数据得出的中间AUC为0.83。    
图1:DIABLO降维表明eoCRC与aoCRC中代谢组学和微生物组特征的判别聚类
3.参与eoCRC分子图谱的代谢组学和微生物组学特征
基于Block Rank算法的排序揭示了有助于建立模型的几种独特代谢物和微生物组特征(图2)。其包括代谢物(n=25,如甘油、假尿嘧啶核苷、单磷酸腺苷)和微生物类群(n=10,如梭杆菌属、瘤胃球菌UCG002、副沙门氏菌、厌氧支原体属)。    
图2:使用PLS-DA来区分癌症组
4.eoCRC的代谢组-微生物组相互作用
由循环相关技术分析结果可知eoCRC与aoCRC中代谢物和微生物之间的几个关键关联,见图3。aoCRC代谢物中甘油和假尿嘧啶核苷含量较高,而Parasutterella属和Ruminococcaceae UCG 002属微生物类群含量较低,呈负相关关系。这两种代谢物也与Acidaminococcus属微生物类群呈负相关。同时,这些微生物类群与赤藓糖醇、木糖醇、肌醇、尿酸和花生四烯酸呈负相关。在eoCRC中含量较高的Acidovorax与胆固醇和木糖醇呈正相关。另外,在block rank算法中发现了一些相关的代谢物,如单磷酸腺苷和羟基马尿酸,但与微生物组不相关,。    
图3:关键代谢物-微生物属关联的循环相关分析
5.与对照组比较
对照组仅采用血浆代谢组学检测。基于代谢组学的分类对非CRC对照组的AUC远低于0.78(在进行年轻与老年分类时),而对CRC患者的AUC为0.98。在评估代谢物与年龄的相关性时,没有发现显著的相关性(附图2)。
6.使用选定的代谢物和微生物组进行事后分析
使用选定的代谢物和微生物组进行Tukey’sHSD事后检验,以评估机器学习模型中相关的代谢物。结果显示与年龄相关的变异不显著(p=0.369)。
7.网络分析
在网络分析中,通过整合微生物分类学和代谢组学特征,来避免DIABLO模型的预选偏差,结果见图4。尿素循环的代谢物,包括尿素和尿酸,在两组中表现出不同的聚集模式和中心性。与aoCRC相比,尿素和鸟氨酸在eoCRC中的中心地位更高。与eoCRC相比,柠檬酸在aoCRC中表现出更大的中心地位,而其相关的代谢物谷氨酸在组间表现出不同的聚集模式。微生物Akkermansia在两组中的中心性不同,与aoCRC相比,eoCRC中与代谢物丝氨酸和谷氨酸的负关联更强。    
图4:eoCRC与aoCRC的代谢组学-微生物组相关性的网络分析
文章小结
基于机器学习,文章证明了多组学分析可用于研究eoCRC中的宿主-微生物组的相关性,并展示了代谢组学用于挖掘生物标记物的潜力。此外,基于网络分析,提出eoCRC中尿素循环的独特宿主-微生物组相关性可能为治疗干预提供机会。文章选择了结直肠癌这个热门方向,创新性结合微生物组学,借助机器学习和网络分析进行数据处理,4图轻松拿下6分+Nature子刊,效果非常棒!或许换个消化系统疾病,下个发高分文章的就是你!这简单可复现的思路,还在观望的盆友,留给你犹豫的时间可不多了哟!思路设计、文章复现、生信分析,馆长等你来call~ 

馆长有话说

馆长会持续为大家带来最新生信思路,也可以提供特色数据库构建、免费思路评估、付费生信分析和方案设计以及实验项目实施等服务,对数据库构建和生信分析感兴趣的朋友可以咨询馆长哦!

生信分析

方案设计

服务器租赁

孟德尔随机化

网络药理学

单细胞测序

临床公共数据库分析

往期推荐

1.IF=14.7!顶级“水刊”又见预后模型!西湖大学团队“蛋白组学+机器学习+免疫微环境”豪取顶刊!可复现性佳!一学一个不吱声!

2.Nature旗下,顶级豪门“水刊”,收纯生信,影响因子却遭腰斩!写好的文章再不投,影响因子回到解放前了!

3.中医药研究又有新思路!“网络荟萃分析”和“网络药理学”两大王炸强强联手,成都中医药大学团队斩获一区Top,怎么做?

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173135
 
131 次点击