Py学习  »  机器学习算法

4+甲基化+机器学习+孟德尔随机化,了解最新生信分析进展!创新性绝绝子!!没有思路的同学可参考!!!

生信分析手册 • 1 年前 • 347 次点击  

导语

今天给同学们分享一篇生信文章“Identification of m6A-Related Biomarkers in Systemic Lupus Erythematosus: A Bioinformation-Based Analysis”,这篇文章发表在J Inflamm Res.期刊上,影响因子为4.5



结果:

SLE患者与健康对照组之间的差异基因鉴定
在对四个微阵列(GSE50772、GSE61635、GSE72509和GSE81622)进行的回顾性分析中,共评估了289个SLE患者样本和93个HC样本。利用limma R软件包进行批次效应消除后,从元数据中确定了171个差异表达基因(DEGs):在SLE患者样本中,有86个基因明显上调,85个基因明显下调(图2A和B)。

功能富集分析
R中的clusterProfiler包被用于对171个鉴定的差异表达基因(DEGs)进行GO和KEGG分析。研究结果显示,这些差异表达基因主要参与了对病毒、囊泡腔和嗅觉受体活性的响应(图2C)。此外,KEGG分析揭示了几个显著的信号通路,包括嗅觉转导、冠状病毒疾病(COVID-19)和流感A(图2D)。
SLE中的m6A调控因子鉴定
鉴定出了17个m6A调控基因,包括6个写入因子、9个读取因子和2个擦除因子。这17个基因在SLE患者和健康对照组之间的表达水平差异得到展示(图3A)。其中12个基因表达偏差具有统计学显著性(p < 0.05)。具体来说,YTHDF3、IGFBP2和IGFBP3在SLE中上调,而METTL14、ZC3H13、RBM15B、YTHDF1、YTHDF2、HNRNPC、IGF2BP1、FTO和ALKBH5在SLE中下调。这12个关键基因的热图如图3B所示。

RF、SVM和Nomogram模型的构建
RF模型展示了令人称赞的性能,与支持向量机(SVM)模型相比,其残差值降低(图4A和B)。RF模型的卓越性能可以归因于其在处理变量之间复杂交互和非线性关联方面的熟练能力,以及通过对决策树结果进行平均来减轻过拟合和偏差的能力。因此,作者选择了RF模型进行后续分析(图4C)。根据重要性评分对显著的m6A调控基因进行排名后,发现所有基因的评分均超过5(图4G),使它们有资格被纳入诺莫图模型(图4H)中。在诺莫图中,每个基因都被单独评分,通过计算这些评分的总和来预测SLE发病率。校准曲线(图4D)显示实线和虚线之间存在紧密一致性,表明模型校准良好。此外,决策曲线分析(DCA)(图4E)显示红线(代表m6A基因)与基准灰线和黑线明显分离。这种分歧凸显了m6A基因在SLE预后评估中的潜在实用性。此外,临床影响曲线(图4F)进一步支持了这些基因的相关性,表明它们在SLE病理生理学的更广泛背景中的重要性。

鉴定和验证潜在生物标志物
LASSO被用于审查171个差异表达基因(DEGs),以寻找SLE的潜在生物标志物,发现了34个具有潜在诊断相关性的基因(图5A)。SVM-RFE算法也分析了这171个DEGs,并得出了39个基因(图5B-D)。此外,随机森林识别出了31个特征基因(图5E和F)。基于DEGs构建了WGCNA,共鉴定出19个模块,包含348个中心基因(图6A-C)。只有四个基因,EPSTI1、USP18、HP、MMP9在所有方法中都是共同的(图6D),表明它们在SLE诊断中的重要性。作者对这四个关键基因进行了ROC分析,结果显示EPSTI1(AUC=0.888)、USP18(AUC=0.870)、HP(AUC=0.817)、MMP9(AUC=0.753)(图6E)。


MMP9与SLE中的m6A修饰相关

EPSTI1、USP18、HP和MMP9的表达水平在SLE中均明显上调,与HCs相比(图7A和B)。MMP9 RNA的甲基化水平增加通过MeRIP qPCR得到确认,而其他的结果没有显著性(图7C)。


不同分子亚型的功能分析

GSVA富集分析发现,与MMP9分组相关的基因集主要涵盖免疫学重要性和代谢相关的途径(图9A)。此外,免疫功能分析箱线图显示,在各种免疫细胞类型或功能中,如激活的树突状细胞(aDCs),高和低基因表达组之间的得分差异显著(图9B)。


MMP9与缺血性中风有因果关系

缺血性中风是与SLE相关的重要并发症之一。7 8 最近对MMP9和缺血性中风的研究为MMP9与缺血性中风的各个方面,包括血脑屏障(BBB)功能障碍、认知障碍、治疗靶点和病理生理变化之间的复杂相互作用提供了宝贵的见解。9–11 MMP9和缺血性中风的SNP特征被认为是可靠的工具变量(附表S2)。图10A和CC说明了个体遗传变异对SLE的因果效应。利用IVW方法,作者发现MMP9与IS之间存在显著关联,其比值比(OR)为1.0134(95% CI = 1.0004–1.0266,p = 0.0440)。然而,MR-Egger方法并未显示出统计学上显著的效应(OR = 1.0173,95% CI = 0.9951–1.0400,p = 0.1314)(附表S3)。代表因果效应的漏斗图显示近似对称(图10B),而MR Egger回归的截距表明没有水平多向性(p = 0.6725),进一步证实了不存在偏倚的因果效应(附表S4)。异质性检验结果显示,MR Egger方法的Q统计量为72.8263,自由度为70(p = 0.3852),IVW方法的Q统计量为73.0138,自由度为71(p = 0.4117),表明因果效应中不存在显著的异质性(附表S5)。图10D展示了在排除每个SNP后对剩余SNP进行的系统MR分析。一致的结果表明,所有SNP的因果意义仍然存在,表明没有一个主导性的SNP影响MMP9水平和IS。这些发现验证了先前的MR结果。


总结

作者的研究确定了12个m6A调节因子,揭示了SLE风险基因的分子机制。重要的是,我们的分析建立了MMP9,一个关键的m6A相关基因,与缺血性中风的因果关系,这是SLE的常见并发症,从而为无症状诊断方法提供了关键的见解。


往期推荐

                                                                                                                      


纯生信选刊


• 纯生信文章的春天!

• 选刊正确=成功发表!


非肿瘤生信


• 6+非肿瘤代谢思路

• 非肿瘤联合铁死亡生信思路


预后模型


• 7+乳酸相关预后模型

• m7G甲基化+肿瘤生信思路


单基因生信


• 8+单基因干湿结合生信思路

• 单基因突变和淋巴结转移


单细胞系列


• 7+的脂肪细胞+单细胞测序

• 单细胞+Bulk seq生信思路




Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/171526