Py学习  »  机器学习算法

4+共病+铁死亡+机器学习+实验,干湿结合加热点,真是玩明白了!

生信分析手册 • 4 月前 • 104 次点击  

导语

今天给同学们分享一篇生信文章“Unveiling the Molecular Links Between Atrial Fibrillation and Atherosclerosis: Insights into Shared Pathogenesis and Ferroptosis Diagnostic Biomarkers”,这篇文章发表在J Inflamm Res期刊上,影响因子为4.2。


结果:


AF和AS差异表达基因的鉴定
GSE 41177数据集包括32对AF患者和6对窦性心律患者。GSE 28829数据集包括13个早期AS斑块样本和16个晚期动脉粥样硬化斑块样本。GEO的表达式文件使用|log 2光纤通道|> 0.585,校正p值< 0.05,批次校正。前者共检测了1627个DEG,其中上调基因780个,下调基因847个;后者共筛选了571个DEG,其中上调基因161个,下调基因410个。热图显示了50个最显著上调和下调的基因,然后将差异表达的基因作为交集并表示为维恩图(图1A和B),其中104个是共上调基因,24个是共下调基因。这些可视化是使用热图和火山图完成的。

AF和AS中FDG的识别
分别从GSE 41177和GSE 28829数据集中鉴定的172和109个FDG与正常样品相比差异表达。标记的热图显示了样品中FDG的表达模式。随后取这两组FDG的交集,获得47个共同基因。这些基因之间的相关性如图2A和B所示。

DEG的功能富集分析
为了研究所涉及的生物过程和途径,94个经常发生的DEG提交GO和KEGG途径富集分析。根据GO分析的结果,这些基因主要富集在白细胞介导的免疫、白细胞运动、吞噬作用、抗原加工、肽抗原的MHC II类呈递和细胞因子产生的阳性对照中(图1C-E),所有p<0.05。就KEGG途径而言,金黄色葡萄球菌感染、吞噬体和结核病是三种高度富集的途径(图1F和G),所有p均0.05。这些发现意味着这两种疾病的出现和进展同时受到白细胞介导的免疫和对外部刺激反应的阳性控制的影响(图1 E)。

FDG的功能富集分析
进行GO富集和KEGG途径分析以阐明与FDG相关的生物过程和途径。因此,GO富集研究揭示了“细胞对化学和氧化应激的反应”的功能基本上与AF和AS的FDG相关(图3A-F)。脂质和动脉粥样硬化、自噬和FoxO信号传导途径显示在KEGG途径研究中是丰富的(图3G-J)。这些数据表明,FDG可能参与了自噬和氧化应激的控制,这可能有助于其在AF和AS发病机制中的潜在作用。

DEGs PPI网络的构建及Hub基因的筛选
使用Cytoscape,为复合得分高于0.7的频繁DEG创建具有80个节点和248个交互配对的PPI网络(图4A)。通过利用Cytoscape插件的cytoHubba功能并使用程度作为评分类型来确定前15个枢纽基因,包括LY 86、ITGAM、CSF 1 R、TYROBP、FCER 1G、TLR 2、HLA-HLA、ITGB 2、CD 14、林恩、C1 QB、CD 86、LILRB 2、HCK和VAV 1(图4 B)。在GeneMANIA数据库的帮助下,作者研究了这些基因的共表达网络和相关功能。共表达率为69.88%,物理相互作用率为20.59%,途径表达率为3.98%,共定位率为3.12%,预测表达率为2.44%。(图4C)。Cytoscape的MCODE组件用于衍生四个密切相关的基因模块,包括31个共享的DEG和63个相互作用配对(图4D-G)。

Hub基因的功能分析
作者进行了GO和KEGG途径富集分析,以检查枢纽基因的生物学途径和功能。根据GO分析的结果,这些基因主要涉及吞噬作用、对细菌来源的化合物和脂多糖的细胞反应、免疫效应机制的有效控制、对生物刺激的细胞应答、白细胞活化的正调节、白细胞介导的免疫和对外部刺激的应答的正调节(图5A-C)。结果表明,白细胞免疫反应和细胞免疫效应对这两种疾病都有影响。根据KEGG途径分析,它们涉及金黄色葡萄球菌感染、造血细胞谱系、吞噬体、百日咳、利什曼病、结核病和军团菌病(图5D-F)。GO和KEGG富集数据显示枢纽基因与免疫系统之间存在显着相关性。

Hub基因的验证
以验证这些枢纽基因的可靠表达水平。作者选择了另外两个具有动脉粥样硬化斑块和AF的数据集,并检查了这些中心基因在这些数据集中的表达量。根据研究结果,与正常组织相比,AF中仅CSF 1 R和ITGAM基因下调(图6A)。与健康血管组织相比,动脉粥样硬化斑块具有更高的基因CSF1R、ITGAM、TLR2、FCER1、TYROBP和LY86的表达水平(图6B)。

TF的预测和验证
使用TRRUST数据库发现了可以调节这些基因表达的七种转录因子(TF)(图7A)。作者发现转录因子HIF1A、SPI1和TRERF1在AF中基本上表达(图7B)以提供额外的支持。虽然动脉粥样硬化斑块中转录因子TRERF 1减少,但转录因子RELA和SPI 1上调(图7 C)。

2个FDG被鉴定为AS和AF的共诊断基因
考虑到AF和AS患者与健康个体之间的差异,作者旨在评估FDG的诊断潜力(图2A和B)。接下来,作者在GSE 41177和GSE 28829数据集中使用了两种不同的机器学习算法LASSO和SVM-RFE,以筛选可以区分AF,AS和正常个体的重要FDG。作者使用LASSO逻辑回归算法筛选与AF相关的11个特征,通过10倍交叉验证调整惩罚参数。作者使用LASSO逻辑回归算法过滤出与AF相关的11个特征(图2C和D)和与AS相关的14个特征(图2 E和F)。然后,作者使用SVM-RFE算法筛选AF和AS的FDG,以确定最佳的特征基因组合。最后,四个基因(最大准确度= 1,最小RMSE = 0)被鉴定为AF的最佳特征基因(图2G和H),并且AS的最佳特征基因也是四个(图2 I和J)(最大准确度= 0.9,最小RMSE = 0.1)。从AF的LASSO模型和SVM-RFE模型获得的标志物基因的交叉鉴定了2个标志物基因(N 0X 5、ADAMTS 13)用于随后的分析(图8A),并且使用相同的方法,在AS的模型交叉中鉴定了4个基因(CTSB、CP、NUPR 1、PARP 12)。遗憾的是,作者在几个特征基因中没有发现AF与AS的交叉,但作者用这些特征基因与之前的47个FDG交叉,获得了两个铁中毒相关基因CTSB和NUPR 1,并且与AF、AS均相关。基于上述四个标志物基因,作者使用R包glm建立了逻辑回归模型,随后的ROC曲线显示基于四个标志物基因的逻辑回归模型可以区分正常样品和AF样品,AUC至少为0.781(图8B)。此外,生成标记基因的ROC曲线以阐明单个基因区分AF和正常样品的能力。如图8C所示,所有基因的AUC为1。同时,正常和AS样品的AUC对于前者至少为0.846(图8D),对于后者至少为1(图8E)。上述证据表明,logistic回归模型在区分AF、AS和正常样本方面比单个标记基因更准确和特异。

CTSB和NUPR 1与AF、AS相关通路密切相关
为了进一步探索标记基因在区分疾病样品和正常样品中的潜在功能,作者进行了单基因GSEA-KEGG通路分析。图9中显示了针对每个标志物基因富集的前6条途径。综合分析后,作者发现,在AF中,这些CTSB在“自然杀伤细胞介导的细胞毒性”、“氮代谢”、“PPAR信号通路”、“淀粉和果糖代谢”、“类固醇激素生物合成”、“丙氨酸-亮氨酸和异亮氨酸降解”中富集;而在AS中,这些CTSB在“细胞因子信号通路”、“细胞因子-细胞因子受体相互作用”中富集,这与AF中NUPR 1富集具有相同的结果。

AF、AS患者免疫细胞浸润景观分析
早期的研究结果表明,AF,AS和免疫微环境是密不可分的。22-24早期的研究结果表明,AF、AS和免疫微环境是密不可分的。为了研究AF、AS患者和正常人之间免疫微环境的变化,作者开发了CIBERSORT技术。根据图10A和B,尽管T细胞滤泡辅助细胞MacrophageM 2在正常样品中比在AF样品中表达更多,AF样品具有更多数量的浆细胞、单核细胞和嗜中性粒细胞。B细胞记忆、巨噬细胞M0和巨噬细胞M2在AS样品中比在正常样品中更普遍,尽管T细胞调节性(TcR)、肥大细胞静息和巨噬细胞M0在正常样品中更普遍。与正常样本相比,AS、AF具有较高百分比的T细胞γ δ,但较少的树突状细胞被激活。此外,Pearson相关性分析显示,在AF中,静息和活化的肥大细胞与NUPR 1具有强的正相关和负相关性。CTSB与巨噬细胞MO正相关,而NUPR 1与AS中静息的NK细胞负相关(图10C和D)。提示NUPR 1可能与AF、AS患者免疫环境的改变有关。

NUPR 1在AF和AS模型中的表达
Western blotting检测AF和AS模型中NUPR 1的表达。结果显示,NUPR 1在正常模型中弱表达,而在AF和AS模型中强表达(图11 A-D)。


总结

在AF和AS中,分别识别出1627个和571个DEG,交叉的DEG有128个,还识别出47个常见的FDG。基因本体论(GO)和京都基因和基因组百科全书(KEGG)对DEG的分析表明,它们与白细胞免疫等生物学过程和途径相关,FDG也参与特定的功能和途径。鉴定出15个关键基因,验证了CSF1R和ITGAM的表达差异,预测了7个转录因子的差异表达。筛选特征基因构建诊断效果良好的模型,免疫浸润显示NUPR 1与免疫环境改变相关,WB显示NUPR 1在疾病模型中高表达。对这篇文章感兴趣的老师,欢迎扫码咨询!


往期推荐

                                                                                                                      


纯生信选刊


• 纯生信文章的春天!

• 选刊正确=成功发表!


非肿瘤生信


• 6+非肿瘤代谢思路

• 非肿瘤联合铁死亡生信思路


预后模型


• 7+乳酸相关预后模型

• m7G甲基化+肿瘤生信思路


单基因生信


• 8+单基因干湿结合生信思路

• 单基因突变和淋巴结转移


单细胞系列


• 7+的脂肪细胞+单细胞测序

• 单细胞+Bulk seq生信思路

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177069
 
104 次点击