社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

衰老+机器学习与单细胞相关!!

生信分析手册 • 4 月前 • 206 次点击  

导语

今天给同学们分享一篇生信文章“ARDS and aging: TYMS emerges as a promising biomarker and therapeutic target”,这篇文章发表在Front Immunol期刊上,影响因子为5.7。


结果:


确定 ARGEG
研究程序图见 图 1。在对照组和 ARDS 气管吸出物之间共鉴定出 2448 个 DEGs,其中 1312 个基因上调,1136 个基因下调( 图 2A) 。通过ARGs和DEGs的交叉得到了134个ARDEGs( 图2B;补充表S1) 。使用 R 程序 limma,从训练集中提取 ARGs 的表达矩阵,并检查它们之间的差异。绘制的基因表达热图显示了差异最显著的前 50 个基因( 图 2C) 。通过 PPI 蛋白网络分析发现,ARDEGs 之间在蛋白质水平上存在密切联系( 图 2D;补充表 S2) 。


ARDEG 的功能富集分析
为了了解ARDEGs在ARDS和衰老中的潜在机制,作者使用R软件包clusterProfiler对ARDEGs进行了GO和KEGG富集研究( 补充表S3, 4) 。BP的GO富集分析表明,前五个 ARDEG 富集元素主要与蛋白质磷酸化、细胞对DNA损伤刺激的反应、细胞凋亡过程的负调控、肽基苏氨酸磷酸化和RNA聚合酶II启动子转录的正调控有关( 图3A) 。图 3B 和 C 显示了 MF 和 CC 中前 20 个富集元素 。此外,这些 ARDEGs 在细胞衰老、细胞周期、FoxO 信号通路、长寿调节通路和自噬中也有相当程度的富集( 图 3D) 。

构建加权基因共表达网络
利用 R 软件包 WGCNA 构建共表达网络,将最初 75% 基因的基因表达差异作为筛选标准。该网络共包含 13906 个基因。确定软阈值功率为 12 时,无标度指数为 0.85,同时平均连通性明显良好,从而建立了无标度网络( 图 4A、B) 。随后,进行聚类分析以确定高度相似的模块,从而显示聚类树枝图( 图 4C) 。计算了这些模块之间的相关性( 图 4D) 。结果显示,MEmagenta 模块与 ARDS(cor=0.34;p=0.01)以及衰老(co=-0.34;p=0.01)之间存在显著相关性( 图 4E ;补充表 S5 )。此外,还观察到品红色模块中 ARDS 的 MM 与 GS 之间存在明显的相关性(cor=0.3;p=3.8e-14),衰老也是如此(co=0.39;p=1.4e-23)( 图 4F、G )。选择品红色模块中的基因作为候选基因,并与 ARDEGs 进行比较,结果发现 14 个基因既在品红色模块中,又与 ARDS 和衰老相关( 图 4H) 。

ARDS-ARDEGs 的相关性和富集分析
作者使用皮尔逊相关系数来评估 ARDS-ARDEG 之间的关系。PSMA2 与 TTBPL1 呈高度相关(cor=0.84)( 图 5A) 。KEGG通路富集分析表明,与ARDS-ARDEG相关的前十条富集通路主要涉及脊髓小脑共济失调、蛋白酶体、麻疹、丙型肝炎、坏死、甲型流感和NOD样受体信号通路( 图5B;补充表S6) 。根据GO富集分析,ARDS-ARDEGs在BP中富集,包括造血干细胞分化的调控、脱氧核糖磷酸的生物合成过程、有丝分裂细胞周期G2/M转换的负调控、先天性免疫反应的调控和脱氧核苷酸的生物合成过程( 图5C、D;补充表S7) 。随后绘制了 BP 之间的相互作用图( 图 5E) 。

通过机器学习识别中枢 ARDS-ARDEGs
为了在患有 ARDS 的老年人群中识别特征基因,作者使用了三种机器学习算法来筛选中枢 ARDS-ARDEG:LASSO( 图 6A、B) 、RF( 图 6C、D) 和 XGBoost( 图 6E) 。综合三种算法的结果,作者最终确定了四个中心基因:CKAP2、P2RY14、RBP2 和 TYMS( 图 6F;补充表 S8) 。

枢纽 ARDS-ARDEG 的诊断功效
ROC 分析显示,ARDS-ARDEG 这四个中心基因在训练集中具有很高的诊断价值。这些特征基因的 ROC 曲线下面积(AUC)如下:CKAP2为0.902,P2RY14为0.843,RBP2为0.770,TYMS为0.834( 图7A-D) 。此外,筛选出的特征基因在 ARDS 患者中的表达水平高于健康对照组,表明这些基因在 ARDS 的发病机制中可能发挥作用( 图 7E-H) 。随后,进行了患者年龄与枢纽 ARDS-ARDEGs 表达之间的相关性分析( 图 7I-L) 。随着患者年龄的增加,这些基因的表达量减少,其中 TYMS 与衰老过程的相关性最强。

此外,还在外部验证队列中评估了各特征基因预测 ARDS 的诊断效果。通过GSE84439,CKAP2、P2RY14、RBP2 和 TYMS 的 ROC AUC 值分别为 0.411、0.321、0.607 和 0.821( 图 8A-D) 。与脓毒症患者相比,在 ARDS 患者的这些特征基因中,只有 TYMS 的表达发生了显著变化,显示出明显的上调( 图 8E-H) 。这些观察结果表明,不管是用于区分老年 ARDS 患者还是用于区分败血症患者,TYMS 对 ARDS 都具有更高的诊断效率。

衰老抑制 ARDS 模型后小鼠的 TYMS 诱导
通过给老年(18 个月)和幼年(3 个月)小鼠注射 LPS,建立了 ARDS 小鼠模型。尽管老年小鼠的 LPS 剂量(2.5 毫克/千克)低于年轻成年小鼠(5 毫克/千克),但老年小鼠表现出更严重的肺损伤( 图 9A、B )。给予 LPS 72 小时后,老年小鼠出现肺水肿,而年轻成年小鼠则没有这种症状( 图 9C) 。为了确认中枢 ARDS-ARDEGs 的 mRNA 表达水平,对从肺组织中提取的总 mRNA 进行了 qRT-PCR 检测( 图 9D-G) 。ARDS 建模后,特征基因 CKAP2、P2RY14、RBP2 和 TYMS 的表达发生了显著变化。值得注意的是,建模后,年轻小鼠和老龄小鼠的 TYMS 表达存在明显差异。研究结果表明,这四个特征基因在 ARDS 发生后被强烈激活,而在 ARDS 进展过程中,衰老抑制了 TYMS 的正常诱导表达。

TYMS 分组的差异分析和 GSEA 分析
根据 TYMS 的中位值和 "P1 "的显著阈值,GSE163426数据集中的 ARDS 患者气管抽吸样本被分为两组:高表达组和低表达组。结果,582 个基因出现上调,544 个基因出现下调( 图 10A) 。热图描述了前 30 个 DEGs( 图 10B) 。为了评估与 TYMS 相关的信号通路,进行了 GSEA 分析( 图 10C-H) 。结果表明,TYMS 与免疫系统过程调控、防御反应、α-β T 细胞活化负调控、血管形态发生、细胞群增殖调控和炎症反应负调控之间存在显着相关性。


免疫细胞浸润的评估和分析
采用单样本基因组富集分析(ssGSEA)算法对免疫细胞浸润进行分析,旨在发现免疫学特征( 补充表S10) 。与健康对照组相比,ARDS 样本中活化 CD4 T 细胞、活化 CD8 T 细胞和效应记忆 CD4 T 细胞的浸润水平显著增加。相反,ARDS 样本中CD56dim自然杀伤细胞和自然杀伤细胞的浸润水平明显降低( 图 11A) 。随后进行了相关性分析,将中枢基因的表达与 ARDS 患者的免疫细胞浸润联系起来( 图 11B) 。值得注意的是,TYMS 的表达与各种免疫细胞的浸润之间存在很强的相关性。随后的分析根据 TYMS 表达水平对个体进行分组,以探讨 TYMS 与免疫细胞比例之间的关系( 图 11C) 。分析结果显示,在 TYMS 高表达组中,活化 B 细胞、记忆 B 细胞和 2 型 T 辅助细胞的比例明显增加。

相反,CD56dim自然杀伤细胞、中心记忆 CD4 T 细胞和未成熟树突状细胞的比例明显下降。图 11D-I展示了 TYMS 与免疫细胞之间的六种相关性。这些研究结果表明,TYMS 与调节免疫反应之间存在关联,从而增强了抵抗病原微生物的能力,并抑制了过度的炎症反应。

以单细胞分辨率区分 TYMS 的细胞来源
为了研究 TYMS 的细胞来源,作者获取了 snRNA-Seq 数据,其中包括来自尸检肺组织的约 116,000 个细胞核数据,这些细胞核取自 COVID-19 的 19 名死亡患者和GSE171524 的 7 名对照组患者的肺部。根据这 19 名患者的临床信息,可以看出他们的年龄都在 55 岁以上,并伴有呼吸道症状。无监督分析确定了 19 个不同的细胞簇( 图 12A) 。根据既定标记物的表达水平,这些细胞群被认定为不同的细胞类型:肺泡 I 型(AT1)细胞、肺泡 II 型(AT2)细胞、气道上皮细胞、B 细胞、CD4+ T 细胞、CD8+ T 细胞、循环 NK/T 细胞、树突状细胞、内皮细胞、成纤维细胞、巨噬细胞、肥大细胞、单核细胞、NK 细胞、神经细胞、其他上皮细胞、浆细胞、平滑肌细胞和 Tregs。肺泡上皮和内皮屏障的破坏是由于 AT1 细胞、AT2 细胞和内皮细胞的丧失以及单核/巨噬细胞、成纤维细胞和神经细胞的增殖( 图 12B) 。研究发现,内皮细胞表现出较高的 TYMS 表达( 图 12C) 。与对照组相比,呼吸道症状患者的内皮细胞中 TYMS 表达明显上调( 图 12D) 。上述研究结果表明,TYMS 主要在内皮细胞中表达,适度诱导可能有助于内皮再生和维持内皮屏障的完整性,从而减少炎症细胞的浸润,抑制 ARDS 的进展。
研究内皮细胞与其他类型细胞之间的交流
为了评估细胞间的通讯,需要检测配体及其匹配受体的表达水平。上述结果表明,TYMS 主要在内皮细胞中表达,并与免疫细胞浸润有关。为了进一步研究细胞间的通讯,作者使用了 "CellChat "软件包进行综合分析。作者生成了环形图,以直观显示所有细胞类型中参与细胞间通讯的分泌信号( 图 13A、B) 。分析表明,内皮细胞通过 VISFATIN 信号通路与气道上皮细胞进行交流( 图 13C) 。此外,内皮细胞主要接收来自 AT1 细胞、成纤维细胞、平滑肌细胞、神经细胞、成纤维细胞和巨噬细胞的信号( 图 13D) 。

此外,作者还进行了配体-受体配对分析,确定了特定的信号相互作用。研究发现,内皮细胞优先通过 NAMPT - INSR 途径发送信号,同时通过 VEGFA - VEGFR1、IGF1 - IGF1R、ANGPT1 - TEK、SEMA3A - (NRP1+PLXNA2)、SEMA3C - (NRP1+PLXNA2) 和 SEMA3D - (NRP1+PLXNA2) 途径接收信号( 图 13E、F )。内皮细胞与其他细胞之间的细胞间通讯主要由 SEMA3 信号通路介导,内皮细胞是该通路的主要接收细胞( 图 13G) 。SEMA3 信号通路对血管系统有重大影响,有助于血管的发育和再生。总之,这些发现为内皮细胞与各种细胞类型之间的细胞间对话提供了宝贵的视角,揭示了这一错综复杂的过程中所涉及的不同信号通路和分子。

总结

ARDEGs 参与细胞对 DNA 损伤刺激、炎症反应和细胞衰老途径的反应。MEmagenta 模块与老年 ARDS 患者有显著相关性。研究人员采用 LASSO、RRF 和 XGBoost 算法筛选特征基因,包括 CKAP2、P2RY14、RBP2 和 TYMS。进一步的验证强调了 TYMS 在 ARDS 发病和进展中的潜在作用。免疫细胞浸润显示了不同的比例以及与 TYMS 表达的相关性。SnRNA-Seq和细胞-细胞通讯分析表明,TYMS在内皮细胞中高表达,而SEMA3信号通路主要介导内皮细胞与其他细胞之间的细胞通讯。


往期推荐

                                                                                                                      


纯生信选刊


• 纯生信文章的春天!

• 选刊正确=成功发表!


非肿瘤生信


• 6+非肿瘤代谢思路

• 非肿瘤联合铁死亡生信思路


预后模型


• 7+乳酸相关预后模型

• m7G甲基化+肿瘤生信思路


单基因生信


• 8+单基因干湿结合生信思路

• 单基因突变和淋巴结转移


单细胞系列


• 7+的脂肪细胞+单细胞测序

• 单细胞+Bulk seq生信思路

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176267
 
206 次点击