社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

4+机器学习+单细胞+分子对接+实验,干湿结合好文可复现性极强!

生信分析手册 • 2 月前 • 163 次点击  

导语

今天给同学们分享一篇生信文章“Transcriptome Sequencing-Based Screening of Key Melatonin-Related Genes in Ischemic Stroke”,这篇文章发表在Int J Mol Sci期刊上,影响因子为4.9。


结果:


差异基因的鉴定
在这项研究中,两个微阵列数据集,GSE 16561和GSE 22255,合并和差异分析后,消除批量效应。通过选择p < 0.05和p < 0.05,在整合表达矩阵中鉴定了总共74个差异表达基因(DEG)。|log(FC)|> 0.5作为阈值。绘制这些差异基因的火山和热图(图1A-B),并用MT标记DEG用于分析,产生35个候选基因(图1C)。

标记基因的筛选
为了筛选中风签名基因,作者将先前获得的35个候选基因应用于三种常用的特征选择算法:SVM-RFE,RF和LASSO。通过使用LASSO回归分析筛选获得12个标签基因(图2A-B)。SVM鉴定了35个基因标记,准确度为0.864(图2C-D)。随后,使用随机森林方法通过重要性得分对35个候选基因进行排序,并筛选出28个特征基因(图2E)。最后,作者对三种方法的结果进行了交叉分析,获得了12个共同的关键特征基因(图2F)。

PPI网络和XGBoost模型的构建
将12个筛选的基因上传到STRING数据库,并构建它们之间的蛋白质-蛋白质相互作用(PPI)网络(图3A)。在网络分析后,作者发现其中8个基因位于网络的核心,具有更多的连接边缘,并且可能在中风发病机制中发挥关键的调节作用。因此,作者构建了一个用于中风预测的XGBoost机器学习模型。首先将数据集分为70%的训练集和30%的测试集。XGBoost模型的关键超参数,如学习率和树的最大深度,使用插入符号软件包(6.0-94)进行迭代调整。作者发现模型的AUC达到0.806(图3B)。这表明基于这八个中心基因的XGBoost模型具有较高的中风预测准确率。

富集分析
74个DEG的GO富集分析揭示了350个生物过程(BP)、2个细胞组分(CC)和25个分子功能(MF)。列出了前10个GO项目(图4A-B)。根据KEGG分析,DEG在IL-17信号传导途径、TNF信号传导途径、流体剪切应力和动脉粥样硬化中显著富集(图4C-D)。此外,使用DO富集分析,作者鉴定了总共399个与DEG相关的疾病条目(图4E-F)。其中,4个DEG在脑血管疾病类别中显着富集(图4G),表明它们可能是中风的枢纽基因。

关键基因的表达水平及其诊断意义
作者评估了4个关键枢纽基因(ADM、PTGS 2、VCAN和MMP 9)在卒中诊断中的潜在价值。在组合数据集中,获得了这些基因的以下AUC值:ADM,0.777;MMP 9,0.749;PTGS 2,0.703;和VCAN,0.724((图5A-D)。在独立验证集中,其AUC进一步改善如下:ADM,0.734;MMP 9,0.820;PTGS 2,0.877;和VCAN,0.941(图5E-H)。这些结果表明,这些枢纽基因对脑卒中具有良好的诊断能力。同时,箱形图分析显示,这四个枢纽基因的表达水平在中风样品中显著高于正常对照组(图5I-L)。这进一步证实了它们在脑卒中发病机制中的重要调节作用。

miRNA-TF-mRNA分析
为了了解基因调控的整体框架和调控关系,作者使用NetworkAnalyst数据库预测了这些枢纽基因的潜在调控miRNA和转录因子。发现miR-144可能同时调节ADM、PTGS 2和VCAN,而转录因子FOS可能与ADM、PTGS 2和MMP 9相互作用(图6)。这为进一步阐明基因调控网络提供了基础。

Hub基因富集
使用单基因GSEA分析,作者发现这些枢纽基因富集的途径主要涉及免疫相关过程,如同种异体移植物排斥、自身免疫性疾病和移植物抗宿主病(图7A-D)。这进一步支持了它们在中风发病机制中的关键作用。

Hub基因与免疫浸润细胞的相关性
作者使用CIBERSORT算法分析了中风(IS)组和正常对照组中的免疫细胞浸润(图8A-B)。结果显示,与正常组相比,IS组中M0巨噬细胞、活化的肥大细胞和中性粒细胞的丰度显著增加,而CD 8 + T细胞和静息树突状细胞的丰度显著降低。这表明炎性免疫细胞在中风的发病机制中起关键作用。进一步的研究显示,这四种中枢基因(ADM、PTGS 2、VCAN和MMP 9)的表达水平与大多数免疫细胞的丰度显著正相关或负相关(图8C-F)。作者认为这些关键基因可能参与调节免疫细胞的浸润和功能,从而影响脑卒中的发生发展。

IS中的scRNA分析
为了研究这四个关键基因在中风样本中不同细胞类型中的分布,作者对作者获得的单细胞样本进行了分类和细胞注释。作者在GSE 174574数据集中鉴定了具有9种不同细胞类型的21个亚型:少突胶质细胞、单核细胞、小胶质细胞、巨噬细胞、上皮细胞、内皮细胞、树突细胞、心肌细胞和星形胶质细胞(图9A-B)。值得注意的是,作者在GSE 174574中风样本中观察到枢纽基因在小胶质细胞、巨噬细胞和树突状细胞中的主要分布(图9C-D)。

接下来,作者使用CellChat分析了中风环境中不同类型免疫细胞之间的细胞间通讯(图10A-B)。MK通路的激活诱导抗氧化基因(如NRF2靶基因)的表达,从而增加细胞的抗氧化能力[23]。因此,作者检查了中风样品中免疫细胞中MK途径的通讯网络(图10C-D)。通过分析MK通路改变的通讯网络,作者可以更好地理解中风引起的氧化应激和免疫系统的反应过程。这可能有助于进一步阐明脑卒中的发病机制,并为开发靶向抗氧化治疗策略提供策略。

IS治疗的药物预测
总之,本研究通过将差异表达基因提交至连接图(CMAP)数据库(所有连接性评分> 0.7)成功预测了潜在的治疗性小分子化合物(图11),作者选择了阳性和阴性评分最大的两种药物,分别为TAK-715和prostratin。TAK-715是一种有效的p38 MAPK抑制剂,prostratin是一种天然二萜类化合物,是一种PKC激活剂。

四个核心基因的分子对接
分子对接分析显示,4个中心基因与prostratin和TAK-715均形成良好的结合构象(图12A-D),表明它们可能是这两种化合物的潜在靶点。结合能与结合构象稳定性之间的负相关性为评价这些小分子与其靶之间的相互作用提供了基础。这为进一步的药物开发和作用机制研究提供了重要的理论依据。

关键基因验证
首先,作者成功地建立了大鼠MACO(middle arterial permanent occlusion)缺血性中风模型。TTC(氯化2,3,5-三苯基四唑)染色显示,MACO模型组中的脑梗死面积显著大于对照组中的脑梗死面积(图13A)。为了进一步研究该模型中关键基因表达的变化,作者收集了MACO组和对照组大鼠的外周血,并提取RNA用于qPCR分析。结果显示,与对照组相比,MACO中四种基因ADM、PTGS 2、MMP 9和VCAN显著上调(图13B)。这些基因的表达变化为进一步探索缺血性脑卒中的发病机制和治疗靶点提供了重要线索,并为后续的转化医学研究奠定了基础。

总结

在这项研究中,一个系统的生物信息学方法被用来成功地确定四个关键褪黑激素基因在IS患者:ADM,MMP 9,VCAN,和PTGS 2。qPCR实验证实,这些关键基因在IS患者中的表达存在明显的异常调节,表明它们在IS的病理生理机制中发挥重要作用。这一发现提供了一个更好地了解褪黑激素在IS中的作用的分子机制,并为开发新的治疗策略和具有重要临床转化价值的个体化医疗方案奠定了基础。对这篇文章感兴趣的老师,欢迎扫码咨询!


往期推荐

                                                                                                                      


纯生信选刊


• 纯生信文章的春天!

• 选刊正确=成功发表!


非肿瘤生信


• 6+非肿瘤代谢思路

• 非肿瘤联合铁死亡生信思路


预后模型


• 7+乳酸相关预后模型

• m7G甲基化+肿瘤生信思路


单基因生信


• 8+单基因干湿结合生信思路

• 单基因突变和淋巴结转移


单细胞系列


• 7+的脂肪细胞+单细胞测序

• 单细胞+Bulk seq生信思路

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/176596
 
163 次点击