社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

​谁敢横刀立马,唯我公开数据集!内质网应激+单细胞+机器学习,干湿结合完美思路,发文如德芙般纵享丝滑!

生信图书馆 • 7 月前 • 157 次点击  

馆长听到了小伙伴们的呼唤快快的出现在你滴眼前!最近闲来无事想给小伙伴们找点新鲜玩意分享一下嘞,逛着逛着发现了一篇刚刚发表于Journal of Translational Medicine没几日的文章,相比于该期刊其它文献接受过程较缓慢,因此肯定本文在各方面应该是比较完美的状态啦!馆长细细看了一下,干湿结合,思路完整,迫不及待地要跟大家分享,且看馆长带你慢慢学习!

本文整合GEO数据集(GSE25097、GSE62232、GSE65372)来识别与HCC相关的差异表达基因(ERSRG),应用随机森林(RF)和支持向量机(SVM)机器学习技术筛选与内质网应激相关的ERSRG,并构建人工神经网络(ANN)诊断预测模型。还使用ESTIMATE算法分析ERSRG与免疫微环境之间的相关性,利用药物特征数据库(DSigDB)对ERSRG的潜在治疗药物进行研究。通过单细胞测序评估了ERSRGs中心基因PPP1R16A的免疫学景观,最后进行细胞学实验验证了其生物学功能,思路清晰完整,简直是个发文模板!PS:你是否担心纯生信不好发文呢?那不如尝试一下干湿结合的思路,数据分析固然重要,验证实验更是锦上添花!想要复现完整的干湿结合思路就快点来找馆长吧!提供各种专属服务包您安心!

定制生信分析

云服务器租赁

加好友备注“99”领取试用


   
题目:内质网应激通过调节免疫促进肝癌:一项基于人工神经网络和单细胞测序的研究
杂志:Journal of Translational Medicine
影响因子:IF=6.1
发表时间:2024年7月
公众号回复“666”即可领取原文献,文献编号240804
研究背景
肝细胞癌(HCC)具有发病机制复杂、治疗方法有限、预后差等特点。内质网应激(ERS)在HCC的发生发展中发挥着重要作用,因此需要进一步研究HCC和ERS的分子机制,以实现早期诊断和有希望的治疗目标。
数据来源
数据集
数据库
数据类型
详细信息
GSE25097
GEO
Rna-seq数据
249个正常组织和268个肿瘤组织
GSE62232
GEO
Rna-seq数据
10个正常组织和81个肿瘤组织
GSE65372
GEO
Rna-seq数据
15个正常组织和39个肿瘤组织
研究思路
首先整合GEO数据集(GSE25097、GSE62232和GSE65372)来识别与HCC相关的差异表达基因(ERSRG),应用随机森林(RF)和支持向量机(SVM)机器学习技术筛选与内质网应激相关的ERSRG,并构建人工神经网络(ANN)诊断预测模型。随后使用ESTIMATE算法分析ERSRGs与免疫微环境之间的相关性,利用药物特征数据库(DSigDB)探索了ERSRG的潜在治疗药物。最后通过单细胞测序和细胞通讯评估了ERSRGs中心基因PPP1R16A的免疫学景观,并通过细胞学实验验证了其生物学功能。    
图1 研究总体流程
研究结果
1.肝细胞癌与正常组织之间差异表达基因鉴定
本研究在非批量删除和批量删除条件下对数据集GSE25097、GSE62232和GSE65372的基因进行主成分分析(图2A、B),结果表明成功消除了批次效应。图2C中的火山图显示HCC与正常组织之间存在763个DEG,其中215个基因上调,548个基因下调。图2D中的热图显示HCC和正常组织之间DEG的表达水平。    
图2 肝细胞癌与正常组织差异表达基因分析
2.ERS相关DEG鉴定
图3A通过312个ERSRGs和763个DEG交集得到11个ERS相关DEG,使用RF分析进一步筛选了11个ERSRG。图3B残差图可以看出,当分支数为125时,残差最小。在RF树中对11个ERSRG进行评分,最终根据基尼系数降序选择得分>20的7个ERSRG(图3C)。如图3D所示,当11个ERSRG中有6个被保留时,均方根误差最小。通过RF分析中的7个ERSRG和SVM分析中的6个ERSRG的交集,得到SRPX、THBS4、CTH、PPP1R16A等,最终确定THBS1用于构建下图的人工神经网络(图3E)。
图3 ERS相关差异表达基因鉴定
3.肝细胞癌神经网络预测模型的构建与验证
建立神经网络,6个神经元(SRPX、THBS4、CTH、PPP1R16A、CLGN、THBS1)作为输入层,2个神经元(HCC和正常组织)作为输出层(图4A)。当隐藏层包含5个神经元时,模型的预测性能在训练组中最高,AUC值为0.979(图4B)。在其他3个验证组中也对该人工神经网络预测模型的效率进行了评估。在GSE121248、GSE45267和GSE84005中,ANN模型的AUC值分别为0.958、0.936和0.970(图5C-E)。总之,该模型在预测HCC方面是一个潜在有力工具。    
图4 肝癌人工神经网络预测模型的构建与验证
4.内质网应激核心基因对免疫浸润的影响值得关注
对6种ERSRGs在HCC和正常组织中的表达情况进一步研究,与正常组织相比,HCC组织中CLGN、PPP1R16A和THBS4的表达水平显著升高(图5A),近一步分析相互作用确定是共现还是互斥关系(图5B)。为探索ERSRGs促进HCC发生的潜在机制,分析了6种ERSRGs表达水平与免疫细胞浸润和免疫相关通路的关系(图5C),THBS1和SRPX与大多数免疫细胞和免疫相关通路呈显著正相关。最后使用ggcor和ggpplot2分析核心基因与两种免疫活性分子之间的表达相关性(图5D)。    
图5 6种ERSRGs的表达及免疫浸润分析
5.6种ersrgs相关的生存、突变和甲基化分析
Kaplan-Meier显示,CLGN和PPP1R16A两种基因低表达的HCC患者的总生存期明显长于高表达的HCC患者(图6A、C)。然而,SRPX、THBS1、THBS4高表达与低表达对HCC患者预后的影响无显著差异(图6D-F)。研究还分析了核心基因对应的启动子的甲基化状态,发现CLGN、CTH、PPP1R16A、THBS1的启动子甲基化程度在对照组和肝癌细胞组之间存在显著差异。CLGN的启动子甲基化水平在肿瘤组中较强,而其他三个基因的甲基化水平在肿瘤组中显著降低(图6H-M)。    
图6 与ERSRGs相关的存活、突变和甲基化分析
6.PPP1R16A基因免疫景观的单细胞测序分析
UMAP图显示所有细胞都可以标注为七种类型,包括肝实质细胞、巨噬细胞等(图7A),气泡图显示了七个不同注释细胞组中使用的标记基因(图7B)。单细胞分析显示PPP1R16A主要在恶性肝实质细胞中表达(图7C),Go富集显示,PPP1R16A高表达的细胞主要与脂质代谢过程有关(图7D)。KEGG结果表明PPP1R16A在肝实质中高度富集(图7E),进一步聚类可知在所有重要的信号通路中,有7条通路具有聚类模块化特征,是更核心的信号通路(图7F)。   
图7 单细胞RNA-seq数据分析
7.肝癌中PPP1R16A的上调和PPP1R16A的下调可显著抑制HCC细胞的增殖、侵袭和迁移能力
QRT-PCR实验显示,与正常肝细胞相比,人HCC细胞系PPP1R16A表达更高(图8A),将siRNA转染到Hep3B和HCCLM3细胞中,选择最有效的sirna-ppp1r16a#1进行后续实验(图8B、C)。CK8实验表明,PPP1R16A敲低可抑制Hep3B和HCCLM3细胞的增殖能力(图8D)。同时,划痕实验和Transwell实验表明,敲低PPP1R16A可抑制HCCLM3和Hep3B细胞的迁移和侵袭能力。观察结果表明PPP1R16A是HCC细胞的正调节因子(图8E、F)。    
图8 PPP1R16A表达水平的验证和PPP1R16A的敲除显着抑制HCC的增殖、侵袭和迁移能力
文章小结

本研究将六个已识别的ERSRG整合到基于RF和SVM算法的ANN预测模型中并进一步研究6种ERSRGs在肝癌诊断中的生物学机制、免疫调节和基因组突变。ERSRGs的综合分析为肝癌患者的预后预测和个性化治疗提供了有力的工具,基于ERSRGs的特征模型有望成为肝癌研究领域重要的预测和治疗决策支持系统。PS:生信分析永远不会过时,就看你如何选择思路方向,同时干湿结合也是加分项,还在苦恼如何提升文章档次嘛?感兴趣的快来扫码联系馆长吧!风里雨里,馆长等你1

馆长有话说

馆长会持续为大家带来最新生信思路,也可以提供特色数据库构建、免费思路评估、付费生信分析和方案设计以及实验项目实施等服务,对数据库构建和生信分析感兴趣的朋友可以咨询馆长哦!

生信分析

方案设计

服务器租赁

孟德尔随机化

网络药理学

单细胞测序

临床公共数据库分析

往期推荐

1.什么?只靠分析几个数据集就能发6分文章?上海交通大学医学院团队用单细胞联合Bulk RNA分析教你0实验整花活!

2.发文量暴涨五倍!高分“水刊”?那是万万不可能滴!复旦联合上交大:单细胞多组学+机器学习,一区14+轻松拿捏!

3.当大家都只关心运动刷脂的时候,有人已经通过运动结合多组学数据悄悄发11+Cell子刊啦!一整个高级住了!

本文信息:

Endoplasmic reticulum stress promotes hepatocellular carcinoma by modulating immunity: a study based on artificial neural networks and single-cell sequencing https://doi.org/10.1186/s12967-024-05460-9  

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172927
 
157 次点击