Py学习  »  机器学习算法

五体投地的佩服!中山大学团队:机器学习构建“ICI双模型”?直接榨干公共数据库啊!好的思路别人可都立马follow上了!

好本子 • 1 月前 • 73 次点击  


每天睁眼第一个念头,我怎么还没发文章啊?火火今天给大家分享的文章也是最近的热门话题:ICI(免疫检查点抑制剂),这个疗法已经被证明可以治疗复发或癌症转移。研究团队利用机器学习建立了两个新模型(成纤维细胞-癌细胞间接共培养(FCICC)模型与成纤维细胞-癌细胞类器官(FC-organoid)模型),基于成纤维细胞与癌细胞间的交互作用,研究HNSCC患者在接受免疫检查点抑制剂(ICI)治疗后的情况。下面简单说明一下思路吧:

1.癌症相关成纤维细胞(CAFs)是肿瘤微环境(TME)中含量最高的基质细胞,在肿瘤转移和免疫抑制中起着至关重要的作用。然而,CCCT的过程仍然难以可视化,这使得完全理解CCCT变得更加困难。

2.首先构建了两个细胞模型来观察CCCT。然后,结合HNSCC患者的scRNA-seq数据和大量转录组数据,建立HNSCC的预后指标。

3.利用HNSCC的scRNA-seq数据提取CAFs与癌细胞之间的配对配体和受体(pairLRs),并鉴定关键对LRs,构建CAF-癌细胞串扰相关基因预后指数(CCRGPI)。

4.描述了CCRGPI的分子和免疫特征,研究了其在接受ICI治疗的患者中的预后能力,并通过连接图(CMap)分析和分子对接筛选了潜在的治疗药物。

Ps:你还知道机器学习能用在哪个方面吗?能构建什么模型呢?如何使用呢?不妨和火火聊一聊,这里思路多多,不用动脑,直接get最核心idea!


定制生信分析

云服务器租赁

加好友备注“99”领取试用


题目:基于机器学习的新型CAF-癌细胞串扰基因预后指标:头颈部鳞状细胞癌治疗反应的预后意义及预测

杂志:J Transl Med

影响因子:IF=6.1

发表时间:2024年7月

公众号回复“123”领取原文PDF,文献编号:20240721

研究背景

在肿瘤微环境构建及免疫治疗效果中,癌相关成纤维细胞(CAF)与癌细胞间的交互作用(CCCT)占据核心地位。当前,针对头颈鳞状细胞癌(HNSCC)患者的免疫治疗反应评估,所采用的预后指标尚显不足。该研究旨在构建一种基于CCCT相关基因的预后指数(CCRGPI),以期精准预测HNSCC患者接受免疫检查点抑制剂(ICI)治疗的预后及响应情况,从而优化治疗策略。

数据来源    

数据集/队列

数据库

数据类型

/

TCGA

494 个HNSCC 样本的 RNA-seq 数据、突变数据和临床病理信息

GSE85446、GSE103322、GSE212550、抗PD-1

GEO

66份HNSCC样本的RNA-seq数据、10份人瘤病毒(HPV)阴性HNSCC样本的scRNA-seq数据以及HNSCC样本的免疫治疗数据

研究思路

为了直观展现成纤维细胞与癌细胞间的交流机制,该研究构建了两种细胞模型:成纤维细胞-癌细胞间接共培养(FCICC)模型与成纤维细胞-癌细胞类器官(FC-organoid)模型。基于HNSCC的单细胞RNA测序数据集,利用R软件中的CellChat包进行细胞通讯分析,以识别参与CCCT的基因对。随后,采用最小绝对收缩与选择算子(LASSO)回归法对基因对进行精细化筛选。筛选出的基因对进一步通过逐步回归法构建CCRGPI。接着,对不同CCRGPI亚组进行详尽的分子特性、免疫特征分析及免疫治疗预后评估。最终,利用连接性图谱(CMap)分析及分子对接技术,筛选出潜在的治疗药物候选者。

研究结果

1.细胞模型中探究CCCT机制

该研究首先采用FCICC模型模拟了癌细胞从上皮层穿透基底膜进入固有层的过程(图1A)。有趣的是,观察到癌细胞以锯齿状方式向固有层推进,且在癌细胞入侵的Fi-mg区域,大量成纤维细胞被激活并聚集于癌细胞侵袭前沿(图1B)。此发现强调了癌细胞在诱导成纤维细胞向CAFs转化中的关键作用。为进一步探索CAFs对癌细胞的影响,构建了FC-类器官模型(图1C)。值得注意的是,在FC-类器官模型中,CAFs与癌细胞呈现不对称生长模式(图1D)。

图1细胞模型中的CCCT

2. CCCT 中涉及的 PairLR 

将单细胞RNA测序数据的整合后, HNSCC样本癌细胞被划分为两个鳞状细胞癌亚组(SCC1, SCC2),而CAFs则被细分为三个亚群:肌成纤维细胞(MyoCAF)、基质CAF(MatCAF)和静息成纤维细胞(Resfib) (图2A,B)。GO分析结果显示,MyoCAF过表达基因主要富集于肌生成与收缩相关通路,MatCAF过表达基因则主要与细胞外基质相关通路富集;对于癌细胞,SCC1高表达基因主要富集于中性粒细胞相关通路,而SCC2高表达基因则主要与代谢及应激相关通路富集(图2C, D)。值得注意的是,生存分析表明,SCC2细胞比例较高的HNSCC患者预后较差(图2E)。因此,该研究后续仅聚焦于MyoCAF、MatCAF与SCC2细胞间的配体受体对(pairLRs)进行深入研究

图2单细胞亚群的特征

3.CCRGPI的建设

为确定构建CCRGPI的关键配体受体对(pairLRs),该研究首先采用ssGSEA算法,计算了TCGA数据库中HNSCC样本中各pairLRs的表达评分(ES)(图3A)。随后,对这些pairLRs进行了LASSO回归分析(图3B),从中筛选出26个关键pairLRs。接着,利用这些pairLRs进行单因素Cox回归分析,最终确定了10个pairLRs(图3C)。随后,将这10个pairLRs输入逐步Cox回归分析中,进一步精简至4个关键pairLRs(图3C, D)。HNSCC患者中IGF1_IGF1R ES较高者预后较差,而LGALS9_CD44、SEMA5A_PLXNA1及TNXB_SDC1则呈相反趋势(图3E),表明这些pairLRs在预测HNSCC患者预后中具有重要作用。 

图3 CCRGPI的建设

4.验证CCRGPI的有效性

该研究首先探讨了CCRGPI在不同临床特征HNSCC患者中的分布情况。结果表明,有吸烟史、饮酒史、复发史及T期较晚的患者CCRGPI较高,而HPV阳性患者则呈现出较低的CCRGPI(图4A)。既往研究表明,HPV阳性HNSCC患者及基质成分较少的患者预后更佳。鉴于MatCAF是基质生成的重要细胞类型,其低水平可能是HPV阳性患者预后较好的原因之一。尽管HPV阳性组中SCC2含量较高,但MatCAF的减少可能导致了较低的CCRGPI(图4A),进而对整体预后产生积极影响。

图4 CCRGPI的验证

5.不同CCRGPI亚群的分子特征

在差异表达分析中,相较于低CCRGPI组,高CCRGPI组内观察到48个基因的上调,这一数量显著低于下调的279个基因(图5A)。尽管上调基因数量有限,但基于HALLMARK基因集的GSEA分析揭示,高CCRGPI组中多达13条信号通路被激活(图5B)。此外,基于趋化因子-细胞因子网络的GSEA分析表明,高CCRGPI组中趋化因子与细胞因子的产生、分泌、结合及激活均受抑制(图5C)。基因突变作为TME异质性的重要驱动力,如人类癌症中最常突变的TP53基因,通过调节免疫发挥肿瘤抑制作用,其突变会改变免疫微环境并促进癌症发展。因此,该研究计算了HNSCC样本的肿瘤突变负荷(TMB),发现TMB与CCRGPI呈正相关,高CCRGPI组展现更高的TMB。

图5 不同CCRGPI亚组的分子特征

6. 不同CCRGPI亚组的免疫特征 

利用R包“estimate”分析HNSCC样本后,发现CCRGPI与免疫评分呈负相关,高CCRGPI组的免疫评分显著降低(图6A)。相反,不同CCRGPI亚组的基质评分保持一致,这可能是由于CAFs在肿瘤微环境(TME)中占主导地位且亚群分布相似所致。HCK、干扰素、LCK、MHC_II和STAT1基因集的富集分数均与CCRGPI呈负相关(图6B)。基于GO数据库的GSEA分析显示,与低CCRGPI组相比,高CCRGPI组的免疫相关通路均受到抑制(图6C)。类似地,除CD276外,高CCRGPI组中几乎所有46个免疫检查点基因均下调(图6D)。这些结果表明,高CCRGPI组样本处于免疫抑制状态,可能对免疫治疗不敏感。

图6 不同CCRGPI亚群的免疫特性

7. 不同HPV亚群的免疫特性

HPV阳性和阴性HNSCC患者的免疫反应模式存在差异。因此进一步探究了不同HPV亚组的免疫特征。结果显示,在两个HPV亚组中,CCRGPI均与免疫评分呈负相关。高CCRGPI组中几乎所有差异含量的免疫细胞均减少。总体而言,高CCRGPI的HNSCC患者无论是否感染HPV,均较难从免疫检查点抑制剂(ICI)治疗中获益。这些结果进一步证实了CCRGPI的可靠性。

8. 不同CCRGPI亚组的治疗敏感性

研究者进一步探讨了CCRGPI预测免疫治疗反应的能力。首先,通过TIDE评分和IPS(免疫预后评分)推断患者对免疫治疗的反应。结果显示,高CCRGPI组的TIDE评分和T细胞排斥评分均高于低CCRGPI组,但T细胞功能障碍评分和IPS较低(图7A)。此外,利用HNSCC(GSE212550,抗PD-1)和尿路上皮癌(IMvigor210,抗PD-L1)的免疫治疗数据集评估了CCRGPI预测接受免疫检查点抑制剂治疗患者预后的能力。发现高CCRGPI患者的预后较低CCRGPI患者更差(图7B和C)。这表明,高CCRGPI的HNSCC患者从ICI治疗中获益的可能性低于低CCRGPI患者。最后推断了两个CCRGPI亚组中198种化疗/靶向治疗药物的IC50值,结果显示,在83种具有统计学意义的药物中,高CCRGPI组样本的IC50值更高,即药物敏感性更差。总体而言, CCRGPI对免疫治疗和化疗均具有较强的预测能力 

图7 不同CCRGPI亚组的治疗敏感性

9.小分子药物筛选与分子对接分析

通过CMap分析筛选出了20种针对CCRGPI的潜在小分子药物,为进一步明确CCRGPI的关键靶点,构建了包含CCRGPI中8种蛋白质的PPI(蛋白质-蛋白质相互作用)网络,并运用三种算法识别出关键靶点。结果显示,IGF1R在三种算法中均排名第一,因此被视为关键靶点。并发现Perospirone和Ganetespib与IGF1R的结合能低于天然配体,表明它们对IGF1R具有更高的亲和力。

文章小结

FCICC与FC-organoid模型揭示了癌细胞诱导成纤维细胞活化为CAFs的过程,CAFs则加剧癌细胞侵袭性,且CCCT展现出一定异质性。该研究基于四组基因对构建了CCRGPI。此外,高CCRGPI与P53通路激活、高TP53突变率及ICI治疗低效正相关,而与CD4+ T细胞、CD8+ T细胞及B细胞等多种免疫细胞丰度负相关该研究通过分子对接分析,确定了Ganetespib作为针对CCRGPI关键靶点IGF1R的潜在治疗药物,为HNSCC的联合治疗提供了新的思路。寻找靶点+预后这个套路也是很常见的,火火之前分享过很多类似的主题,大家有兴趣,可以翻阅过往分享的文章,也可以直接扫码找火火私人定制生信分析哦,一站式服务非常到位!

·  火火有话说 ·

生信火公众号持续为大家带来最新!最优!最赞的生信思路,想复现思路或者定制更多适合自己的创新性思路,欢迎直接扫码联系火火,生信火团队竭诚为您的科研助力!

生信分析服务

免费思路评估

服务器租赁

扫码咨询火火

往期推荐

1. 好思路能在生信领域“横刀立马”!机器学习+多中心+影像学!技术碰撞+热点融合,发文就是这么丝滑!

2. 这波好思路必得藏一手!空军军医大学韩静教授团队“孟德尔随机化+横断面研究”重磅登场!他汀类药物强势出击,7.4分稳稳收入囊中!

3. 哇塞!IF20+原来是这样达成的,思维定胜负,机器学习+纵向聚类+亚组分析的常规组合,居然能成封神之作!错过哭晕!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/172539
 
73 次点击