Py学习  »  机器学习算法

只用了两个月,高校团队巧用机器学习直接拿下top期刊

挑圈联靠 • 1 年前 • 357 次点击  

大家好,我是雪梨~~欢迎来到雪梨的生信套路!


肝癌(HCC)是一种具有高度异质性和复杂性的肿瘤,其发展和治疗响应受到多种分子机制的调控。DNA损伤修复(DDR)是维持基因组稳定性和细胞生存的重要过程,而其异常可能导致肿瘤的发生和进展。免疫治疗近年来在多种癌症中取得了显著的成就,但在肝癌中的效果尚不理想,因此深入了解肝癌的生物学特征,特别是在单细胞水平上的分子细节,对于发展精准医学治疗方案至关重要。接下来,我们来解读一篇有关肝癌DNA损伤修复(DDR)的转录组分析和免疫调节的文章,以挖掘它们之间的关系。



我们一起来看看吧!



技术背景

DDR

在肝癌中,DNA损伤修复(DDR)对于肿瘤的发展和治疗反应至关重要。DNA损伤修复(DDR)涉及细胞对DNA损伤的应答和修复,对于维持基因组的稳定性至关重要。肝癌通常伴随着肿瘤异质性和复杂的肿瘤微环境,这使得了解DDR如何与TME相互作用成为研究的关键点。


DNA损伤修复是一种细胞内的生物学过程,旨在修复DNA分子上的损伤和错误。DNA是细胞中携带遗传信息的分子,它在维持生命和传递遗传信息方面起着关键作用。然而,DNA容易受到各种内外因素的损害,如紫外线辐射、化学物质、离子辐射和其他环境因素。

DNA损伤修复系统

DNA损伤修复系统帮助细胞检测和纠正这些DNA损伤,以维持基因组的完整性。有多种不同的DNA修复机制,每种都专注于修复特定类型的损伤。


直接修复: 包括一些特殊的酶,能够直接修复DNA上的损伤,而无需切除或替换碱基。例如,光修复酶能够修复由紫外线引起的损伤。

错配修复: 用于纠正由于DNA复制错误引起的碱基配对错误。错配修复系统检测到不匹配的碱基,并通过切除和重新合成修复DNA。

核苷酸切除修复: 用于修复较大的损伤,如由于紫外线引起的损伤。该机制涉及切除受损的DNA片段,然后通过DNA合成来填补缺失的部分。

双链断裂修复: 用于修复DNA双链断裂,这是一种较为严重的损伤。有两种主要的双链断裂修复机制,即非同源末端连接和同源重组。


DNA损伤修复对于维持细胞的稳定性和遗传信息的传递至关重要,因为未修复的DNA损伤可能导致细胞死亡、突变和癌症等严重问题。

DNA损伤修复与癌症的发生和发展

DNA损伤修复与癌症的发生和发展密切相关。正常情况下,细胞内的DNA损伤修复机制能够检测和修复DNA上的损伤,以维持基因组的稳定性。然而,当这些修复机制出现缺陷或失调时,可能导致累积的DNA损伤,增加细胞发生突变的风险,从而促使癌症的发生和发展。


失调的修复机制: 如果细胞的DNA损伤修复机制出现缺陷,损伤的DNA可能无法得到及时或正确修复。这可能导致累积的突变,其中一些突变可能在癌症发展中发挥关键作用。

癌症前体病变:某些DNA修复缺陷可能使细胞更容易转变为癌症前体病变,这是癌症发展的早期阶段。例如,遗传性DNA修复缺陷症状(如BRCA1和BRCA2基因的突变)与乳腺癌和卵巢癌的增加风险相关。

治疗的影响: 某些癌症治疗方法,如放射疗法和化疗,通过引起DNA损伤来破坏癌细胞。然而,这些治疗也可能对正常细胞造成损伤,因此患者可能在治疗后经历额外的DNA修复问题。

免疫系统监测: 免疫系统可以通过监测DNA损伤来防止癌症的发展。一旦细胞发生重大DNA损伤,免疫系统通常会引发细胞凋亡(程序性细胞死亡)或将受损细胞标记为需要清除的目标。


总体而言,正常的DNA损伤修复机制对于预防癌症的发生至关重要。DNA修复缺陷可能导致癌症相关基因的突变积累,从而促使癌症的发展。因此,对DNA损伤修复机制的研究不仅有助于理解癌症的发病机制,还为开发针对癌症治疗的新策略提供了重要的线索。


研究概述

DDR

这篇文章涉及了肝癌DNA损伤修复(DDR)状态与肿瘤微环境(TME)的深入研究,结合了生物学和技术方面的多层次分析。


背景介绍:

肝癌是一种常见的肝癌类型。在肝癌中,细胞的DNA损伤修复机制(DDR)对于肿瘤的发展和治疗反应至关重要。DNA损伤修复(DDR)涉及细胞对DNA损伤的应答和修复,对于维持基因组的稳定性至关重要。肝癌通常伴随着肿瘤异质性和复杂的肿瘤微环境,这使得了解DNA损伤修复(DDR)如何与肿瘤微环境(TME)相互作用成为研究的关键点。


技术背景:

在技术方面,研究采用了单细胞RNA测序(scRNA-seq)等高通量技术,通过分析单个细胞的转录组,揭示了肝癌细胞中DNA损伤修复(DDR)状态的异质性。这种技术能够提供单细胞水平的分辨率,揭示不同细胞亚群的基因表达差异,从而深入了解肝癌的细胞异质性。此外,研究使用了生物信息学工具,如CellPhoneDB、NicheNet和scMLnet,通过分析配体-受体相互作用等生物信息学数据,揭示了在免疫检查点抑制剂(ICI)治疗后,TME中不同DNA损伤修复(DDR)状态下的细胞间相互作用。


发现和结论:

通过这些技术手段,研究者发现了肝癌中DNA损伤修复(DDR)状态的异质性,并通过构建DDRscore系统,量化了不同患者的DNA损伤修复(DDR)状态。这一系统不仅能够在整体水平上预测患者的生存状况,还能够为患者分层,指导潜在的个体化治疗策略。此外,通过揭示CXCL10-CXCR3轴在“低DDR”患者中的重要作用,研究提出了可能的免疫治疗策略。最后,通过分析B-Raf通路,研究者提出了治疗“高DDR”患者的潜在策略,为个体化治疗和靶向治疗提供了新的方向。


总体而言,这项研究结合了生物学和高通量技术,深入探讨了肝癌中DNA损伤修复(DDR)状态与肿瘤微环境(TME)的相互作用,为更有效的癌症治疗提供了潜在的生物学和临床启示。


研究结果






Figure1

Figure 1展示了DDR在肝癌细胞中的异质性分析结果,包括实验设计和分析流程、UMAP图表示细胞类型、细胞数量和比例的柱状图、不同样本来源中9个细胞群体的相对百分比、CopyKAT鉴定的恶性和非恶性细胞数量、恶性细胞的UMAP图及不同样本的聚类树图、WGCNA分析的基因模块和调节网络、Venn图和条形图显示WGCNA选择的基因与DDR基因集的交集、不同肿瘤分期下DDR在恶性细胞中的差异、每个肝癌样本的DDR得分条形图以及与DDRscore组相关的14个通路的PROGENy分析结果。从图中可以看出:肝癌中存在显著的DDR异质性,其水平随肿瘤不同阶段而变化;使用DDRscore系统可以定量评估肝癌样本中恶性细胞的DDR状态,早期肝癌显示较高的DNA损伤修复活性;根据DDRscore分组,低DDR组与高DDR组在关键通路上显示差异,如p53和TRAIL途径在低DDR组中上调,而EGFR和PI3K途径在高DDR组中上调。


Figure2


Figure 2展示了对肝癌中不同DDR水平下肿瘤微环境(TME)的分析结果,采用了单细胞RNA测序(scRNA-seq)技术。根据患者级别的DDR分配,生成了高DDR和低DDR的TME的单细胞分辨率可视化图,每种颜色表示相关的细胞类型。通过基于OR的统计分析,评估了潜在的细胞类型变化。NK细胞在低DDR组中与高DDR组关联最强,而B细胞在高DDR组中最丰富。NK细胞通过单细胞表达谱在不同分辨率下聚类,形成六个亚群。其中,低DDR组主要包含SPP1+ NKs、LDLRAD4+ NKs、IRF8+ NKs和FCGR3A+ NKs,而高DDR组主要由GSTA1+ NKs和IGLC3+ NKs主导。这些亚群在功能和代谢过程上有差异,表明NK细胞在DDR水平变化中可能发挥不同的免疫作用。B细胞分为CD20+ B细胞和CD138+浆细胞,CD20+ B细胞在低DDR组中相对更多。CD20+ B细胞在低DDR组中表达CXCL8和GZMB,暗示其可能与CTL协同响应,限制肿瘤发展。CD138+浆细胞在高DDR组中显示较高的“B细胞受体信号通路”活性,而在低DDR组中则显示“糖酵解糖异生途径”活性增强。这些发现支持了NK细胞和B细胞调控肝癌的肿瘤发生转变,从高DDR条件下的有效DNA修复状态到功能受损状态,通过重新编程免疫生态系统和代谢过程。


Figure3

Figure 3展示了在肝癌中,针对不同DDR状态进行免疫治疗(ICI)后,免疫微环境(TME)的特征。使用单细胞数据集(GSE151530),将接受ICI治疗和未接受ICI治疗的肝癌组织中的细胞分为34,708个子群。UMAP图显示了细胞类型的分布,不同治疗条件和患者特征之间几乎没有批次效应。使用“TransferData”算法对细胞类型进行注释,包括恶性细胞和非恶性细胞,以及B细胞、CD4+ T细胞、CD8+ T细胞、NK细胞、树突状细胞、巨噬细胞、内皮细胞和成纤维细胞等主要免疫基质细胞。ICI治疗组中,相较于非ICI治疗组,存在更少的恶性细胞和更多的CD8+ T细胞。总体肝癌上皮比例在免疫治疗后下降,可能是由于免疫检查点抑制剂诱导的肿瘤杀伤。通过DDRscore算法分析ICI治疗样本的DDR状态。与低DDR组相比,高DDR组表现出上调的脂肪酸代谢途径、WNT途径激活和可能的致癌MYC激活。相反,低DDR组显示上调的上皮-间质转化(EMT)和致癌KRAS活化。通过拟时序分析揭示了肿瘤细胞发育的趋势,从恶性细胞集群逐渐分化为成纤维细胞样状态,暗示了在DDR能力下的纤维性TME形成的可能作用。分析不同DDRscore患者中的免疫细胞组分,在低DDR患者中,表现出多种免疫抑制性检查点的上调,而在高DDR患者中,显示出TNF相关家族信号的富集和MHC分子的上调。


Figure4

Figure 4揭示了在免疫治疗后,肝癌TME中不同DDR状态下的细胞相互作用的特征。通过使用多个生物信息学工具(CellPhoneDB、NicheNet和scMLnet),图示了TME中高DDR和低DDR状态下特定细胞类型之间的分子相互作用。在全局范围内,高DDR主要通过纤维细胞-内皮轴进行中心化,而低DDR则向以巨噬细胞为主的模式完全转变。以CD8+ T细胞作为接收细胞,显示了在ICI治疗后不同DDR状态下细胞相互作用的动态变化。特别是在低DDR组中,CD8+ T细胞与巨噬细胞、DC和NK细胞之间的通信显著增强。使用NicheNet算法,表征了与不同DDR水平相关的主要配体的表达差异。结果显示,在低DDR状态下,DCs中HLA-DRA和GSTP1的表达较高,而在高DDR状态下表达下调。通过使用CellphoneDB进一步研究了CD8+ T细胞在低DDR患者中的潜在相互作用分子。发现DCs表达高水平的CXCL10与CD8+ T细胞表面受体CXCR3之间存在最强的相互作用。这一发现揭示了CXCL10-CXCR3轴在产生DCs和CD8+ T细胞以及在低DDR状态下介导CD8+ T细胞浸润肿瘤的关键作用。总结了在免疫治疗后,根据DDR状态的变化,肝癌TME的动态变化。揭示了潜在的治疗策略,为未来的研究提供了线索。


Figure5


Figure 5 展示了在肝癌中开发和验证的DDR一致性Signiture,以及该Signiture与肝癌患者预后和免疫治疗响应之间的关系。使用从单细胞RNA-seq鉴定的56个关键DDR基因,通过机器学习整合技术生成DDRscore。通过LOOCV(Leave-One-Out Cross-Validation)框架拟合101种组合的机器学习方法,选择具有最佳性能的模型(Lasso + 随机生存森林,RSF),其平均C-index为0.843。RSF模型使用17个DDR基因的回归系数加权表达来计算每个患者的DDRscore。基于DDRscore将患者分为高DDR和低DDR组,发现高DDR患者的总体生存率显著低于低DDR患者,这一结果在TCGA-LIHC和ICGC-LIRI-JP数据集中均得到验证。使用TIDE算法估计DDRscore与免疫治疗(PD-1抑制剂)响应之间的可能关系。结果显示,三个独立队列都显示了DDRscore与PD-1响应性之间可能的关联,高DDRscore倾向于PD-1无效。使用独立队列验证,发现高DDRscore与疾病进展相关。通过使用卡方检验,发现在TCGA-LIHC、ICGC-LIRI-JP和FDUZS三个独立队列中,低DDR肝癌患者普遍具有较好的生存优势。


Figure6

Figure 6 提供了有关肝癌患者高DDR得分的潜在治疗靶点的信息,尤其是那些DDR得分较高的患者,他们可能有较差的临床预后。通过机器学习模型计算了22个肝癌细胞系的DDRscore。使用来自TCGA-LIHC队列的反向相位蛋白质组阵列(RPPA)数据,发现B-Raf表达与DDRscore呈正相关。这表明B-Raf可能与高DDRscore相关。使用22个肝癌细胞系的CERES分数,评估了个体基因依赖性与DDRscore之间的相关性。发现BRAF基因是DDR高分组的一个重要预测因子。通过RPPA定量蛋白质组学分析,验证了B-Raf通路在肝癌中的活性。结果显示B-Raf的活性形式(在丝氨酸445位点磷酸化的B-Raf)及其下游靶点MARK3和ERK1/2在肝癌中显著升高。同时,BRAF基因在高DDR组中显著上调。


研究总结

DDR

这份研究通过系统性的单细胞RNA测序(scRNA-seq)分析、生物信息学工具和机器学习方法,深入研究了在肝细胞癌(HCC)患者中DNA损伤修复(DDR)状态与肿瘤微环境(TME)、免疫治疗响应以及患者预后之间的关系。


以下是主要的研究发现和结论:


TME中的DDR状态与免疫细胞分布关联:根据患者DDR水平将TME分为DDR高和DDR低两组,发现在DDR低组中自然杀伤细胞(NK细胞)显著增加,而B细胞则更多地出现在DDR高组。


NK细胞亚群及B细胞亚群的分析:对NK细胞进行进一步分类,发现六个亚群,其中大多数属于DDR低组。B细胞分为CD20+ B细胞和CD138+浆细胞,CD20+ B细胞在DDR低组中更为显著。


HCC TME的动态调控:揭示了NK细胞和B细胞在DDR高和DDR低状态下对HCC的不同调控模式,包括代谢过程、抗原处理和呈递等。


DDR状态与免疫治疗响应的关系:通过单细胞数据分析和机器学习,发现DDR状态与免疫治疗响应存在关联,DDR低状态患者显示更高的免疫活性。


开发DDRscore预测模型:通过56个DDR关键基因构建DDRscore,并使用机器学习方法验证其在多个独立队列中的预测能力。发现DDR高组患者的总体生存率较低。


DDRscore与免疫治疗敏感性关联:使用TIDE算法估计DDRscore与免疫治疗响应的潜在关系,结果显示DDR低组可能更有利于PD-1治疗的有效性。


针对高DDRscore患者的治疗靶点:通过分析肝癌细胞系和蛋白质组数据,发现B-Raf通路与高DDRscore相关,可能成为治疗高DDRscore患者的潜在靶点。


总体而言,这项研究提供了关于HCC患者中DDR状态与TME、免疫治疗响应及预后之间复杂关系的深入理解。通过DDRscore的开发,为将来的个体化治疗和精准医学提供了有希望的方向。



生信人发文的第一道坎,是看不懂文献的套路。


先别着急!


关于生信快速发文的小诀窍,雪球老师在腾讯会议制定了一个会议主题:2024年生信3+SCI性价比最高的发文方式,想要了解的可以扫下方的二维码哦!同时,雪球老师还会不定时在朋友圈发布生信直播链接以及科研干货~ 欢迎大家扫码了解!


现团队推出一款生信学习体系课“卓越计划”,目的是让做科研的医生把生信想明白,做明白,助力科技成果发表。


卓越计划第一次线下课(2023年12月2日-3日)就收获了超乎预期的反响,线下集中训练,尤其是针对代码问题的专项答疑深受学员们的喜爱(卓越计划是一种遥遥领先的精神状态参加卓越计划后,我拿回了属于我的一切)。



另外,现在添加雪球老师微信,回复W-12还可以领取雪球老师精心整理的多分子类型生信套路从入门到精通~


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/167380