社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

太卷了,超全单细胞分析+机器学习建模,广西医科大团队这篇一区6+纯生信帮你查漏补缺

生信学霸 • 1 月前 • 52 次点击  


Integrins identified as potential prognostic markers in osteosarcoma through multi-omics and multi-dataset analysis

骨肉瘤(OS)是一种起源于间充质细胞的恶性肿瘤,占全球原发性恶性骨肿瘤的 20%,常见于儿童和年轻人中。整合素是一类细胞表面受体,在癌细胞中发挥着多种作用,是个潜在治疗靶点。然而,目前评估整合素是否可用作骨肉瘤预后标志物的研究仍有限。npj Precision Oncology 上发表的新文章通过分析转录组和单细胞数据集,成功开发了一个基于整合素相关签名(IRS)的预后模型,该模型能准确预测骨肉瘤患者生存率,为个性化治疗提供依据。


期刊:npj Precision Oncology(IF 6.8)

出版商:Springer Nature

发表:2025年1月17日

DOI:https://doi.org/10.1038/s41698-024-00794-5

关键词:骨肉瘤 | 整合素 | 高通量筛选 | 机器学习 | 预后标志物

技术手段:WGCNA分析、转录组分析、机器学习算法、ceRNA网络构建等

核心思路:


方法



数据来源:GEO 数据库获取OS 患者的scRNA-seq 数据(GSE152048 GSE162454);从TARGET 计划获取批量RNA 测序数据和临床信息。

单细胞转录组分析:使用Cell Ranger 处理数据,并用Scanpy scVI 进行质控以及批次校正;R包Seurat 用于分析细胞类型和基因表达差异,copykat 包则用于评估细胞水平拷贝数变异;Monocle2 CytoTRACE 算法用于拟时序分析。

基因共表达网络分析:使用hdWGCNA 包分析单细胞加权基因共表达网络,鉴定共表达基因模块。

机器学习模型构建与验证:结合10种机器学习算法及其组合构建整合素相关特征(IRS),通过留一法交叉验证(LOOCV)和外部数据集验证模型性能。

预后评估:基于IRS 风险评分将患者分为高、低风险组,利用Kaplan-Meier 生存曲线(survminer 包)和ROC 曲线分析(timeROC 包)评估模型的预后能力。

单细胞代谢分析:使用SCFEA 工具分析不同细胞类型之间的代谢差异。


结果



01

通过单细胞转录组分析揭示骨肉瘤独特的肿瘤微环境特征

目的:通过单细胞转录组分析挖掘OS 中与整合素相关的基因表达模式及其在不同细胞类型中的分布。

结果:

1. 对整合数据进行单细胞分析后,识别了14个细胞簇,并用热图展示了每个细胞簇的前五名标记基因表达(图1a,b);

2. CNV 分析显示,164241个细胞中有70410个非整倍体细胞(肿瘤细胞)和82032个二倍体细胞(图 1c);

3. 肿瘤细胞主要由各种细胞类型组成,包括软骨细胞,成肌细胞,增殖细胞和成骨细胞(图1d)。

图1


02

鉴定肿瘤相关基因

目的:通过hdWGCNA 分析识别与骨肉瘤相关的肿瘤基因,并确定关键基因模块和枢纽基因。

结果:

1. 基于572个与整联蛋白相关的基因,研究利用Seurat 中的AddModulesCore 函数评估了所有肿瘤细胞的整联蛋白活性,并根据中位数分数将细胞分为高和低分组(图2a);

2. 通过hdWGCNA 分析,识别出21个非灰色模块,其中M18、M12、M19、M2、M13、M6和M10模块与高分组细胞显著相关(图2b,c);

3. 从显著相关的模块中提取了166个枢纽基因,它们主要富集于蛋白质消化吸收、细胞黏附、细胞迁移等生物学通路。

图2


03

使用机器学习算法构建和验证骨肉瘤中整合素相关特征

目的:综合运用机器学习算法构建和验证一个基于整合素相关基因的骨肉瘤预后标志物。

结果:

1. 通过单变量Cox 回归分析,从166个与整合素相关的基因中筛选出20个与预后显著相关的基因(图3b);

2. 将Target-OS 数据集用作训练集,GSE21257 GSE39055 用作外部验证集,应用了101个机器学习算法组合来构建模型,最终StepCox[backward]模型因C指数最佳且backward方法较稳健被选为最佳组合(图3a);

3. 通过逐步Cox 比例风险回归分析(向后)在这20个基因中选出10个来构建IRS 模型;

4. 风险评分与生存分析显示,这些基因的高表达会提高风险评分,增加生存风险,降低总体生存率(图3c,d)。

图3


04

骨肉瘤整合素相关特征的预后评估

目的:通过分析IRS 在骨肉瘤不同临床亚组和验证集中的预后价值,以验证其适用性和准确性。

结果:

1. 生存分析显示,在训练集、内部验证集、GSE21257 GSE39055 数据集中,高风险组患者的总体生存率显著低于低风险组(图4a-d);

2. ROC 分析显示,IRS 在训练、验证和测试集中的预测准确性均较高(图4e-h);

3. 在转移性/非转移性、成人/儿童、附肢部位/轴向部位的患者中,高风险组的总体生存率均低于低风险组(图4i-l);

4. ROC 分析显示,IRS 在转移性/非转移性、成人/儿童患者中也具备较高的预测准确性(图4m-p)。

图4


05

IRS 相关基因在骨肉瘤细胞亚群中的分布和相互作用分析

目的:分析IRS 相关基因在骨肉瘤不同细胞亚群中的分布和相互作用,以揭示其在肿瘤微环境中的具体作用和影响。

结果:

1. t-SNE violin 图显示,10个IRS 相关基因在不同细胞类型中的分布存在显著差异(图5a,b);

2. 根据每个细胞IRS 评分的中位值将所有细胞分为高分和低分组,其中高分组细胞主要为软骨细胞、内皮细胞、成纤维细胞、MSCs、成骨细胞和前体细胞(图5c,d);

3. 利用CellPhoneDB 分析高IRS相关性的细胞间的相互作用,发现成骨细胞与其他细胞类型之间存在广泛的整合素介导的相互作用(图6a-f);

4. 点图显示,成骨细胞通过激活多个整合途径与多种细胞相互作用(图6g)。

图5

图6


06

基于IRS 评分的骨肉瘤成骨细胞肿瘤细胞的轨迹分析及分化潜能

目的:通过拟时序分析和分化潜能评估,分析基于IRS 评分的OS 成骨细胞肿瘤细胞的成熟过程和分化状态。

结果:

1. Monocle2 分析显示,高IRS 评分的成骨细胞肿瘤细胞主要分布在DDRTree 的分支3中,表明这些细胞在轨迹分析中处于特定的发育阶段(图7a-c);

2. CytoTRACE 分析表明,高IRS 评分的细胞具有较低的CytoTRACE 分数,意味着这些细胞的分化潜能较低,处于更成熟的分化状态(图7d);

3. 相关性分析显示,IRS 评分与Monocle2 伪时间、CytoTRACE 分数呈负相关,表明IRS 评分随着细胞发育进程的推进而降低,且高IRS 评分的细胞往往处于分化晚期(图7e,f)。

图7


07

代谢异质性及其对骨肉瘤进展和预后的影响

目的:通过代谢分析,探讨OS 进展和预后中的代谢异质性及其意义。

结果:

1. 在高IRS 评分组中,SCFEA 预测显示某些关键代谢物(如天冬氨酸、XMPPRPP、丙酮酸、谷氨酸等)的水平显著降低,表明细胞可能经历了代谢重编程,抑制某些代谢途径以促进其他对肿瘤生长和维持至关重要的途径(图8a,b);

2. 在低IRS 评分组中苯丙氨酸、丝氨酸、赖氨酸等代谢物的水平显著升高,表明组中细胞具有更高的合成代谢活性,支持快速增殖和DNA/RNA合成(图8a,b);

3. 这些结果表明骨肉瘤的进展可能伴随着特定的代谢重编程,这可能是影响与高IRS 评分相关的患者生存预后的重要因素。

图8


08

TCGA 数据库中多种肿瘤类型的IRS 的综合预后分析

目的:通过分析 IRS 在多种肿瘤类型中的预后价值,评估其在不同癌症中的普遍适用性和预后能力。

结果:

1. 通过分析TCGA 数据库中的32种不同类型的肿瘤,发现IRS 评分在多种肿瘤类型中与预后显著相关,并且在大多数情况下可作为生存风险因素(图9);

2. 泛癌分析显示,IRS 在多种肿瘤类型中与预后显著相关,能够有效区分高风险和低风险患者,可作为泛癌种预后指标(图10)。

图9

图10


结论



本文围绕“整合素+单细胞+机器学习建模”的核心方向展开研究,通过分析单细胞转录组数据,识别与整合素相关的基因,并利用多种机器学习算法构建了一个整合素相关预后模型IRS ,以预测骨肉瘤患者的预后。在多个数据集和不同临床分组中,IRS 均表现出显著的预后区分能力,为骨肉瘤的个性化治疗和精准医学提供了新的生物标志物和理论依据。


1

END

1

公众号后台私信太多回复不及时,SCI论文润色服务可以添加下图客服微信👇 ,其他合作或疑难解答可加入我们平台交流群(Q群二维码在下面👇)找管理员对接,同时与你的同行们共同交流、学习、进步。

SCI论文润色|翻译|降重|投稿咨询|SCI期刊推荐等业务详情请扫码咨询!


不想错过生信文献解读

欢迎大家添加生信学霸为星标推荐

SangerBox小红书

保存图片打开小红书,扫码关注

每天更新生信相关内容

SangerBox交流群 

保存图片打开QQ,扫码关注

SangerBox平台交流群直接联系

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/179473
 
52 次点击