数据来源:从GEO 数据库获取OS 患者的scRNA-seq 数据(GSE152048 和GSE162454);从TARGET 计划获取批量RNA 测序数据和临床信息。
单细胞转录组分析:使用Cell Ranger 处理数据,并用Scanpy 和scVI 进行质控以及批次校正;R包Seurat 用于分析细胞类型和基因表达差异,copykat 包则用于评估细胞水平拷贝数变异;Monocle2 和CytoTRACE 算法用于拟时序分析。
基因共表达网络分析:使用hdWGCNA 包分析单细胞加权基因共表达网络,鉴定共表达基因模块。
机器学习模型构建与验证:结合10种机器学习算法及其组合构建整合素相关特征(IRS),通过留一法交叉验证(LOOCV)和外部数据集验证模型性能。
预后评估:基于IRS 风险评分将患者分为高、低风险组,利用Kaplan-Meier 生存曲线(survminer 包)和ROC 曲线分析(timeROC 包)评估模型的预后能力。
单细胞代谢分析:使用SCFEA 工具分析不同细胞类型之间的代谢差异。