2024年12月,首都医科大学附属北京天坛医院神经外科在Journal Of Imaging Informatics In Medicine杂志发表了题为 BTK Expression Level Prediction and the High-Grade Glioma Prognosis Using Radiomic Machine Learning Models 的研究。
我们旨在通过构建放射组学模型来研究布鲁顿酪氨酸激酶 (BTK) 表达是否与高级别胶质瘤 (HGG) 患者的预后相关,并预测其手术前的表达水平。包括来自癌症基因组图谱 (TCGA) 的 310 例患者的临床和基因表达数据,用于基于基因的预后分析。其中,从癌症影像档案 (TCIA) 中选择带有基因组数据的对比增强 T1 加权成像 (T1WI + C) 用于放射组学模型,包括支持向量机 (SVM) 和逻辑回归 (LR) 模型。此外,构建了包含放射组学特征的列线图以评估其临床疗效。通过单变量和多变量 Cox 回归分析,BTK 被确定为 HGGs 的独立危险因素。选择三个放射组学特征构建 SVM 和 LR 模型,验证集显示曲线下面积 (AUC) 值分别为 0.711 (95% CI,0.598-0.824) 和 0.736 (95% CI,0.627-0.844)。基于 LR 模型的高 Rad_score 组和低 Rad_score 组的中位生存时间分别为 15.53 和 23.03 个月。此外,采用每位患者的总风险评分构建预测列线图,根据相应的时间依赖性 ROC 曲线计算的 AUC 分别为 0.533 、 0.659 和 0.767,持续 1 年、 3 年和 5 年。BTK 是与患者预后不良相关的独立危险因素,本研究构建的影像组学模型可以基于 T1WI + C 有效、无创地预测术前 BTK 表达水平和患者预后。
图2 分析两个 BTK 表达组的临床数据和生存数据。a 正常组织和肿瘤组织之间 BTK 表达水平的比较,p < 0.001。b TCGA 中低 BTK 表达组的 OS 长于高 BTK 表达组。对数秩检验显示两组间差异显著。c、d使用单因素和多因素 Cox 回归分析临床病理特征与 OS 之间的关联。
图3 BTK 表达水平、临床病理特征和免疫浸润丰度之间的关系。a 热图显示了 BTK 表达水平与临床病理因素之间的相关性。b CIBERSORTx 分析两个 BTK 表达组之间每种类型 TME 浸润细胞的丰度。
图4 使用 OLR 、 HLR 和 SVM 模型预测 BTK 表达水平,通过 ROC 和校准曲线进行评估。训练集和验证集中 OLR (a) 和 HLR (b) 模型的 ROC 曲线。c 校准曲线说明了与实际 BTK 表达水平相比,OLR 和 HLR 模型预测 BTK 表达水平的准确性。d DCA 用于 OLR 和 HLR 模型。e SVM 模型的 ROC 曲线、DCA 曲线和校准曲线。
图5 使用 REMBRANDT 队列进行外部验证以及 OLR 模型和深度学习模型之间的模型比较。a、b、c、dTCIA 队列和 REMBRANDT 队列(分为所有高级别神经胶质瘤和仅 WHO III 神经胶质瘤)中外部验证集的 ROC 曲线。e、f、g、h相应的校准曲线。
图6 OLR 模型的 SHAP 图。a 使用平均绝对 Shapley 值量化 SHAP 特征重要性。该图说明了每个协变量在最终预测模型开发中的重要性。b 热图显示了每个样本的影像组学特征的重要性。c 一个样本重要性的可视化。d OLR 模型的 SHAP 汇总图。
图7 Rad_score 相关基因和生存数据比较。a BTK 表达水平与临床病理特征之间的关系。b、cKaplan-Meier 曲线和断点为 12 个月的地标分析显示两组 Rad_score 组之间的 OS 存在显著差异。
图8 列线图和相应的模型评估。a 开发的列线图,用于预测 HGG 患者的 OS。b 用于评估模型临床性能的 DCA 曲线。c 列线图的校准曲线。