研究发现,特征中有些是单一或协同地影响治疗反应的。例如,高增殖能力和高免疫激活水平是预测pCR的重要指标,而TP53突变、高突变负荷和新抗原负荷、APOBEC和HRD突变特征、染色体不稳定性等基因组特征也与pCR有正相关。相反,PIK3CA突变、HLA I类等位基因缺失、T细胞功能障碍和排斥、肥大细胞富集等特征则与pCR有负相关。此外,研究还发现,不同的乳腺癌分子亚型对术前治疗的反应存在差异,其中iC10亚型(主要为三阴性乳腺癌)最容易达到pCR,而iC3、iC7和iC8亚型(主要为ER阳性乳腺癌)最难达到pCR。HER2阳性乳腺癌的反应则与增殖能力无关,而可能受到靶向治疗的影响。
图2所示显示,该多组学预测模型在外部验证队列中的AUC为0.87,表明具有很好的预测能力。相比之下,仅使用临床特征的预测模型在外部验证队列中的AUC为0.70,表明其预测能力较差。如图3所示,本研究还分析了不同特征类别对预测模型的贡献,发现转录组特征占据了最大的比例,其次是临床特征、基因组特征和数字病理特征。其中,年龄、淋巴细胞密度、PGR、ESR1和ERBB2的表达水平等是最重要的预测因子。
该研究表明,通过结合临床、分子和数字病理等多模态数据的预测治疗反应机器学习模型明显优于单基于临床变量的预测模型。通过外部验证中获得的高准确性表明,该模型具有良好的鲁棒性,在未来临床实践中完全可以使用分子和数字病理学来确定未来临床试验中的治疗选择或者辅助治疗设置。