Py学习  »  机器学习算法

AJRCCM(IF=31)| 南京医科大学尹荣团队通过整合cfDNA片段组学和机器学习模型,用于早期肺癌检测

iNature • 2 年前 • 336 次点击  

iNature


细胞游离DNA (cfDNA)分析有望早期发现肺癌,有利于提高患者的生存率。然而,以往基于cfDNA的研究的检测灵敏度仍然较低,不足以满足临床应用,特别是对早期肿瘤。

2022118日,南京医科大学尹荣团队在American Journal of Respiratory and Critical Care MedicineIF=31)在线发表题为“Multi-dimensional cell-free DNA fragmentomic assay for detection of early-stage lung cancer”的研究论文,该研究通过整合cfDNA片段组学和机器学习模型,建立了一种准确和负担得起的早期肺癌检测方法。一个堆叠集成模型集成了五个cfDNA特征和五个机器学习算法构建的训练队列(癌症:113,健康:113)优于所有建立在单个特征-算法组合上的模型。

该集成模型在队列验证I(曲线下面积,AUC:0.984)灵敏度高达91.4%,特异性为95.7%;队列验证II(曲线下面积,AUC:0.987)灵敏度高达84.7%,特异性为98.6%;附加验证(AUC:0.974)灵敏度高达 92.5%,特异性为 94.2%。当测序深度为0.5×(AUC:0.966-0.971)时,模型的高性能保持一致。此外,该研究的模型对识别早期病理特征非常敏感(I期的敏感性为83.2%,对<1cm的肿瘤的敏感性为85.0%,临界值为0.66)。总之,该研究利用cfDNA片段组学特征建立了堆叠集成模型,对早期肺癌的检测具有较高的敏感性,可促进早期诊断,使更多患者受益。

早期发现有利于肺癌患者提高生存率,但大多数患者直到转移已经发生才被诊断出来。近年来,液体活检中游离DNA (cfDNA)分析技术的发展为肺癌的诊断提供了广阔的前景。然而,提高基于cfDNA的检测方法的检测性能,特别是对早期肺癌的检测,对于利用其应用至关重要。
不幸的是,只有大约16%的患者在局部阶段被诊断。尽管放射学方法,如低剂量计算机断层扫描(LDCT)测试,可以减少 20%的癌症相关死亡,但由于高假阳性率、辐射诱发的癌症风险和金钱成本,它们的使用受到限制。需要开发一种可靠的非侵入性方法,以准确和经济高效的方式检测早期肺癌。

验证队列的模型说明和诊断性能评估(图源自American Journal of Respiratory and Critical Care Medicine )

在本研究中,建立了一个用于早期非小细胞肺癌(NSCLC)稳健检测的多维堆叠集成模型。该模型综合了cfDNA5个片段组学特征和5个机器学习基础模型,利用全基因组测序数据达到了较好的检测能力。该研究证明,预测模型对检测早期NSCLC病理特征是高度敏感的。在低测序深度至0.5×的情况下,其性能的一致性特别适合于可负担的肺癌早期筛查。

原文链接:
https://www.atsjournals.org/doi/abs/10.1164/rccm.202109-2019OC

END
内容为【iNature】公众号原创,
转载请写明来源于【iNature】

微信加群


iNature汇集了4万名生命科学的研究人员及医生。我们组建了80个综合群(16个PI群及64个博士群),同时更具专业专门组建了相关专业群(植物,免疫,细胞,微生物,基因编辑,神经,化学,物理,心血管,肿瘤等群)。温馨提示:进群请备注一下(格式如学校+专业+姓名,如果是PI/教授,请注明是PI/教授,否则就直接默认为在读博士,谢谢)。可以先加小编微信号(iNature5),或者是长按二维码,添加小编,之后再进相关的群,非诚勿扰。



投稿、合作、转载授权事宜

请联系微信ID:18217322697 或邮箱:921253546@qq.com



觉得本文好看,请点这里!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/149908
 
336 次点击