Py学习  »  机器学习算法

Adv Sci丨施奇惠团队报道基于自动标注的通用细胞病理癌症诊断深度学习模型框架

BioArtMED • 3 天前 • 17 次点击  


针对目前基于体液(如尿液、肺泡灌洗液、脑脊液、血液等)的细胞病理癌症诊断灵敏度较低的临床问题,复旦大学生物医学研究院联合浙大一院报道了一种适用于各种体液的通用细胞病理单细胞深度学习模型框架,其核心是不依赖于细胞病理学医生的体液脱落肿瘤细胞标注方法。该方法使数据标注可客观、准确、自动化的完成,为医学人工智能(AI)模型的发展提供了新的思路。该工作发表于近日出版的Advanced Science。题为Single-Cell Sequencing-Guided Annotation of Rare Tumor Cells for Deep Learning-Based Cytopathologic Diagnosis of Early Lung Cancer.


随着深度学习的迅速发展,AI已在医学影像与组织病理中获得广泛应用,但其在体液细胞病理领域尚缺乏准确性高、可解释性强的模型,主要原因在于缺乏大规模、准确的标注数据。深度学习模型的训练高度依赖高质量的标注数据集,但这需专家花费大量时间才能实现,还存在不准确标注、不同专家间标注一致性较低等问题。虽然弱监督算法可部分弥补标注上的缺陷,但从实现效果上仍逊于基于大规模、准确标注数据集所训练的模型。因此,如何不依赖于专家实现大规模数据的准确标注一直是深度学习领域的重要挑战。


在细胞病理领域,深度学习在基于宫颈细胞学、细针活检细胞学的癌症诊断方面的应用有所报道,但在体液癌症诊断中存在很大困难,其原因在于细胞病理学医生难以提供大量准确标注的体液脱落肿瘤细胞图片。体液通常可无创或微创获取,因此其在癌症/癌症转移/癌症复发的早期诊断方面具有重要意义。但由于体液样本中脱落肿瘤细胞数目少,且形态与良性细胞存在较大重叠,使其难以准确鉴定,因此体液脱落细胞学的恶性诊断灵敏度偏低。


施奇惠团队以单细胞低深度基因组测序为工具,以体液中多个细胞具有一致的拷贝数变异谱为脱落肿瘤细胞鉴定的客观标准,通过大规模、低成本的单细胞测序对细胞病理巴氏染色片上的大量细胞进行随机测序,从而无偏倚的鉴定脱落肿瘤细胞以构建脱落肿瘤细胞数据集。这一包含不同形态脱落肿瘤细胞的数据集不依赖于细胞病理医生标注,是一种通用、客观的细胞标注方法,使用自动化的细胞与液体操纵设备可实现整个单细胞提取、测序与标注过程自动化。



本研究以肺泡灌洗液为代表性体液样本进行深度学习模型的建立。肺癌是我国癌症发病率、死亡率第一的恶性肿瘤,且大部分肺癌被诊断时已是中晚期。相对于有创的活检与气管镜刷检,肺泡灌洗是一种微创的医学手段,所获得的肺泡灌洗液中可包含从肿瘤组织脱落的肿瘤细胞。团队从24名肺癌患者的肺泡灌洗液巴氏染色片中随机测序了3000多个细胞,其中580个被确认为肿瘤细胞,并连同1106个良性细胞构成了深度学习模型训练的数据集。团队开发了名为LESSEL的端到端深度学习模型用于单细胞识别与分割、图片预处理,以及单细胞良恶性分类,其中良恶性二分类模型的曲线下面积大于0.95。基于LESSEL的肺泡灌洗液诊断模型在两个独立的中心队列中进行了验证,其中中心一(n=158)灵敏度47.6%,特异性97.7%,中心二(n=141)灵敏度60.0%,特异性92.5%,其灵敏度均较细胞病理学有较大提升,为肺癌的早期诊断提供了新的工具。


该论文的第一作者为复旦大学生物医学研究院研究生赵镱淳、邱若然及青年副研究员王卓博士,通讯作者为复旦大学生物医学研究院施奇惠研究员、浙大一院病理科尤启汉教授和复旦大学基础医学院陈自强博士。


原文链接:https://doi.org/10.1002/advs.202416921

制版人:十一




BioArt

Med

Plants

人才招聘

会议资讯



学术合作组织

(*排名不分先后)

战略合作伙伴
(*排名不分先后)

·

·
·








转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181569
 
17 次点击