社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

牛!!!单细胞测序+深度学习:早期肺癌病理诊断新突破

今日病理 • 3 天前 • 11 次点击  
今天介绍的这篇文章主打-计算机病理技术,come on!一起看看现在的AI病理多模态新玩法!
深度学习(DL)作为人工智能算法的一种,因其能够学习复杂的数据表示,在医学图像分类和目标检测中被广泛研究。然而,DL模型的进一步发展受到缺乏大规模、高质量标注数据集的限制。支气管肺泡灌洗(BAL)是一种用于诊断肺癌的微创程序,但其细胞学检查的敏感性较低。由于脱落肿瘤细胞(ETCs)的稀有性和与正常细胞的细微形态差异,DL在BAL细胞学中的成功应用较为罕见。
近日,由我国复旦大学附属医院和浙江大学医学院的多位专家一起,在 Advanced Science 上发表了题为:“Single-Cell Sequencing-Guided Annotation of Rare Tumor Cells for Deep Learning-Based Cytopathologic Diagnosis of Early Lung Cancer”的研究论文。该研究的创新地利用单细胞DNA测序(scDNA-Seq)作为ETC标注的客观标准,而不是依赖细胞病理学家的主观判断。这种方法不仅提高了数据集的质量和客观性,还减少了对专家标注的依赖,使得大规模数据集的生成成为可能。
主要研究方法与结果:
为了解决DL模型训练中高质量标注数据集的缺乏问题,研究者们采用了单细胞DNA测序(scDNA-Seq)作为ETC标注的客观“金标准”,以生成一个包含580个ETCs和1106个良性细胞的无偏、准确标注的数据集。这些细胞来自BAL细胞学涂片,涵盖了多种肺癌亚型和细胞形态。

图1. 单细胞测序评估BALF中单细胞和细胞团的细胞学注释

研究者利用 scDNA-Seq 技术,从支气管肺泡灌洗液(BALF)样本中生成无偏、准确的脱落肿瘤细胞(ETC)数据集。他们从24名肺癌患者的BALF样本中随机选择约3000个细胞进行单细胞低覆盖全基因组测序(LP-WGS),最终确认了580个ETCs,这些ETCs涵盖了多种肺癌亚型和不同形态的细胞。同时,研究者还从10名良性肺部疾病患者的BALF样本中挑选了1106个良性细胞。这些数据为开发深度学习模型LESSEL提供了高质量的训练基础,显著提高了肺癌诊断的准确性和可靠性。

图2. 单细胞测序确认的BAL ETC数据集

LESSEL 是一种 DL 管道,用于在单细胞水平上快速检测 Papstained BAL 细胞学载玻片中的 ETC。LESSEL通过从Pap染色的BAL细胞学涂片中提取单细胞图像,并利用单细胞DNA测序(scDNA-Seq)确认的ETC数据集进行训练,能够快速检测BALF中的ETCs。该流程包括单细胞提取、质量控制(QC)、单细胞分割和双通道分类模型。研究者开发了基于YOLOX的单细胞提取模型、基于EfficientNet-B2的质量控制模型和基于U-Net的单细胞分割模型,以提高图像质量和细胞分割的准确性。最终,LESSEL通过双通道分类模型分别对大尺寸和小尺寸细胞进行分类,以提高检测的敏感性和特异性。

图3. LESSEL流程和LESSEL衍生的诊断模型

在内部测试中,LESSEL对大尺寸细胞的分类模型显示出57.1%的敏感性、100%的特异性和0.997的AUC;小尺寸细胞的分类模型显示出46.7%的敏感性、100%的特异性和0.956的AUC。

图4. LESSEL性能

LESSEL模型在BAL基础细胞病理诊断肺癌中的临床应用。研究者在发现队列(n=156)中开发了LESSEL衍生的诊断模型,通过分析Pap染色的BAL细胞学涂片,模型的敏感性为47.6%,特异性为97.7%,显著优于传统细胞学检查(敏感性19.0%,特异性100%)。在独立验证队列(n=158)中,模型的敏感性为47.6%,特异性为97.7%,进一步证明了其优越性。在外部验证队列(n=141)中,模型的敏感性为60.0%,特异性为92.5%,再次验证了其在早期肺癌诊断中的潜力。

图5. LESSEL在BAL基础细胞病理诊断肺癌中的临床应用

总结:这项研究通过scDNA-Seq引导的ETC标注策略,开发了一个基于BAL的DL细胞病理诊断模型,显著提高了肺癌诊断的准确性。这种方法不仅减少了对专家标注的依赖,还为液体活检领域带来了重大进展,有望在未来成为早期肺癌诊断的重要工具。

思考:这篇文章的成功之处在于解决了日常病理诊断工作中的难点,而且研究方法不仅适用于肺癌,还可能推广到其他疾病;未来除了单细胞测序,还可以整合转录组、蛋白质组、代谢组等多组学数据,以构建更全面的诊断模型。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181294
 
11 次点击