摘 要
本文介绍了目前国内外肺结核影像智能识别的研究进展。主要探讨了通用技术路线、数据集来源及影像特征、网络模型、效果评价及应用情况,并分析了肺结核计算机辅助诊断的未来发展趋势。
关键字
医学影像处理;肺结核;X射线;深度学习;计算机辅助诊断
世界卫生组织发布的2020年度《全球结核病报告》显示,全球结核潜伏感染人群接近20亿。2019年全球约1000万人新发结核病,约140万人死于结核病,结核病依然是全球头号传染病杀手。我国结核病人数量位居世界第三,是全球结核病高负担国家之一,2019年约有83.3万人发病,其中3.3万人死亡。虽然经过我国政府的多年努力,对肺结核的防治已经走在世界前列,但随着社会和医疗水平的发展进步,肺结核病也面临结核病菌耐药性变强,流动人口增多对防控的制约,以及患者老龄化严重等一系列棘手问题。我国肺结核防控明显落后于新发传染病。
肺结核也可能出现与新冠肺炎初期类似的症状,不仅会对肺部造成损伤,治疗时间更是长达6~8个月。对肺结核感染者和密切接触者的快速筛查,有助于及时采取有效的防控措施,减少感染和减少后期防控付出的巨大代价。目前,痰菌检查是结核病诊断的金标准。但是,结核病病原菌阳性诊断率低,一般至少需要做5次,且痰结核菌培养周期长、难以定量,不能得出更丰富的信息。而即使临床上已经证明了利用CT进行疾病诊断的误诊率和漏检率都要低于胸部X射线影像,但综合考虑到成本和我国国内医疗水平参差不齐等现实情况,相对较贵的CT扫描设备在不发达/欠发达地区的普及率远远不够,所以截止到现在,X射线摄影依然是结核筛查优选的价格低廉且辐射量小的常规技术。
人工阅读X射线影像易疲劳、耗费时间,漏诊难以避免,而且影像科医生的培养需要很长的周期,基层影像医生严重不足,而我国大部分的结核病患者在农村基层。另外,除了需要诊断出患者是否是肺结核,还需要根据患者的个体病情情况,进行对应的治疗方案设计。因此,基于深度学习的肺结核X射线影像筛查技术,能帮助基层公卫人员挖掘更多的X射线影像信息,提高人工智能阅片的实用性,为个性化治疗和精准防控提供更多辅助信息。
基于深度学习的肺结核X射线影像筛查研究的通用技术路线,如图1所示,可归纳为X射线影像学数据获取、影像特征提取、影像特征生成和模式识别分类验证四个部分。
X射线影像学数据来源,包括公开数据集和研究团队专用数据集。数据集经过医生标注和文献总结,可生成肺结核影像特征知识库。
影像特征提取主要分为影像预处理、深度学习预处理和影像特征提取三部分。通过对影像进行滤波和增强、复原、形态学处理,以及心肺影像区域分割,达到影像预处理的目的。深度学习预处理过程中,通过合理的从影像数据集中划分测试集和训练集,来增强网络模型的鲁棒性和泛化能力。一般会采用多个不同来源的数据集,所以还需要对输入影像数据进行存储格式的统一。不同的深度学习模型输入图像的大小会有不同,因此需要进行调整。训练过程中,还需要进行色彩调整、标注框处理,以及模型参数的迁移学习。预期提取到的影像特征包括肺部的病变分布、粟粒的数目、纤维形态、肺与纵膈及心脏的相对邻域结构变化、纵膈宽度、肺门大小、肺部组织的密度变化、肺部孔洞的大小和多少、肺叶边缘是否光滑等。
目前的肺结核影像处理,主要判断是否患有肺结核的二分类问题。我们拓展二分类问题为四分类问题,进一步识别肺结核的四种临床分型,即原发型肺结核、血行播散型肺结核、继发型肺结核和结核性胸膜炎型肺结核。
对于肺结核影像处理分类效果的验证,以医生的诊断结果作为金标准。医生通过收集病人的病例和病理信息,根据专业经验进行诊断和验证影像智能辅助诊断的效果。
公开数据集促进了肺结核深度学习的研究。目前为止,公开的肺结核数据集汇总如表1所示。
表1 肺结核X射线影像公开数据集
Montgomery数据集中的X射线影像来自美国马里兰州蒙哥马利县卫生与公众服务部的结核病控制项目。所有数据是DICOM格式。
Shenzhen set由美国马里兰州国家医学图书馆与中国深圳广东医学院深圳第三人民医院合作创建。胸部X光片来自门诊,使用飞利浦DR数字诊断系统捕获。
Belarus肺结核X射线数据集是一个包含对常规结核病治疗有耐药性的白俄罗斯患者的数据集,共1049例。
TBX11K肺结核数据集由南开大学的程明明团队创建,包含11200例X射线图像,并有相应的肺结核疑似区域的边框标注。
来自卡塔尔多哈大学和孟加拉国达卡大学的团队,与马来西亚哈马德医疗公司和孟加拉国的医生合作,创建了一个结核病阳性胸片和正常对照胸片各3500例的数据库。
此外,还有美国NIH的Chest X-ray-14公开数据集40GB(3万位病人约11万例X射线影像 ),包含肺不张、心脏肥大、肺渗出、肺渗透、肺部肿块、肺结节、肺炎、气胸、肺实变、肺水肿、肺气肿、肺纤维化、胸膜肥厚和疝气14种肺部疾病。该数据集用于肺结核计算机辅助诊断的缺点是,数据类别分布不平衡,部分数据集含有肺结核的病例征象,对肺结核诊断概念不明确。
基于目前的肺结核X射线影像数据集的研究表明,四种不同临床分型的肺结核的影像特征差异较明显,部分影像特征汇总如表2所示。
表2 肺部X射线的部分影像特征汇总
对于结核病计算机辅助诊断的研究,经历了传统图像处理到深度学习的技术跨越。
传统图像处理阶段,2013年,Tao Xu等提出了在胸部X射线影像中进行空洞检测的双尺度特征分类策略,优势是计算效率高;劣势是数据集较小,分类条件有严格限制。2014年,Kumar等采用Gabor滤波器进行分割和支持向量机进行分类,但是其数据集仅80张影像。2015年,Hogeweg等手工提取纹理和形态特征,分类效果媲美医生,但是AUC值不佳。
肺结核影像深度学习阶段,2016年,Hwang等首次应用卷积神经网络 (CNN) 进行肺结核分类。2017年,Rahul Hooda等提出一种浅层的CNN,包括7个卷积层和3个全连接层,并比较了三个不同的优化器,最终证明 Adam优化器在肺结核分类问题中的性能最优。2018年,Rajaraman 等采用预训练的CNN实现特征提取,分类器采用支持向量机,准确率有所提升。2019年,Pasa等在英伟达GTX 1050 Ti上采用改进的轻量化 CNN实现了肺结核的分类,但是该方案不适用于较大的数据量。2020年,南开大学程明明团队的CVPR论文公开了带有标注的TBX11K肺 结 核 数 据 集, 并 改 进 了SSD、FCOS、RetinaNet和Faster R-CNN,用于健康、非肺结核肺疾病、肺结核三分类,以及核病灶区域检测。2021年,Ayaz等设计Gabor滤波器人工特征提取和深度学习特征提取相融合的集成学习模型,该方案在面对不同来源的样本时,迁移效果将会欠佳。
目前为止,文献中应用于肺结核影像分割、分类和检测的深度学习网络模型有AlexNet、GoogleNet、VggNet、ResNet18、ResNet50、SqueezeNet、U-net、ResNet101、MobileNet、ChexNet、InceptionV3、DenseNet和DeuseNet201等。对CNN网络结构应用于肺结核分类的改进研究,主要集中在先分割再分类、引入注意力机制、采用金字塔池化、引入残差网络或残差单元、改进优化器和集成学习等方面。
图2所示为经典的以AlexNet卷积神经网络为示例的,结核X射线影像筛查深度学习网络模型。将X射线影像的输入大小调整为227×227×3, 经过多次卷积、线性整形、池化、全连接和归一化。使用Relu作为非线性激活函数,克服梯度消失问题。全连接采用了128个特征的展平,用了2层来增加非线性拟合的效果。全局池化采用了空间金字塔结构,从网络的不同层中,抽取不同尺度的特征图进行预测。采用交叉熵损失函数,对网络的预测值和真实的标签值之间的误差进行准确度量。引入尺度变换和平移变化,使数据分布更加符合真实分布的同时,为网络带来更高的灵活性,提高网络的泛化能力。包含的肺结核影像特征信息转化为数值,经过softmax归一化处理,得到是否患肺结核的二分类的判决概率。
图2 肺结核X射线经典深度学习网络模型示例
最新的肺结核二级集成深度学习卷积神经网络模型的示例,图3所示。采用AlexNet和ResNet18的集成深度学习网络模型,对同一张X射线影像,将其生成为227×227×3和224×224×3这2个数据大小,分别输入到浅层AlexNet网络和深层ResNet18网络进行学习。浅层网络做二分类任务,识别是否患肺结核。深层网络做精细特征分类,完成四分类任务。残差网络ResNet18中产生的512个特征,与AlexNet中产生的128个特征展平为640个特征,通过softmax归一化,给出肺结核 4 种临床分型的各自判别概率。
评价基于深度学习的肺结核X射线影像的分类效果的指标,主要有准确率、受试者工作特征曲线(ROC)和曲线下面积(AUC)。
如表3所示,准确率=(真阳+真阴)/(真阳+假阳+真阴+假阴),特异性或假阳性率=假阳(假/阳+真阴),敏感度或真阳性率=真阳(真阳/+假阴)。
表3 混淆矩阵
ROC曲线的横坐标为特异性,纵坐标为敏感度,反映特异性与敏感度的关系,是实验准确性的综合代表。AUC为ROC曲线下面积,AUC值越大,代表分类的结果越准确。
基于深度学习判断是否感染肺结核的二分类的效果举例,如表4所示。
表4 Montgomery数据集的二分类效果
市场上被收录到世界卫生组织阻止肺结核伙伴关系的肺结核计算机辅助诊断商业产品有九峰医疗的JFCXR-1、DxTB、CAD4TB、XrayAME、AXIR、InferRead DR Chest、JLD-02K、CAD4TB、qXR和INSIGHT CXR,其中仅JLD-02K取得了FDA认证。
经 过 痰 培 养 来 作 为 金 标 准 诊 断 肺 结 核,检验出 qXR产品的敏感度为0.93[95%, CI 0.89~0.95,p=0.0002], 特异性为0.75 [0.73~0.77, p<0.0001]。CAD4TB产品的敏感度为 0.93[95%,CI 0.90~0.96,p<0.0001],特异性为0.69[0.67~0.71, p=0.0003]。世界卫生组织推荐的产品敏感度为0.90,特异性为0.70。
由于X射线成像过程中环境因素的干扰,包括患者呼吸带来的细微抖动、设备的热噪声等,成像时会伴随噪声元素。在神经网络进行深度学习时,随着网络层数的增加,这些噪声像素在特征图的权重也会增加。另外,不同设备及不同技师采集的X射线影像,一致性有待提升。此外,肺部疾病患病类型的分类依据在影像上的表现有些特征往往差异不明显,但是生理特征差异可以明显区分。例如,肺结核和新冠肺炎在有些影像征象上难以区分。但是,肺结核以咳痰2周以上或痰中带血为常见症状,此外还有低烧、夜间盗汗、午后发热、胸痛、疲乏无力、体重减轻、呼吸困难等;新型冠状病毒肺炎以发热、乏力、干咳,逐渐出现呼吸困难为主要表现,少数患者伴有鼻塞、流涕、腹泻等症状,部分患者仅表现为低热、轻微乏力等。因此,仅使用X射线影像进行肺结核深度学习特征识别与分类,存在一定的局限性,需要结合影像组学数据进行多维度的深度学习。
肺结核X射线影像的深度学习筛查技术,可更好地辅助基层公共卫生人员开展工作,为个性化治疗和精准防控提供技术支撑。但是,肺结核X射线影像计算机辅助诊断技术的应用,还需要解决三个具体问题。① 肺结核X射线影像样本不均衡对深度学习准确率造成的影响;② 如何有效地对肺结核、肺炎、肺癌等肺疾病进行鉴别诊断;③ 如何在提高模型训练效率的同时,兼顾模型训练准确率。
肺结核作为传染性疾病,具有一定的社会属性,采用基于影像组学的病理-生理-社会的模型预测及计算机辅助诊断技术,是一个值得探索的技术路径。
(参考文献略)
选自《中国人工智能学会通讯》
2021年第11卷第9期
智慧医疗专辑
如果你在看这篇文章,
别忘了点击「在看+点赞」哦!
👇