【阿姆斯特丹博士论文】深度学习在医疗数据中的应用

来源：专知
本文为论文介绍，建议阅读5分钟
这篇论文重新审视了深度学习的基本组成部分，并评估了它们在医学图像分析中的应用。

这篇论文重新审视了深度学习的基本组成部分，并评估了它们在医学图像分析中的应用。论文指出了深度学习在这一领域的三个主要挑战：专家知识的整合、未标记数据的利用以及预测不确定性的估计。论文结构分为几部分，分别解决这些挑战。

第一部分

在第一部分中，论文介绍了一种通过旋转反射等变性（roto-reflective equivariance）来整合专家知识的新型深度学习模型，以提高医学成像任务的准确性和鲁棒性，特别是在组织病理学切片中检测转移组织的任务中。所提出的模型优于传统的卷积神经网络（CNN）架构，并表现出对输入扰动的鲁棒性。接下来，论文探讨了如何通过提出PCam数据集（源于Camelyon16挑战赛）来激励深度学习社区关注现实的医学问题。PCam结构类似于常见的深度学习基准，并证明在该数据集上的改进可以转化为在更大Camelyon16基准上的改进。

第二部分

第二部分探讨了通过对比预测编码（Contrastive Predictive Coding，CPC）进行自监督表示学习的好处，并提出了对比扰动预测编码（Contrastive Perturbative Predictive Coding，C2PC），通过引入特定的医学图像增强来增强CPC的性能。

第三部分

论文的第三部分解决了预测不确定性的估计挑战，这对于高风险医疗决策至关重要。它引入了一种新的变分推理方法，该方法利用了多项分布在量化潜在变量上的特性。与现有方法相比，所提出的方法在不确定性估计和风险评估方面表现出竞争力。

结论

论文总结了通过解决这些挑战，深度学习可以更好地适用于医学成像任务。它证明了专家知识可以有效地整合到深度学习模型中，利用未标记数据通过自监督学习可以提高模型性能，且通过更灵活的变分推理方法可以改进预测不确定性。

总之，论文展示了深度学习在医学图像分析中的潜力，并提供了应对关键挑战的有效方法，为将来在医疗领域的应用奠定了坚实的基础。

重新评估深度学习在医学图像分析中的应用

准确诊断疾病和确定最有效的治疗方法是一个历史性挑战。在古代，困难的病例常常被归因于超自然现象，恶魔和神的干预是古代社会对疾病的普遍解释，并据此选择治疗方法。随着科学方法的兴起和医学的进步，医生现在能够利用不断增长的科学知识、高证据标准的干预措施和各种现代诊断工具，做出更加明智的治疗决策。

1.1.1 医学诊断的复杂性

诊断疾病和预测治疗结果并不是火箭科学；它远比火箭科学复杂。挑战在于医学决策中的每一个方面都充满不确定性。虽然我们有关于重力和火箭发动机的确定性模型，但人体仍未完全被理解。直到今天，仍然有新的器官被发现，对治疗产生影响。关于检测和治疗结果的科学证据稀少且偏向特定人群。干预研究存在生存偏差，随机对照试验倾向于有利于适合双盲研究的治疗方法。人类的异质性和许多诊断工具相关的人类痛苦和经济成本进一步加剧了这种复杂性。此外，这一领域在不断演变，以前被视为现代治疗顶峰的干预措施现在受到质疑。在这种不确定性的迷雾中进行决策，可能需要超越人类手动能力的智能水平。

1.1.2 医学影像

现代医学影像的出现进一步加剧了这一问题。通过X射线、超声、计算机断层扫描（CT）和磁共振成像（MRI）等技术，以及病理图像数字化的进步，临床医生可以获得患者的海量信息。结果，医生在诊断疾病和预测治疗结果时，被大量需要考虑的数据所淹没。处理这些方法生成的不熟悉图像的复杂性导致了专门职业的出现，如放射科医生和病理科医生。这些专家必须专注于密集的数据流，以发现异常和评估风险。为了标准化见解，人类专家依赖于诸如Gleason评分等主观量表，这对治疗的侵入性有重大影响，但其评价者间的变异性惊人。此外，引入更多人类参与决策过程会带来沟通和交接方面的挑战。一旦诊断完成，专家的建议与实际治疗结果之间几乎没有反馈循环。

1.1.3 计算机辅助诊断

计算机辅助诊断（CAD）的前景在于，计算机具有无限的精力、无限的注意力，而且不会在工作时喝醉。软件可以复制并不断改进，错误行为可以重演、研究和纠正。反馈循环可以跨越数月，将治疗结果作为早期识别模型的指导信号。这是一条改进医学决策的有前途的道路。

尽管医学诊断过程包含许多方面，全面涵盖整个过程是一个挑战。在本论文中，我们专注于计算机辅助诊断在医学图像解释中的挑战。这是开发一个综合系统的关键步骤，该系统能够消化来自医学诊断过程各个方面的信息，并沿途提供建议。

1.1.4 深度学习

将医学图像分析领域的专业知识提炼为算法一直很困难。尽管许多博士学位持有人接受了这一挑战，但根据直觉和经过数百年研究和实践精心打磨的理论推导规则几乎是不可能的。幸运的是，机器学习为基于规则的模型设计提供了一个替代方案。该领域提供了经过验证的方法，这些方法采用专家注释的示例，并得出旨在捕捉这些注释背后的基本原则的模型。然而，医学影像数据特别庞大且密集，传统的机器学习方法依赖于手工制作的特征提取，将数据转化为方法能够处理的数字。这种手工制作特征的过程几乎与设计规则同样困难。

1.1.5 深度学习带来的变革

深度学习的出现给医学图像分析领域带来了巨大的变化。通过结合大型随机初始化的特征提取器和随机梯度下降来遍历搜索空间，机器学习模型现在可以直接在原始密集图像上进行训练。这一方法在2012年的ImageNet挑战赛中被广泛推广，当时深度学习在分类准确性上优于传统的机器学习方法。从那时起，大多数医学图像分析研究社区都看到了深度学习作为主导范式的转变。

深度学习的前景

深度学习在医学图像分析中的有效性为未来带来了令人鼓舞的愿景。深度学习模型可以训练来自世界各地的数据，而不是由专家使用来自学术医院的小数据集设计的手工模型，这些数据集仅捕捉到世界各地人口的一小部分。此外，深度学习模型可以在初步诊断数月后从错误中学习，这种反馈循环在人类专家中很少发生。虽然通常被认为是黑箱，但一组专家类似于飞机失事调查员，可以精确再现模型出错时的状态，并可以使用各种工具提供内省和指导，以便在未来减轻类似错误。此外，深度学习模型的免费复制意味着专业知识可以在全球范围内应用。这为缺乏高质量医学见解的社区带来了获取高质量医学见解的机会。

深度学习在初级医疗中的应用

深度学习模型可以通过消除对专门知识的需求来改变初级医疗的提供方式。这使得初级医生能够直接将医学扫描转化为可操作的见解，从而减少沟通负担并减少因交接而导致的错误。最后，当一种新疾病威胁世界时，这些模型可以迅速更新以纳入新的诊断，为全球健康危机提供灵活的应对措施。

重新评估医学图像分析中的深度学习

尽管深度学习非常有效，但它是以经验方式开发的——一些人将这一过程等同于炼金术——并且仍然缺乏基本的第一性原理的支持。虽然这确实带来了巨大的成功和进步，但推动年复一年改进的主要基准与医学图像分析中的问题有显著差异。这些基准通常是自然图像中的单个对象检测，侧重于分类准确性，忽略了医学图像分析的细微差别。这并不是说深度学习在这一领域没有表现出它的价值。它在有影响力的医学图像基准上取得了巨大的成功。例如，Gulshan等人在2016年展示了一种深度学习模型，能够在视网膜眼底照片中检测糖尿病性视网膜病变，其性能可与一组认证的眼科医生相媲美。Esteva等人在2017年展示了（接近）人类专家水平的皮肤癌分类性能。Wang等人在2016年展示了在从前哨淋巴结活检的全切片图像中识别转移性乳腺癌方面的强大性能。

然而，对于如此敏感的医学决策任务，深度学习模型的失败模式不可忽视。数据偏差、类别不平衡、决策的可解释性和可解释性缺乏、输入模式的鲁棒性和标签分歧敏感性等问题在医学领域需要特别关注。因此，有必要在医学图像分析的视角下重新评估深度学习的现状，以发现进一步改进的空间并解决现有的不足。

关于我们

数据派THU作为数据科学类公众号，背靠清华大学大数据研究中心，分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识，努力建设数据人才聚集平台、打造中国大数据最强集团军。

新浪微博：@数据派THU

微信视频号：数据派THU

今日头条：数据派THU