使用机器学习方法实现肝组织学的定量测量和NASH中的疾病监测

✦

深度学习辣汤小组文献阅读学习之五十六

✦

使用机器学习方法实现肝组织学的定量测量和NASH中的疾病监测

DeepLearning 深度学习辣汤小组

2022/9/27

2021年，Amaro Taylor-Weiner等人开发了一种基于机器学习的肝脏组织学评估方法，准确地描述了疾病的严重性和异质性，并敏感地量化了NASH的治疗反应，该成果在Hepatology（IF：17.424）期刊上发表，题目为“A Machine Learning Approach Enables Quantitative Measurement of Liver Histology and Disease Monitoring in NASH”。

DOI：

https://doi.org/10.1002/hep.31750

一、研究背景

非酒精性脂肪性肝炎（NASH，Nonalcoholic Steatohepatitis) 是一种较常见的慢性肝病，NASH的关键组织学特征包括脂肪变性、炎症、肝细胞气球样变和纤维化，由于以上特征需要病理学家人工评分，导致特征评分指标具有较强主观性，因此迫切需要改进肝脏病理的评估方法。文章旨在开发一种基于机器学习（ML，Machine Learning）的肝脏组织学评估方法更客观地评估上述四类指标。

二、数据集

本研究使用了三项针对NASH所致晚期纤维化患者的随机对照试验的肝活检样本STELLAR-3、STELLAR-4和ATLAS。数字化肝活检切片被分为训练、验证和测试集，分别用于模型参数估计、模型性能评估和模型泛化评估。患者首先按照NAS（NAFLD活动评分）和NASH CRN 纤维化分期进行分组，按照0.187/0.813的比率将患者随机分配到训练验证组和测试组。训练和验证切片数据集包括STELLAR-3中388名患者的753张切片和 STELLAR-4中256名患者的502张切片。测试集包括STELLAR-3中1282名患者的 2194张切片，STELLAR-4中1120名患者的2027张切片，以及ATLAS中616名患者的918张切片。

三、方法

为了训练ML模型，来自PathAI病理专家网络的肝胆病理专业委员会认证的病理学家提供了像素级注释，在整个幻灯片图像(WSI)中指定组织区域，以显示特定的形态。具体来说，首先使用数字平台在去除伪影的切片上创建多边形来表示特定形态的区域，包括脂肪变性、气球样变和纤维化（脂肪变性4516个、气球样变4510个、纤维化4511个）用于监督模型训练（表1）。在模型训练后，招募了三名经验丰富的肝胆病理学家，输入相关病理特征的数值分数，对每张载玻片进行一式两份的评估。这些载玻片用于训练具有随机小批量梯度下降的深度CNN，使用ADAM优化器生成NAS成分的像素级预测（脂肪变性、小叶炎症和肝细胞气球化）（图1A）。使用主要病理学家（CP，central pathologist）在临床试验期间生成的载玻片水平标签对ML-Ishak和NASH CRN纤维化评分模型进行监督，模式预测仅限于确定为胆管或纤维化的区域。通过将预测为每个纤维化等级的所有像素相加，并通过纤维化总面积归一化直接从三色染色玻片的图像预测组织纤维化区域内的纤维化阶段，而无需计算特定组织学特征。实验使用Cox比例风险回归模型，并计算c统计量，以评估这些特征对这些结果的模型区分。

四、结果与结论

总的来说，对于病理学家通常难以区分的特征（脂肪变性、小叶炎症和肝细胞气球化），模型的混乱程度最大，这突出了使用主观标签评估模型的困难。首先，文章证明了ML模型和病理学家对脂肪变性(ρ = 0.59)（名词解释1）和纤维化(ρ = 0.63)估计的NASH相关组织学参数结果之间的高度一致性，而血红蛋白（HB，Hemoglobin） (ρ = 0.39)和小叶炎症(ρ = 0.34)的一致性较低。在每个试验的测试集中，ML纤维化评分与纤维化阶段的一致性是一致的，证明了不同载玻片来源的模型通用性（图2）。Ishak分类的评分者内部kappa值（名词解释2）为0.865（范围0.815-0.911），NASH CRN分类的Kappb值为0.797（图3D）。实验还评估了模型性能与病理学家分期的一致性（N=161张幻灯片，图3E），该一致性水平在个体病理学家和共识之间的一致性范围内（N=3；0.780-0.862），同时使再现性水平优于专家评审。除了人类病理学家对纤维化分期的准确再现外，该模型还预测了每种疾病的总体NASH CRN和Ishak纤维化评分图像中的像素，用于计算疾病严重程度的连续测量总结其疾病状态（图3）。

名词解释

1. ρ：在统计学中, 以查尔斯·爱德华·斯皮尔曼命名的斯皮尔曼等级相关系数，即spearman相关系数。经常用希腊字母ρ表示。它是衡量两个变量的依赖性的非参数指标。它利用单调方程评价两个统计变量的相关性，如果数据中没有重复值，并且当两个变量完全单调相关时，斯皮尔曼相关系数则为+1或−1。

2.Kappa系数：用于一致性检验，也可用于衡量分类精度。Kappa值越大，可靠度越强。