摘要 目的:探索利用深度学习方法在建立颈椎病MR诊断模型的可行性。方法:回顾性搜集本院2020年10月至2023年3月诊断为颈椎病患者的MR图像514例,使用已有颈椎分割模型在轴面T2WI上分别预测硬膜囊、脊髓、椎间盘、后纵韧带和黄韧带,在矢状面T1WI和T2WI上预测颈椎椎体和椎间盘。由一位低年资放射科医生(阅片经验2年)修改标注,另一位高年资放射科医生(阅片经验≥15年)对低年资医师的标注进行复核。按照颈椎病的不同诊断要点分别进行3D或2D深度学习分类模型训练,包括(1)颈椎椎体增生模型;(2)颈椎椎体滑脱模型;(3)颈椎间盘突出分类模型;(4)后纵韧带增厚模型;(5)黄韧带增厚模型。将模型输出结果导入R软件进行混淆矩阵分析及ROC曲线绘制,采用正确率、灵敏度、特异度、阳性预测值、阴性预测值以及ROC曲线下面积等评价5种模型的分类效能。结果:5种分类模型中诊断效能最好的是颈椎间盘突出分类模型,正确率0.90,灵敏度0.95,特异度0.85,ROC
曲线下面积0.982。颈椎椎体增生和滑脱的正确率分别为0.81和0.80,灵敏度为0.74和0.76,特异度为0.84和1.00,ROC曲线下面积分别为0.855和0.905。后纵韧带和黄韧带增厚的模型正确率分别为0.82和0.77,灵敏度为0.78和0.84,特异度为0.86和0.70,ROC曲线下面积分别为0.902和0.929。结论:本部分研究采用深度学习方法建立了颈椎病MR的自动分类诊断模型,对颈椎椎体增生、滑脱、椎间盘突出、后纵韧带及黄韧带增厚进行了分类模型训练,证明深度学习方法可以用于颈椎病MR的辅助诊断,为未来进一步探索建立颈椎病MR自动诊断模型及结构化报告的植入奠定了基础。
关键词:磁共振成像,颈椎病,深度学习
MRI因其出色的软组织分辨力而普遍地应用于颈椎
和脊髓疾病的诊断。临床工作中颈椎病的影像学诊断多是基于MRI图像进行定性的主观判读和定性诊断,分类诊断应用较少。由于颈椎区域的骨骼、韧带、血管和神经等解剖结构较多,简便、客观地量化分析颈椎和脊髓的结构有一定困难。影像科日常工作量繁重,对每一例患者进行颈椎和脊髓MRI图像的手工测量并不现实,如果能够从MRI图像中自动获取颈椎和脊髓的形态学指标并进行自动分类诊断将会为临床工作提供强而有效的帮助。
随着AI技术的发展,应用DL等方法对图像进行自动分割和测量在肺、肝脏、乳腺、前列腺、肾脏等方面都已经取得进展。本课题组既往对成人颈椎MR 各结构进行了自动分割的研究,建立了成人颈椎MR分割模型,具备良好的准确性与稳定性。本部分研究将在前期研究的基础上开发基于深度学习的颈椎病MR
诊断模型,为进一步构建颈椎病MR自动诊断模型和结构化报告的植入奠定基础。
材料与方法
1、研究队列
本部分研究已获得本单位伦理审查委员会批准(2019-170),对入组患者豁免知情同意,按照颈椎病的不同诊断要点分别进行回顾性病例搜集并进行模型训练,包括(1)颈椎椎体增生模型;(2)颈椎椎体滑脱模型;(3)颈椎间盘突出分类模型;(4)后纵韧带增厚模型;(5)黄韧带增厚模型。具体纳入标准:(1)颈椎椎体骨质增生、伴或不伴滑脱;(2)颈椎间盘膨出(<5mm)或突出(中央型、旁中央型和椎间孔型);(3)后纵韧带和/或黄韧带增厚。纳入的图像序列为颈椎病患者常规MR平扫序列,不包含增强序列及其他功能成像序列。排除标准:(1)行MR检查前有颈椎手术史、外科治疗史;(2)颈椎骨折、畸形、感染等疾患;(3)
不能配合、图像质量不佳者。
2、扫描设备参数
MRI扫描设备包括GE Signa Excite 3.0T、GE Discovery HD 750 3.0T、Siemens Aera 1.5T、Philips Ingenia 3.0T、Philips Achieva 3.0T、Philips Multiva 1.5T和联影医疗uMR 790 3.0T。扫描序列包括常规矢状面T1WI、矢状面T2WI、轴面T2WI以及脂肪抑制T2WI
(FS-T2WI)。
3、数据标注(图1)
将入组患者的矢状面T1WI、T2WI及轴面T2WI的DICOM格式图像转换为NiFTI格式。使用本课题组既有颈椎MR分割模型对其进行预测,在轴面T2WI上分别预测硬膜囊、脊髓、椎间盘、后纵韧带和黄韧带,在矢状面T1WI和T2
WI上预测颈椎椎体和椎间盘。由一位低年资放射科医生(阅片经验2年)修改标注,另一位高年资放射科专家(阅片经验≥15年)对低年资医师的标注进行复核,如有不一致的情况以高年资放射科专家的标注为金标准。修改标注后,在矢状面椎体分割结果上自动按照C2-C7的顺序进行椎体定位,将矢状面定位信息匹配至轴面T2WI,得到各个椎间盘的定位(C2/3-C6/7)。
图1 颈椎椎体和椎间盘的定位过程。a)在矢状面T2WI 图像对椎体进行分割;b)将椎体标签按不同连通域进行分割,从C2椎体向下依次生成各椎体定位;c)确定椎间盘的测量层面,图中蓝线和绿线代表轴面T2WI扫描平面,其中绿线为通过椎间盘水平的测量平面;d)将矢状面T2WI的定位信息与轴面T2WI进行匹配,从而得到每个椎间盘的位置,图示为C5/6椎间盘。
4、椎体增生
与滑脱模型训练
在定位完成后,由低年资放射科医生在颈椎正中矢状面T1WI图像中对认为存在增生的椎体进行标注,标注标准为在矢状面T1WI中判断椎体边缘是否存在骨质增生变尖等异常信号,标注点位于椎体的中心位置,直径10像素,没有增生的椎体不予标注(即归为正常组)。由另一位高年资放射科专家进行复核,标注过程如图2所示。通过连通域分割的方法将已经定位好的椎体取出,最终将矢状面T1WI图像、椎体的图像标签以及椎体增生的标签共同输入3D-ResNet模型,以每一个椎体为一个数据进行模型训练,模型训练使用的硬件为GPU NVIDIA Tesla P100 16G,软件为Python3.6、Pytorch 0.4.1、Opencv、Numpy和SimpleITK等,Adam为训练优化器。模型的训练参数为图像预处理参数:
size=32×32×64(z,y,x),自动窗宽、窗位。共计874个数据按照8:1:1的比例随机分为训练集(train dataset,n=698)、验证集(validation dataset,n=88)和测试集(test dataset,n=88),每次读取的图像数量(batch size)为20,学习率(learning rate)为0.0001,训练次数(epoch)为500。
图2 颈椎椎体增生标注。a)颈椎正中矢状面T1WI图像;b)分割模型自动预测的椎体标签;c)增生椎体的标注,在有骨质增生的C3-C7椎体中心位置进行标注,直径10像素,颜色为红色。 图3 颈椎椎体滑脱标注。a)颈椎正中矢状面T1WI
图像;b)分割模型自动预测的椎体标签;c)滑脱椎体的标注,分别在后滑脱的C3和C5椎体中心位置进行标注,直径10像素,颜色为红色。
对于颈椎椎体滑脱的标注,同样由低年资放射科医生在颈椎正中矢状面T1WI图像中对滑脱的椎体进行标注,由另一位高年资放射科专家进行复核。滑脱标准以下位椎体为基准进行4等分,上位椎体的下缘前滑小于1/4下位椎体的上缘即为I°前滑脱,后滑小于1/4下位椎体的上缘即为I°后滑脱,依次类推,滑脱标签标注于椎体的中心位置,直径10像素,对没有滑脱的椎体不予标注(即归为正常组),标注过程如图3所示。将矢状面T1WI图像、椎体的图像标签以及椎体滑脱的标签共同输入3D-ResNet模型,以每一个椎体为一个数据进行模型训练,模型的训练参数为图像预处理参数:size=32×96×96(z,y,x),自动窗宽、窗位。共计239个数据按照8:1:1的比例随机分为训练集(train
dataset,n=189)、验证集(validation dataset,n=25)和测试集(test dataset,n=25),每次读取的图像数量(batch size)为4,学习率(learning rate)为0.0001,训练次数(epoch)为500。
5、椎间盘突出分类模型训练
由年资放射科医生在轴面T2WI上对显示椎间盘的层面进行突出标签的标注,在突出的椎间盘图像正中位置标注直径10像素的圆点,正常或膨出<5mm的椎间盘不予标注(即归为正常组),后由高年资放射科专家进行复核,分类标准(1)椎间盘正常或膨出:椎间盘后缘不超过或均匀超过椎体后缘;(2)椎间盘中央型突出:指髓核突出位于椎间盘后方正中央,较大时可以压迫两侧的神经根;(3)椎间盘旁中央型突出:指突出髓核位于椎间盘后方中央偏于一侧,即位于椎管中央和椎间孔之间,一般压迫一侧的神经根;(4)椎间盘椎间孔型突出:指突出的髓核位于椎间孔或椎间孔外,主要引起神经根损害,标注过程如图4所示。标注完成后将轴面T2WI图像、椎间盘的图像标签及正常/膨出或突出的分类标签共同输入2D-Unet模型,以每一个椎间盘层面为一个数据进行模型训练,模型的训练参数为
图像预处理参数:size=224×224(y,x),自动窗宽、窗位。共计379个数据按照8:1:1的比例随机分为训练集(train dataset,n=301)、验证集(validation dataset,n=39)和测试集(test dataset,n=39),每次读取的图像数量(batch size)为10,学习率(learning rate)为0.0001,训练次数(epoch)为500。
图4 椎间盘突出标注。a)正常或膨出的椎间盘,不予进行标注;b)中央型突出椎间盘,在椎间盘标签中央标注直径为10像素的浅灰色圆点;c)旁中央型突出椎间盘,在椎间盘标签中央标注直径为10像素的深蓝色圆点;d)椎间孔型突出椎间盘,在椎间盘标签中央标注直径为10像素的棕色圆点。
图5 后纵韧带及黄韧带增厚标注。a)颈椎轴面T2WI图像;b)分割模型自动预测的后纵韧带标签(红色为增厚的后纵韧带);c)分割模型自动预测的黄韧带标签(绿色为增厚的黄韧带);d)在增厚的后纵韧带及黄韧带上进行标注,其中后纵韧带增厚的标签为直径3像素的红色圆点,黄韧带增厚的标签为直径3像素的绿色圆点。
5、后纵韧带、黄韧带增厚模型训练
由低年资放射科医生在轴面T2WI上对显示后纵韧带的层面进行增厚标签的标注,在增厚的后纵韧带层面标注直径3像素的圆点,后由高年资放射科专家进行复核,标注标准为
后纵韧带增厚超过2mm,对未增厚的后纵韧带不予进行标注(即归为正常组),过程如图5所示。标注完成后将轴面T2WI图像、后纵韧带的图像标签及增厚分类的标签共同输入2D-Unet模型,以每个后纵韧带层面为一个数据进行模型训练,模型的训练参数为图像预处理参数:size=224×224(y,x),自动窗宽、窗位。共计1892个数据按照8:1:1的比例随机分为训练集(train dataset,n=1510)、验证集(validation dataset,n=191)和测试集(test dataset,n=191
),每次读取的图像数量(batch size)为10,学习率(learning rate)为0.0001,训练次数(epoch)为500。
黄韧带增厚的标注,由低年资放射科医生在轴面T2WI上对显示黄韧带增厚超过2mm的层面进行标注,在增厚的黄韧带层面标注直径3像素的圆点,后由高年资放射科专家进行复核,对未增厚的黄韧带不予进行标住(即归为正常组),过程如图5所示。标注完成后将轴面T2WI图像、黄韧带的图像标签及增厚分类的标签共同输入2D-Unet模型,以每个黄韧带层面为一个数据进行模型训练,模型的训练参数为图像预处理参数:size=224×224(y,x),自动窗宽、窗位。共计343个数据按照8:1:1的比例随机分为训练集(train dataset
,n=271)、验证集(validation dataset,n=36)和测试集(test dataset,n=36),每次读取的图像数量(batch size)为10,学习率(learning rate)为0.0001,训练次数(epoch)为500。
讨论
颈椎病的发病率近年来逐渐升高,且有明显低龄化的趋势。随着AI与DL的发展与进步,AI与DL技术在颈椎MR诊断的应用逐渐增多,除在颈椎的分割和测量方面以外,亦有部分研究关注了AI与DL在颈椎疾病诊断中的应用如椎管受压的分类、脊髓损伤和间盘退变的检测等
。本研究在既有颈椎MR分割模型的基础上尝试对颈椎病的几种主要影像诊断要点(椎体增生、滑脱、椎间盘突出、韧带增厚)进行了全新分类模型的训练,5种模型的诊断效能目前均能够满足临床需求,证明DL方法可以用于颈椎病MR的辅助诊断,可以减轻放射科医生的工作负担,提高日常工作的效率。
既往也有研究对AI在脊柱退行性疾病诊断中的应用进行研究,Michopoulou等使用贝叶斯二元分类器算法开发了基于T2WI图像上椎间盘退变的自动分类系统,该系统根据椎间盘的信号将椎间盘按照正常或退变两种分类进行输出。Raja'S等也使用30个MR的数据集进行了类似的研究。Ghosh等使用SVM进行了类似的研究,他们纳入了35个数据,该模型的最终准确度在80%-94%之间,优于贝叶斯二元分类器算法。Hao等提出了一种基于SVM的方法,除了信号强度和纹理信息外,还纳入了椎间盘的形状信息,以便将其分类为退变或未退变,该方法准确率高达91.6%。Oktay等通过纳入椎间盘T1
WI图像的信息进一步改进了这种方法。Ruiz-Espana等和Castro-Mateos等的研究则进一步取得了突破,他们将分类标准由二分类调整为临床实践中普遍使用的Pfirrmann5分类标准,这两项研究都包括自动分割椎间盘并提取椎间盘信号强度和形状的特征,将其输入分类器后交给ANN进行分类输出。Jamaludin等的研究介绍了一些改进和创新,例如搜集大量椎间盘图像用于训练和测试,该研究纳入了2009名患者的12018个椎间盘进行模型训练,该方法与医生的一致性达到70.1%,这个结果与不同放射科专家之间的准确度相当(70.4%)。此外这种方法在椎体终板病变和骨髓病变中也得到了应用。Niemeyer等使用了深度CNN网络并进一步增加了训练集的大小,最终使自动Pfirrmann分类系统的准确率达到97%。上述的既往研究均为单一的分类模型,尽管部分研究有较大规模的数据量做支撑,但应用大多局限在单一的椎间盘退变分类方面。从广义上来看,既往的相关研究结果临床意义较局限,很难实际应用到临床工作中。
本部分研究的创新之处在于除了采用深度学习方法建立颈椎间盘突出的分类模型之外,还尝试引入了颈椎椎体增生、椎体滑脱、后纵韧带及黄韧带增厚的分类模型,更模拟和接近放射科实际工作中对颈椎病MR的影像诊断流程,具备真正应用于放射科临床工作的潜力。这种整合了多模型DL的方法目前在国内外研究中未见明确报道,具备一定的临床应用前景。
本研究也存在明显的局限性。首先,本研究目前仍为初步研究,仅初步探索了使用DL方法建立颈椎病MR诊断模型的可行性,由于入组数据较少,尚不能使模型达到极高标准的准确率和稳定性。在未来的研究中应进一步增加数据
量来迭代模型,同时还需要进行大规模、前瞻性的外部验证以更进一步提高模型的诊断准确性、稳定性和泛化能力。此外,还需要进一步进行放射科医师的读片实验来对比DL模型的效能与放射科医师的诊断效能。第二,目前本研究训练的DL模型尚属于定性诊断模型,在颈椎病乃至其他脊柱疾病中定量诊断亦非常重要,当脊髓出现髓内肿瘤、血管畸形、炎症等疾病或椎管和脊髓神经系统发育异常时,其形态学上通常会出现相应的膨大或萎缩改变,此时脊髓的形态和其在硬膜囊中的相对位置均会出现变化,此时定量测量及诊断能够更加客观、准确地描述疾病的发生发展规律,也有助于疾病的鉴别诊断,既能够对脊髓中枢神经系统的发育进行定量评价,亦可对颈椎和脊髓疾病及其内科保守治疗的疗效进行定量诊断和动态评估。目前本部分研究纳入的数据量相对较少,在颈椎病异常情况中模型自动分割生成标签的准确率尚不能完全满足自动或半自动测量的需求,因此将来应进一步增加数据量进行模型的迭代,在提高模型分割能力的基础上继续探索研究基于深度学习方法的颈椎病MR影像自动测量模型。第三,颈椎病及相关疾病的诊断不仅包括形态学评估,还应评估信号变化、演进过程,将来应在自动分割和定量测量的基础上进一步自动获得解剖结构的信号强度,并通过信号变化来诊断和鉴别诊断颈椎及脊髓疾病,这亦是MR高软组织分辨力成像的关键优势所在。
综上所述,本部分研究采用深度学习方法建立了颈椎病MR的自动分类诊断模型,对颈椎椎体增生、滑脱、椎间盘突出、后纵韧带及黄韧带增厚进行了分类模型的训练,种模型的诊断效能目前均能够满足临床需求,证明深度学习方法可以用于颈椎病MR的辅助诊断,为未来进一步探索建立颈椎病MR自动诊断模型及结构化报告的植入奠定了基础
作者单位:100034 北京,北京大学第一医院医学影像科