利用CNN对6种细菌的SERS光谱进行物种识别,每种细菌共3000张SERS光谱,建立物种数据库。对于部分含有MDR菌的菌型,按照等数原则,随机选取每株菌相同数量的SERS谱,以保证每种病原菌的SERS谱总数为3000张。然后将这些数据用于训练和测试CNN物种识别模型,其平均识别准确率为97.8±1.4%(图3a)。P. aeruginosa的鉴定准确率最低,为95.8%,其中大部分被误认为粪肠杆菌和大肠杆菌。对于大肠杆菌,也存在粪肠杆菌和铜绿假单胞菌的错误分类,这可能是由于铜绿假单胞菌中的一些耐多药菌与其他类型的细菌光谱相似所致。
以上结果表明,所建立的CNN模型可以通过SERS光谱分析准确识别不同的细菌。此外,还将CNN模型与一些典型的数据分析方法进行了比较,以分析和识别相同的数据。结合主成分分析和KNN算法构建分类识别模型PCA-KNN的平均分类准确率为85%,低于CNN,说明CNN算法是细菌SERS光谱分类识别的最佳模型。
利用CNN对大肠杆菌、粪肠杆菌和铜绿假单胞菌的敏感和耐药菌株进行SERS谱鉴定。为每一种细菌建立独立的分类模型,检验CNN是否能够识别引起尿路感染的致病菌的药敏。如图3b所示,大肠杆菌、粪肠杆菌和铜绿假单胞菌的检测准确率均在95%以上,表明所建立的方法具有较高的准确性。其中粪肠杆菌的检测准确率为100%。这可能与粪肠杆菌的形状和大小有关,粪肠杆菌呈球形,具有球对称,尺寸一般小于1 μm,小于物镜焦斑直径。因此,在测量中,与其他细菌相比,我们更容易获得粪肠杆菌完整个体的SERS光谱,其波动范围窄,重现性好。
在这项工作中,还分别使用CNN训练和测试了三种MDR菌株的SERS光谱分类模型。大肠杆菌5株,铜绿假单胞菌5株,粪肠杆菌2株,均有3000个SERS光谱。上述12株菌株均表现出不同程度的抗生素耐药,图3c为分类和识别结果,其中粪肠杆菌的平均识别准确率最高,为100%,大肠杆菌的平均识别准确率次之,为99%,铜绿假单胞菌的平均识别准确率最低,为97%。
本研究在获得SERS谱后,应用CNN算法构建高灵敏度识别模型,对尿路感染细菌进行物种、药敏、多药耐药三个层次的逐步分类。该方法既能鉴定病原菌的药敏,又能鉴定病原菌的多药耐药情况,对临床用药具有重要的参考价值。