深度学习 (Deep Learning, DL) 算法擅长挖掘数据间的非线性关系。基于深度学习算法的化学传感分析,对于复杂体系分析有巨大的优势。然而,由于网络结构的复杂性,深度学习一般被视为黑箱模型,难以对模型的决策机理进行解释。研究深度学习模型的决策机理,有助于人们理解分析数据采集机制的合理性、分析响应机理。然而,现有的深度学习辅助分析研究主要关注数据采集、算法运用与模型结果分析,而关于深度学习模型决策机理的研究鲜有报道。针对深度学习决策机理分析的空白,暨南大学李风煜教授课题组构建了一种可解释深度学习辅助荧光可视化传感阵列的分析方法(图1),用于环境水系中氨基糖苷类抗生素(Aminoglycoside Antibiotics, AGs)的定性定量分析。借助可视化成像技术获取待测物的荧光指纹图像的基础上,采用不同的深度学习和机器学习算法对数据进行分析。采用了类激活图(Class Activation Mapping, CAM)算法对卷积神经网络(Convolutional Neural Network, CNN)模型的决策机理进行可视化分析,以此解释化学传感信息与深度学习模型的关系。通过对深度学习运算过程的研究与解释,可以揭示传感器设计机制,进而推动传感器设计的进化。可解释深度学习辅助分析方法建立了一种“端到端”的方法,为今后复杂传感器设计、复杂化学机制分析乃至发现新的科学原理或模型,提供新的方法学建议与范例。图1. 采用深度学习辅助荧光可视化传感阵列方法对氨基糖苷类抗生素进行检测分析的机理图作者设计了一种由三种荧光指示体系 [邻萘二甲醛(NDA)、茜素红-2-氨基乙基联苯基硼酸酯(ARS-DPBA)、磺酰罗丹明B(SRB)] 组合而成的荧光传感阵列,以不同AGs的荧光指纹图像为基础,作者首先分别采用线性判别分析(LDA)和决策树(DT)算法对去离子水环境中的AGs数据进行分类,六种AGs能完全分开(准确率100%)。决策树模型特征重要度分析显示,传感阵列的三种传感体系都对分类贡献了不同程度的作用,由此验证了荧光传感阵列对简单溶液环境中AGs的传感性能。对不同浓度和环境水系(生活用水、工业用水、医疗用水、生活用水和水产养殖用水)的AGs进行抗干扰检测,以进一步阐明该方法在实际环境水系中检测的有效性(图2)。对2种通用的深度学习算法和8种机器学习算法的建模性能进行评估,深度学习算法对AGs的分类准确度均能达到100%。图2. 十种通用算法的建模性能比较和类激活图可视化决策机理的结果作者采用了CAM算法对卷积神经网络CNN模型的注意力机制进行可视化分析,研究深度学习模型的决策机理。通过初步分析与研究,挖掘出对CNN模型决策贡献度较大的化学传感信息,以该结果为基础进行特征提取,仅保留贡献度大的信息并重新建模,最终也能达到99.76%的分类准确度。不同的算法构建回归模型来预测不同AGs的浓度。其中CNN回归模型,其R2都能达到0.990以上,浓度预测值与真实值的误差较小,定量分析的检出限达到1.34 ppm,由此显示了CNN算法挖掘数据非线性关系的优异性能。相关成果发表在国际化学权威杂志Analytical Chemistry 上。Explainable Deep Learning-Assisted Fluorescence Discrimination for Aminoglycoside Antibiotic IdentificationXiaoqing Tan, Yongpeng Liang, Yingying Ye, Zhihao Liu, Jianxin Meng, and Fengyu Li*Anal. Chem., 2022, DOI: 10.1021/acs.analchem.1c03508https://www.x-mol.com/university/faculty/113026
点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊