南方医科大学附属广东省人民医院王亮教授团队联合徐州医科大学医学信息与工程学院吴响教授团队在环境领域权威期刊《Environmental Technology & Innovation》(JCR
1区,影响因子6.7)发表题为“Simultaneous
detection and quantification of ciprofloxacin, doxycycline, and levofloxacin in
municipal lake water via deep learning analysis of complex Raman spectra” 的研究论文。该研究开发了一种创新的方法,结合表面增强拉曼散射(SERS)技术和深度学习算法模型,实现快速检测和定量分析湖泊水体中的抗生素混合物,包括环丙沙星、多西环素和左氧氟沙星。SERS技术具有高灵敏度和快速检测的特点,通过构建卷积神经网络(CNN)和非负弹性网络(NN-EN),实现了抗生素混合物中各组分浓度比例的精准预测。研究团队从中国某人工湖的四个采样点采集湖水样本,并通过添加抗生素进行实验,验证了方法的准确性和适用性。结果表明,该方法能够高效区分混合抗生素的种类及其比例,为水体抗生素污染的监测提供了一种低成本、高效且实用的新工具。本研究不仅在环境抗生素污染的快速检测领域具有重要意义,还为抗生素污染治理和公共健康保护提供了技术支持,同时展示了SERS技术结合深度学习在复杂环境样本分析中的巨大潜力。
抗生素污染已成为全球水体环境中备受关注的难题。由于广泛使用,抗生素残留经人类和畜牧业排放进入水体,显著破坏生态系统的平衡,并通过食物链对人体健康构成威胁。研究表明,湖泊水体因水流停滞,往往成为抗生素残留的主要聚集地,而现有的高效液相色谱(HPLC)和质谱检测技术尽管具有高灵敏度,但操作复杂且成本高昂,难以实现大规模常规监测。本研究提出一种基于表面增强拉曼散射(SERS)结合深度学习技术的方法,实现湖泊水体中常见抗生素环丙沙星(Ciprofloxacin)、 多西环素(Doxycycline)和左氧氟沙星(Levofloxacin)的同时检测与定量分析。通过卷积神经网络与非负弹性网络的深度结合,研究团队开发了一种低成本、高效率的抗生素混合物识别方法,并通过金龙湖四个采样点的实验验证了该方法的通用性与可靠性。
本研究选取了位于中国江苏省徐州市的人工湖—金龙湖作为研究对象,在湖泊中设置了四个采样点(图1),以确保样本具有地理和环境的多样性。每个采样点的位置均通过精确记录其经纬度坐标,以确保采样点分布的准确性,并在采样前对设备进行彻底清洗,避免交叉污染。水样采集后,所有样本立即储存在4 ℃ 的冷藏条件下,以保持水体成分的稳定性,并用于后续的抗生素检测及物理化学参数分析。。
图1四个湖水采样点的分布示意图。(A) 湖水采样点在国家、省份和城市中的位置示意图;(B) 经纬度为117°16'15'' E, 34°15'52'' N的湖水采样点;(C) 经纬度为117°16'31'' E, 34°15'56'' N的湖水采样点;(D) 经纬度为117°16'30'' E, 34°15'53'' N的湖水采样点;(E) 经纬度为117°16'27'' E, 34°15'57'' N的湖水采样点。
二、抗生素 SERS 光谱的重现性与特征峰解析
在本研究中,利用SERS
技术对湖水中三种常见抗生素(环丙沙星、多西环素和左氧氟沙星)的光谱特性进行了深入分析。实验结果表明,SERS 技术在低浓度条件下(10⁻⁷ M)依然能够获得显著增强的拉曼信号(图2A-C)。基于各抗生素的特征拉曼峰(环丙沙星1392 cm⁻¹、多西环素1320 cm⁻¹、左氧氟沙星1404 cm⁻¹),建立了校准曲线,表明抗生素浓度与拉曼信号强度之间具有良好的线性关系(图2D-F)。进一步对抗生素的 SERS 光谱进行了特征峰进行解析,结果显示混合样本的光谱既包含共性特征峰,也呈现出每种抗生素的独特特征峰,为复杂混合物的成分区分提供了重要依据。
图2 不同浓度单一抗生素 SERS 光谱的线性关系。(A-C) 环丙沙星、多西环素和左氧氟沙星在湖水中浓度为 10⁻⁴ M 至 10⁻⁸ M 时的 SERS 光谱;(D-F) 环丙沙星、多西环素和左氧氟沙星在湖水中的浓度与 SERS 信号强度之间的线性相关性。误差线表示 n = 5 组重复样本的标准误差。
三、数据增强与模型评估
为提高混合样本中纯抗生素含量量化模型的精度并降低过拟合风险,本研究采用数据增强技术扩充训练数据集。通过计算增强光谱与原始光谱的 Pearson 相关系数验证数据一致性,结果显示三种抗生素的相关系数均超过 95%(图3A-C)。基于CNN模型分别为环丙沙星、多西环素和左氧氟沙星构建了单独的分类模型。模型表现出较高的分类性能,准确率、精确率、召回率和 F1 分数均接近1,5 折交叉验证(5Fold-CV)显示模型性能下降至约 80%(图 3D-F)。
图3纯抗生素的数据增强及深度学习模型性能评估。(A) 环丙沙星的数据增强;(B) 多西环素的数据增强;(C) 左氧氟沙星的数据增强;(D-F) 三种抗生素模型的评估指标得分。
四、数据集描述与比例预测
本研究系统性地将三种纯抗生素(环丙沙星、多西环素和左氧氟沙星)按照比例混合,在湖水中的四个采样点生成了 11 种不同的组合(图 4A-D),结果显示随着某抗生素浓度增加,其光谱特征峰逐渐增强。
图4 环丙沙星、多西环素和左氧氟沙星在四个湖水采样点不同比例混合的SERS光谱。
为实现混合物比例的准确预测,开发了结合多种光谱预处理方法与NN-EN的通用模型。实验结果表明,模型在四个采样点的任务中表现稳定,真阳性率(TPR)和准确率(ACC)为 100%,假阳性率(FPR)为 0%。此外,为评估模型在不同采样点的预测精度和稳定性,计算 95% 置信区间(CI)以及预测误差的均方根误差(RMSE)。总体上,模型在大多数情况下表现出良好的预测性能,但在抗生素混合比例极端或不同采样点样本特性差异较大时,RMSE 值有所升高(表1)。
表1
不同湖水采集点不同比例环丙沙星、多西环素、左氧氟沙星的预测结果。
本研究利用 SERS 技术结合先进的计算方法成功实现了对湖水样本中抗生素残留的识别与定量分析。结果表明,抗生素残留浓度与SERS信号中特征峰强度之间具有较强的线性相关性。此外,结合CNN模型与NN-EN的方法,能够有效预测从四个湖水采样点采集的抗生素混合物中三种不同抗生素的比例。研究结果证明,该方法能够准确识别 SERS 光谱中抗生素混合物的成分及其比例。基于此,我们提出了一种湖水抗生素定量分析方法,可实现对水质的及时监测。该方法在水体抗生素残留水平的常规监测中展现了良好的应用潜力,为减少抗生素积累提供了针对性的干预手段,从而在保护湖泊生态平衡和保障公众健康方面发挥了重要作用助。