Ge J, Zhang H, Zuo L, et al. Large-scale rice mapping under spatiotemporal heterogeneity using multi-temporal SAR images and explainable deep learning[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2025, 220: 395-412.
及时、准确地制图水稻种植分布对保障全球粮食安全和实现可持续发展目标2(SDG2)至关重要。从全球视角来看,水稻种植区域在空间分布模式和SAR时间序列特征上表现出高度异质性,这给深度学习(DL)模型的性能、效率和可迁移性带来了巨大挑战。此外,由于深度学习模型具有“黑箱”特性,其可解释性和可信度往往较低。 为应对这些挑战,本研究构建了首个具有时空异质性的SAR水稻数据集,并提出了一种用于水稻区域提取的可解释轻量级模型——eXplainable Mamba UNet(XM-UNet)。该数据集基于2023年Sentinel-1多时相数据,涵盖来自美国、肯尼亚和越南的多样化水稻样本。为增强模型对水稻时间异质性的适应性及其可解释性,本研究设计了一种基于选择性状态空间模型(Selective State Space Model, SSM)的时间特征重要性解释器(TFI-Explainer),用于解析SAR时间序列特征的重要性,并辅助关键时间相位筛选。 针对水稻的空间异质性,本研究设计了注意力沙漏层(Attention Sandglass Layer, ASL),结合卷积神经网络(CNN)和自注意力机制,以增强局部空间特征提取能力。此外,并行视觉状态空间层(Parallel Visual State Space Layer, PVSSL)通过二维选择性扫描(SS2D)进行交叉扫描,以多方向捕捉水稻的全局空间特征,并通过并行计算显著降低计算复杂度。 实验结果表明,XM-UNet能够很好地适应全球范围内水稻的时空异质性,总体精度(OA)和F1分数分别达到94.26% 和 90.73%。该模型极为轻量,仅包含0.190M参数,计算复杂度为0.279 GFLOPs。Mamba的选择性扫描机制促进了特征筛选,并与CNN的结合有效平衡了水稻的局部和全局空间特征。此外,模型的可解释性实验进一步证明,其对时间特征重要性的解释对于指导水稻分布制图至关重要,填补了该领域的研究空白。代码可在github上获取:https://github.com/SAR-RICE/XM-UNet图 1. 研究区的地理位置。
图 2. 研究区内 Sentinel-1 影像数量的时间分布。
图3. 2023 年肯尼亚的实地调查点。
图 4. 异质性水稻数据集展示。(a-c) 分别为美国(USA)、肯尼亚(KEN)和越南(VNM); (1–3) 分别为光学影像、SAR 影像和水稻标注。
图 5. XM-UNet 的整体结构。
图 6. TFI-Explainer 的结构。
图 7. VSSB 中 SS2D 的工作流程。
图 8. 不同国家水稻空间形态的分形维数分布。(a-c) 分别为美国、肯尼亚和越南的分形维数直方图; (d) 混合数据集的堆叠直方图; (e) 美国、肯尼亚和越南的分形维数小提琴图(IQR 为四分位距)。
图 9. 研究区水稻的种植历和后向散射系数曲线。(a) 主要水稻种植历; (b-c) 美国、肯尼亚和越南的后向散射曲线。
图 10. 不同模型结果的详细对比。A/B: 美国,C/D: 肯尼亚,E/F: 越南。
图 11. XM-UNet 在各研究区的时间特征重要性分析。(a) 平均特征重要性的比较; (b) 样本特征重要性的分布。
图 12. 特征增量实验的精度变化趋势。
图 13. 选取时间特征频率的层次热图。
图 14. 2022 年肯尼亚的水稻分布图及主要种植区。
图 15. XM-UNet 内部阶段特征的可视化分析。