在一系列挑战性的 PDE 建模任务中,GridMix 展现出了显著的性能提升。特别是在稀疏空间域和时间外推场景下,其鲁棒性表现尤为突出。该研究已被 ICLR 2025 接收,并获选为 Oral 论文(入选比例 1.8%)。- 论文标题:GridMix: Exploring Spatial Modulation for Neural Fields in PDE Modeling
- 论文地址:https://openreview.net/forum?id=Fur0DtynPX
- 项目主页:https://github.com/LeapLabTHU/GridMix.git
本文研究聚焦于偏微分方程(PDE)建模任务,其核心是近似算子
。该算子根据底层 PDE,将输入空间
中的函数映射到输出空间
。此处
表示定义域为且值域为
的平方可积函数构成的无限维空间。我们重点研究以下两类典型任务:
在几何预测中,每个数据样本分布于不同的空间域
上;而对于动力学建模,所有样本使用相同的训练空间域
,测试时则采用与训练域不同的空间域来评估模型性能。需特别说明的是,
和
均为完整域
的子集。CORAL 是最具创新性的 INR 方法之一,它通过两阶段训练策略解决偏微分方程建模问题。在第一阶段(重构阶段),该框架采用两个神经调控场
和
分别对输入和输出函数进行参数化建模。这些神经调控场作为基础模型,通过不同调制参数实现对不同函数的重构。具体而言,INR 参数
和
在各自函数空间中共享,而调制参数和则是每个函数特有的。这些调制参数通过超网络
和
从低维调控向量
和
中生成:
,
。经训练后,每个函数可由低维调控向量经过共享 INR 重构,其重构误差代表了表示质量。在第二阶段(预测阶段),CORAL 通过处理网络
学习调控编码
与
之间的映射关系。CORAL 利用 SIRENs 作为其 INR 的骨干网络。SIRENs 是具有正弦激活函数的多层感知机,可以表示为:其中,
是网络权重和偏置,
为固定的放缩因子,
,
是空间坐标
下的第层中间表示结果。CORAL 通过平移调控(Shift Modulation)对 SIRENs 进行扩展,将单个函数表示为:其中
表示第 i 层的调制参数。需要注意的是,这种全局调控参数
在不同空间坐标之间是共享的。这一特性限制了神经调控场表示复杂函数空间的能力。正如先前的研究所展示的,全局调控无法捕捉局部细节,因为调控参数的任何变化都会导致重构函数的全局扰动。
图 2. 不同调控方式
基于网格表征的空间调控方法在提升 INR 学习能力方面展现出显著优势,特别是在三维重建领域,其有效性已被广泛验证。受此启发,本文旨在探索空间调控在 PDE 建模中的的应用及其潜在优势。具体而言,空间调控引入了一个基于网格的单通道特征
,其中H和W分别表示网格的空间分辨率(以二维空间为例)。我们可以从该网格特征中提取位置相关的调控参数
。具体步骤如下:给定空间位置
,首先提取围绕该位置的相邻网格点(在二维情况下为四个点)上的特征,其次通过双线性插值计算
。空间调控对应的平移调控方法可表示为:
空间调控引入的位置相关的调控参数虽擅长捕捉局部信息,却难以在稀疏 / 不规则的空间域中建模全局结构,导致未知区域重建质量骤降(如图 3 所示),从而严重制约跨空间域的泛化能力 —— 而这正是鲁棒 PDE 建模的关键要求
图 3. 重建效果对比:观测数据的空间域在训练集之外
为了缓解空间调控在训练空间域上的过拟合问题,GridMix 将空间调控参数表示为一组网格表征的线性组合,如图 2 (c) 所示。首先,GridMix 定义一组网格表征作为基函数,再通过这些基函数的线性组合生成空间调控参数。具体而言,每一隐藏层的网格混合表示为其中
。这里
表示 M 个网格基函数,
为第 i 层的线性组合系数。这些系数通过超网络 h 从低维调控向量 z 中估计得到。网格基函数在不同的函数实例中共享,并与神经调控场一同优化。GridMix 具有以下特点:
在 Naviers-Stokes 和 Shallow-Water 两个动态系统建模任务上,GridMix 相比神经算子方法(DeepONet 和 FNO)、图网络方法(MP-PDE)以及基于全局调控的 INR 方法(CORAL)均取得了显著的性能提升。同时,GridMix 在稀疏空间域的重建和时间外推任务中表现出优越的鲁棒性,进一步验证了其广泛的适用性。图 5. 稀疏空间域下的 Shallow-Water 可视化结果
几何感知推理
在几何感知推理中,模型根据给定的几何结构(例如翼型(NACA-Euler)、水管(Pipe)和弹性材料(Elasticity))预测系统的状态。相较于全局调控方法,GridMix 在所有任务中均实现了性能提升。
图 6. 几何感知推理任务
若觉得还不错的话,请点个 “赞” 或 “在看” 吧CV基础入门班
课程内容:深度学习基础、机器学习基础、数字图像处理、网络设计、模型分析与改进、代码实践等。
课程形式:10次左右的直播(每次大概2小时讲内容)+持续3-4个月的学习反馈、指导、代码实践。
|
网上机构 | CV技术指南入门班 |
授课形式 | 老师单方面授课为主,无法保证所有人学习有效,脑子会了手不会 | 20%直播+80%指导实践,脑子会了,手也得会 |
学习重点 | 所有学员学习任务一致 | 根据学员的情况调整 |
课程价格 | 偏高 | 实惠,性价比高 |
学习内容
| 单一、不成体系 | 系统全面 |
人数 | 100+,无法兼顾所有人 |
10人以内,充分考虑每个学员的学习效果
|
相信大家都深有体会,很多东西都是视频看完了,脑子学会了,但自己上手,就啥也不会。网上辅导机构90%讲内容、10%答疑,且上百人的大班无法有效保证学习效果,而我们仅做小班指导,每个班的人数限制在10人以内,不仅讲具体内容,还包括学习效果的反馈与保证,基本做到讲内容占20%,保证学到位、学明白的反馈占80%,确保大家手也会了。
报名请扫描下方二维码了解详细情况,备注:“入门班报名”。
