社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

革命VINS领域 | AB-VINS:深度学习赋能的视觉惯性SLAM系统、高效且鲁棒

3DCV • 7 月前 • 176 次点击  

点击下方卡片,关注「3DCV」公众号
选择星标,干货第一时间送达

今天给大家分享一篇新工作:AB-VINS是一种新型的视觉惯性SLAM系统,它结合了深度学习与传统方法的优势。如果您有相关工作需要分享,欢迎文末联系我们!

读者个人理解

AB-VINS 是一种新型的视觉惯性 SLAM 系统,它结合了深度学习与传统方法的优势。该系统只估计单目深度图的尺度和平移参数(a和b),以及其他一些用于利用多视图信息校正深度的项,从而得到一个压缩的特征状态。尽管AB-VINS是一个基于优化的系统,但其主要VIO线程的效率超过了最先进的滤波器方法,同时还提供了稠密的深度图。此外,AB-VINS采用了一种名为“记忆树”的新型数据结构,其中关键帧位姿是相对定义的,而不是在一个全局框架中,这使得 AB-VINS 在进行闭环时只需要影响少量变量。实验结果表明,AB-VINS具有与最先进的 VINS 系统相当甚至更好的鲁棒性,并且效率更高

论文信息

标题:Visual-Inertial SLAM as Simple as A, B, VINS

主要贡献

1. 提出了一个新型单目视觉惯性SLAM系统AB-VINS
2. 提出了一个紧凑的特征表示方法 AB 特征
3. 引入了一种新颖的数据结构:记忆树

方法

AB-VINS 是一种新型单目视觉惯性SLAM系统,它具有以下特点:

核心技术

  • 深度学习: AB-VINS 利用深度学习技术来估计深度图的比例和偏差参数,从而实现稠密深度估计。
  • 紧凑特征表示: AB-VINS 采用 AB 特征来表示特征位置,这种表示方法只需要少量参数即可描述大量特征,从而提高计算效率。
  • 记忆树: AB-VINS 引入了一种新颖的数据结构:记忆树,用于加速位姿图优化,从而提高闭环检测的效率。

系统架构:AB-VINS 系统主要包括三个线程:

  • 主 VIO 线程: 负责跟踪和局部建图,利用深度学习技术进行稠密深度估计,并使用 AB 特征进行特征表示。
  • 局部映射线程: 负责将关键帧加入局部映射窗口,并进行局部位姿图优化,利用记忆树数据结构来加速优化过程。
  • 全局映射线程: 负责闭环检测和全局位姿图优化,使用 NetVLAD 和 SuperPoint 深度网络进行特征匹配,并通过记忆树进行高效优化。

优势

  • 高鲁棒性: AB-VINS 能够在低运动、IMU 饱和和存在坏闭环等挑战性场景下保持稳定运行。
  • 高效率: AB-VINS 的主 VIO 线程效率非常高,能够满足实时性要求。同时,记忆树数据结构能够有效加速闭环检测的优化过程。
  • 稠密深度信息: AB-VINS 能够提供稠密深度信息,这对于增强现实、虚拟现实和机器人导航等应用非常有用。

应用场景

AB-VINS 可以应用于各种场景,例如:

  • 增强现实 (AR) 和虚拟现实 (VR)
  • 机器人导航
  • 无人机和自动驾驶汽车

实验

AB-VINS 论文在多个数据集上进行了实验,评估了系统的精度、效率和鲁棒性。

1. 精度

  • AR Table 数据集: 在 AR Table 数据集上,AB-VINS 的位姿精度略低于最先进的 VINS 系统,但仍然能够满足 AR/VR 等应用的需求。此外,AB-VINS 的稠密深度估计精度优于 MiDaS 深度网络,并且可以用于下游应用。
  • TUM-VI 数据集: 在 TUM-VI 数据集上,AB-VINS 的位姿精度同样略低于最先进的 VINS 系统,但闭环检测结果显著优于 VIO 结果,表明记忆树数据结构能够有效提高精度。
  • 2D 位姿图数据集: 在 2D 位姿图数据集上,AB-VINS 的记忆树优化算法的精度略低于 iSAM2,但仍然能够产生合理的轨迹。

2. 效率

  • VIO 线程: AB-VINS 的主 VIO 线程效率非常高,能够满足实时性要求,并且优于最先进的优化基 VINS 系统 VINS-Fusion,甚至超过了滤波基 VIO 系统 OpenVINS。
  • 记忆树: 记忆树优化算法的效率非常高,其中 top-down 方法在平均情况下只需要重新线性化常数数量的变量,并且能够在短时间内完成全局位姿计算。

3. 鲁棒性

  • 低运动场景: AB-VINS 能够在低运动场景下成功初始化和估计位姿,而其他系统则无法工作。
  • IMU 饱和: AB-VINS 能够有效处理 IMU 饱和问题,而其他系统则容易失败。
  • 坏闭环: AB-VINS 的 robust χ2 检验能够有效识别并拒绝坏闭环,从而保持系统稳定。

疑问解答

问1:AB-VINS 论文中提到的 AB 特征表示法,相较于传统的稀疏特征点表示法,有哪些优势和劣势?

优势

  • 紧凑性: AB 特征只需要少量参数即可描述大量特征,从而减少状态空间的大小,提高计算效率。
  • 鲁棒性: AB 特征利用深度学习技术进行稠密深度估计,并使用校正项来消除单目深度估计的误差,从而提高系统的鲁棒性。
  • 稠密深度信息: AB 特征能够提供稠密深度信息,这对于增强现实、虚拟现实和机器人导航等应用非常有用。

劣势

  • 精度: AB 特征的精度略低于传统的稀疏特征点表示法,尤其是在高精度应用中。
  • 复杂性: AB 特征的计算过程相对复杂,需要使用深度学习网络进行深度估计和校正项计算。

问2:AB-VINS 中的 Memory Tree 数据结构,相较于传统的因子图优化方法,如何实现更高效的闭环优化?

:Memory Tree 数据结构通过相对位姿定义、子树移动和 top-down 优化算法,实现了更高效的闭环优化,使得 AB-VINS 能够在更少的计算资源下进行闭环检测,并提高系统的实时性。

问3:AB-VINS 在鲁棒性方面做了哪些改进,使其能够在低激励运动、像素噪声、IMU 饱和以及错误闭环等情况下保持稳定?

:AB-VINS 在鲁棒性方面做了以下改进,使其能够在低激励运动、像素噪声、IMU 饱和以及错误闭环等情况下保持稳定:

1. 低激励运动

  • 初始化: AB-VINS 使用了一种简单的初始化方法,只需要第一帧图像即可完成初始化,无需任何运动。
  • 深度学习: AB-VINS 利用深度学习技术进行稠密深度估计,即使在低运动情况下也能够提供有效的深度信息。
  • AB 特征: AB 特征能够利用多视图信息来校正深度,从而提高系统的鲁棒性。

2. 像素噪声

  • 局部映射优化: AB-VINS 的局部映射优化算法采用了鲁棒的 Cauchy 损失函数,并使用 χ2 检验来剔除噪声较大的特征,从而提高系统的鲁棒性。

3. IMU 饱和

  • IMU 饱和检测: AB-VINS 能够检测 IMU 饱和情况,并自动调整 IMU 测量值的噪声协方差矩阵,从而提高系统的鲁棒性。
  • IMU 饱和处理: AB-VINS 采用了一种鲁棒的预积分方法,能够有效处理 IMU 饱和问题,从而保证系统在 IMU 饱和情况下仍然能够正常运行。

4. 错误闭环

  • robust χ2 检验: AB-VINS 采用了一种 robust χ2 检验来检测和拒绝错误的闭环测量,从而防止错误闭环对系统造成影响。
  • Memory Tree 优化: Memory Tree 优化算法能够有效处理闭环路径上的关键帧,并保证闭环路径的稳定性。

总的来说AB-VINS 通过多种改进措施,使其能够在各种挑战性场景下保持稳定运行,并具有良好的鲁棒性。

总结

总结:AB-VINS通过结合深度学习和新颖的数据结构,实现了高效、鲁棒且能够提供稠密深度信息的视觉惯性SLAM系统,为VINS领域带来了新的思路和方法。

:今天给大家分享一篇新工作:AB-VINS是一种新型的视觉惯性SLAM系统,它结合了深度学习与传统方法的优势。如果您有相关工作需要分享,欢迎联系:cv3d008

本文仅做学术分享,如有侵权,请联系删文。

3DCV技术交流群

目前我们已经建立了3D视觉方向多个社群,包括2D计算机视觉大模型工业3D视觉SLAM自动驾驶三维重建无人机等方向,细分群包括:

2D计算机视觉:图像分类/分割、目标/检测、医学影像、GAN、OCR、2D缺陷检测、遥感测绘、超分辨率、人脸检测、行为识别、模型量化剪枝、迁移学习、人体姿态估计等

大模型:NLP、CV、ASR、生成对抗大模型、强化学习大模型、对话大模型等

工业3D视觉:相机标定、立体匹配、三维点云、结构光、机械臂抓取、缺陷检测、6D位姿估计、相位偏折术、Halcon、摄影测量、阵列相机、光度立体视觉等。

SLAM视觉SLAM、激光SLAM、语义SLAM、滤波算法、多传感器融合、多传感器标定、动态SLAM、MOT SLAM、NeRF SLAM、机器人导航等。

自动驾驶:深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器、多传感器标定、多传感器融合、自动驾驶综合群等、3D目标检测、路径规划、轨迹预测、3D点云分割、模型部署、车道线检测、BEV感知、Occupancy、目标跟踪、端到端自动驾驶等。

三维重建:3DGS、NeRF、多视图几何、OpenMVS、MVSNet、colmap、纹理贴图等

无人机:四旋翼建模、无人机飞控等

除了这些,还有求职硬件选型视觉产品落地最新论文3D视觉最新产品3D视觉行业新闻等交流群

添加小助理: dddvision,备注:研究方向+学校/公司+昵称(如3D点云+清华+小草莓), 拉你入群。

▲长按扫码添加助理

3D视觉技术星球

3D视觉从入门到精通知识星球、国内成立最早的3D视觉学习交流社区。包括:星球视频课程近20门(价值超6000)项目对接3D视觉学习路线总结最新顶会论文&代码3D视觉行业最新模组3D视觉优质源码汇总书籍推荐编程基础&学习工具实战项目&作业求职招聘&面经&面试题等等。欢迎加入3D视觉从入门到精通知识星球,一起学习进步。

▲长按扫码加入星球
3D视觉课程官网:www.3dcver.com

3DGS、NeRF、结构光、相位偏折术、机械臂抓取、点云实战、Open3D、缺陷检测、BEV感知、Occupancy、Transformer、模型部署、3D目标检测、深度估计、多传感器标定、规划与控制、无人机仿真、三维视觉C++、三维视觉python、dToF、相机标定、ROS2、机器人控制规划、LeGo-LAOM、多模态融合SLAM、LOAM-SLAM、室内室外SLAM、VINS-Fusion、ORB-SLAM3、MVSNet三维重建、colmap、线面结构光、硬件结构光扫描仪,无人机等

▲长按扫码学习3D视觉精品课程

3D视觉相关硬件

图片说明名称
硬件+源码+视频教程精迅V1(科研级))单目/双目3D结构光扫描仪
硬件+源码+视频教程深迅V13D线结构光三维扫描仪
硬件+源码+视频教程御风250无人机(基于PX4)
硬件+源码ROS-SLAM两轮差速小车NanoBot
配套标定源码高精度标定板(玻璃or大理石)
添加微信:cv3d007或者QYong2014 咨询更多
欢迎点个在看,你最好看!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/171258
 
176 次点击