pdf code

VOLDOR: Visual Odometry from Log-logistic Dense Optical flow Residuals

这篇paper讨论的是视觉SLAM问题的解决,重点区别点:

  • 稠密光流替代稀疏特征点匹配
  • 把rigidness map作为概率推理的一部分,用于区分出运动中的物体像素
  • 提出了新的概率分布拟合以及推理方法.
  • 整个框架高度并行化,适合在GPU上直接完成SLAM任务

image

方法

image

Notations

  • : 图片
  • : 观测到的光流场
  • : 相机姿态.
  • : 深度图
  • : Rigidness 概率图,若说明是动态物体像素.
  • : 投影点的坐标,已知深度,相机姿态以及相机内参,可以得到静态点的投影关系
  • : 由运动产生的光流

对图片观测到的光流场,我们可以表达其概率分布, 其中分为两部分。 - 对于静态像素,其概率与运动/深度得到的光流之间的残差有关 - 对于动态像素,本文假设其为一个均匀分布.

VO问题就被建模成最大化以上likelihood的求解问题.

Fisk Residual Model

用什么概率模型对残差进行建模是本文中一个很重要的选择项.本文做了以下的观察

  • hierarchical的光流方法,光流估计的误差会与光流本身的值成正比(光流像素值越大, 绝对误差值就越大).
  • 作者尝试对现有的多个光流模型的误差特性进行概率拟合,发现是fisk distribution是最好的.

Fisk distribution:

也称为Log-logistic distribution, 指的是一个随机变量的对数值服从logistic distribution. logistic distribution在默认的参数下的累积函数就是我们常用的sigmoid.

而 fisk的概率密度函数为:

推理方法

深度与rigidness的更新

image

算法上首先将初始化为1, 由稠密光流最小二乘法得到初始解. 然后循环地优化相机姿态、深度以及刚度图.

VOLDOR+SLAM: For the times when feature-based or direct methods are not good enough

pdf

这篇paper将前面的VOLDOR扩展为了一个完整的SLAM系统,

image