VOLDOR: Visual Odometry from Log-logistic Dense Optical flow Residuals
这篇paper讨论的是视觉SLAM问题的解决,重点区别点:
- 稠密光流替代稀疏特征点匹配
- 把rigidness map作为概率推理的一部分,用于区分出运动中的物体像素
- 提出了新的概率分布拟合以及推理方法.
- 整个框架高度并行化,适合在GPU上直接完成SLAM任务
方法
Notations
- : 图片
- : 观测到的光流场
- : 相机姿态.
- : 深度图
- : Rigidness 概率图,若说明是动态物体像素.
- : 投影点的坐标,已知深度,相机姿态以及相机内参,可以得到静态点的投影关系
- : 由运动产生的光流
对图片观测到的光流场,我们可以表达其概率分布, 其中分为两部分。 - 对于静态像素,其概率与运动/深度得到的光流之间的残差有关 - 对于动态像素,本文假设其为一个均匀分布.
VO问题就被建模成最大化以上likelihood的求解问题.
Fisk Residual Model
用什么概率模型对残差进行建模是本文中一个很重要的选择项.本文做了以下的观察
- hierarchical的光流方法,光流估计的误差会与光流本身的值成正比(光流像素值越大, 绝对误差值就越大).
- 作者尝试对现有的多个光流模型的误差特性进行概率拟合,发现是fisk distribution是最好的.
Fisk distribution:
也称为Log-logistic distribution, 指的是一个随机变量的对数值服从logistic distribution. logistic distribution在默认的参数下的累积函数就是我们常用的sigmoid.
而 fisk的概率密度函数为:
推理方法
深度与rigidness的更新
算法上首先将初始化为1, 与由稠密光流最小二乘法得到初始解. 然后循环地优化相机姿态、深度以及刚度图.
VOLDOR+SLAM: For the times when feature-based or direct methods are not good enough
这篇paper将前面的VOLDOR扩展为了一个完整的SLAM系统,