pdf code

Toward Hierarchical Self-Supervised Monocular Absolute Depth Estimation for Autonomous Driving Applications

本文指出目前的深度预测网络有两大缺陷,一个是对object level的深度预测不准确,另一个是缺乏scale信息。

本文分别提出 DCP layer 以及 DGC layer 分别处理这两个问题.

下图展示了与传统方案的对比

image

PipeLine

image

网络首先使用DCP网络预测实现相对深度预测,然后利用地面与相机之间的几何关系,提取出地面点,然后计算相机的高度,其中位数用来估计scale factor. 得到的scale factor与相对深度相乘得到绝对深度。

基准模型为MonoDepth2, 网络上基于MonoDepth2的修改部分:

  • 总体Loss对低resolution的权重下降了,作者的code是按照
  • DCP Layer,其实就是Densely connected layers.

image

Scale Recovery:

计算surface Norm

image

在图片坐标上,以目标点为中心的附近8个点,如图中的颜色一样分成四组,由同颜色的两个矢量叉乘一共能得到四个法向量的估计,最终估计的法向量为:

code 高度暴力。

地面检测

理想的地面的法向为 

image

作者使用基于角度的相似度函数

由于相机不一定是与地面法向完全垂直的,所以作者留了一个threshold, 代码中这个角度差的阈值为正负五度。

相对高度估计

由上图,可以根据地面点与相机的相对矢量以及其该点的法向计算相机的高度,

tu