pdf code

Gated2Depth: Real-Time Dense Lidar From Gated Images

这篇论文使用Gated Image估计稠密的深度图。亮点有几个,首先是对Gate Imaging的原理认识以及使用,其次是其用稀疏点云作为监督来源,进行半监督的学习.

Gated Imaging基本原理

image

Gated camera本质上是一个主动的TOF相机,与激光源时间同步,系统可以控制相机的快门接受光照的时间,如上图,每一张图里面只会显示一个距离区间内的物体,而每一张图中每一个像素的数值代表对应像素的反射的激光强度。

更多信息可以看NIT的产品pdf以及wiki页面

Depth Learning Pipeline

image

输入到网络的输入是3层的原始gated image.使用生成网络输出多尺寸的深度估计图,结构采用的是经典的Unet(pdf),有三个loss函数。其中第一个损失是是稀疏的,用稀疏的激光雷达点云图进行监督。后两个loss在后文描述

图中有一个分类器D,类似于PathchGAN.

在第一个训练阶段,本文用仿真合成的数据用类似Least-square GAN的方式,让这个分类器网络判断一张深度图是来自于合成的正确图还是来自于Generator的输出。

第二个阶段,本文用真实gated image,然后保持分类器固定,同时用激光雷达点云进行监督训练,

损失函数

直接监督

其中还有指代在指在对应尺度上的损失。每一个尺度都是使用损失

在使用合成训练集训练时,所有像素都有对应的误差值。在使用实际的损失函数时,只有部分像素有监督,如下

光滑损失

其中为输入图片的强度值,是深度值,

对抗损失