pdf code

Wasserstein Distances for Stereo Disparity Estimation

这篇paper提出了双目匹配的一个新的输出方式与训练方式,作者将其替换到不同的双目匹配以及双目检测的方案中,都得到了直接的性能提升。

输出方式

image

此前的双目匹配是建立在单模预测的假设上的,每一个点预测一个概率,然后期望将结果训练成为一个单峰的高斯分布。

但是作者指出,在物体边界上的点,大概率得到的disparity是一个双模的分布(disparity可能对应前景也可能对应后景),如果直接对结果进行加权平均,就会观察到像P-lidar文章图片中看到的情况,也就是边缘点洒落在物体前景与后景之间。

作者给出的方案是让每一个base disparity独立地计算ground truth与自己的offset以及概率,网络的输出则是直接输出其中概率最高的模态。

训练方式

对于单模态训练,作者提出使用wasserstein距离进行训练: