pdf

Self-Supervised Learning for Stereo Matching with Self-Improving Ability

这篇paper关注的是自监督双目匹配。重点在于不需要点云监督,而且在新场景测试的时候可以重新迭代进步。

网络结构

image

其中的feature mapping

image

左右目分别运行对称的网络。

损失函数

左右图生成一致性

分三项,分别是SSIM,左图,图片梯度。

def SSIM(self, x, y):
    C1 = 0.01 ** 2
    C2 = 0.03 ** 2

    mu_x = nn.AvgPool2d(3, 1)(x)
    mu_y = nn.AvgPool2d(3, 1)(y)
    mu_x_mu_y = mu_x * mu_y
    mu_x_sq = mu_x.pow(2)
    mu_y_sq = mu_y.pow(2)

    sigma_x = nn.AvgPool2d(3, 1)(x * x) - mu_x_sq
    sigma_y = nn.AvgPool2d(3, 1)(y * y) - mu_y_sq
    sigma_xy = nn.AvgPool2d(3, 1)(x * y) - mu_x_mu_y

    SSIM_n = (2 * mu_x_mu_y + C1) * (2 * sigma_xy + C2)
    SSIM_d = (mu_x_sq + mu_y_sq + C1) * (sigma_x + sigma_y + C2)
    SSIM = SSIM_n / SSIM_d

    return torch.clamp((1 - SSIM) / 2, 0, 1)

规范化

平稳性,图片二次梯度

循环一致性

image

Maximum-Depth Heuristic

最小化dispairty的总和。

自提升

在测试的时候可以进一步fine-tune网络。性能还能提升