Summaries for several CVPR 2021 papers
OTA: Optimal Transport Assignment for Object Detection
OTA 这篇paper提出使用optimal transport assignment 做 ground truth label assignment.
前一年的CVPR一篇paper ATSS 说明RetinaNet和FCOS之间的差距只要在于label的分配上. 这篇paper使用 最优运输.
理解上来说,每一个ground truth作为一个 optimal transport 的 supplier 提供 个正样本, 剩下的由background提供负样本. 然后每一个anchor 作为demander. 分配成本由损失函数决定
这个assign 过程代码上是屏蔽反传的。
Boundary IoU: Improving Object-Centric Image Segmentation Evaluation
定义为距离ground truth与预测的contours距离在以内的像素.
实现上是使用cv2.copyMakeBorder以及cv2.erode。 核心代码
GrooMeD-NMS: Grouped Mathematically Differentiable NMS for Monocular 3D Object Detection
这篇paper提出了一个新的NMS算法,但是仅仅使用了2D等信息,但是仅evaluate在3D算法上.思路是让NMS变得可以训练
Learning Optical Flow From a Few Matches
这篇文章的作者指出新的光流框架,比如RAFT, 会计算每一个像素与整个特征图计算匹配以及光流。但是作者认为这个占用存储太多,不好,但是原来的邻域匹配也还是不尽如人意。作者提出在RAFT的基础上,只存储每个像素的tok-k个匹配。最终形成一个离散的匹配。存储方法也从密集存储变为{值,坐标}存储
UPFlow: Upsampling Pyramid for Unsupervised Optical Flow Learning
这篇paper改善了无监督的光流。
- self-guided upsample.
- Loss guidance at pyramid levels. 其他无监督光流的低分辨率输出层是用GT训练的。本文则是用高分辨率的输出下采样进行训练,
AutoFlow: Learning a Better Training Set for Optical Flow
这篇paper的任务是根据少量非连续图片数据,合成光流训练用的数据。