PointRend: Image Segmentation as Rendering

这篇来自FAIR的论文将语义分割的后处理理解为计算机图形学的渲染问题，目标就是要提升语义分割在物体边缘的性能，同时控制运算量。采取的方法是先输出一个低分辨率的分割图，再逐步上采样，在上采样的过程中对边缘进行处理，效果像是渲染中逐步精修边缘的视觉效果。

PointRend图示

对于instance segmentation，先输出一个粗糙的语义分割结果( $7\times 7$ )，然后迭代上采样过程，每一个上采样过程包含

选择的要求是寻找probability最接近0.5的点进行处理。

对于一个目标为 $M\times M$ 的分割图，PointRend只需要 $N log_2\frac{M}{M_0}$ 次输出. 对于 $M = 224, M_0 = 7$ 本文选择 $N = 28^2$ ,是原来的 $1/16$ .

本文采用的是一个带偏见的随机采样，算法如下：

训练过程与粗糙的语义分割初始估计是平行的、分离的

抗锯齿效果图: