FCOS: Fully Convolutional One-Stage Object Detection
本文是anchor-free object detection的又一代表作品,其有效性应该是显著,因为在后来的其他object detection论文中进行了使用,包括DSGN. 本文在mmdetection中也有复现,比利用maskrcnn-benchmark的官方代码要容易读,其在mmdetection中的主要代码在fcos_head.py
FCOS - Output definition
对于图片中的每一个点,如果它是正样本,那么直接回归它到四个边界的距离。这个是FCOS主要的回归形式,以此来替代anchor box
FCOS - Ground Truth seperation
这一段再补充说明基于retinanet的FCOS在无anchors的情况下如何分配ground truth,由于Retinanet的结构性质,不同层被分配不同的感受野任务,作者hardcode了,对于第层的网络,只负责 的object,其中为根据FPN感受野的hardcode值,具体看论文。
每一个点,只要它在对应object的框内,它就是正样本,如果同一个scale内一个点仍对应多个gt object,就以面积最小的为target.
FCOS - centerness
由于分配了大量的正样本,这样直接训练的结果是有大量的边缘点给出错误的bbox,作者进一步补充,要求网络对每一个点给出一个"centerness"的估计,其目标值为:
在inference的时候,根据centerness进行NMS而非分类置信度,最终能显著的提升结果。