IoU Nets
本文会尝试同时融合两篇idea相似的论文的想法,第一为 Acquisition of Localization Confidence for Accurate Object Detection。第二篇为 IoU-aware Single-stage Object Detector for Accurate Localization
其中第一篇论文由Iou-uniform-rcnn提及,两篇论文的核心idea都是涉及在NMS中使用IoU预测值替代classification score
Acquisition of Localization Confidence for Accurate Object Detection
这篇论文的内容比较多,首先是IoU-guided NMS,其次是IoU-guided optimization,最后是PrROI pooling.
第一部分是在RoI后增加一个分支预测IoU值,在NMS时以IoU替代分类分数
IoU-guided optimization
这里做的是在提供proposal给RCNN提供输入时,用梯度优化微调FPN输出的bounding box,目标函数是RCNN输出的IoU,直觉意思是微调FPN的bounding box,最优化RCNN预测的IoU。在IoU预测准确的前提下,这样可以优化FPN的proposal。
PrROI pooling
PrROI已经开源
这个称为Precise RoI Pooling
IoU-aware Single-stage Object Detector for Accurate Localization
这篇稍微简单将IoU NMS用在one-stage的retina net中。如图
损失函数如下
主要在于IoU的训练方式用的是Binary Cross Entropy(应当假设原IoU为sigmoid)