pdf code

Dynamic Refinement Network for Oriented and Densely Packed Object Detection

这篇paper处理的是SKU数据集,特点是物体数量很大,很密集,且作者进一步提出SKU110K-R数据集,bounding box带有旋转量,这个数据集来自于SKU110K直接选择,提出这个数据集的意义在于促进densely oriented bounding box的研究。网络结构上提出了几个新的模块,适应不同的物体形状与类别特定的信息。

网络结构

网络思路基于 Object as Point.

image

网络会预测角,bounding box由旋转得来

值得注意的地方在于由于object as point的 NMS只是对heatmap进行简单的maxpooling计算,因而不需要计算rotated IoU,速度快而不容易有错误,而且object as point的输出点比较密集,因而很适合这个密集的数据集。

额外的网络模块

Feature Selection Module & Rotation Convolution

image

这里是借助了deformable convolution的思路与代码

使用网络输出一个转角,修改原始convolution对应的offset,

特征选择使用的是简单的attention block.

Dynamic Refinement Head

image

image

Dataset

image