pdf

Localization-aware Channel Pruning for Object Detection

这篇论文尝试解决的是针对2D物体检测的channel pruning问题.localization-aware的动机起源于DCP.pdf,原channel prunning的问题的做法是选择channel并线性重建,减少输出的l2变化,问题划归为lasso regression.但是channel中有很多是冗余的,输出也是冗余的,完整的复原并不一定是最有效的,DCP那篇则是基于这个问题对分类问题进行优化,本文则是基于这个问题,在object detection(主要基于SSD算法)中,针对位置输出进行优化。过程中提出了 contextual ROIAlign层.

本文建议在使用这篇文章之前先补充DCP.pdf

总体pipeline

image

Contextual ROIAlign Layer

image

default bounding box不一定包含足够的语义信息,所以需要更大的框框.

其中分别为GroudTruth/Proposal box, 的关系如图

image

Channel Pruning Loss

作者的思路是形成一个为目标检测任务的loss,从而可以用这个附加网络的梯度辅助模型修剪。

这里用指代Generalized IoU

接着定义为交叉熵,为附加网络的分类损失,为附加网路的定位损失。

其中为权重参数。

Localization-aware Channel Pruning

总体算法概述 image

第三行指代截止到现在修剪后的loss, 第四行指对附加网络和修剪到第i层的model进行训练 第五行: 为重建误差 第六行指,求出关于当前层W的梯度。 指代第输出channel的梯度均方和,只保留梯度最大的几个channel 第七行指