Localization-aware Channel Pruning for Object Detection
这篇论文尝试解决的是针对2D物体检测的channel pruning问题.localization-aware的动机起源于DCP.pdf,原channel prunning的问题的做法是选择channel并线性重建,减少输出的l2变化,问题划归为lasso regression.但是channel中有很多是冗余的,输出也是冗余的,完整的复原并不一定是最有效的,DCP那篇则是基于这个问题对分类问题进行优化,本文则是基于这个问题,在object detection(主要基于SSD算法)中,针对位置输出进行优化。过程中提出了 contextual ROIAlign层.
本文建议在使用这篇文章之前先补充DCP.pdf
总体pipeline
Contextual ROIAlign Layer
default bounding box不一定包含足够的语义信息,所以需要更大的框框.
其中分别为GroudTruth/Proposal box, 与的关系如图
Channel Pruning Loss
作者的思路是形成一个为目标检测任务的loss,从而可以用这个附加网络的梯度辅助模型修剪。
这里用指代Generalized IoU
接着定义为交叉熵,为附加网络的分类损失,为附加网路的定位损失。
其中为权重参数。
Localization-aware Channel Pruning
总体算法概述
第三行指代截止到现在修剪后的loss, 第四行指对附加网络和修剪到第i层的model进行训练 第五行: 为重建误差 第六行指,求出关于当前层W的梯度。 指代第输出channel的梯度均方和,只保留梯度最大的几个channel 第七行指