pdf

MixMatch: A Holistic Approach to Semi-Supervised Learning

这篇paper介绍了MixMatch算法,其是一个性能很强的 semi-supervised learning方法。在这里的semi-supervised指的是使用较少的labelled data以及大量的unlabel data进行训练。

有一个比较清晰的知乎文章,介绍了这个算法的来龙去脉.

Primary Algorithms

自洽正则化 (Consistency Regularization)

这个是一个通用的扩展数据的方案, 也在 SSL-RTM3D中使用了,也就是使用数据增强后,网络对增强后的数据的预测应该是自洽的,作者用这个方法来训练网络在未标注数据上的泛用性.

这里虽然是要求概率上靠拢,但是使用的并不是基于概率值与熵的损失函数,而是要求 损失,这里突出的是 损失对常数不敏感,因而是一个更强的约束.

Entropy Minimization

对于没有标注的数据,作者的方案是让它数据增强多次(K=2),对输出概率矢量取均值,其中概率最大值为预测的 pseudo-label. 作者指出需要降低预测的熵值,鼓励网络做出判断。

实现上包含 - Label Guessing - Sharpening:

MixUp

这个是一个重要的regularization 算法, 本站在bag of freebies for object detection中有引入. 作者这里对labled data, unlabeled data 在训练的时候分别进行 mixup.

框架

image