Summaries for several ICLR 2021 papers

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

pdf code pytorch-code

image

这篇paper使用transformer进行视觉分类。

具体做法上,对于224x224的图片可以分成16x16的一系列小块,每一个小块带上一维的positional encoding放入transformer中,单层连接:

整个网络不使用卷积,但是能在大大小小的分类数据集上达到卷积的水平.

What Matters for On-Policy Deep Actor-Critic Methods? A Large-Scale Study

pdf

这篇文章综合做了很细致很大规模的实验,认真地分析了究竟是哪些因素促进了on-policy 深度强化学习 AC算法的性能。本文规范化地实现了50多个设计因素,然后再五个不同的环境下进行了大量的实验。

一个知乎博客收集了其中的实验结论

How Neural Networks Extrapolate: From Feedforward to Graph Neural Networks

pdf

这篇paper尝试解答了全连接ReLU网络以及GNN是如何extrapolate的,也就是在什么情况下,全连接以及GNN能学习到training distribution之外的正确结果,并给出了理论证明.

image

Image Augmentation Is All You Need: Regularizing Deep Reinforcement Learning from Pixels

pdf

这篇paper发现简单的数据增强也能实现增强学习的SOTA.

image