pdf code

Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization

这篇文章提出了Style Transfer相当长一段时间的SOTA或者baseline,也就是AdaIN模块。

背景知识 Normalization 回顾

本文除了基础的BatchNorm(完整batch)以及InstanceNorm(不考虑batch)还回顾了Conditional Instance Normalization(CIN).

CIN层为每一个style学习一套InstanceNorm的参数

实验可知对CIN网络而言,BN的结果总体不如IN的结果

Adaptive Instance Normalization

AdaIN公式:

其中 为content input而为style input.本质上来说就是对content instance使用instance normalization 转换为style instance的均值与方差.

网络结构与训练方法

网络结构如图

image

将两张图同时输入到VGG encoder中,执行AdaIN,对content结果decode得到输出图

Content Loss

利用VGG encode style-transfered picture,

其中为encoder, 为decoder, 为AdaIN处的输出,也就是对特征向量取L2误差

Style Loss

以前有使用格拉姆矩阵的相关性误差的,这里超链接给的例子来自于keras的例子。本文这里使用另一个别人提出的误差

其中指求均值与方差,指VGG-19中的某一层的输出。