Arbitrary Style Transfer in Real-time with Adaptive Instance Normalization
这篇文章提出了Style Transfer相当长一段时间的SOTA或者baseline,也就是AdaIN模块。
背景知识 Normalization 回顾
本文除了基础的BatchNorm(完整batch)以及InstanceNorm(不考虑batch)还回顾了Conditional Instance Normalization(CIN).
CIN层为每一个style学习一套InstanceNorm的参数
实验可知对CIN网络而言,BN的结果总体不如IN的结果
Adaptive Instance Normalization
AdaIN公式:
其中 为content input而为style input.本质上来说就是对content instance使用instance normalization 转换为style instance的均值与方差.
网络结构与训练方法
网络结构如图
将两张图同时输入到VGG encoder中,执行AdaIN,对content结果decode得到输出图
Content Loss
利用VGG encode style-transfered picture,
其中为encoder, 为decoder, 为AdaIN处的输出,也就是对特征向量取L2误差
Style Loss
以前有使用格拉姆矩阵的相关性误差的,这里超链接给的例子来自于keras的例子。本文这里使用另一个别人提出的误差
其中指求均值与方差,指VGG-19中的某一层的输出。