pdf

Gaussian Process and Variantional Autoencoder

Gaussian Process Prior Variational Autoencoders

pdf code

基础的 Variantional Autoencoder 假设不同sample 的latent variables 是独立同分布的.

这篇 NIPS paper 指出这个假设并不合理, 对于比如时序图片,不同sample显然不是独立同分布的,需要考虑sample data之间的 covariance.

本文提出的理论直觉就是通过高斯过程来建模不同数据样本的latent variables 的协方差分布.

Formulation

image

设: 为样本数, 为unique 物体的数量, 是各个物体不同视角的数量, 是每一个每一个样本的 representation. 指 各个物体的 feature. 指每一个视角的特征. 最终指的是每一个样本的latent representation.

latent representation 设为 由视角特征以及物体特征 加噪声映射而得

图片由laten representation 通过一个generator得到:

作者用一个高斯过程来对进行建模, 关键是要建模不同样本的covatiance. 使用CNN作为 generator.

在高斯过程模型中, 输出的概率分布满足:

  • 均值为 0
  • 与其他所有样本的协方差为 , 其中为特征, 为核函数.

因而有:

根据本文的假设对这个核函数进行拆解,视角矢量仅与其他样本的视角矢量的特征有相关性, 物体类别矢量同理,

将前文的全概率公式进行拆解, 写成期望:

在loss中, 拆解各项,损失函数为

Efficient GP

设计使得高斯的核函数矩阵是低维(low-rank)的,设. 其中.

会有