Gaussian Process and Variantional Autoencoder
Gaussian Process Prior Variational Autoencoders
基础的 Variantional Autoencoder 假设不同sample 的latent variables 是独立同分布的.
这篇 NIPS paper 指出这个假设并不合理, 对于比如时序图片,不同sample显然不是独立同分布的,需要考虑sample data之间的 covariance.
本文提出的理论直觉就是通过高斯过程来建模不同数据样本的latent variables 的协方差分布.
Formulation
设: 为样本数, 为unique 物体的数量, 是各个物体不同视角的数量, 是每一个每一个样本的 representation. 指 各个物体的 feature. 指每一个视角的特征. 最终指的是每一个样本的latent representation.
latent representation 设为 由视角特征以及物体特征 加噪声映射而得
图片由laten representation 通过一个generator得到:
作者用一个高斯过程来对进行建模, 关键是要建模不同样本的covatiance. 使用CNN作为 generator.
在高斯过程模型中, 输出的概率分布满足:
- 均值为 0
- 与其他所有样本的协方差为 , 其中为特征, 为核函数.
因而有:
根据本文的假设对这个核函数进行拆解,视角矢量仅与其他样本的视角矢量的特征有相关性, 物体类别矢量同理,
将前文的全概率公式进行拆解, 写成期望:
在loss中, 拆解各项,损失函数为
Efficient GP
设计使得高斯的核函数矩阵是低维(low-rank)的,设. 其中.
会有