pdf code

On Multiplicative Integration with Recurrent Neural Networks

这篇论文提出一个在CAPs模型提出的文章中使用的Multiplicative Integration RNN(LSTM, GRU)

本质公式就是

其中表示的是相同形状的矩阵之间的元素对应乘积,称为Hadamard product。

直觉是促进了两个信息源的信息交流,同时优化的梯度流通,这个在时序模型中较为重要。

这个github repo提供了keras的执行。

具体公式的替换如下:

image