Kronecker-factored Approximate

1. 约定

默认所有向量都是列向量

2. 目标

Fisher 信息阵

2.1. 证明

把神经网络的每个权重矩阵逐列向量化,然后按一个确定的顺序排列这些向量,得到一个长向量
对于, 令

在后文中用表示

表示按前述顺序排列的第 i 个权重矩阵的向量化表示。
的对角线上的矩阵作为的近似。

记作
都是对称矩阵,对称矩阵的逆矩阵为对称矩阵。

3. Kronecker

3.1. Definition

3.2. Properties

4. Useful formula