重参数化
重参数化
PDF中不含参数求函数期望的梯度
由期望的积分定义:
可以将求导号移入积分:
这个形式下可以直接使用蒙特卡罗方法进行求解
PDF中含参数求函数期望的梯度
如何解决
解决方法一: log trick
定义
对两边关于
移项得到
由上述恒等式代入
即
这就是打分函数 score function形式
这个方法具有通用性,但问题是方差很大
解决方法二: 重参数化
常见的目标形式是:
但直接对这个期望求梯度比较麻烦,因为
重参数化的核心思想是把依赖
即:
于是期望可以写成:
- 先证明
:
证明完毕后将上述结果代入:
对
这时我们可以 直接对被积函数求导再采样估计,避免了方差巨大的 score function
特点:方差小,但是并不通用
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.







