Reinforcement Learning3-GRPO
Reinforcement Learning2-DPO
Reinforcement Learning1-RLHF
Diffusion9-流视角
Diffusion8-SDE框架
Diffusion7-从密度变换到福克-普朗克方程
Diffusion6-SDE与伊藤积分
Diffusion5-ODE的基本性质与解法
Diffusion4-DDPM与分数视角的形式化统一
Diffusion3-分数视角