Image result for Policy Gradient

PyTorch 实现各种 Policy Gradient 算法 (REINFORCE, NPG, TRPO, PPO)

这个项目用 PyTorch (v0.4.0) 实现了下列经典的 policy gradient (PG) 算法:

返回顶部