分类
PyTorch 教程
PyTorch 项目
论文复现
中文文档
教程目录
资源参考
入门实战
支持我们
登录
注册
搜索
PPO
PyTorch 实现各种 Policy Gradient 算法 (REINFORCE, NPG, TRPO, PPO)
这个项目用 PyTorch (v0.4.0) 实现了下列经典的 policy gradient (PG) 算法…
PyTorch 项目
•
2018年9月16日
25118
阅读
返回顶部