MindSpore Reinforcement Release Notes

Reinforcement 0.6.0-alpha Release Notes

主要特性和增强

  • [BETA] 支持GAIL(Generative Adversarial Imitation Learning Jonathan Ho et al..2016) 算法。算法解决了HalfCheetah环境问题,支持GPU后端设备。

  • [BETA] 支持C51(Marc G. Bellemare et al..2017) 算法。算法解决了CartPole环境问题,支持CPU后端设备。

  • [BETA] 支持CQL(Conservative Q-Learning Aviral Kumar et al..2019) 算法。算法解决了Hopper环境问题,支持CPU和GPU后端设备。

  • [BETA] 支持AWAC(Accelerating Online Reinforcement Learning with Offline Datasets Ashvin Nair et al..2020) 算法。算法解决了Ant环境问题,支持CPU和GPU后端设备。

  • [BETA] 支持Dreamer(Danijar Hafner et al..2020) 算法。算法解决了Walker-walk环境问题,支持GPU后端设备。

贡献者

感谢以下人员做出的贡献:

Pro. Peter, Huanzhou Zhu, Bo Zhao, Gang Chen, Weifeng Chen, Liang Shi, Yijie Chen.

欢迎以任何形式对项目提供贡献!