class mindspore_rl.environment.GymEnvironment(params, env_id=0)[源代码]

GymEnvironment将 Gym 封装成一个类来提供在MindSpore图模式下也能和Gym环境交互的能力。

参数:
  • params (dict) - 字典包含GymEnvironment类中所需要的所有参数。

配置参数

备注

name

Gym内游戏的名字

seed

Gym内使用的随机种子

  • env_id (int) - 环境id,用于设置环境内种子。默认:0。

支持平台:

Ascend GPU CPU

样例:

>>> env_params = {'name': 'CartPole-v0'}
>>> environment = GymEnvironment(env_params, 0)
>>> print(environment)
GymEnvironment<>
property action_space

获取环境的动作空间。

返回:

Space,环境的动作空间。

close()[源代码]

关闭环境以释放环境资源

返回:
  • Success (bool) - 是否成功释放资源。

property config

获取环境的配置信息。

返回:

dict,一个包含环境信息的字典。

property done_space

获取环境的终止空间。

返回:

Space,环境的终止空间。

property observation_space

获取环境的状态空间。

返回:

Space,环境的状态空间。

render()[源代码]

渲染环境,仅支持PyNative模式。

reset()[源代码]

将环境重置为初始状态。reset方法一般在每一局游戏开始时使用,并返回环境的初始状态值。

返回:

Tensor,表示环境初始状态。

property reward_space

获取环境的状态空间。

返回:

Space,环境的奖励空间。

step(action)[源代码]

执行环境Step函数来和环境交互一回合。

参数:
  • action (Tensor) - 包含动作信息的Tensor。

返回:
  • state (Tensor) - 输入动作后的环境返回的新状态。

  • reward (Tensor) - 输入动作后环境返回的奖励。

  • done (Tensor) - 输入动作后环境是否终止。