class mindspore_rl.environment.Environment[源代码]

环境的虚基类。在调用此类之前,请重写其中的方法。

property action_space

获取环境的动作空间。

返回:

返回环境的动作空间。

close()[源代码]

关闭环境以释放环境资源

返回:
  • Success (bool) - 是否成功释放资源。

property config

获取环境的配置信息。

返回:

返回一个包含环境信息的字典。

property done_space

获取环境的终止空间。

返回:

返回环境的终止空间。

property observation_space

获取环境的状态空间。

返回:

返回环境的状态空间。

reset()[源代码]

将环境重置为初始状态。reset方法一般在每一局游戏开始时使用,并返回环境的初始状态值以及其reset方法初始信息。

返回:

表示环境初始状态的Tensor或者Tuple包含初始信息,,如新的状态,动作,奖励等。

property reward_space

获取环境的状态空间。

返回:

返回环境的奖励空间。

step(action)[源代码]

执行环境Step函数来和环境交互一回合。

参数:
  • action (Tensor) - 包含动作信息的Tensor。

返回:

tuple,包含和环境交互后的信息。