- class mindspore_rl.environment.Environment[源代码]
环境的虚基类。在调用此类之前,请重写其中的方法。
- property action_space
获取环境的动作空间。
- 返回:
返回环境的动作空间。
- property config
获取环境的配置信息。
- 返回:
返回一个包含环境信息的字典。
- property done_space
获取环境的终止空间。
- 返回:
返回环境的终止空间。
- property observation_space
获取环境的状态空间。
- 返回:
返回环境的状态空间。
- reset()[源代码]
将环境重置为初始状态。reset方法一般在每一局游戏开始时使用,并返回环境的初始状态值以及其reset方法初始信息。
- 返回:
表示环境初始状态的Tensor或者Tuple包含初始信息,,如新的状态,动作,奖励等。
- property reward_space
获取环境的状态空间。
- 返回:
返回环境的奖励空间。