- class mindspore_rl.environment.TicTacToeEnvironment(params, env_id=0)[源代码]
井字棋是一款有名的纸笔游戏<https://en.wikipedia.org/wiki/Tic-tac-toe>。这个游戏的规则是两个玩家在一个3X3的格子上交互的画O和X。当三个相同的标记在水平,垂直或者对角线连成一条线时,对应的玩家将获得胜利。下图就是一个井字棋游戏的例子。
o
x
x
o
x
o
- 参数:
params (dict) - 字典包含TicTacToeEnvironment类中所需要的所有参数。
env_id (int) - 环境id,用于设置环境内种子。默认:0。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> from mindspore_rl.environment import TicTacToeEnvironment >>> env_params = {} >>> environment = TicTacToeEnvironment(env_params, 0) >>> print(environment) TicTacToeEnvironment<>
- property action_space
获取环境的动作空间。
- 返回:
Space,环境的动作空间。
- property config
获取环境的配置信息。
- 返回:
dict,一个包含环境信息的字典。
- property done_space
获取环境的终止空间。
- 返回:
Space,环境的终止空间。
- load(state)[源代码]
加载输入的状态。环境会根据输入的状态,更新当前的状态,合法动作和是否结束。
- 参数:
state (Tensor) - 输入的环境状态。
- 返回:
state (Tensor) - 存档点的状态。
reward (Tensor) - 存档点的收益。
done (Tensor) - 是否在输入存档点时,游戏已经结束。
- property observation_space
获取环境的状态空间。
- 返回:
Space,环境的状态空间。
- property reward_space
获取环境的状态空间。
- 返回:
Space,环境的奖励空间。