- class mindspore_rl.agent.Agent(actors, learner)[源代码]
Agent的基类。作为智能体的定义,由Actor和Learner构成。具备基本的act和learn功能用于和环境交互和自我更新。
- 参数:
actors (Actor) - Actor 实例。
learner (Learner) - learner 实例。
样例:
>>> from mindspore_rl.agent.learner import Learner >>> from mindspore_rl.agent.actor import Actor >>> from mindspore_rl.agent.agent import Agent >>> actors = Actor() >>> learner = Learner() >>> agent = Agent(actors, learner) >>> print(agent) Agent< (_actors): Actor<> (_learner): Learner<> >
- act(phase, params)[源代码]
act 方法接收一个枚举值和观察数据或计算动作期间所需的数据。它将返回一组包含新观察数据或其他经验的输出。此接口中,Agent将与环境交互。
- 参数:
phase (enum) - 一个int型的枚举值,用于初始化、收集或评估的阶段。
params (tuple(Tensor)) - 作为输入的张量元组,用于计算动作。
- 返回:
observation (tuple(Tensor)) - 作为输出的张量元组,用于生成经验数据。