安装部署
使用指南
API参考
RELEASE NOTES
策略的虚基类。在调用模型之前,应该重写此类。
构造函数接口。由用户继承使用,参数可参考 EpsilonGreedyPolicy, RandomPolicy 等。
inputs - 取决于用户的定义。
kwargs - 取决于用户的定义。
取决于用户的定义。通常返回一个动作值或者动作的概率分布。