<no title>

class mindspore_rl.utils.CallbackParam[源代码]: 回调函数的参数。

class mindspore_rl.utils.CallbackManager(callbacks)[源代码]

依次执行回调函数。

参数：

callbacks (list[Callback]) - 回调函数。

begin(params)[源代码]

在训练执行开始调用，仅执行一次。

参数：

params (CallbackParam) - begin执行用的参数。

end(params)[源代码]

在训练执行结束调用，仅执行一次。

参数：

params (CallbackParam) - end执行用的参数。

episode_begin(params)[源代码]

在每个episode执行前调用。

参数：

params (CallbackParam) - episode_begin执行用的参数。

episode_end(params)[源代码]

在每个episode执行后调用。

参数：

params (CallbackParam) - episode_end执行用的参数。

class mindspore_rl.utils.LossCallback(print_rate=1)[源代码]

在每个episode结束时打印loss值。

参数：

print_rate (int) - 打印loss的频率。默认： 1。

episode_end(params)[源代码]

在每个episode执行后调用，打印loss值。

参数：

params (CallbackParam) - 训练参数，用于获取结果。

class mindspore_rl.utils.TimeCallback(print_rate=1, fixed_steps_in_episode=None)[源代码]

在每个episode结束时打印耗时。

参数：

print_rate (int) - 打印耗时的频率, 默认：1。
fixed_steps_in_episode (Optional[int]) - 如果每个episode的steps是固定的，则提供一个固定步长值，否则将取实际步长。默认：None。

episode_begin(params)[源代码]

在每个episode执行后调用，打印耗时。

参数：

params (CallbackParam) - 训练参数，用于获取结果。

episode_end(params)[源代码]

在每个episode执行前记录时间。

参数：

params (CallbackParam) - 训练参数，用于获取结果。

class mindspore_rl.utils.CheckpointCallback(save_per_episode=0, directory=None, max_ckpt_nums=5)[源代码]

保存模型的checkpoint文件，保留最新的 max_ckpt_nums 个。

参数：

save_per_episode (int) - 保存ckpt文件的频率。默认： 0。
directory (str, 可选) - 保存ckpt文件的路径。默认当前文件夹。
max_ckpt_nums (int, 可选) - 最大保留ckpt的个数。默认：5。

episode_end(params)[源代码]

在每个episode执行后调用，保存ckpt文件。

参数：

params (CallbackParam) - 训练参数，用于获取结果。

class mindspore_rl.utils.EvaluateCallback(eval_rate=0)[源代码]

推理回调。

参数：

eval_rate (int) - 推理的频率。默认： 0。

begin(params)[源代码]

在训练开始前保存推理频率。

参数：

params (CallbackParam) - episode开始时用的参数。

episode_end(params)[源代码]

在每个episode执行后调用，推理并打印结果。

参数：

params (CallbackParam) - episode结束后用的参数。