- class mindspore_rl.core.UniformReplayBuffer(batch_size, capacity, shapes, types)[源代码]
重放缓存类。重放缓存区中存放来自环境的经验数据。在该类中,每个元素都是一组Tensor。因此,ReplayBuffer类的构造函数将每个Tensor的形状和类型作为参数。
- 参数:
batch_size (int) - 从缓存区采样的batch大小。
capacity (int) - 缓存区的大小。
shapes (list[int]) - 缓存区中每个元素对应的Tensor shape列表。
types (list[mindspore.dtype]) - 缓存区中每个元素对应的Tensor dtype列表。
样例:
>>> import mindspore as ms >>> from mindspore_rl.core.uniform_replay_buffer import UniformReplayBuffer >>> batch_size = 10 >>> capacity = 10000 >>> shapes = [(4,), (1,), (1,), (4,)] >>> types = [ms.float32, ms.int32, ms.float32, ms.float32] >>> replaybuffer = UniformReplayBuffer(batch_size, capacity, shapes, types) >>> print(replaybuffer) UniformReplayBuffer<>
- get_item(index)[源代码]
从缓存区的指定位置取出元素。
- 参数:
index (int) - 元素的索引。
- 返回:
element (list[Tensor]) - 返回指定位置的元素。