mindspore.ops.LSTM
- class mindspore.ops.LSTM(input_size, hidden_size, num_layers, has_bias, bidirectional, dropout, proj_size=0)[源代码]
对输入执行长短期记忆(LSTM)网络。
有关详细信息,请参见
mindspore.nn.LSTM
。- 参数:
input_size (int) - 输入的大小。
hidden_size (int) - 隐藏状态大小。
num_layers (int) - LSTM的网络层数,当前CPU只支持 1。
has_bias (bool) - Cell是否有偏置 b_ih 和 b_hh ,当前CPU只支持 False。
bidirectional (bool) - 是否为双向LSTM,当前CPU只支持 False。
dropout (float) - 指的是除第一层外每层输入时的dropout概率。dropout的范围为[0.0, 1.0]。
proj_size (int) - 如果大于0,则会使用对应大小的投影,当前只支持CPU后端。默认值:
0
。
- 输入:
input (Tensor) - shape为 \((seq\_len, batch\_size, input\_size)\) 或 \((batch\_size, seq\_len, input\_size)\) 的Tensor。
h (tuple) - shape为 \((num\_directions * num\_layers, batch\_size, real\_hidden\_size)\) 的Tensor。
c (tuple) - shape为 \((num\_directions * num\_layers, batch\_size, hidden\_size)\) 的Tensor。
w (Tensor) - 权重。
如果 \(proj\_size > 0\) , \(real\_hidden\_size = proj\_size\) , 否则 \(real\_hidden\_size = hidden\_size\) 。
- 输出:
tuple,tuple包含 (output, h_n, c_n, reserve, state) 。
output (Tensor) - shape为 \((seq\_len, batch\_size, num\_directions * real\_hidden\_size)\) 的Tensor。
h_n (Tensor) - shape为 \((num\_directions * num\_layers, batch\_size, real\_hidden\_size)\) 的Tensor。
c_n (Tensor) - shape为 \((num\_directions * num\_layers, batch\_size, hidden\_size)\) 的Tensor。
reserve (Tensor) - shape为 \((r, 1)\) 。
state (Tensor) - 使用随机数生成状态及其shape为 \((s, 1)\) 。
- 异常:
TypeError - 如果 input_size , hidden_size 或 num_layers 不是int。
TypeError - 如果 has_bias 或 bidirectional 不是bool。
TypeError - 如果 dropout 不是float。
ValueError - 如果 dropout 不在范围[0.0, 1.0]内。
ValueError - 如果 proj_size 不在范围[0, hidden_size)内。
- 支持平台:
GPU
CPU
样例:
>>> import numpy as np >>> from mindspore import Tensor, ops >>> input_size = 10 >>> hidden_size = 2 >>> num_layers = 1 >>> seq_len = 5 >>> batch_size = 2 >>> >>> net = ops.LSTM(input_size, hidden_size, num_layers, True, False, 0.0) >>> input_tensor = Tensor(np.ones([seq_len, batch_size, input_size]).astype(np.float32)) >>> h0 = Tensor(np.ones([num_layers, batch_size, hidden_size]).astype(np.float32)) >>> c0 = Tensor(np.ones([num_layers, batch_size, hidden_size]).astype(np.float32)) >>> w = Tensor(np.ones([112, 1, 1]).astype(np.float32)) >>> output, hn, cn, _, _ = net(input_tensor, h0, c0, w) >>> print(output) [[[0.9640267 0.9640267 ] [0.9640267 0.9640267 ]] [[0.9950539 0.9950539 ] [0.9950539 0.9950539 ]] [[0.99932843 0.99932843] [0.99932843 0.99932843]] [[0.9999084 0.9999084 ] [0.9999084 0.9999084 ]] [[0.9999869 0.9999869 ] [0.9999869 0.9999869 ]]]