mindspore.experimental.optim.lr_scheduler.ReduceLROnPlateau
- class mindspore.experimental.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, threshold=1e-4, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-8)[源代码]
学习率调整优化器,当指标停止改进时降低学习率。训练中学习停滞情况下,模型通常会受益于将学习率降低2~10倍。
调度程序在执行过程中读取指标 metrics,如果指标在 patience 个周期内没有得到改进,则通过 step 方法调整学习率。
警告
这是一个实验性的动态学习率接口,需要和 mindspore.experimental.optim 下的接口配合使用。
- 参数:
optimizer (
mindspore.experimental.optim.Optimizer
) - 优化器实例。mode (str, 可选) - 触发模式,当监控指标在最低点/最高点时触发降低学习率。在
'min'
模式下,当监控指标不再下降,降低学习率;在'max'
模式下,当监控指标不再上升,降低学习率。默认值:'min'
。factor (float, 可选) - 学习率衰减因子。默认值:
0.1
。patience (int, 可选) - 监控指标无改善情况下等待的epoch数。例如,如果 patience = 2,则前2个无改善的epoch将被忽略,从第3个epoch开始降低学习率。默认值:
10
。threshold (float, 可选) - 衡量指标变好的最小阈值。默认值:
1e-4
。threshold_mode (str, 可选) - 衡量指标变好的模式,可取值
'rel'
或'abs'
。默认值:'rel'
。假设 best 代表当前性能指标的最值。
在
'rel'
模式下,指标与比例形式的 threshold 比较:当 mode 为
'max'
,若超过 best * ( 1 + threshold ) 则认为指标变好。当 mode 为
'min'
,若低于 best * ( 1 - threshold ) 则认为指标变好。
在
'abs'
模式下,指标与绝对值形式的 threshold 比较:当 mode 为
'max'
,若超过 best + threshold 则认为指标变好。当 mode 为
'min'
,若低于 best - threshold 则认为指标变好。
cooldown (int, 可选) - 在降低学习率后恢复正常运行之前要等待的epoch数。默认值:
0
。min_lr (Union(float, list), 可选) - 标量或标量列表,所有参数组或每个组的学习率最小值。默认值:
0
。eps (float, 可选) - 应用于学习率的最小衰减。如果学习率变化的差异小于 eps,则忽略更新。默认值:
1e-8
。
- 异常:
ValueError - factor 大于等于1.0。
TypeError - optimizer 不是 Optimizer。
ValueError - min_lr 为list或tuple时,其长度不等于参数组数目。
ValueError - mode 不是
'min'
或'max'
。ValueError - threshold_mode 不是
'rel'
或'abs'
。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> from mindspore.experimental import optim >>> from mindspore import nn >>> net = nn.Dense(3, 2) >>> optimizer = optim.Adam(net.trainable_params(), 0.1) >>> scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'min', patience=0) >>> metrics = [1, 1.5, 1.8, 0.4, 0.5] >>> for i in range(5): ... scheduler.step(metrics[i]) ... current_lr = scheduler.get_last_lr() ... print(current_lr) [Tensor(shape=[], dtype=Float32, value= 0.1)] [Tensor(shape=[], dtype=Float32, value= 0.01)] [Tensor(shape=[], dtype=Float32, value= 0.001)] [Tensor(shape=[], dtype=Float32, value= 0.001)] [Tensor(shape=[], dtype=Float32, value= 0.0001)]