mindspore.experimental.optim.lr_scheduler.ReduceLROnPlateau
- class mindspore.experimental.optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=10, threshold=1e-4, threshold_mode='rel', cooldown=0, min_lr=0, eps=1e-8)[源代码]
当指标停止改进时降低学习率。训练中学习停滞情况下,模型通常会受益于将学习率降低2-10倍。该调度程序在执行过程中读取 step 方法中传入的指标 metrics,如果在 patience 的时期内没有得到改进,则学习率会降低。
警告
这是一个实验性的动态学习率接口,需要和 mindspore.experimental.optim 下的接口配合使用。
- 参数:
optimizer (
mindspore.experimental.optim.Optimizer
) - 优化器实例。mode (str, 可选) -
'min'
或'max'
。在'min'
模式下,当监控指标不再下降,降低学习率;在'max'
模式下,当监控指标不再上升,降低学习率。默认值:'min'
。factor (float, 可选) - 学习率衰减因子。默认值:
0.1
。patience (int, 可选) - 评估指标无改善情况下等待的epoch数。例如,如果 patience = 2,则前2个无改善的epoch将被忽略,从第3个epoch降低学习率。默认值:
10
。threshold (float, 可选) - 衡量指标变好的最小阈值。默认值:
1e-4
。threshold_mode (str, 可选) -
'rel'
或'abs'
。每次评估指标是否变好的基准为 dynamic_threshold,在'rel'
模式下,如果 mode 为'max'
,则 dynamic_threshold = best * ( 1 + threshold ); 如果 mode 为'min'
,则 best * ( 1 - threshold )。'abs'
模式下,如果 mode 为'max'
,则 dynamic_threshold = best + threshold;如果 mode 为'min'
,则 best - threshold。默认值:'rel'
。cooldown (int, 可选) - 在降低学习率后恢复正常运行之前要等待的epoch数。默认值:
0
。min_lr (Union(float, list), 可选) - 标量或标量列表,所有参数组或每个组的学习率最小值。默认值:
0
。eps (float, 可选) - 应用于学习率的最小衰减。如果学习率变化的差异小于 eps,则忽略更新。默认值:
1e-8
。
- 异常:
ValueError - factor 大于等于1。
TypeError - optimizer 不是 Optimizer。
ValueError - min_lr 为list或tuple时,其长度不等于参数组数目。
ValueError - mode 不是
'min'
或'max'
。ValueError - threshold_mode 不是
'rel'
或'abs'
。
- 支持平台:
Ascend
GPU
CPU
样例:
>>> from mindspore.experimental import optim >>> from mindspore import nn >>> net = nn.Dense(3, 2) >>> optimizer = optim.Adam(net.trainable_params(), 0.1) >>> scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'min', patience=0) >>> metrics = [1, 1.5, 1.8, 0.4, 0.5] >>> for i in range(5): ... scheduler.step(metrics[i]) ... current_lr = scheduler.get_last_lr() ... print(current_lr) [Tensor(shape=[], dtype=Float32, value= 0.1)] [Tensor(shape=[], dtype=Float32, value= 0.01)] [Tensor(shape=[], dtype=Float32, value= 0.001)] [Tensor(shape=[], dtype=Float32, value= 0.001)] [Tensor(shape=[], dtype=Float32, value= 0.0001)]