mindspore_gs.ptq.GPTQQuantConfig
- class mindspore_gs.ptq.GPTQQuantConfig(block_size=128, desc_act=False, damp_percent=0.01, static_groups=False)[源代码]
用于配置 GPTQ 量化算法的数据类。
- 参数:
block_size (int,可选) - 表示 GPTQ 算法在补偿时分块的大小。默认值:
128
。desc_act (bool,可选) - 表示是否对海森矩阵进行重要性排序。默认值:
False
。damp_percent (float,可选) - 表示在数值稳定计算时,海森矩阵对角线元素平均值的百分比。默认值:
0.01
。static_groups (bool,可选) - 表示是否在精度补偿之前进行 per_group 计算。默认值:
False
。
- 异常:
TypeError - block_size 输入不是 int 类型。
TypeError - desc_act 输入不是 bool 类型。
TypeError - damp_percent 输入不是 float 类型。
TypeError - static_groups 输入不是 bool 类型。
ValueError - block_size 输入的值小于0。
ValueError - damp_percent 输入的值小于0,或者大于1。
样例:
>>> from mindspore_gs.ptq import GPTQQuantConfig >>> GPTQQuantConfig(block_size=128, desc_act=False, damp_percent=0.01, static_groups=False)