Release Notes

MindSpore Transformers 1.3.0 Release Notes

以下为 MindSpore Transformers (以下称为 MindFormers ) 套件 1.3.0 版本的变更日志,相较于1.2.0版本有以下关键新特性和 bugfix 。

新特性

  • 安装验证:新增了便捷的API用以查询MindFormers的安装是否成功。

  • [日志优化]:优化 MindFormers 日志,打印信息更全面,更易于精度定位以及训练状态的监控。

  • LLM对话API:提供了大型语言模型的对话文本生成推理接口。

  • 量化推理:集成 MindSpore Golden Stick 工具组件,提供统一量化推理流程。

  • BIN格式数据集:新增对 BIN 格式数据集的处理能力,包括如何制作 BIN 格式数据集和在任务中使用 BIN 格式数据集。

  • 在线数据集:训练时支持加载在线数据集,无需本地离线处理。

  • 榜单评测:基于 Harness 评测框架,支持加载 MindFormers 模型进行评测,支持自定义 prompt 和评测指标,包含 loglikelihood、 generate_until、 loglikelihood_rolling 三种类型的评测任务。基于 VLMEvalKit 评测框架,支持加载 MindFormers 多模态大模型进行评测,支持自定义 prompt 和评测指标,包含 MME、 MMEBench、 COCO caption 三种图文理解评估方法。

  • Benchmark工具:新增预置大模型训练推理 Benchmark 工具,支撑用户实现快捷部署。

  • 长序列训练:新增支持多种长序列并行,序列长度支持至10M。

  • 断点续训优化:断点续训场景下,优化权重和全局一致性文件保存流程,减少续训权重的校验完整性过程,加速恢复时间。

  • 流水线并行优化:提升流水线并行的效率,减少 Bubble 的占比,采用 interleaved pipeline 调度,且做了内存优化。

  • [动态shape]:新增 Llama3-8B 和 Qwen2-7B 模型支持监督微调数据的输入长度动态变化。

新模型

以下为新支持模型:

模型

规格

Llama3.1

Llama3.1-8B (微调、推理)、Llama3.1-70B (微调、推理)

GLM4

GLM4-9B (微调、推理)

CogVLM2_Video

CogVLM2-Video-Chat-13B (微调、推理)

CogVLM2_Image

CogVLM2-Llama3-Chat-19B (推理)

Qwen1.5

Qwen1.5-0.5B (推理)、Qwen1.5-1.8B (推理)、Qwen1.5-4B (推理)、Qwen1.5-32B (推理)

Qwen2

Qwen2-0.5B (微调、推理)、Qwen2-1.5B (微调、推理)、Qwen2-7B (微调、推理)、Qwen2-57B-A14B (推理)、Qwen2-57B (预训练、微调、推理)、Qwen2-72B (微调、推理)

DeepSeek Coder1.5

DeepSeek-Coder-7B-V1.5 (微调、推理)

DeepSeekV2

DeepSeek-V2 (预训练、微调、推理)

Whisper

Whisper-Large-V3 (微调)

Bugfix

在当前版本发布周期内,我们进行了模型/功能/易用性/文档等诸多方面的 bugfix ,在此仅列举部分修复内容:

  • !3674:修复 Internlm2 模型解码不符合预期的问题。

  • !4401:修复 Baichuan2-13B 模型 MindIE 推理精度问题。

贡献者

感谢以下人员做出的贡献:

Chong Li,chenyijie,heqinglin,huangshengshuai,lilei,lizhihao,lizheng,moran,paolo poggi,wangshaocong,wutiancheng,xiaoshihan,yangminghai,yangzhenzhang,zhanzhan,zhaozhengquan,ZhouJingfeng,zhouyaqiang,包淦超,常少中,陈心锐,陈昱坤,陈志坚,程鹏,楚浩田,戴仁杰,冯浩,冯明昊,冯汛,耿辰华,郭儒辰,古雅诗,贺冬冬,何泽泉,胡思超,胡映彤,宦晓玲,黄磊,黄新元,黄勇,黄子灵,金仁操,孔德硕,孔紫怡,寇凯睿,蓝翔,李俊标,李洋,李文,李永文,李子垠,林鑫,林盈来,刘晨晖,刘奇,刘烙彬,刘力力,刘思铭,吕凯盟,倪钰鑫,牛君豪,邱杨,任峪瑾,赛尧,孙宇轩,唐德志,谭纬城,王浩然,汪家傲,王嘉霖,王廖辉,王双玲,魏琢艺,吴治锋,吴致远,吴昊天,杨星宇,杨犇,杨承翰,杨璇,易阳,尤日帆,俞涵,张浩,张泓铨,张吉昊,张俊杰,张敏利,张森镇,张伟,张一飞,张奕晖,张雨强,赵奕舜,周洪叶,周小琪,朱亿超,邹文祥

欢迎以任何形式对项目提供贡献!