介绍
安装
大模型全流程指南
功能特性
高阶开发
优秀实践
环境变量
贡献指南
FAQ
数据集模块,包含常用数据集、数据迭代器、数据增强操作等。
mindformers.dataset.CausalLanguageModelDataset
因果语言模型预训练数据集。
mindformers.dataset.KeyWordGenDataset
关键词生成数据集。
mindformers.dataset.MultiTurnDataset
多轮对话数据集。