模型库

查看源文件

当前MindSpore Transformers全量的模型列表如下:

模型名

支持规格

模型类型

最新支持版本

CodeLlama

34B

稠密LLM

在研版本

CogVLM2-Image

19B

MM

在研版本

CogVLM2-Video

13B

MM

在研版本

DeepSeek-V3

671B

稀疏LLM

在研版本

DeepSeek-V2

236B

稀疏LLM

在研版本

DeepSeek-Coder-V1.5

7B

稠密LLM

在研版本

DeepSeek-Coder

33B

稠密LLM

在研版本

GLM4

9B

稠密LLM

在研版本

GLM3-32K

6B

稠密LLM

在研版本

GLM3

6B

稠密LLM

在研版本

InternLM2

7B/20B

稠密LLM

在研版本

Llama3.1

8B/70B

稠密LLM

在研版本

Llama3

8B/70B

稠密LLM

在研版本

Llama2

7B/13B/70B

稠密LLM

在研版本

Mixtral

8x7B

稀疏LLM

在研版本

Qwen2

0.5B/1.5B/7B/57B/57B-A14B/72B

稠密/稀疏LLM

在研版本

Qwen1.5

7B/14B/72B

稠密LLM

在研版本

Qwen-VL

9.6B

MM

在研版本

Whisper

1.5B

MM

在研版本

Yi

6B/34B

稠密LLM

在研版本

Baichuan2

7B/13B

稠密LLM

1.3.2

GLM2

6B

稠密LLM

1.3.2

GPT2

124M/13B

稠密LLM

1.3.2

InternLM

7B/20B

稠密LLM

1.3.2

Qwen

7B/14B

稠密LLM

1.3.2

CodeGeex2

6B

稠密LLM

1.1.0

WizardCoder

15B

稠密LLM

1.1.0

Baichuan

7B/13B

稠密LLM

1.0

Blip2

8.1B

MM

1.0

Bloom

560M/7.1B/65B/176B

稠密LLM

1.0

Clip

149M/428M

MM

1.0

CodeGeex

13B

稠密LLM

1.0

GLM

6B

稠密LLM

1.0

iFlytekSpark

13B

稠密LLM

1.0

Llama

7B/13B

稠密LLM

1.0

MAE

86M

MM

1.0

Mengzi3

13B

稠密LLM

1.0

PanguAlpha

2.6B/13B

稠密LLM

1.0

SAM

91M/308M/636M

MM

1.0

Skywork

13B

稠密LLM

1.0

Swin

88M

MM

1.0

T5

14M/60M

稠密LLM

1.0

VisualGLM

6B

MM

1.0

Ziya

13B

稠密LLM

1.0

Bert

4M/110M

稠密LLM

0.8

* LLM: 大语言模型(Large Language Model); MM: 多模态(Multi-Modal)