IEITYuan
/

Yuan2-M32-gguf

GGUF

Inference Endpoints

Model card Files Files and versions Community

IEIT-Yuan commited on May 28, 2024

Commit

ef1e398

verified ·

1 Parent(s): 19ce6df

Update README.md

Browse files

Files changed (1) hide show

README.md +1 -3

README.md CHANGED Viewed

@@ -35,7 +35,7 @@ license_link: https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/LICENSE-Yuan
 ##  1. Introduction
-浪潮信息 “源2.0 M32”大模型（简称，Yuan2.0-M32） 采用稀疏混合专家架构（MoE），以Yuan2.0-2B模型作为基底模型，通过创新的门控网络（Attention Router）实现32个专家间（Expers*32）的协同工作与任务调度，在显著降低模型推理算力需求的情况下，带来了更强的模型精度表现与推理性能；源2.0-M32在多个业界主流的评测进行了代码生成、数学问题求解、科学问答与综合知识能力等方面的能力测评。结果显示，源2.0-M32在多项任务评测中，展示出了较为先进的能力表现，MATH（数学求解）、ARC-C（科学问答）测试成绩超越LLaMA3-700亿模型。Yuan2.0-M32大模型 基本信息如下：
 + **模型参数量：** 40B <br>
 + **专家数量：** 32 <br>
@@ -57,7 +57,6 @@ license_link: https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/LICENSE-Yuan
 | :----------: | :------: | :-------: |:---------------------------: |
 | Yuan2.0-M32           |    16K    |    Megatron    | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32)
 | Yuan2.0-M32-HF        |    16K    |    HuggingFace | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32-hf)
-| Yuan2.0-M32-GGUF      |    16K    |    GGUF        | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32-gguf)
 | Yuan2.0-M32-GGUF-INT4 |    16K    |    GGUF        | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32-gguf-int4/)
@@ -139,4 +138,3 @@ docker exec -it your_name bash
 尽管模型在训练时我们已采取措施尽力确保数据的合规性和准确性，但模型参数量巨大且受概率随机性因素影响，我们无法保证输出内容的准确性，且模型易被输入指令所误导，本项目不承担开源模型和代码导致的数据安全、舆情风险或发生任何模型被误导、滥用、传播、不当利用而产生的风险和责任。**您将对通过使用、复制、分发和修改模型等方式利用该开源项目所产生的风险与后果，独自承担全部责任。**

 ##  1. Introduction
+浪潮信息 “源2.0 M32”大模型（简称，Yuan2.0-M32） 采用稀疏混合专家架构（MoE），以Yuan2.0-2B模型作为基底模型，通过创新的门控网络（Attention Router）实现32个专家间（Experts*32）的协同工作与任务调度，在显著降低模型推理算力需求的情况下，带来了更强的模型精度表现与推理性能；源2.0-M32在多个业界主流的评测进行了代码生成、数学问题求解、科学问答与综合知识能力等方面的能力测评。结果显示，源2.0-M32在多项任务评测中，展示出了较为先进的能力表现，MATH（数学求解）、ARC-C（科学问答）测试成绩超越LLaMA3-700亿模型。Yuan2.0-M32大模型 基本信息如下：
 + **模型参数量：** 40B <br>
 + **专家数量：** 32 <br>
 | :----------: | :------: | :-------: |:---------------------------: |
 | Yuan2.0-M32           |    16K    |    Megatron    | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32)
 | Yuan2.0-M32-HF        |    16K    |    HuggingFace | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32-hf)
 | Yuan2.0-M32-GGUF-INT4 |    16K    |    GGUF        | [HuggingFace](https://huggingface.co/IEITYuan/Yuan2-M32-gguf-int4/)
 尽管模型在训练时我们已采取措施尽力确保数据的合规性和准确性，但模型参数量巨大且受概率随机性因素影响，我们无法保证输出内容的准确性，且模型易被输入指令所误导，本项目不承担开源模型和代码导致的数据安全、舆情风险或发生任何模型被误导、滥用、传播、不当利用而产生的风险和责任。**您将对通过使用、复制、分发和修改模型等方式利用该开源项目所产生的风险与后果，独自承担全部责任。**