|
--- |
|
language: |
|
- en |
|
- zh |
|
pipeline_tag: text-generation |
|
tags: |
|
- meta |
|
- llama-3 |
|
- llama3中文基座模型 |
|
license: llama3 |
|
--- |
|
|
|
# Llama3 中文增强预训练基座模型 |
|
|
|
## 项目概述 |
|
|
|
本项目使用 `LLaMA-Factory` 对 `Llama3-8b` 模型进行了中文增强预训练。 |
|
|
|
## Models |
|
|
|
- Chat models |
|
|
|
| Name | Download | |
|
| -------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------- | |
|
| Guru-Llama-3-8B-Chat | • [🤗 Hugging Face](https://huggingface.co/wifibaby4u/Guru-Llama-3-8B-Chat) • [🤖 ModelScope](https://modelscope.cn/models/wifibaby4u/Guru-Llama-3-8B-Chat) | |
|
|
|
- Base models |
|
|
|
| Name | Download | |
|
| ------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------- | |
|
| Guru-Llama-3-8B | • [🤗 Hugging Face](https://huggingface.co/wifibaby4u/Guru-Llama-3-8B) • [🤖 ModelScope](https://modelscope.cn/models/wifibaby4u/Guru-Llama-3-8B) | |
|
|
|
## 评测 |
|
|
|
### CMMLU |
|
|
|
| Name | Average | STEM | Social Sciences | Humanities | Other | |
|
|-------|---------|------|-----------------|------------|-------| |
|
| Five-shot | 49.59 | 42.28 | 51.37 | 51.87 | 51.79 | |
|
| Zero-shot | 40.53 | 36.31 | 41.13 | 40.82 | 43.20 | |
|
|
|
### MMLU |
|
|
|
| Name | Average | STEM | Social Sciences | Humanities | Other | |
|
|-------|---------|------|-----------------|------------|-------| |
|
| Five-shot | 60.88 | 49.77 | 71.62 | 55.22 | 69.24 | |
|
| Zero-shot | 58.97 | 48.30 | 69.62 | 52.75 | 67.81 | |
|
|
|
## 训练数据集 |
|
|
|
| 资源名称 | 描述 | 记录数量 | 文件名 | 文件大小(MB) | 文件占比(%) | |
|
|-----------------------|---------------------------------|----------|----------------------|--------------|------------| |
|
| 新闻联播内容 | 2016-2024年的新闻联播 | 31,637篇 | cctv_news.jsonl | 43 | 0.029 | |
|
| 中华古诗词数据库 | 古诗词数据库 | 390,904篇 | poetry.jsonl | 110 | 0.074 | |
|
| 诗人数据库 | 诗人数据库 | 10,477条 | poet.jsonl | 3.7 | 0.002 | |
|
| 中国古典小说数据库 | 中国古典小说数据库 | 431本 | novel.jsonl | 242 | 0.163 | |
|
| 金庸小说 | 金庸小说 | 15本 | jinyong.jsonl | 25 | 0.017 | |
|
| 中国近现代历史文献选集 | 中国近现代历史文献选集 | 131篇 | bibliography.jsonl | 2.3 | 0.002 | |
|
| 成语数据库 | 成语数据库 | 23,148条 | idiom.jsonl | 2.5 | 0.002 | |
|
| 中国近代史-徐中约 | 中国近代史-徐中约 | 上、下两册 | modern_chinese_history.jsonl | 1.9 | 0.001 | |
|
| 高质量中英文翻译数据 | 中英文高质量翻译对 | 69,206条 | translation.jsonl | 44 | 0.030 | |
|
| 维基百科 | 中文维基百科 (2023年7月20日) | 254,547条 | wikipedia-cn-20230720.jsonl | 488 | 0.329 | |
|
| 作文 | 作文集 | 269,370篇 | composition.jsonl | 517 | 0.349 | |
|
| 散文 | 散文作品集 | 658篇 | prose.jsonl | 2.9 | 0.002 | |
|
|
|
## 使用指南 |
|
|
|
### 环境配置 |
|
|
|
确保您的机器已经安装了以下软件: |
|
|
|
- Python 3.8+ |
|
- PyTorch 1.8+ |
|
|
|
### 安装 |
|
|
|
首先安装所需依赖: |
|
|
|
```bash |
|
pip install modelscope |
|
``` |
|
|
|
### 模型下载 |
|
|
|
使用以下命令加载并运行模型: |
|
|
|
```python |
|
from modelscope import snapshot_download |
|
model_dir = snapshot_download('wifibaby4u/Guru-Llama-3-8B') |
|
``` |
|
|
|
## 贡献 |
|
|
|
我们欢迎社区开发者的贡献!如果您有兴趣参与本项目的开发或有任何建议,欢迎通过 Issue 或 Pull Request 的方式与我们联系。 |