metadata
title: README
emoji: 🌖
colorFrom: green
colorTo: pink
sdk: static
pinned: false
SakuraLLM
🦉 GitHub | 🤖 ModelScope
目前Sakura发布的所有模型均采用CC BY-NC-SA 4.0协议,Sakura所有模型与其衍生模型均禁止任何形式的商用!Sakura系列所有模型皆仅供学习交流使用,开发者对使用Sakura模型造成的问题不负任何责任。
介绍
基于一系列开源大模型构建,在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调,旨在提供开源可控可离线自部署的、ACGN风格的日中翻译模型。
新建了TG交流群,欢迎交流讨论。
对于其他适配本模型的项目如使用非本项目提供的prompt格式进行翻译,不保证会获得与README中的说明一致的质量!
如果使用模型翻译并发布,请在最显眼的位置标注机翻!!!!!开发者对于滥用本模型造成的一切后果不负任何责任。
由于模型一直在更新,请同时注明使用的模型版本等信息,方便进行质量评估和更新翻译。
对于模型翻译的人称代词问题(错用,乱加,主宾混淆,男女不分等)和上下文理解问题,如果有好的想法或建议,欢迎提issue!
TODO:见https://github.com/SakuraLLM/Sakura-13B-Galgame/issues/42
快速开始
教程:
详见本仓库Wiki.
部分使用方法:usage.md
请注意,如果给轻小说机翻站使用,请参见机翻站站内教程,本 repo 不适用。
模型下载:
参数量 | 发布时间-底模-版本 | 模型 |
---|---|---|
32B | 20240508-Qwen1.5-32B-v0.9 | 🤗 Sakura-32B-Qwen2beta-v0.9-GGUF |
20240508-Qwen1.5-32B-v0.10pre1 | 🤗 Sakura-32B-Qwen2beta-v0.10pre1-GGUF | |
14B | 20240111-Qwen-14B-v0.9 | 🤗 Sakura-13B-LNovel-v0.9b-GGUF |
20240213-Qwen1.5-14B-v0.9 | 🤗 Sakura-14B-Qwen2beta-v0.9-GGUF | |
20240516-Qwen1.5-14B-v0.9.2 | 🤗 Sakura-14B-Qwen2beta-v0.9.2-GGUF | |
(最新) | 20241008-Qwen2.5-14B-v1.0 | 🤗 Sakura-14B-Qwen2.5-v1.0-GGUF |
7B | 20240116-Qwen-7B-v0.9 | 🤗 Sakura-7B-LNovel-v0.9-GGUF |
20240531-Qwen1.5-7B-Galtransl-v2.6 | 🤗 Galtransl-v2.6 | |
~2B | 20240214-Qwen1.5-1.8B-v0.9.1 | 🤗 Sakura-1B8-Qwen2beta-v0.9.1-GGUF |
(最新) | 20241012-Qwen2.5-1.5B-v1.0 | 🤗 Sakura-1.5B-Qwen2.5-v1.0-GGUF |
p.s. 如果无法连接到HuggingFace服务器,可将链接中的huggingface.co
改成hf-mirror.com
,使用hf镜像站下载。
News
- 更新了基于Qwen2.5-14B的v1.0正式版模型Sakura-14B-Qwen2.5-v1.0和基于Qwen2.5-1.5B的v1.0正式版模型Qwen2.5-1.5B-v1.0,prompt格式参见下方说明。主要改进:
- 改善翻译质量,提高翻译准确率,尤其是人称的准确率。
- 支持术语表(GPT字典),以保持专有名词和人称的一致性。
- 提高部分简单控制符的保留能力,尤其是单行内存在
\n
的情况下保留\n
的能力。降低行数与原文不一致的概率。 - 由于底模使用GQA,推理速度和显存占用显著改善,可实现更快的多线程推理。关于多线程推理,可参考Sakura启动器GUI使用教程或SakuraLLMServer。
更多信息
详情请查看此页面