metadata

title: README
emoji: 🌖
colorFrom: green
colorTo: pink
sdk: static
pinned: false

SakuraLLM

目前Sakura发布的所有模型均采用CC BY-NC-SA 4.0协议，Sakura所有模型与其衍生模型均禁止任何形式的商用！Sakura系列所有模型皆仅供学习交流使用，开发者对使用Sakura模型造成的问题不负任何责任。

基于一系列开源大模型构建，在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调，旨在提供开源可控可离线自部署的、ACGN风格的日中翻译模型。
新建了TG交流群，欢迎交流讨论。

对于其他适配本模型的项目如使用非本项目提供的prompt格式进行翻译，不保证会获得与README中的说明一致的质量！

如果使用模型翻译并发布，请在最显眼的位置标注机翻！！！！！开发者对于滥用本模型造成的一切后果不负任何责任。

由于模型一直在更新，请同时注明使用的模型版本等信息，方便进行质量评估和更新翻译。

对于模型翻译的人称代词问题（错用，乱加，主宾混淆，男女不分等）和上下文理解问题，如果有好的想法或建议，欢迎提issue！

部分使用方法：usage.md

请注意，如果给轻小说机翻站使用，请参见机翻站站内教程，本 repo 不适用。

p.s. 如果无法连接到HuggingFace服务器，可将链接中的huggingface.co改成hf-mirror.com，使用hf镜像站下载。

更新了基于Qwen2.5-14B的v1.0正式版模型Sakura-14B-Qwen2.5-v1.0和基于Qwen2.5-1.5B的v1.0正式版模型Qwen2.5-1.5B-v1.0，prompt格式参见下方说明。主要改进：
- 改善翻译质量，提高翻译准确率，尤其是人称的准确率。
- 支持术语表(GPT字典)，以保持专有名词和人称的一致性。
- 提高部分简单控制符的保留能力，尤其是单行内存在\n的情况下保留\n的能力。降低行数与原文不一致的概率。
- 由于底模使用GQA，推理速度和显存占用显著改善，可实现更快的多线程推理。关于多线程推理，可参考Sakura启动器GUI使用教程或SakuraLLMServer。