Spaces:

SakuraLLM
/

README

Running

App Files Files Community

README / README.md

sakuraumi

Update README.md

750a2c9 verified 7 days ago

preview code

raw

history blame contribute delete

4.88 kB

	---
	title: README
	emoji: 🌖
	colorFrom: green
	colorTo: pink
	sdk: static
	pinned: false
	---

	<!-- markdownlint-disable first-line-h1 -->
	<!-- markdownlint-disable html -->
	<div align="center">
	<h1>
	SakuraLLM
	</h1>
	<center>

	<p align="center">
	🦉 <a href="https://github.com/SakuraLLM/SakuraLLM" target="_blank">GitHub</a> \| 🤖 <a href="https://www.modelscope.cn/models/sakuraumi/Sakura-13B-Galgame" target="_blank">ModelScope</a>
	</p>

	# 目前Sakura发布的所有模型均采用[CC BY-NC-SA 4.0协议](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh-hans)，Sakura所有模型与其衍生模型均禁止任何形式的商用！Sakura系列所有模型皆仅供学习交流使用，开发者对使用Sakura模型造成的问题不负任何责任。

	# 介绍

	- 基于一系列开源大模型构建，在通用日文语料与轻小说/Galgame等领域的中日语料上进行继续预训练与微调，旨在提供开源可控可离线自部署的、ACGN风格的日中翻译模型。

	- 新建了[TG交流群](https://t.me/+QMDKZyO9GV1kNDA1)，欢迎交流讨论。

	对于其他适配本模型的项目如使用非本项目提供的prompt格式进行翻译，不保证会获得与README中的说明一致的质量！

	如果使用模型翻译并发布，请在最显眼的位置标注机翻！！！！！开发者对于滥用本模型造成的一切后果不负任何责任。
	> 由于模型一直在更新，请同时注明使用的模型版本等信息，方便进行质量评估和更新翻译。

	对于模型翻译的人称代词问题（错用，乱加，主宾混淆，男女不分等）和上下文理解问题，如果有好的想法或建议，欢迎提issue！

	### TODO：见https://github.com/SakuraLLM/Sakura-13B-Galgame/issues/42

	## 快速开始

	### 教程：

	详见[本仓库Wiki](https://github.com/SakuraLLM/Sakura-13B-Galgame/wiki).

	部分使用方法：[usage.md](https://github.com/SakuraLLM/SakuraLLM/blob/main/usage.md)

	> 请注意，如果给轻小说机翻站使用，请参见[机翻站站内教程](https://books.fishhawk.top/forum?category=Guide&page=1)，本 repo 不适用。

	### 模型下载：

	\| 参数量 \| 发布时间-底模-版本 \| 模型 \|
	\|:-------:\|:-------\|:-------\|
	\| 32B \| 20240508-Qwen1.5-32B-v0.9 \| 🤗 [Sakura-32B-Qwen2beta-v0.9-GGUF](https://huggingface.co/SakuraLLM/Sakura-32B-Qwen2beta-v0.9-GGUF) \|
	\| \| 20240508-Qwen1.5-32B-v0.10pre1 \| 🤗 [Sakura-32B-Qwen2beta-v0.10pre1-GGUF](https://huggingface.co/SakuraLLM/Sakura-32B-Qwen2beta-v0.10pre1-GGUF) \|
	\| 14B \| 20240111-Qwen-14B-v0.9 \| 🤗 [Sakura-13B-LNovel-v0.9b-GGUF](https://huggingface.co/SakuraLLM/Sakura-13B-LNovel-v0.9b-GGUF) \|
	\| \| 20240213-Qwen1.5-14B-v0.9 \| 🤗 [Sakura-14B-Qwen2beta-v0.9-GGUF](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2beta-v0.9-GGUF) \|
	\| \| 20240516-Qwen1.5-14B-v0.9.2 \| 🤗 [Sakura-14B-Qwen2beta-v0.9.2-GGUF](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2beta-v0.9.2-GGUF)
	\|(最新)\| 20241008-Qwen2.5-14B-v1.0 \| 🤗 [Sakura-14B-Qwen2.5-v1.0-GGUF](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2.5-v1.0-GGUF)
	\| 7B \| 20240116-Qwen-7B-v0.9 \| 🤗 [Sakura-7B-LNovel-v0.9-GGUF](https://huggingface.co/SakuraLLM/Sakura-7B-LNovel-v0.9-GGUF) \|
	\| \| 20240531-Qwen1.5-7B-Galtransl-v2.6 \| 🤗 [Galtransl-v2.6](https://huggingface.co/SakuraLLM/GalTransl-7B-v2.6) \|
	\| ~2B \| 20240214-Qwen1.5-1.8B-v0.9.1 \| 🤗 [Sakura-1B8-Qwen2beta-v0.9.1-GGUF](https://huggingface.co/SakuraLLM/Sakura-1B8-Qwen2beta-v0.9.1-GGUF) \|
	\|(最新)\| 20241012-Qwen2.5-1.5B-v1.0 \| 🤗 [Sakura-1.5B-Qwen2.5-v1.0-GGUF](https://huggingface.co/SakuraLLM/Sakura-1.5B-Qwen2.5-v1.0-GGUF) \|


	p.s. 如果无法连接到HuggingFace服务器，可将链接中的`huggingface.co`改成`hf-mirror.com`，使用hf镜像站下载。

	## News

	1. 更新了基于Qwen2.5-14B的v1.0正式版模型[Sakura-14B-Qwen2.5-v1.0](https://huggingface.co/SakuraLLM/Sakura-14B-Qwen2.5-v1.0-GGUF)和基于Qwen2.5-1.5B的v1.0正式版模型[Qwen2.5-1.5B-v1.0](https://huggingface.co/SakuraLLM/Sakura-1.5B-Qwen2.5-v1.0-GGUF)，prompt格式参见[下方说明](https://github.com/SakuraLLM/SakuraLLM#%E6%8E%A8%E7%90%86)。主要改进：
	- 改善翻译质量，提高翻译准确率，尤其是人称的准确率。
	- 支持术语表(GPT字典)，以保持专有名词和人称的一致性。
	- 提高部分简单控制符的保留能力，尤其是单行内存在`\n`的情况下保留`\n`的能力。降低行数与原文不一致的概率。
	- 由于底模使用GQA，推理速度和显存占用显著改善，可实现更快的多线程推理。关于多线程推理，可参考[Sakura启动器GUI使用教程](https://books.fishhawk.top/forum/656d60530286f15e3384fcf8)或[SakuraLLMServer](https://github.com/neavo/SakuraLLMServer)。

	# 更多信息

	详情请查看[此页面](https://github.com/SakuraLLM/SakuraLLM)