4season
/

alignment-model-test9

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

alignment-model-test9 / README.md

ldahee's picture

upload model9

d768106 7 months ago

|

history blame contribute delete

320 Bytes

	---
	license: apache-2.0
	language:
	- en
	---

	# 4season/model_eval_test


	# Introduction
	This model is test version, alignment-tuned model.

	We utilize state-of-the-art instruction fine-tuning methods including direct preference optimization (DPO).
	After DPO training, we linearly merged models to boost performance.