RLHF-And-Friends
/

TLDR-Mistral-7B-SmallSFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

TLDR-Mistral-7B-SmallSFT-PPO / .gitattributes

Commit History

initial commit

4c7fb1f
verified

arqa39 commited on 10 days ago