RLHF-And-Friends
/

TLDR-Mistral-7B-SmallSFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

TLDR-Mistral-7B-SmallSFT-PPO / tokenizer.json

arqa39's picture

Upload folder using huggingface_hub

30d6350 verified 10 days ago

history contribute delete

3.51 MB

File too large to display, you can check the raw version instead.