SachiK
/

Llama3.2-PairRM-DPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama3.2-PairRM-DPO / tokenizer.json

Commit History

SachiK/Llama3.2-PairRM-DPO

fb2b773
verified

SachiK commited on 18 days ago