SachiK
/

Llama3.2-PairRM-DPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama3.2-PairRM-DPO / README.md

Commit History

SachiK/Llama3.2-PairRM-DPO

fb2b773
verified

SachiK commited on 16 days ago