SachiK
/

Llama3.2-PairRM-DPO

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Llama3.2-PairRM-DPO / training_args.bin

Commit History

SachiK/Llama3.2-PairRM-DPO

fb2b773
verified

SachiK commited on 13 days ago