tanliboy
/

llama-3.2-3b-dpo-2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llama-3.2-3b-dpo-2 / model-00002-of-00002.safetensors

Commit History

Model save

daad045
verified

tanliboy commited on Oct 1

Training in progress, step 1722

e899843
verified

tanliboy commited on Oct 1

Training in progress, step 1500

3716009
verified

tanliboy commited on Oct 1

Training in progress, step 1200

b44a911
verified

tanliboy commited on Oct 1

Training in progress, step 900

7d3ae09
verified

tanliboy commited on Oct 1

Training in progress, step 600

f27f489
verified

tanliboy commited on Oct 1

Training in progress, step 300

2b6a542
verified

tanliboy commited on Oct 1