YYYYYYibo
/

two_agent_rdpo_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

two_agent_rdpo_iter_2

Commit History

RDPO-7b-beta0.01-eta0.001

96ac2a4
verified

YYYYYYibo commited on Aug 1, 2024

Model save

8097c02
verified

YYYYYYibo commited on Aug 1, 2024

Training in progress, step 100

e9d1149
verified

YYYYYYibo commited on Aug 1, 2024

initial commit

a51e1c1
verified

YYYYYYibo commited on Aug 1, 2024