mradermacher
/

R-PRM-7B-DPO-i1-GGUF

Reinforcement Learning

Model card Files Files and versions

R-PRM-7B-DPO-i1-GGUF / README.md

mradermacher's picture

uploaded from rain

5f106ac verified 8 months ago

|

229 Bytes

weighted/imatrix quants of https://huggingface.co/kevinpro/R-PRM-7B-DPO