DPO - a nbeerbower Collection

nbeerbower 's Collections

abliteration loras

DPO

bruphin

flammen

llama 3 experiments

Nemo

DPO

updated 13 days ago

Various useful datasets with preference optimization