Reward Consistency Model - a naiweizi Collection

naiweizi 's Collections

Reward Consistency Model

Reward Consistency Model

updated Mar 28

naiweizi/dpo-harmless_saferlhf

Updated Jun 18