Edit Models filters

Apps

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

88

Full-text search

Active filters: reward-model

dongboklee/dPRM-14B

Text Classification • Updated 29 days ago • 19

dongboklee/gORM-8B

Text Generation • Updated 29 days ago • 7

dongboklee/gPRM-8B-merged

Text Generation • 8B • Updated 29 days ago • 10

dongboklee/gORM-8B-merged

Text Generation • 8B • Updated 29 days ago • 14

dongboklee/dORM-8B

Text Classification • Updated 29 days ago • 165

dongboklee/gPRM-8B

Text Generation • Updated 29 days ago

dongboklee/dPRM-8B

Text Classification • Updated 29 days ago • 166

mradermacher/Binary-Think-RM-8B-GGUF

8B • Updated 22 days ago • 237

mradermacher/Multiclass-Think-RM-8B-GGUF

8B • Updated 22 days ago • 236

ArtusDev/ilgee_Binary-Think-RM-8B-EXL3

Updated 22 days ago • 14

mradermacher/Binary-Think-RM-8B-i1-GGUF

8B • Updated 22 days ago • 394

mradermacher/Multiclass-Think-RM-8B-i1-GGUF

8B • Updated 22 days ago • 393

ArtusDev/ilgee_Multiclass-Think-RM-8B-EXL3

Updated 22 days ago • 16

Panga-Azazia/reward-model-v1

1.29M • Updated 14 days ago

Panga-Azazia/reward-model-v2

1.29M • Updated 14 days ago

Panga-Azazia/reward-model-v3

Tabular Regression • 1.29M • Updated 14 days ago • 21

Panga-Azazia/reward-model-v4

1.29M • Updated 13 days ago • 39

Panga-Azazia/reward-model-v5

1.68M • Updated 13 days ago • 81

Panga-Azazia/reward-model-v6

2.08M • Updated 13 days ago • 57

Panga-Azazia/reward-model-v7

2.08M • Updated 13 days ago

kp-forks/reward-model-deberta-v3-large-v2

Updated Feb 1, 2023 • 10

Panga-Azazia/reward-model-v8

2.88M • Updated 12 days ago • 28

Yuhan123/rm_cad_maj_vote_eval_acc_0_9065

Text Classification • 1B • Updated 11 days ago • 41

samhitha2601/llama3-gsm8k-critic

3B • Updated 11 days ago • 62

Panga-Azazia/reward-model

Tabular Regression • 908k • Updated 6 days ago • 47

Panga-Azazia/reward-model-1

908k • Updated 6 days ago • 51

Panga-Azazia/reward-model-2

908k • Updated 5 days ago

Coffeemood1611/railbird-rm-00

Updated 2 days ago • 52