Lior Baruch's picture

Lior Baruch

LBK95

·

Lior-Baruch

AI & ML interests

DL

Recent Activity

updated a model 1 day ago

LBK95/GRPO_Iterative_Q1Q2_Llama32-1B_LA5_MCL12_G8_full

published a model 1 day ago

LBK95/GRPO_Iterative_Q1Q2_Llama32-1B_LA5_MCL12_G8_full

updated a model 2 days ago

LBK95/PTO_Iterative_Q1Q2_Llama32-1B_LA5_MCL12_M8_PTgreedy_full

View all activity

Organizations

None yet

LBK95 's models 137

LBK95/PTO_Iterative_Q1Q2_Llama32-1B_LA5_MCL12_M8_PTgreedy_full

Updated 1 day ago

LBK95/GRPO_Iterative_Q1Q2_Llama32-1B_LA0_MCL12_G8_full

Updated 1 day ago

LBK95/GRPO_Iterative_Q1Q2_Llama32-1B_LA5_MCL12_G8_full

Updated 1 day ago

LBK95/PTO_Iterative_Q1Q2_Llama32-1B_LA0_MCL12_M8_PTgreedy_full

Updated 2 days ago

LBK95/GRPO_Iterative_Q1Q2_Llama32-1B_LA5_MCL12_G8_full_Archive_V2

Updated 5 days ago

LBK95/GRPO_Oracle_Llama32-1B-Instruct_LA5_G4_V2

LBK95/GRPO_Oracle_Llama32-1B_LA5_G4_V2

LBK95/GRPO_Oracle_Llama32-1B_LA5_G4_V1

LBK95/GRPO-OracleRM_Q1Q2_V1-adapter-v1

LBK95/grpo-OracleRM_Async_4responses_V1-adapter-v1

LBK95/grpo-OracleRM_Async_4responses_V1

LBK95/grpo-OracleReward_Async_2responses_V1

LBK95/grpo-OracleReward_Async_V1

LBK95/grpo-OracleReward_V1

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.15

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.14

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.13

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.12

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.11

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.10

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.9

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.8

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.7

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.6

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.5

LBK95/Llama-3.2-1B-Instruct-Reward-Model-Finetuned_V1.4

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.4

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.3

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.2

LBK95/Llama-3.2-1B-Reward-Model-Finetuned_V1.1