Charles Koutcheme's picture

Charles Koutcheme PRO

koutch

·

https://koutche.me

AI & ML interests

Source code modelling using large language models

Recent Activity

updated a model 4 days ago

koutch/paper_smol_3.json_train_dpo_v1_train_no_think

updated a model 4 days ago

koutch/paper_qwen_3.json_train_dpo_v1_train_no_think

updated a model 4 days ago

koutch/paper_smol_smol3-3B_train_sft_train_think

View all activity

Organizations

updated 20 models 4 days ago

koutch/paper_smol_3.json_train_dpo_v1_train_no_think

Text Generation • 3B • Updated 4 days ago • 25

koutch/paper_qwen_3.json_train_dpo_v1_train_no_think

Text Generation • 4B • Updated 4 days ago • 24

koutch/paper_smol_smol3-3B_train_sft_train_think

Text Generation • 3B • Updated 4 days ago • 88

koutch/paper_qwen_qwen3-instruct-4b_train_sft_train_think

Text Generation • 4B • Updated 4 days ago • 49

koutch/paper_smol_smol3-3B_train_sft_train_no_think

Text Generation • 3B • Updated 4 days ago • 60

koutch/paper_llama_llama3.1-8b_train_sft_train_think

Text Generation • 8B • Updated 4 days ago • 63

koutch/paper_llama_llama3.1-8b_train_sft_train_no_think

Text Generation • 8B • Updated 4 days ago • 51

koutch/paper_llama_llama3.1-8b_train_sft_train_para

Text Generation • 8B • Updated 4 days ago • 60

koutch/paper_smol_smol3-3B_train_sft_train_para

Text Generation • 3B • Updated 4 days ago • 56

koutch/paper_smol_smol3-3B_train_sft_all_train_think

Text Generation • 3B • Updated 4 days ago • 56

koutch/paper_qwen_qwen3-instruct-4b_train_sft_train_no_think

Text Generation • 4B • Updated 4 days ago • 51

koutch/paper_qwen_qwen3-instruct-4b_train_sft_train_para

Text Generation • 4B • Updated 4 days ago • 56

koutch/paper_qwen_qwen3-instruct-4b_train_sft_all_train_think

Text Generation • 4B • Updated 4 days ago • 46

koutch/paper_qwen_qwen3-instruct-4b_train_sft_all_train_think

Text Generation • 4B • Updated 4 days ago • 46

koutch/paper_llama_llama3.1-8b_train_sft_train_think

Text Generation • 8B • Updated 4 days ago • 63

koutch/paper_llama_llama3.1-8b_train_sft_train_no_think

Text Generation • 8B • Updated 4 days ago • 51

koutch/paper_llama_llama3.1-8b_train_sft_train_para

Text Generation • 8B • Updated 4 days ago • 60

koutch/paper_smol_3.json_train_dpo_v1_train_no_think

Text Generation • 3B • Updated 4 days ago • 25

koutch/paper_qwen_qwen3-instruct-4b_train_sft_train_think

Text Generation • 4B • Updated 4 days ago • 49

koutch/paper_qwen_qwen3-instruct-4b_train_sft_train_no_think

Text Generation • 4B • Updated 4 days ago • 51