August Moharrami's picture

1 3 3

August Moharrami

August4293

·

AI & ML interests

None yet

Recent Activity

updated a model 8 days ago

August4293/Llama3.1-8B-PRM-Deepseek-Data-4bit

published a model 8 days ago

August4293/Llama3.1-8B-PRM-Deepseek-Data-4bit

updated a model 9 days ago

August4293/tiny-llama3.1-8B-PRM-Deepseek-Data

View all activity

Organizations

August4293's activity

upvoted a paper 30 days ago

Offline Reinforcement Learning for LLM Multi-Step Reasoning

Paper • 2412.16145 • Published Dec 20, 2024 • 38

upvoted a paper about 1 month ago

Training Large Language Models to Reason in a Continuous Latent Space

Paper • 2412.06769 • Published Dec 9, 2024 • 74