0x05a4
/

DeepRL-PPO-LLv2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

DeepRL-PPO-LLv2 / LunarLander-v2-PPO-305 /policy.optimizer.pth

Commit History

Baseline: LR=5e-4/cosine-100, epochs=1e7/305

ab2dd36

0x05a4 commited on Jun 16, 2023