0x05a4
/

DeepRL-PPO-LLv2

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

DeepRL-PPO-LLv2 / LunarLander-v2-PPO-305 /_stable_baselines3_version

0x05a4's picture

Baseline: LR=5e-4/cosine-100, epochs=1e7/305

ab2dd36 over 1 year ago

7 Bytes

2.0.0a5