Initial commit

Files changed (9) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: BeamRiderNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 568.80 +/- 126.46
       name: mean_reward
       verified: false
 ---
@@ -73,7 +73,7 @@ OrderedDict([('batch_size', 32),
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
-             ('n_timesteps', 200000),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

       type: BeamRiderNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 13.20 +/- 20.16
       name: mean_reward
       verified: false
 ---
              ('gradient_steps', 1),
              ('learning_rate', 0.0001),
              ('learning_starts', 100000),
+             ('n_timesteps', 20000),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),
              ('target_update_interval', 1000),

args.yml CHANGED Viewed

@@ -56,7 +56,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 161184070
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 2411528922
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -18,7 +18,7 @@
   - - learning_starts
     - 100000
   - - n_timesteps
-    - 200000
   - - optimize_memory_usage
     - false
   - - policy

   - - learning_starts
     - 100000
   - - n_timesteps
+    - 20000
   - - optimize_memory_usage
     - false
   - - policy

dqn-BeamRiderNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ad6035bf71e95420b7a0cae970980ef24176a7d2c0b5b0d189bd551c02b489b
-size 13724476

 version https://git-lfs.github.com/spec/v1
+oid sha256:2863b0b1bca2725dcf602b845a9e4b0ed108b484462f6243940ea67c6c7a7a2c
+size 13724115

dqn-BeamRiderNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-BeamRiderNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2509be3e061e008e46f738fef59f00b633dbf652a3225cab15ebfd2e332c12f
-size 13517658

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2b70fbe343202aaea13d58027061705b3b9e1ee301fe389d912f42366096239
+size 13517466

dqn-BeamRiderNoFrameskip-v4/system_info.txt CHANGED Viewed

@@ -2,7 +2,7 @@
 - Python: 3.10.12
 - Stable-Baselines3: 2.4.0
 - PyTorch: 2.5.1+cu121
-- GPU Enabled: True
 - Numpy: 1.26.4
 - Cloudpickle: 3.1.0
 - Gymnasium: 1.0.0

 - Python: 3.10.12
 - Stable-Baselines3: 2.4.0
 - PyTorch: 2.5.1+cu121
+- GPU Enabled: False
 - Numpy: 1.26.4
 - Cloudpickle: 3.1.0
 - Gymnasium: 1.0.0

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~568~~.8, "std_reward": ~~126~~.~~4632753015673~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-12-12T07:12:28.~~270149~~"}


1	+ {"mean_reward": 13.2, "std_reward": 20.163333057805698, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-12-12T07:15:48.123436"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0fa95a265d96e1e24acaf6f3223e39dbd3536511ea66ccd06895b73824f94181
-size 591

 version https://git-lfs.github.com/spec/v1
+oid sha256:d536526182c8782387bc98327c91d08f5b1180b548a556aef358b9d5eaa9fae4
+size 504