Initial commit

Files changed (10) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 163.50 +/- 34.72
       name: mean_reward
       verified: false
 ---
@@ -62,15 +62,15 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 64),
              ('buffer_size', 1000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
-             ('exploration_final_eps', 0.5),
              ('exploration_fraction', 1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.001),
              ('learning_starts', 1000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 178.50 +/- 157.47
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 128),
              ('buffer_size', 1000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
+             ('exploration_final_eps', 0.05),
              ('exploration_fraction', 1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 0.0001),
              ('learning_starts', 1000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 4072161153
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 4084644614
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,12 +1,12 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 64
   - - buffer_size
     - 1000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
-    - 0.5
   - - exploration_fraction
     - 1
   - - frame_stack
@@ -14,7 +14,7 @@
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.001
   - - learning_starts
     - 1000
   - - n_timesteps

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 128
   - - buffer_size
     - 1000
   - - env_wrapper
     - - stable_baselines3.common.atari_wrappers.AtariWrapper
   - - exploration_final_eps
+    - 0.05
   - - exploration_fraction
     - 1
   - - frame_stack
   - - gradient_steps
     - 1
   - - learning_rate
+    - 0.0001
   - - learning_starts
     - 1000
   - - n_timesteps

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1d1f2a8c0f3586754fa701ed0b480aab4ff406ab9730482241660d5192d9190
-size 27218366

 version https://git-lfs.github.com/spec/v1
+oid sha256:22a01f82e2e21f00b88021f80f57c52d00f4f0fb2fb340c6f67440be10d75fc5
+size 27218385

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0a3d964c1178fde7a6b63740b0105963620891a449a1ac561ddf3620c45993f
 size 13505739

 version https://git-lfs.github.com/spec/v1
+oid sha256:95f96e67dfa30950706c1bb5651cc76b6974939c7b75e1289199c4b757e9b5b5
 size 13505739

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:924b9dcd55124d23936883f683e5c6b4bb231b43c32e52011c3c179922b7a730
 size 13504937

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ccee755a3e6e35086544de99352df41e4b91be4264af751cef16483a39b8ba1
 size 13504937

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8c770163c90b14dd48b034d05e636471c65b483c1b322dbe51a48a780ade1edb
-size 263363

 version https://git-lfs.github.com/spec/v1
+oid sha256:b16b2ef1bf6c348dcd0c313dd9095818c8c6e17a48c95c0834722babd2644f7d
+size 286968

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~163~~.5, "std_reward": 34.~~7167106736799~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-07-~~17T19~~:48:49.~~877603~~"}


1	+ {"mean_reward": 178.5, "std_reward": 157.46507549294859, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2023-07-17T21:16:49.576883"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3276e7e1599db5d2e62f357a9b4f37d28404e91c2d0fe03ca879fd9ef06840ab
-size 49381

 version https://git-lfs.github.com/spec/v1
+oid sha256:adb7a4f1b50923a0c3e037d0c900f63b9e830de3135081f5e57497208177c8a1
+size 47226