Initial commit

Files changed (11) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ model-index:
       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
-      value: 401.50 +/- 239.43
       name: mean_reward
       verified: false
 ---
@@ -62,16 +62,16 @@ python -m rl_zoo3.push_to_hub --algo dqn --env SpaceInvadersNoFrameskip-v4 -f lo
 ## Hyperparameters
 ```python
-OrderedDict([('batch_size', 1024),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
-             ('exploration_fraction', 0.025),
              ('frame_stack', 4),
              ('gradient_steps', 1),
-             ('learning_rate', 0.0001),
-             ('learning_starts', 10000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),

       type: SpaceInvadersNoFrameskip-v4
     metrics:
     - type: mean_reward
+      value: 439.50 +/- 160.10
       name: mean_reward
       verified: false
 ---
 ## Hyperparameters
 ```python
+OrderedDict([('batch_size', 32),
              ('buffer_size', 100000),
              ('env_wrapper',
               ['stable_baselines3.common.atari_wrappers.AtariWrapper']),
              ('exploration_final_eps', 0.01),
+             ('exploration_fraction', 0.1),
              ('frame_stack', 4),
              ('gradient_steps', 1),
+             ('learning_rate', 5e-05),
+             ('learning_starts', 100000),
              ('n_timesteps', 1000000.0),
              ('optimize_memory_usage', False),
              ('policy', 'CnnPolicy'),

args.yml CHANGED Viewed

@@ -54,7 +54,7 @@
   - - save_replay_buffer
     - false
   - - seed
-    - 265090744
   - - storage
     - null
   - - study_name

   - - save_replay_buffer
     - false
   - - seed
+    - 2950847451
   - - storage
     - null
   - - study_name

config.yml CHANGED Viewed

@@ -1,6 +1,6 @@
 !!python/object/apply:collections.OrderedDict
 - - - batch_size
-    - 1024
   - - buffer_size
     - 100000
   - - env_wrapper
@@ -8,15 +8,15 @@
   - - exploration_final_eps
     - 0.01
   - - exploration_fraction
-    - 0.025
   - - frame_stack
     - 4
   - - gradient_steps
     - 1
   - - learning_rate
-    - 0.0001
   - - learning_starts
-    - 10000
   - - n_timesteps
     - 1000000.0
   - - optimize_memory_usage

 !!python/object/apply:collections.OrderedDict
 - - - batch_size
+    - 32
   - - buffer_size
     - 100000
   - - env_wrapper
   - - exploration_final_eps
     - 0.01
   - - exploration_fraction
+    - 0.1
   - - frame_stack
     - 4
   - - gradient_steps
     - 1
   - - learning_rate
+    - 5.0e-05
   - - learning_starts
+    - 100000
   - - n_timesteps
     - 1000000.0
   - - optimize_memory_usage

dqn-SpaceInvadersNoFrameskip-v4.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:631f377061bbe104afe5783aeef3d9f4baec192b586baecf92c644feb1c4b1da
-size 27220145

 version https://git-lfs.github.com/spec/v1
+oid sha256:957236f18d3e3f30047ed00f3c209f1bc93a56d0d72904da34f9df381a356386
+size 27219567

dqn-SpaceInvadersNoFrameskip-v4/data CHANGED Viewed

The diff for this file is too large to render. See raw diff

dqn-SpaceInvadersNoFrameskip-v4/policy.optimizer.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6087e71397fd9c75ee574d9f4cc334904c0e051a0cc44f33b33eeb2c7946070b
-size 13506236

 version https://git-lfs.github.com/spec/v1
+oid sha256:dbdc0786aa251991a7ce281a95eb737abd9f82f502614cc284716facf26622db
+size 13505852

dqn-SpaceInvadersNoFrameskip-v4/policy.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:800b917b9a9178db8a3d33c4fa92e74b2a86a375b8b5e6dce9586943d8b968f9
-size 13505370

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c3483fbd54e25077af91ddda75375a05bbb4f7de881642df93ad05180358478
+size 13505178

dqn-SpaceInvadersNoFrameskip-v4/system_info.txt CHANGED Viewed

@@ -2,7 +2,7 @@
 - Python: 3.10.12
 - Stable-Baselines3: 2.3.0a2
 - PyTorch: 2.2.1+cu121
-- GPU Enabled: True
 - Numpy: 1.26.4
 - Cloudpickle: 3.0.0
 - Gymnasium: 0.29.1

 - Python: 3.10.12
 - Stable-Baselines3: 2.3.0a2
 - PyTorch: 2.2.1+cu121
+- GPU Enabled: False
 - Numpy: 1.26.4
 - Cloudpickle: 3.0.0
 - Gymnasium: 0.29.1

replay.mp4 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:767c4e20c0d9b64b4c168ca2032209c82a40398f96ac64aeb21439829410c005
-size 245193

 version https://git-lfs.github.com/spec/v1
+oid sha256:09b62df74873f116319719d1db42d488af1e87b579d5f8537042955d6add0416
+size 219308

results.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"mean_reward": ~~401~~.5, "std_reward": ~~239~~.~~4269199568002~~, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-02-~~27T15~~:17:29.~~785296~~"}


1	+ {"mean_reward": 439.5, "std_reward": 160.10074952978826, "is_deterministic": false, "n_eval_episodes": 10, "eval_datetime": "2024-02-27T19:51:07.021708"}

train_eval_metrics.zip CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7119cd1f7a617469a4b69042d57e7b993518b3c08264157df6f162f60144b5b4
-size 41098

 version https://git-lfs.github.com/spec/v1
+oid sha256:5b65e028ee4bce23630c333ecbc0a5fda0782023ec966a7f85617beab03be66d
+size 41027