Upload policy_config.py with huggingface_hub
Browse files- policy_config.py +5 -3
policy_config.py
CHANGED
@@ -11,6 +11,7 @@ exp_config = {
|
|
11 |
'cfg_type': 'BaseEnvManagerDict'
|
12 |
},
|
13 |
'stop_value': 6000,
|
|
|
14 |
'env_id': 'Walker2d-v3',
|
15 |
'norm_obs': {
|
16 |
'use_norm': False
|
@@ -20,7 +21,7 @@ exp_config = {
|
|
20 |
},
|
21 |
'collector_env_num': 1,
|
22 |
'evaluator_env_num': 8,
|
23 |
-
'
|
24 |
},
|
25 |
'policy': {
|
26 |
'model': {
|
@@ -74,9 +75,10 @@ exp_config = {
|
|
74 |
'render_freq': -1,
|
75 |
'mode': 'train_iter'
|
76 |
},
|
|
|
77 |
'cfg_type': 'InteractionSerialEvaluatorDict',
|
78 |
-
'
|
79 |
-
'
|
80 |
}
|
81 |
},
|
82 |
'other': {
|
|
|
11 |
'cfg_type': 'BaseEnvManagerDict'
|
12 |
},
|
13 |
'stop_value': 6000,
|
14 |
+
'n_evaluator_episode': 8,
|
15 |
'env_id': 'Walker2d-v3',
|
16 |
'norm_obs': {
|
17 |
'use_norm': False
|
|
|
21 |
},
|
22 |
'collector_env_num': 1,
|
23 |
'evaluator_env_num': 8,
|
24 |
+
'env_wrapper': 'mujoco_default'
|
25 |
},
|
26 |
'policy': {
|
27 |
'model': {
|
|
|
75 |
'render_freq': -1,
|
76 |
'mode': 'train_iter'
|
77 |
},
|
78 |
+
'figure_path': None,
|
79 |
'cfg_type': 'InteractionSerialEvaluatorDict',
|
80 |
+
'stop_value': 6000,
|
81 |
+
'n_episode': 8
|
82 |
}
|
83 |
},
|
84 |
'other': {
|