shantanu-tr commited on
Commit
9fdc36c
1 Parent(s): 126e563

Upload folder using huggingface_hub

Browse files
Files changed (4) hide show
  1. README.md +12 -0
  2. config.json +61 -0
  3. config.yaml +262 -0
  4. model.safetensors +3 -0
README.md ADDED
@@ -0,0 +1,12 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ library_name: lerobot
3
+ tags:
4
+ - model_hub_mixin
5
+ - robotics
6
+ - act
7
+ - pytorch_model_hub_mixin
8
+ ---
9
+
10
+ This model has been pushed to the Hub using the [PytorchModelHubMixin](https://huggingface.co/docs/huggingface_hub/package_reference/mixins#huggingface_hub.PyTorchModelHubMixin) integration:
11
+ - Library: https://github.com/huggingface/lerobot
12
+ - Docs: [More Information Needed]
config.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "chunk_size": 100,
3
+ "dim_feedforward": 3200,
4
+ "dim_model": 512,
5
+ "dropout": 0.1,
6
+ "feedforward_activation": "relu",
7
+ "input_normalization_modes": {
8
+ "observation.images.cam_high": "mean_std",
9
+ "observation.images.cam_left_wrist": "mean_std",
10
+ "observation.images.cam_low": "mean_std",
11
+ "observation.images.cam_right_wrist": "mean_std",
12
+ "observation.state": "mean_std"
13
+ },
14
+ "input_shapes": {
15
+ "observation.images.cam_high": [
16
+ 3,
17
+ 480,
18
+ 640
19
+ ],
20
+ "observation.images.cam_left_wrist": [
21
+ 3,
22
+ 480,
23
+ 640
24
+ ],
25
+ "observation.images.cam_low": [
26
+ 3,
27
+ 480,
28
+ 640
29
+ ],
30
+ "observation.images.cam_right_wrist": [
31
+ 3,
32
+ 480,
33
+ 640
34
+ ],
35
+ "observation.state": [
36
+ 18
37
+ ]
38
+ },
39
+ "kl_weight": 10.0,
40
+ "latent_dim": 32,
41
+ "n_action_steps": 100,
42
+ "n_decoder_layers": 1,
43
+ "n_encoder_layers": 4,
44
+ "n_heads": 8,
45
+ "n_obs_steps": 1,
46
+ "n_vae_encoder_layers": 4,
47
+ "output_normalization_modes": {
48
+ "action": "mean_std"
49
+ },
50
+ "output_shapes": {
51
+ "action": [
52
+ 18
53
+ ]
54
+ },
55
+ "pre_norm": false,
56
+ "pretrained_backbone_weights": "ResNet18_Weights.IMAGENET1K_V1",
57
+ "replace_final_stride_with_dilation": false,
58
+ "temporal_ensemble_coeff": null,
59
+ "use_vae": true,
60
+ "vision_backbone": "resnet18"
61
+ }
config.yaml ADDED
@@ -0,0 +1,262 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ resume: false
2
+ device: cuda
3
+ use_amp: false
4
+ seed: 1000
5
+ dataset_repo_id: TrossenRoboticsCommunity/aloha_static_peg_insertion
6
+ video_backend: pyav
7
+ training:
8
+ offline_steps: 80000
9
+ num_workers: 4
10
+ batch_size: 8
11
+ eval_freq: -1
12
+ log_freq: 100
13
+ save_checkpoint: true
14
+ save_freq: 10000
15
+ online_steps: 0
16
+ online_rollout_n_episodes: 1
17
+ online_rollout_batch_size: 1
18
+ online_steps_between_rollouts: 1
19
+ online_sampling_ratio: 0.5
20
+ online_env_seed: null
21
+ online_buffer_capacity: null
22
+ online_buffer_seed_size: 0
23
+ do_online_rollout_async: false
24
+ image_transforms:
25
+ enable: false
26
+ max_num_transforms: 3
27
+ random_order: false
28
+ brightness:
29
+ weight: 1
30
+ min_max:
31
+ - 0.8
32
+ - 1.2
33
+ contrast:
34
+ weight: 1
35
+ min_max:
36
+ - 0.8
37
+ - 1.2
38
+ saturation:
39
+ weight: 1
40
+ min_max:
41
+ - 0.5
42
+ - 1.5
43
+ hue:
44
+ weight: 1
45
+ min_max:
46
+ - -0.05
47
+ - 0.05
48
+ sharpness:
49
+ weight: 1
50
+ min_max:
51
+ - 0.8
52
+ - 1.2
53
+ lr: 1.0e-05
54
+ lr_backbone: 1.0e-05
55
+ weight_decay: 0.0001
56
+ grad_clip_norm: 10
57
+ delta_timestamps:
58
+ action:
59
+ - 0.0
60
+ - 0.03333333333333333
61
+ - 0.06666666666666667
62
+ - 0.1
63
+ - 0.13333333333333333
64
+ - 0.16666666666666666
65
+ - 0.2
66
+ - 0.23333333333333334
67
+ - 0.26666666666666666
68
+ - 0.3
69
+ - 0.3333333333333333
70
+ - 0.36666666666666664
71
+ - 0.4
72
+ - 0.43333333333333335
73
+ - 0.4666666666666667
74
+ - 0.5
75
+ - 0.5333333333333333
76
+ - 0.5666666666666667
77
+ - 0.6
78
+ - 0.6333333333333333
79
+ - 0.6666666666666666
80
+ - 0.7
81
+ - 0.7333333333333333
82
+ - 0.7666666666666667
83
+ - 0.8
84
+ - 0.8333333333333334
85
+ - 0.8666666666666667
86
+ - 0.9
87
+ - 0.9333333333333333
88
+ - 0.9666666666666667
89
+ - 1.0
90
+ - 1.0333333333333334
91
+ - 1.0666666666666667
92
+ - 1.1
93
+ - 1.1333333333333333
94
+ - 1.1666666666666667
95
+ - 1.2
96
+ - 1.2333333333333334
97
+ - 1.2666666666666666
98
+ - 1.3
99
+ - 1.3333333333333333
100
+ - 1.3666666666666667
101
+ - 1.4
102
+ - 1.4333333333333333
103
+ - 1.4666666666666666
104
+ - 1.5
105
+ - 1.5333333333333334
106
+ - 1.5666666666666667
107
+ - 1.6
108
+ - 1.6333333333333333
109
+ - 1.6666666666666667
110
+ - 1.7
111
+ - 1.7333333333333334
112
+ - 1.7666666666666666
113
+ - 1.8
114
+ - 1.8333333333333333
115
+ - 1.8666666666666667
116
+ - 1.9
117
+ - 1.9333333333333333
118
+ - 1.9666666666666666
119
+ - 2.0
120
+ - 2.033333333333333
121
+ - 2.066666666666667
122
+ - 2.1
123
+ - 2.1333333333333333
124
+ - 2.1666666666666665
125
+ - 2.2
126
+ - 2.2333333333333334
127
+ - 2.2666666666666666
128
+ - 2.3
129
+ - 2.3333333333333335
130
+ - 2.3666666666666667
131
+ - 2.4
132
+ - 2.433333333333333
133
+ - 2.466666666666667
134
+ - 2.5
135
+ - 2.533333333333333
136
+ - 2.566666666666667
137
+ - 2.6
138
+ - 2.6333333333333333
139
+ - 2.6666666666666665
140
+ - 2.7
141
+ - 2.7333333333333334
142
+ - 2.7666666666666666
143
+ - 2.8
144
+ - 2.8333333333333335
145
+ - 2.8666666666666667
146
+ - 2.9
147
+ - 2.933333333333333
148
+ - 2.966666666666667
149
+ - 3.0
150
+ - 3.033333333333333
151
+ - 3.066666666666667
152
+ - 3.1
153
+ - 3.1333333333333333
154
+ - 3.1666666666666665
155
+ - 3.2
156
+ - 3.2333333333333334
157
+ - 3.2666666666666666
158
+ - 3.3
159
+ eval:
160
+ n_episodes: 50
161
+ batch_size: 50
162
+ use_async_envs: true
163
+ wandb:
164
+ enable: false
165
+ disable_artifact: false
166
+ project: lerobot
167
+ notes: ''
168
+ fps: 30
169
+ env:
170
+ name: real_world
171
+ task: null
172
+ state_dim: 18
173
+ action_dim: 18
174
+ fps: ${fps}
175
+ override_dataset_stats:
176
+ observation.images.cam_right_wrist:
177
+ mean:
178
+ - - - 0.485
179
+ - - - 0.456
180
+ - - - 0.406
181
+ std:
182
+ - - - 0.229
183
+ - - - 0.224
184
+ - - - 0.225
185
+ observation.images.cam_left_wrist:
186
+ mean:
187
+ - - - 0.485
188
+ - - - 0.456
189
+ - - - 0.406
190
+ std:
191
+ - - - 0.229
192
+ - - - 0.224
193
+ - - - 0.225
194
+ observation.images.cam_high:
195
+ mean:
196
+ - - - 0.485
197
+ - - - 0.456
198
+ - - - 0.406
199
+ std:
200
+ - - - 0.229
201
+ - - - 0.224
202
+ - - - 0.225
203
+ observation.images.cam_low:
204
+ mean:
205
+ - - - 0.485
206
+ - - - 0.456
207
+ - - - 0.406
208
+ std:
209
+ - - - 0.229
210
+ - - - 0.224
211
+ - - - 0.225
212
+ policy:
213
+ name: act
214
+ n_obs_steps: 1
215
+ chunk_size: 100
216
+ n_action_steps: 100
217
+ input_shapes:
218
+ observation.images.cam_right_wrist:
219
+ - 3
220
+ - 480
221
+ - 640
222
+ observation.images.cam_left_wrist:
223
+ - 3
224
+ - 480
225
+ - 640
226
+ observation.images.cam_high:
227
+ - 3
228
+ - 480
229
+ - 640
230
+ observation.images.cam_low:
231
+ - 3
232
+ - 480
233
+ - 640
234
+ observation.state:
235
+ - ${env.state_dim}
236
+ output_shapes:
237
+ action:
238
+ - ${env.action_dim}
239
+ input_normalization_modes:
240
+ observation.images.cam_right_wrist: mean_std
241
+ observation.images.cam_left_wrist: mean_std
242
+ observation.images.cam_high: mean_std
243
+ observation.images.cam_low: mean_std
244
+ observation.state: mean_std
245
+ output_normalization_modes:
246
+ action: mean_std
247
+ vision_backbone: resnet18
248
+ pretrained_backbone_weights: ResNet18_Weights.IMAGENET1K_V1
249
+ replace_final_stride_with_dilation: false
250
+ pre_norm: false
251
+ dim_model: 512
252
+ n_heads: 8
253
+ dim_feedforward: 3200
254
+ feedforward_activation: relu
255
+ n_encoder_layers: 4
256
+ n_decoder_layers: 1
257
+ use_vae: true
258
+ latent_dim: 32
259
+ n_vae_encoder_layers: 4
260
+ temporal_ensemble_momentum: null
261
+ dropout: 0.1
262
+ kl_weight: 10.0
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:e3a057da43d0a167dfa5c45c78f451ba1c8de5eed0185f4e011c5424ea8a8f37
3
+ size 206800312