yanivmel1 commited on
Commit
3fe6562
1 Parent(s): 42c6525

Upload folder using huggingface_hub

Browse files
Files changed (4) hide show
  1. README.md +12 -0
  2. config.json +49 -0
  3. config.yaml +241 -0
  4. model.safetensors +3 -0
README.md ADDED
@@ -0,0 +1,12 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ library_name: lerobot
3
+ tags:
4
+ - act
5
+ - model_hub_mixin
6
+ - pytorch_model_hub_mixin
7
+ - robotics
8
+ ---
9
+
10
+ This model has been pushed to the Hub using the [PytorchModelHubMixin](https://huggingface.co/docs/huggingface_hub/package_reference/mixins#huggingface_hub.PyTorchModelHubMixin) integration:
11
+ - Library: https://github.com/huggingface/lerobot
12
+ - Docs: [More Information Needed]
config.json ADDED
@@ -0,0 +1,49 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "chunk_size": 100,
3
+ "dim_feedforward": 3200,
4
+ "dim_model": 512,
5
+ "dropout": 0.1,
6
+ "feedforward_activation": "relu",
7
+ "input_normalization_modes": {
8
+ "observation.images.laptop": "mean_std",
9
+ "observation.images.phone": "mean_std",
10
+ "observation.state": "mean_std"
11
+ },
12
+ "input_shapes": {
13
+ "observation.images.laptop": [
14
+ 3,
15
+ 480,
16
+ 640
17
+ ],
18
+ "observation.images.phone": [
19
+ 3,
20
+ 480,
21
+ 640
22
+ ],
23
+ "observation.state": [
24
+ 6
25
+ ]
26
+ },
27
+ "kl_weight": 10.0,
28
+ "latent_dim": 32,
29
+ "n_action_steps": 100,
30
+ "n_decoder_layers": 1,
31
+ "n_encoder_layers": 4,
32
+ "n_heads": 8,
33
+ "n_obs_steps": 1,
34
+ "n_vae_encoder_layers": 4,
35
+ "output_normalization_modes": {
36
+ "action": "mean_std"
37
+ },
38
+ "output_shapes": {
39
+ "action": [
40
+ 6
41
+ ]
42
+ },
43
+ "pre_norm": false,
44
+ "pretrained_backbone_weights": "ResNet18_Weights.IMAGENET1K_V1",
45
+ "replace_final_stride_with_dilation": false,
46
+ "temporal_ensemble_coeff": null,
47
+ "use_vae": true,
48
+ "vision_backbone": "resnet18"
49
+ }
config.yaml ADDED
@@ -0,0 +1,241 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ resume: true
2
+ device: cuda
3
+ use_amp: false
4
+ seed: 1000
5
+ dataset_repo_id:
6
+ - yanivmel1/post_hack_cube_1
7
+ - yanivmel1/post_hack_cube_2
8
+ - yanivmel1/post_hack_cube_3
9
+ - yanivmel1/post_hack_cube_4
10
+ - yanivmel1/post_hack_cube_7
11
+ - yanivmel1/post_hack_cube_8
12
+ - yanivmel1/post_hack_cube_9
13
+ video_backend: pyav
14
+ training:
15
+ offline_steps: 200000
16
+ num_workers: 4
17
+ batch_size: 8
18
+ eval_freq: -1
19
+ log_freq: 100
20
+ save_checkpoint: true
21
+ save_freq: 10000
22
+ online_steps: 0
23
+ online_rollout_n_episodes: 1
24
+ online_rollout_batch_size: 1
25
+ online_steps_between_rollouts: 1
26
+ online_sampling_ratio: 0.5
27
+ online_env_seed: null
28
+ online_buffer_capacity: null
29
+ online_buffer_seed_size: 0
30
+ do_online_rollout_async: false
31
+ image_transforms:
32
+ enable: false
33
+ max_num_transforms: 3
34
+ random_order: false
35
+ brightness:
36
+ weight: 1
37
+ min_max:
38
+ - 0.8
39
+ - 1.2
40
+ contrast:
41
+ weight: 1
42
+ min_max:
43
+ - 0.8
44
+ - 1.2
45
+ saturation:
46
+ weight: 1
47
+ min_max:
48
+ - 0.5
49
+ - 1.5
50
+ hue:
51
+ weight: 1
52
+ min_max:
53
+ - -0.05
54
+ - 0.05
55
+ sharpness:
56
+ weight: 1
57
+ min_max:
58
+ - 0.8
59
+ - 1.2
60
+ lr: 1.0e-05
61
+ lr_backbone: 1.0e-05
62
+ weight_decay: 0.0001
63
+ grad_clip_norm: 10
64
+ delta_timestamps:
65
+ action:
66
+ - 0.0
67
+ - 0.03333333333333333
68
+ - 0.06666666666666667
69
+ - 0.1
70
+ - 0.13333333333333333
71
+ - 0.16666666666666666
72
+ - 0.2
73
+ - 0.23333333333333334
74
+ - 0.26666666666666666
75
+ - 0.3
76
+ - 0.3333333333333333
77
+ - 0.36666666666666664
78
+ - 0.4
79
+ - 0.43333333333333335
80
+ - 0.4666666666666667
81
+ - 0.5
82
+ - 0.5333333333333333
83
+ - 0.5666666666666667
84
+ - 0.6
85
+ - 0.6333333333333333
86
+ - 0.6666666666666666
87
+ - 0.7
88
+ - 0.7333333333333333
89
+ - 0.7666666666666667
90
+ - 0.8
91
+ - 0.8333333333333334
92
+ - 0.8666666666666667
93
+ - 0.9
94
+ - 0.9333333333333333
95
+ - 0.9666666666666667
96
+ - 1.0
97
+ - 1.0333333333333334
98
+ - 1.0666666666666667
99
+ - 1.1
100
+ - 1.1333333333333333
101
+ - 1.1666666666666667
102
+ - 1.2
103
+ - 1.2333333333333334
104
+ - 1.2666666666666666
105
+ - 1.3
106
+ - 1.3333333333333333
107
+ - 1.3666666666666667
108
+ - 1.4
109
+ - 1.4333333333333333
110
+ - 1.4666666666666666
111
+ - 1.5
112
+ - 1.5333333333333334
113
+ - 1.5666666666666667
114
+ - 1.6
115
+ - 1.6333333333333333
116
+ - 1.6666666666666667
117
+ - 1.7
118
+ - 1.7333333333333334
119
+ - 1.7666666666666666
120
+ - 1.8
121
+ - 1.8333333333333333
122
+ - 1.8666666666666667
123
+ - 1.9
124
+ - 1.9333333333333333
125
+ - 1.9666666666666666
126
+ - 2.0
127
+ - 2.033333333333333
128
+ - 2.066666666666667
129
+ - 2.1
130
+ - 2.1333333333333333
131
+ - 2.1666666666666665
132
+ - 2.2
133
+ - 2.2333333333333334
134
+ - 2.2666666666666666
135
+ - 2.3
136
+ - 2.3333333333333335
137
+ - 2.3666666666666667
138
+ - 2.4
139
+ - 2.433333333333333
140
+ - 2.466666666666667
141
+ - 2.5
142
+ - 2.533333333333333
143
+ - 2.566666666666667
144
+ - 2.6
145
+ - 2.6333333333333333
146
+ - 2.6666666666666665
147
+ - 2.7
148
+ - 2.7333333333333334
149
+ - 2.7666666666666666
150
+ - 2.8
151
+ - 2.8333333333333335
152
+ - 2.8666666666666667
153
+ - 2.9
154
+ - 2.933333333333333
155
+ - 2.966666666666667
156
+ - 3.0
157
+ - 3.033333333333333
158
+ - 3.066666666666667
159
+ - 3.1
160
+ - 3.1333333333333333
161
+ - 3.1666666666666665
162
+ - 3.2
163
+ - 3.2333333333333334
164
+ - 3.2666666666666666
165
+ - 3.3
166
+ eval:
167
+ n_episodes: 50
168
+ batch_size: 50
169
+ use_async_envs: true
170
+ wandb:
171
+ enable: false
172
+ disable_artifact: false
173
+ project: lerobot
174
+ notes: ''
175
+ fps: 30
176
+ env:
177
+ name: real_world
178
+ task: null
179
+ state_dim: 6
180
+ action_dim: 6
181
+ fps: ${fps}
182
+ override_dataset_stats:
183
+ observation.images.laptop:
184
+ mean:
185
+ - - - 0.485
186
+ - - - 0.456
187
+ - - - 0.406
188
+ std:
189
+ - - - 0.229
190
+ - - - 0.224
191
+ - - - 0.225
192
+ observation.images.phone:
193
+ mean:
194
+ - - - 0.485
195
+ - - - 0.456
196
+ - - - 0.406
197
+ std:
198
+ - - - 0.229
199
+ - - - 0.224
200
+ - - - 0.225
201
+ policy:
202
+ name: act
203
+ n_obs_steps: 1
204
+ chunk_size: 100
205
+ n_action_steps: 100
206
+ input_shapes:
207
+ observation.images.laptop:
208
+ - 3
209
+ - 480
210
+ - 640
211
+ observation.images.phone:
212
+ - 3
213
+ - 480
214
+ - 640
215
+ observation.state:
216
+ - ${env.state_dim}
217
+ output_shapes:
218
+ action:
219
+ - ${env.action_dim}
220
+ input_normalization_modes:
221
+ observation.images.laptop: mean_std
222
+ observation.images.phone: mean_std
223
+ observation.state: mean_std
224
+ output_normalization_modes:
225
+ action: mean_std
226
+ vision_backbone: resnet18
227
+ pretrained_backbone_weights: ResNet18_Weights.IMAGENET1K_V1
228
+ replace_final_stride_with_dilation: false
229
+ pre_norm: false
230
+ dim_model: 512
231
+ n_heads: 8
232
+ dim_feedforward: 3200
233
+ feedforward_activation: relu
234
+ n_encoder_layers: 4
235
+ n_decoder_layers: 1
236
+ use_vae: true
237
+ latent_dim: 32
238
+ n_vae_encoder_layers: 4
239
+ temporal_ensemble_momentum: null
240
+ dropout: 0.1
241
+ kl_weight: 10.0
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:aad43a34e7a70159505af050c19ba6937172445b5ba0e1a7d78fbdf4e7ab8055
3
+ size 206701072