nousr
/

dalle2-pytorch

nousr commited on Nov 11, 2022

Commit

fd00eb5

•

1 Parent(s): f03817b

Upload decoder/decoder_config.json with huggingface_hub

Files changed (1) hide show

decoder/decoder_config.json CHANGED Viewed

@@ -15,7 +15,7 @@
                 "attn_dim_head": 64,
                 "sparse_attn": true,
                 "memory_efficient": true,
-                "resnet_weight_standardization": true,
 		        "self_attn": [false, true, true, true]
             }
         ],
@@ -33,7 +33,7 @@
     "data": {
         "webdataset_base_url": "pipe:aws s3 cp --quiet s3://s-datasets/laion5b/laion2B-data/{}.tar -",
         "num_workers": 6,
-        "batch_size": 20,
         "start_shard": 0,
         "end_shard": 231349,
         "shard_width": 6,
@@ -56,12 +56,12 @@
     },
     "train": {
         "epochs": 1000,
-        "lr": 1e-4,
-        "wd": 0.01,
         "max_grad_norm": 0.5,
         "save_every_n_samples": 5000000,
         "find_unused_parameters": false,
-        "warmup_steps": 100,
         "amp": true,
         "n_sample_images": 10,
         "device": "cuda:0",

                 "attn_dim_head": 64,
                 "sparse_attn": true,
                 "memory_efficient": true,
+                "resnet_weight_standardization": false,
 		        "self_attn": [false, true, true, true]
             }
         ],
     "data": {
         "webdataset_base_url": "pipe:aws s3 cp --quiet s3://s-datasets/laion5b/laion2B-data/{}.tar -",
         "num_workers": 6,
+        "batch_size": 21,
         "start_shard": 0,
         "end_shard": 231349,
         "shard_width": 6,
     },
     "train": {
         "epochs": 1000,
+        "lr": 1.2e-4,
+        "wd": 0.0,
         "max_grad_norm": 0.5,
         "save_every_n_samples": 5000000,
         "find_unused_parameters": false,
+        "warmup_steps": 1000,
         "amp": true,
         "n_sample_images": 10,
         "device": "cuda:0",