pszemraj
/

nGPT-enwiki8

pszemraj commited on Nov 4, 2024

Commit

2adf6da

verified ·

1 Parent(s): f20dc33

Upload folder using huggingface_hub

Files changed (7) hide show

config.json ADDED Viewed

+{
+    "num_batches": 100000,
+    "batch_size": 4,
+    "grad_accum_every": 4,
+    "learning_rate": 0.001,
+    "validate_every": 100,
+    "prime_length": 128,
+    "generate_every": 500,
+    "generate_length": 512,
+    "seq_len": 512,
+    "use_amp": true,
+    "use_parametrize": true,
+    "device": "cuda:0"
+}

nGPT_best.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:028dee2daed30c5f44902d8b537f4de7c16455469556620b25d997e40f6c0cbe
+size 304068666

nGPT_checkpoint_0.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:35caf7bb402298f4926804b35743c42c93372cfab485f197bc5de4f73856aada
+size 304071842

nGPT_checkpoint_50000.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2431af8a4c9bb9a8a7bc505430b715a17ae8f14c46ee94b6bc9eb7066fa79f85
+size 304073430

nGPT_checkpoint_latest.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5f71b1c0e3d92158f719a40d26e8775ebfd35988f7c84d7bfcc758dfe9ea7726
+size 304073891

nGPT_final.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:68f01173ad320bb63d74d9dc92dfbca6ae1bca629433f31eb921ab850cb3f75c
+size 101368482

training.log ADDED Viewed

The diff for this file is too large to render. See raw diff