Init cpm-bee-1b

Files changed (3) hide show

config.json ADDED Viewed

+{
+    "vocab_size": 86583,
+    "dim_model": 4096,
+    "dim_ff" : 1024,
+    "num_layers" : 48,
+    "num_heads": 32,
+    "dim_head" : 40,
+    "dropout_p" : 0.0,
+    "position_bias_num_buckets" : 256,
+    "position_bias_num_segment_buckets": 256,
+    "position_bias_max_distance" : 2048,
+    "eps" : 1e-6,
+    "half" : true,
+    "mask_modules": [[false, false], [true, false], [false, false], [true, false], [true, true], [true, false], [true, true], [true, true], [false, false], [false, false], [true, true], [true, false], [true, false], [true, true], [false, false], [true, true], [false, false], [false, true], [true, false], [true, true], [false, false], [false, true], [true, true], [true, true], [false, false], [true, true], [false, false], [true, true], [true, true], [false, false], [true, true], [false, false], [true, true], [false, false], [true, true], [true, false], [true, true], [true, true], [true, true], [false, false], [true, true], [false, false], [true, true], [true, true], [false, false], [true, true], [false, false], [false, false]]
+}

pytorch_model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a4900eb67843181959ea77043a59a7d7e78fb688bd9ee61858658c10823c1b33
+size 2110668093

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff