Add models config, data folder (#1)

Files changed (10) hide show

.gitattributes CHANGED Viewed

@@ -30,3 +30,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 it-en.tsv filter=lfs diff=lfs merge=lfs -text

 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 it-en.tsv filter=lfs diff=lfs merge=lfs -text
+data/europarl_test.csv filter=lfs diff=lfs merge=lfs -text
+data/europarl_train.csv filter=lfs diff=lfs merge=lfs -text
+data/europarl_valid.csv filter=lfs diff=lfs merge=lfs -text

data/europarl_test.csv ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:84f64f0128451020ed962d4a4d580849d8da7c8f4ddbf7c00eafd9eab90b7b6c
+size 331420

data/europarl_train.csv ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:646002ef8fe7d578beb8690675234c556cbae20abe3c36de46bfe96626f0b9c0
+size 565391071

data/europarl_valid.csv ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e03c79cde3999b638fc40e972b63ed3ca88c2c816d2bd0aa7640cf34a9f88dec
+size 62842505

models/europarl/config.json ADDED Viewed

+{
+  "batch_size": 64,
+  "mask_probability": 0.15,
+  "num_layers": 6,
+  "num_heads": 8,
+  "d_model": 512,
+  "d_ff": 1024,
+  "p_dropout": 0.1,
+  "max_seq_len": 256,
+  "vocab_size": 20000,
+  "learning_rate": 1e-4,
+  "grad_clip_value": 1
+}

models/europarl/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

models/europarl/train_state_437000.pkl ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:eed8ce60e80f20b7f3bc6586e5bbc2fcb54c531d43584a7197155455194af582
+size 624575923

models/tatoeba/config.json ADDED Viewed

+{
+  "batch_size": 64,
+  "mask_probability": 0.15,
+  "num_layers": 6,
+  "num_heads": 8,
+  "d_model": 256,
+  "d_ff": 512,
+  "p_dropout": 0.1,
+  "max_seq_len": 128,
+  "vocab_size": 20000,
+  "learning_rate": 3e-4,
+  "grad_clip_value": 1
+}

mt_tokenizer.json → models/tatoeba/tokenizer.json RENAMED Viewed

File without changes

best_mt_train_state_468500.pkl → models/tatoeba/train_state_468500.pkl RENAMED Viewed

File without changes