NlpHUST
/

gpt2-vietnamese

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

nhanv commited on May 30, 2022

Commit

27f0101

•

1 Parent(s): 0fda306

Update README.md

Files changed (1) hide show

README.md +3 -0

README.md CHANGED Viewed

@@ -31,3 +31,6 @@ model = AutoModelForCausalLM.from_pretrained("nhanv/vi-gpt2")
 # Model architecture
 A 12-layer, 768-hidden-size transformer-based language model.

 # Model architecture
 A 12-layer, 768-hidden-size transformer-based language model.
+# Training
+The model was trained on Vietnamese Oscar dataset (32 GB) to optimize a traditional language modelling objective on v3-8 TPU for around 6 days. It reaches around 13.4 perplexity on a chosen validation set from Oscar.