Macedonian-ASR
/

mt5-restore-capitalization-macedonian

Model card Files Files and versions Community

Porjaz commited on Sep 30, 2024

Commit

9bec930

·

verified ·

1 Parent(s): 93b0b80

Update README.md

Files changed (1) hide show

README.md +19 -1

README.md CHANGED Viewed

@@ -9,4 +9,22 @@ base_model:
 ---
 mt-5-base model fine tuned for restoration and recapitalization for Macedonian language.
-The model is fine-tuned on a subset of the Macedonian portion of Wikipedia.

 ---
 mt-5-base model fine tuned for restoration and recapitalization for Macedonian language.
+The model is fine-tuned on a subset of the Macedonian portion of Wikipedia.
+## Usage
+```python
+from transformers import T5Tokenizer, T5ForConditionalGeneration
+recap_model_name = "Macedonian-ASR/mt5-restore-capitalization-macedonian"
+recap_tokenizer = T5Tokenizer.from_pretrained(recap_model_name)
+recap_model = T5ForConditionalGeneration.from_pretrained(recap_model_name)
+recap_model.to(device)
+sentence = "скопје е главен град на македонија"
+inputs = recap_tokenizer(["restore capitalization and punctuation: " + sentence], return_tensors="pt", padding=True).to(device)
+outputs = recap_model.generate(**inputs, max_length=768, num_beams=5, early_stopping=True).squeeze(0)
+recap_result = recap_tokenizer.decode(outputs, skip_special_tokens=True)
+print(recap_result)
+-> Скопје е главен град на Македонија.
+```