whisper-webui-translate

Runtime error

App Files Files Community

SoybeanMilk commited on Dec 11, 2023

Commit

73779c4

1 Parent(s): e57c738

Upload translationModel.py

Browse files

Files changed (1) hide show

src/translation/translationModel.py +20 -1

src/translation/translationModel.py CHANGED Viewed

@@ -7,9 +7,12 @@ import torch
 import ctranslate2
 import transformers
 from typing import Optional
 from src.config import ModelConfig
 from src.translation.translationLangs import TranslationLang, get_lang_from_whisper_code
 class TranslationModel:
     def __init__(
@@ -92,11 +95,17 @@ class TranslationModel:
                 self.transTokenizer = transformers.AutoTokenizer.from_pretrained(self.modelConfig.tokenizer_url if self.modelConfig.tokenizer_url is not None and len(self.modelConfig.tokenizer_url) > 0 else self.modelPath, src_lang=self.whisperLang.m2m100.code)
                 self.targetPrefix = [self.transTokenizer.lang_code_to_token[self.translationLang.m2m100.code]]
             self.transModel = ctranslate2.Translator(self.modelPath, compute_type="auto", device=self.device)
         elif "mt5" in self.modelPath:
             self.mt5Prefix = self.whisperLang.whisper.code + "2" + self.translationLang.whisper.code + ": "
             self.transTokenizer = transformers.T5Tokenizer.from_pretrained(self.modelPath, legacy=False) #requires spiece.model
             self.transModel = transformers.MT5ForConditionalGeneration.from_pretrained(self.modelPath)
             self.transTranslator = transformers.pipeline('text2text-generation', model=self.transModel, device=self.device, tokenizer=self.transTokenizer)
         else:
             self.transTokenizer = transformers.AutoTokenizer.from_pretrained(self.modelPath)
             self.transModel = transformers.AutoModelForSeq2SeqLM.from_pretrained(self.modelPath)
@@ -130,6 +139,12 @@ class TranslationModel:
             elif "mt5" in self.modelPath:
                 output = self.transTranslator(self.mt5Prefix + text, max_length=max_length, batch_size=self.batchSize, no_repeat_ngram_size=self.noRepeatNgramSize, num_beams=self.numBeams) #, num_return_sequences=2
                 result = output[0]['generated_text']
             else: #M2M100 & NLLB
                 output = self.transTranslator(text, max_length=max_length, batch_size=self.batchSize, no_repeat_ngram_size=self.noRepeatNgramSize, num_beams=self.numBeams)
                 result = output[0]['translation_text']
@@ -148,7 +163,8 @@ _MODELS = ["distilled-600M", "distilled-1.3B", "1.3B", "3.3B",
            "m2m100_1.2B-ct2", "m2m100_418M-ct2", "m2m100-12B-ct2",
            "m2m100_1.2B", "m2m100_418M",
            "mt5-zh-ja-en-trimmed",
-           "mt5-zh-ja-en-trimmed-fine-tuned-v1"]
 def check_model_name(name):
     return any(allowed_name in name for allowed_name in _MODELS)
@@ -206,6 +222,9 @@ def download_model(
         "special_tokens_map.json",
         "spiece.model",
         "vocab.json", #m2m100
     ]
     kwargs = {

 import ctranslate2
 import transformers
+import re
 from typing import Optional
 from src.config import ModelConfig
 from src.translation.translationLangs import TranslationLang, get_lang_from_whisper_code
+from peft import PeftModel
 class TranslationModel:
     def __init__(
                 self.transTokenizer = transformers.AutoTokenizer.from_pretrained(self.modelConfig.tokenizer_url if self.modelConfig.tokenizer_url is not None and len(self.modelConfig.tokenizer_url) > 0 else self.modelPath, src_lang=self.whisperLang.m2m100.code)
                 self.targetPrefix = [self.transTokenizer.lang_code_to_token[self.translationLang.m2m100.code]]
             self.transModel = ctranslate2.Translator(self.modelPath, compute_type="auto", device=self.device)
         elif "mt5" in self.modelPath:
             self.mt5Prefix = self.whisperLang.whisper.code + "2" + self.translationLang.whisper.code + ": "
             self.transTokenizer = transformers.T5Tokenizer.from_pretrained(self.modelPath, legacy=False) #requires spiece.model
             self.transModel = transformers.MT5ForConditionalGeneration.from_pretrained(self.modelPath)
             self.transTranslator = transformers.pipeline('text2text-generation', model=self.transModel, device=self.device, tokenizer=self.transTokenizer)
+        elif "ALMA" in self.modelPath:
+            self.ALMAPrefix = "Translate this from " + self.whisperLang.whisper.code + " to " + self.translationLang.whisper.code + ":" + self.whisperLang.whisper.code + ":"
+            self.transTokenizer = transformers.AutoTokenizer.from_pretrained(self.modelPath, use_fast=True)
+            self.transModel = transformers.AutoModelForCausalLM.from_pretrained(self.modelPath, device_map="auto", trust_remote_code=False, revision="main")
+            self.transTranslator = transformers.pipeline("text-generation", model=self.transModel, tokenizer=self.transTokenizer, batch_size=2, do_sample=True, temperature=0.7, top_p=0.95, top_k=40, repetition_penalty=1.1)
         else:
             self.transTokenizer = transformers.AutoTokenizer.from_pretrained(self.modelPath)
             self.transModel = transformers.AutoModelForSeq2SeqLM.from_pretrained(self.modelPath)
             elif "mt5" in self.modelPath:
                 output = self.transTranslator(self.mt5Prefix + text, max_length=max_length, batch_size=self.batchSize, no_repeat_ngram_size=self.noRepeatNgramSize, num_beams=self.numBeams) #, num_return_sequences=2
                 result = output[0]['generated_text']
+            elif "ALMA" in self.modelPath:
+                output = self.transTranslator(self.ALMAPrefix + text + self.translationLang.whisper.code + ":", max_length=max_length, batch_size=self.batchSize, no_repeat_ngram_size=self.noRepeatNgramSize, num_beams=self.numBeams)
+                result = output[0]['generated_text']
+                result = re.sub(rf'^(.*{self.translationLang.whisper.code}: )', '', result)  # Remove the prompt from the result
+                result = re.sub(rf'^(Translate this from .* to .*:)', '', result)  # Remove the translation instruction
+                return result.strip()
             else: #M2M100 & NLLB
                 output = self.transTranslator(text, max_length=max_length, batch_size=self.batchSize, no_repeat_ngram_size=self.noRepeatNgramSize, num_beams=self.numBeams)
                 result = output[0]['translation_text']
            "m2m100_1.2B-ct2", "m2m100_418M-ct2", "m2m100-12B-ct2",
            "m2m100_1.2B", "m2m100_418M",
            "mt5-zh-ja-en-trimmed",
+           "mt5-zh-ja-en-trimmed-fine-tuned-v1",
+           "ALMA-13B-GPTQ"]
 def check_model_name(name):
     return any(allowed_name in name for allowed_name in _MODELS)
         "special_tokens_map.json",
         "spiece.model",
         "vocab.json", #m2m100
+        "model.safetensors",
+        "quantize_config.json",
+        "tokenizer.model"
     ]
     kwargs = {