rwkv-v5-1b5-translator

Sleeping

picocreator commited on Oct 28, 2023

Commit

5709a62

•

1 Parent(s): 4080581

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -94,7 +94,14 @@ Death does not concern us, because as long as we exist, death is not here. And w
 PREFIX_STATE = precompute_state(INSTRUCT_PREFIX)
 # Translation logic
-def translate(text, source_language, target_language, inState=PREFIX_STATE):
     prompt = f"## From {source_language}:\n{text}\n\n## To {target_language}:\n"
     ctx = prompt.strip()
     all_tokens = []
@@ -102,6 +109,9 @@ def translate(text, source_language, target_language, inState=PREFIX_STATE):
     out_str = ''
     occurrence = {}
     state = None
     if inState != None:
         state = universal_deepcopy(inState)
@@ -114,10 +124,21 @@ def translate(text, source_language, target_language, inState=PREFIX_STATE):
     # Generate things token by token
     for i in range(ctx_limit):
         out, state = model.forward(pipeline.encode(ctx)[-ctx_limit:] if i == 0 else [token], state)
-        token = pipeline.sample_logits(out, temperature=0.1, top_p=0.5)
         if token in [0]:  # EOS token
             break
         all_tokens += [token]
         tmp = pipeline.decode(all_tokens[out_last:])
         if '\ufffd' not in tmp:
             out_str += tmp
@@ -166,7 +187,6 @@ def translate(text, source_language, target_language, inState=PREFIX_STATE):
 # Languages
 LANGUAGES = [
   "English",
-  "Zombie Speak",
   "Chinese",
   "Spanish",
   "Bengali",

 PREFIX_STATE = precompute_state(INSTRUCT_PREFIX)
 # Translation logic
+def translate(
+        text, source_language, target_language,
+        inState=PREFIX_STATE,
+        temperature=0.2,
+        top_p=0.5,
+        presencePenalty = 0.1,
+        countPenalty = 0.1,
+    ):
     prompt = f"## From {source_language}:\n{text}\n\n## To {target_language}:\n"
     ctx = prompt.strip()
     all_tokens = []
     out_str = ''
     occurrence = {}
+    alpha_frequency = countPenalty
+    alpha_presence = presencePenalty
     state = None
     if inState != None:
         state = universal_deepcopy(inState)
     # Generate things token by token
     for i in range(ctx_limit):
         out, state = model.forward(pipeline.encode(ctx)[-ctx_limit:] if i == 0 else [token], state)
+        for n in occurrence:
+            out[n] -= (alpha_presence + occurrence[n] * alpha_frequency)
+        token = pipeline.sample_logits(out, temperature=temperature, top_p=top_p)
         if token in [0]:  # EOS token
             break
         all_tokens += [token]
+        for xxx in occurrence:
+            occurrence[xxx] *= 0.996
+        if token not in occurrence:
+            occurrence[token] = 1
+        else:
+            occurrence[token] += 1
         tmp = pipeline.decode(all_tokens[out_last:])
         if '\ufffd' not in tmp:
             out_str += tmp
 # Languages
 LANGUAGES = [
   "English",
   "Chinese",
   "Spanish",
   "Bengali",