Spaces:

mikeee
/

multilingual-dokugpt

Runtime error

ffreemt commited on Jun 23, 2023

Commit

689b5eb

1 Parent(s): fdb2623

Update

Files changed (1) hide show

app.py CHANGED Viewed

@@ -136,11 +136,10 @@ DEVICE = "cuda" if torch.cuda.is_available() else "cpu"
 # from langchain.embeddings import HuggingFaceEmbeddings
 # embeddings = HuggingFaceEmbeddings(model_name='paraphrase-multilingual-MiniLM-L12-v2')
 # https://www.sbert.net/docs/pretrained_models.html
-#
 # 'max_seq_length': 128
 MODEL_NAME = "paraphrase-multilingual-mpnet-base-v2"  # 1.11G
-MODEL_NAME = "paraphrase-multilingual-MiniLM-L12-v2"  # 471M
 # opanai max 4097
 # retriever default k = 4, query lenght about CHUNK_SIZE
@@ -424,8 +423,8 @@ def process_files(
     _ = (
         f"done file(s): {dict(ns.files_info)}, split to "
         f"{total} chunk(s). \n\nThe following embedding takes "
-        f" {total} step(s). (Each step lasts about 18 secs "
-        " on a free tier instance on huggingface space.)"
     )
     return _

 # from langchain.embeddings import HuggingFaceEmbeddings
 # embeddings = HuggingFaceEmbeddings(model_name='paraphrase-multilingual-MiniLM-L12-v2')
 # https://www.sbert.net/docs/pretrained_models.html
 # 'max_seq_length': 128
 MODEL_NAME = "paraphrase-multilingual-mpnet-base-v2"  # 1.11G
+MODEL_NAME = "paraphrase-multilingual-MiniLM-L12-v2"  # 471M
 # opanai max 4097
 # retriever default k = 4, query lenght about CHUNK_SIZE
     _ = (
         f"done file(s): {dict(ns.files_info)}, split to "
         f"{total} chunk(s). \n\nThe following embedding takes "
+        f"{total} step(s) and approximately {total/10:.1f} minutes. (Each step lasts about ~6 secs "
+        "on a free tier instance on huggingface space.)"
     )
     return _