Spaces:

Pendrokar
/

DeepMoji

Running

Pendrokar commited on Feb 2

Commit

6755c50

•

1 Parent(s): 2b5c8ca

huggingface_hub to download model and vocab

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,13 +10,12 @@ import numpy as np
 from torchmoji.sentence_tokenizer import SentenceTokenizer
 from torchmoji.model_def import torchmoji_emojis
-from transformers import AutoModel, AutoTokenizer
 model_name = "Pendrokar/TorchMoji"
-model = AutoModel.from_pretrained(model_name, cache_dir="~/.cache/huggingface/hub/")
-model.save_pretrained("~/.cache/huggingface/hub/TorchMoji/pytorch_model.bin")
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model_path = "~/.cache/huggingface/hub/TorchMoji/pytorch_model.bin"
-vocab_path = './' + model_name + "/vocabulary.json"
 def top_elements(array, k):
     ind = np.argpartition(array, -k)[-k:]
@@ -24,6 +23,10 @@ def top_elements(array, k):
 maxlen = 30
 st = SentenceTokenizer(tokenizer.get_added_vocab(), maxlen)
 model = torchmoji_emojis(model_path)

 from torchmoji.sentence_tokenizer import SentenceTokenizer
 from torchmoji.model_def import torchmoji_emojis
+from huggingface_hub import hf_hub_download
 model_name = "Pendrokar/TorchMoji"
+model_path = hf_hub_download(repo_id=model_name, filename="pytorch_model.bin")
+vocab_path = hf_hub_download(repo_id=model_name, filename="vocabulary.json")
 def top_elements(array, k):
     ind = np.argpartition(array, -k)[-k:]
 maxlen = 30
+print('Tokenizing using dictionary from {}'.format(vocab_path))
+with open(vocab_path, 'r') as f:
+    vocabulary = json.load(f)
 st = SentenceTokenizer(tokenizer.get_added_vocab(), maxlen)
 model = torchmoji_emojis(model_path)