Spaces:

MikhailPugachev
/

hw4

Running

App Files Files Community

MikhailPugachev commited on Mar 31

Commit

0c47f30

1 Parent(s): bb1ee88

Исправлен путь к модели

Browse files

Files changed (1) hide show

app.py +14 -11

app.py CHANGED Viewed

@@ -4,18 +4,21 @@ import torch.nn.functional as F
 from transformers import AutoTokenizer
 from model_SingleLabelClassifier import SingleLabelClassifier
 from safetensors.torch import load_file
-# --- Настройки ---
 MODEL_NAME = "allenai/scibert_scivocab_uncased"
-CHECKPOINT_PATH = "checkpoint-28553"
-NUM_CLASSES = 7
-MAX_LEN = 320
-# --- Загрузка меток ---
-label2id = {'cs.CV': 0, 'cs.LG': 1, 'cs.AI': 2, 'cs.CL': 3, 'stat.ML': 4, 'cs.NE': 5, '<OTHER>': 6}
-id2label = {v: k for k, v in label2id.items()}
-# --- Загрузка модели и токенизатора ---
 @st.cache_resource
 def load_model_and_tokenizer():
     tokenizer = AutoTokenizer.from_pretrained(CHECKPOINT_PATH)
@@ -27,7 +30,7 @@ def load_model_and_tokenizer():
 model, tokenizer = load_model_and_tokenizer()
-# --- Функция предсказания ---
 def predict(title, summary, model, tokenizer, id2label, max_length=320, top_k=3):
     model.eval()
     text = title + ". " + summary
@@ -48,9 +51,9 @@ def predict(title, summary, model, tokenizer, id2label, max_length=320, top_k=3)
     top_indices = probs.argsort()[::-1][:top_k]
     return [(id2label[i], round(probs[i], 3)) for i in top_indices]
-# --- Интерфейс Streamlit ---
 st.title("ArXiv Tag Predictor")
-st.write("Вставьте заголовок и аннотацию статьи — получите предсказанный тег!")
 title = st.text_input("**Title**")
 summary = st.text_area("**Summary**", height=200)

 from transformers import AutoTokenizer
 from model_SingleLabelClassifier import SingleLabelClassifier
 from safetensors.torch import load_file
+import json
 MODEL_NAME = "allenai/scibert_scivocab_uncased"
+CHECKPOINT_PATH = "checkpoint-23985"
+NUM_CLASSES = 65
+MAX_LEN = 325020
+# Загрузка меток
+with open("label_mappings.json", "r") as f:
+    mappings = json.load(f)
+abel2id = mappings["label2id"]
+id2label = {int(k): v for k, v in mappings["id2label"].items()}
+# Загрузка модели и токенизатора
 @st.cache_resource
 def load_model_and_tokenizer():
     tokenizer = AutoTokenizer.from_pretrained(CHECKPOINT_PATH)
 model, tokenizer = load_model_and_tokenizer()
+# Функция предсказания
 def predict(title, summary, model, tokenizer, id2label, max_length=320, top_k=3):
     model.eval()
     text = title + ". " + summary
     top_indices = probs.argsort()[::-1][:top_k]
     return [(id2label[i], round(probs[i], 3)) for i in top_indices]
+# Интерфейс Streamlit
 st.title("ArXiv Tag Predictor")
+st.write("Вставьте заголовок и аннотацию статьи!")
 title = st.text_input("**Title**")
 summary = st.text_area("**Summary**", height=200)