Spaces:

Piggihex
/

CodeT5

Sleeping

Sixparticle commited on 18 days ago

Commit

83d6a1c

1 Parent(s): b51e859

Use slow Roberta tokenizer for CodeT5

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,39 +1,16 @@
 import gradio as gr
-import json
-import os
-from huggingface_hub import snapshot_download
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import torch
 # 加载 CodeT5+ 模型
 model_name = "Salesforce/codet5p-220m"
-def prepare_local_model(repo_id: str, local_dir: str = "./model_cache") -> str:
-    snapshot_download(repo_id=repo_id, local_dir=local_dir)
-    added_tokens_file = os.path.join(local_dir, "added_tokens.json")
-    if os.path.exists(added_tokens_file):
-        with open(added_tokens_file, "r", encoding="utf-8") as f:
-            data = json.load(f)
-        # Ensure the file is a plain token list for compatibility with tokenizers.add_tokens.
-        if isinstance(data, dict):
-            normalized = list(data.keys())
-        elif isinstance(data, list):
-            normalized = [str(item) for item in data]
-        else:
-            normalized = []
-        with open(added_tokens_file, "w", encoding="utf-8") as f:
-            json.dump(normalized, f, ensure_ascii=False)
-    return local_dir
-local_model_dir = prepare_local_model(model_name)
-tokenizer = AutoTokenizer.from_pretrained(local_model_dir, use_fast=True, trust_remote_code=True)
-model = AutoModelForSeq2SeqLM.from_pretrained(local_model_dir, trust_remote_code=True)
 def generate_code(prompt: str, max_length: int = 128) -> str:
     """代码生成/补全"""

 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM, RobertaTokenizer
 import torch
 # 加载 CodeT5+ 模型
 model_name = "Salesforce/codet5p-220m"
+try:
+    tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False, trust_remote_code=False)
+except Exception:
+    # Fallback to explicit slow tokenizer class to bypass tokenizers fast-path issues.
+    tokenizer = RobertaTokenizer.from_pretrained(model_name, trust_remote_code=False)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name, trust_remote_code=False)
 def generate_code(prompt: str, max_length: int = 128) -> str:
     """代码生成/补全"""

requirements.txt CHANGED Viewed

@@ -1,5 +1,4 @@
 transformers>=4.40.0
-huggingface_hub>=0.23.0
 torch>=2.0.0
 sentencepiece>=0.1.96
 accelerate>=0.20.0

 transformers>=4.40.0
 torch>=2.0.0
 sentencepiece>=0.1.96
 accelerate>=0.20.0