Spaces:
				
			
			
	
			
			
		Sleeping
		
	
	
	
			
			
	
	
	
	
		
		
		Sleeping
		
	File size: 1,011 Bytes
			
			| a96a6c8 81264d0 6e1d547 95f08f0 81264d0 6e1d547 81264d0 6e1d547 95f08f0 a96a6c8 6e1d547 a96a6c8 95f08f0 a96a6c8 95f08f0 a96a6c8 | 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 | import gradio as gr
from huggingface_hub import hf_hub_download
from llama_cpp import Llama
# 下载模型文件
model_path = hf_hub_download(
    repo_id="muchuan-l/qwen2.5math1.5b-2v2-rev",  # 模型仓库 ID
    filename="unsloth.Q4_K_M.gguf",  # 模型文件名
    cache_dir="."  # 下载到当前目录
)
# 加载 GGUF 模型
llm = Llama(
    model_path=model_path,
    n_ctx=2048,  # 上下文长度
    n_threads=4  # 线程数
)
# 定义对话函数
def chat(input_text):
    # 生成回复
    output = llm(input_text, max_tokens=100)
    response = output["choices"][0]["text"]
    return response
# 创建 Gradio 界面
interface = gr.Interface(
    fn=chat,  # 对话函数
    inputs="text",  # 输入类型
    outputs="text",  # 输出类型
    title="Qwen2.5Math1.5B Chat",  # 界面标题
    description="A chatbot powered by Qwen2.5Math1.5B model.",  # 界面描述
    examples=["What is 2 + 2?", "Explain the Pythagorean theorem."]  # 示例输入
)
# 启动界面
interface.launch() |