Spaces:

QJMKWB
/

qwen-coder-1

Sleeping

App Files Files Community

QJMKWB commited on Apr 16

Commit

26bc55c

verified ·

1 Parent(s): 1dfc44a

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -56

app.py CHANGED Viewed

@@ -1,68 +1,26 @@
 import os
 import subprocess
-import sys
-def install_dependencies():
-    print("--- INŠTALÁCIA ZÁVISLOSTÍ (toto môže chvíľu trvať) ---")
-    # Nastavenie pre kompiláciu llama-cpp
-    os.environ["CMAKE_ARGS"] = "-DLLAMA_NATIVE=OFF"
-    packages = [
-        "huggingface_hub[hf-transfer]",
-        "llama-cpp-python[server]"
-    ]
-    for package in packages:
-        print(f"Inštalujem {package}...")
-        subprocess.check_call([sys.executable, "-m", "pip", "install", "--no-cache-dir", package])
-    print("--- INŠTALÁCIA DOKONČENÁ ---")
-def download_model():
-    # Aktivujeme hf_transfer pre super rýchle sťahovanie
-    os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
-    from huggingface_hub import hf_hub_download
-    repo_id = "bartowski/Qwen2.5-Coder-7B-Instruct-GGUF"
-    filename = "Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf"
-    print(f"--- SŤAHUJEM MODEL: {filename} ---")
-    # Stiahne model priamo do aktuálneho adresára
     model_path = hf_hub_download(
-        repo_id=repo_id,
-        filename=filename,
-        local_dir=".",
-        local_dir_use_symlinks=False
     )
-    print(f"--- MODEL PRIPRAVENÝ: {model_path} ---")
-    return filename
-def run_server(model_file):
-    print("--- SPÚŠŤAM SERVER ---")
-    command = [
-        sys.executable, "-m", "llama_cpp.server",
-        "--model", model_file,
         "--host", "0.0.0.0",
         "--port", "7860",
-        "--chat_format", "chatml",
         "--n_ctx", "4096"
-    ]
-    # Spustenie servera tak, aby logy tiekli priamo do konzoly HF Spaces
-    subprocess.run(command)
 if __name__ == "__main__":
-    try:
-        # 1. Inštalácia (ak už sú, pip ich preskočí)
-        install_dependencies()
-        # 2. Sťahovanie
-        model_filename = download_model()
-        # 3. Štart
-        run_server(model_filename)
-    except Exception as e:
-        print(f"KRITICKÁ CHYBA: {e}")
-        sys.exit(1)

 import os
 import subprocess
+from huggingface_hub import hf_hub_download
+# Rýchle sťahovanie
+os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"
+def run():
+    # Stiahneš model (už máš llama-cpp pripravené v systéme)
     model_path = hf_hub_download(
+        repo_id="bartowski/Qwen2.5-Coder-7B-Instruct-GGUF",
+        filename="Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf",
+        local_dir="."
     )
+    # Spustíš server
+    subprocess.run([
+        "python3", "-m", "llama_cpp.server",
+        "--model", "Qwen2.5-Coder-7B-Instruct-Q4_K_M.gguf",
         "--host", "0.0.0.0",
         "--port", "7860",
         "--n_ctx", "4096"
+    ])
 if __name__ == "__main__":
+    run()