Haary/haryra-7B-gguf
Haary/haryra-7B-gguf adalah Model LLM Bahasa Indonesia
Model Haary/haryra-7b-id adalah Model terkuantisasi dari Model Dasar Open-Orca/Mistral-7B-OpenOrca ke format GGUF.
Cara menjalankan dengan kode Python
Anda dapat menggunakan model GGUF dari Python menggunakan ctransformers library.
Cara memuat model ini dalam kode Python, menggunakan ctransformers
Pertama instal package ctransformers
Jalankan salah satu perintah berikut, sesuai dengan sistem Anda:
# Base ctransformers with no GPU acceleration
pip install ctransformers
# Or with CUDA GPU acceleration
pip install ctransformers[cuda]
# Or with AMD ROCm GPU acceleration (Linux only)
CT_HIPBLAS=1 pip install ctransformers --no-binary ctransformers
# Or with Metal GPU acceleration for macOS systems only
CT_METAL=1 pip install ctransformers --no-binary ctransformers
Contoh kode sederhana untuk menjalankan ctransformers
from ctransformers import AutoModelForCausalLM
# Set gpu_layers to the number of layers to offload to GPU. Set to 0 if no GPU acceleration is available on your system.
llm = AutoModelForCausalLM.from_pretrained("Ichsan2895/Merak-7B-v4-GGUF", model_file="Merak-7B-v4-model-q5_k_m.gguf", model_type="mistral", gpu_layers=50)
print(llm("AI is going to"))