Not: Bu modelin dokümantasyonu Türk yapay zeka topluluğuna katkı sağlamak amacıyla VeriPazarı tarafından Türkçeye çevrilmiştir. Orijinal model TURKCELL tarafından geliştirilmiş olup, VeriPazarı tarafından Türk AI ekosistemi için arşivlenmiştir.

🔗 Orijinal Kaynak: TURKCELL/Turkcell-LLM-7b-v1 🔗 Derleyen Platform: VeriPazarı

Turkcell LLM 7B v1

Bu model, Türkçe için geliştirilmiş ve genişletilmiş (extended) Mistral tabanlı bir Büyük Dil Modelidir (LLM). Toplamda 5 milyar token içeren temizlenmiş ham Türkçe veri seti üzerinde eğitilmiştir.

Eğitim sürecinde başlangıçta DORA yöntemi kullanılmıştır. Bunun ardından, modelin talimat (instruction) izleme yeteneğini artırmak için çeşitli açık kaynaklı ve Turkcell'in dahili (internal) kaynaklarından oluşturulan Türkçe talimat setleri kullanılarak LORA yöntemiyle ince ayar (fine-tuning) yapılmıştır.

Model Detayları

Temel (Base) Model: Mistral 7B tabanlı LLM
Tokenizer Genişletmesi: Türkçe için özel olarak genişletilmiştir.
Eğitim Veri Seti: 5 milyar token'lık temizlenmiş Türkçe ham veri ve özel Türkçe talimat (instruction) setleri.
Eğitim Yöntemi: Başlangıçta DORA ile, ardından LORA ile ince ayar (fine-tuning) yapılmıştır.

DORA Konfigürasyonu

lora_alpha: 128
lora_dropout: 0.05
r: 64
target_modules: "all-linear"

LORA Fine-Tuning Konfigürasyonu

lora_alpha: 128
lora_dropout: 0.05
r: 256
target_modules: "all-linear"

Kullanım Örnekleri

Modeli transformers kütüphanesi ile aşağıdaki gibi kullanabilirsiniz:

from transformers import AutoModelForCausalLM, AutoTokenizer

device = "cuda" # Modeli yükleyeceğiniz cihaz (GPU)

model = AutoModelForCausalLM.from_pretrained("TURKCELL/Turkcell-LLM-7b-v1")
tokenizer = AutoTokenizer.from_pretrained("TURKCELL/Turkcell-LLM-7b-v1")

messages = [
    {"role": "user", "content": "Türkiye'nin başkenti neresidir?"},
]

encodeds = tokenizer.apply_chat_template(messages, return_tensors="pt")
eos_token = tokenizer("<|im_end|>", add_special_tokens=False)["input_ids"][0]

model_inputs = encodeds.to(device)
model.to(device)

generated_ids = model.generate(
    model_inputs,
    max_new_tokens=1024,
    do_sample=True,
    eos_token_id=eos_token
)

decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

Bu dosya veripazari.com.tr topluluğu tarafından Hugging Face altyapısında barındırılmaktadır. Orijinal emeğe saygı kuralımız gereği lisans ve model isimleri korunmuştur.

Downloads last month: 27

Safetensors

Model size

7B params

Tensor type

F16

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support